Whamcloud - gitweb
LU-14996 lov: prefer mirrors on non-rotational OSTs
[fs/lustre-release.git] / lustre / lod / lod_internal.h
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13  * GNU General Public License version 2 for more details.  A copy is
14  * included in the COPYING file that accompanied this code.
15  *
16  * You should have received a copy of the GNU General Public License
17  * along with this program; if not, write to the Free Software
18  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright  2009 Sun Microsystems, Inc. All rights reserved
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2012, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  *
31  * lustre/lod/lod_internal.h
32  *
33  * Author: Alex Zhuravlev <alexey.zhuravlev@intel.com>
34  * Author: Mikhail Pershin <mike.pershin@intel.com>
35  */
36
37 #ifndef _LOD_INTERNAL_H
38 #define _LOD_INTERNAL_H
39
40 #include <libcfs/libcfs.h>
41 #include <uapi/linux/lustre/lustre_cfg.h>
42 #include <obd.h>
43 #include <dt_object.h>
44
45 #define LOV_USES_ASSIGNED_STRIPE        0
46 #define LOV_USES_DEFAULT_STRIPE         1
47
48 /* Special values to remove LOV EA from disk */
49 #define LOVEA_DELETE_VALUES(size, count, offset, pool)                  \
50         ((size) == 0 && (count) == 0 &&                                 \
51          (offset) == (typeof(offset))(-1) && (pool) == NULL)
52
53 #define LMVEA_DELETE_VALUES(count, offset)                              \
54         ((count) == 0 && (offset) == (typeof(offset))(-1))
55
56 struct pool_desc {
57         char                     pool_name[LOV_MAXPOOLNAME + 1];
58         struct lu_tgt_pool       pool_obds;     /* pool members */
59         atomic_t                 pool_refcount;
60         struct lu_qos_rr         pool_rr;
61         struct rhash_head        pool_hash;     /* access by poolname */
62         struct list_head         pool_list;
63         struct rcu_head          pool_rcu;
64         struct proc_dir_entry   *pool_proc_entry;
65         struct obd_device       *pool_lobd;     /* owner */
66         time64_t                 pool_spill_expire;
67         struct proc_dir_entry   *pool_spill_proc_entry;
68         bool                     pool_spill_is_active;
69         unsigned int             pool_spill_threshold_pct;
70         char                     pool_spill_target[LOV_MAXPOOLNAME + 1];
71 };
72
73 int lod_pool_hash_init(struct rhashtable *tbl);
74 void lod_pool_hash_destroy(struct rhashtable *tbl);
75 extern const struct rhashtable_params pools_hash_params;
76
77 #define pool_tgt_count(p) ((p)->pool_obds.op_count)
78 #define pool_tgt_array(p)  ((p)->pool_obds.op_array)
79 #define pool_tgt_rw_sem(p) ((p)->pool_obds.op_rw_sem)
80
81 #define lod_tgt_desc    lu_tgt_desc
82 #define lod_tgt_descs   lu_tgt_descs
83
84 #define OST_TGT(lod, index)   LTD_TGT(&lod->lod_ost_descs, index)
85 #define MDT_TGT(lod, index)   LTD_TGT(&lod->lod_mdt_descs, index)
86
87 struct lod_avoid_guide {
88         /* ids of OSSs avoid guidance */
89         __u32                   *lag_oss_avoid_array;
90         /* number of filled array items */
91         unsigned int            lag_oaa_count;
92         /* number of allocated array items */
93         unsigned int            lag_oaa_size;
94         /* bitmap of OSTs avoid guidance */
95         unsigned long           *lag_ost_avoid_bitmap;
96         u32                     lag_ost_avoid_size;
97         /* how many OSTs are available for alloc */
98         __u32                   lag_ost_avail;
99 };
100
101 #define LOD_DOM_MIN_SIZE_KB (LOV_MIN_STRIPE_SIZE >> 10)
102 #define LOD_DOM_SFS_MAX_AGE 10
103
104 struct lod_device {
105         struct dt_device      lod_dt_dev;
106         struct obd_export    *lod_child_exp;
107         struct dt_device     *lod_child;
108         struct lprocfs_stats *lod_stats;
109         spinlock_t            lod_connects_lock;
110         int                   lod_connects;
111         unsigned int          lod_recovery_completed:1,
112                               lod_initialized:1,
113                               lod_lmv_failout:1,
114                               lod_child_got_update_log:1;
115
116         /* protect ld_active_tgt_count, ltd_active and lod_md_root */
117         spinlock_t           lod_lock;
118
119         /* Description of OST */
120         struct lod_tgt_descs  lod_ost_descs;
121         /* Description of MDT */
122         struct lod_tgt_descs  lod_mdt_descs;
123
124         /* Recovery thread for lod_child */
125         struct task_struct   *lod_child_recovery_task;
126
127         /* maximum EA size underlied OSD may have */
128         unsigned int          lod_osd_max_easize;
129         /* maximum size of MDT stripe for Data-on-MDT files. */
130         unsigned int          lod_dom_stripesize_max_kb;
131         /* current DOM default stripe size adjusted by threshold */
132         unsigned int          lod_dom_stripesize_cur_kb;
133         /* Threshold at which DOM default stripe will start decreasing */
134         __u64                 lod_dom_threshold_free_mb;
135
136         /* Local OSD statfs cache */
137         spinlock_t            lod_lsfs_lock;
138         time64_t              lod_lsfs_age;
139         __u64                 lod_lsfs_total_mb;
140         __u64                 lod_lsfs_free_mb;
141
142         /* OST pool data */
143         int                     lod_pool_count;
144         struct rhashtable       lod_pools_hash_body; /* used for key access */
145         struct list_head        lod_pool_list; /* used for sequential access */
146         struct proc_dir_entry  *lod_pool_proc_entry;
147         struct proc_dir_entry  *lod_spill_proc_entry;
148
149         enum lustre_sec_part   lod_sp_me;
150
151         struct proc_dir_entry *lod_symlink;
152         struct dentry          *lod_debugfs;
153
154         /* ROOT object, used to fetch FS default striping */
155         struct lod_object      *lod_md_root;
156 };
157
158 #define lod_ost_bitmap          lod_ost_descs.ltd_tgt_bitmap
159 #define lod_ost_count           lod_ost_descs.ltd_lov_desc.ld_tgt_count
160 #define lod_remote_mdt_count    lod_mdt_descs.ltd_lmv_desc.ld_tgt_count
161
162 struct lod_layout_component {
163         struct lu_extent          llc_extent;
164         __u32                     llc_id;
165         __u32                     llc_flags;
166         __u32                     llc_stripe_size;
167         __u32                     llc_pattern;
168         __u16                     llc_layout_gen;
169         __u16                     llc_stripe_offset;
170         __u16                     llc_stripe_count;
171         __u16                     llc_stripes_allocated;
172         __u64                     llc_timestamp; /* snapshot time */
173         char                     *llc_pool;
174         /* ost list specified with LOV_USER_MAGIC_SPECIFIC lum */
175         struct lu_tgt_pool        llc_ostlist;
176         struct dt_object        **llc_stripe;
177         __u32                    *llc_ost_indices;
178 };
179
180 struct lod_default_striping {
181         /* default LOV */
182         /* current layout component count */
183         __u16                           lds_def_comp_cnt;
184         __u16                           lds_def_mirror_cnt;
185         /* the largest comp count ever used */
186         __u32                           lds_def_comp_size_cnt;
187         struct lod_layout_component     *lds_def_comp_entries;
188         /* default LMV */
189         __u32                           lds_dir_def_stripe_count;
190         __u32                           lds_dir_def_stripe_offset;
191         __u32                           lds_dir_def_hash_type;
192         __u8                            lds_dir_def_max_inherit;
193         __u8                            lds_dir_def_max_inherit_rr;
194                                         /* default file striping flags (LOV) */
195         __u32                           lds_def_striping_set:1,
196                                         lds_def_striping_is_composite:1,
197                                         /* default dir striping flags (LMV) */
198                                         lds_dir_def_striping_set:1;
199 };
200
201 static inline __u8 lmv_inherit_next(__u8 inherit)
202 {
203         if (inherit == LMV_INHERIT_END || inherit == LMV_INHERIT_NONE)
204                 return LMV_INHERIT_NONE;
205
206         if (inherit == LMV_INHERIT_UNLIMITED || inherit > LMV_INHERIT_MAX)
207                 return inherit;
208
209         return inherit - 1;
210 }
211
212 static inline __u8 lmv_inherit_rr_next(__u8 inherit_rr)
213 {
214         if (inherit_rr == LMV_INHERIT_RR_NONE ||
215             inherit_rr == LMV_INHERIT_RR_UNLIMITED ||
216             inherit_rr > LMV_INHERIT_RR_MAX)
217                 return inherit_rr;
218
219         return inherit_rr - 1;
220 }
221
222 struct lod_mirror_entry {
223         __u16   lme_stale:1,
224                 lme_prefer:1;
225         /* mirror id */
226         __u16   lme_id;
227         /* preference */
228         __u16   lme_preference;
229         /* start,end index of this mirror in ldo_comp_entries */
230         __u16   lme_start;
231         __u16   lme_end;
232 };
233
234 struct lod_object {
235         /* common fields for both files and directories */
236         struct dt_object                ldo_obj;
237         struct mutex                    ldo_layout_mutex;
238         union {
239                 /* file stripe (LOV) */
240                 struct {
241                         __u32           ldo_layout_gen;
242                         /* Layout component count for a regular file.
243                          * It equals to 1 for non-composite layout. */
244                         __u16           ldo_comp_cnt;
245                         /* Layout mirror count for a PFLR file.
246                          * It's 0 for files with non-composite layout. */
247                         __u16           ldo_mirror_count;
248                         struct lod_mirror_entry *ldo_mirrors;
249                         __u32           ldo_is_composite:1,
250                                         ldo_flr_state:4,
251                                         ldo_comp_cached:1,
252                                         ldo_is_foreign:1;
253                 };
254                 /* directory stripe (LMV) */
255                 struct {
256                         /* Slave stripe count for striped directory. */
257                         __u16           ldo_dir_stripe_count;
258                         /* How many stripes allocated for a striped directory */
259                         __u16           ldo_dir_stripes_allocated;
260                         __u32           ldo_dir_stripe_offset;
261                         __u32           ldo_dir_hash_type;
262                         __u32           ldo_dir_migrate_offset;
263                         __u32           ldo_dir_migrate_hash;
264                         __u32           ldo_dir_layout_version;
265                         /* Is a slave stripe of striped directory? */
266                         __u32           ldo_dir_slave_stripe:1,
267                                         ldo_dir_striped:1,
268                                         /* the stripe has been loaded */
269                                         ldo_dir_stripe_loaded:1,
270                                         /* foreign directory */
271                                         ldo_dir_is_foreign;
272                         /*
273                          * This default LMV is parent default LMV, which will be
274                          * used in child creation, and it's not cached, so this
275                          * field is invalid after create, make sure it's used by
276                          * lod_dir_striping_create_internal() only.
277                          */
278                         struct lod_default_striping     *ldo_def_striping;
279                 };
280         };
281         union {
282                 struct {
283                         /* foreign/raw format LOV */
284                         char                            *ldo_foreign_lov;
285                         size_t                           ldo_foreign_lov_size;
286                 };
287                 struct {
288                         /* foreign/raw format LMV */
289                         char                            *ldo_foreign_lmv;
290                         size_t                           ldo_foreign_lmv_size;
291                 };
292                 struct {
293                         /* file stripe (LOV) */
294                         struct lod_layout_component     *ldo_comp_entries;
295                         /* slave stripes of striped directory (LMV) */
296                         struct dt_object                **ldo_stripe;
297                 };
298         };
299 };
300
301 #define ldo_dir_split_offset    ldo_dir_migrate_offset
302 #define ldo_dir_split_hash      ldo_dir_migrate_hash
303
304 #define lod_foreach_mirror_comp(comp, lo, mirror_idx)                      \
305 for (comp = &lo->ldo_comp_entries[lo->ldo_mirrors[mirror_idx].lme_start];  \
306      comp <= &lo->ldo_comp_entries[lo->ldo_mirrors[mirror_idx].lme_end];   \
307      comp++)
308
309 static inline bool lod_is_flr(const struct lod_object *lo)
310 {
311         if (!lo->ldo_is_composite)
312                 return false;
313
314         return (lo->ldo_flr_state & LCM_FL_FLR_MASK) != LCM_FL_NONE;
315 }
316
317 static inline bool lod_is_splitting(const struct lod_object *lo)
318 {
319         return lmv_hash_is_splitting(lo->ldo_dir_hash_type);
320 }
321
322 static inline bool lod_is_migrating(const struct lod_object *lo)
323 {
324         return lmv_hash_is_migrating(lo->ldo_dir_hash_type);
325 }
326
327 static inline bool lod_is_layout_changing(const struct lod_object *lo)
328 {
329         return lmv_hash_is_layout_changing(lo->ldo_dir_hash_type);
330 }
331
332 static inline int lod_set_pool(char **pool, const char *new_pool)
333 {
334         int len;
335
336         if (*pool == new_pool)
337                 return 0;
338
339         if (*pool != NULL) {
340                 len = strlen(*pool) + 1;
341                 OBD_FREE(*pool, len);
342                 *pool = NULL;
343         }
344         if (new_pool != NULL) {
345                 len = strlen(new_pool) + 1;
346                 OBD_ALLOC(*pool, len);
347                 if (*pool == NULL)
348                         return -ENOMEM;
349                 strlcpy(*pool, new_pool, len);
350         }
351         return 0;
352 }
353
354 static inline int lod_set_def_pool(struct lod_default_striping *lds,
355                                    int i, const char *new_pool)
356 {
357         return lod_set_pool(&lds->lds_def_comp_entries[i].llc_pool, new_pool);
358 }
359
360 static inline int lod_obj_set_pool(struct lod_object *lo, int i,
361                                    const char *new_pool)
362 {
363         return lod_set_pool(&lo->ldo_comp_entries[i].llc_pool, new_pool);
364 }
365
366 /**
367  * Create new layout generation.
368  *
369  * The only requirement for layout generation is that it changes when
370  * the layout is modified, so a circular counter is sufficient for the
371  * low rate of layout modifications.
372  *
373  * Layout generation is also used to generate unique component ID.
374  * To detect generation overflow, we preserve the highest bit of the
375  * generation when it wrapped.
376  */
377 static inline void lod_obj_inc_layout_gen(struct lod_object *lo)
378 {
379         __u32 preserve = lo->ldo_layout_gen & ~LCME_ID_MASK;
380         lo->ldo_layout_gen++;
381         lo->ldo_layout_gen |= preserve;
382         /* Zero is not a valid generation */
383         if (unlikely((lo->ldo_layout_gen & LCME_ID_MASK) == 0))
384                 lo->ldo_layout_gen++;
385 }
386
387 struct lod_it {
388         struct dt_object        *lit_obj; /* object from the layer below */
389         /* stripe offset of iteration */
390         __u32                   lit_stripe_index;
391         __u32                   lit_attr;
392         struct dt_it            *lit_it;  /* iterator from the layer below */
393 };
394
395 struct lod_thread_info {
396         /* per-thread buffer for LOV EA, may be vmalloc'd */
397         void                           *lti_ea_store;
398         __u32                           lti_ea_store_size;
399         /* per-thread buffer for LMV EA */
400         struct lu_buf                   lti_buf;
401         struct ost_id                   lti_ostid;
402         struct lu_fid                   lti_fid;
403         struct obd_statfs               lti_osfs;
404         struct lu_attr                  lti_attr;
405         struct lod_it                   lti_it;
406         struct ldlm_res_id              lti_res_id;
407         /* used to hold lu_dirent, sizeof(struct lu_dirent) + NAME_MAX */
408         char                            lti_key[sizeof(struct lu_dirent) +
409                                                 NAME_MAX];
410         struct dt_object_format         lti_format;
411         struct lu_name                  lti_name;
412         struct lu_buf                   lti_linkea_buf;
413         struct dt_insert_rec            lti_dt_rec;
414         struct llog_catid               lti_cid;
415         struct llog_cookie              lti_cookie;
416         struct lustre_cfg               lti_lustre_cfg;
417         /* used to store parent default striping in create */
418         struct lod_default_striping     lti_def_striping;
419         struct filter_fid               lti_ff;
420         __u32                           *lti_comp_idx;
421         size_t                          lti_comp_size;
422         size_t                          lti_count;
423         struct lu_attr                  lti_layout_attr;
424         /* object allocation avoid guide info */
425         struct lod_avoid_guide          lti_avoid;
426         union lmv_mds_md                lti_lmv;
427         struct dt_allocation_hint       lti_ah;
428 };
429
430 extern const struct lu_device_operations lod_lu_ops;
431
432 static inline int lu_device_is_lod(struct lu_device *d)
433 {
434         return ergo(d != NULL && d->ld_ops != NULL, d->ld_ops == &lod_lu_ops);
435 }
436
437 static inline struct lod_device* lu2lod_dev(struct lu_device *d)
438 {
439         LASSERT(lu_device_is_lod(d));
440         return container_of_safe(d, struct lod_device, lod_dt_dev.dd_lu_dev);
441 }
442
443 static inline struct lu_device *lod2lu_dev(struct lod_device *d)
444 {
445         return &d->lod_dt_dev.dd_lu_dev;
446 }
447
448 static inline struct obd_device *lod2obd(struct lod_device *d)
449 {
450         return d->lod_dt_dev.dd_lu_dev.ld_obd;
451 }
452
453 static inline struct lod_device *dt2lod_dev(struct dt_device *d)
454 {
455         LASSERT(lu_device_is_lod(&d->dd_lu_dev));
456         return container_of(d, struct lod_device, lod_dt_dev);
457 }
458
459 static inline struct lod_object *lu2lod_obj(struct lu_object *o)
460 {
461         LASSERT(ergo(o != NULL, lu_device_is_lod(o->lo_dev)));
462         return container_of_safe(o, struct lod_object, ldo_obj.do_lu);
463 }
464
465 static inline struct lu_object *lod2lu_obj(struct lod_object *obj)
466 {
467         return &obj->ldo_obj.do_lu;
468 }
469
470 static inline const struct lu_fid *lod_object_fid(struct lod_object *obj)
471 {
472         return lu_object_fid(lod2lu_obj(obj));
473 }
474
475 static inline struct lod_object *lod_obj(const struct lu_object *o)
476 {
477         LASSERT(lu_device_is_lod(o->lo_dev));
478         return container_of(o, struct lod_object, ldo_obj.do_lu);
479 }
480
481 static inline struct lod_object *lod_dt_obj(const struct dt_object *d)
482 {
483         return lod_obj(&d->do_lu);
484 }
485
486 static inline struct dt_object* lod_object_child(struct lod_object *o)
487 {
488         return container_of(lu_object_next(lod2lu_obj(o)),
489                             struct dt_object, do_lu);
490 }
491
492 static inline bool lod_obj_is_striped(struct dt_object *dt)
493 {
494         struct lod_object *lo = lod_dt_obj(dt);
495         int i;
496         bool rc = false;
497
498         if (!dt_object_exists(dt_object_child(dt)))
499                 return false;
500
501         mutex_lock(&lo->ldo_layout_mutex);
502
503         if (S_ISDIR(dt->do_lu.lo_header->loh_attr)) {
504                 rc = lo->ldo_dir_stripe_count != 0;
505         } else if (lo->ldo_is_foreign) {
506                 rc = false;
507         } else {
508                 for (i = 0; i < lo->ldo_comp_cnt; i++) {
509                         if (lo->ldo_comp_entries[i].llc_stripe == NULL)
510                                 continue;
511                         LASSERT(lo->ldo_comp_entries[i].llc_stripe_count > 0);
512                         rc = true;
513                         break;
514                 }
515         }
516
517         mutex_unlock(&lo->ldo_layout_mutex);
518         return rc;
519 }
520
521 extern struct lu_context_key lod_thread_key;
522
523 static inline struct lod_thread_info *lod_env_info(const struct lu_env *env)
524 {
525         struct lod_thread_info *info;
526         info = lu_context_key_get(&env->le_ctx, &lod_thread_key);
527         LASSERT(info);
528         return info;
529 }
530
531 static inline struct lu_name *
532 lod_name_get(const struct lu_env *env, const void *area, int len)
533 {
534         struct lu_name *lname;
535
536         lname = &lod_env_info(env)->lti_name;
537         lname->ln_name = area;
538         lname->ln_namelen = len;
539         return lname;
540 }
541
542 static inline struct lod_default_striping *
543 lod_lds_buf_get(const struct lu_env *env)
544 {
545         struct lod_thread_info *info = lod_env_info(env);
546
547         info->lti_def_striping.lds_def_striping_set = 0;
548         info->lti_def_striping.lds_dir_def_striping_set = 0;
549         return &info->lti_def_striping;
550 }
551
552 static inline void lod_layout_get_pool(struct lod_layout_component *entries,
553                                        int count, char *pool, int len)
554 {
555         int i;
556
557         for (i = 0; i < count; i++) {
558                 if (entries[i].llc_pool != NULL) {
559                         strlcpy(pool, entries[i].llc_pool, len);
560                         break;
561                 }
562         }
563 }
564
565 #define lod_foreach_mdt(lod, mdt) ltd_foreach_tgt(&(lod)->lod_mdt_descs, mdt)
566 #define lod_foreach_ost(lod, ost) ltd_foreach_tgt(&(lod)->lod_ost_descs, ost)
567
568 /* lod_dev.c */
569 extern struct kmem_cache *lod_object_kmem;
570 int lod_fld_lookup(const struct lu_env *env, struct lod_device *lod,
571                    const struct lu_fid *fid, __u32 *tgt, int *flags);
572 int lod_sub_init_llog(const struct lu_env *env, struct lod_device *lod,
573                       struct dt_device *dt);
574 void lod_sub_fini_llog(const struct lu_env *env,
575                        struct dt_device *dt, struct task_struct **taskp);
576 int lodname2mdt_index(char *lodname, __u32 *mdt_index);
577 extern void target_recovery_fini(struct obd_device *obd);
578
579 /* lod_lov.c */
580 void lod_getref(struct lod_tgt_descs *ltd);
581 void lod_putref(struct lod_device *lod, struct lod_tgt_descs *ltd);
582 int lod_add_device(const struct lu_env *env, struct lod_device *lod,
583                    char *osp, unsigned index, unsigned gen, int mdt_index,
584                    char *type, int active);
585 int lod_del_device(const struct lu_env *env, struct lod_device *lod,
586                    struct lod_tgt_descs *ltd, char *osp, unsigned int idx,
587                    unsigned int gen);
588 int validate_lod_and_idx(struct lod_device *lod, __u32 idx);
589 int lod_fini_tgt(const struct lu_env *env, struct lod_device *lod,
590                  struct lod_tgt_descs *ltd);
591 int lod_striping_load(const struct lu_env *env, struct lod_object *lo);
592 int lod_striping_reload(const struct lu_env *env, struct lod_object *lo,
593                         const struct lu_buf *buf);
594 void lod_dom_stripesize_recalc(struct lod_device *d);
595
596 int lod_get_ea(const struct lu_env *env, struct lod_object *lo,
597                const char *name);
598 static inline int
599 lod_get_lov_ea(const struct lu_env *env, struct lod_object *lo)
600 {
601         return lod_get_ea(env, lo, XATTR_NAME_LOV);
602 }
603
604 static inline int
605 lod_get_lmv_ea(const struct lu_env *env, struct lod_object *lo)
606 {
607         return lod_get_ea(env, lo, XATTR_NAME_LMV);
608 }
609
610 static inline int
611 lod_get_default_lmv_ea(const struct lu_env *env, struct lod_object *lo)
612 {
613         return lod_get_ea(env, lo, XATTR_NAME_DEFAULT_LMV);
614 }
615
616 static inline void
617 lod_comp_set_init(struct lod_layout_component *entry)
618 {
619         entry->llc_flags |= LCME_FL_INIT;
620 }
621
622 static inline void
623 lod_comp_unset_init(struct lod_layout_component *entry)
624 {
625         entry->llc_flags &= ~LCME_FL_INIT;
626 }
627
628 static inline bool
629 lod_comp_inited(const struct lod_layout_component *entry)
630 {
631         return entry->llc_flags & LCME_FL_INIT;
632 }
633
634 /**
635  * For a PFL file, some of its component could be un-instantiated, so
636  * that their lov_ost_data_v1 array is not needed, we'd use this function
637  * to reduce the LOVEA buffer size.
638  *
639  * Note: if llc_ostlist contains value, we'd need lov_ost_data_v1 array to
640  * save the specified OST index list.
641  */
642 static inline void
643 lod_comp_shrink_stripe_count(struct lod_layout_component *lod_comp,
644                              __u16 *stripe_count)
645 {
646         /**
647          * Need one lov_ost_data_v1 to store invalid ost_idx, please refer to
648          * lod_parse_striping()
649          */
650         if (!lod_comp_inited(lod_comp) && lod_comp->llc_ostlist.op_count == 0)
651                 *stripe_count = 1;
652 }
653
654 void lod_fix_desc(struct lov_desc *desc);
655 void lod_fix_desc_qos_maxage(__u32 *val);
656 void lod_fix_desc_pattern(__u32 *val);
657 void lod_fix_desc_stripe_count(__u32 *val);
658 void lod_fix_desc_stripe_size(__u64 *val);
659 void lod_fix_lmv_desc_pattern(__u32 *val);
660 int lod_pools_init(struct lod_device *m, struct lustre_cfg *cfg);
661 int lod_pools_fini(struct lod_device *m);
662 int lod_parse_striping(const struct lu_env *env, struct lod_object *mo,
663                        const struct lu_buf *buf);
664 int lod_parse_dir_striping(const struct lu_env *env, struct lod_object *lo,
665                            const struct lu_buf *buf);
666 int lod_initialize_objects(const struct lu_env *env, struct lod_object *mo,
667                            struct lov_ost_data_v1 *objs, int index);
668 int lod_verify_striping(const struct lu_env *env, struct lod_device *d,
669                         struct lod_object *lo, const struct lu_buf *buf,
670                         bool is_from_disk);
671 int lod_generate_lovea(const struct lu_env *env, struct lod_object *lo,
672                        struct lov_mds_md *lmm, int *lmm_size, bool is_dir);
673 int lod_ea_store_resize(struct lod_thread_info *info, size_t size);
674 int lod_def_striping_comp_resize(struct lod_default_striping *lds, __u16 count);
675 void lod_free_def_comp_entries(struct lod_default_striping *lds);
676 void lod_free_comp_entries(struct lod_object *lo);
677 int lod_alloc_comp_entries(struct lod_object *lo, int mirror_cnt, int comp_cnt);
678 int lod_fill_mirrors(struct lod_object *lo);
679
680 /* lod_pool.c */
681 struct pool_desc *lod_find_pool(struct lod_device *lod, char *poolname);
682 void lod_pool_putref(struct pool_desc *pool);
683 int lod_pool_del(struct obd_device *obd, char *poolname);
684 int lod_check_index_in_pool(__u32 idx, struct pool_desc *pool);
685 int lod_pool_new(struct obd_device *obd, char *poolname);
686 int lod_pool_add(struct obd_device *obd, char *poolname, char *ostname);
687 int lod_pool_remove(struct obd_device *obd, char *poolname, char *ostname);
688
689 struct lod_obj_stripe_cb_data;
690 typedef int (*lod_obj_stripe_cb_t)(const struct lu_env *env,
691                                    struct lod_object *lo, struct dt_object *dt,
692                                    struct thandle *th,
693                                    int comp_idx, int stripe_idx,
694                                    struct lod_obj_stripe_cb_data *data);
695 typedef bool (*lod_obj_comp_skip_cb_t)(const struct lu_env *env,
696                                         struct lod_object *lo, int comp_idx,
697                                         struct lod_obj_stripe_cb_data *data);
698 typedef int (*lod_obj_comp_cb_t)(const struct lu_env *env,
699                                 struct lod_object *lo, int comp_idx,
700                                 struct lod_obj_stripe_cb_data *data);
701 struct lod_obj_stripe_cb_data {
702         union {
703                 const struct lu_attr    *locd_attr;
704                 int                     locd_ost_index;
705                 const struct lu_buf     *locd_buf;
706         };
707         lod_obj_stripe_cb_t             locd_stripe_cb;
708         lod_obj_comp_skip_cb_t          locd_comp_skip_cb;
709         lod_obj_comp_cb_t               locd_comp_cb;
710         bool                            locd_declare;
711 };
712
713 /* lod_qos.c */
714 int lod_mdt_alloc_qos(const struct lu_env *env, struct lod_object *lo,
715                       struct dt_object **stripes, u32 stripe_idx,
716                       u32 stripe_count);
717 int lod_mdt_alloc_rr(const struct lu_env *env, struct lod_object *lo,
718                      struct dt_object **stripes, u32 stripe_idx,
719                      u32 stripe_count);
720 int lod_prepare_create(const struct lu_env *env, struct lod_object *lo,
721                        struct lu_attr *attr, const struct lu_buf *buf,
722                        struct thandle *th);
723 int lod_use_defined_striping(const struct lu_env *, struct lod_object *,
724                              const struct lu_buf *);
725 int lod_qos_parse_config(const struct lu_env *env, struct lod_object *lo,
726                          const struct lu_buf *buf);
727 int lod_qos_prep_create(const struct lu_env *env, struct lod_object *lo,
728                         struct lu_attr *attr, struct thandle *th,
729                         int comp_idx, __u64 reserve);
730 __u16 lod_comp_entry_stripe_count(struct lod_object *lo,
731                                   int comp_idx, bool is_dir);
732 __u16 lod_get_stripe_count(struct lod_device *lod, struct lod_object *lo,
733                            int comp_idx, __u16 stripe_count, bool overstriping);
734 void lod_qos_statfs_update(const struct lu_env *env, struct lod_device *lod,
735                            struct lu_tgt_descs *ltd);
736
737 /* lproc_lod.c */
738 int lod_procfs_init(struct lod_device *lod);
739 void lod_procfs_fini(struct lod_device *lod);
740
741 /* lod_object.c */
742 extern const struct dt_object_operations lod_obj_ops;
743 extern const struct lu_object_operations lod_lu_obj_ops;
744
745 int lod_load_lmv_shards(const struct lu_env *env, struct lod_object *lo,
746                         struct lu_buf *buf, bool resize);
747 int lod_declare_striped_create(const struct lu_env *env, struct dt_object *dt,
748                                struct lu_attr *attr,
749                                const struct lu_buf *lovea, struct thandle *th);
750 int lod_striped_create(const struct lu_env *env, struct dt_object *dt,
751                         struct lu_attr *attr, struct dt_object_format *dof,
752                         struct thandle *th);
753 int lod_alloc_foreign_lov(struct lod_object *lo, size_t size);
754 void lod_free_foreign_lov(struct lod_object *lo);
755 void lod_striping_free_nolock(const struct lu_env *env, struct lod_object *lo);
756 void lod_striping_free(const struct lu_env *env, struct lod_object *lo);
757
758 int lod_obj_for_each_stripe(const struct lu_env *env, struct lod_object *lo,
759                             struct thandle *th,
760                             struct lod_obj_stripe_cb_data *data);
761 int lod_comp_copy_ost_lists(struct lod_layout_component *lod_comp,
762                             struct lov_user_md_v3 *v3);
763 void lod_adjust_stripe_size(struct lod_layout_component *comp,
764                             __u32 def_stripe_size);
765
766 /* lod_sub_object.c */
767 struct thandle *lod_sub_get_thandle(const struct lu_env *env,
768                                     struct thandle *th,
769                                     const struct dt_object *sub_obj,
770                                     bool *record_update);
771 int lod_sub_declare_create(const struct lu_env *env, struct dt_object *dt,
772                            struct lu_attr *attr,
773                            struct dt_allocation_hint *hint,
774                            struct dt_object_format *dof, struct thandle *th);
775 int lod_sub_create(const struct lu_env *env, struct dt_object *dt,
776                    struct lu_attr *attr, struct dt_allocation_hint *hint,
777                    struct dt_object_format *dof, struct thandle *th);
778 int lod_sub_declare_ref_add(const struct lu_env *env, struct dt_object *dt,
779                             struct thandle *th);
780 int lod_sub_ref_add(const struct lu_env *env, struct dt_object *dt,
781                     struct thandle *th);
782 int lod_sub_declare_ref_del(const struct lu_env *env, struct dt_object *dt,
783                             struct thandle *th);
784 int lod_sub_ref_del(const struct lu_env *env, struct dt_object *dt,
785                     struct thandle *th);
786 int lod_sub_declare_destroy(const struct lu_env *env, struct dt_object *dt,
787                             struct thandle *th);
788 int lod_sub_destroy(const struct lu_env *env, struct dt_object *dt,
789                     struct thandle *th);
790 int lod_sub_declare_insert(const struct lu_env *env, struct dt_object *dt,
791                            const struct dt_rec *rec, const struct dt_key *key,
792                            struct thandle *th);
793 int lod_sub_insert(const struct lu_env *env, struct dt_object *dt,
794                    const struct dt_rec *rec, const struct dt_key *key,
795                    struct thandle *th);
796 int lod_sub_declare_delete(const struct lu_env *env, struct dt_object *dt,
797                            const struct dt_key *key, struct thandle *th);
798 int lod_sub_delete(const struct lu_env *env, struct dt_object *dt,
799                    const struct dt_key *name, struct thandle *th);
800 int lod_sub_declare_xattr_set(const struct lu_env *env, struct dt_object *dt,
801                               const struct lu_buf *buf, const char *name,
802                               int fl, struct thandle *th);
803 int lod_sub_xattr_set(const struct lu_env *env, struct dt_object *dt,
804                       const struct lu_buf *buf, const char *name, int fl,
805                       struct thandle *th);
806 int lod_sub_declare_attr_set(const struct lu_env *env, struct dt_object *dt,
807                              const struct lu_attr *attr, struct thandle *th);
808 int lod_sub_attr_set(const struct lu_env *env, struct dt_object *dt,
809                      const struct lu_attr *attr, struct thandle *th);
810 int lod_sub_declare_xattr_del(const struct lu_env *env, struct dt_object *dt,
811                               const char *name, struct thandle *th);
812 int lod_sub_xattr_del(const struct lu_env *env, struct dt_object *dt,
813                       const char *name, struct thandle *th);
814 int lod_sub_declare_write(const struct lu_env *env, struct dt_object *dt,
815                           const struct lu_buf *buf, loff_t pos,
816                           struct thandle *th);
817 ssize_t lod_sub_write(const struct lu_env *env, struct dt_object *dt,
818                       const struct lu_buf *buf, loff_t *pos,
819                       struct thandle *th);
820 int lod_sub_declare_punch(const struct lu_env *env, struct dt_object *dt,
821                           __u64 start, __u64 end, struct thandle *th);
822 int lod_sub_punch(const struct lu_env *env, struct dt_object *dt,
823                   __u64 start, __u64 end, struct thandle *th);
824
825 int lod_sub_prep_llog(const struct lu_env *env, struct lod_device *lod,
826                       struct dt_device *dt, int index);
827 void lod_check_and_spill_pool(const struct lu_env *env, struct lod_device *lod,
828                               char **poolname);
829 void lod_spill_target_refresh(const struct lu_env *env, struct lod_device *lod,
830                               struct pool_desc *pool);
831 extern struct lprocfs_vars lprocfs_lod_spill_vars[];
832 #endif