Whamcloud - gitweb
LU-13073 osp: don't block waiting for new objects
[fs/lustre-release.git] / lustre / lod / lod_internal.h
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13  * GNU General Public License version 2 for more details.  A copy is
14  * included in the COPYING file that accompanied this code.
15  *
16  * You should have received a copy of the GNU General Public License
17  * along with this program; if not, write to the Free Software
18  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright  2009 Sun Microsystems, Inc. All rights reserved
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2012, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/lod/lod_internal.h
33  *
34  * Author: Alex Zhuravlev <alexey.zhuravlev@intel.com>
35  * Author: Mikhail Pershin <mike.pershin@intel.com>
36  */
37
38 #ifndef _LOD_INTERNAL_H
39 #define _LOD_INTERNAL_H
40
41 #include <libcfs/libcfs.h>
42 #include <uapi/linux/lustre/lustre_cfg.h>
43 #include <obd.h>
44 #include <dt_object.h>
45
46 #define LOV_USES_ASSIGNED_STRIPE        0
47 #define LOV_USES_DEFAULT_STRIPE         1
48
49 /* Special values to remove LOV EA from disk */
50 #define LOVEA_DELETE_VALUES(size, count, offset, pool)                  \
51         ((size) == 0 && (count) == 0 &&                                 \
52          (offset) == (typeof(offset))(-1) && (pool) == NULL)
53
54 #define LMVEA_DELETE_VALUES(count, offset)                              \
55         ((count) == 0 && (offset) == (typeof(offset))(-1))
56
57 #define LOV_OFFSET_DEFAULT              ((__u16)-1)
58
59 struct lod_qos_rr {
60         spinlock_t               lqr_alloc;     /* protect allocation index */
61         __u32                    lqr_start_idx; /* start index of new inode */
62         __u32                    lqr_offset_idx;/* aliasing for start_idx */
63         int                      lqr_start_count;/* reseed counter */
64         struct ost_pool          lqr_pool;      /* round-robin optimized list */
65         unsigned long            lqr_dirty:1;   /* recalc round-robin list */
66 };
67
68 struct pool_desc {
69         char                     pool_name[LOV_MAXPOOLNAME + 1];
70         struct ost_pool          pool_obds;     /* pool members */
71         atomic_t                 pool_refcount;
72         struct lod_qos_rr        pool_rr;
73         struct hlist_node        pool_hash;     /* access by poolname */
74         struct list_head         pool_list;
75         struct proc_dir_entry   *pool_proc_entry;
76         struct obd_device       *pool_lobd;     /* owner */
77 };
78
79 #define pool_tgt_count(p) ((p)->pool_obds.op_count)
80 #define pool_tgt_array(p)  ((p)->pool_obds.op_array)
81 #define pool_tgt_rw_sem(p) ((p)->pool_obds.op_rw_sem)
82
83 struct lod_qos {
84         struct list_head         lq_oss_list;
85         struct rw_semaphore      lq_rw_sem;
86         __u32                    lq_active_oss_count;
87         unsigned int             lq_prio_free;   /* priority for free space */
88         unsigned int             lq_threshold_rr;/* priority for rr */
89         struct lod_qos_rr        lq_rr;          /* round robin qos data */
90         bool                     lq_dirty:1,     /* recalc qos data */
91                                  lq_same_space:1,/* the ost's all have approx.
92                                                     the same space avail */
93                                  lq_reset:1;     /* zero current penalties */
94 };
95
96 struct lod_qos_oss {
97         struct obd_uuid          lqo_uuid;      /* ptlrpc's c_remote_uuid */
98         struct list_head         lqo_oss_list;  /* link to lov_qos */
99         __u64                    lqo_bavail;    /* total bytes avail on OSS */
100         __u64                    lqo_penalty;   /* current penalty */
101         __u64                    lqo_penalty_per_obj; /* penalty decrease
102                                                          every obj*/
103         time64_t                 lqo_used;      /* last used time, seconds */
104         __u32                    lqo_ost_count; /* number of osts on this oss */
105         __u32                    lqo_id;        /* unique oss id */
106 };
107
108 struct ltd_qos {
109         struct lod_qos_oss      *ltq_oss;       /* oss info */
110         __u64                    ltq_penalty;   /* current penalty */
111         __u64                    ltq_penalty_per_obj; /* penalty decrease
112                                                          every obj*/
113         __u64                    ltq_weight;    /* net weighting */
114         time64_t                 ltq_used;      /* last used time, seconds */
115         bool                     ltq_usable:1;  /* usable for striping */
116 };
117
118 struct lod_tgt_desc {
119         struct dt_device  *ltd_tgt;
120         struct list_head   ltd_kill;
121         struct obd_export *ltd_exp;
122         struct obd_uuid    ltd_uuid;
123         __u32              ltd_gen;
124         __u32              ltd_index;
125         struct ltd_qos     ltd_qos; /* qos info per target */
126         struct obd_statfs  ltd_statfs;
127         struct ptlrpc_thread    *ltd_recovery_thread;
128         unsigned long      ltd_active:1,/* is this target up for requests */
129                            ltd_activate:1,/* should  target be activated */
130                            ltd_reap:1,  /* should this target be deleted */
131                            ltd_got_update_log:1, /* Already got update log */
132                            ltd_connecting:1; /* target is connecting */
133 };
134
135 #define TGT_PTRS                256     /* number of pointers at 1st level */
136 #define TGT_PTRS_PER_BLOCK      256     /* number of pointers at 2nd level */
137
138 struct lod_tgt_desc_idx {
139         struct lod_tgt_desc *ldi_tgt[TGT_PTRS_PER_BLOCK];
140 };
141
142 #define LTD_TGT(ltd, index)      \
143          ((ltd)->ltd_tgt_idx[(index) / \
144          TGT_PTRS_PER_BLOCK]->ldi_tgt[(index) % TGT_PTRS_PER_BLOCK])
145
146 #define OST_TGT(lod, index)   LTD_TGT(&lod->lod_ost_descs, index)
147 #define MDT_TGT(lod, index)   LTD_TGT(&lod->lod_mdt_descs, index)
148 struct lod_tgt_descs {
149         /* list of known TGTs */
150         struct lod_tgt_desc_idx *ltd_tgt_idx[TGT_PTRS];
151         /* Size of the lod_tgts array, granted to be a power of 2 */
152         __u32                   ltd_tgts_size;
153         /* number of registered TGTs */
154         __u32                   ltd_tgtnr;
155         /* bitmap of TGTs available */
156         struct cfs_bitmap       *ltd_tgt_bitmap;
157         /* TGTs scheduled to be deleted */
158         __u32                   ltd_death_row;
159         /* Table refcount used for delayed deletion */
160         int                     ltd_refcount;
161         /* mutex to serialize concurrent updates to the tgt table */
162         struct mutex            ltd_mutex;
163         /* read/write semaphore used for array relocation */
164         struct rw_semaphore     ltd_rw_sem;
165 };
166
167 struct lod_avoid_guide {
168         /* ids of OSSs avoid guidance */
169         __u32                   *lag_oss_avoid_array;
170         /* number of filled array items */
171         unsigned int            lag_oaa_count;
172         /* number of allocated array items */
173         unsigned int            lag_oaa_size;
174         /* bitmap of OSTs avoid guidance */
175         struct cfs_bitmap       *lag_ost_avoid_bitmap;
176         /* how many OSTs are available for alloc */
177         __u32                   lag_ost_avail;
178 };
179
180 struct lod_device {
181         struct dt_device      lod_dt_dev;
182         struct obd_export    *lod_child_exp;
183         struct dt_device     *lod_child;
184         struct lprocfs_stats *lod_stats;
185         spinlock_t            lod_connects_lock;
186         int                   lod_connects;
187         unsigned int          lod_recovery_completed:1,
188                               lod_initialized:1,
189                               lod_lmv_failout:1,
190                               lod_child_got_update_log:1;
191
192         /* lov settings descriptor storing static information */
193         struct lov_desc       lod_desc;
194
195         /* protect ld_active_tgt_count, ltd_active and lod_md_root */
196         spinlock_t           lod_lock;
197
198         /* Description of OST */
199         struct lod_tgt_descs  lod_ost_descs;
200         /* Description of MDT */
201         struct lod_tgt_descs  lod_mdt_descs;
202
203         /* Recovery thread for lod_child */
204         struct ptlrpc_thread    lod_child_recovery_thread;
205
206         /* maximum EA size underlied OSD may have */
207         unsigned int          lod_osd_max_easize;
208         /* maximum size of MDT stripe for Data-on-MDT files. */
209         unsigned int          lod_dom_max_stripesize;
210
211         /*FIXME: When QOS and pool is implemented for MDT, probably these
212          * structure should be moved to lod_tgt_descs as well.
213          */
214         /* QoS info per LOD */
215         struct lod_qos        lod_qos; /* qos info per lod */
216
217         /* OST pool data */
218         struct ost_pool         lod_pool_info; /* all OSTs in a packed array */
219         int                     lod_pool_count;
220         struct cfs_hash        *lod_pools_hash_body; /* used for key access */
221         struct list_head        lod_pool_list; /* used for sequential access */
222         struct proc_dir_entry  *lod_pool_proc_entry;
223
224         enum lustre_sec_part   lod_sp_me;
225
226         struct proc_dir_entry *lod_symlink;
227         struct dentry          *lod_debugfs;
228
229         /* ROOT object, used to fetch FS default striping */
230         struct lod_object      *lod_md_root;
231 };
232
233 #define lod_osts        lod_ost_descs.ltd_tgts
234 #define lod_ost_bitmap  lod_ost_descs.ltd_tgt_bitmap
235 #define lod_ostnr       lod_ost_descs.ltd_tgtnr
236 #define lod_osts_size   lod_ost_descs.ltd_tgts_size
237 #define ltd_ost         ltd_tgt
238 #define lod_ost_desc    lod_tgt_desc
239
240 #define lod_mdts                lod_mdt_descs.ltd_tgts
241 #define lod_mdt_bitmap          lod_mdt_descs.ltd_tgt_bitmap
242 #define lod_remote_mdt_count    lod_mdt_descs.ltd_tgtnr
243 #define lod_mdts_size           lod_mdt_descs.ltd_tgts_size
244 #define ltd_mdt                 ltd_tgt
245 #define lod_mdt_desc            lod_tgt_desc
246
247 struct lod_layout_component {
248         struct lu_extent          llc_extent;
249         __u32                     llc_id;
250         __u32                     llc_flags;
251         __u32                     llc_stripe_size;
252         __u32                     llc_pattern;
253         __u16                     llc_layout_gen;
254         __u16                     llc_stripe_offset;
255         __u16                     llc_stripe_count;
256         __u16                     llc_stripes_allocated;
257         __u64                     llc_timestamp; /* snapshot time */
258         char                     *llc_pool;
259         /* ost list specified with LOV_USER_MAGIC_SPECIFIC lum */
260         struct ost_pool           llc_ostlist;
261         struct dt_object        **llc_stripe;
262         __u32                    *llc_ost_indices;
263 };
264
265 struct lod_default_striping {
266         /* default LOV */
267         /* current layout component count */
268         __u16                           lds_def_comp_cnt;
269         __u16                           lds_def_mirror_cnt;
270         /* the largest comp count ever used */
271         __u32                           lds_def_comp_size_cnt;
272         struct lod_layout_component     *lds_def_comp_entries;
273         /* default LMV */
274         __u32                           lds_dir_def_stripe_count;
275         __u32                           lds_dir_def_stripe_offset;
276         __u32                           lds_dir_def_hash_type;
277                                         /* default file striping flags (LOV) */
278         __u32                           lds_def_striping_set:1,
279                                         lds_def_striping_is_composite:1,
280                                         /* default dir striping flags (LMV) */
281                                         lds_dir_def_striping_set:1;
282 };
283
284 struct lod_mirror_entry {
285         __u16   lme_stale:1,
286                 lme_primary:1;
287         /* mirror id */
288         __u16   lme_id;
289         /* start,end index of this mirror in ldo_comp_entries */
290         __u16   lme_start;
291         __u16   lme_end;
292 };
293
294 struct lod_object {
295         /* common fields for both files and directories */
296         struct dt_object                ldo_obj;
297         struct mutex                    ldo_layout_mutex;
298         union {
299                 /* file stripe (LOV) */
300                 struct {
301                         __u32           ldo_layout_gen;
302                         /* Layout component count for a regular file.
303                          * It equals to 1 for non-composite layout. */
304                         __u16           ldo_comp_cnt;
305                         /* Layout mirror count for a PFLR file.
306                          * It's 0 for files with non-composite layout. */
307                         __u16           ldo_mirror_count;
308                         struct lod_mirror_entry *ldo_mirrors;
309                         __u32           ldo_is_composite:1,
310                                         ldo_flr_state:2,
311                                         ldo_comp_cached:1;
312                 };
313                 /* directory stripe (LMV) */
314                 struct {
315                         /* Slave stripe count for striped directory. */
316                         __u16           ldo_dir_stripe_count;
317                         /* How many stripes allocated for a striped directory */
318                         __u16           ldo_dir_stripes_allocated;
319                         __u32           ldo_dir_stripe_offset;
320                         __u32           ldo_dir_hash_type;
321                         __u32           ldo_dir_migrate_offset;
322                         __u32           ldo_dir_migrate_hash;
323                         /* Is a slave stripe of striped directory? */
324                         __u32           ldo_dir_slave_stripe:1,
325                                         ldo_dir_striped:1,
326                                         /* the stripe has been loaded */
327                                         ldo_dir_stripe_loaded:1;
328                         /*
329                          * default striping is not cached, so this field is
330                          * invalid after create, make sure it's used by
331                          * lod_dir_striping_create_internal() only.
332                          */
333                         struct lod_default_striping     *ldo_def_striping;
334                 };
335         };
336         /* file stripe (LOV) */
337         struct lod_layout_component     *ldo_comp_entries;
338         /* slave stripes of striped directory (LMV) */
339         struct dt_object                **ldo_stripe;
340 };
341
342 #define lod_foreach_mirror_comp(comp, lo, mirror_idx)                      \
343 for (comp = &lo->ldo_comp_entries[lo->ldo_mirrors[mirror_idx].lme_start];  \
344      comp <= &lo->ldo_comp_entries[lo->ldo_mirrors[mirror_idx].lme_end];   \
345      comp++)
346
347 static inline bool lod_is_flr(const struct lod_object *lo)
348 {
349         if (!lo->ldo_is_composite)
350                 return false;
351
352         return (lo->ldo_flr_state & LCM_FL_FLR_MASK) != LCM_FL_NONE;
353 }
354
355 static inline int lod_set_pool(char **pool, const char *new_pool)
356 {
357         int len;
358
359         if (*pool == new_pool)
360                 return 0;
361
362         if (*pool != NULL) {
363                 len = strlen(*pool) + 1;
364                 OBD_FREE(*pool, len);
365                 *pool = NULL;
366         }
367         if (new_pool != NULL) {
368                 len = strlen(new_pool) + 1;
369                 OBD_ALLOC(*pool, len);
370                 if (*pool == NULL)
371                         return -ENOMEM;
372                 strlcpy(*pool, new_pool, len);
373         }
374         return 0;
375 }
376
377 static inline int lod_set_def_pool(struct lod_default_striping *lds,
378                                    int i, const char *new_pool)
379 {
380         return lod_set_pool(&lds->lds_def_comp_entries[i].llc_pool, new_pool);
381 }
382
383 static inline int lod_obj_set_pool(struct lod_object *lo, int i,
384                                    const char *new_pool)
385 {
386         return lod_set_pool(&lo->ldo_comp_entries[i].llc_pool, new_pool);
387 }
388
389 /**
390  * Create new layout generation.
391  *
392  * The only requirement for layout generation is that it changes when
393  * the layout is modified, so a circular counter is sufficient for the
394  * low rate of layout modifications.
395  *
396  * Layout generation is also used to generate unique component ID.
397  * To detect generation overflow, we preserve the highest bit of the
398  * generation when it wrapped.
399  */
400 static inline void lod_obj_inc_layout_gen(struct lod_object *lo)
401 {
402         __u32 preserve = lo->ldo_layout_gen & ~LCME_ID_MASK;
403         lo->ldo_layout_gen++;
404         lo->ldo_layout_gen |= preserve;
405         /* Zero is not a valid generation */
406         if (unlikely((lo->ldo_layout_gen & LCME_ID_MASK) == 0))
407                 lo->ldo_layout_gen++;
408 }
409
410 struct lod_it {
411         struct dt_object        *lit_obj; /* object from the layer below */
412         /* stripe offset of iteration */
413         __u32                   lit_stripe_index;
414         __u32                   lit_attr;
415         struct dt_it            *lit_it;  /* iterator from the layer below */
416 };
417
418 struct lod_thread_info {
419         /* per-thread buffer for LOV EA, may be vmalloc'd */
420         void                           *lti_ea_store;
421         __u32                           lti_ea_store_size;
422         /* per-thread buffer for LMV EA */
423         struct lu_buf                   lti_buf;
424         struct ost_id                   lti_ostid;
425         struct lu_fid                   lti_fid;
426         struct obd_statfs               lti_osfs;
427         struct lu_attr                  lti_attr;
428         struct lod_it                   lti_it;
429         struct ldlm_res_id              lti_res_id;
430         /* used to hold lu_dirent, sizeof(struct lu_dirent) + NAME_MAX */
431         char                            lti_key[sizeof(struct lu_dirent) +
432                                                 NAME_MAX];
433         struct dt_object_format         lti_format;
434         struct lu_name                  lti_name;
435         struct lu_buf                   lti_linkea_buf;
436         struct dt_insert_rec            lti_dt_rec;
437         struct llog_catid               lti_cid;
438         struct llog_cookie              lti_cookie;
439         struct lustre_cfg               lti_lustre_cfg;
440         /* used to store parent default striping in create */
441         struct lod_default_striping     lti_def_striping;
442         struct filter_fid               lti_ff;
443         __u32                           *lti_comp_idx;
444         size_t                          lti_comp_size;
445         size_t                          lti_count;
446         struct lu_attr                  lti_layout_attr;
447         /* object allocation avoid guide info */
448         struct lod_avoid_guide          lti_avoid;
449         struct dt_allocation_hint       lti_ah;
450 };
451
452 extern const struct lu_device_operations lod_lu_ops;
453
454 static inline int lu_device_is_lod(struct lu_device *d)
455 {
456         return ergo(d != NULL && d->ld_ops != NULL, d->ld_ops == &lod_lu_ops);
457 }
458
459 static inline struct lod_device* lu2lod_dev(struct lu_device *d)
460 {
461         LASSERT(lu_device_is_lod(d));
462         return container_of0(d, struct lod_device, lod_dt_dev.dd_lu_dev);
463 }
464
465 static inline struct lu_device *lod2lu_dev(struct lod_device *d)
466 {
467         return &d->lod_dt_dev.dd_lu_dev;
468 }
469
470 static inline struct obd_device *lod2obd(struct lod_device *d)
471 {
472         return d->lod_dt_dev.dd_lu_dev.ld_obd;
473 }
474
475 static inline struct lod_device *dt2lod_dev(struct dt_device *d)
476 {
477         LASSERT(lu_device_is_lod(&d->dd_lu_dev));
478         return container_of0(d, struct lod_device, lod_dt_dev);
479 }
480
481 static inline struct lod_object *lu2lod_obj(struct lu_object *o)
482 {
483         LASSERT(ergo(o != NULL, lu_device_is_lod(o->lo_dev)));
484         return container_of0(o, struct lod_object, ldo_obj.do_lu);
485 }
486
487 static inline struct lu_object *lod2lu_obj(struct lod_object *obj)
488 {
489         return &obj->ldo_obj.do_lu;
490 }
491
492 static inline const struct lu_fid *lod_object_fid(struct lod_object *obj)
493 {
494         return lu_object_fid(lod2lu_obj(obj));
495 }
496
497 static inline struct lod_object *lod_obj(const struct lu_object *o)
498 {
499         LASSERT(lu_device_is_lod(o->lo_dev));
500         return container_of0(o, struct lod_object, ldo_obj.do_lu);
501 }
502
503 static inline struct lod_object *lod_dt_obj(const struct dt_object *d)
504 {
505         return lod_obj(&d->do_lu);
506 }
507
508 static inline struct dt_object* lod_object_child(struct lod_object *o)
509 {
510         return container_of0(lu_object_next(lod2lu_obj(o)),
511                         struct dt_object, do_lu);
512 }
513
514 static inline bool lod_obj_is_striped(struct dt_object *dt)
515 {
516         struct lod_object *lo = lod_dt_obj(dt);
517         int i;
518
519         if (!dt_object_exists(dt_object_child(dt)))
520                 return false;
521
522         if (S_ISDIR(dt->do_lu.lo_header->loh_attr))
523                 return lo->ldo_dir_stripe_count != 0;
524
525         for (i = 0; i < lo->ldo_comp_cnt; i++) {
526                 if (lo->ldo_comp_entries[i].llc_stripe == NULL)
527                         continue;
528                 LASSERT(lo->ldo_comp_entries[i].llc_stripe_count > 0);
529                 return true;
530         }
531         return false;
532 }
533
534 extern struct lu_context_key lod_thread_key;
535
536 static inline struct lod_thread_info *lod_env_info(const struct lu_env *env)
537 {
538         struct lod_thread_info *info;
539         info = lu_context_key_get(&env->le_ctx, &lod_thread_key);
540         LASSERT(info);
541         return info;
542 }
543
544 static inline struct lu_name *
545 lod_name_get(const struct lu_env *env, const void *area, int len)
546 {
547         struct lu_name *lname;
548
549         lname = &lod_env_info(env)->lti_name;
550         lname->ln_name = area;
551         lname->ln_namelen = len;
552         return lname;
553 }
554
555 static inline struct lod_default_striping *
556 lod_lds_buf_get(const struct lu_env *env)
557 {
558         struct lod_thread_info *info = lod_env_info(env);
559
560         info->lti_def_striping.lds_def_striping_set = 0;
561         info->lti_def_striping.lds_dir_def_striping_set = 0;
562         return &info->lti_def_striping;
563 }
564
565 static inline void lod_layout_get_pool(struct lod_layout_component *entries,
566                                        int count, char *pool, int len)
567 {
568         int i;
569
570         for (i = 0; i < count; i++) {
571                 if (entries[i].llc_pool != NULL) {
572                         strlcpy(pool, entries[i].llc_pool, len);
573                         break;
574                 }
575         }
576 }
577
578 #define lod_foreach_ost(__dev, index)   \
579         if ((__dev)->lod_osts_size > 0) \
580                 cfs_foreach_bit((__dev)->lod_ost_bitmap, (index))
581
582 #define lod_foreach_mdt(mdt_dev, index) \
583         cfs_foreach_bit((mdt_dev)->lod_mdt_bitmap, (index))
584
585 /* lod_dev.c */
586 extern struct kmem_cache *lod_object_kmem;
587 int lod_fld_lookup(const struct lu_env *env, struct lod_device *lod,
588                    const struct lu_fid *fid, __u32 *tgt, int *flags);
589 int lod_sub_init_llog(const struct lu_env *env, struct lod_device *lod,
590                       struct dt_device *dt);
591 void lod_sub_fini_llog(const struct lu_env *env,
592                        struct dt_device *dt, struct ptlrpc_thread *thread);
593 int lodname2mdt_index(char *lodname, __u32 *mdt_index);
594 extern void target_recovery_fini(struct obd_device *obd);
595
596 /* lod_lov.c */
597 void lod_getref(struct lod_tgt_descs *ltd);
598 void lod_putref(struct lod_device *lod, struct lod_tgt_descs *ltd);
599 int lod_add_device(const struct lu_env *env, struct lod_device *lod,
600                    char *osp, unsigned index, unsigned gen, int mdt_index,
601                    char *type, int active);
602 int lod_del_device(const struct lu_env *env, struct lod_device *lod,
603                    struct lod_tgt_descs *ltd, char *osp, unsigned idx,
604                    unsigned gen, bool for_ost);
605 int lod_fini_tgt(const struct lu_env *env, struct lod_device *lod,
606                  struct lod_tgt_descs *ltd, bool for_ost);
607 int lod_striping_load(const struct lu_env *env, struct lod_object *lo);
608 int lod_striping_reload(const struct lu_env *env, struct lod_object *lo,
609                         const struct lu_buf *buf);
610
611 int lod_get_ea(const struct lu_env *env, struct lod_object *lo,
612                const char *name);
613 static inline int
614 lod_get_lov_ea(const struct lu_env *env, struct lod_object *lo)
615 {
616         return lod_get_ea(env, lo, XATTR_NAME_LOV);
617 }
618
619 static inline int
620 lod_get_lmv_ea(const struct lu_env *env, struct lod_object *lo)
621 {
622         return lod_get_ea(env, lo, XATTR_NAME_LMV);
623 }
624
625 static inline int
626 lod_get_default_lmv_ea(const struct lu_env *env, struct lod_object *lo)
627 {
628         return lod_get_ea(env, lo, XATTR_NAME_DEFAULT_LMV);
629 }
630
631 static inline void
632 lod_comp_set_init(struct lod_layout_component *entry)
633 {
634         entry->llc_flags |= LCME_FL_INIT;
635 }
636
637 static inline void
638 lod_comp_unset_init(struct lod_layout_component *entry)
639 {
640         entry->llc_flags &= ~LCME_FL_INIT;
641 }
642
643 static inline bool
644 lod_comp_inited(const struct lod_layout_component *entry)
645 {
646         return entry->llc_flags & LCME_FL_INIT;
647 }
648
649 /**
650  * For a PFL file, some of its component could be un-instantiated, so
651  * that their lov_ost_data_v1 array is not needed, we'd use this function
652  * to reduce the LOVEA buffer size.
653  *
654  * Note: if llc_ostlist contains value, we'd need lov_ost_data_v1 array to
655  * save the specified OST index list.
656  */
657 static inline void
658 lod_comp_shrink_stripe_count(struct lod_layout_component *lod_comp,
659                              __u16 *stripe_count)
660 {
661         /**
662          * Need one lov_ost_data_v1 to store invalid ost_idx, please refer to
663          * lod_parse_striping()
664          */
665         if (!lod_comp_inited(lod_comp) && lod_comp->llc_ostlist.op_count == 0)
666                 *stripe_count = 1;
667 }
668
669 void lod_fix_desc(struct lov_desc *desc);
670 void lod_fix_desc_qos_maxage(__u32 *val);
671 void lod_fix_desc_pattern(__u32 *val);
672 void lod_fix_desc_stripe_count(__u32 *val);
673 void lod_fix_desc_stripe_size(__u64 *val);
674 int lod_pools_init(struct lod_device *m, struct lustre_cfg *cfg);
675 int lod_pools_fini(struct lod_device *m);
676 int lod_parse_striping(const struct lu_env *env, struct lod_object *mo,
677                        const struct lu_buf *buf);
678 int lod_parse_dir_striping(const struct lu_env *env, struct lod_object *lo,
679                            const struct lu_buf *buf);
680 int lod_initialize_objects(const struct lu_env *env, struct lod_object *mo,
681                            struct lov_ost_data_v1 *objs, int index);
682 int lod_verify_striping(struct lod_device *d, struct lod_object *lo,
683                         const struct lu_buf *buf, bool is_from_disk);
684 int lod_generate_lovea(const struct lu_env *env, struct lod_object *lo,
685                        struct lov_mds_md *lmm, int *lmm_size, bool is_dir);
686 int lod_ea_store_resize(struct lod_thread_info *info, size_t size);
687 int lod_def_striping_comp_resize(struct lod_default_striping *lds, __u16 count);
688 void lod_free_def_comp_entries(struct lod_default_striping *lds);
689 void lod_free_comp_entries(struct lod_object *lo);
690 int lod_alloc_comp_entries(struct lod_object *lo, int mirror_cnt, int comp_cnt);
691 int lod_fill_mirrors(struct lod_object *lo);
692
693 /* lod_pool.c */
694 int lod_ost_pool_add(struct ost_pool *op, __u32 idx, unsigned int min_count);
695 int lod_ost_pool_remove(struct ost_pool *op, __u32 idx);
696 int lod_ost_pool_extend(struct ost_pool *op, unsigned int min_count);
697 struct pool_desc *lod_find_pool(struct lod_device *lod, char *poolname);
698 void lod_pool_putref(struct pool_desc *pool);
699 int lod_ost_pool_free(struct ost_pool *op);
700 int lod_pool_del(struct obd_device *obd, char *poolname);
701 int lod_ost_pool_init(struct ost_pool *op, unsigned int count);
702 extern struct cfs_hash_ops pool_hash_operations;
703 int lod_check_index_in_pool(__u32 idx, struct pool_desc *pool);
704 int lod_pool_new(struct obd_device *obd, char *poolname);
705 int lod_pool_add(struct obd_device *obd, char *poolname, char *ostname);
706 int lod_pool_remove(struct obd_device *obd, char *poolname, char *ostname);
707
708 struct lod_obj_stripe_cb_data;
709 typedef int (*lod_obj_stripe_cb_t)(const struct lu_env *env,
710                                    struct lod_object *lo, struct dt_object *dt,
711                                    struct thandle *th,
712                                    int comp_idx, int stripe_idx,
713                                    struct lod_obj_stripe_cb_data *data);
714 typedef bool (*lod_obj_comp_skip_cb_t)(const struct lu_env *env,
715                                         struct lod_object *lo, int comp_idx,
716                                         struct lod_obj_stripe_cb_data *data);
717 typedef int (*lod_obj_comp_cb_t)(const struct lu_env *env,
718                                 struct lod_object *lo, int comp_idx,
719                                 struct lod_obj_stripe_cb_data *data);
720 struct lod_obj_stripe_cb_data {
721         union {
722                 const struct lu_attr    *locd_attr;
723                 int                     locd_ost_index;
724                 const struct lu_buf     *locd_buf;
725         };
726         lod_obj_stripe_cb_t             locd_stripe_cb;
727         lod_obj_comp_skip_cb_t          locd_comp_skip_cb;
728         lod_obj_comp_cb_t               locd_comp_cb;
729         bool                            locd_declare;
730 };
731
732 /* lod_qos.c */
733 int lod_prepare_create(const struct lu_env *env, struct lod_object *lo,
734                        struct lu_attr *attr, const struct lu_buf *buf,
735                        struct thandle *th);
736 int qos_add_tgt(struct lod_device*, struct lod_tgt_desc *);
737 int qos_del_tgt(struct lod_device *, struct lod_tgt_desc *);
738 void lod_qos_rr_init(struct lod_qos_rr *lqr);
739 int lod_use_defined_striping(const struct lu_env *, struct lod_object *,
740                              const struct lu_buf *);
741 int lod_qos_parse_config(const struct lu_env *env, struct lod_object *lo,
742                          const struct lu_buf *buf);
743 int lod_qos_prep_create(const struct lu_env *env, struct lod_object *lo,
744                         struct lu_attr *attr, struct thandle *th,
745                         int comp_idx);
746 __u16 lod_comp_entry_stripe_count(struct lod_object *lo,
747                                   struct lod_layout_component *entry,
748                                   bool is_dir);
749 __u16 lod_get_stripe_count(struct lod_device *lod, struct lod_object *lo,
750                            __u16 stripe_count);
751 void lod_qos_statfs_update(const struct lu_env *env, struct lod_device *lod);
752
753 /* lproc_lod.c */
754 int lod_procfs_init(struct lod_device *lod);
755 void lod_procfs_fini(struct lod_device *lod);
756
757 /* lod_object.c */
758 extern struct dt_object_operations lod_obj_ops;
759 extern struct lu_object_operations lod_lu_obj_ops;
760
761 int lod_load_lmv_shards(const struct lu_env *env, struct lod_object *lo,
762                         struct lu_buf *buf, bool resize);
763 int lod_declare_striped_create(const struct lu_env *env, struct dt_object *dt,
764                                struct lu_attr *attr,
765                                const struct lu_buf *lovea, struct thandle *th);
766 int lod_striped_create(const struct lu_env *env, struct dt_object *dt,
767                         struct lu_attr *attr, struct dt_object_format *dof,
768                         struct thandle *th);
769 void lod_striping_free_nolock(const struct lu_env *env, struct lod_object *lo);
770 void lod_striping_free(const struct lu_env *env, struct lod_object *lo);
771
772 int lod_obj_for_each_stripe(const struct lu_env *env, struct lod_object *lo,
773                             struct thandle *th,
774                             struct lod_obj_stripe_cb_data *data);
775 int lod_comp_copy_ost_lists(struct lod_layout_component *lod_comp,
776                             struct lov_user_md_v3 *v3);
777
778 /* lod_sub_object.c */
779 struct thandle *lod_sub_get_thandle(const struct lu_env *env,
780                                     struct thandle *th,
781                                     const struct dt_object *sub_obj,
782                                     bool *record_update);
783 int lod_sub_declare_create(const struct lu_env *env, struct dt_object *dt,
784                            struct lu_attr *attr,
785                            struct dt_allocation_hint *hint,
786                            struct dt_object_format *dof, struct thandle *th);
787 int lod_sub_create(const struct lu_env *env, struct dt_object *dt,
788                    struct lu_attr *attr, struct dt_allocation_hint *hint,
789                    struct dt_object_format *dof, struct thandle *th);
790 int lod_sub_declare_ref_add(const struct lu_env *env, struct dt_object *dt,
791                             struct thandle *th);
792 int lod_sub_ref_add(const struct lu_env *env, struct dt_object *dt,
793                     struct thandle *th);
794 int lod_sub_declare_ref_del(const struct lu_env *env, struct dt_object *dt,
795                             struct thandle *th);
796 int lod_sub_ref_del(const struct lu_env *env, struct dt_object *dt,
797                     struct thandle *th);
798 int lod_sub_declare_destroy(const struct lu_env *env, struct dt_object *dt,
799                             struct thandle *th);
800 int lod_sub_destroy(const struct lu_env *env, struct dt_object *dt,
801                     struct thandle *th);
802 int lod_sub_declare_insert(const struct lu_env *env, struct dt_object *dt,
803                            const struct dt_rec *rec, const struct dt_key *key,
804                            struct thandle *th);
805 int lod_sub_insert(const struct lu_env *env, struct dt_object *dt,
806                    const struct dt_rec *rec, const struct dt_key *key,
807                    struct thandle *th);
808 int lod_sub_declare_delete(const struct lu_env *env, struct dt_object *dt,
809                            const struct dt_key *key, struct thandle *th);
810 int lod_sub_delete(const struct lu_env *env, struct dt_object *dt,
811                    const struct dt_key *name, struct thandle *th);
812 int lod_sub_declare_xattr_set(const struct lu_env *env, struct dt_object *dt,
813                               const struct lu_buf *buf, const char *name,
814                               int fl, struct thandle *th);
815 int lod_sub_xattr_set(const struct lu_env *env, struct dt_object *dt,
816                       const struct lu_buf *buf, const char *name, int fl,
817                       struct thandle *th);
818 int lod_sub_declare_attr_set(const struct lu_env *env, struct dt_object *dt,
819                              const struct lu_attr *attr, struct thandle *th);
820 int lod_sub_attr_set(const struct lu_env *env, struct dt_object *dt,
821                      const struct lu_attr *attr, struct thandle *th);
822 int lod_sub_declare_xattr_del(const struct lu_env *env, struct dt_object *dt,
823                               const char *name, struct thandle *th);
824 int lod_sub_xattr_del(const struct lu_env *env, struct dt_object *dt,
825                       const char *name, struct thandle *th);
826 int lod_sub_declare_write(const struct lu_env *env, struct dt_object *dt,
827                           const struct lu_buf *buf, loff_t pos,
828                           struct thandle *th);
829 ssize_t lod_sub_write(const struct lu_env *env, struct dt_object *dt,
830                       const struct lu_buf *buf, loff_t *pos,
831                       struct thandle *th);
832 int lod_sub_declare_punch(const struct lu_env *env, struct dt_object *dt,
833                           __u64 start, __u64 end, struct thandle *th);
834 int lod_sub_punch(const struct lu_env *env, struct dt_object *dt,
835                   __u64 start, __u64 end, struct thandle *th);
836
837 int lod_sub_prep_llog(const struct lu_env *env, struct lod_device *lod,
838                       struct dt_device *dt, int index);
839 #endif