Whamcloud - gitweb
LU-9859 lod: use linux kernel bitmap API
[fs/lustre-release.git] / lustre / lod / lod_internal.h
index 2970d93..68d890d 100644 (file)
@@ -23,7 +23,7 @@
  * Copyright  2009 Sun Microsystems, Inc. All rights reserved
  * Use is subject to license terms.
  *
- * Copyright (c) 2012, 2016, Intel Corporation.
+ * Copyright (c) 2012, 2017, Intel Corporation.
  */
 /*
  * This file is part of Lustre, http://www.lustre.org/
@@ -39,7 +39,7 @@
 #define _LOD_INTERNAL_H
 
 #include <libcfs/libcfs.h>
-#include <uapi/linux/lustre_cfg.h>
+#include <uapi/linux/lustre/lustre_cfg.h>
 #include <obd.h>
 #include <dt_object.h>
 
 #define LMVEA_DELETE_VALUES(count, offset)                             \
        ((count) == 0 && (offset) == (typeof(offset))(-1))
 
-#define LOV_OFFSET_DEFAULT             ((__u16)-1)
-
-struct lod_qos_rr {
-       spinlock_t               lqr_alloc;     /* protect allocation index */
-       __u32                    lqr_start_idx; /* start index of new inode */
-       __u32                    lqr_offset_idx;/* aliasing for start_idx */
-       int                      lqr_start_count;/* reseed counter */
-       struct ost_pool          lqr_pool;      /* round-robin optimized list */
-       unsigned long            lqr_dirty:1;   /* recalc round-robin list */
-};
-
 struct pool_desc {
        char                     pool_name[LOV_MAXPOOLNAME + 1];
-       struct ost_pool          pool_obds;     /* pool members */
+       struct lu_tgt_pool       pool_obds;     /* pool members */
        atomic_t                 pool_refcount;
-       struct lod_qos_rr        pool_rr;
-       struct hlist_node        pool_hash;     /* access by poolname */
+       struct lu_qos_rr         pool_rr;
+       struct rhash_head        pool_hash;     /* access by poolname */
        struct list_head         pool_list;
+       struct rcu_head          pool_rcu;
        struct proc_dir_entry   *pool_proc_entry;
        struct obd_device       *pool_lobd;     /* owner */
 };
 
+int lod_pool_hash_init(struct rhashtable *tbl);
+void lod_pool_hash_destroy(struct rhashtable *tbl);
+
 #define pool_tgt_count(p) ((p)->pool_obds.op_count)
 #define pool_tgt_array(p)  ((p)->pool_obds.op_array)
 #define pool_tgt_rw_sem(p) ((p)->pool_obds.op_rw_sem)
 
-struct lod_qos {
-       struct list_head         lq_oss_list;
-       struct rw_semaphore      lq_rw_sem;
-       __u32                    lq_active_oss_count;
-       unsigned int             lq_prio_free;   /* priority for free space */
-       unsigned int             lq_threshold_rr;/* priority for rr */
-       struct lod_qos_rr        lq_rr;          /* round robin qos data */
-       bool                     lq_dirty:1,     /* recalc qos data */
-                                lq_same_space:1,/* the ost's all have approx.
-                                                   the same space avail */
-                                lq_reset:1;     /* zero current penalties */
-};
-
-struct lod_qos_oss {
-       struct obd_uuid          lqo_uuid;      /* ptlrpc's c_remote_uuid */
-       struct list_head         lqo_oss_list;  /* link to lov_qos */
-       __u64                    lqo_bavail;    /* total bytes avail on OSS */
-       __u64                    lqo_penalty;   /* current penalty */
-       __u64                    lqo_penalty_per_obj; /* penalty decrease
-                                                        every obj*/
-       time_t                   lqo_used;      /* last used time, seconds */
-       __u32                    lqo_ost_count; /* number of osts on this oss */
-};
-
-struct ltd_qos {
-       struct lod_qos_oss      *ltq_oss;       /* oss info */
-       __u64                    ltq_penalty;   /* current penalty */
-       __u64                    ltq_penalty_per_obj; /* penalty decrease
-                                                        every obj*/
-       __u64                    ltq_weight;    /* net weighting */
-       time_t                   ltq_used;      /* last used time, seconds */
-       bool                     ltq_usable:1;  /* usable for striping */
-};
-
-struct lod_tgt_desc {
-       struct dt_device  *ltd_tgt;
-       struct list_head   ltd_kill;
-       struct obd_export *ltd_exp;
-       struct obd_uuid    ltd_uuid;
-       __u32              ltd_gen;
-       __u32              ltd_index;
-       struct ltd_qos     ltd_qos; /* qos info per target */
-       struct obd_statfs  ltd_statfs;
-       struct ptlrpc_thread    *ltd_recovery_thread;
-       unsigned long      ltd_active:1,/* is this target up for requests */
-                          ltd_activate:1,/* should  target be activated */
-                          ltd_reap:1,  /* should this target be deleted */
-                          ltd_got_update_log:1, /* Already got update log */
-                          ltd_connecting:1; /* target is connecting */
-};
-
-#define TGT_PTRS               256     /* number of pointers at 1st level */
-#define TGT_PTRS_PER_BLOCK      256     /* number of pointers at 2nd level */
-
-struct lod_tgt_desc_idx {
-       struct lod_tgt_desc *ldi_tgt[TGT_PTRS_PER_BLOCK];
-};
-
-#define LTD_TGT(ltd, index)      \
-        ((ltd)->ltd_tgt_idx[(index) / \
-        TGT_PTRS_PER_BLOCK]->ldi_tgt[(index) % TGT_PTRS_PER_BLOCK])
+#define lod_tgt_desc   lu_tgt_desc
+#define lod_tgt_descs  lu_tgt_descs
 
 #define OST_TGT(lod, index)   LTD_TGT(&lod->lod_ost_descs, index)
 #define MDT_TGT(lod, index)   LTD_TGT(&lod->lod_mdt_descs, index)
-struct lod_tgt_descs {
-       /* list of known TGTs */
-       struct lod_tgt_desc_idx *ltd_tgt_idx[TGT_PTRS];
-       /* Size of the lod_tgts array, granted to be a power of 2 */
-       __u32                   ltd_tgts_size;
-       /* number of registered TGTs */
-       __u32                   ltd_tgtnr;
-       /* bitmap of TGTs available */
-       struct cfs_bitmap       *ltd_tgt_bitmap;
-       /* TGTs scheduled to be deleted */
-       __u32                   ltd_death_row;
-       /* Table refcount used for delayed deletion */
-       int                     ltd_refcount;
-       /* mutex to serialize concurrent updates to the tgt table */
-       struct mutex            ltd_mutex;
-       /* read/write semaphore used for array relocation */
-       struct rw_semaphore     ltd_rw_sem;
+
+struct lod_avoid_guide {
+       /* ids of OSSs avoid guidance */
+       __u32                   *lag_oss_avoid_array;
+       /* number of filled array items */
+       unsigned int            lag_oaa_count;
+       /* number of allocated array items */
+       unsigned int            lag_oaa_size;
+       /* bitmap of OSTs avoid guidance */
+       unsigned long           *lag_ost_avoid_bitmap;
+       u32                     lag_ost_avoid_size;
+       /* how many OSTs are available for alloc */
+       __u32                   lag_ost_avail;
 };
 
+#define LOD_DOM_MIN_SIZE_KB (LOV_MIN_STRIPE_SIZE >> 10)
+#define LOD_DOM_SFS_MAX_AGE 10
+
 struct lod_device {
        struct dt_device      lod_dt_dev;
        struct obd_export    *lod_child_exp;
        struct dt_device     *lod_child;
-       struct proc_dir_entry *lod_proc_entry;
        struct lprocfs_stats *lod_stats;
        spinlock_t            lod_connects_lock;
        int                   lod_connects;
@@ -176,9 +108,6 @@ struct lod_device {
                              lod_lmv_failout:1,
                              lod_child_got_update_log:1;
 
-       /* lov settings descriptor storing static information */
-       struct lov_desc       lod_desc;
-
        /* protect ld_active_tgt_count, ltd_active and lod_md_root */
        spinlock_t           lod_lock;
 
@@ -188,45 +117,41 @@ struct lod_device {
        struct lod_tgt_descs  lod_mdt_descs;
 
        /* Recovery thread for lod_child */
-       struct ptlrpc_thread    lod_child_recovery_thread;
+       struct task_struct   *lod_child_recovery_task;
 
        /* maximum EA size underlied OSD may have */
        unsigned int          lod_osd_max_easize;
-
-       /*FIXME: When QOS and pool is implemented for MDT, probably these
-        * structure should be moved to lod_tgt_descs as well.
-        */
-       /* QoS info per LOD */
-       struct lod_qos        lod_qos; /* qos info per lod */
+       /* maximum size of MDT stripe for Data-on-MDT files. */
+       unsigned int          lod_dom_stripesize_max_kb;
+       /* current DOM default stripe size adjusted by threshold */
+       unsigned int          lod_dom_stripesize_cur_kb;
+       /* Threshold at which DOM default stripe will start decreasing */
+       __u64                 lod_dom_threshold_free_mb;
+
+       /* Local OSD statfs cache */
+       spinlock_t            lod_lsfs_lock;
+       time64_t              lod_lsfs_age;
+       __u64                 lod_lsfs_total_mb;
+       __u64                 lod_lsfs_free_mb;
 
        /* OST pool data */
-       struct ost_pool         lod_pool_info; /* all OSTs in a packed array */
        int                     lod_pool_count;
-       struct cfs_hash        *lod_pools_hash_body; /* used for key access */
+       struct rhashtable       lod_pools_hash_body; /* used for key access */
        struct list_head        lod_pool_list; /* used for sequential access */
        struct proc_dir_entry  *lod_pool_proc_entry;
 
        enum lustre_sec_part   lod_sp_me;
 
        struct proc_dir_entry *lod_symlink;
+       struct dentry          *lod_debugfs;
 
        /* ROOT object, used to fetch FS default striping */
        struct lod_object      *lod_md_root;
 };
 
-#define lod_osts       lod_ost_descs.ltd_tgts
-#define lod_ost_bitmap lod_ost_descs.ltd_tgt_bitmap
-#define lod_ostnr      lod_ost_descs.ltd_tgtnr
-#define lod_osts_size  lod_ost_descs.ltd_tgts_size
-#define ltd_ost                ltd_tgt
-#define lod_ost_desc   lod_tgt_desc
-
-#define lod_mdts               lod_mdt_descs.ltd_tgts
-#define lod_mdt_bitmap         lod_mdt_descs.ltd_tgt_bitmap
-#define lod_remote_mdt_count   lod_mdt_descs.ltd_tgtnr
-#define lod_mdts_size          lod_mdt_descs.ltd_tgts_size
-#define ltd_mdt                        ltd_tgt
-#define lod_mdt_desc           lod_tgt_desc
+#define lod_ost_bitmap         lod_ost_descs.ltd_tgt_bitmap
+#define lod_ost_count          lod_ost_descs.ltd_lov_desc.ld_tgt_count
+#define lod_remote_mdt_count   lod_mdt_descs.ltd_lmv_desc.ld_tgt_count
 
 struct lod_layout_component {
        struct lu_extent          llc_extent;
@@ -236,23 +161,26 @@ struct lod_layout_component {
        __u32                     llc_pattern;
        __u16                     llc_layout_gen;
        __u16                     llc_stripe_offset;
-       __u16                     llc_stripenr;
+       __u16                     llc_stripe_count;
        __u16                     llc_stripes_allocated;
+       __u64                     llc_timestamp; /* snapshot time */
        char                     *llc_pool;
        /* ost list specified with LOV_USER_MAGIC_SPECIFIC lum */
-       struct ost_pool           llc_ostlist;
+       struct lu_tgt_pool        llc_ostlist;
        struct dt_object        **llc_stripe;
+       __u32                    *llc_ost_indices;
 };
 
 struct lod_default_striping {
        /* default LOV */
        /* current layout component count */
        __u16                           lds_def_comp_cnt;
+       __u16                           lds_def_mirror_cnt;
        /* the largest comp count ever used */
        __u32                           lds_def_comp_size_cnt;
        struct lod_layout_component     *lds_def_comp_entries;
        /* default LMV */
-       __u32                           lds_dir_def_stripenr;
+       __u32                           lds_dir_def_stripe_count;
        __u32                           lds_dir_def_stripe_offset;
        __u32                           lds_dir_def_hash_type;
                                        /* default file striping flags (LOV) */
@@ -262,8 +190,20 @@ struct lod_default_striping {
                                        lds_dir_def_striping_set:1;
 };
 
+struct lod_mirror_entry {
+       __u16   lme_stale:1,
+               lme_primary:1;
+       /* mirror id */
+       __u16   lme_id;
+       /* start,end index of this mirror in ldo_comp_entries */
+       __u16   lme_start;
+       __u16   lme_end;
+};
+
 struct lod_object {
+       /* common fields for both files and directories */
        struct dt_object                ldo_obj;
+       struct mutex                    ldo_layout_mutex;
        union {
                /* file stripe (LOV) */
                struct {
@@ -271,34 +211,93 @@ struct lod_object {
                        /* Layout component count for a regular file.
                         * It equals to 1 for non-composite layout. */
                        __u16           ldo_comp_cnt;
+                       /* Layout mirror count for a PFLR file.
+                        * It's 0 for files with non-composite layout. */
+                       __u16           ldo_mirror_count;
+                       struct lod_mirror_entry *ldo_mirrors;
                        __u32           ldo_is_composite:1,
-                                       ldo_comp_cached:1;
+                                       ldo_flr_state:2,
+                                       ldo_comp_cached:1,
+                                       ldo_is_foreign:1;
                };
                /* directory stripe (LMV) */
                struct {
                        /* Slave stripe count for striped directory. */
-                       __u16           ldo_dir_stripenr;
+                       __u16           ldo_dir_stripe_count;
                        /* How many stripes allocated for a striped directory */
                        __u16           ldo_dir_stripes_allocated;
                        __u32           ldo_dir_stripe_offset;
                        __u32           ldo_dir_hash_type;
+                       __u32           ldo_dir_migrate_offset;
+                       __u32           ldo_dir_migrate_hash;
+                       __u32           ldo_dir_layout_version;
                        /* Is a slave stripe of striped directory? */
                        __u32           ldo_dir_slave_stripe:1,
-                                       ldo_dir_striped:1;
+                                       ldo_dir_striped:1,
+                                       /* the stripe has been loaded */
+                                       ldo_dir_stripe_loaded:1,
+                                       /* foreign directory */
+                                       ldo_dir_is_foreign;
                        /*
-                        * default striping is not cached, so this field is
-                        * invalid after create, make sure it's used by
+                        * This default LMV is parent default LMV, which will be
+                        * used in child creation, and it's not cached, so this
+                        * field is invalid after create, make sure it's used by
                         * lod_dir_striping_create_internal() only.
                         */
                        struct lod_default_striping     *ldo_def_striping;
                };
        };
-       /* file stripe (LOV) */
-       struct lod_layout_component     *ldo_comp_entries;
-       /* slave stripes of striped directory (LMV)*/
-       struct dt_object                **ldo_stripe;
+       union {
+               struct {
+                       /* foreign/raw format LOV */
+                       char                            *ldo_foreign_lov;
+                       size_t                           ldo_foreign_lov_size;
+               };
+               struct {
+                       /* foreign/raw format LMV */
+                       char                            *ldo_foreign_lmv;
+                       size_t                           ldo_foreign_lmv_size;
+               };
+               struct {
+                       /* file stripe (LOV) */
+                       struct lod_layout_component     *ldo_comp_entries;
+                       /* slave stripes of striped directory (LMV) */
+                       struct dt_object                **ldo_stripe;
+               };
+       };
 };
 
+#define ldo_dir_split_offset   ldo_dir_migrate_offset
+#define ldo_dir_split_hash     ldo_dir_migrate_hash
+
+#define lod_foreach_mirror_comp(comp, lo, mirror_idx)                      \
+for (comp = &lo->ldo_comp_entries[lo->ldo_mirrors[mirror_idx].lme_start];  \
+     comp <= &lo->ldo_comp_entries[lo->ldo_mirrors[mirror_idx].lme_end];   \
+     comp++)
+
+static inline bool lod_is_flr(const struct lod_object *lo)
+{
+       if (!lo->ldo_is_composite)
+               return false;
+
+       return (lo->ldo_flr_state & LCM_FL_FLR_MASK) != LCM_FL_NONE;
+}
+
+static inline bool lod_is_splitting(const struct lod_object *lo)
+{
+       return lmv_hash_is_splitting(lo->ldo_dir_hash_type);
+}
+
+static inline bool lod_is_migrating(const struct lod_object *lo)
+{
+       return lmv_hash_is_migrating(lo->ldo_dir_hash_type);
+}
+
+static inline bool lod_is_layout_changing(const struct lod_object *lo)
+{
+       return lmv_hash_is_layout_changing(lo->ldo_dir_hash_type);
+}
+
 static inline int lod_set_pool(char **pool, const char *new_pool)
 {
        int len;
@@ -324,15 +323,13 @@ static inline int lod_set_pool(char **pool, const char *new_pool)
 static inline int lod_set_def_pool(struct lod_default_striping *lds,
                                   int i, const char *new_pool)
 {
-       return lod_set_pool(&lds->lds_def_comp_entries[i].llc_pool,
-                           new_pool);
+       return lod_set_pool(&lds->lds_def_comp_entries[i].llc_pool, new_pool);
 }
 
 static inline int lod_obj_set_pool(struct lod_object *lo, int i,
                                   const char *new_pool)
 {
-       return lod_set_pool(&lo->ldo_comp_entries[i].llc_pool,
-                           new_pool);
+       return lod_set_pool(&lo->ldo_comp_entries[i].llc_pool, new_pool);
 }
 
 /**
@@ -376,7 +373,6 @@ struct lod_thread_info {
        struct lu_attr                  lti_attr;
        struct lod_it                   lti_it;
        struct ldlm_res_id              lti_res_id;
-       struct ost_pool                 lti_inuse_osts;
        /* used to hold lu_dirent, sizeof(struct lu_dirent) + NAME_MAX */
        char                            lti_key[sizeof(struct lu_dirent) +
                                                NAME_MAX];
@@ -389,7 +385,14 @@ struct lod_thread_info {
        struct lustre_cfg               lti_lustre_cfg;
        /* used to store parent default striping in create */
        struct lod_default_striping     lti_def_striping;
-       struct filter_fid lti_ff;
+       struct filter_fid               lti_ff;
+       __u32                           *lti_comp_idx;
+       size_t                          lti_comp_size;
+       size_t                          lti_count;
+       struct lu_attr                  lti_layout_attr;
+       /* object allocation avoid guide info */
+       struct lod_avoid_guide          lti_avoid;
+       union lmv_mds_md                lti_lmv;
 };
 
 extern const struct lu_device_operations lod_lu_ops;
@@ -402,7 +405,7 @@ static inline int lu_device_is_lod(struct lu_device *d)
 static inline struct lod_device* lu2lod_dev(struct lu_device *d)
 {
        LASSERT(lu_device_is_lod(d));
-       return container_of0(d, struct lod_device, lod_dt_dev.dd_lu_dev);
+       return container_of_safe(d, struct lod_device, lod_dt_dev.dd_lu_dev);
 }
 
 static inline struct lu_device *lod2lu_dev(struct lod_device *d)
@@ -418,13 +421,13 @@ static inline struct obd_device *lod2obd(struct lod_device *d)
 static inline struct lod_device *dt2lod_dev(struct dt_device *d)
 {
        LASSERT(lu_device_is_lod(&d->dd_lu_dev));
-       return container_of0(d, struct lod_device, lod_dt_dev);
+       return container_of(d, struct lod_device, lod_dt_dev);
 }
 
 static inline struct lod_object *lu2lod_obj(struct lu_object *o)
 {
        LASSERT(ergo(o != NULL, lu_device_is_lod(o->lo_dev)));
-       return container_of0(o, struct lod_object, ldo_obj.do_lu);
+       return container_of_safe(o, struct lod_object, ldo_obj.do_lu);
 }
 
 static inline struct lu_object *lod2lu_obj(struct lod_object *obj)
@@ -432,10 +435,15 @@ static inline struct lu_object *lod2lu_obj(struct lod_object *obj)
        return &obj->ldo_obj.do_lu;
 }
 
+static inline const struct lu_fid *lod_object_fid(struct lod_object *obj)
+{
+       return lu_object_fid(lod2lu_obj(obj));
+}
+
 static inline struct lod_object *lod_obj(const struct lu_object *o)
 {
        LASSERT(lu_device_is_lod(o->lo_dev));
-       return container_of0(o, struct lod_object, ldo_obj.do_lu);
+       return container_of(o, struct lod_object, ldo_obj.do_lu);
 }
 
 static inline struct lod_object *lod_dt_obj(const struct dt_object *d)
@@ -445,8 +453,8 @@ static inline struct lod_object *lod_dt_obj(const struct dt_object *d)
 
 static inline struct dt_object* lod_object_child(struct lod_object *o)
 {
-       return container_of0(lu_object_next(lod2lu_obj(o)),
-                       struct dt_object, do_lu);
+       return container_of(lu_object_next(lod2lu_obj(o)),
+                           struct dt_object, do_lu);
 }
 
 static inline bool lod_obj_is_striped(struct dt_object *dt)
@@ -458,12 +466,15 @@ static inline bool lod_obj_is_striped(struct dt_object *dt)
                return false;
 
        if (S_ISDIR(dt->do_lu.lo_header->loh_attr))
-               return lo->ldo_dir_stripenr != 0;
+               return lo->ldo_dir_stripe_count != 0;
+
+       if (lo->ldo_is_foreign)
+               return false;
 
        for (i = 0; i < lo->ldo_comp_cnt; i++) {
                if (lo->ldo_comp_entries[i].llc_stripe == NULL)
                        continue;
-               LASSERT(lo->ldo_comp_entries[i].llc_stripenr > 0);
+               LASSERT(lo->ldo_comp_entries[i].llc_stripe_count > 0);
                return true;
        }
        return false;
@@ -490,12 +501,31 @@ lod_name_get(const struct lu_env *env, const void *area, int len)
        return lname;
 }
 
-#define lod_foreach_ost(__dev, index)  \
-       if ((__dev)->lod_osts_size > 0) \
-               cfs_foreach_bit((__dev)->lod_ost_bitmap, (index))
+static inline struct lod_default_striping *
+lod_lds_buf_get(const struct lu_env *env)
+{
+       struct lod_thread_info *info = lod_env_info(env);
 
-#define lod_foreach_mdt(mdt_dev, index)        \
-       cfs_foreach_bit((mdt_dev)->lod_mdt_bitmap, (index))
+       info->lti_def_striping.lds_def_striping_set = 0;
+       info->lti_def_striping.lds_dir_def_striping_set = 0;
+       return &info->lti_def_striping;
+}
+
+static inline void lod_layout_get_pool(struct lod_layout_component *entries,
+                                      int count, char *pool, int len)
+{
+       int i;
+
+       for (i = 0; i < count; i++) {
+               if (entries[i].llc_pool != NULL) {
+                       strlcpy(pool, entries[i].llc_pool, len);
+                       break;
+               }
+       }
+}
+
+#define lod_foreach_mdt(lod, mdt) ltd_foreach_tgt(&(lod)->lod_mdt_descs, mdt)
+#define lod_foreach_ost(lod, ost) ltd_foreach_tgt(&(lod)->lod_ost_descs, ost)
 
 /* lod_dev.c */
 extern struct kmem_cache *lod_object_kmem;
@@ -504,7 +534,7 @@ int lod_fld_lookup(const struct lu_env *env, struct lod_device *lod,
 int lod_sub_init_llog(const struct lu_env *env, struct lod_device *lod,
                      struct dt_device *dt);
 void lod_sub_fini_llog(const struct lu_env *env,
-                      struct dt_device *dt, struct ptlrpc_thread *thread);
+                      struct dt_device *dt, struct task_struct **taskp);
 int lodname2mdt_index(char *lodname, __u32 *mdt_index);
 extern void target_recovery_fini(struct obd_device *obd);
 
@@ -515,12 +545,14 @@ int lod_add_device(const struct lu_env *env, struct lod_device *lod,
                   char *osp, unsigned index, unsigned gen, int mdt_index,
                   char *type, int active);
 int lod_del_device(const struct lu_env *env, struct lod_device *lod,
-                  struct lod_tgt_descs *ltd, char *osp, unsigned idx,
-                  unsigned gen, bool for_ost);
+                  struct lod_tgt_descs *ltd, char *osp, unsigned int idx,
+                  unsigned int gen);
 int lod_fini_tgt(const struct lu_env *env, struct lod_device *lod,
-                struct lod_tgt_descs *ltd, bool for_ost);
-int lod_load_striping_locked(const struct lu_env *env, struct lod_object *lo);
-int lod_load_striping(const struct lu_env *env, struct lod_object *lo);
+                struct lod_tgt_descs *ltd);
+int lod_striping_load(const struct lu_env *env, struct lod_object *lo);
+int lod_striping_reload(const struct lu_env *env, struct lod_object *lo,
+                       const struct lu_buf *buf);
+void lod_dom_stripesize_recalc(struct lod_device *d);
 
 int lod_get_ea(const struct lu_env *env, struct lod_object *lo,
               const char *name);
@@ -569,8 +601,8 @@ lod_comp_inited(const struct lod_layout_component *entry)
  * save the specified OST index list.
  */
 static inline void
-lod_comp_shrink_stripecount(struct lod_layout_component *lod_comp,
-                           __u16 *stripe_count)
+lod_comp_shrink_stripe_count(struct lod_layout_component *lod_comp,
+                            __u16 *stripe_count)
 {
        /**
         * Need one lov_ost_data_v1 to store invalid ost_idx, please refer to
@@ -585,6 +617,7 @@ void lod_fix_desc_qos_maxage(__u32 *val);
 void lod_fix_desc_pattern(__u32 *val);
 void lod_fix_desc_stripe_count(__u32 *val);
 void lod_fix_desc_stripe_size(__u64 *val);
+void lod_fix_lmv_desc_pattern(__u32 *val);
 int lod_pools_init(struct lod_device *m, struct lustre_cfg *cfg);
 int lod_pools_fini(struct lod_device *m);
 int lod_parse_striping(const struct lu_env *env, struct lod_object *mo,
@@ -593,67 +626,74 @@ int lod_parse_dir_striping(const struct lu_env *env, struct lod_object *lo,
                           const struct lu_buf *buf);
 int lod_initialize_objects(const struct lu_env *env, struct lod_object *mo,
                           struct lov_ost_data_v1 *objs, int index);
-int lod_verify_striping(struct lod_device *d, const struct lu_buf *buf,
-                       bool is_from_disk, __u64 start);
+int lod_verify_striping(const struct lu_env *env, struct lod_device *d,
+                       struct lod_object *lo, const struct lu_buf *buf,
+                       bool is_from_disk);
 int lod_generate_lovea(const struct lu_env *env, struct lod_object *lo,
                       struct lov_mds_md *lmm, int *lmm_size, bool is_dir);
 int lod_ea_store_resize(struct lod_thread_info *info, size_t size);
 int lod_def_striping_comp_resize(struct lod_default_striping *lds, __u16 count);
 void lod_free_def_comp_entries(struct lod_default_striping *lds);
 void lod_free_comp_entries(struct lod_object *lo);
-int lod_alloc_comp_entries(struct lod_object *lo, int cnt);
+int lod_alloc_comp_entries(struct lod_object *lo, int mirror_cnt, int comp_cnt);
+int lod_fill_mirrors(struct lod_object *lo);
 
 /* lod_pool.c */
-int lod_ost_pool_add(struct ost_pool *op, __u32 idx, unsigned int min_count);
-int lod_ost_pool_remove(struct ost_pool *op, __u32 idx);
-int lod_ost_pool_extend(struct ost_pool *op, unsigned int min_count);
 struct pool_desc *lod_find_pool(struct lod_device *lod, char *poolname);
 void lod_pool_putref(struct pool_desc *pool);
-int lod_ost_pool_free(struct ost_pool *op);
 int lod_pool_del(struct obd_device *obd, char *poolname);
-int lod_ost_pool_init(struct ost_pool *op, unsigned int count);
-extern struct cfs_hash_ops pool_hash_operations;
 int lod_check_index_in_pool(__u32 idx, struct pool_desc *pool);
 int lod_pool_new(struct obd_device *obd, char *poolname);
 int lod_pool_add(struct obd_device *obd, char *poolname, char *ostname);
 int lod_pool_remove(struct obd_device *obd, char *poolname, char *ostname);
 
+struct lod_obj_stripe_cb_data;
+typedef int (*lod_obj_stripe_cb_t)(const struct lu_env *env,
+                                  struct lod_object *lo, struct dt_object *dt,
+                                  struct thandle *th,
+                                  int comp_idx, int stripe_idx,
+                                  struct lod_obj_stripe_cb_data *data);
+typedef bool (*lod_obj_comp_skip_cb_t)(const struct lu_env *env,
+                                       struct lod_object *lo, int comp_idx,
+                                       struct lod_obj_stripe_cb_data *data);
+typedef int (*lod_obj_comp_cb_t)(const struct lu_env *env,
+                               struct lod_object *lo, int comp_idx,
+                               struct lod_obj_stripe_cb_data *data);
 struct lod_obj_stripe_cb_data {
        union {
                const struct lu_attr    *locd_attr;
-               struct ost_pool         *locd_inuse;
+               int                     locd_ost_index;
+               const struct lu_buf     *locd_buf;
        };
-       bool    locd_declare;
+       lod_obj_stripe_cb_t             locd_stripe_cb;
+       lod_obj_comp_skip_cb_t          locd_comp_skip_cb;
+       lod_obj_comp_cb_t               locd_comp_cb;
+       bool                            locd_declare;
 };
 
-typedef int (*lod_obj_stripe_cb_t)(const struct lu_env *env,
-                                  struct lod_object *lo, struct dt_object *dt,
-                                  struct thandle *th, int stripe_idx,
-                                  struct lod_obj_stripe_cb_data *data);
 /* lod_qos.c */
-int lod_prepare_inuse(const struct lu_env *env, struct lod_object *lo);
+int lod_mdt_alloc_qos(const struct lu_env *env, struct lod_object *lo,
+                     struct dt_object **stripes, u32 stripe_idx,
+                     u32 stripe_count);
+int lod_mdt_alloc_rr(const struct lu_env *env, struct lod_object *lo,
+                    struct dt_object **stripes, u32 stripe_idx,
+                    u32 stripe_count);
 int lod_prepare_create(const struct lu_env *env, struct lod_object *lo,
                       struct lu_attr *attr, const struct lu_buf *buf,
                       struct thandle *th);
-int qos_add_tgt(struct lod_device*, struct lod_tgt_desc *);
-int qos_del_tgt(struct lod_device *, struct lod_tgt_desc *);
-void lod_qos_rr_init(struct lod_qos_rr *lqr);
 int lod_use_defined_striping(const struct lu_env *, struct lod_object *,
                             const struct lu_buf *);
-int lod_obj_stripe_set_inuse_cb(const struct lu_env *env, struct lod_object *lo,
-                               struct dt_object *dt, struct thandle *th,
-                               int stripe_idx,
-                               struct lod_obj_stripe_cb_data *data);
 int lod_qos_parse_config(const struct lu_env *env, struct lod_object *lo,
                         const struct lu_buf *buf);
 int lod_qos_prep_create(const struct lu_env *env, struct lod_object *lo,
                        struct lu_attr *attr, struct thandle *th,
-                       int comp_idx, struct ost_pool *inuse);
-__u16 lod_comp_entry_stripecnt(struct lod_object *lo,
-                              struct lod_layout_component *entry,
-                              bool is_dir);
-__u16 lod_get_stripecnt(struct lod_device *lod, struct lod_object *lo,
-                       __u16 stripe_count);
+                       int comp_idx, __u64 reserve);
+__u16 lod_comp_entry_stripe_count(struct lod_object *lo,
+                                 int comp_idx, bool is_dir);
+__u16 lod_get_stripe_count(struct lod_device *lod, struct lod_object *lo,
+                          int comp_idx, __u16 stripe_count, bool overstriping);
+void lod_qos_statfs_update(const struct lu_env *env, struct lod_device *lod,
+                          struct lu_tgt_descs *ltd);
 
 /* lproc_lod.c */
 int lod_procfs_init(struct lod_device *lod);
@@ -671,11 +711,18 @@ int lod_declare_striped_create(const struct lu_env *env, struct dt_object *dt,
 int lod_striped_create(const struct lu_env *env, struct dt_object *dt,
                        struct lu_attr *attr, struct dt_object_format *dof,
                        struct thandle *th);
-void lod_object_free_striping(const struct lu_env *env, struct lod_object *lo);
+int lod_alloc_foreign_lov(struct lod_object *lo, size_t size);
+void lod_free_foreign_lov(struct lod_object *lo);
+void lod_striping_free_nolock(const struct lu_env *env, struct lod_object *lo);
+void lod_striping_free(const struct lu_env *env, struct lod_object *lo);
 
 int lod_obj_for_each_stripe(const struct lu_env *env, struct lod_object *lo,
-                           struct thandle *th, lod_obj_stripe_cb_t cb,
+                           struct thandle *th,
                            struct lod_obj_stripe_cb_data *data);
+int lod_comp_copy_ost_lists(struct lod_layout_component *lod_comp,
+                           struct lov_user_md_v3 *v3);
+void lod_adjust_stripe_size(struct lod_layout_component *comp,
+                           __u32 def_stripe_size);
 
 /* lod_sub_object.c */
 struct thandle *lod_sub_get_thandle(const struct lu_env *env,
@@ -706,7 +753,7 @@ int lod_sub_declare_insert(const struct lu_env *env, struct dt_object *dt,
                           struct thandle *th);
 int lod_sub_insert(const struct lu_env *env, struct dt_object *dt,
                   const struct dt_rec *rec, const struct dt_key *key,
-                  struct thandle *th, int ign);
+                  struct thandle *th);
 int lod_sub_declare_delete(const struct lu_env *env, struct dt_object *dt,
                           const struct dt_key *key, struct thandle *th);
 int lod_sub_delete(const struct lu_env *env, struct dt_object *dt,
@@ -730,7 +777,7 @@ int lod_sub_declare_write(const struct lu_env *env, struct dt_object *dt,
                          struct thandle *th);
 ssize_t lod_sub_write(const struct lu_env *env, struct dt_object *dt,
                      const struct lu_buf *buf, loff_t *pos,
-                     struct thandle *th, int rq);
+                     struct thandle *th);
 int lod_sub_declare_punch(const struct lu_env *env, struct dt_object *dt,
                          __u64 start, __u64 end, struct thandle *th);
 int lod_sub_punch(const struct lu_env *env, struct dt_object *dt,