Whamcloud - gitweb
LU-14128 lov: correctly set OST obj size
[fs/lustre-release.git] / lustre / lov / lov_internal.h
index 134f512..8016610 100644 (file)
  *
  * You should have received a copy of the GNU General Public License
  * version 2 along with this program; If not, see
- * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
- *
- * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
- * CA 95054 USA or visit www.sun.com if you need additional information or
- * have any questions.
+ * http://www.gnu.org/licenses/gpl-2.0.html
  *
  * GPL HEADER END
  */
@@ -27,7 +23,7 @@
  * Copyright (c) 2003, 2010, Oracle and/or its affiliates. All rights reserved.
  * Use is subject to license terms.
  *
- * Copyright (c) 2011, 2013, Intel Corporation.
+ * Copyright (c) 2011, 2017, Intel Corporation.
  */
 /*
  * This file is part of Lustre, http://www.lustre.org/
 #define LOV_INTERNAL_H
 
 #include <obd_class.h>
-#include <lustre/lustre_user.h>
+#include <uapi/linux/lustre/lustre_user.h>
+
+/* If we are unable to get the maximum object size from the OST in
+ * ocd_maxbytes using OBD_CONNECT_MAXBYTES, then we fall back to using
+ * the old maximum object size from ext3. */
+#define LUSTRE_EXT3_STRIPE_MAXBYTES 0x1fffffff000ULL
+
+struct lov_stripe_md_entry {
+       struct lu_extent        lsme_extent;
+       u32                     lsme_id;
+       u32                     lsme_magic;
+       u32                     lsme_flags;
+       u32                     lsme_pattern;
+       u64                     lsme_timestamp;
+       u32                     lsme_stripe_size;
+       u16                     lsme_stripe_count;
+       u16                     lsme_layout_gen;
+       char                    lsme_pool_name[LOV_MAXPOOLNAME + 1];
+       struct lov_oinfo       *lsme_oinfo[];
+};
+
+static inline bool lsme_is_dom(struct lov_stripe_md_entry *lsme)
+{
+       return (lov_pattern(lsme->lsme_pattern) == LOV_PATTERN_MDT);
+}
+
+static inline void copy_lsm_entry(struct lov_stripe_md_entry *dst,
+                                 struct lov_stripe_md_entry *src)
+{
+       unsigned i;
+
+       for (i = 0; i < src->lsme_stripe_count; i++)
+               *dst->lsme_oinfo[i] = *src->lsme_oinfo[i];
+       memcpy(dst, src, offsetof(typeof(*src), lsme_oinfo));
+}
+
+struct lov_stripe_md {
+       atomic_t        lsm_refc;
+       spinlock_t      lsm_lock;
+       pid_t           lsm_lock_owner; /* debugging */
+
+       union {
+               /* maximum possible file size, might change as OSTs status
+                * changes, e.g. disconnected, deactivated
+                */
+               loff_t          lsm_maxbytes;
+               /* size of full foreign LOV */
+               size_t          lsm_foreign_size;
+       };
+       struct ost_id   lsm_oi;
+       u32             lsm_magic;
+       u32             lsm_layout_gen;
+       u16             lsm_flags;
+       bool            lsm_is_released;
+       u16             lsm_mirror_count;
+       u16             lsm_entry_count;
+       struct lov_stripe_md_entry *lsm_entries[];
+};
+
+#define lsm_foreign(lsm) (lsm->lsm_entries[0])
+
+static inline bool lsme_inited(const struct lov_stripe_md_entry *lsme)
+{
+       return lsme->lsme_flags & LCME_FL_INIT;
+}
+
+static inline bool lsm_entry_inited(const struct lov_stripe_md *lsm, int index)
+{
+       return lsme_inited(lsm->lsm_entries[index]);
+}
+
+static inline bool lsm_is_composite(__u32 magic)
+{
+       return magic == LOV_MAGIC_COMP_V1;
+}
+
+static inline size_t lov_comp_md_size(const struct lov_stripe_md *lsm)
+{
+       struct lov_stripe_md_entry *lsme;
+       size_t size;
+       int entry;
+
+       if (lsm->lsm_magic == LOV_MAGIC_V1 || lsm->lsm_magic == LOV_MAGIC_V3)
+               return lov_mds_md_size(lsm->lsm_entries[0]->lsme_stripe_count,
+                                      lsm->lsm_entries[0]->lsme_magic);
+
+       if (lsm->lsm_magic == LOV_MAGIC_FOREIGN)
+               return lsm->lsm_foreign_size;
+
+       LASSERT(lsm->lsm_magic == LOV_MAGIC_COMP_V1);
+
+       size = sizeof(struct lov_comp_md_v1);
+       for (entry = 0; entry < lsm->lsm_entry_count; entry++) {
+               u16 stripe_count;
+
+               lsme = lsm->lsm_entries[entry];
+
+               if (lsme_inited(lsme))
+                       stripe_count = lsme->lsme_stripe_count;
+               else
+                       stripe_count = 0;
+
+               size += sizeof(*lsme);
+               size += lov_mds_md_size(stripe_count,
+                                       lsme->lsme_magic);
+       }
+
+       return size;
+}
+
+static inline bool lsm_has_objects(struct lov_stripe_md *lsm)
+{
+       return lsm != NULL && !lsm->lsm_is_released;
+}
+
+static inline unsigned int lov_comp_index(int entry, int stripe)
+{
+       LASSERT(entry >= 0 && entry <= SHRT_MAX);
+       LASSERT(stripe >= 0 && stripe < USHRT_MAX);
+
+       return entry << 16 | stripe;
+}
+
+static inline int lov_comp_stripe(int index)
+{
+       return index & 0xffff;
+}
+
+static inline int lov_comp_entry(int index)
+{
+       return index >> 16;
+}
+
+struct lsm_operations {
+       struct lov_stripe_md *(*lsm_unpackmd)(struct lov_obd *, void *, size_t);
+};
+
+extern const struct lsm_operations lsm_v1_ops;
+extern const struct lsm_operations lsm_v3_ops;
+extern const struct lsm_operations lsm_comp_md_v1_ops;
+extern const struct lsm_operations lsm_foreign_ops;
+static inline const struct lsm_operations *lsm_op_find(int magic)
+{
+       switch (magic) {
+       case LOV_MAGIC_V1:
+               return &lsm_v1_ops;
+       case LOV_MAGIC_V3:
+               return &lsm_v3_ops;
+       case LOV_MAGIC_COMP_V1:
+               return &lsm_comp_md_v1_ops;
+       case LOV_MAGIC_FOREIGN:
+               return &lsm_foreign_ops;
+       default:
+               CERROR("unrecognized lsm_magic %08x\n", magic);
+               return NULL;
+       }
+}
+
+void lsm_free(struct lov_stripe_md *lsm);
 
 /* lov_do_div64(a, b) returns a % b, and a = a / b.
  * The 32-bit code is LOV-specific due to knowing about stripe limits in
 })
 #elif BITS_PER_LONG == 32
 # define lov_do_div64(n, base) ({                                      \
+       uint64_t __num = (n);                                           \
        uint64_t __rem;                                                 \
        if ((sizeof(base) > 4) && (((base) & 0xffffffff00000000ULL) != 0)) {  \
-               int __remainder;                                              \
-               LASSERTF(!((base) & (LOV_MIN_STRIPE_SIZE - 1)), "64 bit lov " \
-                        "division %llu / %llu\n", (n), (uint64_t)(base));    \
-               __remainder = (n) & (LOV_MIN_STRIPE_SIZE - 1);          \
-               (n) >>= LOV_MIN_STRIPE_BITS;                            \
-               __rem = do_div(n, (base) >> LOV_MIN_STRIPE_BITS);       \
+               int __remainder;                                        \
+               LASSERTF(!((base) & (LOV_MIN_STRIPE_SIZE - 1)),         \
+                        "64 bit lov division %llu / %llu\n",           \
+                        __num, (uint64_t)(base));                      \
+               __remainder = __num & (LOV_MIN_STRIPE_SIZE - 1);        \
+               __num >>= LOV_MIN_STRIPE_BITS;                          \
+               __rem = do_div(__num, (base) >> LOV_MIN_STRIPE_BITS);   \
                __rem <<= LOV_MIN_STRIPE_BITS;                          \
                __rem += __remainder;                                   \
        } else {                                                        \
-               __rem = do_div(n, base);                                \
+               __rem = do_div(__num, base);                            \
        }                                                               \
+       (n) = __num;                                                    \
        __rem;                                                          \
 })
 #endif
 
-#define pool_tgt_size(p) ((p)->pool_obds.op_size)
 #define pool_tgt_count(p) ((p)->pool_obds.op_count)
 #define pool_tgt_array(p) ((p)->pool_obds.op_array)
 #define pool_tgt_rw_sem(p) ((p)->pool_obds.op_rw_sem)
 
 struct pool_desc {
        char                     pool_name[LOV_MAXPOOLNAME + 1];
-       struct ost_pool          pool_obds;
+       struct lu_tgt_pool       pool_obds;
        atomic_t                 pool_refcount;
-       struct hlist_node        pool_hash;     /* access by poolname */
+       struct rhash_head        pool_hash;     /* access by poolname */
        struct list_head         pool_list;     /* serial access */
+       struct rcu_head          pool_rcu;
        struct proc_dir_entry   *pool_proc_entry;
        struct obd_device       *pool_lobd;     /* owner */
 };
 
+int lov_pool_hash_init(struct rhashtable *tbl);
+void lov_pool_hash_destroy(struct rhashtable *tbl);
+
 struct lov_request {
        struct obd_info          rq_oi;
        struct lov_request_set  *rq_rqset;
        struct list_head         rq_link;
        int                      rq_idx;        /* index in lov->tgts array */
-       int                      rq_stripe;     /* stripe number */
-       int                      rq_complete;
-       int                      rq_rc;
 };
 
 struct lov_request_set {
        struct obd_info         *set_oi;
-       atomic_t                 set_refcount;
-       struct obd_export       *set_exp;
-       /* XXX: There is @set_exp already, however obd_statfs gets
-          obd_device only. */
        struct obd_device       *set_obd;
        int                      set_count;
        atomic_t                 set_completes;
        atomic_t                 set_success;
-       atomic_t                 set_finish_checked;
-       struct llog_cookie      *set_cookies;
        struct list_head         set_list;
-       wait_queue_head_t        set_waitq;
 };
 
 extern struct kmem_cache *lov_oinfo_slab;
 
-void lov_finish_set(struct lov_request_set *set);
-
-static inline void lov_put_reqset(struct lov_request_set *set)
-{
-       if (atomic_dec_and_test(&set->set_refcount))
-               lov_finish_set(set);
-}
+extern struct lu_kmem_descr lov_caches[];
 
 #define lov_uuid2str(lv, index) \
         (char *)((lv)->lov_tgts[index]->ltd_uuid.uuid)
 
 /* lov_merge.c */
-void lov_merge_attrs(struct obdo *tgt, struct obdo *src, obd_valid valid,
-                     struct lov_stripe_md *lsm, int stripeno, int *set);
-int lov_merge_lvb_kms(struct lov_stripe_md *lsm,
+int lov_merge_lvb_kms(struct lov_stripe_md *lsm, int index,
                       struct ost_lvb *lvb, __u64 *kms_place);
 
 /* lov_offset.c */
-obd_size lov_stripe_size(struct lov_stripe_md *lsm, obd_size ost_size,
-                         int stripeno);
-int lov_stripe_offset(struct lov_stripe_md *lsm, obd_off lov_off,
-                      int stripeno, obd_off *obd_off);
-obd_off lov_size_to_stripe(struct lov_stripe_md *lsm, obd_off file_size,
-                           int stripeno);
-int lov_stripe_intersects(struct lov_stripe_md *lsm, int stripeno,
-                          obd_off start, obd_off end,
-                          obd_off *obd_start, obd_off *obd_end);
-int lov_stripe_number(struct lov_stripe_md *lsm, obd_off lov_off);
-pgoff_t lov_stripe_pgoff(struct lov_stripe_md *lsm, pgoff_t stripe_index,
-                        int stripe);
+loff_t stripe_width(struct lov_stripe_md *lsm, unsigned int index);
+u64 lov_stripe_size(struct lov_stripe_md *lsm, int index,
+                   u64 ost_size, int stripeno);
+int lov_stripe_offset(struct lov_stripe_md *lsm, int index, loff_t lov_off,
+                     int stripeno, loff_t *obd_off);
+loff_t lov_size_to_stripe(struct lov_stripe_md *lsm, int index, u64 file_size,
+                         int stripeno);
+int lov_stripe_intersects(struct lov_stripe_md *lsm, int index, int stripeno,
+                         struct lu_extent *ext, u64 *obd_start, u64 *obd_end);
+int lov_stripe_number(struct lov_stripe_md *lsm, int index, loff_t lov_off);
+pgoff_t lov_stripe_pgoff(struct lov_stripe_md *lsm, int index,
+                        pgoff_t stripe_index, int stripe);
 
 /* lov_request.c */
-void lov_set_add_req(struct lov_request *req, struct lov_request_set *set);
-int lov_set_finished(struct lov_request_set *set, int idempotent);
-void lov_update_set(struct lov_request_set *set,
-                    struct lov_request *req, int rc);
-int lov_update_common_set(struct lov_request_set *set,
-                          struct lov_request *req, int rc);
-int lov_check_and_wait_active(struct lov_obd *lov, int ost_idx);
-int lov_prep_getattr_set(struct obd_export *exp, struct obd_info *oinfo,
-                         struct lov_request_set **reqset);
-int lov_fini_getattr_set(struct lov_request_set *set);
-int lov_prep_destroy_set(struct obd_export *exp, struct obd_info *oinfo,
-                         struct obdo *src_oa, struct lov_stripe_md *lsm,
-                         struct obd_trans_info *oti,
-                         struct lov_request_set **reqset);
-int lov_fini_destroy_set(struct lov_request_set *set);
-int lov_prep_setattr_set(struct obd_export *exp, struct obd_info *oinfo,
-                         struct obd_trans_info *oti,
-                         struct lov_request_set **reqset);
-int lov_update_setattr_set(struct lov_request_set *set,
-                           struct lov_request *req, int rc);
-int lov_fini_setattr_set(struct lov_request_set *set);
 int lov_prep_statfs_set(struct obd_device *obd, struct obd_info *oinfo,
                         struct lov_request_set **reqset);
-void lov_update_statfs(struct obd_statfs *osfs, struct obd_statfs *lov_sfs,
-                       int success);
-int lov_fini_statfs(struct obd_device *obd, struct obd_statfs *osfs,
-                    int success);
 int lov_fini_statfs_set(struct lov_request_set *set);
-int lov_statfs_interpret(struct ptlrpc_request_set *rqset, void *data, int rc);
 
 /* lov_obd.c */
+void lov_tgts_getref(struct obd_device *obd);
+void lov_tgts_putref(struct obd_device *obd);
 void lov_stripe_lock(struct lov_stripe_md *md);
 void lov_stripe_unlock(struct lov_stripe_md *md);
 void lov_fix_desc(struct lov_desc *desc);
@@ -184,53 +302,44 @@ void lov_fix_desc_stripe_size(__u64 *val);
 void lov_fix_desc_stripe_count(__u32 *val);
 void lov_fix_desc_pattern(__u32 *val);
 void lov_fix_desc_qos_maxage(__u32 *val);
-__u16 lov_get_stripecnt(struct lov_obd *lov, __u32 magic, __u16 stripe_count);
-int lov_connect_obd(struct obd_device *obd, __u32 index, int activate,
-                    struct obd_connect_data *data);
+__u16 lov_get_stripe_count(struct lov_obd *lov, __u32 magic,
+                          __u16 stripe_count);
+int lov_connect_obd(struct obd_device *obd, u32 index, int activate,
+                   struct obd_connect_data *data);
 int lov_setup(struct obd_device *obd, struct lustre_cfg *lcfg);
 int lov_process_config_base(struct obd_device *obd, struct lustre_cfg *lcfg,
-                            __u32 *indexp, int *genp);
-int lov_del_target(struct obd_device *obd, __u32 index,
-                   struct obd_uuid *uuidp, int gen);
+                           u32 *indexp, int *genp);
+int lov_del_target(struct obd_device *obd, u32 index,
+                  struct obd_uuid *uuidp, int gen);
 
 /* lov_pack.c */
-int lov_packmd(struct obd_export *exp, struct lov_mds_md **lmm,
-               struct lov_stripe_md *lsm);
-int lov_unpackmd(struct obd_export *exp, struct lov_stripe_md **lsmp,
-                 struct lov_mds_md *lmm, int lmm_bytes);
-int lov_getstripe(struct obd_export *exp,
-                  struct lov_stripe_md *lsm, struct lov_user_md *lump);
-int lov_alloc_memmd(struct lov_stripe_md **lsmp, __u16 stripe_count,
-                    int pattern, int magic);
+ssize_t lov_lsm_pack(const struct lov_stripe_md *lsm, void *buf,
+                    size_t buf_size);
+struct lov_stripe_md *lov_unpackmd(struct lov_obd *lov, void *buf,
+                                  size_t buf_size);
 int lov_free_memmd(struct lov_stripe_md **lsmp);
 
 void lov_dump_lmm_v1(int level, struct lov_mds_md_v1 *lmm);
-void lov_dump_lmm_v3(int level, struct lov_mds_md_v3 *lmm);
 void lov_dump_lmm_common(int level, void *lmmp);
-void lov_dump_lmm(int level, void *lmm);
 
 /* lov_ea.c */
-struct lov_stripe_md *lsm_alloc_plain(__u16 stripe_count, int *size);
 void lsm_free_plain(struct lov_stripe_md *lsm);
 void dump_lsm(unsigned int level, const struct lov_stripe_md *lsm);
 
 /* lproc_lov.c */
-extern struct file_operations lov_proc_target_fops;
-#ifdef LPROCFS
-extern struct lprocfs_seq_vars lprocfs_lov_obd_vars[];
-#endif
+int lov_tunables_init(struct obd_device *obd);
 
 /* lov_cl.c */
 extern struct lu_device_type lov_device_type;
 
-/* pools */
-extern cfs_hash_ops_t pool_hash_operations;
-/* ost_pool methods */
-int lov_ost_pool_init(struct ost_pool *op, unsigned int count);
-int lov_ost_pool_extend(struct ost_pool *op, unsigned int min_count);
-int lov_ost_pool_add(struct ost_pool *op, __u32 idx, unsigned int min_count);
-int lov_ost_pool_remove(struct ost_pool *op, __u32 idx);
-int lov_ost_pool_free(struct ost_pool *op);
+#define LOV_MDC_TGT_MAX 256
+
+/* lu_tgt_pool methods */
+int lov_ost_pool_init(struct lu_tgt_pool *op, unsigned int count);
+int lov_ost_pool_extend(struct lu_tgt_pool *op, unsigned int min_count);
+int lov_ost_pool_add(struct lu_tgt_pool *op, __u32 idx, unsigned int min_count);
+int lov_ost_pool_remove(struct lu_tgt_pool *op, __u32 idx);
+int lov_ost_pool_free(struct lu_tgt_pool *op);
 
 /* high level pool methods */
 int lov_pool_new(struct obd_device *obd, char *poolname);
@@ -238,7 +347,6 @@ int lov_pool_del(struct obd_device *obd, char *poolname);
 int lov_pool_add(struct obd_device *obd, char *poolname, char *ostname);
 int lov_pool_remove(struct obd_device *obd, char *poolname, char *ostname);
 void lov_dump_pool(int level, struct pool_desc *pool);
-void lov_pool_putref(struct pool_desc *pool);
 
 static inline struct lov_stripe_md *lsm_addref(struct lov_stripe_md *lsm)
 {
@@ -258,4 +366,28 @@ static inline bool lov_oinfo_is_dummy(const struct lov_oinfo *loi)
        return false;
 }
 
+static inline struct obd_device *lov2obd(const struct lov_obd *lov)
+{
+       return container_of_safe(lov, struct obd_device, u.lov);
+}
+
+static inline void lov_lsm2layout(struct lov_stripe_md *lsm,
+                                 struct lov_stripe_md_entry *lsme,
+                                 struct ost_layout *ol)
+{
+       ol->ol_stripe_size = lsme->lsme_stripe_size;
+       ol->ol_stripe_count = lsme->lsme_stripe_count;
+       if (lsm->lsm_magic == LOV_MAGIC_COMP_V1) {
+               ol->ol_comp_start = lsme->lsme_extent.e_start;
+               ol->ol_comp_end = lsme->lsme_extent.e_end;
+               ol->ol_comp_id = lsme->lsme_id;
+       } else {
+               ol->ol_comp_start = 0;
+               ol->ol_comp_end = 0;
+               ol->ol_comp_id = 0;
+       }
+}
+
+struct pool_desc *lov_pool_find(struct obd_device *obd, char *poolname);
+void lov_pool_putref(struct pool_desc *pool);
 #endif