Whamcloud - gitweb
LU-1534 osd: Fix LBUGs when destroying IGIF objects
[fs/lustre-release.git] / lustre / osd-ldiskfs / osd_internal.h
index b94c0f2..307ecfa 100644 (file)
@@ -1,6 +1,4 @@
-/* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
- * vim:expandtab:shiftwidth=8:tabstop=8:
- *
+/*
  * GPL HEADER START
  *
  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
 
 #include "osd_oi.h"
 #include "osd_iam.h"
+#include "osd_scrub.h"
 
 struct inode;
 
-#define OSD_OII_NOGEN (0)
 #define OSD_COUNTERS (0)
 
+/* Lustre special inode::i_state to indicate OI scrub skip this inode. */
+#define I_LUSTRE_NOSCRUB       (1 << 31)
+
 /** Enable thandle usage statistics */
 #define OSD_THANDLE_STATS (0)
 
@@ -107,7 +108,7 @@ struct osd_oi {
          * underlying index object, where fid->id mapping in stored.
          */
         struct inode         *oi_inode;
-        struct osd_directory   oi_dir;
+        struct osd_directory  oi_dir;
 };
 
 extern const int osd_dto_credits_noquota[];
@@ -194,6 +195,55 @@ static inline void ldiskfs_htree_lock_free(struct htree_lock *lk)
 
 #endif /* HAVE_LDISKFS_PDO */
 
+#define OSD_OTABLE_IT_CACHE_SIZE       128
+#define OSD_OTABLE_IT_CACHE_MASK       (~(OSD_OTABLE_IT_CACHE_SIZE - 1))
+
+struct osd_inconsistent_item {
+       /* link into osd_scrub::os_inconsistent_items,
+        * protected by osd_scrub::os_lock. */
+       cfs_list_t             oii_list;
+
+       /* The right FID <=> ino#/gen mapping. */
+       struct osd_idmap_cache oii_cache;
+
+       unsigned int           oii_insert:1; /* insert or update mapping. */
+};
+
+struct osd_otable_cache {
+       struct osd_idmap_cache ooc_cache[OSD_OTABLE_IT_CACHE_SIZE];
+
+       /* Index for next cache slot to be filled. */
+       int                    ooc_producer_idx;
+
+       /* Index for next cache slot to be returned by it::next(). */
+       int                    ooc_consumer_idx;
+
+       /* How many items in ooc_cache. */
+       int                    ooc_cached_items;
+
+       /* Position for up layer LFSCK iteration pre-loading. */
+       __u32                  ooc_pos_preload;
+};
+
+struct osd_otable_it {
+       struct osd_device       *ooi_dev;
+       struct osd_otable_cache  ooi_cache;
+
+       /* For osd_otable_it_key. */
+       __u8                     ooi_key[16];
+
+       /* The following bits can be updated/checked w/o lock protection.
+        * If more bits will be introduced in the future and need lock to
+        * protect, please add comment. */
+       unsigned long            ooi_used_outside:1, /* Some user out of OSD
+                                                     * uses the iteration. */
+                                ooi_all_cached:1, /* No more entries can be
+                                                   * filled into cache. */
+                                ooi_user_ready:1, /* The user out of OSD is
+                                                   * ready to iterate. */
+                                ooi_waiting:1; /* it::next is waiting. */
+};
+
 extern const int osd_dto_credits_noquota[];
 
 /*
@@ -204,11 +254,7 @@ struct osd_device {
         struct dt_device          od_dt_dev;
         /* information about underlying file system */
         struct lustre_mount_info *od_mount;
-        /*
-         * XXX temporary stuff for object index: directory where every object
-         * is named by its fid.
-         */
-        struct dt_object         *od_obj_area;
+        struct vfsmount          *od_mnt;
         /* object index */
         struct osd_oi           **od_oi_table;
         /* total number of OI containers */
@@ -228,7 +274,7 @@ struct osd_device {
          * statfs optimization: we cache a bit.
          */
         cfs_time_t                od_osfs_age;
-        cfs_kstatfs_t             od_kstatfs;
+        struct obd_statfs         od_statfs;
         cfs_spinlock_t            od_osfs_lock;
 
         /**
@@ -239,6 +285,11 @@ struct osd_device {
 
         struct fsfilt_operations *od_fsops;
 
+        /*
+         * mapping for legacy OST objids
+         */
+        struct osd_compat_objid  *od_ost_map;
+
         unsigned long long        od_readcache_max_filesize;
         int                       od_read_cache;
         int                       od_writethrough_cache;
@@ -246,6 +297,10 @@ struct osd_device {
         struct brw_stats          od_brw_stats;
         cfs_atomic_t              od_r_in_flight;
         cfs_atomic_t              od_w_in_flight;
+
+       cfs_mutex_t               od_otable_mutex;
+       struct osd_otable_it     *od_otable_it;
+       struct osd_scrub          od_scrub;
 };
 
 #define OSD_TRACK_DECLARES
@@ -253,11 +308,13 @@ struct osd_device {
 #define OSD_DECLARE_OP(oh, op)   {                               \
         LASSERT(oh->ot_handle == NULL);                          \
         ((oh)->ot_declare_ ##op)++; }
-#define OSD_EXEC_OP(handle, op)     {                            \
+#define OSD_EXEC_OP(handle,op)      {                            \
         struct osd_thandle *oh;                                  \
         oh = container_of0(handle, struct osd_thandle, ot_super);\
-        LASSERT((oh)->ot_declare_ ##op > 0);                     \
-        ((oh)->ot_declare_ ##op)--; }
+        if (((oh)->ot_declare_ ##op) > 0) {                      \
+                ((oh)->ot_declare_ ##op)--;                      \
+        }                                                        \
+        }
 #else
 #define OSD_DECLARE_OP(oh, op)
 #define OSD_EXEC_OP(oh, op)
@@ -440,7 +497,11 @@ struct osd_thread_info {
         struct htree_lock     *oti_hlock;
 
         struct lu_fid          oti_fid;
-        struct osd_inode_id    oti_id;
+       struct lu_fid          oti_fid2;
+       struct osd_inode_id    oti_id;
+       struct osd_inode_id    oti_id2;
+        struct ost_id          oti_ostid;
+
         /*
          * XXX temporary: for ->i_op calls.
          */
@@ -476,6 +537,8 @@ struct osd_thread_info {
         /** pre-allocated buffer used by oti_it_ea, size OSD_IT_EA_BUFSIZE */
         void                  *oti_it_ea_buf;
 
+        cfs_kstatfs_t          oti_ksfs;
+
         /** IAM iterator for index operation. */
         struct iam_iterator    oti_idx_it;
 
@@ -525,16 +588,41 @@ void osd_brw_stats_update(struct osd_device *osd, struct osd_iobuf *iobuf);
 
 #endif
 int osd_statfs(const struct lu_env *env, struct dt_device *dev,
-               cfs_kstatfs_t *sfs);
+               struct obd_statfs *sfs);
 int osd_object_auth(const struct lu_env *env, struct dt_object *dt,
                     struct lustre_capa *capa, __u64 opc);
 void osd_declare_qid(struct dt_object *dt, struct osd_thandle *oh,
                      int type, uid_t id, struct inode *inode);
-struct inode *osd_iget(struct osd_thread_info *info,
-                       struct osd_device *dev,
-                       const struct osd_inode_id *id);
-int generic_error_remove_page(struct address_space *mapping,
-                                     struct page *page);
+struct inode *osd_iget(struct osd_thread_info *info, struct osd_device *dev,
+                      struct osd_inode_id *id);
+struct inode *osd_iget_fid(struct osd_thread_info *info, struct osd_device *dev,
+                          struct osd_inode_id *id, struct lu_fid *fid);
+
+int osd_compat_init(struct osd_device *dev);
+void osd_compat_fini(struct osd_device *dev);
+int osd_compat_objid_lookup(struct osd_thread_info *info,
+                            struct osd_device *osd,
+                            const struct lu_fid *fid, struct osd_inode_id *id);
+int osd_compat_objid_insert(struct osd_thread_info *info,
+                            struct osd_device *osd,
+                            const struct lu_fid *fid,
+                            const struct osd_inode_id *id, struct thandle *th);
+int osd_compat_objid_delete(struct osd_thread_info *info,
+                            struct osd_device *osd,
+                            const struct lu_fid *fid, struct thandle *th);
+int osd_compat_spec_lookup(struct osd_thread_info *info,
+                           struct osd_device *osd,
+                           const struct lu_fid *fid, struct osd_inode_id *id);
+int osd_compat_spec_insert(struct osd_thread_info *info,
+                           struct osd_device *osd,
+                           const struct lu_fid *fid,
+                           const struct osd_inode_id *id, struct thandle *th);
+
+void osd_scrub_file_reset(struct osd_scrub *scrub, __u8 *uuid, __u64 flags);
+int osd_scrub_file_store(struct osd_scrub *scrub);
+int osd_scrub_start(struct osd_device *dev);
+int osd_scrub_setup(const struct lu_env *env, struct osd_device *dev);
+void osd_scrub_cleanup(const struct lu_env *env, struct osd_device *dev);
 
 /*
  * Invariants, assertions.
@@ -562,32 +650,23 @@ static inline int osd_invariant(const struct osd_object *obj)
 #define osd_invariant(obj) (1)
 #endif
 
-/* The on-disk extN format reserves inodes 0-11 for internal filesystem
- * use, and these inodes will be invisible on client side, so the valid
- * sequence for IGIF fid is 12-0xffffffff. But root inode (2#) will be seen
- * on server side (osd), and it should be valid too here.
- */
-#define OSD_ROOT_SEQ            2
-static inline int osd_fid_is_root(const struct lu_fid *fid)
-{
-        return fid_seq(fid) == OSD_ROOT_SEQ;
-}
+extern const struct dt_index_operations osd_otable_ops;
 
-static inline int osd_fid_is_igif(const struct lu_fid *fid)
+static inline int osd_oi_fid2idx(struct osd_device *dev,
+                                const struct lu_fid *fid)
 {
-        return fid_is_igif(fid) || osd_fid_is_root(fid);
+       return fid->f_seq & (dev->od_oi_count - 1);
 }
 
 static inline struct osd_oi *osd_fid2oi(struct osd_device *osd,
                                         const struct lu_fid *fid)
 {
-        if (!fid_is_norm(fid))
-                return NULL;
-
-        LASSERT(osd->od_oi_table != NULL && osd->od_oi_count >= 1);
-        /* It can work even od_oi_count equals to 1 although it's unexpected,
-         * the only reason we set it to 1 is for performance measurement */
-        return osd->od_oi_table[fid->f_seq & (osd->od_oi_count - 1)];
+       LASSERTF(!fid_is_idif(fid), DFID"\n", PFID(fid));
+       LASSERTF(!fid_is_igif(fid), DFID"\n", PFID(fid));
+       LASSERT(osd->od_oi_table != NULL && osd->od_oi_count >= 1);
+       /* It can work even od_oi_count equals to 1 although it's unexpected,
+        * the only reason we set it to 1 is for performance measurement */
+       return osd->od_oi_table[osd_oi_fid2idx(osd, fid)];
 }
 
 extern const struct lu_device_operations  osd_lu_ops;
@@ -681,12 +760,16 @@ static inline void osd_ipd_put(const struct lu_env *env,
         bag->ic_descr->id_ops->id_ipd_free(ipd);
 }
 
+int osd_ldiskfs_read(struct inode *inode, void *buf, int size, loff_t *offs);
+int osd_ldiskfs_write_record(struct inode *inode, void *buf, int bufsize,
+                            loff_t *offs, handle_t *handle);
+
 static inline
 struct dentry *osd_child_dentry_by_inode(const struct lu_env *env,
                                          struct inode *inode,
                                          const char *name, const int namelen)
 {
-        struct osd_thread_info *info   = osd_oti_get(env);
+        struct osd_thread_info *info = osd_oti_get(env);
         struct dentry *child_dentry = &info->oti_child_dentry;
         struct dentry *obj_dentry = &info->oti_obj_dentry;