Whamcloud - gitweb
LU-2240 mds: Assign special fid sequence to root.
[fs/lustre-release.git] / lustre / mdd / mdd_internal.h
index 746047e..97f6cb6 100644 (file)
@@ -1,6 +1,4 @@
-/* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
- * vim:expandtab:shiftwidth=8:tabstop=8:
- *
+/*
  * GPL HEADER START
  *
  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
  * GPL HEADER END
  */
 /*
- * Copyright  2008 Sun Microsystems, Inc. All rights reserved
+ * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
  * Use is subject to license terms.
+ *
+ * Copyright (c) 2011, 2012, Intel Corporation.
  */
 /*
  * This file is part of Lustre, http://www.lustre.org/
 #ifndef _MDD_INTERNAL_H
 #define _MDD_INTERNAL_H
 
-#include <asm/semaphore.h>
-
 #include <lustre_acl.h>
 #include <lustre_eacl.h>
-#include <obd.h>
 #include <md_object.h>
 #include <dt_object.h>
-#include <linux/sched.h>
-#include <linux/capability.h>
-#include <linux/dynlocks.h>
-#ifdef HAVE_QUOTA_SUPPORT
-# include <lustre_quota.h>
-#endif
 #include <lustre_fsfilt.h>
+#include <lustre/lustre_lfsck_user.h>
+#include <lustre_fid.h>
+#include <lustre_capa.h>
+#include <lprocfs_status.h>
+#include <lustre_log.h>
+
+#include "mdd_lfsck.h"
+
+/* PDO lock is unnecessary for current MDT stack because operations
+ * are already protected by ldlm lock */
+#define MDD_DISABLE_PDO_LOCK    1
+
+/* Changelog flags */
+/** changelog is recording */
+#define CLM_ON    0x00001
+/** internal error prevented changelogs from starting */
+#define CLM_ERR   0x00002
+/* Marker flags */
+/** changelogs turned on */
+#define CLM_START 0x10000
+/** changelogs turned off */
+#define CLM_FINI  0x20000
+/** some changelog records purged */
+#define CLM_PURGE 0x40000
+
+struct mdd_changelog {
+       spinlock_t              mc_lock;        /* for index */
+       int                     mc_flags;
+       int                     mc_mask;
+       __u64                   mc_index;
+       __u64                   mc_starttime;
+       spinlock_t              mc_user_lock;
+       int                     mc_lastuser;
+};
 
-#ifdef HAVE_QUOTA_SUPPORT
-/* quota stuff */
-extern quota_interface_t *mds_quota_interface_ref;
+static inline __u64 cl_time(void) {
+       cfs_fs_time_t time;
 
-static inline void mdd_quota_wrapper(struct lu_attr *la, unsigned int *qids)
-{
-        qids[0] = la->la_uid;
-        qids[1] = la->la_gid;
+       cfs_fs_time_current(&time);
+       return (((__u64)time.tv_sec) << 30) + time.tv_nsec;
 }
-#endif
 
-enum mdd_txn_op {
-        MDD_TXN_OBJECT_DESTROY_OP = 0,
-        MDD_TXN_OBJECT_CREATE_OP,
-        MDD_TXN_ATTR_SET_OP,
-        MDD_TXN_XATTR_SET_OP,
-        MDD_TXN_INDEX_INSERT_OP,
-        MDD_TXN_INDEX_DELETE_OP,
-        MDD_TXN_LINK_OP,
-        MDD_TXN_UNLINK_OP,
-        MDD_TXN_RENAME_OP,
-        MDD_TXN_RENAME_TGT_OP,
-        MDD_TXN_CREATE_DATA_OP,
-        MDD_TXN_MKDIR_OP,
-        MDD_TXN_LAST_OP
+/** Objects in .lustre dir */
+struct mdd_dot_lustre_objs {
+        struct mdd_object *mdd_obf;
 };
 
-struct mdd_txn_op_descr {
-        enum mdd_txn_op mod_op;
-        unsigned int    mod_credits;
-};
+extern const char lfsck_bookmark_name[];
+extern const char lfsck_namespace_name[];
 
 struct mdd_device {
         struct md_device                 mdd_md_dev;
+       struct obd_export               *mdd_child_exp;
         struct dt_device                *mdd_child;
-        struct obd_device               *mdd_obd_dev;
+       struct dt_device                *mdd_bottom;
         struct lu_fid                    mdd_root_fid;
+       struct lu_fid                    mdd_local_root_fid;
         struct dt_device_param           mdd_dt_conf;
-        struct dt_object                *mdd_orphans;
-        struct dt_txn_callback           mdd_txn_cb;
+        struct dt_object                *mdd_orphans; /* PENDING directory */
+        struct dt_object                *mdd_capa;
         cfs_proc_dir_entry_t            *mdd_proc_entry;
-        struct lprocfs_stats            *mdd_stats;
-        struct mdd_txn_op_descr          mdd_tod[MDD_TXN_LAST_OP];
+        struct mdd_changelog             mdd_cl;
         unsigned long                    mdd_atime_diff;
+        struct mdd_object               *mdd_dot_lustre;
+        struct mdd_dot_lustre_objs       mdd_dot_lustre_objs;
+       struct md_lfsck                  mdd_lfsck;
+       unsigned int                     mdd_sync_permission;
+       int                              mdd_connects;
 };
 
 enum mod_flags {
@@ -108,28 +122,18 @@ enum mod_flags {
         APPEND_OBJ = 1 << 1,
         IMMUTE_OBJ = 1 << 2,
         ORPHAN_OBJ = 1 << 3,
-        MNLINK_OBJ = 1 << 4
-};
-
-#define LUSTRE_APPEND_FL LDISKFS_APPEND_FL
-#define LUSTRE_IMMUTABLE_FL LDISKFS_IMMUTABLE_FL
-#define LUSTRE_DIRSYNC_FL LDISKFS_DIRSYNC_FL
-
-enum mdd_object_role {
-        MOR_SRC_PARENT,
-        MOR_SRC_CHILD,
-        MOR_TGT_PARENT,
-        MOR_TGT_CHILD,
-        MOR_TGT_ORPHAN
 };
 
 struct mdd_object {
         struct md_object   mod_obj;
         /* open count */
-        __u32              mod_count;
-        __u32              mod_valid;
-        unsigned long      mod_flags;
-        struct dynlock     mod_pdlock;
+        __u32             mod_count;
+        __u32             mod_valid;
+        __u64             mod_cltime;
+        unsigned long     mod_flags;
+#ifndef MDD_DISABLE_PDO_LOCK
+        struct dynlock    mod_pdlock;
+#endif
 #ifdef CONFIG_LOCKDEP
         /* "dep_map" name is assumed by lockdep.h macros. */
         struct lockdep_map dep_map;
@@ -137,19 +141,25 @@ struct mdd_object {
 };
 
 struct mdd_thread_info {
-        struct txn_param          mti_param;
         struct lu_fid             mti_fid;
+        struct lu_fid             mti_fid2; /* used for be & cpu converting */
         struct lu_attr            mti_la;
-        struct md_attr            mti_ma;
         struct lu_attr            mti_la_for_fix;
+       struct lu_attr            mti_pattr;
+       struct lu_attr            mti_cattr;
+        struct md_attr            mti_ma;
         struct obd_info           mti_oi;
-        char                      mti_orph_key[NAME_MAX + 1];
+       /* mti_ent and mti_key must be conjoint,
+        * then mti_ent::lde_name will be mti_key. */
+       struct lu_dirent          mti_ent;
+       char                      mti_key[NAME_MAX + 16];
         struct obd_trans_info     mti_oti;
         struct lu_buf             mti_buf;
+        struct lu_buf             mti_big_buf; /* biggish persistent buf */
+        struct lu_name            mti_name;
+       struct lu_name            mti_name2;
         struct obdo               mti_oa;
         char                      mti_xattr_buf[LUSTRE_POSIX_ACL_MAX_SIZE];
-        struct lu_fid             mti_fid2; /* used for be & cpu converting */
-        struct lu_fid_pack        mti_pack;
         struct dt_allocation_hint mti_hint;
         struct lov_mds_md        *mti_max_lmm;
         int                       mti_max_lmm_size;
@@ -159,10 +169,27 @@ struct mdd_thread_info {
         struct obd_quotactl       mti_oqctl;
 };
 
+/**
+ * The data that link search is done on.
+ */
+struct mdd_link_data {
+       /**
+        * Buffer to keep link EA body.
+        */
+       struct lu_buf           *ml_buf;
+       /**
+        * The matched header, entry and its lenght in the EA
+        */
+       struct link_ea_header   *ml_leh;
+       struct link_ea_entry    *ml_lee;
+       int                      ml_reclen;
+};
+
 extern const char orph_index_name[];
 
 extern const struct dt_index_features orph_index_features;
 
+struct lov_mds_md *mdd_max_lmm_buffer(const struct lu_env *env, int size);
 struct lov_mds_md *mdd_max_lmm_get(const struct lu_env *env,
                                    struct mdd_device *mdd);
 
@@ -173,6 +200,9 @@ int mdd_init_obd(const struct lu_env *env, struct mdd_device *mdd,
                  struct lustre_cfg *cfg);
 int mdd_fini_obd(const struct lu_env *env, struct mdd_device *mdd,
                  struct lustre_cfg *lcfg);
+int __mdd_xattr_set(const struct lu_env *env, struct mdd_object *obj,
+                    const struct lu_buf *buf, const char *name,
+                    int fl, struct thandle *handle);
 int mdd_xattr_set_txn(const struct lu_env *env, struct mdd_object *obj,
                       const struct lu_buf *buf, const char *name, int fl,
                       struct thandle *txn);
@@ -183,18 +213,32 @@ int mdd_lov_set_md(const struct lu_env *env, struct mdd_object *pobj,
 int mdd_lov_create(const struct lu_env *env, struct mdd_device *mdd,
                    struct mdd_object *parent, struct mdd_object *child,
                    struct lov_mds_md **lmm, int *lmm_size,
-                   const struct md_op_spec *spec, struct lu_attr *la);
+                   const struct md_op_spec *spec, struct md_attr *ma);
 int mdd_lov_objid_prepare(struct mdd_device *mdd, struct lov_mds_md *lmm);
+int mdd_declare_lov_objid_update(const struct lu_env *, struct mdd_device *,
+                                 struct thandle *);
 void mdd_lov_objid_update(struct mdd_device *mdd, struct lov_mds_md *lmm);
 void mdd_lov_create_finish(const struct lu_env *env, struct mdd_device *mdd,
                            struct lov_mds_md *lmm, int lmm_size,
                            const struct md_op_spec *spec);
+int mdd_file_lock(const struct lu_env *env, struct md_object *obj,
+                  struct lov_mds_md *lmm, struct ldlm_extent *extent,
+                  struct lustre_handle *lockh);
+int mdd_file_unlock(const struct lu_env *env, struct md_object *obj,
+                    struct lov_mds_md *lmm, struct lustre_handle *lockh);
+int mdd_lum_lmm_cmp(const struct lu_env *env, struct md_object *cobj,
+                    const struct md_op_spec *spec, struct md_attr *ma);
 int mdd_get_md(const struct lu_env *env, struct mdd_object *obj,
                void *md, int *md_size, const char *name);
 int mdd_get_md_locked(const struct lu_env *env, struct mdd_object *obj,
                       void *md, int *md_size, const char *name);
+int mdd_data_get(const struct lu_env *env, struct mdd_object *obj, void **data);
 int mdd_la_get(const struct lu_env *env, struct mdd_object *obj,
                struct lu_attr *la, struct lustre_capa *capa);
+int mdd_attr_get(const struct lu_env *env, struct md_object *obj,
+                struct md_attr *ma);
+int mdd_attr_set(const struct lu_env *env, struct md_object *obj,
+                const struct md_attr *ma);
 int mdd_attr_set_internal(const struct lu_env *env,
                           struct mdd_object *obj,
                           struct lu_attr *attr,
@@ -205,17 +249,16 @@ int mdd_attr_check_set_internal(const struct lu_env *env,
                                 struct lu_attr *attr,
                                 struct thandle *handle,
                                 int needacl);
+int mdd_declare_object_kill(const struct lu_env *env, struct mdd_object *obj,
+                            struct md_attr *ma, struct thandle *handle);
 int mdd_object_kill(const struct lu_env *env, struct mdd_object *obj,
-                    struct md_attr *ma);
+                    struct md_attr *ma, struct thandle *handle);
 int mdd_iattr_get(const struct lu_env *env, struct mdd_object *mdd_obj,
                   struct md_attr *ma);
-int mdd_attr_get_internal_locked(const struct lu_env *env,
-                                 struct mdd_object *mdd_obj,
-                                 struct md_attr *ma);
 int mdd_object_create_internal(const struct lu_env *env, struct mdd_object *p,
-                               struct mdd_object *c, struct md_attr *ma,
-                               struct thandle *handle,
-                               const struct md_op_spec *spec);
+                              struct mdd_object *c, struct lu_attr *attr,
+                              struct thandle *handle,
+                              const struct md_op_spec *spec);
 int mdd_attr_check_set_internal_locked(const struct lu_env *env,
                                        struct mdd_object *obj,
                                        struct lu_attr *attr,
@@ -223,6 +266,7 @@ int mdd_attr_check_set_internal_locked(const struct lu_env *env,
                                        int needacl);
 int mdd_lmm_get_locked(const struct lu_env *env, struct mdd_object *mdd_obj,
                        struct md_attr *ma);
+
 /* mdd_lock.c */
 void mdd_write_lock(const struct lu_env *env, struct mdd_object *obj,
                     enum mdd_object_role role);
@@ -230,43 +274,67 @@ void mdd_read_lock(const struct lu_env *env, struct mdd_object *obj,
                    enum mdd_object_role role);
 void mdd_write_unlock(const struct lu_env *env, struct mdd_object *obj);
 void mdd_read_unlock(const struct lu_env *env, struct mdd_object *obj);
+int mdd_write_locked(const struct lu_env *env, struct mdd_object *obj);
 
 void mdd_pdlock_init(struct mdd_object *obj);
 unsigned long mdd_name2hash(const char *name);
-struct dynlock_handle *mdd_pdo_write_lock(const struct lu_env *env,
-                                          struct mdd_object *obj,
-                                          const char *name,
-                                          enum mdd_object_role role);
-struct dynlock_handle *mdd_pdo_read_lock(const struct lu_env *env,
-                                         struct mdd_object *obj,
-                                         const char *name,
-                                         enum mdd_object_role role);
+void *mdd_pdo_write_lock(const struct lu_env *env, struct mdd_object *obj,
+                         const char *name, enum mdd_object_role role);
+void *mdd_pdo_read_lock(const struct lu_env *env, struct mdd_object *obj,
+                        const char *name, enum mdd_object_role role);
 void mdd_pdo_write_unlock(const struct lu_env *env, struct mdd_object *obj,
-                          struct dynlock_handle *dlh);
+                          void *dlh);
 void mdd_pdo_read_unlock(const struct lu_env *env, struct mdd_object *obj,
-                         struct dynlock_handle *dlh);
+                         void *dlh);
 /* mdd_dir.c */
-void __mdd_ref_add(const struct lu_env *env, struct mdd_object *obj,
-                   struct thandle *handle);
-void __mdd_ref_del(const struct lu_env *env, struct mdd_object *obj,
-                   struct thandle *handle, int is_dot);
+int mdd_parent_fid(const struct lu_env *env, struct mdd_object *obj,
+                  struct lu_fid *fid);
+int mdd_is_subdir(const struct lu_env *env, struct md_object *mo,
+                  const struct lu_fid *fid, struct lu_fid *sfid);
 int mdd_may_create(const struct lu_env *env, struct mdd_object *pobj,
                    struct mdd_object *cobj, int check_perm, int check_nlink);
 int mdd_may_unlink(const struct lu_env *env, struct mdd_object *pobj,
-                   const struct md_attr *ma);
+                  const struct lu_attr *attr);
 int mdd_may_delete(const struct lu_env *env, struct mdd_object *pobj,
-                   struct mdd_object *cobj, struct md_attr *ma,
-                   int check_perm, int check_empty);
+                  struct mdd_object *cobj, struct lu_attr *cattr,
+                  struct lu_attr *src_attr, int check_perm, int check_empty);
 int mdd_unlink_sanity_check(const struct lu_env *env, struct mdd_object *pobj,
-                            struct mdd_object *cobj, struct md_attr *ma);
+                           struct mdd_object *cobj, struct lu_attr *cattr);
 int mdd_finish_unlink(const struct lu_env *env, struct mdd_object *obj,
                       struct md_attr *ma, struct thandle *th);
 int mdd_object_initialize(const struct lu_env *env, const struct lu_fid *pfid,
-                          struct mdd_object *child, struct md_attr *ma,
-                          struct thandle *handle, const struct md_op_spec *spec);
+                         const struct lu_name *lname, struct mdd_object *child,
+                         struct lu_attr *attr, struct thandle *handle,
+                         const struct md_op_spec *spec);
 int mdd_link_sanity_check(const struct lu_env *env, struct mdd_object *tgt_obj,
                           const struct lu_name *lname, struct mdd_object *src_obj);
+int mdd_is_root(struct mdd_device *mdd, const struct lu_fid *fid);
+int mdd_lookup(const struct lu_env *env,
+               struct md_object *pobj, const struct lu_name *lname,
+               struct lu_fid* fid, struct md_op_spec *spec);
+int mdd_links_read(const struct lu_env *env, struct mdd_object *mdd_obj,
+                  struct mdd_link_data *ldata);
+int mdd_links_find(const struct lu_env *env, struct mdd_object *mdd_obj,
+                  struct mdd_link_data *ldata, const struct lu_name *lname,
+                  const struct lu_fid  *pfid);
+int mdd_links_new(const struct lu_env *env, struct mdd_link_data *ldata);
+int mdd_links_add_buf(const struct lu_env *env, struct mdd_link_data *ldata,
+                     const struct lu_name *lname, const struct lu_fid *pfid);
+void mdd_links_del_buf(const struct lu_env *env, struct mdd_link_data *ldata,
+                      const struct lu_name *lname);
+int mdd_declare_links_add(const struct lu_env *env,
+                         struct mdd_object *mdd_obj,
+                         struct thandle *handle);
+int mdd_links_write(const struct lu_env *env, struct mdd_object *mdd_obj,
+                   struct mdd_link_data *ldata, struct thandle *handle);
+struct lu_buf *mdd_links_get(const struct lu_env *env,
+                             struct mdd_object *mdd_obj);
+void mdd_lee_unpack(const struct link_ea_entry *lee, int *reclen,
+                    struct lu_name *lname, struct lu_fid *pfid);
+
 /* mdd_lov.c */
+int mdd_declare_unlink_log(const struct lu_env *env, struct mdd_object *obj,
+                           struct md_attr *ma, struct thandle *handle);
 int mdd_unlink_log(const struct lu_env *env, struct mdd_device *mdd,
                    struct mdd_object *mdd_cobj, struct md_attr *ma);
 
@@ -282,8 +350,14 @@ int mdd_lov_setattr_async(const struct lu_env *env, struct mdd_object *obj,
                           struct lov_mds_md *lmm, int lmm_size,
                           struct llog_cookie *logcookies);
 
+int mdd_lovobj_unlink(const struct lu_env *env, struct mdd_device *mdd,
+                     struct mdd_object *obj, struct lu_attr *la,
+                     struct md_attr *ma, int log_unlink);
+
 struct mdd_thread_info *mdd_env_info(const struct lu_env *env);
 
+const struct lu_name *mdd_name_get_const(const struct lu_env *env,
+                                        const void *area, ssize_t len);
 struct lu_buf *mdd_buf_get(const struct lu_env *env, void *area, ssize_t len);
 const struct lu_buf *mdd_buf_get_const(const struct lu_env *env,
                                        const void *area, ssize_t len);
@@ -295,116 +369,106 @@ int __mdd_orphan_del(const struct lu_env *, struct mdd_object *,
                      struct thandle *);
 int orph_index_init(const struct lu_env *env, struct mdd_device *mdd);
 void orph_index_fini(const struct lu_env *env, struct mdd_device *mdd);
-int mdd_txn_init_credits(const struct lu_env *env, struct mdd_device *mdd);
+int orph_declare_index_insert(const struct lu_env *, struct mdd_object *,
+                             cfs_umode_t mode, struct thandle *);
+int orph_declare_index_delete(const struct lu_env *, struct mdd_object *,
+                              struct thandle *);
 
 /* mdd_lproc.c */
 void lprocfs_mdd_init_vars(struct lprocfs_static_vars *lvars);
 int mdd_procfs_init(struct mdd_device *mdd, const char *name);
 int mdd_procfs_fini(struct mdd_device *mdd);
-void mdd_lprocfs_time_start(const struct lu_env *env);
-void mdd_lprocfs_time_end(const struct lu_env *env,
-                          struct mdd_device *mdd, int op);
 
+/* mdd_object.c */
 int mdd_get_flags(const struct lu_env *env, struct mdd_object *obj);
+struct lu_buf *mdd_buf_alloc(const struct lu_env *env, ssize_t len);
+int mdd_buf_grow(const struct lu_env *env, ssize_t len);
+void mdd_buf_put(struct lu_buf *buf);
 
 extern const struct md_dir_operations    mdd_dir_ops;
 extern const struct md_object_operations mdd_obj_ops;
 
-/* mdd_quota.c*/
-#ifdef HAVE_QUOTA_SUPPORT
-int mdd_quota_notify(const struct lu_env *env, struct md_device *m);
-int mdd_quota_setup(const struct lu_env *env, struct md_device *m,
-                    void *data);
-int mdd_quota_cleanup(const struct lu_env *env, struct md_device *m);
-int mdd_quota_recovery(const struct lu_env *env, struct md_device *m);
-int mdd_quota_check(const struct lu_env *env, struct md_device *m,
-                    struct obd_export *exp, __u32 type);
-int mdd_quota_on(const struct lu_env *env, struct md_device *m,
-                 __u32 type);
-int mdd_quota_off(const struct lu_env *env, struct md_device *m,
-                  __u32 type);
-int mdd_quota_setinfo(const struct lu_env *env, struct md_device *m,
-                      __u32 type, __u32 id, struct obd_dqinfo *dqinfo);
-int mdd_quota_getinfo(const struct lu_env *env, const struct md_device *m,
-                      __u32 type, __u32 id, struct obd_dqinfo *dqinfo);
-int mdd_quota_setquota(const struct lu_env *env, struct md_device *m,
-                       __u32 type, __u32 id, struct obd_dqblk *dqblk);
-int mdd_quota_getquota(const struct lu_env *env, const struct md_device *m,
-                       __u32 type, __u32 id, struct obd_dqblk *dqblk);
-int mdd_quota_getoinfo(const struct lu_env *env, const struct md_device *m,
-                       __u32 type, __u32 id, struct obd_dqinfo *dqinfo);
-int mdd_quota_getoquota(const struct lu_env *env, const struct md_device *m,
-                        __u32 type, __u32 id, struct obd_dqblk *dqblk);
-int mdd_quota_invalidate(const struct lu_env *env, struct md_device *m,
-                         __u32 type);
-int mdd_quota_finvalidate(const struct lu_env *env, struct md_device *m,
-                          __u32 type);
-#endif
+int accmode(const struct lu_env *env, struct lu_attr *la, int flags);
+extern struct lu_context_key mdd_thread_key;
+extern const struct lu_device_operations mdd_lu_ops;
 
-/* mdd_trans.c */
-void mdd_txn_param_build(const struct lu_env *env, struct mdd_device *mdd,
-                         enum mdd_txn_op);
-int mdd_log_txn_param_build(const struct lu_env *env, struct md_object *obj,
-                            struct md_attr *ma, enum mdd_txn_op);
-int mdd_setattr_txn_param_build(const struct lu_env *env, struct md_object *obj,
-                                struct md_attr *ma, enum mdd_txn_op);
+struct mdd_object *mdd_object_find(const struct lu_env *env,
+                                   struct mdd_device *d,
+                                   const struct lu_fid *f);
+int mdd_get_default_md(struct mdd_object *mdd_obj, struct lov_mds_md *lmm);
+int mdd_readpage(const struct lu_env *env, struct md_object *obj,
+                 const struct lu_rdpg *rdpg);
+int mdd_declare_llog_record(const struct lu_env *env, struct mdd_device *mdd,
+                            int reclen, struct thandle *handle);
+int mdd_declare_changelog_store(const struct lu_env *env,
+                               struct mdd_device *mdd,
+                               const struct lu_name *fname,
+                               struct thandle *handle);
+int mdd_changelog_store(const struct lu_env *env, struct mdd_device *mdd,
+                       struct llog_changelog_rec *rec, struct thandle *th);
+int mdd_changelog_ns_store(const struct lu_env *env, struct mdd_device *mdd,
+                          enum changelog_rec_type type, unsigned flags,
+                          struct mdd_object *target, struct mdd_object *parent,
+                          const struct lu_name *tname, struct thandle *handle);
+int mdd_declare_object_create_internal(const struct lu_env *env,
+                                      struct mdd_object *p,
+                                      struct mdd_object *c,
+                                      struct lu_attr *attr,
+                                      struct thandle *handle,
+                                      const struct md_op_spec *spec);
 
+/* mdd_trans.c */
 int mdd_lov_destroy(const struct lu_env *env, struct mdd_device *mdd,
                     struct mdd_object *obj, struct lu_attr *la);
 
+void mdd_object_make_hint(const struct lu_env *env, struct mdd_object *parent,
+                         struct mdd_object *child, struct lu_attr *attr);
+
+static inline void mdd_object_get(struct mdd_object *o)
+{
+       lu_object_get(&o->mod_obj.mo_lu);
+}
+
 static inline void mdd_object_put(const struct lu_env *env,
                                   struct mdd_object *o)
 {
         lu_object_put(env, &o->mod_obj.mo_lu);
 }
 
-struct thandle* mdd_trans_start(const struct lu_env *env,
-                                       struct mdd_device *);
-
+struct thandle *mdd_trans_create(const struct lu_env *env,
+                                 struct mdd_device *mdd);
+int mdd_trans_start(const struct lu_env *env, struct mdd_device *mdd,
+                    struct thandle *th);
 void mdd_trans_stop(const struct lu_env *env, struct mdd_device *mdd,
                     int rc, struct thandle *handle);
-
-int mdd_txn_start_cb(const struct lu_env *env, struct txn_param *param,
-                     void *cookie);
-
 int mdd_txn_stop_cb(const struct lu_env *env, struct thandle *txn,
                     void *cookie);
+int mdd_txn_start_cb(const struct lu_env *env, struct thandle *,
+                     void *cookie);
+
+/* mdd_lfsck.c */
+int mdd_lfsck_set_speed(const struct lu_env *env, struct md_lfsck *lfsck,
+                       __u32 limit);
+int mdd_lfsck_start(const struct lu_env *env, struct md_lfsck *lfsck,
+                   struct lfsck_start *start);
+int mdd_lfsck_stop(const struct lu_env *env, struct md_lfsck *lfsck,
+                  bool pause);
+int mdd_lfsck_setup(const struct lu_env *env, struct mdd_device *mdd);
+void mdd_lfsck_cleanup(const struct lu_env *env, struct mdd_device *mdd);
+int mdd_lfsck_dump(const struct lu_env *env, struct md_lfsck *lfsck,
+                  __u16 type, char *buf, int len);
 
-int mdd_txn_commit_cb(const struct lu_env *env, struct thandle *txn,
-                      void *cookie);
 /* mdd_device.c */
 struct lu_object *mdd_object_alloc(const struct lu_env *env,
                                    const struct lu_object_header *hdr,
                                    struct lu_device *d);
 
-/* mdd_object.c */
-int accmode(const struct lu_env *env, struct lu_attr *la, int flags);
-extern struct lu_context_key mdd_thread_key;
-extern const struct lu_device_operations mdd_lu_ops;
-
-struct mdd_object *mdd_object_find(const struct lu_env *env,
-                                   struct mdd_device *d,
-                                   const struct lu_fid *f);
-
-/* mdd_permission.c */
-#define mdd_cap_t(x) (x)
-
-#define MDD_CAP_TO_MASK(x) (1 << (x))
-
-#define mdd_cap_raised(c, flag) (mdd_cap_t(c) & MDD_CAP_TO_MASK(flag))
-
-/* capable() is copied from linux kernel! */
-static inline int mdd_capable(struct md_ucred *uc, cfs_cap_t cap)
-{
-        if (mdd_cap_raised(uc->mu_cap, cap))
-                return 1;
-        return 0;
-}
-
-int mdd_def_acl_get(const struct lu_env *env, struct mdd_object *mdd_obj,
-                    struct md_attr *ma);
 int mdd_acl_chmod(const struct lu_env *env, struct mdd_object *o, __u32 mode,
                   struct thandle *handle);
+int __mdd_declare_acl_init(const struct lu_env *env, struct mdd_object *obj,
+                           int is_dir, struct thandle *handle);
+int mdd_acl_set(const struct lu_env *env, struct mdd_object *obj,
+               const struct lu_buf *buf, int fl);
 int __mdd_acl_init(const struct lu_env *env, struct mdd_object *obj,
                    struct lu_buf *buf, __u32 *mode, struct thandle *handle);
 int __mdd_permission_internal(const struct lu_env *env, struct mdd_object *obj,
@@ -417,24 +481,24 @@ int mdd_capa_get(const struct lu_env *env, struct md_object *obj,
 
 static inline int lu_device_is_mdd(struct lu_device *d)
 {
-       return ergo(d != NULL && d->ld_ops != NULL, d->ld_ops == &mdd_lu_ops);
+        return ergo(d != NULL && d->ld_ops != NULL, d->ld_ops == &mdd_lu_ops);
 }
 
 static inline struct mdd_device* lu2mdd_dev(struct lu_device *d)
 {
-       LASSERT(lu_device_is_mdd(d));
-       return container_of0(d, struct mdd_device, mdd_md_dev.md_lu_dev);
+        LASSERT(lu_device_is_mdd(d));
+        return container_of0(d, struct mdd_device, mdd_md_dev.md_lu_dev);
 }
 
 static inline struct lu_device *mdd2lu_dev(struct mdd_device *d)
 {
-       return (&d->mdd_md_dev.md_lu_dev);
+        return (&d->mdd_md_dev.md_lu_dev);
 }
 
 static inline struct mdd_object *lu2mdd_obj(struct lu_object *o)
 {
-       LASSERT(ergo(o != NULL, lu_device_is_mdd(o->lo_dev)));
-       return container_of0(o, struct mdd_object, mod_obj.mo_lu);
+        LASSERT(ergo(o != NULL, lu_device_is_mdd(o->lo_dev)));
+        return container_of0(o, struct mdd_object, mod_obj.mo_lu);
 }
 
 static inline struct mdd_device* mdo2mdd(struct md_object *mdo)
@@ -466,7 +530,7 @@ static inline struct dt_object* mdd_object_child(struct mdd_object *o)
 
 static inline struct obd_device *mdd2obd_dev(struct mdd_device *mdd)
 {
-        return mdd->mdd_obd_dev;
+       return (mdd->mdd_md_dev.md_lu_dev.ld_obd);
 }
 
 static inline struct mdd_device *mdd_obj2mdd_dev(struct mdd_object *obj)
@@ -479,34 +543,16 @@ static inline const struct lu_fid *mdo2fid(const struct mdd_object *obj)
         return lu_object_fid(&obj->mod_obj.mo_lu);
 }
 
-static inline const struct dt_rec *__mdd_fid_rec(const struct lu_env *env,
-                                                 const struct lu_fid *fid)
+static inline int mdd_object_obf(const struct mdd_object *obj)
 {
-        struct lu_fid_pack *pack = &mdd_env_info(env)->mti_pack;
-
-        fid_pack(pack, fid, &mdd_env_info(env)->mti_fid2);
-        return (const struct dt_rec *)pack;
+       return lu_fid_eq(mdo2fid(obj), &LU_OBF_FID);
 }
 
-static inline umode_t mdd_object_type(const struct mdd_object *obj)
+static inline cfs_umode_t mdd_object_type(const struct mdd_object *obj)
 {
         return lu_object_attr(&obj->mod_obj.mo_lu);
 }
 
-static inline int mdd_lov_mdsize(const struct lu_env *env,
-                                 struct mdd_device *mdd)
-{
-        struct obd_device *obd = mdd2obd_dev(mdd);
-        return obd->u.mds.mds_max_mdsize;
-}
-
-static inline int mdd_lov_cookiesize(const struct lu_env *env,
-                                     struct mdd_device *mdd)
-{
-        struct obd_device *obd = mdd2obd_dev(mdd);
-        return obd->u.mds.mds_max_cookiesize;
-}
-
 static inline int mdd_is_immutable(struct mdd_object *obj)
 {
         return obj->mod_flags & IMMUTE_OBJ;
@@ -522,14 +568,14 @@ static inline int mdd_is_append(struct mdd_object *obj)
         return obj->mod_flags & APPEND_OBJ;
 }
 
-static inline int mdd_is_mnlink(struct mdd_object *obj)
+static inline int mdd_object_exists(struct mdd_object *obj)
 {
-        return obj->mod_flags & MNLINK_OBJ;
+        return lu_object_exists(mdd2lu_obj(obj));
 }
 
-static inline int mdd_object_exists(struct mdd_object *obj)
+static inline int mdd_object_remote(struct mdd_object *obj)
 {
-        return lu_object_exists(mdd2lu_obj(obj));
+       return lu_object_remote(mdd2lu_obj(obj));
 }
 
 static inline const struct lu_fid *mdd_object_fid(struct mdd_object *obj)
@@ -537,6 +583,11 @@ static inline const struct lu_fid *mdd_object_fid(struct mdd_object *obj)
         return lu_object_fid(mdd2lu_obj(obj));
 }
 
+static inline struct seq_server_site *mdd_seq_site(struct mdd_device *mdd)
+{
+       return mdd2lu_dev(mdd)->ld_site->ld_seq_site;
+}
+
 static inline struct lustre_capa *mdd_object_capa(const struct lu_env *env,
                                                   const struct mdd_object *obj)
 {
@@ -548,7 +599,7 @@ static inline struct lustre_capa *mdd_object_capa(const struct lu_env *env,
         if (!ci)
                 return BYPASS_CAPA;
         for (i = 0; i < MD_CAPAINFO_MAX; i++)
-                if (ci->mc_fid[i] && lu_fid_eq(ci->mc_fid[i], fid))
+                if (lu_fid_eq(&ci->mc_fid[i], fid))
                         return ci->mc_capa[i];
         return NULL;
 }
@@ -560,14 +611,19 @@ static inline void mdd_set_capainfo(const struct lu_env *env, int offset,
         struct md_capainfo *ci = md_capainfo(env);
         const struct lu_fid *fid = mdo2fid(obj);
 
-        LASSERT(offset >= 0 && offset <= MD_CAPAINFO_MAX);
+       LASSERT(offset >= 0 && offset < MD_CAPAINFO_MAX);
         /* NB: in mdt_init0 */
         if (!ci)
                 return;
-        ci->mc_fid[offset]  = fid;
+        ci->mc_fid[offset]  = *fid;
         ci->mc_capa[offset] = capa;
 }
 
+static inline const char *mdd_obj_dev_name(const struct mdd_object *obj)
+{
+        return lu_dev_name(obj->mod_obj.mo_lu.lo_dev);
+}
+
 #define MAX_ATIME_DIFF 60
 
 enum {
@@ -589,6 +645,15 @@ static inline int mdd_permission_internal_locked(const struct lu_env *env,
         return __mdd_permission_internal(env, obj, la, mask, role);
 }
 
+static inline int mdo_data_get(const struct lu_env *env,
+                               struct mdd_object *obj,
+                               void **data)
+{
+        struct dt_object *next = mdd_object_child(obj);
+        next->do_ops->do_data_get(env, next, data);
+        return 0;
+}
+
 /* mdd inline func for calling osd_dt_object ops */
 static inline int mdo_attr_get(const struct lu_env *env, struct mdd_object *obj,
                                struct lu_attr *la, struct lustre_capa *capa)
@@ -597,12 +662,27 @@ static inline int mdo_attr_get(const struct lu_env *env, struct mdd_object *obj,
         return next->do_ops->do_attr_get(env, next, la, capa);
 }
 
-static inline int mdo_attr_set(const struct lu_env *env, struct mdd_object *obj,
-                               const struct lu_attr *la, struct thandle *handle,
+static inline int mdo_declare_attr_set(const struct lu_env *env,
+                                       struct mdd_object *obj,
+                                       const struct lu_attr *la,
+                                       struct thandle *handle)
+{
+        struct dt_object *next = mdd_object_child(obj);
+        return dt_declare_attr_set(env, next, la, handle);
+}
+
+static inline int mdo_attr_set(const struct lu_env *env,
+                               struct mdd_object *obj,
+                               const struct lu_attr *la,
+                               struct thandle *handle,
                                struct lustre_capa *capa)
 {
         struct dt_object *next = mdd_object_child(obj);
-        LASSERT(mdd_object_exists(obj));
+        if (mdd_object_exists(obj) == 0) {
+                CERROR("%s: object "DFID" not found: rc = -2\n",
+                       mdd_obj_dev_name(obj), PFID(mdd_object_fid(obj)));
+                return -ENOENT;
+        }
         return next->do_ops->do_attr_set(env, next, la, handle, capa);
 }
 
@@ -614,23 +694,50 @@ static inline int mdo_xattr_get(const struct lu_env *env,struct mdd_object *obj,
         return next->do_ops->do_xattr_get(env, next, buf, name, capa);
 }
 
+static inline int mdo_declare_xattr_set(const struct lu_env *env,
+                                        struct mdd_object *obj,
+                                        const struct lu_buf *buf,
+                                        const char *name,
+                                        int fl, struct thandle *handle)
+{
+        struct dt_object *next = mdd_object_child(obj);
+        return dt_declare_xattr_set(env, next, buf, name, fl, handle);
+}
+
 static inline int mdo_xattr_set(const struct lu_env *env,struct mdd_object *obj,
                                 const struct lu_buf *buf, const char *name,
                                 int fl, struct thandle *handle,
                                 struct lustre_capa *capa)
 {
         struct dt_object *next = mdd_object_child(obj);
-        LASSERT(mdd_object_exists(obj));
+        if (mdd_object_exists(obj) == 0) {
+                CERROR("%s: object "DFID" not found: rc = -2\n",
+                       mdd_obj_dev_name(obj), PFID(mdd_object_fid(obj)));
+                return -ENOENT;
+        }
         return next->do_ops->do_xattr_set(env, next, buf, name, fl, handle,
                                           capa);
 }
 
+static inline int mdo_declare_xattr_del(const struct lu_env *env,
+                                        struct mdd_object *obj,
+                                        const char *name,
+                                        struct thandle *handle)
+{
+        struct dt_object *next = mdd_object_child(obj);
+        return dt_declare_xattr_del(env, next, name, handle);
+}
+
 static inline int mdo_xattr_del(const struct lu_env *env,struct mdd_object *obj,
                                 const char *name, struct thandle *handle,
                                 struct lustre_capa *capa)
 {
         struct dt_object *next = mdd_object_child(obj);
-        LASSERT(mdd_object_exists(obj));
+        if (mdd_object_exists(obj) == 0) {
+                CERROR("%s: object "DFID" not found: rc = -2\n",
+                       mdd_obj_dev_name(obj), PFID(mdd_object_fid(obj)));
+                return -ENOENT;
+        }
         return next->do_ops->do_xattr_del(env, next, name, handle, capa);
 }
 
@@ -639,7 +746,11 @@ int mdo_xattr_list(const struct lu_env *env, struct mdd_object *obj,
                    struct lu_buf *buf, struct lustre_capa *capa)
 {
         struct dt_object *next = mdd_object_child(obj);
-        LASSERT(mdd_object_exists(obj));
+        if (mdd_object_exists(obj) == 0) {
+                CERROR("%s: object "DFID" not found: rc = -2\n",
+                       mdd_obj_dev_name(obj), PFID(mdd_object_fid(obj)));
+                return -ENOENT;
+        }
         return next->do_ops->do_xattr_list(env, next, buf, capa);
 }
 
@@ -651,23 +762,102 @@ int mdo_index_try(const struct lu_env *env, struct mdd_object *obj,
         return next->do_ops->do_index_try(env, next, feat);
 }
 
-static inline void mdo_ref_add(const struct lu_env *env, struct mdd_object *obj,
-                               struct thandle *handle)
+static inline
+int mdo_declare_index_insert(const struct lu_env *env, struct mdd_object *obj,
+                             const struct lu_fid *fid, const char *name,
+                             struct thandle *handle)
+{
+        struct dt_object *next = mdd_object_child(obj);
+        int              rc = 0;
+
+        /*
+         * if the object doesn't exist yet, then it's supposed to be created
+         * and declaration of the creation should be enough to insert ./..
+         */
+        /* FIXME: remote object should not be awared by MDD layer, but local
+         * creation does not declare insert ./.. (comments above), which
+         * is required by remote directory creation.
+         * This remote check should be removed when mdd_object_exists check is
+         * removed.
+         */
+        if (mdd_object_exists(obj) || mdd_object_remote(obj)) {
+                rc = -ENOTDIR;
+                if (dt_try_as_dir(env, next))
+                        rc = dt_declare_insert(env, next,
+                                               (struct dt_rec *)fid,
+                                               (const struct dt_key *)name,
+                                               handle);
+        }
+
+        return rc;
+}
+
+static inline
+int mdo_declare_index_delete(const struct lu_env *env, struct mdd_object *obj,
+                             const char *name, struct thandle *handle)
 {
         struct dt_object *next = mdd_object_child(obj);
-        LASSERT(mdd_object_exists(obj));
+
+        if (!dt_try_as_dir(env, next))
+                return -ENOTDIR;
+
+        return dt_declare_delete(env, next, (const struct dt_key *)name,
+                                 handle);
+}
+
+static inline int mdo_declare_ref_add(const struct lu_env *env,
+                                      struct mdd_object *obj,
+                                      struct thandle *handle)
+{
+        struct dt_object *next = mdd_object_child(obj);
+        return dt_declare_ref_add(env, next, handle);
+}
+
+static inline int mdo_ref_add(const struct lu_env *env, struct mdd_object *obj,
+                              struct thandle *handle)
+{
+        struct dt_object *next = mdd_object_child(obj);
+        if (mdd_object_exists(obj) == 0) {
+                CERROR("%s: object "DFID" not found: rc = -2\n",
+                       mdd_obj_dev_name(obj), PFID(mdd_object_fid(obj)));
+                return -ENOENT;
+        }
         return next->do_ops->do_ref_add(env, next, handle);
 }
 
-static inline void mdo_ref_del(const struct lu_env *env, struct mdd_object *obj,
-                               struct thandle *handle)
+static inline int mdo_declare_ref_del(const struct lu_env *env,
+                                      struct mdd_object *obj,
+                                      struct thandle *handle)
+{
+        struct dt_object *next = mdd_object_child(obj);
+        return dt_declare_ref_del(env, next, handle);
+}
+
+static inline int mdo_ref_del(const struct lu_env *env, struct mdd_object *obj,
+                              struct thandle *handle)
 {
         struct dt_object *next = mdd_object_child(obj);
-        LASSERT(mdd_object_exists(obj));
+        if (mdd_object_exists(obj) == 0) {
+                CERROR("%s: object "DFID" not found: rc = -2\n",
+                       mdd_obj_dev_name(obj), PFID(mdd_object_fid(obj)));
+                return -ENOENT;
+        }
         return next->do_ops->do_ref_del(env, next, handle);
 }
 
 static inline
+int mdo_declare_create_obj(const struct lu_env *env, struct mdd_object *o,
+                           struct lu_attr *attr,
+                           struct dt_allocation_hint *hint,
+                           struct dt_object_format *dof,
+                           struct thandle *handle)
+{
+        struct dt_object *next = mdd_object_child(o);
+        return next->do_ops->do_declare_create(env, next, attr, hint,
+                                               dof, handle);
+}
+
+static inline
 int mdo_create_obj(const struct lu_env *env, struct mdd_object *o,
                    struct lu_attr *attr,
                    struct dt_allocation_hint *hint,
@@ -675,7 +865,40 @@ int mdo_create_obj(const struct lu_env *env, struct mdd_object *o,
                    struct thandle *handle)
 {
         struct dt_object *next = mdd_object_child(o);
-        return next->do_ops->do_create(env, next, attr, hint, dof, handle);
+       struct lu_ucred *uc = lu_ucred(env);
+       __u32 saved;
+       int rc;
+
+       /*
+        *  LU-974 enforce client umask in creation.
+        * TODO: CMD needs to handle this for remote object.
+        */
+       if (likely(uc != NULL))
+               saved = xchg(&current->fs->umask, uc->uc_umask & S_IRWXUGO);
+
+       rc = next->do_ops->do_create(env, next, attr, hint, dof, handle);
+
+       /* restore previous umask value */
+       if (likely(uc != NULL))
+               current->fs->umask = saved;
+
+       return rc;
+}
+
+static inline
+int mdo_declare_destroy(const struct lu_env *env, struct mdd_object *o,
+                        struct thandle *handle)
+{
+        struct dt_object *next = mdd_object_child(o);
+        return dt_declare_destroy(env, next, handle);
+}
+
+static inline
+int mdo_destroy(const struct lu_env *env, struct mdd_object *o,
+                struct thandle *handle)
+{
+        struct dt_object *next = mdd_object_child(o);
+        return dt_destroy(env, next, handle);
 }
 
 static inline struct obd_capa *mdo_capa_get(const struct lu_env *env,
@@ -684,7 +907,11 @@ static inline struct obd_capa *mdo_capa_get(const struct lu_env *env,
                                             __u64 opc)
 {
         struct dt_object *next = mdd_object_child(obj);
-        LASSERT(mdd_object_exists(obj));
+        if (mdd_object_exists(obj) == 0) {
+                CERROR("%s: object "DFID" not found: rc = -2\n",
+                       mdd_obj_dev_name(obj), PFID(mdd_object_fid(obj)));
+                return ERR_PTR(-ENOENT);
+        }
         return next->do_ops->do_capa_get(env, next, old, opc);
 }