Whamcloud - gitweb
LU-8050 osp: not use obdo::o_lcookie for non-onwire RPC data
[fs/lustre-release.git] / lustre / include / lustre / lustre_idl.h
index e8a15b6..bc3b762 100644 (file)
  *
  * You should have received a copy of the GNU General Public License
  * version 2 along with this program; If not, see
- * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
- *
- * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
- * CA 95054 USA or visit www.sun.com if you need additional information or
- * have any questions.
+ * http://www.gnu.org/licenses/gpl-2.0.html
  *
  * GPL HEADER END
  */
@@ -27,7 +23,7 @@
  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
  * Use is subject to license terms.
  *
- * Copyright (c) 2011, 2014, Intel Corporation.
+ * Copyright (c) 2011, 2016, Intel Corporation.
  */
 /*
  * This file is part of Lustre, http://www.lustre.org/
@@ -52,8 +48,7 @@
  * that the Lustre wire protocol is not influenced by external dependencies.
  *
  * The only other acceptable items in this file are VERY SIMPLE accessor
- * functions to avoid callers grubbing inside the structures, and the
- * prototypes of the swabber functions for each struct.  Nothing that
+ * functions to avoid callers grubbing inside the structures. Nothing that
  * depends on external functions or definitions should be in here.
  *
  * Structs must be properly aligned to put 64-bit values on an 8-byte
  * in the code to ensure that new/old clients that see this larger struct
  * do not fail, otherwise you need to implement protocol compatibility).
  *
- * We assume all nodes are either little-endian or big-endian, and we
- * always send messages in the sender's native format.  The receiver
- * detects the message format by checking the 'magic' field of the message
- * (see lustre_msg_swabbed() below).
- *
- * Each wire type has corresponding 'lustre_swab_xxxtypexxx()' routines,
- * implemented either here, inline (trivial implementations) or in
- * ptlrpc/pack_generic.c.  These 'swabbers' convert the type from "other"
- * endian, in-place in the message buffer.
- *
- * A swabber takes a single pointer argument.  The caller must already have
- * verified that the length of the message buffer >= sizeof (type).
- *
- * For variable length types, a second 'lustre_swab_v_xxxtypexxx()' routine
- * may be defined that swabs just the variable part, after the caller has
- * verified that the message buffer is large enough.
- *
  * @{
  */
 
 #ifndef _LUSTRE_IDL_H_
 #define _LUSTRE_IDL_H_
 
-#include <libcfs/libcfs.h> /* for LPUX64, etc */
+#include <asm/byteorder.h>
+#include <linux/types.h>
+
 #include <lnet/types.h>
 #include <lustre/lustre_user.h> /* Defn's shared with user-space. */
-#include <lustre/lustre_errno.h>
 #include <lustre_ver.h>
 
 /*
@@ -213,8 +192,10 @@ enum lma_incompat {
        LMAI_REMOTE_PARENT      = 0x00000004, /* the parent of the object
                                                 is on the remote MDT */
        LMAI_STRIPED            = 0x00000008, /* striped directory inode */
+       LMAI_ORPHAN             = 0x00000010, /* inode is orphan */
+       LMA_INCOMPAT_SUPP       = (LMAI_AGENT | LMAI_REMOTE_PARENT | \
+                                  LMAI_STRIPED | LMAI_ORPHAN)
 };
-#define LMA_INCOMPAT_SUPP      (LMAI_AGENT | LMAI_REMOTE_PARENT | LMAI_STRIPED)
 
 extern void lustre_lma_swab(struct lustre_mdt_attrs *lma);
 extern void lustre_lma_init(struct lustre_mdt_attrs *lma,
@@ -254,41 +235,94 @@ enum {
         LUSTRE_FID_INIT_OID  = 1UL
 };
 
-/** returns fid object sequence */
-static inline __u64 fid_seq(const struct lu_fid *fid)
-{
-        return fid->f_seq;
-}
-
-/** returns fid object id */
-static inline __u32 fid_oid(const struct lu_fid *fid)
-{
-        return fid->f_oid;
-}
-
-/** returns fid object version */
-static inline __u32 fid_ver(const struct lu_fid *fid)
-{
-        return fid->f_ver;
-}
-
-static inline void fid_zero(struct lu_fid *fid)
-{
-        memset(fid, 0, sizeof(*fid));
-}
-
-static inline __u64 fid_ver_oid(const struct lu_fid *fid)
-{
-        return ((__u64)fid_ver(fid) << 32 | fid_oid(fid));
-}
+/**
+ * Different FID Format
+ * http://arch.lustre.org/index.php?title=Interoperability_fids_zfs#NEW.0
+ *
+ * FID:
+ * File IDentifier generated by client from range allocated by the seq service.
+ * First 0x400 sequences [2^33, 2^33 + 0x400] are reserved for system use. Note
+ * that on ldiskfs MDTs that IGIF FIDs can use inode numbers starting at 12,
+ * but this is in the IGIF SEQ rangeand does not conflict with assigned FIDs.
+ *
+ * IGIF:
+ * Inode and Generation In FID, a surrogate FID used to globally identify an
+ * existing object on OLD formatted MDT file system. This would only be used on
+ * MDT0 in a DNE filesystem, because there are not expected to be any OLD
+ * formatted DNE filesystems. Belongs to a sequence in [12, 2^32 - 1] range,
+ * where sequence number is inode number, and inode generation is used as OID.
+ * NOTE: This assumes no more than 2^32-1 inodes exist in the MDT filesystem,
+ * which is the maximum possible for an ldiskfs backend. NOTE: This assumes
+ * that the reserved ext3/ext4/ldiskfs inode numbers [0-11] are never visible
+ * to clients, which has always been true.
+ *
+ * IDIF:
+ * Object ID in FID, a surrogate FID used to globally identify an existing
+ * object on OLD formatted OST file system. Belongs to a sequence in
+ * [2^32, 2^33 - 1]. Sequence number is calculated as:
+ *     1 << 32 | (ost_index << 16) | ((objid >> 32) & 0xffff)
+ * that is, SEQ consists of 16-bit OST index, and higher 16 bits of object ID.
+ * The generation of unique SEQ values per OST allows the IDIF FIDs to be
+ * identified in the FLD correctly. The OID field is calculated as:
+ *     objid & 0xffffffff
+ * that is, it consists of lower 32 bits of object ID. NOTE This assumes that
+ * no more than 2^48-1 objects have ever been created on an OST, and that no
+ * more than 65535 OSTs are in use. Both are very reasonable assumptions (can
+ * uniquely map all objects on an OST that created 1M objects per second for 9
+ * years, or combinations thereof).
+ *
+ * OST_MDT0:
+ * Surrogate FID used to identify an existing object on OLD formatted OST
+ * filesystem. Belongs to the reserved sequence 0, and is used internally prior
+ * to the introduction of FID-on-OST, at which point IDIF will be used to
+ * identify objects as residing on a specific OST.
+ *
+ * LLOG:
+ * For Lustre Log objects the object sequence 1 is used. This is compatible with
+ * both OLD and NEW.1 namespaces, as this SEQ number is in the ext3/ldiskfs
+ * reserved inode range and does not conflict with IGIF sequence numbers.
+ *
+ * ECHO:
+ * For testing OST IO performance the object sequence 2 is used. This is
+ * compatible with both OLD and NEW.1 namespaces, as this SEQ number is in the
+ * ext3/ldiskfs reserved inode range and does not conflict with IGIF sequence
+ * numbers.
+ *
+ * OST_MDT1 .. OST_MAX:
+ * For testing with multiple MDTs the object sequence 3 through 9 is used,
+ * allowing direct mapping of MDTs 1 through 7 respectively, for a total of 8
+ * MDTs including OST_MDT0. This matches the legacy CMD project "group"
+ * mappings. However, this SEQ range is only for testing prior to any production
+ * DNE release, as the objects in this range conflict across all OSTs, as the
+ * OST index is not part of the FID.
+ *
+ *
+ * For compatibility with existing OLD OST network protocol structures, the FID
+ * must map onto the o_id and o_gr in a manner that ensures existing objects are
+ * identified consistently for IO, as well as onto the lock namespace to ensure
+ * both IDIFs map onto the same objects for IO as well as resources in the DLM.
+ *
+ * DLM OLD OBIF/IDIF:
+ * resource[] = {o_id, o_seq, 0, 0};  // o_seq == 0 for production releases
+ *
+ * DLM NEW.1 FID (this is the same for both the MDT and OST):
+ * resource[] = {SEQ, OID, VER, HASH};
+ *
+ * Note that for mapping IDIF values to DLM resource names the o_id may be
+ * larger than the 2^33 reserved sequence numbers for IDIF, so it is possible
+ * for the o_id numbers to overlap FID SEQ numbers in the resource. However, in
+ * all production releases the OLD o_seq field is always zero, and all valid FID
+ * OID values are non-zero, so the lock resources will not collide.
+ *
+ * For objects within the IDIF range, group extraction (non-CMD) will be:
+ * o_id = (fid->f_seq & 0x7fff) << 16 | fid->f_oid;
+ * o_seq = 0;  // formerly group number
+ */
 
 /**
  * Note that reserved SEQ numbers below 12 will conflict with ldiskfs
  * inodes in the IGIF namespace, so these reserved SEQ numbers can be
  * used for other purposes and not risk collisions with existing inodes.
- *
- * Different FID Format
- * http://arch.lustre.org/index.php?title=Interoperability_fids_zfs#NEW.0
  */
 enum fid_seq {
        FID_SEQ_OST_MDT0        = 0,
@@ -354,513 +388,6 @@ enum root_oid {
        FID_OID_ECHO_ROOT       = 2UL,
 };
 
-static inline bool fid_seq_is_mdt0(__u64 seq)
-{
-       return seq == FID_SEQ_OST_MDT0;
-}
-
-static inline bool fid_seq_is_mdt(__u64 seq)
-{
-       return seq == FID_SEQ_OST_MDT0 || seq >= FID_SEQ_NORMAL;
-};
-
-static inline bool fid_seq_is_echo(__u64 seq)
-{
-       return seq == FID_SEQ_ECHO;
-}
-
-static inline bool fid_is_echo(const struct lu_fid *fid)
-{
-       return fid_seq_is_echo(fid_seq(fid));
-}
-
-static inline bool fid_seq_is_llog(__u64 seq)
-{
-       return seq == FID_SEQ_LLOG;
-}
-
-static inline bool fid_is_llog(const struct lu_fid *fid)
-{
-       /* file with OID == 0 is not llog but contains last oid */
-       return fid_seq_is_llog(fid_seq(fid)) && fid_oid(fid) > 0;
-}
-
-static inline bool fid_seq_is_rsvd(__u64 seq)
-{
-       return seq > FID_SEQ_OST_MDT0 && seq <= FID_SEQ_RSVD;
-};
-
-static inline bool fid_seq_is_special(__u64 seq)
-{
-       return seq == FID_SEQ_SPECIAL;
-};
-
-static inline bool fid_seq_is_local_file(__u64 seq)
-{
-       return seq == FID_SEQ_LOCAL_FILE ||
-              seq == FID_SEQ_LOCAL_NAME;
-};
-
-static inline bool fid_seq_is_root(__u64 seq)
-{
-       return seq == FID_SEQ_ROOT;
-}
-
-static inline bool fid_seq_is_dot(__u64 seq)
-{
-       return seq == FID_SEQ_DOT_LUSTRE;
-}
-
-static inline bool fid_seq_is_default(__u64 seq)
-{
-       return seq == FID_SEQ_LOV_DEFAULT;
-}
-
-static inline bool fid_is_mdt0(const struct lu_fid *fid)
-{
-       return fid_seq_is_mdt0(fid_seq(fid));
-}
-
-static inline void lu_root_fid(struct lu_fid *fid)
-{
-       fid->f_seq = FID_SEQ_ROOT;
-       fid->f_oid = FID_OID_ROOT;
-       fid->f_ver = 0;
-}
-
-static inline void lu_echo_root_fid(struct lu_fid *fid)
-{
-       fid->f_seq = FID_SEQ_ROOT;
-       fid->f_oid = FID_OID_ECHO_ROOT;
-       fid->f_ver = 0;
-}
-
-static inline void lu_update_log_fid(struct lu_fid *fid, __u32 index)
-{
-       fid->f_seq = FID_SEQ_UPDATE_LOG;
-       fid->f_oid = index;
-       fid->f_ver = 0;
-}
-
-static inline void lu_update_log_dir_fid(struct lu_fid *fid, __u32 index)
-{
-       fid->f_seq = FID_SEQ_UPDATE_LOG_DIR;
-       fid->f_oid = index;
-       fid->f_ver = 0;
-}
-
-/**
- * Check if a fid is igif or not.
- * \param fid the fid to be tested.
- * \return true if the fid is an igif; otherwise false.
- */
-static inline bool fid_seq_is_igif(__u64 seq)
-{
-       return seq >= FID_SEQ_IGIF && seq <= FID_SEQ_IGIF_MAX;
-}
-
-static inline bool fid_is_igif(const struct lu_fid *fid)
-{
-       return fid_seq_is_igif(fid_seq(fid));
-}
-
-/**
- * Check if a fid is idif or not.
- * \param fid the fid to be tested.
- * \return true if the fid is an idif; otherwise false.
- */
-static inline bool fid_seq_is_idif(__u64 seq)
-{
-       return seq >= FID_SEQ_IDIF && seq <= FID_SEQ_IDIF_MAX;
-}
-
-static inline bool fid_is_idif(const struct lu_fid *fid)
-{
-       return fid_seq_is_idif(fid_seq(fid));
-}
-
-static inline bool fid_is_local_file(const struct lu_fid *fid)
-{
-       return fid_seq_is_local_file(fid_seq(fid));
-}
-
-static inline bool fid_seq_is_norm(__u64 seq)
-{
-       return (seq >= FID_SEQ_NORMAL);
-}
-
-static inline bool fid_is_norm(const struct lu_fid *fid)
-{
-       return fid_seq_is_norm(fid_seq(fid));
-}
-
-static inline int fid_is_layout_rbtree(const struct lu_fid *fid)
-{
-       return fid_seq(fid) == FID_SEQ_LAYOUT_RBTREE;
-}
-
-static inline bool fid_seq_is_update_log(__u64 seq)
-{
-       return seq == FID_SEQ_UPDATE_LOG;
-}
-
-static inline bool fid_is_update_log(const struct lu_fid *fid)
-{
-       return fid_seq_is_update_log(fid_seq(fid));
-}
-
-static inline bool fid_seq_is_update_log_dir(__u64 seq)
-{
-       return seq == FID_SEQ_UPDATE_LOG_DIR;
-}
-
-static inline bool fid_is_update_log_dir(const struct lu_fid *fid)
-{
-       return fid_seq_is_update_log_dir(fid_seq(fid));
-}
-
-/* convert an OST objid into an IDIF FID SEQ number */
-static inline __u64 fid_idif_seq(__u64 id, __u32 ost_idx)
-{
-       return FID_SEQ_IDIF | (ost_idx << 16) | ((id >> 32) & 0xffff);
-}
-
-/* convert a packed IDIF FID into an OST objid */
-static inline __u64 fid_idif_id(__u64 seq, __u32 oid, __u32 ver)
-{
-       return ((__u64)ver << 48) | ((seq & 0xffff) << 32) | oid;
-}
-
-static inline __u32 idif_ost_idx(__u64 seq)
-{
-       return (seq >> 16) & 0xffff;
-}
-
-/* extract ost index from IDIF FID */
-static inline __u32 fid_idif_ost_idx(const struct lu_fid *fid)
-{
-       return idif_ost_idx(fid_seq(fid));
-}
-
-/* extract OST sequence (group) from a wire ost_id (id/seq) pair */
-static inline __u64 ostid_seq(const struct ost_id *ostid)
-{
-       if (fid_seq_is_mdt0(ostid->oi.oi_seq))
-               return FID_SEQ_OST_MDT0;
-
-       if (unlikely(fid_seq_is_default(ostid->oi.oi_seq)))
-               return FID_SEQ_LOV_DEFAULT;
-
-       if (fid_is_idif(&ostid->oi_fid))
-               return FID_SEQ_OST_MDT0;
-
-       return fid_seq(&ostid->oi_fid);
-}
-
-/* extract OST objid from a wire ost_id (id/seq) pair */
-static inline __u64 ostid_id(const struct ost_id *ostid)
-{
-       if (fid_seq_is_mdt0(ostid->oi.oi_seq))
-               return ostid->oi.oi_id & IDIF_OID_MASK;
-
-       if (unlikely(fid_seq_is_default(ostid->oi.oi_seq)))
-               return ostid->oi.oi_id;
-
-       if (fid_is_idif(&ostid->oi_fid))
-               return fid_idif_id(fid_seq(&ostid->oi_fid),
-                                  fid_oid(&ostid->oi_fid), 0);
-
-       return fid_oid(&ostid->oi_fid);
-}
-
-static inline void ostid_set_seq(struct ost_id *oi, __u64 seq)
-{
-       if (fid_seq_is_mdt0(seq) || fid_seq_is_default(seq)) {
-               oi->oi.oi_seq = seq;
-       } else {
-               oi->oi_fid.f_seq = seq;
-               /* Note: if f_oid + f_ver is zero, we need init it
-                * to be 1, otherwise, ostid_seq will treat this
-                * as old ostid (oi_seq == 0) */
-               if (oi->oi_fid.f_oid == 0 && oi->oi_fid.f_ver == 0)
-                       oi->oi_fid.f_oid = LUSTRE_FID_INIT_OID;
-       }
-}
-
-static inline void ostid_set_seq_mdt0(struct ost_id *oi)
-{
-       ostid_set_seq(oi, FID_SEQ_OST_MDT0);
-}
-
-static inline void ostid_set_seq_echo(struct ost_id *oi)
-{
-       ostid_set_seq(oi, FID_SEQ_ECHO);
-}
-
-static inline void ostid_set_seq_llog(struct ost_id *oi)
-{
-       ostid_set_seq(oi, FID_SEQ_LLOG);
-}
-
-/**
- * Note: we need check oi_seq to decide where to set oi_id,
- * so oi_seq should always be set ahead of oi_id.
- */
-static inline void ostid_set_id(struct ost_id *oi, __u64 oid)
-{
-       if (fid_seq_is_mdt0(oi->oi.oi_seq)) {
-               if (oid >= IDIF_MAX_OID) {
-                       CERROR("Bad %llu to set "DOSTID"\n",
-                               (unsigned long long)oid, POSTID(oi));
-                       return;
-               }
-               oi->oi.oi_id = oid;
-       } else if (fid_is_idif(&oi->oi_fid)) {
-               if (oid >= IDIF_MAX_OID) {
-                       CERROR("Bad %llu to set "DOSTID"\n",
-                               (unsigned long long)oid, POSTID(oi));
-                       return;
-               }
-               oi->oi_fid.f_seq = fid_idif_seq(oid,
-                                               fid_idif_ost_idx(&oi->oi_fid));
-               oi->oi_fid.f_oid = oid;
-               oi->oi_fid.f_ver = oid >> 48;
-       } else {
-               if (oid > OBIF_MAX_OID) {
-                       CERROR("Bad %llu to set "DOSTID"\n",
-                               (unsigned long long)oid, POSTID(oi));
-                       return;
-               }
-               oi->oi_fid.f_oid = oid;
-       }
-}
-
-static inline int fid_set_id(struct lu_fid *fid, __u64 oid)
-{
-       if (unlikely(fid_seq_is_igif(fid->f_seq))) {
-               CERROR("bad IGIF, "DFID"\n", PFID(fid));
-               return -EBADF;
-       }
-
-       if (fid_is_idif(fid)) {
-               if (oid >= IDIF_MAX_OID) {
-                       CERROR("Bad %llu to set "DFID"\n",
-                               (unsigned long long)oid, PFID(fid));
-                       return -EBADF;
-               }
-               fid->f_seq = fid_idif_seq(oid, fid_idif_ost_idx(fid));
-               fid->f_oid = oid;
-               fid->f_ver = oid >> 48;
-       } else {
-               if (oid > OBIF_MAX_OID) {
-                       CERROR("Bad %llu to set "DFID"\n",
-                               (unsigned long long)oid, PFID(fid));
-                       return -EBADF;
-               }
-               fid->f_oid = oid;
-       }
-       return 0;
-}
-
-/**
- * Unpack an OST object id/seq (group) into a FID.  This is needed for
- * converting all obdo, lmm, lsm, etc. 64-bit id/seq pairs into proper
- * FIDs.  Note that if an id/seq is already in FID/IDIF format it will
- * be passed through unchanged.  Only legacy OST objects in "group 0"
- * will be mapped into the IDIF namespace so that they can fit into the
- * struct lu_fid fields without loss.  For reference see:
- * http://arch.lustre.org/index.php?title=Interoperability_fids_zfs
- */
-static inline int ostid_to_fid(struct lu_fid *fid, const struct ost_id *ostid,
-                              __u32 ost_idx)
-{
-       __u64 seq = ostid_seq(ostid);
-
-       if (ost_idx > 0xffff) {
-               CERROR("bad ost_idx, "DOSTID" ost_idx:%u\n", POSTID(ostid),
-                      ost_idx);
-               return -EBADF;
-       }
-
-       if (fid_seq_is_mdt0(seq)) {
-               __u64 oid = ostid_id(ostid);
-
-               /* This is a "legacy" (old 1.x/2.early) OST object in "group 0"
-                * that we map into the IDIF namespace.  It allows up to 2^48
-                * objects per OST, as this is the object namespace that has
-                * been in production for years.  This can handle create rates
-                * of 1M objects/s/OST for 9 years, or combinations thereof. */
-               if (oid >= IDIF_MAX_OID) {
-                       CERROR("bad MDT0 id(1), "DOSTID" ost_idx:%u\n",
-                              POSTID(ostid), ost_idx);
-                       return -EBADF;
-               }
-               fid->f_seq = fid_idif_seq(oid, ost_idx);
-               /* truncate to 32 bits by assignment */
-               fid->f_oid = oid;
-               /* in theory, not currently used */
-               fid->f_ver = oid >> 48;
-       } else if (likely(!fid_seq_is_default(seq)))
-               /* if (fid_seq_is_idif(seq) || fid_seq_is_norm(seq)) */ {
-               /* This is either an IDIF object, which identifies objects across
-                * all OSTs, or a regular FID.  The IDIF namespace maps legacy
-                * OST objects into the FID namespace.  In both cases, we just
-                * pass the FID through, no conversion needed. */
-               if (ostid->oi_fid.f_ver != 0) {
-                       CERROR("bad MDT0 id(2), "DOSTID" ost_idx:%u\n",
-                               POSTID(ostid), ost_idx);
-                       return -EBADF;
-               }
-               *fid = ostid->oi_fid;
-       }
-
-       return 0;
-}
-
-/* pack any OST FID into an ostid (id/seq) for the wire/disk */
-static inline int fid_to_ostid(const struct lu_fid *fid, struct ost_id *ostid)
-{
-       if (unlikely(fid_seq_is_igif(fid->f_seq))) {
-               CERROR("bad IGIF, "DFID"\n", PFID(fid));
-               return -EBADF;
-       }
-
-       if (fid_is_idif(fid)) {
-               ostid_set_seq_mdt0(ostid);
-               ostid_set_id(ostid, fid_idif_id(fid_seq(fid), fid_oid(fid),
-                                               fid_ver(fid)));
-       } else {
-               ostid->oi_fid = *fid;
-       }
-
-       return 0;
-}
-
-/* Check whether the fid is for LAST_ID */
-static inline bool fid_is_last_id(const struct lu_fid *fid)
-{
-       return fid_oid(fid) == 0 && fid_seq(fid) != FID_SEQ_UPDATE_LOG &&
-              fid_seq(fid) != FID_SEQ_UPDATE_LOG_DIR;
-}
-
-/**
- * Get inode number from an igif.
- * \param fid an igif to get inode number from.
- * \return inode number for the igif.
- */
-static inline ino_t lu_igif_ino(const struct lu_fid *fid)
-{
-        return fid_seq(fid);
-}
-
-extern void lustre_swab_ost_id(struct ost_id *oid);
-
-/**
- * Get inode generation from an igif.
- * \param fid an igif to get inode generation from.
- * \return inode generation for the igif.
- */
-static inline __u32 lu_igif_gen(const struct lu_fid *fid)
-{
-        return fid_oid(fid);
-}
-
-/**
- * Build igif from the inode number/generation.
- */
-static inline void lu_igif_build(struct lu_fid *fid, __u32 ino, __u32 gen)
-{
-       fid->f_seq = ino;
-       fid->f_oid = gen;
-       fid->f_ver = 0;
-}
-
-/*
- * Fids are transmitted across network (in the sender byte-ordering),
- * and stored on disk in big-endian order.
- */
-static inline void fid_cpu_to_le(struct lu_fid *dst, const struct lu_fid *src)
-{
-       dst->f_seq = cpu_to_le64(fid_seq(src));
-       dst->f_oid = cpu_to_le32(fid_oid(src));
-       dst->f_ver = cpu_to_le32(fid_ver(src));
-}
-
-static inline void fid_le_to_cpu(struct lu_fid *dst, const struct lu_fid *src)
-{
-       dst->f_seq = le64_to_cpu(fid_seq(src));
-       dst->f_oid = le32_to_cpu(fid_oid(src));
-       dst->f_ver = le32_to_cpu(fid_ver(src));
-}
-
-static inline void fid_cpu_to_be(struct lu_fid *dst, const struct lu_fid *src)
-{
-       dst->f_seq = cpu_to_be64(fid_seq(src));
-       dst->f_oid = cpu_to_be32(fid_oid(src));
-       dst->f_ver = cpu_to_be32(fid_ver(src));
-}
-
-static inline void fid_be_to_cpu(struct lu_fid *dst, const struct lu_fid *src)
-{
-       dst->f_seq = be64_to_cpu(fid_seq(src));
-       dst->f_oid = be32_to_cpu(fid_oid(src));
-       dst->f_ver = be32_to_cpu(fid_ver(src));
-}
-
-static inline bool fid_is_sane(const struct lu_fid *fid)
-{
-       return fid != NULL &&
-              ((fid_seq(fid) >= FID_SEQ_START && fid_ver(fid) == 0) ||
-               fid_is_igif(fid) || fid_is_idif(fid) ||
-               fid_seq_is_rsvd(fid_seq(fid)));
-}
-
-extern void lustre_swab_lu_fid(struct lu_fid *fid);
-
-static inline bool lu_fid_eq(const struct lu_fid *f0, const struct lu_fid *f1)
-{
-       return memcmp(f0, f1, sizeof *f0) == 0;
-}
-
-#define __diff_normalize(val0, val1)                            \
-({                                                              \
-        typeof(val0) __val0 = (val0);                           \
-        typeof(val1) __val1 = (val1);                           \
-                                                                \
-        (__val0 == __val1 ? 0 : __val0 > __val1 ? +1 : -1);     \
-})
-
-static inline int lu_fid_cmp(const struct lu_fid *f0,
-                             const struct lu_fid *f1)
-{
-        return
-                __diff_normalize(fid_seq(f0), fid_seq(f1)) ?:
-                __diff_normalize(fid_oid(f0), fid_oid(f1)) ?:
-                __diff_normalize(fid_ver(f0), fid_ver(f1));
-}
-
-static inline void ostid_cpu_to_le(const struct ost_id *src_oi,
-                                  struct ost_id *dst_oi)
-{
-       if (fid_seq_is_mdt0(src_oi->oi.oi_seq)) {
-               dst_oi->oi.oi_id = cpu_to_le64(src_oi->oi.oi_id);
-               dst_oi->oi.oi_seq = cpu_to_le64(src_oi->oi.oi_seq);
-       } else {
-               fid_cpu_to_le(&dst_oi->oi_fid, &src_oi->oi_fid);
-       }
-}
-
-static inline void ostid_le_to_cpu(const struct ost_id *src_oi,
-                                  struct ost_id *dst_oi)
-{
-       if (fid_seq_is_mdt0(src_oi->oi.oi_seq)) {
-               dst_oi->oi.oi_id = le64_to_cpu(src_oi->oi.oi_id);
-               dst_oi->oi.oi_seq = le64_to_cpu(src_oi->oi.oi_seq);
-       } else {
-               fid_le_to_cpu(&dst_oi->oi_fid, &src_oi->oi_fid);
-       }
-}
-
 struct lu_orphan_rec {
        /* The MDT-object's FID referenced by the orphan OST-object */
        struct lu_fid   lor_fid;
@@ -873,7 +400,6 @@ struct lu_orphan_ent {
        struct lu_fid           loe_key;
        struct lu_orphan_rec    loe_rec;
 };
-void lustre_swab_orphan_ent(struct lu_orphan_ent *ent);
 
 /** @} lu_fid */
 
@@ -894,19 +420,21 @@ enum lu_dirent_attrs {
        /* The following attrs are used for MDT internal only,
         * not visible to client */
 
-       /* Verify the dirent consistency */
-       LUDA_VERIFY             = 0x8000,
-       /* Only check but not repair the dirent inconsistency */
-       LUDA_VERIFY_DRYRUN      = 0x4000,
-       /* The dirent has been repaired, or to be repaired (dryrun). */
-       LUDA_REPAIR             = 0x2000,
-       /* The system is upgraded, has beed or to be repaired (dryrun). */
-       LUDA_UPGRADE            = 0x1000,
+       /* Something in the record is unknown, to be verified in further. */
+       LUDA_UNKNOWN            = 0x0400,
        /* Ignore this record, go to next directly. */
        LUDA_IGNORE             = 0x0800,
+       /* The system is upgraded, has beed or to be repaired (dryrun). */
+       LUDA_UPGRADE            = 0x1000,
+       /* The dirent has been repaired, or to be repaired (dryrun). */
+       LUDA_REPAIR             = 0x2000,
+       /* Only check but not repair the dirent inconsistency */
+       LUDA_VERIFY_DRYRUN      = 0x4000,
+       /* Verify the dirent consistency */
+       LUDA_VERIFY             = 0x8000,
 };
 
-#define LU_DIRENT_ATTRS_MASK   0xf800
+#define LU_DIRENT_ATTRS_MASK   0xff00
 
 /**
  * Layout of readdir pages, as transmitted on wire.
@@ -980,22 +508,22 @@ enum lu_dirpage_flags {
 
 static inline struct lu_dirent *lu_dirent_start(struct lu_dirpage *dp)
 {
-        if (le32_to_cpu(dp->ldp_flags) & LDF_EMPTY)
-                return NULL;
-        else
-                return dp->ldp_entries;
+       if (__le32_to_cpu(dp->ldp_flags) & LDF_EMPTY)
+               return NULL;
+       else
+               return dp->ldp_entries;
 }
 
 static inline struct lu_dirent *lu_dirent_next(struct lu_dirent *ent)
 {
-        struct lu_dirent *next;
+       struct lu_dirent *next;
 
-        if (le16_to_cpu(ent->lde_reclen) != 0)
-                next = ((void *)ent) + le16_to_cpu(ent->lde_reclen);
-        else
-                next = NULL;
+       if (__le16_to_cpu(ent->lde_reclen) != 0)
+               next = ((void *)ent) + __le16_to_cpu(ent->lde_reclen);
+       else
+               next = NULL;
 
-        return next;
+       return next;
 }
 
 static inline size_t lu_dirent_calc_size(size_t namelen, __u16 attr)
@@ -1018,16 +546,16 @@ static inline size_t lu_dirent_calc_size(size_t namelen, __u16 attr)
  * MDS_READPAGE page size
  *
  * This is the directory page size packed in MDS_READPAGE RPC.
- * It's different than PAGE_CACHE_SIZE because the client needs to
+ * It's different than PAGE_SIZE because the client needs to
  * access the struct lu_dirpage header packed at the beginning of
  * the "page" and without this there isn't any way to know find the
- * lu_dirpage header is if client and server PAGE_CACHE_SIZE differ.
+ * lu_dirpage header is if client and server PAGE_SIZE differ.
  */
 #define LU_PAGE_SHIFT 12
 #define LU_PAGE_SIZE  (1UL << LU_PAGE_SHIFT)
 #define LU_PAGE_MASK  (~(LU_PAGE_SIZE - 1))
 
-#define LU_PAGE_COUNT (1 << (PAGE_CACHE_SHIFT - LU_PAGE_SHIFT))
+#define LU_PAGE_COUNT (1 << (PAGE_SHIFT - LU_PAGE_SHIFT))
 
 /** @} lu_dir */
 
@@ -1053,6 +581,11 @@ static inline void lustre_handle_copy(struct lustre_handle *tgt,
        tgt->cookie = src->cookie;
 }
 
+struct lustre_handle_array {
+       unsigned int            count;
+       struct lustre_handle    handles[0];
+};
+
 /* flags for lm_flags */
 #define MSGHDR_AT_SUPPORT               0x1
 #define MSGHDR_CKSUM_INCOMPAT18         0x2
@@ -1133,8 +666,6 @@ struct ptlrpc_body_v2 {
        __u64 pb_padding64_2;
 };
 
-extern void lustre_swab_ptlrpc_body(struct ptlrpc_body *pb);
-
 /* message body offset for lustre_msg_v2 */
 /* ptlrpc body offset in all request/reply messages */
 #define MSG_PTLRPC_BODY_OFF             0
@@ -1204,15 +735,19 @@ extern void lustre_swab_ptlrpc_body(struct ptlrpc_body *pb);
 #define OBD_CONNECT_TRUNCLOCK           0x400ULL /*locks on server for punch */
 #define OBD_CONNECT_TRANSNO             0x800ULL /*replay sends init transno */
 #define OBD_CONNECT_IBITS              0x1000ULL /*support for inodebits locks*/
-#define OBD_CONNECT_JOIN               0x2000ULL /*files can be concatenated.
-                                                  *We do not support JOIN FILE
-                                                  *anymore, reserve this flags
-                                                  *just for preventing such bit
-                                                  *to be reused.*/
+#define OBD_CONNECT_BARRIER           0x2000ULL /* write barrier */
 #define OBD_CONNECT_ATTRFID            0x4000ULL /*Server can GetAttr By Fid*/
 #define OBD_CONNECT_NODEVOH            0x8000ULL /*No open hndl on specl nodes*/
-#define OBD_CONNECT_RMT_CLIENT        0x10000ULL /*Remote client */
-#define OBD_CONNECT_RMT_CLIENT_FORCE  0x20000ULL /*Remote client by force */
+#define OBD_CONNECT_RMT_CLIENT        0x10000ULL /* Remote client, never used
+                                                 * in production. Removed in
+                                                 * 2.9. Keep this flag to
+                                                 * avoid reusing.
+                                                 */
+#define OBD_CONNECT_RMT_CLIENT_FORCE  0x20000ULL /* Remote client by force,
+                                                 * never used in production.
+                                                 * Removed in 2.9. Keep this
+                                                 * flag to avoid reusing.
+                                                 */
 #define OBD_CONNECT_BRW_SIZE          0x40000ULL /*Max bytes per rpc */
 #define OBD_CONNECT_QUOTA64           0x80000ULL /*Not used since 2.4 */
 #define OBD_CONNECT_MDS_CAPA         0x100000ULL /*MDS capability */
@@ -1222,7 +757,7 @@ extern void lustre_swab_ptlrpc_body(struct ptlrpc_body *pb);
 #define OBD_CONNECT_AT              0x1000000ULL /*client uses AT */
 #define OBD_CONNECT_LRU_RESIZE      0x2000000ULL /*LRU resize feature. */
 #define OBD_CONNECT_MDS_MDS         0x4000000ULL /*MDS-MDS connection */
-#define OBD_CONNECT_REAL            0x8000000ULL /*real connection */
+#define OBD_CONNECT_REAL            0x8000000ULL /* obsolete since 2.8 */
 #define OBD_CONNECT_CHANGE_QS      0x10000000ULL /*Not used since 2.4 */
 #define OBD_CONNECT_CKSUM          0x20000000ULL /*support several cksum algos*/
 #define OBD_CONNECT_FID            0x40000000ULL /*FID is supported by server */
@@ -1259,8 +794,15 @@ extern void lustre_swab_ptlrpc_body(struct ptlrpc_body *pb);
 #define OBD_CONNECT_MULTIMODRPCS 0x200000000000000ULL /* support multiple modify
                                                         RPCs in parallel */
 #define OBD_CONNECT_DIR_STRIPE  0x400000000000000ULL /* striped DNE dir */
+#define OBD_CONNECT_SUBTREE    0x800000000000000ULL /* fileset mount */
+#define OBD_CONNECT_LOCK_AHEAD  0x1000000000000000ULL /* lock ahead */
 /** bulk matchbits is sent within ptlrpc_body */
 #define OBD_CONNECT_BULK_MBITS  0x2000000000000000ULL
+#define OBD_CONNECT_OBDOPACK    0x4000000000000000ULL /* compact OUT obdo */
+#define OBD_CONNECT_FLAGS2      0x8000000000000000ULL /* second flags word */
+/* ocd_connect_flags2 flags */
+#define OBD_CONNECT2_FILE_SECCTX       0x1ULL /* set file security context at create */
+
 /* XXX README XXX:
  * Please DO NOT add flag values here before first ensuring that this same
  * flag value is not in use on some other branch.  Please clear any such
@@ -1287,16 +829,13 @@ extern void lustre_swab_ptlrpc_body(struct ptlrpc_body *pb);
 #endif
 
 #define MDT_CONNECT_SUPPORTED  (OBD_CONNECT_RDONLY | OBD_CONNECT_VERSION | \
-                                OBD_CONNECT_ACL | OBD_CONNECT_XATTR | \
-                                OBD_CONNECT_IBITS | \
-                                OBD_CONNECT_NODEVOH | OBD_CONNECT_ATTRFID | \
-                                OBD_CONNECT_CANCELSET | OBD_CONNECT_AT | \
-                                OBD_CONNECT_RMT_CLIENT | \
-                                OBD_CONNECT_RMT_CLIENT_FORCE | \
-                               OBD_CONNECT_BRW_SIZE | OBD_CONNECT_MDS_MDS | \
-                                OBD_CONNECT_FID | LRU_RESIZE_CONNECT_FLAG | \
-                                OBD_CONNECT_VBR | OBD_CONNECT_LOV_V3 | \
-                               OBD_CONNECT_FULL20 | \
+                               OBD_CONNECT_ACL | OBD_CONNECT_XATTR | \
+                               OBD_CONNECT_IBITS | OBD_CONNECT_NODEVOH | \
+                               OBD_CONNECT_ATTRFID | OBD_CONNECT_CANCELSET | \
+                               OBD_CONNECT_AT | OBD_CONNECT_BRW_SIZE | \
+                               OBD_CONNECT_MDS_MDS | OBD_CONNECT_FID | \
+                               LRU_RESIZE_CONNECT_FLAG | OBD_CONNECT_VBR | \
+                               OBD_CONNECT_LOV_V3 | OBD_CONNECT_FULL20 | \
                                OBD_CONNECT_64BITHASH | OBD_CONNECT_JOBSTATS | \
                                OBD_CONNECT_EINPROGRESS | \
                                OBD_CONNECT_LIGHTWEIGHT | OBD_CONNECT_UMASK | \
@@ -1307,31 +846,40 @@ extern void lustre_swab_ptlrpc_body(struct ptlrpc_body *pb);
                                OBD_CONNECT_OPEN_BY_FID | \
                                OBD_CONNECT_DIR_STRIPE | \
                                OBD_CONNECT_BULK_MBITS | \
-                               OBD_CONNECT_MULTIMODRPCS)
+                               OBD_CONNECT_MULTIMODRPCS | \
+                               OBD_CONNECT_SUBTREE | \
+                               OBD_CONNECT_FLAGS2)
+
+#define MDT_CONNECT_SUPPORTED2 OBD_CONNECT2_FILE_SECCTX
 
 #define OST_CONNECT_SUPPORTED  (OBD_CONNECT_SRVLOCK | OBD_CONNECT_GRANT | \
-                                OBD_CONNECT_REQPORTAL | OBD_CONNECT_VERSION | \
-                                OBD_CONNECT_TRUNCLOCK | OBD_CONNECT_INDEX | \
-                               OBD_CONNECT_BRW_SIZE | \
-                                OBD_CONNECT_CANCELSET | OBD_CONNECT_AT | \
-                                LRU_RESIZE_CONNECT_FLAG | OBD_CONNECT_CKSUM | \
-                                OBD_CONNECT_RMT_CLIENT | \
-                                OBD_CONNECT_RMT_CLIENT_FORCE | OBD_CONNECT_VBR | \
-                                OBD_CONNECT_MDS | OBD_CONNECT_SKIP_ORPHAN | \
-                                OBD_CONNECT_GRANT_SHRINK | OBD_CONNECT_FULL20 | \
-                                OBD_CONNECT_64BITHASH | OBD_CONNECT_MAXBYTES | \
-                                OBD_CONNECT_MAX_EASIZE | \
+                               OBD_CONNECT_REQPORTAL | OBD_CONNECT_VERSION | \
+                               OBD_CONNECT_TRUNCLOCK | OBD_CONNECT_INDEX | \
+                               OBD_CONNECT_BRW_SIZE | OBD_CONNECT_CANCELSET | \
+                               OBD_CONNECT_AT | LRU_RESIZE_CONNECT_FLAG | \
+                               OBD_CONNECT_CKSUM | OBD_CONNECT_VBR | \
+                               OBD_CONNECT_MDS | OBD_CONNECT_SKIP_ORPHAN | \
+                               OBD_CONNECT_GRANT_SHRINK | OBD_CONNECT_FULL20 |\
+                               OBD_CONNECT_64BITHASH | OBD_CONNECT_MAXBYTES | \
+                               OBD_CONNECT_MAX_EASIZE | \
                                OBD_CONNECT_EINPROGRESS | \
                                OBD_CONNECT_JOBSTATS | \
                                OBD_CONNECT_LIGHTWEIGHT | OBD_CONNECT_LVB_TYPE|\
                                OBD_CONNECT_LAYOUTLOCK | OBD_CONNECT_FID | \
                                OBD_CONNECT_PINGLESS | OBD_CONNECT_LFSCK | \
-                               OBD_CONNECT_BULK_MBITS)
-#define ECHO_CONNECT_SUPPORTED (0)
+                               OBD_CONNECT_BULK_MBITS | \
+                               OBD_CONNECT_GRANT_PARAM)
+#define OST_CONNECT_SUPPORTED2 0
+
+#define ECHO_CONNECT_SUPPORTED 0
+#define ECHO_CONNECT_SUPPORTED2 0
+
 #define MGS_CONNECT_SUPPORTED  (OBD_CONNECT_VERSION | OBD_CONNECT_AT | \
                                OBD_CONNECT_FULL20 | OBD_CONNECT_IMP_RECOV | \
                                OBD_CONNECT_MNE_SWAB | OBD_CONNECT_PINGLESS |\
-                               OBD_CONNECT_BULK_MBITS)
+                               OBD_CONNECT_BULK_MBITS | OBD_CONNECT_BARRIER)
+
+#define MGS_CONNECT_SUPPORTED2 0
 
 /* Features required for this version of the client to work with server */
 #define CLIENT_CONNECT_MDT_REQD (OBD_CONNECT_IBITS | OBD_CONNECT_FID | \
@@ -1348,10 +896,10 @@ struct obd_connect_data {
        __u32 ocd_index;         /* LOV index to connect to */
        __u32 ocd_brw_size;      /* Maximum BRW size in bytes */
         __u64 ocd_ibits_known;   /* inode bits this client understands */
-        __u8  ocd_blocksize;     /* log2 of the backend filesystem blocksize */
-        __u8  ocd_inodespace;    /* log2 of the per-inode space consumption */
-        __u16 ocd_grant_extent;  /* per-extent grant overhead, in 1K blocks */
-        __u32 ocd_unused;        /* also fix lustre_swab_connect */
+       __u8  ocd_grant_blkbits; /* log2 of the backend filesystem blocksize */
+       __u8  ocd_grant_inobits; /* log2 of the per-inode space consumption */
+       __u16 ocd_grant_tax_kb;  /* extent insertion overhead, in 1K blocks */
+       __u32 ocd_grant_max_blks;/* maximum number of blocks per extent */
         __u64 ocd_transno;       /* first transno from client to be replayed */
         __u32 ocd_group;         /* MDS group on OST */
         __u32 ocd_cksum_types;   /* supported checksum algorithms */
@@ -1365,7 +913,7 @@ struct obd_connect_data {
        __u16 ocd_maxmodrpcs;    /* Maximum modify RPCs in parallel */
        __u16 padding0;          /* added 2.1.0. also fix lustre_swab_connect */
        __u32 padding1;          /* added 2.1.0. also fix lustre_swab_connect */
-        __u64 padding2;          /* added 2.1.0. also fix lustre_swab_connect */
+       __u64 ocd_connect_flags2;
         __u64 padding3;          /* added 2.1.0. also fix lustre_swab_connect */
         __u64 padding4;          /* added 2.1.0. also fix lustre_swab_connect */
         __u64 padding5;          /* added 2.1.0. also fix lustre_swab_connect */
@@ -1388,16 +936,13 @@ struct obd_connect_data {
  * the matching OBD_CONNECT flag, so that can be approved and landed easily to
  * reserve the flag for future use. */
 
-
-extern void lustre_swab_connect(struct obd_connect_data *ocd);
-
 /*
  * Supported checksum algorithms. Up to 32 checksum types are supported.
  * (32-bit mask stored in obd_connect_data::ocd_cksum_types)
  * Please update DECLARE_CKSUM_NAME/OBD_CKSUM_ALL in obd.h when adding a new
  * algorithm and also the OBD_FL_CKSUM* flags.
  */
-typedef enum {
+typedef enum cksum_types {
         OBD_CKSUM_CRC32 = 0x00000001,
         OBD_CKSUM_ADLER = 0x00000002,
         OBD_CKSUM_CRC32C= 0x00000004,
@@ -1428,7 +973,8 @@ typedef enum {
        OST_QUOTACHECK = 18, /* not used since 2.4 */
         OST_QUOTACTL   = 19,
        OST_QUOTA_ADJUST_QUNIT = 20, /* not used since 2.4 */
-        OST_LAST_OPC
+       OST_LADVISE    = 21,
+       OST_LAST_OPC /* must be < 33 to avoid MDS_GETATTR */
 } ost_cmd_t;
 #define OST_FIRST_OPC  OST_REPLY
 
@@ -1484,6 +1030,7 @@ enum obdo_flags {
 /* reserved for specifying OSTs */
 #define LOV_MAGIC_SPECIFIC     (0x0BD50000 | LOV_MAGIC_MAGIC)
 #define LOV_MAGIC              LOV_MAGIC_V1
+#define LOV_MAGIC_COMP_V1      (0x0BD60000 | LOV_MAGIC_MAGIC)
 
 /*
  * magic for fully defined striping
@@ -1496,9 +1043,14 @@ enum obdo_flags {
  * depending on the case (replay uses ready striping, non-replay req uses
  * hints), so MDT replaces magic with appropriate one and now LOD can
  * easily understand what's inside -bzzz
+ *
+ * those *_DEF magics are only used on server side internally, they
+ * won't be put on wire or disk.
  */
-#define LOV_MAGIC_V1_DEF  0x0CD10BD0
-#define LOV_MAGIC_V3_DEF  0x0CD30BD0
+#define LOV_MAGIC_DEF          0x10000000
+#define LOV_MAGIC_V1_DEF       (LOV_MAGIC_DEF | LOV_MAGIC_V1)
+#define LOV_MAGIC_V3_DEF       (LOV_MAGIC_DEF | LOV_MAGIC_V3)
+#define LOV_MAGIC_COMP_V1_DEF  (LOV_MAGIC_DEF | LOV_MAGIC_COMP_V1)
 
 #define lov_pattern(pattern)           (pattern & ~LOV_PATTERN_F_MASK)
 #define lov_pattern_flags(pattern)     (pattern & LOV_PATTERN_F_MASK)
@@ -1522,73 +1074,6 @@ struct lov_mds_md_v1 {            /* LOV EA mds/wire data (little-endian) */
        struct lov_ost_data_v1 lmm_objects[0]; /* per-stripe data */
 };
 
-/**
- * Sigh, because pre-2.4 uses
- * struct lov_mds_md_v1 {
- *     ........
- *     __u64 lmm_object_id;
- *     __u64 lmm_object_seq;
- *      ......
- *      }
- * to identify the LOV(MDT) object, and lmm_object_seq will
- * be normal_fid, which make it hard to combine these conversion
- * to ostid_to FID. so we will do lmm_oi/fid conversion separately
- *
- * We can tell the lmm_oi by this way,
- * 1.8: lmm_object_id = {inode}, lmm_object_gr = 0
- * 2.1: lmm_object_id = {oid < 128k}, lmm_object_seq = FID_SEQ_NORMAL
- * 2.4: lmm_oi.f_seq = FID_SEQ_NORMAL, lmm_oi.f_oid = {oid < 128k},
- *      lmm_oi.f_ver = 0
- *
- * But currently lmm_oi/lsm_oi does not have any "real" usages,
- * except for printing some information, and the user can always
- * get the real FID from LMA, besides this multiple case check might
- * make swab more complicate. So we will keep using id/seq for lmm_oi.
- */
-
-static inline void fid_to_lmm_oi(const struct lu_fid *fid,
-                                struct ost_id *oi)
-{
-       oi->oi.oi_id = fid_oid(fid);
-       oi->oi.oi_seq = fid_seq(fid);
-}
-
-static inline void lmm_oi_set_seq(struct ost_id *oi, __u64 seq)
-{
-       oi->oi.oi_seq = seq;
-}
-
-static inline void lmm_oi_set_id(struct ost_id *oi, __u64 oid)
-{
-       oi->oi.oi_id = oid;
-}
-
-static inline __u64 lmm_oi_id(const struct ost_id *oi)
-{
-       return oi->oi.oi_id;
-}
-
-static inline __u64 lmm_oi_seq(const struct ost_id *oi)
-{
-       return oi->oi.oi_seq;
-}
-
-static inline void lmm_oi_le_to_cpu(struct ost_id *dst_oi,
-                                   const struct ost_id *src_oi)
-{
-       dst_oi->oi.oi_id = le64_to_cpu(src_oi->oi.oi_id);
-       dst_oi->oi.oi_seq = le64_to_cpu(src_oi->oi.oi_seq);
-}
-
-static inline void lmm_oi_cpu_to_le(struct ost_id *dst_oi,
-                                   const struct ost_id *src_oi)
-{
-       dst_oi->oi.oi_id = cpu_to_le64(src_oi->oi.oi_id);
-       dst_oi->oi.oi_seq = cpu_to_le64(src_oi->oi.oi_seq);
-}
-
-/* extern void lustre_swab_lov_mds_md(struct lov_mds_md *llm); */
-
 #define MAX_MD_SIZE (sizeof(struct lov_mds_md) + 4 * sizeof(struct lov_ost_data))
 #define MIN_MD_SIZE (sizeof(struct lov_mds_md) + 1 * sizeof(struct lov_ost_data))
 
@@ -1616,10 +1101,6 @@ static inline void lmm_oi_cpu_to_le(struct ost_id *dst_oi,
 #define XATTR_NAME_LFSCK_BITMAP "trusted.lfsck_bitmap"
 #define XATTR_NAME_DUMMY       "trusted.dummy"
 
-#if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(2, 8, 53, 0)
-# define XATTR_NAME_LFSCK_NAMESPACE_OLD "trusted.lfsck_namespace"
-#endif
-
 #define XATTR_NAME_LFSCK_NAMESPACE "trusted.lfsck_ns"
 #define XATTR_NAME_MAX_LEN     32 /* increase this, if there is longer name. */
 
@@ -1712,7 +1193,7 @@ lov_mds_md_max_stripe_count(size_t buf_size, __u32 lmm_magic)
 #define OBD_MD_FLXATTRLS     (0x0000002000000000ULL) /* xattr list */
 #define OBD_MD_FLXATTRRM     (0x0000004000000000ULL) /* xattr remove */
 #define OBD_MD_FLACL         (0x0000008000000000ULL) /* ACL */
-#define OBD_MD_FLRMTPERM     (0x0000010000000000ULL) /* remote permission */
+/*     OBD_MD_FLRMTPERM     (0x0000010000000000ULL) remote perm, obsolete */
 #define OBD_MD_FLMDSCAPA     (0x0000020000000000ULL) /* MDS capability */
 #define OBD_MD_FLOSSCAPA     (0x0000040000000000ULL) /* OSS capability */
 #define OBD_MD_FLCKSPLIT     (0x0000080000000000ULL) /* Check split on server */
@@ -1723,11 +1204,6 @@ lov_mds_md_max_stripe_count(size_t buf_size, __u32 lmm_magic)
                                                       * client holds the lock */
 #define OBD_MD_FLOBJCOUNT    (0x0000400000000000ULL) /* for multiple destroy */
 
-#define OBD_MD_FLRMTLSETFACL (0x0001000000000000ULL) /* lfs lsetfacl case */
-#define OBD_MD_FLRMTLGETFACL (0x0002000000000000ULL) /* lfs lgetfacl case */
-#define OBD_MD_FLRMTRSETFACL (0x0004000000000000ULL) /* lfs rsetfacl case */
-#define OBD_MD_FLRMTRGETFACL (0x0008000000000000ULL) /* lfs rgetfacl case */
-
 #define OBD_MD_FLDATAVERSION (0x0010000000000000ULL) /* iversion sum */
 #define OBD_MD_CLOSE_INTENT_EXECED (0x0020000000000000ULL) /* close intent
                                                              executed */
@@ -1758,11 +1234,6 @@ struct hsm_state_set {
        __u64   hss_clearmask;
 };
 
-extern void lustre_swab_hsm_user_state(struct hsm_user_state *hus);
-extern void lustre_swab_hsm_state_set(struct hsm_state_set *hss);
-
-extern void lustre_swab_obd_statfs (struct obd_statfs *os);
-
 /* ost_body.data values for OST_BRW */
 
 #define OBD_BRW_READ            0x01
@@ -1799,14 +1270,14 @@ struct obd_ioobj {
        __u32           ioo_bufcnt;     /* number of niobufs for this object */
 };
 
+/* NOTE: IOOBJ_MAX_BRW_BITS defines the _offset_ of the max_brw field in
+ * ioo_max_brw, NOT the maximum number of bits in PTLRPC_BULK_OPS_BITS.
+ * That said, ioo_max_brw is a 32-bit field so the limit is also 16 bits. */
 #define IOOBJ_MAX_BRW_BITS     16
-#define IOOBJ_TYPE_MASK                ((1U << IOOBJ_MAX_BRW_BITS) - 1)
 #define ioobj_max_brw_get(ioo) (((ioo)->ioo_max_brw >> IOOBJ_MAX_BRW_BITS) + 1)
 #define ioobj_max_brw_set(ioo, num)                                    \
 do { (ioo)->ioo_max_brw = ((num) - 1) << IOOBJ_MAX_BRW_BITS; } while (0)
 
-extern void lustre_swab_obd_ioobj (struct obd_ioobj *ioo);
-
 /* multiple of 8 bytes => can array */
 struct niobuf_remote {
        __u64   rnb_offset;
@@ -1814,8 +1285,6 @@ struct niobuf_remote {
        __u32   rnb_flags;
 };
 
-void lustre_swab_niobuf_remote(struct niobuf_remote *nbr);
-
 /* lock value block communicated between the filter and llite */
 
 /* OST_LVB_ERR_INIT is needed because the return code in rc is
@@ -1836,8 +1305,6 @@ struct ost_lvb_v1 {
        __u64   lvb_blocks;
 };
 
-extern void lustre_swab_ost_lvb_v1(struct ost_lvb_v1 *lvb);
-
 struct ost_lvb {
        __u64   lvb_size;
        __s64   lvb_mtime;
@@ -1850,8 +1317,6 @@ struct ost_lvb {
        __u32   lvb_padding;
 };
 
-extern void lustre_swab_ost_lvb(struct ost_lvb *lvb);
-
 /*
  *   lquota data structures
  */
@@ -1889,8 +1354,6 @@ struct obd_quotactl {
        struct obd_dqblk        qc_dqblk;
 };
 
-extern void lustre_swab_obd_quotactl(struct obd_quotactl *q);
-
 #define Q_COPY(out, in, member) (out)->member = (in)->member
 
 #define QCTL_COPY(out, in)             \
@@ -1932,8 +1395,6 @@ struct quota_body {
 #define QUOTA_DQACQ_FL_REL     0x4  /* release quota */
 #define QUOTA_DQACQ_FL_REPORT  0x8  /* report usage */
 
-extern void lustre_swab_quota_body(struct quota_body *b);
-
 /* Quota types currently supported */
 enum {
        LQUOTA_TYPE_USR = 0x00, /* maps to USRQUOTA */
@@ -2012,8 +1473,6 @@ struct lquota_lvb {
        __u64   lvb_pad1;
 };
 
-extern void lustre_swab_lquota_lvb(struct lquota_lvb *lvb);
-
 /* LVB used with global quota lock */
 #define lvb_glb_ver  lvb_id_may_rel /* current version of the global index */
 
@@ -2038,7 +1497,7 @@ typedef enum {
        MDS_READPAGE            = 37,
        MDS_CONNECT             = 38,
        MDS_DISCONNECT          = 39,
-       MDS_GETSTATUS           = 40,
+       MDS_GET_ROOT            = 40,
        MDS_STATFS              = 41,
        MDS_PIN                 = 42, /* obsolete, never used in a release */
        MDS_UNPIN               = 43, /* obsolete, never used in a release */
@@ -2091,8 +1550,6 @@ typedef enum {
         REINT_MAX
 } mds_reint_t, mdt_reint_t;
 
-extern void lustre_swab_generic_32s (__u32 *val);
-
 /* the disposition of the intent outlines what was executed */
 #define DISP_IT_EXECD        0x00000001
 #define DISP_LOOKUP_EXECD    0x00000002
@@ -2132,8 +1589,6 @@ extern void lustre_swab_generic_32s (__u32 *val);
 /* This FULL lock is useful to take on unlink sort of operations */
 #define MDS_INODELOCK_FULL ((1<<(MDS_INODELOCK_MAXSHIFT+1))-1)
 
-extern void lustre_swab_ll_fid (struct ll_fid *fid);
-
 /* NOTE: until Lustre 1.8.7/2.1.1 the fid_ver() was packed into name[2],
  * but was moved into name[1] along with the OID to avoid consuming the
  * name[2,3] fields that need to be used for the quota id (also a FID). */
@@ -2149,15 +1604,31 @@ enum {
 #define MDS_STATUS_CONN 1
 #define MDS_STATUS_LOV 2
 
-#define LUSTRE_BFLAG_UNCOMMITTED_WRITES   0x1
-
-/* these should be identical to their EXT4_*_FL counterparts, they are
- * redefined here only to avoid dragging in fs/ext4/ext4.h */
-#define LUSTRE_SYNC_FL         0x00000008 /* Synchronous updates */
-#define LUSTRE_IMMUTABLE_FL    0x00000010 /* Immutable file */
-#define LUSTRE_APPEND_FL       0x00000020 /* writes to file may only append */
-#define LUSTRE_NOATIME_FL      0x00000080 /* do not update atime */
-#define LUSTRE_DIRSYNC_FL      0x00010000 /* dirsync behaviour (dir only) */
+enum {
+       /* these should be identical to their EXT4_*_FL counterparts, they are
+        * redefined here only to avoid dragging in fs/ext4/ext4.h */
+       LUSTRE_SYNC_FL = 0x00000008, /* Synchronous updates */
+       LUSTRE_IMMUTABLE_FL = 0x00000010, /* Immutable file */
+       LUSTRE_APPEND_FL = 0x00000020, /* writes to file may only append */
+       LUSTRE_NODUMP_FL = 0x00000040, /* do not dump file */
+       LUSTRE_NOATIME_FL = 0x00000080, /* do not update atime */
+       LUSTRE_INDEX_FL = 0x00001000, /* hash-indexed directory */
+       LUSTRE_DIRSYNC_FL = 0x00010000, /* dirsync behaviour (dir only) */
+       LUSTRE_TOPDIR_FL = 0x00020000, /* Top of directory hierarchies*/
+       LUSTRE_DIRECTIO_FL = 0x00100000, /* Use direct i/o */
+       LUSTRE_INLINE_DATA_FL = 0x10000000, /* Inode has inline data. */
+
+       /* These flags will not be identical to any EXT4_*_FL counterparts,
+        * and only reserved for lustre purpose. Note: these flags might
+        * be conflict with some of EXT4 flags, so
+        * 1. these conflict flags needs to be removed when the flag is
+        * wired by la_flags see osd_attr_get().
+        * 2. If these flags needs to be stored into inode, they will be
+        * stored in LMA. see LMAI_XXXX */
+       LUSTRE_ORPHAN_FL = 0x00002000,
+
+       LUSTRE_LMA_FL_MASKS = LUSTRE_ORPHAN_FL,
+};
 
 #ifdef __KERNEL__
 /* Convert wire LUSTRE_*_FL to corresponding client local VFS S_* values
@@ -2214,7 +1685,7 @@ struct mdt_body {
        __u32   mbo_mode;
        __u32   mbo_uid;
        __u32   mbo_gid;
-       __u32   mbo_flags;
+       __u32   mbo_flags;   /* LUSTRE_*_FL file attributes */
        __u32   mbo_rdev;
        __u32   mbo_nlink; /* #bytes to read in the case of MDS_READPAGE */
        __u32   mbo_unused2; /* was "generation" until 2.4.0 */
@@ -2233,8 +1704,6 @@ struct mdt_body {
        __u64   mbo_padding_10;
 }; /* 216 */
 
-extern void lustre_swab_mdt_body (struct mdt_body *b);
-
 struct mdt_ioepoch {
        struct lustre_handle mio_handle;
        __u64 mio_unused1; /* was ioepoch */
@@ -2242,32 +1711,13 @@ struct mdt_ioepoch {
        __u32 mio_padding;
 };
 
-extern void lustre_swab_mdt_ioepoch (struct mdt_ioepoch *b);
-
 /* permissions for md_perm.mp_perm */
 enum {
         CFS_SETUID_PERM = 0x01,
         CFS_SETGID_PERM = 0x02,
         CFS_SETGRP_PERM = 0x04,
-        CFS_RMTACL_PERM = 0x08,
-        CFS_RMTOWN_PERM = 0x10
-};
-
-/* inode access permission for remote user, the inode info are omitted,
- * for client knows them. */
-struct mdt_remote_perm {
-        __u32           rp_uid;
-        __u32           rp_gid;
-        __u32           rp_fsuid;
-        __u32           rp_fsuid_h;
-        __u32           rp_fsgid;
-        __u32           rp_fsgid_h;
-        __u32           rp_access_perm; /* MAY_READ/WRITE/EXEC */
-        __u32           rp_padding;
 };
 
-extern void lustre_swab_mdt_remote_perm(struct mdt_remote_perm *p);
-
 struct mdt_rec_setattr {
         __u32           sa_opcode;
         __u32           sa_cap;
@@ -2296,8 +1746,6 @@ struct mdt_rec_setattr {
         __u32           sa_padding_5;
 };
 
-extern void lustre_swab_mdt_rec_setattr (struct mdt_rec_setattr *sa);
-
 /*
  * Attribute flags used in mdt_rec_setattr::sa_valid.
  * The kernel's #defines for ATTR_* should not be used over the network
@@ -2419,17 +1867,6 @@ struct mdt_rec_create {
         __u32           cr_padding_4;   /* rr_padding_4 */
 };
 
-static inline void set_mrc_cr_flags(struct mdt_rec_create *mrc, __u64 flags)
-{
-        mrc->cr_flags_l = (__u32)(flags & 0xFFFFFFFFUll);
-        mrc->cr_flags_h = (__u32)(flags >> 32);
-}
-
-static inline __u64 get_mrc_cr_flags(struct mdt_rec_create *mrc)
-{
-        return ((__u64)(mrc->cr_flags_l) | ((__u64)mrc->cr_flags_h << 32));
-}
-
 /* instance of mdt_reint_rec */
 struct mdt_rec_link {
         __u32           lk_opcode;
@@ -2574,8 +2011,6 @@ struct mdt_rec_reint {
        __u32           rr_padding_4; /* also fix lustre_swab_mdt_rec_reint */
 };
 
-extern void lustre_swab_mdt_rec_reint(struct mdt_rec_reint *rr);
-
 /* lmv structures */
 struct lmv_desc {
         __u32 ld_tgt_count;                /* how many MDS's */
@@ -2591,8 +2026,6 @@ struct lmv_desc {
         struct obd_uuid ld_uuid;
 };
 
-extern void lustre_swab_lmv_desc (struct lmv_desc *ld);
-
 /* LMV layout EA, and it will be stored both in master and slave object */
 struct lmv_mds_md_v1 {
        __u32 lmv_magic;
@@ -2627,7 +2060,14 @@ struct lmv_mds_md_v1 {
 #define LMV_HASH_TYPE_MASK 0x0000ffff
 
 #define LMV_HASH_FLAG_MIGRATION        0x80000000
+
+#if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(2, 10, 53, 0)
+/* Since lustre 2.8, this flag will not be needed, instead this DEAD
+ * and orphan flags will be stored in LMA (see LMAI_ORPHAN)
+ * Keep this flag just for LFSCK, because it still might meet such
+ * flag when it checks the old FS */
 #define LMV_HASH_FLAG_DEAD     0x40000000
+#endif
 #define LMV_HASH_FLAG_BAD_TYPE 0x20000000
 
 /* The striped directory has ever lost its master LMV EA, then LFSCK
@@ -2669,8 +2109,6 @@ union lmv_mds_md {
        struct lmv_user_md       lmv_user_md;
 };
 
-extern void lustre_swab_lmv_mds_md(union lmv_mds_md *lmm);
-
 static inline int lmv_mds_md_size(int stripe_count, unsigned int lmm_magic)
 {
        switch (lmm_magic) {
@@ -2687,30 +2125,26 @@ static inline int lmv_mds_md_size(int stripe_count, unsigned int lmm_magic)
 
 static inline int lmv_mds_md_stripe_count_get(const union lmv_mds_md *lmm)
 {
-       switch (le32_to_cpu(lmm->lmv_magic)) {
+       switch (__le32_to_cpu(lmm->lmv_magic)) {
        case LMV_MAGIC_V1:
-               return le32_to_cpu(lmm->lmv_md_v1.lmv_stripe_count);
+               return __le32_to_cpu(lmm->lmv_md_v1.lmv_stripe_count);
        case LMV_USER_MAGIC:
-               return le32_to_cpu(lmm->lmv_user_md.lum_stripe_count);
+               return __le32_to_cpu(lmm->lmv_user_md.lum_stripe_count);
        default:
                return -EINVAL;
        }
 }
 
-static inline int lmv_mds_md_stripe_count_set(union lmv_mds_md *lmm,
-                                             unsigned int stripe_count)
+static inline int lmv_mds_md_hash_type_get(const union lmv_mds_md *lmm)
 {
-       switch (le32_to_cpu(lmm->lmv_magic)) {
+       switch (__le32_to_cpu(lmm->lmv_magic)) {
        case LMV_MAGIC_V1:
-               lmm->lmv_md_v1.lmv_stripe_count = cpu_to_le32(stripe_count);
-               break;
+               return __le32_to_cpu(lmm->lmv_md_v1.lmv_hash_type);
        case LMV_USER_MAGIC:
-               lmm->lmv_user_md.lum_stripe_count = cpu_to_le32(stripe_count);
-               break;
+               return __le32_to_cpu(lmm->lmv_user_md.lum_hash_type);
        default:
                return -EINVAL;
        }
-       return 0;
 }
 
 enum fld_rpc_opc {
@@ -2775,8 +2209,6 @@ struct lov_desc {
 
 #define ld_magic ld_active_tgt_count       /* for swabbing from llogs */
 
-extern void lustre_swab_lov_desc (struct lov_desc *ld);
-
 /*
  *   LDLM requests:
  */
@@ -2804,14 +2236,6 @@ struct ldlm_res_id {
                        (unsigned long long)(res)->lr_name.name[2],     \
                        (unsigned long long)(res)->lr_name.name[3]
 
-extern void lustre_swab_ldlm_res_id (struct ldlm_res_id *id);
-
-static inline bool ldlm_res_eq(const struct ldlm_res_id *res0,
-                              const struct ldlm_res_id *res1)
-{
-       return memcmp(res0, res1, sizeof(*res0)) == 0;
-}
-
 /* lock types */
 typedef enum ldlm_mode {
        LCK_MINMODE     = 0,
@@ -2844,19 +2268,6 @@ struct ldlm_extent {
         __u64 gid;
 };
 
-static inline int ldlm_extent_overlap(const struct ldlm_extent *ex1,
-                                     const struct ldlm_extent *ex2)
-{
-       return ex1->start <= ex2->end && ex2->start <= ex1->end;
-}
-
-/* check if @ex1 contains @ex2 */
-static inline int ldlm_extent_contain(const struct ldlm_extent *ex1,
-                                     const struct ldlm_extent *ex2)
-{
-       return ex1->start <= ex2->start && ex1->end >= ex2->end;
-}
-
 struct ldlm_inodebits {
         __u64 bits;
 };
@@ -2881,28 +2292,51 @@ typedef union ldlm_wire_policy_data {
        struct ldlm_inodebits   l_inodebits;
 } ldlm_wire_policy_data_t;
 
-extern void lustre_swab_ldlm_policy_data(union ldlm_wire_policy_data *d);
+struct barrier_lvb {
+       __u32   lvb_status;
+       __u32   lvb_index;
+       __u64   lvb_padding;
+};
+
+struct ldlm_gl_barrier_desc {
+       __u32   lgbd_status;
+       __u32   lgbd_timeout;
+       __u64   lgbd_padding;
+};
 
 union ldlm_gl_desc {
        struct ldlm_gl_lquota_desc      lquota_desc;
+       struct ldlm_gl_barrier_desc     barrier_desc;
+};
+
+enum ldlm_intent_flags {
+       IT_OPEN        = 0x00000001,
+       IT_CREAT       = 0x00000002,
+       IT_OPEN_CREAT  = 0x00000003,
+       IT_READDIR     = 0x00000004,
+       IT_GETATTR     = 0x00000008,
+       IT_LOOKUP      = 0x00000010,
+       IT_UNLINK      = 0x00000020,
+       IT_TRUNC       = 0x00000040,
+       IT_GETXATTR    = 0x00000080,
+       IT_EXEC        = 0x00000100,
+       IT_PIN         = 0x00000200,
+       IT_LAYOUT      = 0x00000400,
+       IT_QUOTA_DQACQ = 0x00000800,
+       IT_QUOTA_CONN  = 0x00001000,
+       IT_SETXATTR    = 0x00002000,
 };
 
-extern void lustre_swab_gl_desc(union ldlm_gl_desc *);
-
 struct ldlm_intent {
-        __u64 opc;
+       __u64 opc;
 };
 
-extern void lustre_swab_ldlm_intent (struct ldlm_intent *i);
-
 struct ldlm_resource_desc {
        enum ldlm_type     lr_type;
        __u32              lr_pad; /* also fix lustre_swab_ldlm_resource_desc */
        struct ldlm_res_id lr_name;
 };
 
-extern void lustre_swab_ldlm_resource_desc (struct ldlm_resource_desc *r);
-
 struct ldlm_lock_desc {
        struct ldlm_resource_desc l_resource;
        enum ldlm_mode l_req_mode;
@@ -2910,8 +2344,6 @@ struct ldlm_lock_desc {
        union ldlm_wire_policy_data l_policy_data;
 };
 
-extern void lustre_swab_ldlm_lock_desc(struct ldlm_lock_desc *l);
-
 #define LDLM_LOCKREQ_HANDLES 2
 #define LDLM_ENQUEUE_CANCEL_OFF 1
 
@@ -2922,19 +2354,6 @@ struct ldlm_request {
         struct lustre_handle lock_handle[LDLM_LOCKREQ_HANDLES];
 };
 
-extern void lustre_swab_ldlm_request (struct ldlm_request *rq);
-
-/* If LDLM_ENQUEUE, 1 slot is already occupied, 1 is available.
- * Otherwise, 2 are available. */
-#define ldlm_request_bufsize(count,type)                                \
-({                                                                      \
-        int _avail = LDLM_LOCKREQ_HANDLES;                              \
-        _avail -= (type == LDLM_ENQUEUE ? LDLM_ENQUEUE_CANCEL_OFF : 0); \
-        sizeof(struct ldlm_request) +                                   \
-        (count > _avail ? count - _avail : 0) *                         \
-        sizeof(struct lustre_handle);                                   \
-})
-
 struct ldlm_reply {
         __u32 lock_flags;
         __u32 lock_padding;     /* also fix lustre_swab_ldlm_reply */
@@ -2944,8 +2363,6 @@ struct ldlm_reply {
         __u64  lock_policy_res2;
 };
 
-extern void lustre_swab_ldlm_reply (struct ldlm_reply *r);
-
 #define ldlm_flags_to_wire(flags)    ((__u32)(flags))
 #define ldlm_flags_from_wire(flags)  ((__u64)(flags))
 
@@ -2964,12 +2381,14 @@ typedef enum {
 } mgs_cmd_t;
 #define MGS_FIRST_OPC MGS_CONNECT
 
+#if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(2, 13, 53, 0)
 #define MGS_PARAM_MAXLEN 1024
 #define KEY_SET_INFO "set_info"
 
 struct mgs_send_param {
         char             mgs_param[MGS_PARAM_MAXLEN];
 };
+#endif
 
 /* We pass this info to the MGS so it can write config logs */
 #define MTI_NAME_MAXLEN  64
@@ -2988,7 +2407,6 @@ struct mgs_target_info {
         __u64            mti_nids[MTI_NIDS_MAX];     /* host nids (lnet_nid_t)*/
         char             mti_params[MTI_PARAM_MAXLEN];
 };
-extern void lustre_swab_mgs_target_info(struct mgs_target_info *oinfo);
 
 struct mgs_nidtbl_entry {
         __u64           mne_version;    /* table version of this entry */
@@ -3003,23 +2421,33 @@ struct mgs_nidtbl_entry {
                 lnet_nid_t nids[0];     /* variable size buffer for NIDs. */
         } u;
 };
-extern void lustre_swab_mgs_nidtbl_entry(struct mgs_nidtbl_entry *oinfo);
+
+enum {
+       CONFIG_T_CONFIG  = 0,
+       CONFIG_T_SPTLRPC = 1,
+       CONFIG_T_RECOVER = 2,
+       CONFIG_T_PARAMS  = 3,
+       CONFIG_T_NODEMAP = 4,
+       CONFIG_T_BARRIER = 5,
+       CONFIG_T_MAX
+};
 
 struct mgs_config_body {
-        char     mcb_name[MTI_NAME_MAXLEN]; /* logname */
-        __u64    mcb_offset;    /* next index of config log to request */
-        __u16    mcb_type;      /* type of log: CONFIG_T_[CONFIG|RECOVER] */
-        __u8     mcb_reserved;
-        __u8     mcb_bits;      /* bits unit size of config log */
-        __u32    mcb_units;     /* # of units for bulk transfer */
+       char     mcb_name[MTI_NAME_MAXLEN]; /* logname */
+       __u64    mcb_offset;    /* next index of config log to request */
+       __u16    mcb_type;      /* type of log: CONFIG_T_[CONFIG|RECOVER] */
+       __u8     mcb_nm_cur_pass;
+       __u8     mcb_bits;      /* bits unit size of config log */
+       __u32    mcb_units;     /* # of units for bulk transfer */
 };
-extern void lustre_swab_mgs_config_body(struct mgs_config_body *body);
 
 struct mgs_config_res {
-        __u64    mcr_offset;    /* index of last config log */
-        __u64    mcr_size;      /* size of the log */
+       __u64    mcr_offset;    /* index of last config log */
+       union {
+               __u64    mcr_size;              /* size of the log */
+               __u64    mcr_nm_cur_pass;       /* current nodemap config pass */
+       };
 };
-extern void lustre_swab_mgs_config_res(struct mgs_config_res *body);
 
 /* Config marker flags (in config log) */
 #define CM_START       0x01
@@ -3040,9 +2468,6 @@ struct cfg_marker {
        char    cm_comment[MTI_NAME_MAXLEN];
 };
 
-extern void lustre_swab_cfg_marker(struct cfg_marker *marker,
-                                   int swab, int size);
-
 /*
  * Opcodes for multiple servers.
  */
@@ -3153,12 +2578,6 @@ struct llog_rec_tail {
        (rec->lrh_len - sizeof(struct llog_rec_hdr) -           \
         sizeof(struct llog_rec_tail))
 
-static inline void *rec_tail(struct llog_rec_hdr *rec)
-{
-       return (void *)((char *)rec + rec->lrh_len -
-                       sizeof(struct llog_rec_tail));
-}
-
 struct llog_logid_rec {
        struct llog_rec_hdr     lid_hdr;
        struct llog_logid       lid_id;
@@ -3269,12 +2688,6 @@ static inline const char *agent_req_status2name(enum agent_req_status ars)
        }
 }
 
-static inline bool agent_req_in_final_state(enum agent_req_status ars)
-{
-       return ((ars == ARS_SUCCEED) || (ars == ARS_FAILED) ||
-               (ars == ARS_CANCELED));
-}
-
 struct llog_agent_req_rec {
        struct llog_rec_hdr     arr_hdr;        /**< record header */
        __u32                   arr_status;     /**< status of the request */
@@ -3333,8 +2746,10 @@ struct llog_log_hdr {
        __u32                   llh_bitmap_offset;
        __u32                   llh_size;
        __u32                   llh_flags;
+       /* for a catalog the first/oldest and still in-use plain slot is just
+        * next to it. It will serve as the upper limit after Catalog has
+        * wrapped around */
        __u32                   llh_cat_idx;
-       /* for a catalog the first plain slot is next to it */
        struct obd_uuid         llh_tgtuuid;
        __u32                   llh_reserved[LLOG_HEADER_SIZE/sizeof(__u32)-23];
        /* These fields must always be at the end of the llog_log_hdr.
@@ -3427,8 +2842,7 @@ struct obdo {
        struct lustre_handle    o_handle;       /* brw: lock handle to prolong
                                                 * locks */
        struct llog_cookie      o_lcookie;      /* destroy: unlink cookie from
-                                                * MDS, obsolete in 2.8, reused
-                                                * in OSP */
+                                                * MDS, obsolete in 2.8 */
        __u32                   o_uid_h;
        __u32                   o_gid_h;
 
@@ -3469,16 +2883,12 @@ struct lfsck_request {
        __u64           lr_padding_2;
 };
 
-void lustre_swab_lfsck_request(struct lfsck_request *lr);
-
 struct lfsck_reply {
        __u32           lr_status;
        __u32           lr_padding_1;
-       __u64           lr_padding_2;
+       __u64           lr_repaired;
 };
 
-void lustre_swab_lfsck_reply(struct lfsck_reply *lr);
-
 enum lfsck_events {
        LE_LASTID_REBUILDING    = 1,
        LE_LASTID_REBUILT       = 2,
@@ -3491,8 +2901,6 @@ enum lfsck_events {
        LE_PEER_EXIT            = 9,
        LE_CONDITIONAL_DESTROY  = 10,
        LE_PAIRS_VERIFY         = 11,
-       LE_SKIP_NLINK_DECLARE   = 13,
-       LE_SKIP_NLINK           = 14,
        LE_SET_LMV_MASTER       = 15,
        LE_SET_LMV_SLAVE        = 16,
 };
@@ -3503,58 +2911,12 @@ enum lfsck_event_flags {
        LEF_SET_LMV_HASH        = 0x00000004,
        LEF_SET_LMV_ALL         = 0x00000008,
        LEF_RECHECK_NAME_HASH   = 0x00000010,
+       LEF_QUERY_ALL           = 0x00000020,
 };
 
-static inline void lustre_set_wire_obdo(const struct obd_connect_data *ocd,
-                                       struct obdo *wobdo,
-                                       const struct obdo *lobdo)
-{
-       *wobdo = *lobdo;
-       wobdo->o_flags &= ~OBD_FL_LOCAL_MASK;
-       if (ocd == NULL)
-               return;
-
-       if (unlikely(!(ocd->ocd_connect_flags & OBD_CONNECT_FID)) &&
-           fid_seq_is_echo(ostid_seq(&lobdo->o_oi))) {
-               /* Currently OBD_FL_OSTID will only be used when 2.4 echo
-                * client communicate with pre-2.4 server */
-               wobdo->o_oi.oi.oi_id = fid_oid(&lobdo->o_oi.oi_fid);
-               wobdo->o_oi.oi.oi_seq = fid_seq(&lobdo->o_oi.oi_fid);
-       }
-}
-
-static inline void lustre_get_wire_obdo(const struct obd_connect_data *ocd,
-                                       struct obdo *lobdo,
-                                       const struct obdo *wobdo)
-{
-       __u32 local_flags = 0;
-
-        if (lobdo->o_valid & OBD_MD_FLFLAGS)
-                 local_flags = lobdo->o_flags & OBD_FL_LOCAL_MASK;
-
-       *lobdo = *wobdo;
-       if (local_flags != 0) {
-               lobdo->o_valid |= OBD_MD_FLFLAGS;
-               lobdo->o_flags &= ~OBD_FL_LOCAL_MASK;
-               lobdo->o_flags |= local_flags;
-       }
-       if (ocd == NULL)
-               return;
-
-       if (unlikely(!(ocd->ocd_connect_flags & OBD_CONNECT_FID)) &&
-           fid_seq_is_echo(wobdo->o_oi.oi.oi_seq)) {
-               /* see above */
-               lobdo->o_oi.oi_fid.f_seq = wobdo->o_oi.oi.oi_seq;
-               lobdo->o_oi.oi_fid.f_oid = wobdo->o_oi.oi.oi_id;
-               lobdo->o_oi.oi_fid.f_ver = 0;
-       }
-}
-
-extern void lustre_swab_obdo (struct obdo *o);
-
 /* request structure for OST's */
 struct ost_body {
-        struct  obdo oa;
+       struct obdo oa;
 };
 
 /* Key for FIEMAP to be used in get_info calls */
@@ -3564,35 +2926,6 @@ struct ll_fiemap_info_key {
        struct fiemap   lfik_fiemap;
 };
 
-extern void lustre_swab_ost_body (struct ost_body *b);
-extern void lustre_swab_ost_last_id(__u64 *id);
-extern void lustre_swab_fiemap(struct fiemap *fiemap);
-
-extern void lustre_swab_lov_user_md_v1(struct lov_user_md_v1 *lum);
-extern void lustre_swab_lov_user_md_v3(struct lov_user_md_v3 *lum);
-extern void lustre_swab_lov_user_md_objects(struct lov_user_ost_data *lod,
-                                            int stripe_count);
-extern void lustre_swab_lov_mds_md(struct lov_mds_md *lmm);
-void lustre_print_user_md(unsigned int level, struct lov_user_md *lum,
-                         const char *msg);
-
-/* llog_swab.c */
-extern void lustre_swab_llogd_body (struct llogd_body *d);
-extern void lustre_swab_llog_hdr (struct llog_log_hdr *h);
-extern void lustre_swab_llogd_conn_body (struct llogd_conn_body *d);
-extern void lustre_swab_llog_rec(struct llog_rec_hdr *rec);
-extern void lustre_swab_llog_id(struct llog_logid *lid);
-
-struct lustre_cfg;
-extern void lustre_swab_lustre_cfg(struct lustre_cfg *lcfg);
-
-/* Functions for dumping PTLRPC fields */
-void dump_rniobuf(struct niobuf_remote *rnb);
-void dump_ioo(struct obd_ioobj *nb);
-void dump_obdo(struct obdo *oa);
-void dump_ost_body(struct ost_body *ob);
-void dump_rcs(__u32 *rc);
-
 #define IDX_INFO_MAGIC 0x3D37CC37
 
 /* Index file transfer through the network. The server serializes the index into
@@ -3636,7 +2969,6 @@ struct idx_info {
        __u64           ii_pad2;
        __u64           ii_pad3;
 };
-extern void lustre_swab_idx_info(struct idx_info *ii);
 
 #define II_END_OFF     MDS_DIR_END_OFF /* all entries have been read */
 
@@ -3669,7 +3001,6 @@ struct lu_idxpage {
         * For the time being, we only support fixed-size key & record. */
        char    lip_entries[0];
 };
-extern void lustre_swab_lip_header(struct lu_idxpage *lip);
 
 #define LIP_HDR_SIZE (offsetof(struct lu_idxpage, lip_entries))
 
@@ -3709,8 +3040,6 @@ struct lustre_capa {
         __u8            lc_hmac[CAPA_HMAC_MAX_LEN];   /** HMAC */
 } __attribute__((packed));
 
-extern void lustre_swab_lustre_capa(struct lustre_capa *c);
-
 /** lustre_capa::lc_opc */
 enum {
         CAPA_OPC_BODY_WRITE   = 1<<0,  /**< write object data */
@@ -3736,16 +3065,6 @@ enum {
 #define CAPA_OPC_MDS_DEFAULT ~CAPA_OPC_OSS_ONLY
 #define CAPA_OPC_OSS_DEFAULT ~(CAPA_OPC_MDS_ONLY | CAPA_OPC_OSS_ONLY)
 
-static inline bool lovea_slot_is_dummy(const struct lov_ost_data_v1 *obj)
-{
-       /* zero area does not care about the bytes-order. */
-       if (obj->l_ost_oi.oi.oi_id == 0 && obj->l_ost_oi.oi.oi_seq == 0 &&
-           obj->l_ost_idx == 0 && obj->l_ost_gen == 0)
-               return true;
-
-       return false;
-}
-
 /* lustre_capa::lc_hmac_alg */
 enum {
         CAPA_HMAC_ALG_SHA1 = 1, /**< sha1 algorithm */
@@ -3762,17 +3081,14 @@ struct lustre_capa_key {
         __u8    lk_key[CAPA_HMAC_KEY_MAX_LEN];    /**< key */
 } __attribute__((packed));
 
-extern void lustre_swab_lustre_capa_key(struct lustre_capa_key *k);
-
 /** The link ea holds 1 \a link_ea_entry for each hardlink */
 #define LINK_EA_MAGIC 0x11EAF1DFUL
 struct link_ea_header {
-        __u32 leh_magic;
-        __u32 leh_reccount;
-        __u64 leh_len;      /* total size */
-        /* future use */
-        __u32 padding1;
-        __u32 padding2;
+       __u32 leh_magic;
+       __u32 leh_reccount;
+       __u64 leh_len;  /* total size */
+       __u32 leh_overflow_time;
+       __u32 leh_padding;
 };
 
 /** Hardlink data is name and parent fid.
@@ -3787,15 +3103,16 @@ struct link_ea_entry {
 
 /** fid2path request/reply structure */
 struct getinfo_fid2path {
-        struct lu_fid   gf_fid;
-        __u64           gf_recno;
-        __u32           gf_linkno;
-        __u32           gf_pathlen;
-        char            gf_path[0];
+       struct lu_fid   gf_fid;
+       __u64           gf_recno;
+       __u32           gf_linkno;
+       __u32           gf_pathlen;
+       union {
+               char            gf_path[0];
+               struct lu_fid   gf_root_fid[0];
+       } gf_u;
 } __attribute__((packed));
 
-void lustre_swab_fid2path (struct getinfo_fid2path *gf);
-
 /** path2parent request/reply structures */
 struct getparent {
        struct lu_fid   gp_fid;         /**< parent FID */
@@ -3822,8 +3139,6 @@ struct layout_intent {
        __u64 li_end;
 };
 
-void lustre_swab_layout_intent(struct layout_intent *li);
-
 /**
  * On the wire version of hsm_progress structure.
  *
@@ -3842,13 +3157,6 @@ struct hsm_progress_kernel {
        __u64                   hpk_padding2;
 } __attribute__((packed));
 
-extern void lustre_swab_hsm_user_state(struct hsm_user_state *hus);
-extern void lustre_swab_hsm_current_action(struct hsm_current_action *action);
-extern void lustre_swab_hsm_progress_kernel(struct hsm_progress_kernel *hpk);
-extern void lustre_swab_hsm_user_state(struct hsm_user_state *hus);
-extern void lustre_swab_hsm_user_item(struct hsm_user_item *hui);
-extern void lustre_swab_hsm_request(struct hsm_request *hr);
-
 /**
  * OUT_UPDATE RPC Format
  *
@@ -3920,17 +3228,11 @@ struct object_update_param {
        char    oup_buf[0];
 };
 
-static inline size_t
-object_update_param_size(const struct object_update_param *param)
-{
-       return cfs_size_round(sizeof(*param) + param->oup_len);
-}
-
 /* object update */
 struct object_update {
        __u16           ou_type;                /* enum update_type */
        __u16           ou_params_count;        /* update parameters count */
-       __u32           ou_master_index;        /* master MDT/OST index */
+       __u32           ou_result_size;         /* how many bytes can return */
        __u32           ou_flags;               /* enum update_flag */
        __u32           ou_padding1;            /* padding 1 */
        __u64           ou_batchid;             /* op transno on master */
@@ -3956,7 +3258,7 @@ struct out_update_header {
        __u32           ouh_magic;
        __u32           ouh_count;
        __u32           ouh_inline_length;
-       __u32           ouh_padding;
+       __u32           ouh_reply_size;
        __u32           ouh_inline_data[0];
 };
 
@@ -3965,57 +3267,6 @@ struct out_update_buffer {
        __u32   oub_padding;
 };
 
-void lustre_swab_object_update(struct object_update *ou);
-void lustre_swab_object_update_request(struct object_update_request *our);
-void lustre_swab_out_update_header(struct out_update_header *ouh);
-void lustre_swab_out_update_buffer(struct out_update_buffer *oub);
-
-static inline size_t
-object_update_params_size(const struct object_update *update)
-{
-       const struct object_update_param *param;
-       size_t                           total_size = 0;
-       unsigned int                     i;
-
-       param = &update->ou_params[0];
-       for (i = 0; i < update->ou_params_count; i++) {
-               size_t size = object_update_param_size(param);
-
-               param = (struct object_update_param *)((char *)param + size);
-               total_size += size;
-       }
-
-       return total_size;
-}
-
-static inline size_t
-object_update_size(const struct object_update *update)
-{
-       return offsetof(struct object_update, ou_params[0]) +
-              object_update_params_size(update);
-}
-
-static inline struct object_update *
-object_update_request_get(const struct object_update_request *our,
-                         unsigned int index, size_t *size)
-{
-       void    *ptr;
-       unsigned int i;
-
-       if (index >= our->ourq_count)
-               return NULL;
-
-       ptr = (void *)&our->ourq_updates[0];
-       for (i = 0; i < index; i++)
-               ptr += object_update_size(ptr);
-
-       if (size != NULL)
-               *size = object_update_size(ptr);
-
-       return ptr;
-}
-
-
 /* the result of object update */
 struct object_update_result {
        __u32   our_rc;
@@ -4035,36 +3286,6 @@ struct object_update_reply {
        __u16   ourp_lens[0];
 };
 
-void lustre_swab_object_update_result(struct object_update_result *our);
-void lustre_swab_object_update_reply(struct object_update_reply *our);
-
-static inline struct object_update_result *
-object_update_result_get(const struct object_update_reply *reply,
-                        unsigned int index, size_t *size)
-{
-       __u16 count = reply->ourp_count;
-       unsigned int i;
-       void *ptr;
-
-       if (index >= count)
-               return NULL;
-
-       ptr = (char *)reply +
-             cfs_size_round(offsetof(struct object_update_reply,
-                                     ourp_lens[count]));
-       for (i = 0; i < index; i++) {
-               if (reply->ourp_lens[i] == 0)
-                       return NULL;
-
-               ptr += cfs_size_round(reply->ourp_lens[i]);
-       }
-
-       if (size != NULL)
-               *size = reply->ourp_lens[index];
-
-       return ptr;
-}
-
 /* read update result */
 struct out_read_reply {
        __u32   orr_size;
@@ -4073,30 +3294,12 @@ struct out_read_reply {
        char    orr_data[0];
 };
 
-static inline void orr_cpu_to_le(struct out_read_reply *orr_dst,
-                                const struct out_read_reply *orr_src)
-{
-       orr_dst->orr_size = cpu_to_le32(orr_src->orr_size);
-       orr_dst->orr_padding = cpu_to_le32(orr_src->orr_padding);
-       orr_dst->orr_offset = cpu_to_le64(orr_dst->orr_offset);
-}
-
-static inline void orr_le_to_cpu(struct out_read_reply *orr_dst,
-                                const struct out_read_reply *orr_src)
-{
-       orr_dst->orr_size = le32_to_cpu(orr_src->orr_size);
-       orr_dst->orr_padding = le32_to_cpu(orr_src->orr_padding);
-       orr_dst->orr_offset = le64_to_cpu(orr_dst->orr_offset);
-}
-
 /** layout swap request structure
  * fid1 and fid2 are in mdt_body
  */
 struct mdc_swap_layouts {
        __u64           msl_flags;
-} __packed;
-
-void lustre_swab_swap_layouts(struct mdc_swap_layouts *msl);
+} __attribute__((packed));
 
 struct close_data {
        struct lustre_handle    cd_handle;
@@ -4105,11 +3308,6 @@ struct close_data {
        __u64                   cd_reserved[8];
 };
 
-void lustre_swab_close_data(struct close_data *data);
-
-struct update_ops;
-void lustre_swab_update_ops(struct update_ops *uops, unsigned int op_count);
-
 /* Update llog format */
 struct update_op {
        struct lu_fid   uop_fid;
@@ -4167,6 +3365,75 @@ struct llog_update_record {
        */
 };
 
+/* nodemap records, uses 32 byte record length */
+#define LUSTRE_NODEMAP_NAME_LENGTH 16
+struct nodemap_cluster_rec {
+       char    ncr_name[LUSTRE_NODEMAP_NAME_LENGTH + 1];
+       __u8    ncr_flags;
+       __u16   ncr_padding1;
+       __u32   ncr_padding2;
+       __u32   ncr_squash_uid;
+       __u32   ncr_squash_gid;
+};
+
+/* lnet_nid_t is 8 bytes */
+struct nodemap_range_rec {
+       lnet_nid_t      nrr_start_nid;
+       lnet_nid_t      nrr_end_nid;
+       __u64           nrr_padding1;
+       __u64           nrr_padding2;
+};
+
+struct nodemap_id_rec {
+       __u32   nir_id_fs;
+       __u32   nir_padding1;
+       __u64   nir_padding2;
+       __u64   nir_padding3;
+       __u64   nir_padding4;
+};
+
+struct nodemap_global_rec {
+       __u8    ngr_is_active;
+       __u8    ngr_padding1;
+       __u16   ngr_padding2;
+       __u32   ngr_padding3;
+       __u64   ngr_padding4;
+       __u64   ngr_padding5;
+       __u64   ngr_padding6;
+};
+
+union nodemap_rec {
+       struct nodemap_cluster_rec ncr;
+       struct nodemap_range_rec nrr;
+       struct nodemap_id_rec nir;
+       struct nodemap_global_rec ngr;
+};
+
+/* This is the lu_ladvise struct which goes out on the wire.
+ * Corresponds to the userspace arg llapi_lu_ladvise.
+ * value[1-4] are unspecified fields, used differently by different advices */
+struct lu_ladvise {
+       __u16 lla_advice;       /* advice type */
+       __u16 lla_value1;       /* values for different advice types */
+       __u32 lla_value2;
+       __u64 lla_start;        /* first byte of extent for advice */
+       __u64 lla_end;          /* last byte of extent for advice */
+       __u32 lla_value3;
+       __u32 lla_value4;
+};
+
+/* This is the ladvise_hdr which goes on the wire, corresponds to the userspace
+ * arg llapi_ladvise_hdr.
+ * value[1-3] are unspecified fields, used differently by different advices */
+struct ladvise_hdr {
+       __u32                   lah_magic;      /* LADVISE_MAGIC */
+       __u32                   lah_count;      /* number of advices */
+       __u64                   lah_flags;      /* from enum ladvise_flag */
+       __u32                   lah_value1;     /* unused */
+       __u32                   lah_value2;     /* unused */
+       __u64                   lah_value3;     /* unused */
+       struct lu_ladvise       lah_advise[0];  /* advices in this header */
+};
 
 #endif
 /** @} lustreidl */