Whamcloud - gitweb
LU-11838 lustre: discard LTIME_S macro
[fs/lustre-release.git] / lustre / mdc / mdc_lib.c
index db7cbb5..336761d 100644 (file)
  *
  * You should have received a copy of the GNU General Public License
  * version 2 along with this program; If not, see
- * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
- *
- * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
- * CA 95054 USA or visit www.sun.com if you need additional information or
- * have any questions.
+ * http://www.gnu.org/licenses/gpl-2.0.html
  *
  * GPL HEADER END
  */
@@ -27,7 +23,7 @@
  * Copyright (c) 2003, 2010, Oracle and/or its affiliates. All rights reserved.
  * Use is subject to license terms.
  *
- * Copyright (c) 2011, 2014, Intel Corporation.
+ * Copyright (c) 2011, 2017, Intel Corporation.
  */
 /*
  * This file is part of Lustre, http://www.lustre.org/
 # include <linux/uidgid.h>
 #endif
 #include <lustre_net.h>
-#include <lustre/lustre_idl.h>
 #include <obd_class.h>
 #include <obd.h>
 #include <cl_object.h>
 #include "mdc_internal.h"
 
+static void set_mrc_cr_flags(struct mdt_rec_create *mrc, __u64 flags)
+{
+       mrc->cr_flags_l = (__u32)(flags & 0xFFFFFFFFUll);
+       mrc->cr_flags_h = (__u32)(flags >> 32);
+}
 
 static void __mdc_pack_body(struct mdt_body *b, __u32 suppgid)
 {
@@ -116,7 +116,35 @@ static void mdc_pack_name(struct ptlrpc_request *req,
 
        cpy_len = strlcpy(buf, name, buf_size);
 
-       LASSERT(cpy_len == name_len && lu_name_is_valid_2(buf, cpy_len));
+       LASSERT(lu_name_is_valid_2(buf, cpy_len));
+       if (cpy_len != name_len)
+               CDEBUG(D_DENTRY, "%s: %s len %zd != %zd, concurrent rename?\n",
+                      req->rq_export->exp_obd->obd_name, buf, name_len,
+                      cpy_len);
+}
+
+void mdc_file_secctx_pack(struct ptlrpc_request *req, const char *secctx_name,
+                         const void *secctx, size_t secctx_size)
+{
+       void *buf;
+       size_t buf_size;
+
+       if (secctx_name == NULL)
+               return;
+
+       buf = req_capsule_client_get(&req->rq_pill, &RMF_FILE_SECCTX_NAME);
+       buf_size = req_capsule_get_size(&req->rq_pill, &RMF_FILE_SECCTX_NAME,
+                                       RCL_CLIENT);
+
+       LASSERT(buf_size == strlen(secctx_name) + 1);
+       memcpy(buf, secctx_name, buf_size);
+
+       buf = req_capsule_client_get(&req->rq_pill, &RMF_FILE_SECCTX);
+       buf_size = req_capsule_get_size(&req->rq_pill, &RMF_FILE_SECCTX,
+                                       RCL_CLIENT);
+
+       LASSERT(buf_size == secctx_size);
+       memcpy(buf, secctx, buf_size);
 }
 
 void mdc_readdir_pack(struct ptlrpc_request *req, __u64 pgoff, size_t size,
@@ -137,9 +165,9 @@ void mdc_create_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
                     const void *data, size_t datalen, umode_t mode,
                     uid_t uid, gid_t gid, cfs_cap_t cap_effective, __u64 rdev)
 {
-       struct mdt_rec_create   *rec;
-       char                    *tmp;
-       __u64                    flags;
+       struct mdt_rec_create *rec;
+       char *tmp;
+       __u64 flags;
 
        CLASSERT(sizeof(struct mdt_rec_reint) == sizeof(struct mdt_rec_create));
        rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
@@ -168,13 +196,20 @@ void mdc_create_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
                tmp = req_capsule_client_get(&req->rq_pill, &RMF_EADATA);
                memcpy(tmp, data, datalen);
        }
+
+       mdc_file_secctx_pack(req, op_data->op_file_secctx_name,
+                            op_data->op_file_secctx,
+                            op_data->op_file_secctx_size);
 }
 
 static inline __u64 mds_pack_open_flags(__u64 flags)
 {
-       __u64 cr_flags = (flags & (FMODE_READ | FMODE_WRITE |
-                                  MDS_OPEN_FL_INTERNAL));
+       __u64 cr_flags = (flags & MDS_OPEN_FL_INTERNAL);
 
+       if (flags & FMODE_READ)
+               cr_flags |= MDS_FMODE_READ;
+       if (flags & FMODE_WRITE)
+               cr_flags |= MDS_FMODE_WRITE;
        if (flags & O_CREAT)
                cr_flags |= MDS_OPEN_CREAT;
        if (flags & O_EXCL)
@@ -228,7 +263,7 @@ void mdc_open_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
                rec->cr_suppgid1   = op_data->op_suppgids[0];
                rec->cr_suppgid2   = op_data->op_suppgids[1];
                rec->cr_bias       = op_data->op_bias;
-               rec->cr_old_handle = op_data->op_handle;
+               rec->cr_open_handle_old = op_data->op_open_handle;
 
                if (op_data->op_name) {
                        mdc_pack_name(req, &RMF_NAME, op_data->op_name,
@@ -237,6 +272,10 @@ void mdc_open_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
                        if (op_data->op_bias & MDS_CREATE_VOLATILE)
                                cr_flags |= MDS_OPEN_VOLATILE;
                }
+
+               mdc_file_secctx_pack(req, op_data->op_file_secctx_name,
+                                    op_data->op_file_secctx,
+                                    op_data->op_file_secctx_size);
        }
 
        if (lmm) {
@@ -247,8 +286,9 @@ void mdc_open_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
        set_mrc_cr_flags(rec, cr_flags);
 }
 
-static inline __u64 attr_pack(unsigned int ia_valid) {
-        __u64 sa_valid = 0;
+static inline u64 attr_pack(unsigned int ia_valid, enum op_xvalid ia_xvalid)
+{
+       u64 sa_valid = 0;
 
         if (ia_valid & ATTR_MODE)
                 sa_valid |= MDS_ATTR_MODE;
@@ -270,21 +310,27 @@ static inline __u64 attr_pack(unsigned int ia_valid) {
                 sa_valid |= MDS_ATTR_MTIME_SET;
         if (ia_valid & ATTR_FORCE)
                 sa_valid |= MDS_ATTR_FORCE;
-        if (ia_valid & ATTR_ATTR_FLAG)
-                sa_valid |= MDS_ATTR_ATTR_FLAG;
-        if (ia_valid & ATTR_KILL_SUID)
-                sa_valid |=  MDS_ATTR_KILL_SUID;
-        if (ia_valid & ATTR_KILL_SGID)
-                sa_valid |= MDS_ATTR_KILL_SGID;
-        if (ia_valid & ATTR_CTIME_SET)
-                sa_valid |= MDS_ATTR_CTIME_SET;
-        if (ia_valid & ATTR_FROM_OPEN)
-                sa_valid |= MDS_ATTR_FROM_OPEN;
-        if (ia_valid & ATTR_BLOCKS)
-                sa_valid |= MDS_ATTR_BLOCKS;
-        if (ia_valid & MDS_OPEN_OWNEROVERRIDE)
-                /* NFSD hack (see bug 5781) */
-                sa_valid |= MDS_OPEN_OWNEROVERRIDE;
+       if (ia_xvalid & OP_XVALID_FLAGS)
+               sa_valid |= MDS_ATTR_ATTR_FLAG;
+       if (ia_valid & ATTR_KILL_SUID)
+               sa_valid |=  MDS_ATTR_KILL_SUID;
+       if (ia_valid & ATTR_KILL_SGID)
+               sa_valid |= MDS_ATTR_KILL_SGID;
+       if (ia_xvalid & OP_XVALID_CTIME_SET)
+               sa_valid |= MDS_ATTR_CTIME_SET;
+       if (ia_valid & ATTR_OPEN)
+               sa_valid |= MDS_ATTR_FROM_OPEN;
+       if (ia_xvalid & OP_XVALID_BLOCKS)
+               sa_valid |= MDS_ATTR_BLOCKS;
+       if (ia_xvalid & OP_XVALID_OWNEROVERRIDE)
+               /* NFSD hack (see bug 5781) */
+               sa_valid |= MDS_OPEN_OWNEROVERRIDE;
+       if (ia_xvalid & OP_XVALID_PROJID)
+               sa_valid |= MDS_ATTR_PROJID;
+       if (ia_xvalid & OP_XVALID_LAZYSIZE)
+               sa_valid |= MDS_ATTR_LSIZE;
+       if (ia_xvalid & OP_XVALID_LAZYBLOCKS)
+               sa_valid |= MDS_ATTR_LBLOCKS;
         return sa_valid;
 }
 
@@ -298,15 +344,17 @@ static void mdc_setattr_pack_rec(struct mdt_rec_setattr *rec,
        rec->sa_suppgid = -1;
 
        rec->sa_fid    = op_data->op_fid1;
-       rec->sa_valid  = attr_pack(op_data->op_attr.ia_valid);
+       rec->sa_valid  = attr_pack(op_data->op_attr.ia_valid,
+                                  op_data->op_xvalid);
        rec->sa_mode   = op_data->op_attr.ia_mode;
        rec->sa_uid    = from_kuid(&init_user_ns, op_data->op_attr.ia_uid);
        rec->sa_gid    = from_kgid(&init_user_ns, op_data->op_attr.ia_gid);
+       rec->sa_projid = op_data->op_projid;
        rec->sa_size   = op_data->op_attr.ia_size;
        rec->sa_blocks = op_data->op_attr_blocks;
-       rec->sa_atime  = LTIME_S(op_data->op_attr.ia_atime);
-       rec->sa_mtime  = LTIME_S(op_data->op_attr.ia_mtime);
-       rec->sa_ctime  = LTIME_S(op_data->op_attr.ia_ctime);
+       rec->sa_atime = op_data->op_attr.ia_atime.tv_sec;
+       rec->sa_mtime = op_data->op_attr.ia_mtime.tv_sec;
+       rec->sa_ctime = op_data->op_attr.ia_ctime.tv_sec;
        rec->sa_attr_flags = op_data->op_attr_flags;
        if ((op_data->op_attr.ia_valid & ATTR_GID) &&
             in_group_p(op_data->op_attr.ia_gid))
@@ -321,7 +369,7 @@ static void mdc_setattr_pack_rec(struct mdt_rec_setattr *rec,
 static void mdc_ioepoch_pack(struct mdt_ioepoch *epoch,
                             struct md_op_data *op_data)
 {
-       epoch->mio_handle = op_data->op_handle;
+       epoch->mio_open_handle = op_data->op_open_handle;
        epoch->mio_unused1 = 0;
        epoch->mio_unused2 = 0;
        epoch->mio_padding = 0;
@@ -330,25 +378,26 @@ static void mdc_ioepoch_pack(struct mdt_ioepoch *epoch,
 void mdc_setattr_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
                      void *ea, size_t ealen)
 {
-        struct mdt_rec_setattr *rec;
-        struct lov_user_md *lum = NULL;
+       struct mdt_rec_setattr *rec;
+       struct lov_user_md *lum = NULL;
 
-        CLASSERT(sizeof(struct mdt_rec_reint) ==sizeof(struct mdt_rec_setattr));
-        rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
-        mdc_setattr_pack_rec(rec, op_data);
+       CLASSERT(sizeof(struct mdt_rec_reint) ==
+                sizeof(struct mdt_rec_setattr));
+       rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
+       mdc_setattr_pack_rec(rec, op_data);
 
-        if (ealen == 0)
-                return;
+       if (ealen == 0)
+               return;
 
-        lum = req_capsule_client_get(&req->rq_pill, &RMF_EADATA);
-        if (ea == NULL) { /* Remove LOV EA */
+       lum = req_capsule_client_get(&req->rq_pill, &RMF_EADATA);
+       if (ea == NULL) { /* Remove LOV EA */
                lum->lmm_magic = cpu_to_le32(LOV_USER_MAGIC_V1);
-                lum->lmm_stripe_size = 0;
-                lum->lmm_stripe_count = 0;
-                lum->lmm_stripe_offset = (typeof(lum->lmm_stripe_offset))(-1);
-        } else {
-                memcpy(lum, ea, ealen);
-        }
+               lum->lmm_stripe_size = 0;
+               lum->lmm_stripe_count = 0;
+               lum->lmm_stripe_offset = (typeof(lum->lmm_stripe_offset))(-1);
+       } else {
+               memcpy(lum, ea, ealen);
+       }
 }
 
 void mdc_unlink_pack(struct ptlrpc_request *req, struct md_op_data *op_data)
@@ -397,15 +446,14 @@ void mdc_link_pack(struct ptlrpc_request *req, struct md_op_data *op_data)
        mdc_pack_name(req, &RMF_NAME, op_data->op_name, op_data->op_namelen);
 }
 
-static void mdc_intent_close_pack(struct ptlrpc_request *req,
+static void mdc_close_intent_pack(struct ptlrpc_request *req,
                                  struct md_op_data *op_data)
 {
        struct close_data       *data;
        struct ldlm_lock        *lock;
        enum mds_op_bias         bias = op_data->op_bias;
 
-       if (!(bias & (MDS_HSM_RELEASE | MDS_CLOSE_LAYOUT_SWAP |
-                     MDS_RENAME_MIGRATE)))
+       if (!(bias & (MDS_CLOSE_INTENT | MDS_CLOSE_MIGRATE)))
                return;
 
        data = req_capsule_client_get(&req->rq_pill, &RMF_CLOSE_DATA);
@@ -420,44 +468,87 @@ static void mdc_intent_close_pack(struct ptlrpc_request *req,
 
        data->cd_data_version = op_data->op_data_version;
        data->cd_fid = op_data->op_fid2;
+
+       if (bias & MDS_CLOSE_LAYOUT_SPLIT) {
+               data->cd_mirror_id = op_data->op_mirror_id;
+       } else if (bias & MDS_CLOSE_RESYNC_DONE) {
+               struct close_data_resync_done *sync = &data->cd_resync;
+
+               CLASSERT(sizeof(data->cd_resync) <= sizeof(data->cd_reserved));
+               sync->resync_count = op_data->op_data_size / sizeof(__u32);
+               if (sync->resync_count <= INLINE_RESYNC_ARRAY_SIZE) {
+                       memcpy(sync->resync_ids_inline, op_data->op_data,
+                              op_data->op_data_size);
+               } else {
+                       size_t count = sync->resync_count;
+
+                       memcpy(req_capsule_client_get(&req->rq_pill, &RMF_U32),
+                               op_data->op_data, count * sizeof(__u32));
+               }
+       }
 }
 
 void mdc_rename_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
                     const char *old, size_t oldlen,
                     const char *new, size_t newlen)
 {
-        struct mdt_rec_rename *rec;
+       struct mdt_rec_rename *rec;
 
-        CLASSERT(sizeof(struct mdt_rec_reint) == sizeof(struct mdt_rec_rename));
-        rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
+       CLASSERT(sizeof(struct mdt_rec_reint) == sizeof(struct mdt_rec_rename));
+       rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
 
-        /* XXX do something about time, uid, gid */
-       rec->rn_opcode  = op_data->op_cli_flags & CLI_MIGRATE ?
-                                       REINT_MIGRATE : REINT_RENAME;
-        rec->rn_fsuid    = op_data->op_fsuid;
-        rec->rn_fsgid    = op_data->op_fsgid;
-        rec->rn_cap      = op_data->op_cap;
-        rec->rn_suppgid1 = op_data->op_suppgids[0];
-        rec->rn_suppgid2 = op_data->op_suppgids[1];
-        rec->rn_fid1     = op_data->op_fid1;
-        rec->rn_fid2     = op_data->op_fid2;
-        rec->rn_time     = op_data->op_mod_time;
-        rec->rn_mode     = op_data->op_mode;
-        rec->rn_bias     = op_data->op_bias;
+       /* XXX do something about time, uid, gid */
+       rec->rn_opcode   = REINT_RENAME;
+       rec->rn_fsuid    = op_data->op_fsuid;
+       rec->rn_fsgid    = op_data->op_fsgid;
+       rec->rn_cap      = op_data->op_cap;
+       rec->rn_suppgid1 = op_data->op_suppgids[0];
+       rec->rn_suppgid2 = op_data->op_suppgids[1];
+       rec->rn_fid1     = op_data->op_fid1;
+       rec->rn_fid2     = op_data->op_fid2;
+       rec->rn_time     = op_data->op_mod_time;
+       rec->rn_mode     = op_data->op_mode;
+       rec->rn_bias     = op_data->op_bias;
 
        mdc_pack_name(req, &RMF_NAME, old, oldlen);
 
        if (new != NULL)
                mdc_pack_name(req, &RMF_SYMTGT, new, newlen);
+}
 
-       if (op_data->op_cli_flags & CLI_MIGRATE &&
-           op_data->op_bias & MDS_RENAME_MIGRATE) {
+void mdc_migrate_pack(struct ptlrpc_request *req, struct md_op_data *op_data,
+                     const char *name, size_t namelen)
+{
+       struct mdt_rec_rename *rec;
+       char *ea;
+
+       CLASSERT(sizeof(struct mdt_rec_reint) == sizeof(struct mdt_rec_rename));
+       rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
+
+       rec->rn_opcode   = REINT_MIGRATE;
+       rec->rn_fsuid    = op_data->op_fsuid;
+       rec->rn_fsgid    = op_data->op_fsgid;
+       rec->rn_cap      = op_data->op_cap;
+       rec->rn_suppgid1 = op_data->op_suppgids[0];
+       rec->rn_suppgid2 = op_data->op_suppgids[1];
+       rec->rn_fid1     = op_data->op_fid1;
+       rec->rn_fid2     = op_data->op_fid4;
+       rec->rn_time     = op_data->op_mod_time;
+       rec->rn_mode     = op_data->op_mode;
+       rec->rn_bias     = op_data->op_bias;
+
+       mdc_pack_name(req, &RMF_NAME, name, namelen);
+
+       if (op_data->op_bias & MDS_CLOSE_MIGRATE) {
                struct mdt_ioepoch *epoch;
 
-               mdc_intent_close_pack(req, op_data);
+               mdc_close_intent_pack(req, op_data);
                epoch = req_capsule_client_get(&req->rq_pill, &RMF_MDT_EPOCH);
                mdc_ioepoch_pack(epoch, op_data);
        }
+
+       ea = req_capsule_client_get(&req->rq_pill, &RMF_EADATA);
+       memcpy(ea, op_data->op_data, op_data->op_data_size);
 }
 
 void mdc_getattr_pack(struct ptlrpc_request *req, __u64 valid, __u32 flags,
@@ -467,8 +558,6 @@ void mdc_getattr_pack(struct ptlrpc_request *req, __u64 valid, __u32 flags,
                                                     &RMF_MDT_BODY);
 
        b->mbo_valid = valid;
-       if (op_data->op_bias & MDS_CHECK_SPLIT)
-               b->mbo_valid |= OBD_MD_FLCKSPLIT;
        if (op_data->op_bias & MDS_CROSS_REF)
                b->mbo_valid |= OBD_MD_FLCROSSREF;
        b->mbo_eadatasize = ea_size;
@@ -486,13 +575,25 @@ void mdc_getattr_pack(struct ptlrpc_request *req, __u64 valid, __u32 flags,
 
 void mdc_close_pack(struct ptlrpc_request *req, struct md_op_data *op_data)
 {
-        struct mdt_ioepoch *epoch;
-        struct mdt_rec_setattr *rec;
+       struct mdt_ioepoch *epoch;
+       struct mdt_rec_setattr *rec;
 
-        epoch = req_capsule_client_get(&req->rq_pill, &RMF_MDT_EPOCH);
-        rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
+       epoch = req_capsule_client_get(&req->rq_pill, &RMF_MDT_EPOCH);
+       rec = req_capsule_client_get(&req->rq_pill, &RMF_REC_REINT);
 
-        mdc_setattr_pack_rec(rec, op_data);
-        mdc_ioepoch_pack(epoch, op_data);
-       mdc_intent_close_pack(req, op_data);
+       mdc_setattr_pack_rec(rec, op_data);
+       /*
+        * The client will zero out local timestamps when losing the IBITS lock
+        * so any new RPC timestamps will update the client inode's timestamps.
+        * There was a defect on the server side which allowed the atime to be
+        * overwritten by a zeroed-out atime packed into the close RPC.
+        *
+        * Proactively clear the MDS_ATTR_ATIME flag in the RPC in this case
+        * to avoid zeroing the atime on old unpatched servers.  See LU-8041.
+        */
+       if (rec->sa_atime == 0)
+               rec->sa_valid &= ~MDS_ATTR_ATIME;
+
+       mdc_ioepoch_pack(epoch, op_data);
+       mdc_close_intent_pack(req, op_data);
 }