Whamcloud - gitweb
- make HEAD from b_post_cmd3
[fs/lustre-release.git] / lustre / mdc / mdc_reint.c
index 1fbd346..63bbb0c 100644 (file)
  *
  * Copyright (C) 2001-2003 Cluster File Systems, Inc.
  *
- *   This file is part of Lustre, http://www.sf.net/projects/lustre/
+ *   This file is part of the Lustre file system, http://www.lustre.org
+ *   Lustre is a trademark of Cluster File Systems, Inc.
  *
- *   Lustre is free software; you can redistribute it and/or
- *   modify it under the terms of version 2 of the GNU General Public
- *   License as published by the Free Software Foundation.
+ *   You may have signed or agreed to another license before downloading
+ *   this software.  If so, you are bound by the terms and conditions
+ *   of that agreement, and the following does not apply to you.  See the
+ *   LICENSE file included with this distribution for more information.
  *
- *   Lustre is distributed in the hope that it will be useful,
- *   but WITHOUT ANY WARRANTY; without even the implied warranty of
- *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
- *   GNU General Public License for more details.
+ *   If you did not agree to a different license, then this copy of Lustre
+ *   is open source software; you can redistribute it and/or modify it
+ *   under the terms of version 2 of the GNU General Public License as
+ *   published by the Free Software Foundation.
  *
- *   You should have received a copy of the GNU General Public License
- *   along with Lustre; if not, write to the Free Software
- *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
+ *   In either case, Lustre is distributed in the hope that it will be
+ *   useful, but WITHOUT ANY WARRANTY; without even the implied warranty
+ *   of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+ *   license text for more details.
  */
 
-#define EXPORT_SYMTAB
-
-#include <linux/config.h>
-#include <linux/module.h>
-#include <linux/kernel.h>
-
+#ifndef EXPORT_SYMTAB
+# define EXPORT_SYMTAB
+#endif
 #define DEBUG_SUBSYSTEM S_MDC
 
-#include <linux/obd_class.h>
-#include <linux/lustre_mds.h>
-
-extern struct semaphore mdc_sem;
-
-static int mdc_reint(struct ptlrpc_request *request, int level)
+#ifdef __KERNEL__
+#ifdef HAVE_KERNEL_CONFIG_H
+# include <linux/config.h>
+#endif
+# include <linux/module.h>
+# include <linux/kernel.h>
+#else
+# include <liblustre.h>
+#endif
+
+#include <obd_class.h>
+#include "mdc_internal.h"
+
+/* mdc_setattr does its own semaphore handling */
+static int mdc_reint(struct ptlrpc_request *request,
+                     struct mdc_rpc_lock *rpc_lock, int level)
 {
         int rc;
-        __u32 *opcodeptr = lustre_msg_buf(request->rq_reqmsg, 0);
 
-        request->rq_level = level;
-
-        if (!(*opcodeptr == REINT_SETATTR))
-                mdc_get_rpc_lock(&mdc_rpc_lock, NULL);
+        request->rq_send_state = level;
 
+        mdc_get_rpc_lock(rpc_lock, NULL);
         rc = ptlrpc_queue_wait(request);
-        if (!(*opcodeptr == REINT_SETATTR))
-                mdc_put_rpc_lock(&mdc_rpc_lock, NULL);
-
-        if (rc) {
+        mdc_put_rpc_lock(rpc_lock, NULL);
+        if (rc)
                 CDEBUG(D_INFO, "error in handling %d\n", rc);
-        } else {
-                /* For future resend/replays. */
-                *opcodeptr |= REINT_REPLAYING;
+        else if (!lustre_swab_repbuf(request, REPLY_REC_OFF,
+                                     sizeof(struct mdt_body),
+                                     lustre_swab_mdt_body)) {
+                CERROR ("Can't unpack mdt_body\n");
+                rc = -EPROTO;
         }
         return rc;
 }
 
-int mdc_setattr(struct lustre_handle *conn, struct inode *inode,
-                struct iattr *iattr, void *ea, int ealen,
+/* If mdc_setattr is called with an 'iattr', then it is a normal RPC that
+ * should take the normal semaphore and go to the normal portal.
+ *
+ * If it is called with iattr->ia_valid & ATTR_FROM_OPEN, then it is a
+ * magic open-path setattr that should take the setattr semaphore and
+ * go to the setattr portal. */
+int mdc_setattr(struct obd_export *exp, struct md_op_data *op_data,
+                void *ea, int ealen, void *ea2, int ea2len,
                 struct ptlrpc_request **request)
 {
         struct ptlrpc_request *req;
-        struct mds_rec_setattr *rec;
-        int rc, bufcount = 1, size[2] = {sizeof(*rec), ealen};
+        struct mdt_rec_setattr *rec;
+        struct mdc_rpc_lock *rpc_lock;
+        struct obd_device *obd = exp->exp_obd;
+        int size[6] = { sizeof(struct ptlrpc_body),
+                        sizeof(*rec), 0, 0, ealen, ea2len };
+        int bufcount = 4, rc;
         ENTRY;
 
-        if (ealen > 0)
-                bufcount = 2;
+        LASSERT(op_data != NULL);
+
+        size[REQ_REC_OFF + 1] = op_data->op_capa1 ?
+                                        sizeof(struct lustre_capa) : 0;
+
+        if (op_data->op_flags & (MF_SOM_CHANGE | MF_EPOCH_OPEN))
+                size[REQ_REC_OFF + 2] = sizeof(struct mdt_epoch);
+
+        if (ealen > 0) {
+                bufcount++;
+                if (ea2len > 0)
+                        bufcount++;
+        }
 
-        req = ptlrpc_prep_req(class_conn2cliimp(conn), MDS_REINT, bufcount,
-                              size, NULL);
-        if (!req)
+        req = ptlrpc_prep_req(class_exp2cliimp(exp), LUSTRE_MDS_VERSION,
+                              MDS_REINT, bufcount, size, NULL);
+        if (req == NULL)
                 RETURN(-ENOMEM);
 
-        /* XXX FIXME bug 249 */
-        req->rq_request_portal = MDS_GETATTR_PORTAL;
+        if (op_data->op_attr.ia_valid & ATTR_FROM_OPEN) {
+                req->rq_request_portal = MDS_SETATTR_PORTAL; //XXX FIXME bug 249
+                rpc_lock = obd->u.cli.cl_setattr_lock;
+        } else {
+                rpc_lock = obd->u.cli.cl_rpc_lock;
+        }
 
-        mds_setattr_pack(req, inode, iattr, ea, ealen);
+        if (op_data->op_attr.ia_valid & (ATTR_MTIME | ATTR_CTIME))
+                CDEBUG(D_INODE, "setting mtime %lu, ctime %lu\n",
+                       LTIME_S(op_data->op_attr.ia_mtime),
+                       LTIME_S(op_data->op_attr.ia_ctime));
+        mdc_setattr_pack(req, REQ_REC_OFF, op_data, ea, ealen, ea2, ea2len);
 
-        size[0] = sizeof(struct mds_body);
-        req->rq_replen = lustre_msg_size(1, size);
+        size[REPLY_REC_OFF] = sizeof(struct mdt_body);
+        size[REPLY_REC_OFF + 1] = sizeof(struct lustre_capa);
+        ptlrpc_req_set_repsize(req, 3, size);
 
-        rc = mdc_reint(req, LUSTRE_CONN_FULL);
+        rc = mdc_reint(req, rpc_lock, LUSTRE_IMP_FULL);
         *request = req;
         if (rc == -ERESTARTSYS)
                 rc = 0;
@@ -88,99 +125,146 @@ int mdc_setattr(struct lustre_handle *conn, struct inode *inode,
         RETURN(rc);
 }
 
-int mdc_create(struct lustre_handle *conn, struct inode *dir,
-               const char *name, int namelen, const void *data, int datalen,
-               int mode, __u32 uid, __u32 gid, __u64 time, __u64 rdev,
-               struct ptlrpc_request **request)
+int mdc_create(struct obd_export *exp, struct md_op_data *op_data,
+               const void *data, int datalen, int mode, __u32 uid, __u32 gid,
+               __u32 cap_effective, __u64 rdev, struct ptlrpc_request **request)
 {
+        int size[5] = { sizeof(struct ptlrpc_body),
+                        sizeof(struct mdt_rec_create),
+                        0, op_data->op_namelen + 1 };
+        struct obd_device *obd = exp->exp_obd;
+        int level, bufcount = 4, rc;
         struct ptlrpc_request *req;
-        int rc, size[3] = {sizeof(struct mds_rec_create), namelen + 1, 0};
-        int level, bufcount = 2;
         ENTRY;
 
+        /* For case if upper layer did not alloc fid, do it now. */
+        if (!fid_is_sane(&op_data->op_fid2)) {
+                /*
+                 * mdc_fid_alloc() may return errno 1 in case of switch to new
+                 * sequence, handle this.
+                 */
+                rc = mdc_fid_alloc(exp, &op_data->op_fid2, op_data);
+                if (rc < 0) {
+                        CERROR("Can't alloc new fid, rc %d\n", rc);
+                        RETURN(rc);
+                }
+        }
+
+        size[REQ_REC_OFF + 1] = op_data->op_capa1 ?
+                sizeof(struct lustre_capa) : 0;
+        
         if (data && datalen) {
                 size[bufcount] = datalen;
                 bufcount++;
         }
 
-        req = ptlrpc_prep_req(class_conn2cliimp(conn), MDS_REINT, bufcount,
-                              size, NULL);
-        if (!req)
+        req = ptlrpc_prep_req(class_exp2cliimp(exp), LUSTRE_MDS_VERSION,
+                              MDS_REINT, bufcount, size, NULL);
+        if (req == NULL)
                 RETURN(-ENOMEM);
 
-        /* mds_create_pack fills msg->bufs[1] with name
-         * and msg->bufs[2] with tgt, for symlinks or lov MD data */
-        mds_create_pack(req, 0, dir, mode, rdev, uid, gid, time,
-                        name, namelen, data, datalen);
+        /*
+         * mdc_create_pack() fills msg->bufs[1] with name and msg->bufs[2] with
+         * tgt, for symlinks or lov MD data.
+         */
+        mdc_create_pack(req, REQ_REC_OFF, op_data, data, datalen, mode, uid,
+                        gid, cap_effective, rdev);
 
-        size[0] = sizeof(struct mds_body);
-        req->rq_replen = lustre_msg_size(1, size);
+        size[REPLY_REC_OFF] = sizeof(struct mdt_body);
+        size[REPLY_REC_OFF + 1] = sizeof(struct lustre_capa);
+        ptlrpc_req_set_repsize(req, 3, size);
 
-        level = LUSTRE_CONN_FULL;
+        level = LUSTRE_IMP_FULL;
  resend:
-        rc = mdc_reint(req, level);
+        rc = mdc_reint(req, obd->u.cli.cl_rpc_lock, level);
+        
         /* Resend if we were told to. */
         if (rc == -ERESTARTSYS) {
-                level = LUSTRE_CONN_RECOVD;
-                req->rq_flags = 0;
+                level = LUSTRE_IMP_RECOVER;
                 goto resend;
+        } else if (rc == 0) {
+                struct mdt_body *body;
+                struct lustre_capa *capa;
+
+                body = lustre_msg_buf(req->rq_repmsg, REPLY_REC_OFF,
+                                      sizeof(*body));
+                LASSERT(body);
+                if (body->valid & OBD_MD_FLMDSCAPA) {
+                        capa = lustre_unpack_capa(req->rq_repmsg,
+                                                  REPLY_REC_OFF + 1);
+                        if (capa == NULL) {
+                                CERROR("Missing/short MDS capability\n");
+                                rc = -EPROTO;
+                        }
+                }
         }
 
-        if (!rc)
-                mdc_store_inode_generation(req, 0, 0);
-
         *request = req;
         RETURN(rc);
 }
 
-int mdc_unlink(struct lustre_handle *conn, struct inode *dir,
-               struct inode *child, __u32 mode, const char *name, int namelen,
+int mdc_unlink(struct obd_export *exp, struct md_op_data *op_data,
                struct ptlrpc_request **request)
 {
-        struct obd_device *obddev = class_conn2obd(conn);
+        struct obd_device *obd = class_exp2obd(exp);
         struct ptlrpc_request *req = *request;
-        int rc, size[2] = {sizeof(struct mds_rec_unlink), namelen + 1};
+        int size[4] = { sizeof(struct ptlrpc_body),
+                        sizeof(struct mdt_rec_unlink),
+                        0, op_data->op_namelen + 1 };
+        int rc;
         ENTRY;
 
         LASSERT(req == NULL);
 
-        req = ptlrpc_prep_req(class_conn2cliimp(conn), MDS_REINT, 2, size,
-                              NULL);
-        if (!req)
+        size[REQ_REC_OFF + 1] = op_data->op_capa1 ?
+                                        sizeof(struct lustre_capa) : 0;
+
+        req = ptlrpc_prep_req(class_exp2cliimp(exp), LUSTRE_MDS_VERSION,
+                              MDS_REINT, 4, size, NULL);
+        if (req == NULL)
                 RETURN(-ENOMEM);
         *request = req;
 
-        size[0] = sizeof(struct mds_body);
-        size[1] = obddev->u.cli.cl_max_mds_easize;
-        req->rq_replen = lustre_msg_size(2, size);
+        size[REPLY_REC_OFF] = sizeof(struct mdt_body);
+        size[REPLY_REC_OFF + 1] = obd->u.cli.cl_max_mds_easize;
+        size[REPLY_REC_OFF + 2] = obd->u.cli.cl_max_mds_cookiesize;
+        ptlrpc_req_set_repsize(req, 4, size);
 
-        mds_unlink_pack(req, 0, dir, child, mode, name, namelen);
+        mdc_unlink_pack(req, REQ_REC_OFF, op_data);
 
-        rc = mdc_reint(req, LUSTRE_CONN_FULL);
+        rc = mdc_reint(req, obd->u.cli.cl_rpc_lock, LUSTRE_IMP_FULL);
         if (rc == -ERESTARTSYS)
                 rc = 0;
         RETURN(rc);
 }
 
-int mdc_link(struct lustre_handle *conn,
-             struct inode *src, struct inode *dir, const char *name,
-             int namelen, struct ptlrpc_request **request)
+int mdc_link(struct obd_export *exp, struct md_op_data *op_data,
+             struct ptlrpc_request **request)
 {
+        struct obd_device *obd = exp->exp_obd;
         struct ptlrpc_request *req;
-        int rc, size[2] = {sizeof(struct mds_rec_link), namelen + 1};
+        int size[5] = { sizeof(struct ptlrpc_body),
+                        sizeof(struct mdt_rec_link),
+                        0, 0, op_data->op_namelen + 1 };
+        int rc;
         ENTRY;
 
-        req = ptlrpc_prep_req(class_conn2cliimp(conn), MDS_REINT, 2, size,
-                              NULL);
-        if (!req)
+        size[REQ_REC_OFF + 1] = op_data->op_capa1 ?
+                sizeof(struct lustre_capa) : 0;
+        size[REQ_REC_OFF + 2] = op_data->op_capa2 ?
+                sizeof(struct lustre_capa) : 0;
+
+        req = ptlrpc_prep_req(class_exp2cliimp(exp), LUSTRE_MDS_VERSION,
+                              MDS_REINT, 5, size, NULL);
+        if (req == NULL)
                 RETURN(-ENOMEM);
 
-        mds_link_pack(req, 0, src, dir, name, namelen);
+        mdc_link_pack(req, REQ_REC_OFF, op_data);
 
-        size[0] = sizeof(struct mds_body);
-        req->rq_replen = lustre_msg_size(1, size);
+        size[REPLY_REC_OFF] = sizeof(struct mdt_body);
+        ptlrpc_req_set_repsize(req, 2, size);
 
-        rc = mdc_reint(req, LUSTRE_CONN_FULL);
+        rc = mdc_reint(req, obd->u.cli.cl_rpc_lock, LUSTRE_IMP_FULL);
         *request = req;
         if (rc == -ERESTARTSYS)
                 rc = 0;
@@ -188,27 +272,36 @@ int mdc_link(struct lustre_handle *conn,
         RETURN(rc);
 }
 
-int mdc_rename(struct lustre_handle *conn,
-               struct inode *src, struct inode *tgt, const char *old,
-               int oldlen, const char *new, int newlen,
+int mdc_rename(struct obd_export *exp, struct md_op_data *op_data,
+               const char *old, int oldlen, const char *new, int newlen,
                struct ptlrpc_request **request)
 {
+        struct obd_device *obd = exp->exp_obd;
         struct ptlrpc_request *req;
-        int rc, size[3] = {sizeof(struct mds_rec_rename), oldlen + 1,
-                           newlen + 1};
+        int size[6] = { sizeof(struct ptlrpc_body),
+                        sizeof(struct mdt_rec_rename),
+                        0, 0, oldlen + 1, newlen + 1 };
+        int rc;
         ENTRY;
 
-        req = ptlrpc_prep_req(class_conn2cliimp(conn), MDS_REINT, 3, size,
-                              NULL);
-        if (!req)
+        size[REQ_REC_OFF + 1] = op_data->op_capa1 ?
+                                        sizeof(struct lustre_capa) : 0;
+        size[REQ_REC_OFF + 2] = op_data->op_capa2 ?
+                                        sizeof(struct lustre_capa) : 0;
+
+        req = ptlrpc_prep_req(class_exp2cliimp(exp), LUSTRE_MDS_VERSION,
+                              MDS_REINT, 6, size, NULL);
+        if (req == NULL)
                 RETURN(-ENOMEM);
 
-        mds_rename_pack(req, 0, src, tgt, old, oldlen, new, newlen);
+        mdc_rename_pack(req, REQ_REC_OFF, op_data, old, oldlen, new, newlen);
 
-        size[0] = sizeof(struct mds_body);
-        req->rq_replen = lustre_msg_size(1, size);
+        size[REPLY_REC_OFF] = sizeof(struct mdt_body);
+        size[REPLY_REC_OFF + 1] = obd->u.cli.cl_max_mds_easize;
+        size[REPLY_REC_OFF + 2] = obd->u.cli.cl_max_mds_cookiesize;
+        ptlrpc_req_set_repsize(req, 4, size);
 
-        rc = mdc_reint(req, LUSTRE_CONN_FULL);
+        rc = mdc_reint(req, obd->u.cli.cl_rpc_lock, LUSTRE_IMP_FULL);
         *request = req;
         if (rc == -ERESTARTSYS)
                 rc = 0;