Whamcloud - gitweb
- make HEAD from b_post_cmd3
[fs/lustre-release.git] / lustre / mdc / mdc_reint.c
index 9249d89..63bbb0c 100644 (file)
 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
  * vim:expandtab:shiftwidth=8:tabstop=8:
  *
- * Copyright (C) 2001, 2002 Cluster File Systems, Inc.
+ * Copyright (C) 2001-2003 Cluster File Systems, Inc.
  *
- *   This file is part of Portals, http://www.sf.net/projects/lustre/
+ *   This file is part of the Lustre file system, http://www.lustre.org
+ *   Lustre is a trademark of Cluster File Systems, Inc.
  *
- *   Portals is free software; you can redistribute it and/or
- *   modify it under the terms of version 2 of the GNU General Public
- *   License as published by the Free Software Foundation.
+ *   You may have signed or agreed to another license before downloading
+ *   this software.  If so, you are bound by the terms and conditions
+ *   of that agreement, and the following does not apply to you.  See the
+ *   LICENSE file included with this distribution for more information.
  *
- *   Portals is distributed in the hope that it will be useful,
- *   but WITHOUT ANY WARRANTY; without even the implied warranty of
- *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
- *   GNU General Public License for more details.
- *
- *   You should have received a copy of the GNU General Public License
- *   along with Portals; if not, write to the Free Software
- *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
+ *   If you did not agree to a different license, then this copy of Lustre
+ *   is open source software; you can redistribute it and/or modify it
+ *   under the terms of version 2 of the GNU General Public License as
+ *   published by the Free Software Foundation.
  *
+ *   In either case, Lustre is distributed in the hope that it will be
+ *   useful, but WITHOUT ANY WARRANTY; without even the implied warranty
+ *   of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+ *   license text for more details.
  */
 
-#define EXPORT_SYMTAB
+#ifndef EXPORT_SYMTAB
+# define EXPORT_SYMTAB
+#endif
+#define DEBUG_SUBSYSTEM S_MDC
 
-#include <linux/config.h>
-#include <linux/module.h>
-#include <linux/kernel.h>
-#include <linux/mm.h>
-#include <linux/string.h>
-#include <linux/stat.h>
-#include <linux/errno.h>
-#include <linux/locks.h>
-#include <linux/unistd.h>
+#ifdef __KERNEL__
+#ifdef HAVE_KERNEL_CONFIG_H
+# include <linux/config.h>
+#endif
+# include <linux/module.h>
+# include <linux/kernel.h>
+#else
+# include <liblustre.h>
+#endif
+
+#include <obd_class.h>
+#include "mdc_internal.h"
+
+/* mdc_setattr does its own semaphore handling */
+static int mdc_reint(struct ptlrpc_request *request,
+                     struct mdc_rpc_lock *rpc_lock, int level)
+{
+        int rc;
+
+        request->rq_send_state = level;
+
+        mdc_get_rpc_lock(rpc_lock, NULL);
+        rc = ptlrpc_queue_wait(request);
+        mdc_put_rpc_lock(rpc_lock, NULL);
+        if (rc)
+                CDEBUG(D_INFO, "error in handling %d\n", rc);
+        else if (!lustre_swab_repbuf(request, REPLY_REC_OFF,
+                                     sizeof(struct mdt_body),
+                                     lustre_swab_mdt_body)) {
+                CERROR ("Can't unpack mdt_body\n");
+                rc = -EPROTO;
+        }
+        return rc;
+}
 
-#include <asm/system.h>
-#include <asm/uaccess.h>
-#include <linux/module.h>
+/* If mdc_setattr is called with an 'iattr', then it is a normal RPC that
+ * should take the normal semaphore and go to the normal portal.
+ *
+ * If it is called with iattr->ia_valid & ATTR_FROM_OPEN, then it is a
+ * magic open-path setattr that should take the setattr semaphore and
+ * go to the setattr portal. */
+int mdc_setattr(struct obd_export *exp, struct md_op_data *op_data,
+                void *ea, int ealen, void *ea2, int ea2len,
+                struct ptlrpc_request **request)
+{
+        struct ptlrpc_request *req;
+        struct mdt_rec_setattr *rec;
+        struct mdc_rpc_lock *rpc_lock;
+        struct obd_device *obd = exp->exp_obd;
+        int size[6] = { sizeof(struct ptlrpc_body),
+                        sizeof(*rec), 0, 0, ealen, ea2len };
+        int bufcount = 4, rc;
+        ENTRY;
 
-#include <linux/fs.h>
-#include <linux/stat.h>
-#include <asm/uaccess.h>
-#include <asm/segment.h>
-#include <linux/miscdevice.h>
+        LASSERT(op_data != NULL);
 
-#define DEBUG_SUBSYSTEM S_MDC
+        size[REQ_REC_OFF + 1] = op_data->op_capa1 ?
+                                        sizeof(struct lustre_capa) : 0;
 
-#include <linux/obd_support.h>
-#include <linux/obd_class.h>
-#include <linux/lustre_lib.h>
-#include <linux/lustre_idl.h>
-#include <linux/lustre_mds.h>
+        if (op_data->op_flags & (MF_SOM_CHANGE | MF_EPOCH_OPEN))
+                size[REQ_REC_OFF + 2] = sizeof(struct mdt_epoch);
 
-extern int mdc_reint(struct ptlrpc_client *peer, struct ptlrpc_request *request);
+        if (ealen > 0) {
+                bufcount++;
+                if (ea2len > 0)
+                        bufcount++;
+        }
 
-int mdc_setattr(struct ptlrpc_client *peer, 
-               struct inode *inode, struct iattr *iattr,
-               struct ptlrpc_request **request)
-{
-       int rc; 
-       struct mds_rec_setattr *rec;
-        ENTRY;
+        req = ptlrpc_prep_req(class_exp2cliimp(exp), LUSTRE_MDS_VERSION,
+                              MDS_REINT, bufcount, size, NULL);
+        if (req == NULL)
+                RETURN(-ENOMEM);
 
-       *request = ptlrpc_prep_req(peer, MDS_REINT, 0, NULL, sizeof(*rec), NULL);
-       if (!(*request)) { 
-               CERROR("mdc request: cannot pack\n");
-               return -ENOMEM;
-       }
+        if (op_data->op_attr.ia_valid & ATTR_FROM_OPEN) {
+                req->rq_request_portal = MDS_SETATTR_PORTAL; //XXX FIXME bug 249
+                rpc_lock = obd->u.cli.cl_setattr_lock;
+        } else {
+                rpc_lock = obd->u.cli.cl_rpc_lock;
+        }
 
-       rec = mds_req_tgt((*request)->rq_req.mds);
-       mds_setattr_pack(rec, inode, iattr); 
-       (*request)->rq_req.mds->opcode = HTON__u32(REINT_SETATTR);
-       (*request)->rq_replen = 
-               sizeof(struct ptlrep_hdr) + sizeof(struct mds_rep);
+        if (op_data->op_attr.ia_valid & (ATTR_MTIME | ATTR_CTIME))
+                CDEBUG(D_INODE, "setting mtime %lu, ctime %lu\n",
+                       LTIME_S(op_data->op_attr.ia_mtime),
+                       LTIME_S(op_data->op_attr.ia_ctime));
+        mdc_setattr_pack(req, REQ_REC_OFF, op_data, ea, ealen, ea2, ea2len);
 
-       rc = mdc_reint(peer, *request);
+        size[REPLY_REC_OFF] = sizeof(struct mdt_body);
+        size[REPLY_REC_OFF + 1] = sizeof(struct lustre_capa);
+        ptlrpc_req_set_repsize(req, 3, size);
 
-        EXIT;
-        return rc;
+        rc = mdc_reint(req, rpc_lock, LUSTRE_IMP_FULL);
+        *request = req;
+        if (rc == -ERESTARTSYS)
+                rc = 0;
+
+        RETURN(rc);
 }
 
-int mdc_create(struct ptlrpc_client *peer, 
-              struct inode *dir, const char *name, int namelen, 
-              const char *tgt, int tgtlen, 
-              int mode, __u64 id, __u32 uid, __u32 gid, __u64 time, 
-               struct ptlrpc_request **request)
+int mdc_create(struct obd_export *exp, struct md_op_data *op_data,
+               const void *data, int datalen, int mode, __u32 uid, __u32 gid,
+               __u32 cap_effective, __u64 rdev, struct ptlrpc_request **request)
 {
-       int rc; 
-       struct mds_rec_create *rec;
+        int size[5] = { sizeof(struct ptlrpc_body),
+                        sizeof(struct mdt_rec_create),
+                        0, op_data->op_namelen + 1 };
+        struct obd_device *obd = exp->exp_obd;
+        int level, bufcount = 4, rc;
+        struct ptlrpc_request *req;
         ENTRY;
 
-       (*request) = ptlrpc_prep_req(peer, MDS_REINT, 0, NULL, 
-                              sizeof(*rec) + size_round0(namelen) + 
-                              size_round0(tgtlen), NULL);
-       if (!(*request)) { 
-               CERROR("mdc_create: cannot pack\n");
-               return -ENOMEM;
-       }
-
-       (*request)->rq_replen = 
-               sizeof(struct ptlrep_hdr) + sizeof(struct mds_rep);
-
-       rec = mds_req_tgt((*request)->rq_req.mds);
-       mds_create_pack(rec, dir, name, namelen, mode, id, uid, gid, time, 
-                       tgt, tgtlen); 
-
-       rc = mdc_reint(peer, (*request));
-
-        EXIT;
-       return rc;
+        /* For case if upper layer did not alloc fid, do it now. */
+        if (!fid_is_sane(&op_data->op_fid2)) {
+                /*
+                 * mdc_fid_alloc() may return errno 1 in case of switch to new
+                 * sequence, handle this.
+                 */
+                rc = mdc_fid_alloc(exp, &op_data->op_fid2, op_data);
+                if (rc < 0) {
+                        CERROR("Can't alloc new fid, rc %d\n", rc);
+                        RETURN(rc);
+                }
+        }
+
+        size[REQ_REC_OFF + 1] = op_data->op_capa1 ?
+                sizeof(struct lustre_capa) : 0;
+        
+        if (data && datalen) {
+                size[bufcount] = datalen;
+                bufcount++;
+        }
+
+        req = ptlrpc_prep_req(class_exp2cliimp(exp), LUSTRE_MDS_VERSION,
+                              MDS_REINT, bufcount, size, NULL);
+        if (req == NULL)
+                RETURN(-ENOMEM);
+
+        /*
+         * mdc_create_pack() fills msg->bufs[1] with name and msg->bufs[2] with
+         * tgt, for symlinks or lov MD data.
+         */
+        mdc_create_pack(req, REQ_REC_OFF, op_data, data, datalen, mode, uid,
+                        gid, cap_effective, rdev);
+
+        size[REPLY_REC_OFF] = sizeof(struct mdt_body);
+        size[REPLY_REC_OFF + 1] = sizeof(struct lustre_capa);
+        ptlrpc_req_set_repsize(req, 3, size);
+
+        level = LUSTRE_IMP_FULL;
+ resend:
+        rc = mdc_reint(req, obd->u.cli.cl_rpc_lock, level);
+        
+        /* Resend if we were told to. */
+        if (rc == -ERESTARTSYS) {
+                level = LUSTRE_IMP_RECOVER;
+                goto resend;
+        } else if (rc == 0) {
+                struct mdt_body *body;
+                struct lustre_capa *capa;
+
+                body = lustre_msg_buf(req->rq_repmsg, REPLY_REC_OFF,
+                                      sizeof(*body));
+                LASSERT(body);
+                if (body->valid & OBD_MD_FLMDSCAPA) {
+                        capa = lustre_unpack_capa(req->rq_repmsg,
+                                                  REPLY_REC_OFF + 1);
+                        if (capa == NULL) {
+                                CERROR("Missing/short MDS capability\n");
+                                rc = -EPROTO;
+                        }
+                }
+        }
+
+        *request = req;
+        RETURN(rc);
 }
 
-int mdc_unlink(struct ptlrpc_client *peer, 
-              struct inode *dir, const char *name, int namelen, 
+int mdc_unlink(struct obd_export *exp, struct md_op_data *op_data,
                struct ptlrpc_request **request)
 {
-       int rc; 
-       struct mds_rec_unlink *rec;
+        struct obd_device *obd = class_exp2obd(exp);
+        struct ptlrpc_request *req = *request;
+        int size[4] = { sizeof(struct ptlrpc_body),
+                        sizeof(struct mdt_rec_unlink),
+                        0, op_data->op_namelen + 1 };
+        int rc;
+        ENTRY;
+
+        LASSERT(req == NULL);
 
-       (*request) = ptlrpc_prep_req(peer, MDS_REINT, 0, NULL, 
-                              sizeof(*rec) + size_round0(namelen), NULL);
-       if (!(*request)) { 
-               CERROR("mdc_unlink: cannot pack\n");
-               return -ENOMEM;
-       }
+        size[REQ_REC_OFF + 1] = op_data->op_capa1 ?
+                                        sizeof(struct lustre_capa) : 0;
 
-       (*request)->rq_replen = 
-               sizeof(struct ptlrep_hdr) + sizeof(struct mds_rep);
+        req = ptlrpc_prep_req(class_exp2cliimp(exp), LUSTRE_MDS_VERSION,
+                              MDS_REINT, 4, size, NULL);
+        if (req == NULL)
+                RETURN(-ENOMEM);
+        *request = req;
 
-       rec = mds_req_tgt((*request)->rq_req.mds);
-       mds_unlink_pack(rec, dir, name, namelen);
+        size[REPLY_REC_OFF] = sizeof(struct mdt_body);
+        size[REPLY_REC_OFF + 1] = obd->u.cli.cl_max_mds_easize;
+        size[REPLY_REC_OFF + 2] = obd->u.cli.cl_max_mds_cookiesize;
+        ptlrpc_req_set_repsize(req, 4, size);
 
-       rc = mdc_reint(peer, (*request));
+        mdc_unlink_pack(req, REQ_REC_OFF, op_data);
 
-        EXIT;
-       return rc;
+        rc = mdc_reint(req, obd->u.cli.cl_rpc_lock, LUSTRE_IMP_FULL);
+        if (rc == -ERESTARTSYS)
+                rc = 0;
+        RETURN(rc);
 }
 
-int mdc_link(struct ptlrpc_client *peer, struct dentry *src, 
-            struct inode *dir, const char *name, int namelen, 
+int mdc_link(struct obd_export *exp, struct md_op_data *op_data,
              struct ptlrpc_request **request)
 {
-       int rc; 
-       struct mds_rec_link *rec;
+        struct obd_device *obd = exp->exp_obd;
+        struct ptlrpc_request *req;
+        int size[5] = { sizeof(struct ptlrpc_body),
+                        sizeof(struct mdt_rec_link),
+                        0, 0, op_data->op_namelen + 1 };
+        int rc;
         ENTRY;
 
-       (*request) = ptlrpc_prep_req(peer, MDS_REINT, 0, NULL, 
-                              sizeof(*rec) + size_round0(namelen), NULL);
-       if (!(*request)) { 
-               CERROR("mdc_link: cannot pack\n");
-               return -ENOMEM;
-       }
+        size[REQ_REC_OFF + 1] = op_data->op_capa1 ?
+                sizeof(struct lustre_capa) : 0;
+        size[REQ_REC_OFF + 2] = op_data->op_capa2 ?
+                sizeof(struct lustre_capa) : 0;
+
+        req = ptlrpc_prep_req(class_exp2cliimp(exp), LUSTRE_MDS_VERSION,
+                              MDS_REINT, 5, size, NULL);
+        if (req == NULL)
+                RETURN(-ENOMEM);
 
-       (*request)->rq_replen = 
-               sizeof(struct ptlrep_hdr) + sizeof(struct mds_rep);
+        mdc_link_pack(req, REQ_REC_OFF, op_data);
 
-       rec = mds_req_tgt((*request)->rq_req.mds);
-       mds_link_pack(rec, src->d_inode, dir, name, namelen);
+        size[REPLY_REC_OFF] = sizeof(struct mdt_body);
+        ptlrpc_req_set_repsize(req, 2, size);
 
-       rc = mdc_reint(peer, (*request));
-        EXIT;
-       return rc;
+        rc = mdc_reint(req, obd->u.cli.cl_rpc_lock, LUSTRE_IMP_FULL);
+        *request = req;
+        if (rc == -ERESTARTSYS)
+                rc = 0;
+
+        RETURN(rc);
 }
 
-int mdc_rename(struct ptlrpc_client *peer, struct inode *src, 
-              struct inode *tgt, const char *old, int oldlen, 
-              const char *new, int newlen, 
+int mdc_rename(struct obd_export *exp, struct md_op_data *op_data,
+               const char *old, int oldlen, const char *new, int newlen,
                struct ptlrpc_request **request)
 {
-       int rc; 
-       struct mds_rec_rename *rec;
+        struct obd_device *obd = exp->exp_obd;
+        struct ptlrpc_request *req;
+        int size[6] = { sizeof(struct ptlrpc_body),
+                        sizeof(struct mdt_rec_rename),
+                        0, 0, oldlen + 1, newlen + 1 };
+        int rc;
         ENTRY;
 
-       (*request) = ptlrpc_prep_req(peer, MDS_REINT, 0, NULL, 
-                              sizeof(*rec) + size_round0(oldlen)
-                              + size_round0(newlen), NULL);
-       if (!(*request)) { 
-               CERROR("mdc_link: cannot pack\n");
-               return -ENOMEM;
-       }
+        size[REQ_REC_OFF + 1] = op_data->op_capa1 ?
+                                        sizeof(struct lustre_capa) : 0;
+        size[REQ_REC_OFF + 2] = op_data->op_capa2 ?
+                                        sizeof(struct lustre_capa) : 0;
+
+        req = ptlrpc_prep_req(class_exp2cliimp(exp), LUSTRE_MDS_VERSION,
+                              MDS_REINT, 6, size, NULL);
+        if (req == NULL)
+                RETURN(-ENOMEM);
 
-       (*request)->rq_replen = 
-               sizeof(struct ptlrep_hdr) + sizeof(struct mds_rep);
+        mdc_rename_pack(req, REQ_REC_OFF, op_data, old, oldlen, new, newlen);
 
-       rec = mds_req_tgt((*request)->rq_req.mds);
-       mds_rename_pack(rec, src, tgt, old, oldlen, new, newlen);
+        size[REPLY_REC_OFF] = sizeof(struct mdt_body);
+        size[REPLY_REC_OFF + 1] = obd->u.cli.cl_max_mds_easize;
+        size[REPLY_REC_OFF + 2] = obd->u.cli.cl_max_mds_cookiesize;
+        ptlrpc_req_set_repsize(req, 4, size);
 
-       rc = mdc_reint(peer, (*request));
+        rc = mdc_reint(req, obd->u.cli.cl_rpc_lock, LUSTRE_IMP_FULL);
+        *request = req;
+        if (rc == -ERESTARTSYS)
+                rc = 0;
 
-        EXIT;
-       return rc;
+        RETURN(rc);
 }