Whamcloud - gitweb
b=3940
[fs/lustre-release.git] / lustre / mds / mds_lib.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  *  Copyright (c) 2003 Cluster File Systems, Inc.
5  *
6  *   This file is part of Lustre, http://www.lustre.org.
7  *
8  *   Lustre is free software; you can redistribute it and/or
9  *   modify it under the terms of version 2 of the GNU General Public
10  *   License as published by the Free Software Foundation.
11  *
12  *   Lustre is distributed in the hope that it will be useful,
13  *   but WITHOUT ANY WARRANTY; without even the implied warranty of
14  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  *   GNU General Public License for more details.
16  *
17  *   You should have received a copy of the GNU General Public License
18  *   along with Lustre; if not, write to the Free Software
19  *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
20  */
21
22 #define DEBUG_SUBSYSTEM S_MDS
23
24 #include <linux/config.h>
25 #include <linux/module.h>
26 #include <linux/kernel.h>
27 #include <linux/mm.h>
28 #include <linux/string.h>
29 #include <linux/stat.h>
30 #include <linux/errno.h>
31 #include <linux/version.h>
32 #if (LINUX_VERSION_CODE < KERNEL_VERSION(2,5,0))
33 # include <linux/locks.h>   // for wait_on_buffer
34 #else
35 # include <linux/buffer_head.h>   // for wait_on_buffer
36 #endif
37 #include <linux/unistd.h>
38
39 #include <asm/system.h>
40 #include <asm/uaccess.h>
41
42 #include <linux/fs.h>
43 #include <linux/stat.h>
44 #include <asm/uaccess.h>
45 #include <linux/slab.h>
46 #include <asm/segment.h>
47
48 #include <linux/obd_support.h>
49 #include <linux/lustre_lib.h>
50 #include <linux/lustre_mds.h>
51
52 void mds_pack_dentry2fid(struct ll_fid *fid, struct dentry *dentry)
53 {
54         fid->id = dentry->d_inum;
55         fid->generation = dentry->d_generation;
56         fid->mds = dentry->d_mdsnum;
57 }
58
59 void mds_pack_dentry2body(struct mds_body *b, struct dentry *dentry)
60 {
61         b->valid |= OBD_MD_FLID | OBD_MD_FLGENER;
62         b->ino = dentry->d_inum;
63         b->generation = dentry->d_generation;
64         b->mds = dentry->d_mdsnum;
65 }
66
67 void mds_pack_inode2fid(struct obd_device *obd, struct ll_fid *fid,
68                                 struct inode *inode)
69 {
70         fid->id = inode->i_ino;
71         fid->generation = inode->i_generation;
72         fid->f_type = (S_IFMT & inode->i_mode);
73         fid->mds = obd->u.mds.mds_num;
74 }
75
76 /* Note that we can copy all of the fields, just some will not be "valid" */
77 void mds_pack_inode2body(struct obd_device *obd, struct mds_body *b,
78                                 struct inode *inode)
79 {
80         b->valid |= OBD_MD_FLID | OBD_MD_FLCTIME | OBD_MD_FLUID |
81                     OBD_MD_FLGID | OBD_MD_FLFLAGS | OBD_MD_FLTYPE |
82                     OBD_MD_FLMODE | OBD_MD_FLNLINK | OBD_MD_FLGENER |
83                     OBD_MD_FLATIME | OBD_MD_FLMTIME; /* bug 2020 */
84
85         if (!S_ISREG(inode->i_mode))
86                 b->valid |= OBD_MD_FLSIZE | OBD_MD_FLBLOCKS | OBD_MD_FLATIME |
87                             OBD_MD_FLMTIME | OBD_MD_FLRDEV;
88
89         b->ino = inode->i_ino;
90         b->atime = LTIME_S(inode->i_atime);
91         b->mtime = LTIME_S(inode->i_mtime);
92         b->ctime = LTIME_S(inode->i_ctime);
93         b->mode = inode->i_mode;
94         b->size = inode->i_size;
95         b->blocks = inode->i_blocks;
96         b->uid = inode->i_uid;
97         b->gid = inode->i_gid;
98         b->flags = inode->i_flags;
99         b->rdev = inode->i_rdev;
100         /* Return the correct link count for orphan inodes */
101         if (mds_inode_is_orphan(inode)) {
102                 b->nlink = 0;
103         } else if (S_ISDIR(inode->i_mode)) {
104                 b->nlink = 1;
105         } else {
106                 b->nlink = inode->i_nlink;
107         }
108         b->generation = inode->i_generation;
109         b->suppgid = -1;
110         b->mds = obd->u.mds.mds_num;
111 }
112
113 /* unpacking */
114 static int mds_setattr_unpack(struct ptlrpc_request *req, int offset,
115                               struct mds_update_record *r)
116 {
117         struct iattr *attr = &r->ur_iattr;
118         struct mds_rec_setattr *rec;
119         ENTRY;
120
121         rec = lustre_swab_reqbuf(req, offset, sizeof(*rec),
122                                  lustre_swab_mds_rec_setattr);
123         if (rec == NULL)
124                 RETURN (-EFAULT);
125
126         r->_ur_fsuid = rec->sa_fsuid;
127         r->_ur_fsgid = rec->sa_fsgid;
128         r->_ur_cap = rec->sa_cap;
129         r->_ur_suppgid1 = rec->sa_suppgid;
130         r->_ur_suppgid2 = -1;
131         r->ur_fid1 = &rec->sa_fid;
132         attr->ia_valid = rec->sa_valid;
133         attr->ia_mode = rec->sa_mode;
134         attr->ia_uid = rec->sa_uid;
135         attr->ia_gid = rec->sa_gid;
136         attr->ia_size = rec->sa_size;
137         LTIME_S(attr->ia_atime) = rec->sa_atime;
138         LTIME_S(attr->ia_mtime) = rec->sa_mtime;
139         LTIME_S(attr->ia_ctime) = rec->sa_ctime;
140         attr->ia_attr_flags = rec->sa_attr_flags;
141
142         LASSERT_REQSWAB (req, offset + 1);
143         if (req->rq_reqmsg->bufcount > offset + 1) {
144                 r->ur_eadata = lustre_msg_buf (req->rq_reqmsg,
145                                                offset + 1, 0);
146                 if (r->ur_eadata == NULL)
147                         RETURN (-EFAULT);
148                 r->ur_eadatalen = req->rq_reqmsg->buflens[offset + 1];
149         }
150
151         if (req->rq_reqmsg->bufcount > offset + 2) {
152                 r->ur_logcookies = lustre_msg_buf(req->rq_reqmsg, offset + 2,0);
153                 if (r->ur_eadata == NULL)
154                         RETURN (-EFAULT);
155
156                 r->ur_cookielen = req->rq_reqmsg->buflens[offset + 2];
157         }
158
159         RETURN(0);
160 }
161
162 static int mds_create_unpack(struct ptlrpc_request *req, int offset,
163                              struct mds_update_record *r)
164 {
165         struct mds_rec_create *rec;
166         ENTRY;
167
168         rec = lustre_swab_reqbuf (req, offset, sizeof (*rec),
169                                   lustre_swab_mds_rec_create);
170         if (rec == NULL)
171                 RETURN (-EFAULT);
172
173         r->_ur_fsuid = rec->cr_fsuid;
174         r->_ur_fsgid = rec->cr_fsgid;
175         r->_ur_cap = rec->cr_cap;
176         r->ur_fid1 = &rec->cr_fid;
177         r->ur_fid2 = &rec->cr_replayfid;
178         r->ur_mode = rec->cr_mode;
179         r->ur_rdev = rec->cr_rdev;
180         r->ur_time = rec->cr_time;
181         r->ur_flags = rec->cr_flags;
182         r->_ur_suppgid1 = rec->cr_suppgid;
183         r->_ur_suppgid2 = -1;
184
185         LASSERT_REQSWAB (req, offset + 1);
186         r->ur_name = lustre_msg_string (req->rq_reqmsg, offset + 1, 0);
187         if (r->ur_name == NULL)
188                 RETURN (-EFAULT);
189         r->ur_namelen = req->rq_reqmsg->buflens[offset + 1];
190
191         LASSERT_REQSWAB (req, offset + 2);
192         if (req->rq_reqmsg->bufcount > offset + 2) {
193                 if (S_ISLNK(r->ur_mode)) {
194                         r->ur_tgt = lustre_msg_string(req->rq_reqmsg,
195                                                       offset + 2, 0);
196                         if (r->ur_tgt == NULL)
197                                 RETURN (-EFAULT);
198                         r->ur_tgtlen = req->rq_reqmsg->buflens[offset + 2];
199                 } else if (S_ISDIR(r->ur_mode)) {
200                         /* Stripe info for mkdir - just a 16bit integer */
201                         if (req->rq_reqmsg->buflens[offset + 2] != 2) {
202                                 CERROR("mkdir stripe info does not match "
203                                        "expected size %d vs 2\n",
204                                        req->rq_reqmsg->buflens[offset + 2]);
205                                 RETURN (-EINVAL);
206                         }
207                         r->ur_eadata = lustre_swab_buf (req->rq_reqmsg,
208                                                offset + 2, 2, __swab16s);
209                         r->ur_eadatalen = req->rq_reqmsg->buflens[offset + 2];
210                 } else {
211                         /* Hm, no other users so far? */
212                         LBUG();
213                 }
214         }
215         RETURN(0);
216 }
217
218 static int mds_link_unpack(struct ptlrpc_request *req, int offset,
219                            struct mds_update_record *r)
220 {
221         struct mds_rec_link *rec;
222         ENTRY;
223
224         rec = lustre_swab_reqbuf (req, offset, sizeof (*rec),
225                                   lustre_swab_mds_rec_link);
226         if (rec == NULL)
227                 RETURN (-EFAULT);
228
229         r->_ur_fsuid = rec->lk_fsuid;
230         r->_ur_fsgid = rec->lk_fsgid;
231         r->_ur_cap = rec->lk_cap;
232         r->_ur_suppgid1 = rec->lk_suppgid1;
233         r->_ur_suppgid2 = rec->lk_suppgid2;
234         r->ur_fid1 = &rec->lk_fid1;
235         r->ur_fid2 = &rec->lk_fid2;
236         r->ur_time = rec->lk_time;
237
238         LASSERT_REQSWAB (req, offset + 1);
239         r->ur_name = lustre_msg_string (req->rq_reqmsg, offset + 1, 0);
240         if (r->ur_name == NULL)
241                 RETURN (-EFAULT);
242         r->ur_namelen = req->rq_reqmsg->buflens[offset + 1];
243         RETURN(0);
244 }
245
246 static int mds_unlink_unpack(struct ptlrpc_request *req, int offset,
247                              struct mds_update_record *r)
248 {
249         struct mds_rec_unlink *rec;
250         ENTRY;
251
252         rec = lustre_swab_reqbuf (req, offset, sizeof (*rec),
253                                   lustre_swab_mds_rec_unlink);
254         if (rec == NULL)
255                 RETURN(-EFAULT);
256
257         r->_ur_fsuid = rec->ul_fsuid;
258         r->_ur_fsgid = rec->ul_fsgid;
259         r->_ur_cap = rec->ul_cap;
260         r->ur_mode = rec->ul_mode;
261         r->_ur_suppgid1 = rec->ul_suppgid;
262         r->_ur_suppgid2 = -1;
263         r->ur_fid1 = &rec->ul_fid1;
264         r->ur_fid2 = &rec->ul_fid2;
265         r->ur_time = rec->ul_time;
266
267         LASSERT_REQSWAB (req, offset + 1);
268         r->ur_name = lustre_msg_string(req->rq_reqmsg, offset + 1, 0);
269         if (r->ur_name == NULL)
270                 RETURN(-EFAULT);
271         r->ur_namelen = req->rq_reqmsg->buflens[offset + 1];
272         RETURN(0);
273 }
274
275 static int mds_rename_unpack(struct ptlrpc_request *req, int offset,
276                              struct mds_update_record *r)
277 {
278         struct mds_rec_rename *rec;
279         ENTRY;
280
281         rec = lustre_swab_reqbuf (req, offset, sizeof (*rec),
282                                   lustre_swab_mds_rec_unlink);
283         if (rec == NULL)
284                 RETURN(-EFAULT);
285
286         r->_ur_fsuid = rec->rn_fsuid;
287         r->_ur_fsgid = rec->rn_fsgid;
288         r->_ur_cap = rec->rn_cap;
289         r->_ur_suppgid1 = rec->rn_suppgid1;
290         r->_ur_suppgid2 = rec->rn_suppgid2;
291         r->ur_fid1 = &rec->rn_fid1;
292         r->ur_fid2 = &rec->rn_fid2;
293         r->ur_time = rec->rn_time;
294
295         LASSERT_REQSWAB (req, offset + 1);
296         r->ur_name = lustre_msg_string(req->rq_reqmsg, offset + 1, 0);
297         if (r->ur_name == NULL)
298                 RETURN(-EFAULT);
299         r->ur_namelen = req->rq_reqmsg->buflens[offset + 1];
300
301         LASSERT_REQSWAB (req, offset + 2);
302         r->ur_tgt = lustre_msg_string(req->rq_reqmsg, offset + 2, 0);
303         if (r->ur_tgt == NULL)
304                 RETURN(-EFAULT);
305         r->ur_tgtlen = req->rq_reqmsg->buflens[offset + 2];
306         RETURN(0);
307 }
308
309 static int mds_open_unpack(struct ptlrpc_request *req, int offset,
310                            struct mds_update_record *r)
311 {
312         struct mds_rec_create *rec;
313         ENTRY;
314
315         rec = lustre_swab_reqbuf (req, offset, sizeof (*rec),
316                                   lustre_swab_mds_rec_create);
317         if (rec == NULL)
318                 RETURN (-EFAULT);
319
320         r->_ur_fsuid = rec->cr_fsuid;
321         r->_ur_fsgid = rec->cr_fsgid;
322         r->_ur_cap = rec->cr_cap;
323         r->ur_fid1 = &rec->cr_fid;
324         r->ur_fid2 = &rec->cr_replayfid;
325         r->ur_mode = rec->cr_mode;
326         r->ur_rdev = rec->cr_rdev;
327         r->ur_time = rec->cr_time;
328         r->ur_flags = rec->cr_flags;
329         r->_ur_suppgid1 = rec->cr_suppgid;
330         r->_ur_suppgid2 = -1;
331
332         LASSERT_REQSWAB (req, offset + 1);
333         r->ur_name = lustre_msg_string (req->rq_reqmsg, offset + 1, 0);
334         if (r->ur_name == NULL)
335                 RETURN (-EFAULT);
336         r->ur_namelen = req->rq_reqmsg->buflens[offset + 1];
337
338         LASSERT_REQSWAB (req, offset + 2);
339         if (req->rq_reqmsg->bufcount > offset + 2) {
340                 r->ur_eadata = lustre_msg_buf(req->rq_reqmsg, offset + 2, 0);
341                 if (r->ur_eadata == NULL)
342                         RETURN (-EFAULT);
343                 r->ur_eadatalen = req->rq_reqmsg->buflens[offset + 2];
344         }
345         RETURN(0);
346 }
347
348 typedef int (*update_unpacker)(struct ptlrpc_request *req, int offset,
349                                struct mds_update_record *r);
350
351 static update_unpacker mds_unpackers[REINT_MAX + 1] = {
352         [REINT_SETATTR] mds_setattr_unpack,
353         [REINT_CREATE] mds_create_unpack,
354         [REINT_LINK] mds_link_unpack,
355         [REINT_UNLINK] mds_unlink_unpack,
356         [REINT_RENAME] mds_rename_unpack,
357         [REINT_OPEN] mds_open_unpack,
358 };
359
360 int mds_update_unpack(struct ptlrpc_request *req, int offset,
361                       struct mds_update_record *rec)
362 {
363         __u32 *opcodep;
364         __u32  opcode;
365         int rc;
366         ENTRY;
367
368         /* NB don't lustre_swab_reqbuf() here.  We're just taking a peek
369          * and we want to leave it to the specific unpacker once we've
370          * identified the message type */
371         opcodep = lustre_msg_buf (req->rq_reqmsg, offset, sizeof (*opcodep));
372         if (opcodep == NULL)
373                 RETURN(-EFAULT);
374
375         opcode = *opcodep;
376         if (lustre_msg_swabbed (req->rq_reqmsg))
377                 __swab32s (&opcode);
378
379         if (opcode > REINT_MAX ||
380             mds_unpackers[opcode] == NULL) {
381                 CERROR ("Unexpected opcode %d\n", opcode);
382                 RETURN(-EFAULT);
383         }
384
385         rec->ur_opcode = opcode;
386         rc = mds_unpackers[opcode](req, offset, rec);
387         RETURN(rc);
388 }