Whamcloud - gitweb
Add comment about direct access to fs-internal data struct - it works for
[fs/lustre-release.git] / lustre / mds / mds_reint.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  *  linux/mds/mds_reint.c
5  *  
6  *  Lustre Metadata Server (mds) reintegration routines
7  * 
8  *  Copyright (C) 2002  Cluster File Systems, Inc.
9  *  author: Peter Braam <braam@clusterfs.com>
10  *
11  *  This code is issued under the GNU General Public License.
12  *  See the file COPYING in this distribution
13  *
14  */
15
16 // XXX - add transaction sequence numbers
17
18 #define EXPORT_SYMTAB
19
20 #include <linux/version.h>
21 #include <linux/module.h>
22 #include <linux/fs.h>
23 #include <linux/stat.h>
24 #include <linux/locks.h>
25 #include <linux/ext2_fs.h>
26 #include <linux/quotaops.h>
27 #include <asm/unistd.h>
28 #include <asm/uaccess.h>
29
30 #define DEBUG_SUBSYSTEM S_MDS
31
32 #include <linux/obd_support.h>
33 #include <linux/obd_class.h>
34 #include <linux/obd.h>
35 #include <linux/lustre_lib.h>
36 #include <linux/lustre_idl.h>
37 #include <linux/lustre_mds.h>
38 #include <linux/obd_class.h>
39
40 extern struct ptlrpc_request *mds_prep_req(int size, int opcode, int namelen, char *name, int tgtlen, char *tgt);
41
42 static int mds_reint_setattr(struct mds_update_record *rec, struct ptlrpc_request *req)
43 {
44         struct dentry *de;
45
46         de = mds_fid2dentry(&req->rq_obd->u.mds, rec->ur_fid1, NULL);
47         if (IS_ERR(de)) { 
48                 req->rq_rephdr->status = -ESTALE;
49                 return 0;
50         }
51
52         CDEBUG(D_INODE, "ino %ld\n", de->d_inode->i_ino);
53
54         /* a _really_ horrible hack to avoid removing the data stored
55            in the block pointers; this data is the object id 
56            this will go into an extended attribute at some point.
57         */
58         if ( rec->ur_iattr.ia_valid & ATTR_SIZE ) { 
59                 /* ATTR_SIZE would invoke truncate: clear it */ 
60                 rec->ur_iattr.ia_valid &= ~ATTR_SIZE;
61                 de->d_inode->i_size = rec->ur_iattr.ia_size;
62                 /* make sure _something_ gets set - so new inode
63                    goes to disk (probably won't work over XFS */
64                 if (!rec->ur_iattr.ia_valid & ATTR_MODE) { 
65                         rec->ur_iattr.ia_valid |= ATTR_MODE;
66                         rec->ur_iattr.ia_mode = de->d_inode->i_mode;
67                 }
68         }
69         if ( de->d_inode->i_op->setattr ) {
70                 req->rq_rephdr->status =
71                         de->d_inode->i_op->setattr(de, &rec->ur_iattr);
72         } else { 
73                 req->rq_rephdr->status =
74                         inode_setattr(de->d_inode, &rec->ur_iattr);
75         }
76
77         l_dput(de);
78         EXIT;
79         return 0;
80 }
81
82 /* 
83    XXX nasty hack: store the object id in the first two
84    direct block spots 
85 */
86 static inline void mds_store_objid(struct inode *inode, __u64 *id)
87 {
88         /* FIXME: it is only by luck that this works on ext3 */
89         memcpy(&inode->u.ext2_i.i_data, id, sizeof(*id));
90 }
91
92
93 static int mds_reint_create(struct mds_update_record *rec, 
94                             struct ptlrpc_request *req)
95 {
96         int type = rec->ur_mode & S_IFMT;
97         struct dentry *de;
98         struct mds_rep *rep = req->rq_rep.mds;
99         struct dentry *dchild; 
100         int rc;
101         ENTRY;
102
103         de = mds_fid2dentry(&req->rq_obd->u.mds, rec->ur_fid1, NULL);
104         if (IS_ERR(de)) { 
105                 req->rq_rephdr->status = -ESTALE;
106                 BUG();
107                 EXIT;
108                 return 0;
109         }
110         CDEBUG(D_INODE, "ino %ld\n", de->d_inode->i_ino);
111
112         dchild = lookup_one_len(rec->ur_name, de, rec->ur_namelen - 1);
113         rc = PTR_ERR(dchild);
114         if (IS_ERR(dchild)) { 
115                 CERROR("child lookup error %d\n", rc);
116                 dput(de); 
117                 req->rq_rephdr->status = -ESTALE;
118                 BUG();
119                 EXIT;
120                 return 0;
121         }
122
123         if (dchild->d_inode) {
124                 CERROR("child exists (dir %ld, name %s)\n", 
125                        de->d_inode->i_ino, rec->ur_name);
126                 dput(de); 
127                 req->rq_rephdr->status = -EEXIST;
128                 BUG();
129                 EXIT;
130                 return 0;
131         }
132
133         switch (type) {
134         case S_IFREG: { 
135                 rc = vfs_create(de->d_inode, dchild, rec->ur_mode);
136                 EXIT;
137                 break;
138         }
139         case S_IFDIR: { 
140                 rc = vfs_mkdir(de->d_inode, dchild, rec->ur_mode);
141                 EXIT;
142                 break;
143         } 
144         case S_IFLNK: { 
145                 rc = vfs_symlink(de->d_inode, dchild, rec->ur_tgt);
146                 EXIT;
147                 break;
148         } 
149         case S_IFCHR:
150         case S_IFBLK:
151         case S_IFIFO:
152         case S_IFSOCK: { 
153                 int rdev = rec->ur_id;
154                 rc = vfs_mknod(de->d_inode, dchild, rec->ur_mode, rdev); 
155                 EXIT;
156                 break;
157         }
158         }
159
160         req->rq_rephdr->status = rc;
161         if (!rc) { 
162                 if (type == S_IFREG)
163                         mds_store_objid(dchild->d_inode, &rec->ur_id); 
164                 dchild->d_inode->i_atime = rec->ur_time;
165                 dchild->d_inode->i_ctime = rec->ur_time;
166                 dchild->d_inode->i_mtime = rec->ur_time;
167                 dchild->d_inode->i_uid = rec->ur_uid;
168                 dchild->d_inode->i_gid = rec->ur_gid;
169                 rep->ino = dchild->d_inode->i_ino;
170         }
171
172         dput(de);
173         dput(dchild); 
174         EXIT;
175         return 0;
176 }
177
178 static int mds_reint_unlink(struct mds_update_record *rec, 
179                             struct ptlrpc_request *req)
180 {
181         struct dentry *de;
182         struct dentry *dchild; 
183         int rc;
184         ENTRY;
185
186         de = mds_fid2dentry(&req->rq_obd->u.mds, rec->ur_fid1, NULL);
187         if (IS_ERR(de)) { 
188                 BUG();
189                 req->rq_rephdr->status = -ESTALE;
190                 EXIT;
191                 return 0;
192         }
193         CDEBUG(D_INODE, "ino %ld\n", de->d_inode->i_ino);
194
195         dchild = lookup_one_len(rec->ur_name, de, rec->ur_namelen - 1);
196         rc = PTR_ERR(dchild);
197         if (IS_ERR(dchild)) { 
198                 CERROR("child lookup error %d\n", rc);
199                 BUG();
200                 dput(de); 
201                 req->rq_rephdr->status = -ESTALE;
202                 EXIT;
203                 return 0;
204         }
205
206         if (!dchild->d_inode) {
207                 CERROR("child doesn't exist (dir %ld, name %s\n", 
208                        de->d_inode->i_ino, rec->ur_name);
209                 BUG();
210                 dput(de); 
211                 req->rq_rephdr->status = -ESTALE;
212                 EXIT;
213                 return 0;
214         }
215
216         switch (dchild->d_inode->i_mode & S_IFMT) {
217         case S_IFDIR:
218                 rc = vfs_rmdir(de->d_inode, dchild);
219                 EXIT;
220                 break;
221         default:
222                 rc = vfs_unlink(de->d_inode, dchild);
223                 
224                 EXIT;
225                 break;
226         }
227
228         req->rq_rephdr->status = rc;
229         dput(de);
230         dput(dchild); 
231         EXIT;
232         return 0;
233 }
234
235 static int mds_reint_link(struct mds_update_record *rec, 
236                             struct ptlrpc_request *req)
237 {
238         struct dentry *de_src = NULL;
239         struct dentry *de_tgt_dir = NULL;
240         struct dentry *dchild = NULL; 
241         int rc;
242         ENTRY;
243
244         rc = -ESTALE;
245         de_src = mds_fid2dentry(&req->rq_obd->u.mds, rec->ur_fid1, NULL);
246         if (IS_ERR(de_src)) { 
247                 EXIT;
248                 goto out_link;
249         }
250
251         de_tgt_dir = mds_fid2dentry(&req->rq_obd->u.mds, rec->ur_fid2, NULL);
252         if (IS_ERR(de_tgt_dir)) { 
253                 EXIT;
254                 goto out_link;
255         }
256
257         dchild = lookup_one_len(rec->ur_name, de_tgt_dir, rec->ur_namelen - 1);
258         if (IS_ERR(dchild)) { 
259                 CERROR("child lookup error %d\n", rc);
260                 EXIT;
261                 goto out_link;
262         }
263
264         if (dchild->d_inode) {
265                 CERROR("child exists (dir %ld, name %s\n", 
266                        de_tgt_dir->d_inode->i_ino, rec->ur_name);
267                 EXIT;
268                 goto out_link;
269         }
270
271         rc = vfs_link(de_src, de_tgt_dir->d_inode, dchild); 
272         EXIT;
273
274  out_link:
275         req->rq_rephdr->status = rc;
276         l_dput(de_src);
277         l_dput(de_tgt_dir); 
278         l_dput(dchild); 
279         return 0;
280 }
281
282
283 static int mds_reint_rename(struct mds_update_record *rec, 
284                             struct ptlrpc_request *req)
285 {
286         struct dentry *de_srcdir = NULL;
287         struct dentry *de_tgtdir = NULL;
288         struct dentry *de_old = NULL; 
289         struct dentry *de_new = NULL; 
290         int rc;
291         ENTRY;
292
293         rc = -ESTALE;
294         de_srcdir = mds_fid2dentry(&req->rq_obd->u.mds, rec->ur_fid1, NULL);
295         if (IS_ERR(de_srcdir)) { 
296                 EXIT;
297                 goto out_rename;
298         }
299
300         de_tgtdir = mds_fid2dentry(&req->rq_obd->u.mds, rec->ur_fid2, NULL);
301         if (IS_ERR(de_tgtdir)) { 
302                 EXIT;
303                 goto out_rename;
304         }
305
306         de_old = lookup_one_len(rec->ur_name, de_srcdir, rec->ur_namelen - 1);
307         if (IS_ERR(de_old)) { 
308                 CERROR("child lookup error %d\n", rc);
309                 EXIT;
310                 goto out_rename;
311         }
312
313         de_new = lookup_one_len(rec->ur_tgt, de_tgtdir, rec->ur_tgtlen - 1);
314         if (IS_ERR(de_new)) { 
315                 CERROR("child lookup error %d\n", rc);
316                 EXIT;
317                 goto out_rename;
318         }
319
320         rc = vfs_rename(de_srcdir->d_inode, de_old, de_tgtdir->d_inode, de_new);
321         EXIT;
322
323  out_rename:
324         req->rq_rephdr->status = rc;
325         l_dput(de_new);
326         l_dput(de_old); 
327         l_dput(de_tgtdir); 
328         l_dput(de_srcdir); 
329         return 0;
330 }
331
332 typedef int (*mds_reinter)(struct mds_update_record *, struct ptlrpc_request*); 
333
334 static mds_reinter  reinters[REINT_MAX+1] = { 
335         [REINT_SETATTR]   mds_reint_setattr, 
336         [REINT_CREATE]    mds_reint_create,
337         [REINT_UNLINK]    mds_reint_unlink, 
338         [REINT_LINK]      mds_reint_link,
339         [REINT_RENAME]    mds_reint_rename
340 };
341
342 int mds_reint_rec(struct mds_update_record *rec, struct ptlrpc_request *req)
343 {
344         int rc; 
345
346         if (rec->ur_opcode < 0 || rec->ur_opcode > REINT_MAX) { 
347                 CERROR("opcode %d not valid\n", 
348                        rec->ur_opcode); 
349                 rc = req->rq_status = -EINVAL;
350                 return rc;
351         }
352
353         rc = mds_pack_rep(NULL, 0, NULL, 0, &req->rq_rephdr, &req->rq_rep, 
354                           &req->rq_replen, &req->rq_repbuf);
355         if (rc) { 
356                 EXIT;
357                 CERROR("mds: out of memory\n");
358                 rc = req->rq_status = -ENOMEM;
359                 return rc;
360         }
361         req->rq_rephdr->xid = req->rq_reqhdr->xid;
362
363         rc = reinters[rec->ur_opcode](rec, req); 
364         return rc;
365
366