Whamcloud - gitweb
fdae25fe12bba9572c41c45dcc16a4a79de3113e
[fs/lustre-release.git] / lustre / llite / namei.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * This code is issued under the GNU General Public License.
5  * See the file COPYING in this distribution
6  *
7  * Copyright (C) 1992, 1993, 1994, 1995
8  * Remy Card (card@masi.ibp.fr)
9  * Laboratoire MASI - Institut Blaise Pascal
10  * Universite Pierre et Marie Curie (Paris VI)
11  *
12  *  from
13  *
14  *  linux/fs/ext2/namei.c
15  *
16  *  Copyright (C) 1991, 1992  Linus Torvalds
17  *
18  *  Big-endian to little-endian byte-swapping/bitmaps by
19  *        David S. Miller (davem@caip.rutgers.edu), 1995
20  *  Directory entry file type support and forward compatibility hooks
21  *      for B-tree directories by Theodore Ts'o (tytso@mit.edu), 1998
22  *
23  *  Changes for use in OBDFS
24  *  Copyright (c) 1999, Seagate Technology Inc.
25  *  Copyright (C) 2001, Cluster File Systems, Inc.
26  *                       Rewritten based on recent ext2 page cache use.
27  *
28  */
29
30 #include <linux/fs.h>
31 #include <linux/locks.h>
32 #include <linux/quotaops.h>
33
34 #define DEBUG_SUBSYSTEM S_LLITE
35
36 #include <linux/obd_support.h>
37 #include <linux/lustre_lite.h>
38 #include <linux/lustre_dlm.h>
39 extern struct address_space_operations ll_aops;
40
41 /* from super.c */
42 extern void ll_change_inode(struct inode *inode);
43 extern int ll_setattr(struct dentry *de, struct iattr *attr);
44
45 /* from dir.c */
46 extern int ll_add_link (struct dentry *dentry, struct inode *inode);
47 obd_id ll_inode_by_name(struct inode * dir, struct dentry *dentry, int *typ);
48 int ext2_make_empty(struct inode *inode, struct inode *parent);
49 struct ext2_dir_entry_2 * ext2_find_entry (struct inode * dir,
50                    struct dentry *dentry, struct page ** res_page);
51 int ext2_delete_entry (struct ext2_dir_entry_2 * dir, struct page * page );
52 int ext2_empty_dir (struct inode * inode);
53 struct ext2_dir_entry_2 * ext2_dotdot (struct inode *dir, struct page **p);
54 void ext2_set_link(struct inode *dir, struct ext2_dir_entry_2 *de,
55                    struct page *page, struct inode *inode);
56
57 /*
58  * Couple of helper functions - make the code slightly cleaner.
59  */
60 static inline void ext2_inc_count(struct inode *inode)
61 {
62         inode->i_nlink++;
63 }
64
65 /* postpone the disk update until the inode really goes away */
66 static inline void ext2_dec_count(struct inode *inode)
67 {
68         inode->i_nlink--;
69 }
70
71 static inline int ext2_add_nondir(struct dentry *dentry, struct inode *inode)
72 {
73         int err;
74         err = ll_add_link(dentry, inode);
75         if (!err) {
76                 d_instantiate(dentry, inode);
77                 return 0;
78         }
79         ext2_dec_count(inode);
80         iput(inode);
81         return err;
82 }
83
84 /* methods */
85 static int ll_find_inode(struct inode *inode, unsigned long ino, void *opaque)
86 {
87         struct mds_body *body = (struct mds_body *)opaque;
88
89         if (inode->i_generation != body->generation)
90                 return 0;
91
92         return 1;
93 }
94
95 extern struct dentry_operations ll_d_ops;
96
97 int ll_lock(struct inode *dir, struct dentry *dentry,
98             struct lookup_intent *it, struct lustre_handle *lockh)
99 {
100         struct ll_sb_info *sbi = ll_i2sbi(dir);
101         int err, lock_mode;
102
103         if ((it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_SETATTR |
104                           IT_MKNOD)))
105                 lock_mode = LCK_PW;
106         else if (it->it_op & (IT_READDIR | IT_GETATTR | IT_OPEN | IT_UNLINK |
107                               IT_RMDIR | IT_RENAME | IT_RENAME2 | IT_READLINK))
108                 lock_mode = LCK_PR;
109         else if (it->it_op & IT_LOOKUP)
110                 lock_mode = LCK_CR;
111         else {
112                 LBUG();
113                 RETURN(-EINVAL);
114         }
115
116 #warning FIXME: add symlink tgt to intent and as a parameter here
117         err = mdc_enqueue(&sbi->ll_mdc_conn, LDLM_MDSINTENT, it, lock_mode, dir,
118                           dentry, lockh, 0, NULL, 0, dir, sizeof(*dir));
119
120         RETURN(err);
121 }
122
123 int ll_unlock(__u32 mode, struct lustre_handle *lockh)
124 {
125         ENTRY;
126
127         ldlm_lock_decref(lockh, mode);
128
129         RETURN(0);
130 }
131
132 static struct dentry *ll_lookup2(struct inode * dir, struct dentry *dentry,
133                                  struct lookup_intent *it)
134 {
135         struct ptlrpc_request *request = NULL;
136         struct inode * inode = NULL;
137         struct ll_sb_info *sbi = ll_i2sbi(dir);
138         struct ll_inode_md md;
139         struct lustre_handle lockh;
140         int err, offset;
141         struct lookup_intent lookup_it = { IT_LOOKUP };
142         obd_id ino = 0;
143
144         ENTRY;
145
146         if (it == NULL) {
147                 it = &lookup_it;
148                 dentry->d_it = it;
149         }
150
151         CDEBUG(D_INFO, "name: %*s, intent op: %d\n", dentry->d_name.len,
152                dentry->d_name.name, it->it_op);
153
154         if (dentry->d_name.len > EXT2_NAME_LEN)
155                 RETURN(ERR_PTR(-ENAMETOOLONG));
156
157         if (it->it_op == IT_RENAME2) {
158                 /* Set below to be the old dentry from the IT_RENAME intent */
159                 inode = ((struct dentry *)(it->it_data))->d_inode;
160                 LASSERT(inode);
161         }
162
163         err = ll_lock(dir, dentry, it, &lockh);
164         if (err < 0)
165                 RETURN(ERR_PTR(err));
166         memcpy(it->it_lock_handle, &lockh, sizeof(lockh));
167
168         request = (struct ptlrpc_request *)it->it_data;
169         if (it->it_disposition) {
170                 offset = 1;
171                 if (it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_MKNOD)) {
172                         /* For create ops, we want the lookup to be negative */
173                         if (!it->it_status)
174                                 GOTO(negative, NULL);
175                 } else if (it->it_op & (IT_GETATTR | IT_UNLINK |
176                                         IT_RMDIR | IT_SETATTR | IT_LOOKUP)) {
177                         /* For remove/check, we want the lookup to succeed */
178                         it->it_data = NULL;
179                         if (it->it_status)
180                                 GOTO(neg_req, NULL);
181                 } else if (it->it_op & IT_RENAME) {
182                         if (it->it_status) {
183                                 it->it_data = NULL;
184                                 GOTO(neg_req, NULL);
185                         }
186                         LASSERT(dentry->d_inode);
187                         it->it_data = dentry;
188                 } else if (it->it_op == IT_OPEN) {
189                         it->it_data = NULL;
190                         if (it->it_status && it->it_status != -EEXIST)
191                                 GOTO(neg_req, NULL);
192                 } else if (it->it_op == IT_RENAME2) {
193                         /* FIXME: make old_de negative, and drop
194                          *        new_de->d_inode if needed.
195                          */
196                         it->it_data = NULL;
197                         GOTO(out_req, NULL);
198                 }
199         } else {
200                 struct ll_inode_info *lli = ll_i2info(dir);
201                 int type;
202
203                 memcpy(&lli->lli_intent_lock_handle, &lockh, sizeof(lockh));
204                 offset = 0;
205
206                 ino = ll_inode_by_name(dir, dentry, &type);
207 #warning FIXME: handle negative inode case (see old ll_lookup)
208
209                 err = mdc_getattr(&sbi->ll_mdc_conn, ino, type,
210                                   OBD_MD_FLNOTOBD|OBD_MD_FLEASIZE, 0, &request);
211                 if (err) {
212                         CERROR("failure %d inode %Ld\n", err, (long long)ino);
213                         ptlrpc_free_req(request);
214                         RETURN(ERR_PTR(-abs(err)));
215                 }
216         }
217
218         md.body = lustre_msg_buf(request->rq_repmsg, offset);
219         if (S_ISREG(md.body->mode)) {
220                 if (request->rq_repmsg->bufcount < offset + 1)
221                         LBUG();
222                 md.md = lustre_msg_buf(request->rq_repmsg, offset + 1);
223         } else
224                 md.md = NULL;
225
226         /* No rpc's happen during iget4, -ENOMEM's are possible */
227         inode = iget4(dir->i_sb, ino, ll_find_inode, &md);
228
229  out_req:
230         LASSERT(!IS_ERR(inode));
231         if (!inode) {
232                 ptlrpc_free_req(request);
233                 ll_intent_release(dentry);
234                 RETURN(ERR_PTR(-ENOMEM));
235         }
236         EXIT;
237  neg_req:
238         ptlrpc_free_req(request);
239  negative:
240         dentry->d_op = &ll_d_ops;
241         d_add(dentry, inode);
242         if (it->it_op == IT_LOOKUP)
243                 ll_intent_release(dentry);
244
245         return NULL;
246 }
247
248 static struct inode *ll_create_node(struct inode *dir, const char *name,
249                                     int namelen, const char *tgt, int tgtlen,
250                                     int mode, __u64 extra,
251                                     struct lookup_intent *it,
252                                     struct lov_stripe_md *smd)
253 {
254         struct inode *inode;
255         struct ptlrpc_request *request = NULL;
256         struct mds_body *body;
257         int rc;
258         time_t time = CURRENT_TIME;
259         struct ll_sb_info *sbi = ll_i2sbi(dir);
260         int gid = current->fsgid;
261         struct ll_inode_md md;
262
263         ENTRY;
264
265         if (dir->i_mode & S_ISGID) {
266                 gid = dir->i_gid;
267                 if (S_ISDIR(mode))
268                         mode |= S_ISGID;
269         }
270
271         if (!it || !it->it_disposition) {
272                 rc = mdc_create(&sbi->ll_mdc_conn, dir, name, namelen, tgt,
273                                  tgtlen, mode, current->fsuid,
274                                  gid, time, extra, smd, &request);
275                 if (rc) {
276                         inode = ERR_PTR(rc);
277                         GOTO(out, rc);
278                 }
279                 body = lustre_msg_buf(request->rq_repmsg, 0);
280                 md.md = smd;
281         } else {
282                 request = it->it_data;
283                 body = lustre_msg_buf(request->rq_repmsg, 1);
284                 md.md = NULL;
285         }
286
287         body->valid = OBD_MD_FLNOTOBD;
288
289         body->nlink = 1;
290         body->atime = body->ctime = body->mtime = time;
291         body->uid = current->fsuid;
292         body->gid = gid;
293         body->mode = mode;
294
295         md.body = body;
296
297         inode = iget4(dir->i_sb, body->ino, ll_find_inode, &md);
298         if (IS_ERR(inode)) {
299                 rc = PTR_ERR(inode);
300                 CERROR("new_inode -fatal: rc %d\n", rc);
301                 LBUG();
302                 GOTO(out, rc);
303         }
304
305         if (!list_empty(&inode->i_dentry)) {
306                 CERROR("new_inode -fatal: inode %d, ct %d lnk %d\n",
307                        body->ino, atomic_read(&inode->i_count),
308                        inode->i_nlink);
309                 iput(inode);
310                 LBUG();
311                 inode = ERR_PTR(-EIO);
312                 GOTO(out, -EIO);
313         }
314
315         EXIT;
316  out:
317         ptlrpc_free_req(request);
318         return inode;
319 }
320
321 static int ll_mdc_unlink(struct inode *dir, struct inode *child, __u32 mode,
322                          const char *name, int len)
323 {
324         struct ptlrpc_request *request = NULL;
325         struct ll_sb_info *sbi = ll_i2sbi(dir);
326         int err;
327
328         ENTRY;
329
330         err = mdc_unlink(&sbi->ll_mdc_conn, dir, child, mode, name, len,
331                          &request);
332         ptlrpc_free_req(request);
333
334         RETURN(err);
335 }
336
337 int ll_mdc_link(struct dentry *src, struct inode *dir,
338                 const char *name, int len)
339 {
340         struct ptlrpc_request *request = NULL;
341         int err;
342         struct ll_sb_info *sbi = ll_i2sbi(dir);
343
344         ENTRY;
345
346         err = mdc_link(&sbi->ll_mdc_conn, src, dir, name,
347                        len, &request);
348         ptlrpc_free_req(request);
349
350         RETURN(err);
351 }
352
353 int ll_mdc_rename(struct inode *src, struct inode *tgt,
354                   struct dentry *old, struct dentry *new)
355 {
356         struct ptlrpc_request *request = NULL;
357         struct ll_sb_info *sbi = ll_i2sbi(src);
358         int err;
359
360         ENTRY;
361
362         err = mdc_rename(&sbi->ll_mdc_conn, src, tgt,
363                          old->d_name.name, old->d_name.len,
364                          new->d_name.name, new->d_name.len, &request);
365         ptlrpc_free_req(request);
366
367         RETURN(err);
368 }
369
370 /*
371  * By the time this is called, we already have created
372  * the directory cache entry for the new file, but it
373  * is so far negative - it has no inode.
374  *
375  * If the create succeeds, we fill in the inode information
376  * with d_instantiate().
377  */
378
379 static int ll_create(struct inode * dir, struct dentry * dentry, int mode)
380 {
381         int err, rc = 0;
382         struct obdo oa;
383         struct inode *inode;
384         struct lov_stripe_md *smd;
385         struct ll_inode_info *ii = NULL;
386         ENTRY;
387
388         if (dentry->d_it->it_disposition == 0) {
389                 memset(&oa, 0, sizeof(oa));
390                 oa.o_valid = OBD_MD_FLMODE;
391                 oa.o_mode = S_IFREG | 0600;
392                 rc = obd_create(ll_i2obdconn(dir), &oa, &smd);
393                 CDEBUG(D_DENTRY, "name %s mode %o o_id %lld: rc = %d\n",
394                        dentry->d_name.name, mode, (long long)oa.o_id, rc);
395                 if (rc)
396                         RETURN(rc);
397         }
398
399         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
400                                NULL, 0, mode, 0, dentry->d_it, smd);
401
402         if (IS_ERR(inode)) {
403                 rc = PTR_ERR(inode);
404                 CERROR("error creating MDS object for id %Ld: rc = %d\n",
405                        (unsigned long long)oa.o_id, rc);
406 #warning FIXME: 'ii' needs to be set before this goto
407                 GOTO(out_destroy, rc);
408         }
409
410         if (dentry->d_it->it_disposition) {
411                 ii = ll_i2info(inode);
412                 memcpy(&ii->lli_intent_lock_handle,
413                        dentry->d_it->it_lock_handle,
414                        sizeof(struct lustre_handle));
415                 d_instantiate(dentry, inode);
416         } else {
417                 /* no directory data updates when intents rule */
418                 rc = ext2_add_nondir(dentry, inode);
419         }
420
421         RETURN(rc);
422
423 out_destroy:
424         oa.o_easize = ii->lli_smd->lmd_easize;
425         err = obd_destroy(ll_i2obdconn(dir), &oa, ii->lli_smd);
426         if (err)
427                 CERROR("error destroying object %Ld in error path: err = %d\n",
428                        (unsigned long long)oa.o_id, err);
429         return rc;
430 }
431
432 static int ll_mknod(struct inode *dir, struct dentry *dentry, int mode,
433                     int rdev)
434 {
435         struct inode *inode;
436         int err = 0;
437
438         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
439                                NULL, 0, mode, rdev, dentry->d_it, NULL);
440
441         if (IS_ERR(inode))
442                 RETURN(PTR_ERR(inode));
443
444         /* no directory data updates when intents rule */
445         if (dentry->d_it->it_disposition == 0)
446                 err = ext2_add_nondir(dentry, inode);
447         else
448                 d_instantiate(dentry, inode);
449
450         return err;
451 }
452
453 static int ll_symlink(struct inode *dir, struct dentry *dentry,
454                       const char *symname)
455 {
456         unsigned l = strlen(symname);
457         struct inode *inode;
458         struct ll_inode_info *oinfo;
459
460         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
461                                symname, l, S_IFLNK | S_IRWXUGO, 0,
462                                dentry->d_it, NULL);
463         if (IS_ERR(inode))
464                 RETURN(PTR_ERR(inode));
465
466         oinfo = ll_i2info(inode);
467
468         if (dentry->d_it->it_disposition) {
469 #warning FIXME: still needs intent support
470                 d_instantiate(dentry, inode);
471                 return 0;
472         }
473
474         OBD_ALLOC(oinfo->lli_symlink_name, l + 1);
475         if (!oinfo->lli_symlink_name)
476                 RETURN(-ENOMEM);
477
478         memcpy(oinfo->lli_symlink_name, symname, l + 1);
479         inode->i_size = l;
480
481         return ext2_add_nondir(dentry, inode);
482 }
483
484 static int ll_link(struct dentry *old_dentry, struct inode * dir,
485                    struct dentry *dentry)
486 {
487         int err;
488         struct inode *inode = old_dentry->d_inode;
489
490 #warning FIXME: still needs intent support
491         if (S_ISDIR(inode->i_mode))
492                 return -EPERM;
493
494         if (inode->i_nlink >= EXT2_LINK_MAX)
495                 return -EMLINK;
496
497         err = ll_mdc_link(old_dentry, dir,
498                           dentry->d_name.name, dentry->d_name.len);
499         if (err)
500                 RETURN(err);
501
502         inode->i_ctime = CURRENT_TIME;
503         ext2_inc_count(inode);
504         atomic_inc(&inode->i_count);
505
506         return ext2_add_nondir(dentry, inode);
507 }
508
509 static int ll_mkdir(struct inode * dir, struct dentry * dentry, int mode)
510 {
511         struct inode * inode;
512         int err = -EMLINK;
513         ENTRY;
514
515         if (dir->i_nlink >= EXT2_LINK_MAX)
516                 goto out;
517
518         ext2_inc_count(dir);
519
520         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
521                                NULL, 0, S_IFDIR | mode, 0, dentry->d_it, NULL);
522         err = PTR_ERR(inode);
523         if (IS_ERR(inode))
524                 goto out_dir;
525
526         ext2_inc_count(inode);
527
528         err = ext2_make_empty(inode, dir);
529         if (err)
530                 goto out_fail;
531
532         /* no directory data updates when intents rule */
533         if (dentry->d_it->it_disposition == 0) {
534                 err = ll_add_link(dentry, inode);
535                 if (err)
536                         goto out_fail;
537         }
538
539         d_instantiate(dentry, inode);
540 out:
541         EXIT;
542         return err;
543
544 out_fail:
545         ext2_dec_count(inode);
546         ext2_dec_count(inode);
547         iput(inode);
548         EXIT;
549 out_dir:
550         ext2_dec_count(dir);
551         EXIT;
552         goto out;
553 }
554
555 static int ll_common_unlink(struct inode *dir, struct dentry *dentry,
556                             __u32 mode)
557 {
558         struct inode * inode = dentry->d_inode;
559         struct ext2_dir_entry_2 * de;
560         struct page * page;
561         int err = -ENOENT;
562
563         if (dentry->d_it && dentry->d_it->it_disposition) {
564                 err = dentry->d_it->it_status;
565                 if (!err)
566                         inode->i_nlink = 0;
567                 GOTO(out, err);
568         }
569
570         de = ext2_find_entry(dir, dentry, &page);
571         if (!de)
572                 goto out;
573
574         err = ll_mdc_unlink(dir, dentry->d_inode, mode,
575                             dentry->d_name.name, dentry->d_name.len);
576         if (err)
577                 goto out;
578
579         err = ext2_delete_entry(de, page);
580         if (err)
581                 goto out;
582
583         inode->i_ctime = dir->i_ctime;
584         ext2_dec_count(inode);
585 out:
586         return err;
587 }
588
589 static int ll_unlink(struct inode *dir, struct dentry *dentry)
590 {
591         return ll_common_unlink(dir, dentry, S_IFREG);
592 }
593
594 static int ll_rmdir(struct inode *dir, struct dentry *dentry)
595 {
596         struct inode * inode = dentry->d_inode;
597         int err = 0;
598         ENTRY;
599
600         if (!dentry->d_it || dentry->d_it->it_disposition == 0) {
601                 if (!ext2_empty_dir(inode))
602                         LBUG();
603
604                 err = ll_common_unlink(dir, dentry, S_IFDIR);
605         } else
606                 err = dentry->d_it->it_status;
607         if (err)
608                 RETURN(err);
609         inode->i_size = 0;
610         ext2_dec_count(inode);
611         ext2_dec_count(dir);
612         RETURN(err);
613 }
614
615 static int ll_rename(struct inode * old_dir, struct dentry * old_dentry,
616                      struct inode * new_dir, struct dentry * new_dentry)
617 {
618         struct inode * old_inode = old_dentry->d_inode;
619         struct inode * new_inode = new_dentry->d_inode;
620         struct page * dir_page = NULL;
621         struct ext2_dir_entry_2 * dir_de = NULL;
622         struct page * old_page;
623         struct ext2_dir_entry_2 * old_de;
624         int err = -ENOENT;
625
626         if (new_dentry->d_it && new_dentry->d_it->it_disposition)
627                 GOTO(out, err = new_dentry->d_it->it_status);
628
629         err = ll_mdc_rename(old_dir, new_dir, old_dentry, new_dentry);
630         if (err)
631                 goto out;
632
633         old_de = ext2_find_entry (old_dir, old_dentry, &old_page);
634         if (!old_de)
635                 goto out;
636
637         if (S_ISDIR(old_inode->i_mode)) {
638                 err = -EIO;
639                 dir_de = ext2_dotdot(old_inode, &dir_page);
640                 if (!dir_de)
641                         goto out_old;
642         }
643
644         if (new_inode) {
645                 struct page *new_page;
646                 struct ext2_dir_entry_2 *new_de;
647
648                 err = -ENOTEMPTY;
649                 if (dir_de && !ext2_empty_dir (new_inode))
650                         goto out_dir;
651
652                 err = -ENOENT;
653                 new_de = ext2_find_entry (new_dir, new_dentry, &new_page);
654                 if (!new_de)
655                         goto out_dir;
656                 ext2_inc_count(old_inode);
657                 ext2_set_link(new_dir, new_de, new_page, old_inode);
658                 new_inode->i_ctime = CURRENT_TIME;
659                 if (dir_de)
660                         new_inode->i_nlink--;
661                 ext2_dec_count(new_inode);
662         } else {
663                 if (dir_de) {
664                         err = -EMLINK;
665                         if (new_dir->i_nlink >= EXT2_LINK_MAX)
666                                 goto out_dir;
667                 }
668                 ext2_inc_count(old_inode);
669                 err = ll_add_link(new_dentry, old_inode);
670                 if (err) {
671                         ext2_dec_count(old_inode);
672                         goto out_dir;
673                 }
674                 if (dir_de)
675                         ext2_inc_count(new_dir);
676         }
677
678         ext2_delete_entry (old_de, old_page);
679         ext2_dec_count(old_inode);
680
681         if (dir_de) {
682                 ext2_set_link(old_inode, dir_de, dir_page, new_dir);
683                 ext2_dec_count(old_dir);
684         }
685         return 0;
686
687 out_dir:
688         if (dir_de) {
689                 kunmap(dir_page);
690                 page_cache_release(dir_page);
691         }
692 out_old:
693         kunmap(old_page);
694         page_cache_release(old_page);
695 out:
696         return err;
697 }
698
699 struct inode_operations ll_dir_inode_operations = {
700         create:         ll_create,
701         lookup2:        ll_lookup2,
702         link:           ll_link,
703         unlink:         ll_unlink,
704         symlink:        ll_symlink,
705         mkdir:          ll_mkdir,
706         rmdir:          ll_rmdir,
707         mknod:          ll_mknod,
708         rename:         ll_rename,
709         setattr:        ll_setattr
710 };