Whamcloud - gitweb
- move the peter branch changes to the head
[fs/lustre-release.git] / lustre / llite / namei.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * This code is issued under the GNU General Public License.
5  * See the file COPYING in this distribution
6  *
7  * Copyright (C) 1992, 1993, 1994, 1995
8  * Remy Card (card@masi.ibp.fr)
9  * Laboratoire MASI - Institut Blaise Pascal
10  * Universite Pierre et Marie Curie (Paris VI)
11  *
12  *  from
13  *
14  *  linux/fs/ext2/namei.c
15  *
16  *  Copyright (C) 1991, 1992  Linus Torvalds
17  *
18  *  Big-endian to little-endian byte-swapping/bitmaps by
19  *        David S. Miller (davem@caip.rutgers.edu), 1995
20  *  Directory entry file type support and forward compatibility hooks
21  *      for B-tree directories by Theodore Ts'o (tytso@mit.edu), 1998
22  *
23  *  Changes for use in OBDFS
24  *  Copyright (c) 1999, Seagate Technology Inc.
25  *  Copyright (C) 2001, Cluster File Systems, Inc.
26  *                       Rewritten based on recent ext2 page cache use.
27  *
28  */
29
30 #include <linux/fs.h>
31 #include <linux/locks.h>
32 #include <linux/quotaops.h>
33
34 #define DEBUG_SUBSYSTEM S_LLITE
35
36 #include <linux/obd_support.h>
37 #include <linux/lustre_lite.h>
38 #include <linux/lustre_dlm.h>
39 extern struct address_space_operations ll_aops;
40
41 /* from super.c */
42 extern void ll_change_inode(struct inode *inode);
43 extern int ll_setattr(struct dentry *de, struct iattr *attr);
44
45 /* from dir.c */
46 extern int ll_add_link (struct dentry *dentry, struct inode *inode);
47 obd_id ll_inode_by_name(struct inode * dir, struct dentry *dentry, int *typ);
48 int ext2_make_empty(struct inode *inode, struct inode *parent);
49 struct ext2_dir_entry_2 * ext2_find_entry (struct inode * dir,
50                    struct dentry *dentry, struct page ** res_page);
51 int ext2_delete_entry (struct ext2_dir_entry_2 * dir, struct page * page );
52 int ext2_empty_dir (struct inode * inode);
53 struct ext2_dir_entry_2 * ext2_dotdot (struct inode *dir, struct page **p);
54 void ext2_set_link(struct inode *dir, struct ext2_dir_entry_2 *de,
55                    struct page *page, struct inode *inode);
56
57 /*
58  * Couple of helper functions - make the code slightly cleaner.
59  */
60 static inline void ext2_inc_count(struct inode *inode)
61 {
62         inode->i_nlink++;
63 }
64
65 /* postpone the disk update until the inode really goes away */
66 static inline void ext2_dec_count(struct inode *inode)
67 {
68         inode->i_nlink--;
69 }
70
71 static inline int ext2_add_nondir(struct dentry *dentry, struct inode *inode)
72 {
73         int err;
74         err = ll_add_link(dentry, inode);
75         if (!err) {
76                 d_instantiate(dentry, inode);
77                 return 0;
78         }
79         ext2_dec_count(inode);
80         iput(inode);
81         return err;
82 }
83
84 /* methods */
85 static int ll_find_inode(struct inode *inode, unsigned long ino, void *opaque)
86 {
87         struct mds_body *body = (struct mds_body *)opaque;
88
89         if (inode->i_generation != body->generation)
90                 return 0;
91
92         return 1;
93 }
94
95 extern struct dentry_operations ll_d_ops;
96
97 int ll_lock(struct inode *dir, struct dentry *dentry,
98             struct lookup_intent *it, struct lustre_handle *lockh)
99 {
100         struct ll_sb_info *sbi = ll_i2sbi(dir);
101         int err, lock_mode;
102
103         if ((it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_SETATTR |
104                           IT_MKNOD)))
105                 lock_mode = LCK_PW;
106         else if (it->it_op & (IT_READDIR | IT_GETATTR | IT_OPEN | IT_UNLINK |
107                               IT_RMDIR | IT_RENAME | IT_RENAME2 | IT_READLINK))
108                 lock_mode = LCK_PR;
109         else if (it->it_op & IT_LOOKUP)
110                 lock_mode = LCK_CR;
111         else {
112                 LBUG();
113                 RETURN(-1);
114         }
115
116         err = mdc_enqueue(&sbi->ll_mdc_conn, LDLM_MDSINTENT, it, lock_mode, dir,
117                           dentry, lockh, 0, NULL, 0, dir, sizeof(*dir));
118
119         RETURN(err);
120 }
121
122 int ll_unlock(__u32 mode, struct lustre_handle *lockh)
123 {
124         ENTRY;
125
126         ldlm_lock_decref(lockh, mode);
127
128         RETURN(0);
129 }
130
131 static struct dentry *ll_lookup2(struct inode * dir, struct dentry *dentry,
132                                  struct lookup_intent *it)
133 {
134         struct ptlrpc_request *request = NULL;
135         struct inode * inode = NULL;
136         struct ll_sb_info *sbi = ll_i2sbi(dir);
137         struct ll_inode_md md;
138         struct lustre_handle lockh;
139         int err, type, offset;
140         struct lookup_intent lookup_it = { IT_LOOKUP };
141         obd_id ino = 0;
142
143         ENTRY;
144
145         if (it == NULL) {
146                 it = &lookup_it;
147                 dentry->d_it = it;
148         }
149
150         CDEBUG(D_INFO, "name: %*s, intent op: %d\n", dentry->d_name.len,
151                dentry->d_name.name, it->it_op);
152
153         if (dentry->d_name.len > EXT2_NAME_LEN)
154                 RETURN(ERR_PTR(-ENAMETOOLONG));
155
156         err = ll_lock(dir, dentry, it, &lockh);
157         if (err < 0)
158                 RETURN(ERR_PTR(err));
159         memcpy(it->it_lock_handle, &lockh, sizeof(lockh));
160
161         if ((it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_MKNOD)) &&
162             it->it_disposition && !it->it_status)
163                 GOTO(negative, NULL);
164
165         if ((it->it_op & (IT_RENAME | IT_GETATTR | IT_UNLINK | IT_RMDIR |
166                           IT_SETATTR | IT_LOOKUP)) &&
167             it->it_disposition && it->it_status)
168                 GOTO(negative, NULL);
169
170         request = (struct ptlrpc_request *)it->it_data;
171         if (!it->it_disposition) {
172                 struct ll_inode_info *lli = ll_i2info(dir);
173                 memcpy(&lli->lli_intent_lock_handle, &lockh, sizeof(lockh));
174
175                 ino = ll_inode_by_name(dir, dentry, &type);
176 #warning FIXME: handle negative inode case (see old ll_lookup)
177
178                 err = mdc_getattr(&sbi->ll_mdc_conn, ino, type,
179                                   OBD_MD_FLNOTOBD|OBD_MD_FLBLOCKS, 0, &request);
180                 if (err) {
181                         CERROR("failure %d inode %Ld\n", err, (long long)ino);
182                         ptlrpc_free_req(request);
183                         RETURN(ERR_PTR(-abs(err)));
184                 }
185                 offset = 0;
186         } else if (it->it_op == IT_RENAME2) {
187                 inode = ((struct dentry *)(it->it_data))->d_inode;
188                 GOTO(out_req, NULL);
189         } else {
190                 offset = 1;
191         }
192
193         md.body = lustre_msg_buf(request->rq_repmsg, offset);
194         if (S_ISREG(md.body->mode)) {
195                 if (request->rq_repmsg->bufcount < offset + 1)
196                         LBUG();
197                 md.md = lustre_msg_buf(request->rq_repmsg, offset + 1);
198         } else
199                 md.md = NULL;
200
201         /* No rpc's happen during iget4, -ENOMEM's are possible */
202         inode = iget4(dir->i_sb, ino, ll_find_inode, &md);
203         if (it->it_op & IT_RENAME)
204                 it->it_data = dentry;
205
206  out_req:
207         ptlrpc_free_req(request);
208         if (!inode || IS_ERR(inode)) {
209                 ll_intent_release(dentry);
210                 RETURN(ERR_PTR(-ENOMEM));
211         }
212         EXIT;
213  negative:
214         dentry->d_op = &ll_d_ops;
215         d_add(dentry, inode);
216         if (it->it_op == IT_LOOKUP)
217                 ll_intent_release(dentry);
218
219         return NULL;
220 }
221
222 static struct inode *ll_create_node(struct inode *dir, const char *name,
223                                     int namelen, const char *tgt, int tgtlen,
224                                     int mode, __u64 extra,
225                                     struct lookup_intent *it,
226                                     struct lov_stripe_md *smd)
227 {
228         struct inode *inode;
229         struct ptlrpc_request *request = NULL;
230         struct mds_body *body;
231         int rc;
232         time_t time = CURRENT_TIME;
233         struct ll_sb_info *sbi = ll_i2sbi(dir);
234         int gid = current->fsgid;
235         struct ll_inode_md md;
236
237         ENTRY;
238
239         if (dir->i_mode & S_ISGID) {
240                 gid = dir->i_gid;
241                 if (S_ISDIR(mode))
242                         mode |= S_ISGID;
243         }
244
245         if (!it || !it->it_disposition) {
246                 rc = mdc_create(&sbi->ll_mdc_conn, dir, name, namelen, tgt,
247                                  tgtlen, mode, current->fsuid,
248                                  gid, time, extra, smd, &request);
249                 if (rc) {
250                         inode = ERR_PTR(rc);
251                         GOTO(out, rc);
252                 }
253                 body = lustre_msg_buf(request->rq_repmsg, 0);
254                 md.md = smd;
255         } else {
256                 request = it->it_data;
257                 body = lustre_msg_buf(request->rq_repmsg, 1);
258                 md.md = NULL;
259         }
260
261         body->valid = OBD_MD_FLNOTOBD;
262
263         body->nlink = 1;
264         body->atime = body->ctime = body->mtime = time;
265         body->uid = current->fsuid;
266         body->gid = gid;
267         body->mode = mode;
268
269         md.body = body;
270
271         inode = iget4(dir->i_sb, body->ino, ll_find_inode, &md);
272         if (IS_ERR(inode)) {
273                 rc = PTR_ERR(inode);
274                 CERROR("new_inode -fatal: rc %d\n", rc);
275                 LBUG();
276                 GOTO(out, rc);
277         }
278
279         if (!list_empty(&inode->i_dentry)) {
280                 CERROR("new_inode -fatal: inode %d, ct %d lnk %d\n",
281                        body->ino, atomic_read(&inode->i_count),
282                        inode->i_nlink);
283                 iput(inode);
284                 LBUG();
285                 inode = ERR_PTR(-EIO);
286                 GOTO(out, -EIO);
287         }
288
289         EXIT;
290  out:
291         ptlrpc_free_req(request);
292         return inode;
293 }
294
295 int ll_mdc_unlink(struct inode *dir, struct inode *child,
296                   const char *name, int len)
297 {
298         struct ptlrpc_request *request = NULL;
299         int err;
300         struct ll_sb_info *sbi = ll_i2sbi(dir);
301
302         ENTRY;
303
304         err = mdc_unlink(&sbi->ll_mdc_conn, dir, child,
305                          name, len, &request);
306         ptlrpc_free_req(request);
307
308         RETURN(err);
309 }
310
311 int ll_mdc_link(struct dentry *src, struct inode *dir,
312                 const char *name, int len)
313 {
314         struct ptlrpc_request *request = NULL;
315         int err;
316         struct ll_sb_info *sbi = ll_i2sbi(dir);
317
318         ENTRY;
319
320         err = mdc_link(&sbi->ll_mdc_conn, src, dir, name,
321                        len, &request);
322         ptlrpc_free_req(request);
323
324         RETURN(err);
325 }
326
327 int ll_mdc_rename(struct inode *src, struct inode *tgt,
328                   struct dentry *old, struct dentry *new)
329 {
330         struct ptlrpc_request *request = NULL;
331         struct ll_sb_info *sbi = ll_i2sbi(src);
332         int err;
333
334         ENTRY;
335
336         err = mdc_rename(&sbi->ll_mdc_conn, src, tgt,
337                          old->d_name.name, old->d_name.len,
338                          new->d_name.name, new->d_name.len, &request);
339         ptlrpc_free_req(request);
340
341         RETURN(err);
342 }
343
344 /*
345  * By the time this is called, we already have created
346  * the directory cache entry for the new file, but it
347  * is so far negative - it has no inode.
348  *
349  * If the create succeeds, we fill in the inode information
350  * with d_instantiate().
351  */
352
353 static int ll_create(struct inode * dir, struct dentry * dentry, int mode)
354 {
355         int err, rc = 0;
356         struct obdo oa;
357         struct inode *inode;
358         struct lov_stripe_md *smd;
359         struct ll_inode_info *ii = NULL;
360
361         if (dentry->d_it->it_disposition == 0) {
362                 memset(&oa, 0, sizeof(oa));
363                 oa.o_valid = OBD_MD_FLMODE;
364                 oa.o_mode = S_IFREG | 0600;
365                 rc = obd_create(ll_i2obdconn(dir), &oa, &smd);
366                 if (rc)
367                         RETURN(rc);
368         }
369
370         CDEBUG(D_DENTRY, "name %s mode %o o_id %lld\n",
371                dentry->d_name.name, mode, (unsigned long long)oa.o_id);
372         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
373                                NULL, 0, mode, 0, dentry->d_it, smd);
374
375         if (IS_ERR(inode)) {
376                 rc = PTR_ERR(inode);
377                 CERROR("error creating MDS object for id %Ld: rc = %d\n",
378                        (unsigned long long)oa.o_id, rc);
379                 GOTO(out_destroy, rc);
380         }
381
382         if (dentry->d_it->it_disposition) {
383                 ii = ll_i2info(inode);
384                 ii->lli_flags |= OBD_FL_CREATEONOPEN;
385                 memcpy(&ii->lli_intent_lock_handle,
386                        dentry->d_it->it_lock_handle,
387                        sizeof(struct lustre_handle));
388         }
389
390         /* no directory data updates when intents rule */
391         if (dentry->d_it->it_disposition == 0)
392                 rc = ext2_add_nondir(dentry, inode);
393         else
394                 d_instantiate(dentry, inode);
395         RETURN(rc);
396
397 out_destroy:
398         oa.o_easize = ii->lli_smd->lmd_easize;
399         err = obd_destroy(ll_i2obdconn(dir), &oa, ii->lli_smd);
400         if (err)
401                 CERROR("error destroying object %Ld in error path: err = %d\n",
402                        (unsigned long long)oa.o_id, err);
403         return rc;
404 }
405
406 static int ll_mknod(struct inode *dir, struct dentry *dentry, int mode,
407                     int rdev)
408 {
409         struct inode *inode;
410         int err = 0;
411
412         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
413                                NULL, 0, mode, rdev, dentry->d_it, NULL);
414
415         if (IS_ERR(inode))
416                 RETURN(PTR_ERR(inode));
417
418         /* no directory data updates when intents rule */
419         if (dentry->d_it->it_disposition == 0)
420                 err = ext2_add_nondir(dentry, inode);
421         else
422                 d_instantiate(dentry, inode);
423
424         return err;
425 }
426
427 static int ll_symlink(struct inode *dir, struct dentry *dentry,
428                       const char *symname)
429 {
430         unsigned l = strlen(symname);
431         struct inode *inode;
432         struct ll_inode_info *oinfo;
433
434         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
435                                symname, l, S_IFLNK | S_IRWXUGO, 0,
436                                dentry->d_it, NULL);
437         if (IS_ERR(inode))
438                 RETURN(PTR_ERR(inode));
439
440         oinfo = ll_i2info(inode);
441
442         if (dentry->d_it->it_disposition) {
443                 d_instantiate(dentry, inode);
444                 return 0;
445         }
446
447         OBD_ALLOC(oinfo->lli_symlink_name, l + 1);
448         if (!oinfo->lli_symlink_name)
449                 RETURN(-ENOMEM);
450
451         memcpy(oinfo->lli_symlink_name, symname, l + 1);
452         inode->i_size = l;
453
454         return ext2_add_nondir(dentry, inode);
455 }
456
457 static int ll_link(struct dentry *old_dentry, struct inode * dir,
458                    struct dentry *dentry)
459 {
460         int err;
461         struct inode *inode = old_dentry->d_inode;
462
463         if (S_ISDIR(inode->i_mode))
464                 return -EPERM;
465
466         if (inode->i_nlink >= EXT2_LINK_MAX)
467                 return -EMLINK;
468
469         err = ll_mdc_link(old_dentry, dir,
470                           dentry->d_name.name, dentry->d_name.len);
471         if (err)
472                 RETURN(err);
473
474         inode->i_ctime = CURRENT_TIME;
475         ext2_inc_count(inode);
476         atomic_inc(&inode->i_count);
477
478         return ext2_add_nondir(dentry, inode);
479 }
480
481 static int ll_mkdir(struct inode * dir, struct dentry * dentry, int mode)
482 {
483         struct inode * inode;
484         int err = -EMLINK;
485         ENTRY;
486
487         if (dir->i_nlink >= EXT2_LINK_MAX)
488                 goto out;
489
490         ext2_inc_count(dir);
491
492         inode = ll_create_node (dir, dentry->d_name.name,
493                                 dentry->d_name.len, NULL, 0,
494                                 S_IFDIR | mode, 0, dentry->d_it, NULL);
495         err = PTR_ERR(inode);
496         if (IS_ERR(inode))
497                 goto out_dir;
498
499         ext2_inc_count(inode);
500
501         err = ext2_make_empty(inode, dir);
502         if (err)
503                 goto out_fail;
504
505         /* no directory data updates when intents rule */
506         if (dentry->d_it->it_disposition == 0) {
507                 err = ll_add_link(dentry, inode);
508                 if (err)
509                         goto out_fail;
510         }
511
512         d_instantiate(dentry, inode);
513 out:
514         EXIT;
515         return err;
516
517 out_fail:
518         ext2_dec_count(inode);
519         ext2_dec_count(inode);
520         iput(inode);
521         EXIT;
522 out_dir:
523         ext2_dec_count(dir);
524         EXIT;
525         goto out;
526 }
527
528 static int ll_unlink(struct inode * dir, struct dentry *dentry)
529 {
530         struct inode * inode = dentry->d_inode;
531         struct ext2_dir_entry_2 * de;
532         struct page * page;
533         int err = -ENOENT;
534
535         if (dentry->d_it && dentry->d_it->it_disposition) {
536                 inode->i_nlink = 0;
537                 GOTO(out, err = dentry->d_it->it_status);
538         }
539
540         de = ext2_find_entry (dir, dentry, &page);
541         if (!de)
542                 goto out;
543
544         err = ll_mdc_unlink(dir, dentry->d_inode,
545                             dentry->d_name.name, dentry->d_name.len);
546         if (err)
547                 goto out;
548
549         err = ext2_delete_entry (de, page);
550         if (err)
551                 goto out;
552
553         inode->i_ctime = dir->i_ctime;
554         ext2_dec_count(inode);
555 out:
556         return err;
557 }
558
559 static int ll_rmdir(struct inode * dir, struct dentry *dentry)
560 {
561         struct inode * inode = dentry->d_inode;
562         int err = 0;
563         int intent_did = dentry->d_it && dentry->d_it->it_disposition;
564
565         if (!intent_did) {
566                 if (!ext2_empty_dir(inode))
567                 LBUG();
568
569                 err = ll_unlink(dir, dentry);
570                 if (err)
571                         RETURN(err);
572         } else
573                 err = dentry->d_it->it_status;
574         inode->i_size = 0;
575         ext2_dec_count(inode);
576         ext2_dec_count(dir);
577         RETURN(err);
578 }
579
580 static int ll_rename(struct inode * old_dir, struct dentry * old_dentry,
581                      struct inode * new_dir, struct dentry * new_dentry)
582 {
583         struct inode * old_inode = old_dentry->d_inode;
584         struct inode * new_inode = new_dentry->d_inode;
585         struct page * dir_page = NULL;
586         struct ext2_dir_entry_2 * dir_de = NULL;
587         struct page * old_page;
588         struct ext2_dir_entry_2 * old_de;
589         int err = -ENOENT;
590
591         if (new_dentry->d_it && new_dentry->d_it->it_disposition)
592                 GOTO(out, err = new_dentry->d_it->it_status);
593
594         err = ll_mdc_rename(old_dir, new_dir, old_dentry, new_dentry);
595         if (err)
596                 goto out;
597
598         old_de = ext2_find_entry (old_dir, old_dentry, &old_page);
599         if (!old_de)
600                 goto out;
601
602         if (S_ISDIR(old_inode->i_mode)) {
603                 err = -EIO;
604                 dir_de = ext2_dotdot(old_inode, &dir_page);
605                 if (!dir_de)
606                         goto out_old;
607         }
608
609         if (new_inode) {
610                 struct page *new_page;
611                 struct ext2_dir_entry_2 *new_de;
612
613                 err = -ENOTEMPTY;
614                 if (dir_de && !ext2_empty_dir (new_inode))
615                         goto out_dir;
616
617                 err = -ENOENT;
618                 new_de = ext2_find_entry (new_dir, new_dentry, &new_page);
619                 if (!new_de)
620                         goto out_dir;
621                 ext2_inc_count(old_inode);
622                 ext2_set_link(new_dir, new_de, new_page, old_inode);
623                 new_inode->i_ctime = CURRENT_TIME;
624                 if (dir_de)
625                         new_inode->i_nlink--;
626                 ext2_dec_count(new_inode);
627         } else {
628                 if (dir_de) {
629                         err = -EMLINK;
630                         if (new_dir->i_nlink >= EXT2_LINK_MAX)
631                                 goto out_dir;
632                 }
633                 ext2_inc_count(old_inode);
634                 err = ll_add_link(new_dentry, old_inode);
635                 if (err) {
636                         ext2_dec_count(old_inode);
637                         goto out_dir;
638                 }
639                 if (dir_de)
640                         ext2_inc_count(new_dir);
641         }
642
643         ext2_delete_entry (old_de, old_page);
644         ext2_dec_count(old_inode);
645
646         if (dir_de) {
647                 ext2_set_link(old_inode, dir_de, dir_page, new_dir);
648                 ext2_dec_count(old_dir);
649         }
650         return 0;
651
652 out_dir:
653         if (dir_de) {
654                 kunmap(dir_page);
655                 page_cache_release(dir_page);
656         }
657 out_old:
658         kunmap(old_page);
659         page_cache_release(old_page);
660 out:
661         return err;
662 }
663
664 struct inode_operations ll_dir_inode_operations = {
665         create:         ll_create,
666         lookup2:        ll_lookup2,
667         link:           ll_link,
668         unlink:         ll_unlink,
669         symlink:        ll_symlink,
670         mkdir:          ll_mkdir,
671         rmdir:          ll_rmdir,
672         mknod:          ll_mknod,
673         rename:         ll_rename,
674         setattr:        ll_setattr
675 };