Whamcloud - gitweb
Merge from posix_stable.
[fs/lustre-release.git] / lustre / llite / namei.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * This code is issued under the GNU General Public License.
5  * See the file COPYING in this distribution
6  *
7  * Copyright (C) 1992, 1993, 1994, 1995
8  * Remy Card (card@masi.ibp.fr)
9  * Laboratoire MASI - Institut Blaise Pascal
10  * Universite Pierre et Marie Curie (Paris VI)
11  *
12  *  from
13  *
14  *  linux/fs/ext2/namei.c
15  *
16  *  Copyright (C) 1991, 1992  Linus Torvalds
17  *
18  *  Big-endian to little-endian byte-swapping/bitmaps by
19  *        David S. Miller (davem@caip.rutgers.edu), 1995
20  *  Directory entry file type support and forward compatibility hooks
21  *      for B-tree directories by Theodore Ts'o (tytso@mit.edu), 1998
22  *
23  *  Changes for use in OBDFS
24  *  Copyright (c) 1999, Seagate Technology Inc.
25  *  Copyright (C) 2001, Cluster File Systems, Inc.
26  *                       Rewritten based on recent ext2 page cache use.
27  *
28  */
29
30 #include <linux/fs.h>
31 #include <linux/locks.h>
32 #include <linux/quotaops.h>
33
34 #define DEBUG_SUBSYSTEM S_LLITE
35
36 #include <linux/obd_support.h>
37 #include <linux/lustre_lite.h>
38 #include <linux/lustre_dlm.h>
39 extern struct address_space_operations ll_aops;
40
41 /* from super.c */
42 extern void ll_change_inode(struct inode *inode);
43 extern int ll_setattr(struct dentry *de, struct iattr *attr);
44
45 /* from dir.c */
46 extern int ll_add_link (struct dentry *dentry, struct inode *inode);
47 ino_t ll_inode_by_name(struct inode * dir, struct dentry *dentry, int *typ);
48 int ext2_make_empty(struct inode *inode, struct inode *parent);
49 struct ext2_dir_entry_2 * ext2_find_entry (struct inode * dir,
50                    struct dentry *dentry, struct page ** res_page);
51 int ext2_delete_entry (struct ext2_dir_entry_2 * dir, struct page * page );
52 int ext2_empty_dir (struct inode * inode);
53 struct ext2_dir_entry_2 * ext2_dotdot (struct inode *dir, struct page **p);
54 void ext2_set_link(struct inode *dir, struct ext2_dir_entry_2 *de,
55                    struct page *page, struct inode *inode);
56
57 /*
58  * Couple of helper functions - make the code slightly cleaner.
59  */
60 static inline void ext2_inc_count(struct inode *inode)
61 {
62         inode->i_nlink++;
63 }
64
65 /* postpone the disk update until the inode really goes away */
66 static inline void ext2_dec_count(struct inode *inode)
67 {
68         inode->i_nlink--;
69 }
70
71 static inline int ext2_add_nondir(struct dentry *dentry, struct inode *inode)
72 {
73         int err;
74         err = ll_add_link(dentry, inode);
75         if (!err) {
76                 d_instantiate(dentry, inode);
77                 return 0;
78         }
79         ext2_dec_count(inode);
80         iput(inode);
81         return err;
82 }
83
84 /* methods */
85 static int ll_find_inode(struct inode *inode, unsigned long ino, void *opaque)
86 {
87         struct mds_body *body = (struct mds_body *)opaque;
88
89         if (inode->i_generation != body->generation)
90                 return 0;
91
92         return 1;
93 }
94
95 extern struct dentry_operations ll_d_ops;
96
97 int ll_lock(struct inode *dir, struct dentry *dentry,
98             struct lookup_intent *it, struct lustre_handle *lockh)
99 {
100         struct ll_sb_info *sbi = ll_i2sbi(dir);
101         int err;
102
103         if ((it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_SETATTR |
104                           IT_MKNOD)) )
105                 err = mdc_enqueue(&sbi->ll_mdc_conn, LDLM_MDSINTENT,
106                                   it, LCK_PW, dir, dentry, lockh, 0, NULL, 0,
107                                   dir, sizeof(*dir));
108         else if (it->it_op & (IT_READDIR | IT_GETATTR | IT_OPEN | IT_UNLINK))
109                 err = mdc_enqueue(&sbi->ll_mdc_conn, LDLM_MDSINTENT,
110                                   it, LCK_PR, dir, dentry, lockh, 0, NULL, 0,
111                                   dir, sizeof(*dir));
112
113         else
114                 LBUG();
115
116         RETURN(err);
117 }
118
119 int ll_unlock(__u32 mode, struct lustre_handle *lockh)
120 {
121         struct ldlm_lock *lock;
122         ENTRY;
123
124         lock = lustre_handle2object(lockh);
125         ldlm_lock_decref(lock, mode);
126
127         RETURN(0);
128 }
129
130 static struct dentry *ll_lookup2(struct inode * dir, struct dentry *dentry,
131                                  struct lookup_intent *it)
132 {
133         struct ptlrpc_request *request = NULL;
134         struct inode * inode = NULL;
135         struct ll_sb_info *sbi = ll_i2sbi(dir);
136         struct ll_inode_md md;
137         struct lustre_handle lockh;
138         int err, type, offset;
139         ino_t ino;
140
141         ENTRY;
142
143         CDEBUG(D_INFO, "name: %*s, intent op: %d\n", dentry->d_name.len,
144                dentry->d_name.name, it->it_op);
145
146         if (dentry->d_name.len > EXT2_NAME_LEN)
147                 RETURN(ERR_PTR(-ENAMETOOLONG));
148
149         err = ll_lock(dir, dentry, it, &lockh);
150         memcpy(it->it_lock_handle, &lockh, sizeof(lockh));
151
152         if ( (it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_MKNOD)) &&
153              it->it_disposition && !it->it_status)
154                 GOTO(negative, NULL);
155
156         if ( (it->it_op & (IT_GETATTR | IT_UNLINK)) &&
157              it->it_disposition && it->it_status)
158                 GOTO(negative, NULL);
159
160         if (!it->it_disposition) {
161                 struct ll_inode_info *lli = ll_i2info(dir);
162                 memcpy(&lli->lli_intent_lock_handle, &lockh, sizeof(lockh));
163
164                 ino = ll_inode_by_name(dir, dentry, &type);
165
166                 err = mdc_getattr(&sbi->ll_mdc_conn, ino, type,
167                                   OBD_MD_FLNOTOBD|OBD_MD_FLBLOCKS, 0, &request);
168                 if (err) {
169                         CERROR("failure %d inode %ld\n", err, (long)ino);
170                         ptlrpc_free_req(request);
171                         RETURN(ERR_PTR(-abs(err)));
172                 }
173                 offset = 0;
174         } else if (it->it_op == IT_UNLINK) { 
175                 struct obdo *obdo;
176                 request = (struct ptlrpc_request *)it->it_data;
177                 obdo = lustre_msg_buf(request->rq_repmsg, 1);
178                 inode = new_inode(dir->i_sb);
179                 ll_i2info(inode)->lli_obdo = obdo_alloc();
180
181                 /* XXX fix mem allocation error */
182                 memcpy(ll_i2info(inode)->lli_obdo, obdo, sizeof(*obdo));
183
184                 if (!inode) 
185                         GOTO(out_req, -ENOMEM);
186                 inode->i_mode= S_IFREG;
187                 inode->i_nlink = 1;
188                 GOTO(out_req, 0);
189         } else {
190                 struct mds_body *body;
191
192                 offset = 1;
193                 request = (struct ptlrpc_request *)it->it_data;
194                 body = lustre_msg_buf(request->rq_repmsg, 1);
195                 type = body->mode;
196         }
197
198         if (S_ISREG(type)) {
199                 if (request->rq_repmsg->bufcount < offset + 2 ||
200                     request->rq_repmsg->buflens[offset + 1] !=
201                     sizeof(struct obdo))
202                         LBUG();
203
204                 md.obdo = lustre_msg_buf(request->rq_repmsg, offset + 1);
205         } else
206                 md.obdo = NULL;
207
208         md.body = lustre_msg_buf(request->rq_repmsg, offset);
209
210         inode = iget4(dir->i_sb, ino, ll_find_inode, &md);
211
212         if (it->it_op & IT_RENAME)
213                 it->it_data = dentry;
214
215  out_req:
216         ptlrpc_free_req(request);
217         if (!inode)
218                 RETURN(ERR_PTR(-ENOMEM));
219
220         EXIT;
221  negative:
222         dentry->d_op = &ll_d_ops;
223         d_add(dentry, inode);
224         return NULL;
225 }
226
227 static struct inode *ll_create_node(struct inode *dir, const char *name,
228                                     int namelen, const char *tgt, int tgtlen,
229                                     int mode, __u64 extra,
230                                     struct lookup_intent *it, struct obdo *obdo)
231 {
232         struct inode *inode;
233         struct ptlrpc_request *request = NULL;
234         struct mds_body *body;
235         int rc;
236         time_t time = CURRENT_TIME;
237         struct ll_sb_info *sbi = ll_i2sbi(dir);
238         int gid = current->fsgid;
239         struct ll_inode_md md;
240
241         ENTRY;
242
243         if (dir->i_mode & S_ISGID) {
244                 gid = dir->i_gid;
245                 if (S_ISDIR(mode))
246                         mode |= S_ISGID;
247         }
248
249         if (!it->it_disposition) {
250                 rc = mdc_create(&sbi->ll_mdc_conn, dir, name, namelen, tgt,
251                                  tgtlen, mode, current->fsuid,
252                                  gid, time, extra, obdo, &request);
253                 if (rc) {
254                         inode = ERR_PTR(rc);
255                         GOTO(out, rc);
256                 }
257                 body = lustre_msg_buf(request->rq_repmsg, 0);
258                 md.obdo = obdo;
259         } else {
260                 request = it->it_data;
261                 body = lustre_msg_buf(request->rq_repmsg, 1);
262                 md.obdo = NULL;
263         }
264
265         body->valid = OBD_MD_FLNOTOBD;
266
267         body->nlink = 1;
268         body->atime = body->ctime = body->mtime = time;
269         body->uid = current->fsuid;
270         body->gid = gid;
271         body->mode = mode;
272
273         md.body = body;
274
275         inode = iget4(dir->i_sb, body->ino, ll_find_inode, &md);
276         if (IS_ERR(inode)) {
277                 rc = PTR_ERR(inode);
278                 CERROR("new_inode -fatal: rc %d\n", rc);
279                 LBUG();
280                 GOTO(out, rc);
281         }
282
283         if (!list_empty(&inode->i_dentry)) {
284                 CERROR("new_inode -fatal: inode %d, ct %d lnk %d\n",
285                        body->ino, atomic_read(&inode->i_count),
286                        inode->i_nlink);
287                 iput(inode);
288                 LBUG();
289                 inode = ERR_PTR(-EIO);
290                 GOTO(out, -EIO);
291         }
292
293         EXIT;
294  out:
295         ptlrpc_free_req(request);
296         return inode;
297 }
298
299 int ll_mdc_unlink(struct inode *dir, struct inode *child,
300                   const char *name, int len)
301 {
302         struct ptlrpc_request *request = NULL;
303         int err;
304         struct ll_sb_info *sbi = ll_i2sbi(dir);
305
306         ENTRY;
307
308         err = mdc_unlink(&sbi->ll_mdc_conn, dir, child,
309                          name, len, &request);
310         ptlrpc_free_req(request);
311
312         RETURN(err);
313 }
314
315 int ll_mdc_link(struct dentry *src, struct inode *dir,
316                 const char *name, int len)
317 {
318         struct ptlrpc_request *request = NULL;
319         int err;
320         struct ll_sb_info *sbi = ll_i2sbi(dir);
321
322         ENTRY;
323
324         err = mdc_link(&sbi->ll_mdc_conn, src, dir, name,
325                        len, &request);
326         ptlrpc_free_req(request);
327
328         RETURN(err);
329 }
330
331 int ll_mdc_rename(struct inode *src, struct inode *tgt,
332                   struct dentry *old, struct dentry *new)
333 {
334         struct ptlrpc_request *request = NULL;
335         struct ll_sb_info *sbi = ll_i2sbi(src);
336         int err;
337
338         ENTRY;
339
340         err = mdc_rename(&sbi->ll_mdc_conn, src, tgt,
341                          old->d_name.name, old->d_name.len,
342                          new->d_name.name, new->d_name.len, &request);
343         ptlrpc_free_req(request);
344
345         RETURN(err);
346 }
347
348 /*
349  * By the time this is called, we already have created
350  * the directory cache entry for the new file, but it
351  * is so far negative - it has no inode.
352  *
353  * If the create succeeds, we fill in the inode information
354  * with d_instantiate().
355  */
356
357 static int ll_create(struct inode * dir, struct dentry * dentry, int mode)
358 {
359         int err, rc = 0;
360         struct obdo oa;
361         struct inode *inode;
362
363         if (dentry->d_it->it_disposition == 0) {
364                 memset(&oa, 0, sizeof(oa));
365                 oa.o_valid = OBD_MD_FLMODE;
366                 oa.o_mode = S_IFREG | 0600;
367                 rc = obd_create(ll_i2obdconn(dir), &oa);
368                 if (rc)
369                         RETURN(rc);
370         }
371
372         mode = mode | S_IFREG;
373         CDEBUG(D_DENTRY, "name %s mode %o o_id %lld\n",
374                dentry->d_name.name, mode, (unsigned long long)oa.o_id);
375         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
376                                NULL, 0, mode, 0, dentry->d_it, &oa);
377
378         if (IS_ERR(inode)) {
379                 rc = PTR_ERR(inode);
380                 CERROR("error creating MDS object for id %Ld: rc = %d\n",
381                        (unsigned long long)oa.o_id, rc);
382                 GOTO(out_destroy, rc);
383         }
384
385         if (dentry->d_it->it_disposition) {
386                 struct ll_inode_info *ii = ll_i2info(inode);
387                 ii->lli_flags |= OBD_FL_CREATEONOPEN;
388                 memcpy(&ii->lli_intent_lock_handle,
389                        dentry->d_it->it_lock_handle,
390                        sizeof(struct lustre_handle));
391         }
392
393         /* no directory data updates when intents rule */
394         if (dentry->d_it->it_disposition == 0)
395                 rc = ext2_add_nondir(dentry, inode);
396         else
397                 d_instantiate(dentry, inode);
398         RETURN(rc);
399
400 out_destroy:
401         err = obd_destroy(ll_i2obdconn(dir), &oa);
402         if (err)
403                 CERROR("error destroying object %Ld in error path: err = %d\n",
404                        (unsigned long long)oa.o_id, err);
405         return rc;
406 }
407
408 static int ll_mknod(struct inode *dir, struct dentry *dentry, int mode,
409                     int rdev)
410 {
411         struct inode * inode = ll_create_node(dir, dentry->d_name.name,
412                                               dentry->d_name.len, NULL, 0,
413                                               mode, rdev, NULL, NULL);
414         int err = PTR_ERR(inode);
415         if (!IS_ERR(inode))
416                 err = ext2_add_nondir(dentry, inode);
417         return err;
418 }
419
420 static int ll_symlink(struct inode *dir, struct dentry *dentry,
421                       const char *symname)
422 {
423         int err = -ENAMETOOLONG;
424         unsigned l = strlen(symname);
425         struct inode * inode;
426         struct ll_inode_info *oinfo;
427
428         if (l > LL_INLINESZ)
429                 return err;
430
431         inode = ll_create_node(dir, dentry->d_name.name,
432                                dentry->d_name.len, symname, l,
433                                S_IFLNK | S_IRWXUGO, 0, dentry->d_it, NULL);
434         err = PTR_ERR(inode);
435         if (IS_ERR(inode))
436                 return err;
437
438         oinfo = ll_i2info(inode);
439
440         memcpy(oinfo->lli_inline, symname, l);
441         inode->i_size = l-1;
442
443         err = ext2_add_nondir(dentry, inode);
444
445         if (err) {
446                 ext2_dec_count(inode);
447                 iput (inode);
448         }
449         return err;
450 }
451
452 static int ll_link(struct dentry * old_dentry, struct inode * dir,
453                    struct dentry *dentry)
454 {
455         int err;
456         struct inode *inode = old_dentry->d_inode;
457
458         if (S_ISDIR(inode->i_mode))
459                 return -EPERM;
460
461         if (inode->i_nlink >= EXT2_LINK_MAX)
462                 return -EMLINK;
463
464         err = ll_mdc_link(old_dentry, dir,
465                           dentry->d_name.name, dentry->d_name.len);
466         if (err) {
467                 EXIT;
468                 return err;
469         }
470
471         inode->i_ctime = CURRENT_TIME;
472         ext2_inc_count(inode);
473         atomic_inc(&inode->i_count);
474
475         return ext2_add_nondir(dentry, inode);
476 }
477
478 static int ll_mkdir(struct inode * dir, struct dentry * dentry, int mode)
479 {
480         struct inode * inode;
481         int err = -EMLINK;
482         ENTRY;
483
484         if (dir->i_nlink >= EXT2_LINK_MAX)
485                 goto out;
486
487         ext2_inc_count(dir);
488
489         inode = ll_create_node (dir, dentry->d_name.name,
490                                 dentry->d_name.len, NULL, 0,
491                                 S_IFDIR | mode, 0, dentry->d_it, NULL);
492         err = PTR_ERR(inode);
493         if (IS_ERR(inode))
494                 goto out_dir;
495
496         inode->i_nlink = 1;
497         ext2_inc_count(inode);
498
499         err = ext2_make_empty(inode, dir);
500         if (err)
501                 goto out_fail;
502
503         /* no directory data updates when intents rule */
504         if (dentry->d_it->it_disposition == 0) {
505                 err = ll_add_link(dentry, inode);
506                 if (err)
507                         goto out_fail;
508         }
509
510         d_instantiate(dentry, inode);
511 out:
512         EXIT;
513         return err;
514
515 out_fail:
516         ext2_dec_count(inode);
517         ext2_dec_count(inode);
518         iput(inode);
519         EXIT;
520 out_dir:
521         ext2_dec_count(dir);
522         EXIT;
523         goto out;
524 }
525
526 static int ll_unlink(struct inode * dir, struct dentry *dentry)
527 {
528         struct inode * inode = dentry->d_inode;
529         struct ext2_dir_entry_2 * de;
530         struct page * page;
531         int err = -ENOENT;
532
533         if (dentry->d_it && dentry->d_it->it_disposition) { 
534                 inode->i_nlink = 0;
535                 GOTO(out, err=0);
536         }
537
538         de = ext2_find_entry (dir, dentry, &page);
539         if (!de)
540                 goto out;
541
542         err = ll_mdc_unlink(dir, dentry->d_inode,
543                             dentry->d_name.name, dentry->d_name.len);
544         if (err)
545                 goto out;
546
547         err = ext2_delete_entry (de, page);
548         if (err)
549                 goto out;
550
551         inode->i_ctime = dir->i_ctime;
552         ext2_dec_count(inode);
553         err = 0;
554 out:
555         return err;
556 }
557
558 static int ll_rmdir(struct inode * dir, struct dentry *dentry)
559 {
560         struct inode * inode = dentry->d_inode;
561         int err = -ENOTEMPTY;
562
563         if (ext2_empty_dir(inode)) {
564                 err = ll_unlink(dir, dentry);
565                 if (!err) {
566                         inode->i_size = 0;
567                         ext2_dec_count(inode);
568                         ext2_dec_count(dir);
569                 }
570         }
571         return err;
572 }
573
574 static int ll_rename (struct inode * old_dir, struct dentry * old_dentry,
575                       struct inode * new_dir, struct dentry * new_dentry )
576 {
577         struct inode * old_inode = old_dentry->d_inode;
578         struct inode * new_inode = new_dentry->d_inode;
579         struct page * dir_page = NULL;
580         struct ext2_dir_entry_2 * dir_de = NULL;
581         struct page * old_page;
582         struct ext2_dir_entry_2 * old_de;
583         int err = -ENOENT;
584
585         if (new_dentry->d_it) {
586                 struct ptlrpc_request *req = new_dentry->d_it->it_data;
587                 err = req->rq_status;
588                 goto out;
589         }
590
591         err = ll_mdc_rename(old_dir, new_dir, old_dentry, new_dentry);
592         if (err)
593                 goto out;
594
595         old_de = ext2_find_entry (old_dir, old_dentry, &old_page);
596         if (!old_de)
597                 goto out;
598
599         if (S_ISDIR(old_inode->i_mode)) {
600                 err = -EIO;
601                 dir_de = ext2_dotdot(old_inode, &dir_page);
602                 if (!dir_de)
603                         goto out_old;
604         }
605
606         if (new_inode) {
607                 struct page *new_page;
608                 struct ext2_dir_entry_2 *new_de;
609
610                 err = -ENOTEMPTY;
611                 if (dir_de && !ext2_empty_dir (new_inode))
612                         goto out_dir;
613
614                 err = -ENOENT;
615                 new_de = ext2_find_entry (new_dir, new_dentry, &new_page);
616                 if (!new_de)
617                         goto out_dir;
618                 ext2_inc_count(old_inode);
619                 ext2_set_link(new_dir, new_de, new_page, old_inode);
620                 new_inode->i_ctime = CURRENT_TIME;
621                 if (dir_de)
622                         new_inode->i_nlink--;
623                 ext2_dec_count(new_inode);
624         } else {
625                 if (dir_de) {
626                         err = -EMLINK;
627                         if (new_dir->i_nlink >= EXT2_LINK_MAX)
628                                 goto out_dir;
629                 }
630                 ext2_inc_count(old_inode);
631                 err = ll_add_link(new_dentry, old_inode);
632                 if (err) {
633                         ext2_dec_count(old_inode);
634                         goto out_dir;
635                 }
636                 if (dir_de)
637                         ext2_inc_count(new_dir);
638         }
639
640         ext2_delete_entry (old_de, old_page);
641         ext2_dec_count(old_inode);
642
643         if (dir_de) {
644                 ext2_set_link(old_inode, dir_de, dir_page, new_dir);
645                 ext2_dec_count(old_dir);
646         }
647         return 0;
648
649 out_dir:
650         if (dir_de) {
651                 kunmap(dir_page);
652                 page_cache_release(dir_page);
653         }
654 out_old:
655         kunmap(old_page);
656         page_cache_release(old_page);
657 out:
658         return err;
659 }
660
661 struct inode_operations ll_dir_inode_operations = {
662         create:         ll_create,
663         lookup2:        ll_lookup2,
664         link:           ll_link,
665         unlink:         ll_unlink,
666         symlink:        ll_symlink,
667         mkdir:          ll_mkdir,
668         rmdir:          ll_rmdir,
669         mknod:          ll_mknod,
670         rename:         ll_rename,
671         setattr:        ll_setattr
672 };