Whamcloud - gitweb
Items of note:
[fs/lustre-release.git] / lustre / llite / namei.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * This code is issued under the GNU General Public License.
5  * See the file COPYING in this distribution
6  *
7  * Copyright (C) 1992, 1993, 1994, 1995
8  * Remy Card (card@masi.ibp.fr)
9  * Laboratoire MASI - Institut Blaise Pascal
10  * Universite Pierre et Marie Curie (Paris VI)
11  *
12  *  from
13  *
14  *  linux/fs/ext2/namei.c
15  *
16  *  Copyright (C) 1991, 1992  Linus Torvalds
17  *
18  *  Big-endian to little-endian byte-swapping/bitmaps by
19  *        David S. Miller (davem@caip.rutgers.edu), 1995
20  *  Directory entry file type support and forward compatibility hooks
21  *      for B-tree directories by Theodore Ts'o (tytso@mit.edu), 1998
22  *
23  *  Changes for use in OBDFS
24  *  Copyright (c) 1999, Seagate Technology Inc.
25  *  Copyright (C) 2001, Cluster File Systems, Inc.
26  *                       Rewritten based on recent ext2 page cache use.
27  *
28  */
29
30 #include <linux/fs.h>
31 #include <linux/locks.h>
32 #include <linux/quotaops.h>
33
34 #define DEBUG_SUBSYSTEM S_LLITE
35
36 #include <linux/obd_support.h>
37 #include <linux/lustre_lite.h>
38 #include <linux/lustre_dlm.h>
39 extern struct address_space_operations ll_aops;
40
41 /* from super.c */
42 extern void ll_change_inode(struct inode *inode);
43 extern int ll_setattr(struct dentry *de, struct iattr *attr);
44
45 /* from dir.c */
46 extern int ll_add_link (struct dentry *dentry, struct inode *inode);
47 obd_id ll_inode_by_name(struct inode * dir, struct dentry *dentry, int *typ);
48 int ext2_make_empty(struct inode *inode, struct inode *parent);
49 struct ext2_dir_entry_2 * ext2_find_entry (struct inode * dir,
50                    struct dentry *dentry, struct page ** res_page);
51 int ext2_delete_entry (struct ext2_dir_entry_2 * dir, struct page * page );
52 int ext2_empty_dir (struct inode * inode);
53 struct ext2_dir_entry_2 * ext2_dotdot (struct inode *dir, struct page **p);
54 void ext2_set_link(struct inode *dir, struct ext2_dir_entry_2 *de,
55                    struct page *page, struct inode *inode);
56
57 /*
58  * Couple of helper functions - make the code slightly cleaner.
59  */
60 static inline void ext2_inc_count(struct inode *inode)
61 {
62         inode->i_nlink++;
63 }
64
65 /* postpone the disk update until the inode really goes away */
66 static inline void ext2_dec_count(struct inode *inode)
67 {
68         inode->i_nlink--;
69 }
70
71 static inline int ext2_add_nondir(struct dentry *dentry, struct inode *inode)
72 {
73         int err;
74         err = ll_add_link(dentry, inode);
75         if (!err) {
76                 d_instantiate(dentry, inode);
77                 return 0;
78         }
79         ext2_dec_count(inode);
80         iput(inode);
81         return err;
82 }
83
84 /* methods */
85 static int ll_find_inode(struct inode *inode, unsigned long ino, void *opaque)
86 {
87         struct mds_body *body = (struct mds_body *)opaque;
88
89         if (inode->i_generation != body->generation)
90                 return 0;
91
92         return 1;
93 }
94
95 extern struct dentry_operations ll_d_ops;
96
97 int ll_lock(struct inode *dir, struct dentry *dentry,
98             struct lookup_intent *it, struct lustre_handle *lockh)
99 {
100         struct ll_sb_info *sbi = ll_i2sbi(dir);
101         int err;
102
103         if ((it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_SETATTR |
104                           IT_MKNOD)) )
105                 err = mdc_enqueue(&sbi->ll_mdc_conn, LDLM_MDSINTENT,
106                                   it, LCK_PW, dir, dentry, lockh, 0, NULL, 0,
107                                   dir, sizeof(*dir));
108         else if (it->it_op & (IT_READDIR | IT_GETATTR | IT_OPEN | IT_UNLINK |
109                               IT_RMDIR | IT_RENAME | IT_RENAME2))
110                 err = mdc_enqueue(&sbi->ll_mdc_conn, LDLM_MDSINTENT,
111                                   it, LCK_PR, dir, dentry, lockh, 0, NULL, 0,
112                                   dir, sizeof(*dir));
113         else {
114                 LBUG();
115                 RETURN(-1);
116         }
117
118         RETURN(err);
119 }
120
121 int ll_unlock(__u32 mode, struct lustre_handle *lockh)
122 {
123         ENTRY;
124
125         ldlm_lock_decref(lockh, mode);
126
127         RETURN(0);
128 }
129
130 static struct dentry *ll_lookup2(struct inode * dir, struct dentry *dentry,
131                                  struct lookup_intent *it)
132 {
133         struct ptlrpc_request *request = NULL;
134         struct inode * inode = NULL;
135         struct ll_sb_info *sbi = ll_i2sbi(dir);
136         struct ll_inode_md md;
137         struct lustre_handle lockh;
138         int err, type, offset;
139         obd_id ino;
140
141         ENTRY;
142
143         if (it == NULL) {
144                 LBUG();
145                 RETURN(NULL);
146         }
147
148         CDEBUG(D_INFO, "name: %*s, intent op: %d\n", dentry->d_name.len,
149                dentry->d_name.name, it->it_op);
150
151         if (dentry->d_name.len > EXT2_NAME_LEN)
152                 RETURN(ERR_PTR(-ENAMETOOLONG));
153
154         err = ll_lock(dir, dentry, it, &lockh);
155         if (err < 0) {
156                 /* FIXME: Mike handle EINTR here */
157                 LBUG();
158                 RETURN(ERR_PTR(err));
159         }
160         memcpy(it->it_lock_handle, &lockh, sizeof(lockh));
161
162         if ((it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_MKNOD)) &&
163             it->it_disposition && !it->it_status)
164                 GOTO(negative, NULL);
165
166         if ((it->it_op & (IT_RENAME | IT_GETATTR | IT_UNLINK | IT_RMDIR)) &&
167             it->it_disposition && it->it_status)
168                 GOTO(negative, NULL);
169
170         request = (struct ptlrpc_request *)it->it_data;
171         if (!it->it_disposition) {
172                 struct ll_inode_info *lli = ll_i2info(dir);
173                 memcpy(&lli->lli_intent_lock_handle, &lockh, sizeof(lockh));
174
175                 ino = ll_inode_by_name(dir, dentry, &type);
176
177                 err = mdc_getattr(&sbi->ll_mdc_conn, ino, type,
178                                   OBD_MD_FLNOTOBD|OBD_MD_FLBLOCKS, 0, &request);
179                 if (err) {
180                         CERROR("failure %d inode %Ld\n", err, (long long)ino);
181                         ptlrpc_free_req(request);
182                         RETURN(ERR_PTR(-abs(err)));
183                 }
184                 offset = 0;
185         } else if (it->it_op == IT_UNLINK) {
186                 struct obdo *obdo;
187                 obdo = lustre_msg_buf(request->rq_repmsg, 1);
188                 inode = new_inode(dir->i_sb);
189
190                 ll_i2info(inode)->lli_obdo = obdo_alloc();
191                 /* XXX fix mem allocation error */
192                 memcpy(ll_i2info(inode)->lli_obdo, obdo, sizeof(*obdo));
193
194                 if (!inode)
195                         GOTO(out_req, -ENOMEM);
196                 inode->i_mode = S_IFREG;
197                 inode->i_nlink = 1;
198                 GOTO(out_req, 0);
199         } else if (it->it_op == IT_RMDIR) {
200                 inode = new_inode(dir->i_sb);
201                 if (!inode)
202                         GOTO(out_req, -ENOMEM);
203                 ll_i2info(inode)->lli_obdo = NULL;
204                 inode->i_mode = S_IFDIR;
205                 inode->i_nlink = 1;
206                 GOTO(out_req, 0);
207         } else if (it->it_op != IT_RENAME2) {
208                 struct mds_body *body;
209
210                 offset = 1;
211                 body = lustre_msg_buf(request->rq_repmsg, 1);
212                 type = body->mode;
213                 ino = body->fid1.id;
214         }
215
216         if (S_ISREG(type)) {
217                 if (request->rq_repmsg->bufcount < offset + 2 ||
218                     request->rq_repmsg->buflens[offset + 1] !=
219                     sizeof(struct obdo))
220                         LBUG();
221
222                 md.obdo = lustre_msg_buf(request->rq_repmsg, offset + 1);
223         } else
224                 md.obdo = NULL;
225
226         if (!(it->it_op & IT_RENAME2))
227                 md.body = lustre_msg_buf(request->rq_repmsg, offset);
228
229         inode = iget4(dir->i_sb, ino, ll_find_inode, &md);
230
231         if (it->it_op & IT_RENAME)
232                 it->it_data = dentry;
233
234  out_req:
235         ptlrpc_free_req(request);
236         if (!inode)
237                 RETURN(ERR_PTR(-ENOMEM));
238
239         EXIT;
240  negative:
241         dentry->d_op = &ll_d_ops;
242         d_add(dentry, inode);
243         return NULL;
244 }
245
246 static struct inode *ll_create_node(struct inode *dir, const char *name,
247                                     int namelen, const char *tgt, int tgtlen,
248                                     int mode, __u64 extra,
249                                     struct lookup_intent *it, struct obdo *obdo)
250 {
251         struct inode *inode;
252         struct ptlrpc_request *request = NULL;
253         struct mds_body *body;
254         int rc;
255         time_t time = CURRENT_TIME;
256         struct ll_sb_info *sbi = ll_i2sbi(dir);
257         int gid = current->fsgid;
258         struct ll_inode_md md;
259
260         ENTRY;
261
262         if (dir->i_mode & S_ISGID) {
263                 gid = dir->i_gid;
264                 if (S_ISDIR(mode))
265                         mode |= S_ISGID;
266         }
267
268         if (!it->it_disposition) {
269                 rc = mdc_create(&sbi->ll_mdc_conn, dir, name, namelen, tgt,
270                                  tgtlen, mode, current->fsuid,
271                                  gid, time, extra, obdo, &request);
272                 if (rc) {
273                         inode = ERR_PTR(rc);
274                         GOTO(out, rc);
275                 }
276                 body = lustre_msg_buf(request->rq_repmsg, 0);
277                 md.obdo = obdo;
278         } else {
279                 request = it->it_data;
280                 body = lustre_msg_buf(request->rq_repmsg, 1);
281                 md.obdo = NULL;
282         }
283
284         body->valid = OBD_MD_FLNOTOBD;
285
286         body->nlink = 1;
287         body->atime = body->ctime = body->mtime = time;
288         body->uid = current->fsuid;
289         body->gid = gid;
290         body->mode = mode;
291
292         md.body = body;
293
294         inode = iget4(dir->i_sb, body->ino, ll_find_inode, &md);
295         if (IS_ERR(inode)) {
296                 rc = PTR_ERR(inode);
297                 CERROR("new_inode -fatal: rc %d\n", rc);
298                 LBUG();
299                 GOTO(out, rc);
300         }
301
302         if (!list_empty(&inode->i_dentry)) {
303                 CERROR("new_inode -fatal: inode %d, ct %d lnk %d\n",
304                        body->ino, atomic_read(&inode->i_count),
305                        inode->i_nlink);
306                 iput(inode);
307                 LBUG();
308                 inode = ERR_PTR(-EIO);
309                 GOTO(out, -EIO);
310         }
311
312         EXIT;
313  out:
314         ptlrpc_free_req(request);
315         return inode;
316 }
317
318 int ll_mdc_unlink(struct inode *dir, struct inode *child,
319                   const char *name, int len)
320 {
321         struct ptlrpc_request *request = NULL;
322         int err;
323         struct ll_sb_info *sbi = ll_i2sbi(dir);
324
325         ENTRY;
326
327         err = mdc_unlink(&sbi->ll_mdc_conn, dir, child,
328                          name, len, &request);
329         ptlrpc_free_req(request);
330
331         RETURN(err);
332 }
333
334 int ll_mdc_link(struct dentry *src, struct inode *dir,
335                 const char *name, int len)
336 {
337         struct ptlrpc_request *request = NULL;
338         int err;
339         struct ll_sb_info *sbi = ll_i2sbi(dir);
340
341         ENTRY;
342
343         err = mdc_link(&sbi->ll_mdc_conn, src, dir, name,
344                        len, &request);
345         ptlrpc_free_req(request);
346
347         RETURN(err);
348 }
349
350 int ll_mdc_rename(struct inode *src, struct inode *tgt,
351                   struct dentry *old, struct dentry *new)
352 {
353         struct ptlrpc_request *request = NULL;
354         struct ll_sb_info *sbi = ll_i2sbi(src);
355         int err;
356
357         ENTRY;
358
359         err = mdc_rename(&sbi->ll_mdc_conn, src, tgt,
360                          old->d_name.name, old->d_name.len,
361                          new->d_name.name, new->d_name.len, &request);
362         ptlrpc_free_req(request);
363
364         RETURN(err);
365 }
366
367 /*
368  * By the time this is called, we already have created
369  * the directory cache entry for the new file, but it
370  * is so far negative - it has no inode.
371  *
372  * If the create succeeds, we fill in the inode information
373  * with d_instantiate().
374  */
375
376 static int ll_create(struct inode * dir, struct dentry * dentry, int mode)
377 {
378         int err, rc = 0;
379         struct obdo oa;
380         struct inode *inode;
381
382         if (dentry->d_it->it_disposition == 0) {
383                 memset(&oa, 0, sizeof(oa));
384                 oa.o_valid = OBD_MD_FLMODE;
385                 oa.o_mode = S_IFREG | 0600;
386                 rc = obd_create(ll_i2obdconn(dir), &oa);
387                 if (rc)
388                         RETURN(rc);
389         }
390
391         mode = mode | S_IFREG;
392         CDEBUG(D_DENTRY, "name %s mode %o o_id %lld\n",
393                dentry->d_name.name, mode, (unsigned long long)oa.o_id);
394         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
395                                NULL, 0, mode, 0, dentry->d_it, &oa);
396
397         if (IS_ERR(inode)) {
398                 rc = PTR_ERR(inode);
399                 CERROR("error creating MDS object for id %Ld: rc = %d\n",
400                        (unsigned long long)oa.o_id, rc);
401                 GOTO(out_destroy, rc);
402         }
403
404         if (dentry->d_it->it_disposition) {
405                 struct ll_inode_info *ii = ll_i2info(inode);
406                 ii->lli_flags |= OBD_FL_CREATEONOPEN;
407                 memcpy(&ii->lli_intent_lock_handle,
408                        dentry->d_it->it_lock_handle,
409                        sizeof(struct lustre_handle));
410         }
411
412         /* no directory data updates when intents rule */
413         if (dentry->d_it->it_disposition == 0)
414                 rc = ext2_add_nondir(dentry, inode);
415         else
416                 d_instantiate(dentry, inode);
417         RETURN(rc);
418
419 out_destroy:
420         err = obd_destroy(ll_i2obdconn(dir), &oa);
421         if (err)
422                 CERROR("error destroying object %Ld in error path: err = %d\n",
423                        (unsigned long long)oa.o_id, err);
424         return rc;
425 }
426
427 static int ll_mknod(struct inode *dir, struct dentry *dentry, int mode,
428                     int rdev)
429 {
430         struct inode * inode = ll_create_node(dir, dentry->d_name.name,
431                                               dentry->d_name.len, NULL, 0,
432                                               mode, rdev, NULL, NULL);
433         int err = PTR_ERR(inode);
434         if (!IS_ERR(inode))
435                 err = ext2_add_nondir(dentry, inode);
436         return err;
437 }
438
439 static int ll_symlink(struct inode *dir, struct dentry *dentry,
440                       const char *symname)
441 {
442         int err = -ENAMETOOLONG;
443         unsigned l = strlen(symname);
444         struct inode * inode;
445         struct ll_inode_info *oinfo;
446
447         inode = ll_create_node(dir, dentry->d_name.name,
448                                dentry->d_name.len, symname, l,
449                                S_IFLNK | S_IRWXUGO, 0, dentry->d_it, NULL);
450         err = PTR_ERR(inode);
451         if (IS_ERR(inode))
452                 return err;
453
454         oinfo = ll_i2info(inode);
455
456         OBD_ALLOC(oinfo->lli_symlink_name, l + 1);
457         memcpy(oinfo->lli_symlink_name, symname, l + 1);
458         inode->i_size = l;
459
460         err = ext2_add_nondir(dentry, inode);
461
462         if (err) {
463                 ext2_dec_count(inode);
464                 iput (inode);
465         }
466         return err;
467 }
468
469 static int ll_link(struct dentry * old_dentry, struct inode * dir,
470                    struct dentry *dentry)
471 {
472         int err;
473         struct inode *inode = old_dentry->d_inode;
474
475         if (S_ISDIR(inode->i_mode))
476                 return -EPERM;
477
478         if (inode->i_nlink >= EXT2_LINK_MAX)
479                 return -EMLINK;
480
481         err = ll_mdc_link(old_dentry, dir,
482                           dentry->d_name.name, dentry->d_name.len);
483         if (err) {
484                 EXIT;
485                 return err;
486         }
487
488         inode->i_ctime = CURRENT_TIME;
489         ext2_inc_count(inode);
490         atomic_inc(&inode->i_count);
491
492         return ext2_add_nondir(dentry, inode);
493 }
494
495 static int ll_mkdir(struct inode * dir, struct dentry * dentry, int mode)
496 {
497         struct inode * inode;
498         int err = -EMLINK;
499         ENTRY;
500
501         if (dir->i_nlink >= EXT2_LINK_MAX)
502                 goto out;
503
504         ext2_inc_count(dir);
505
506         inode = ll_create_node (dir, dentry->d_name.name,
507                                 dentry->d_name.len, NULL, 0,
508                                 S_IFDIR | mode, 0, dentry->d_it, NULL);
509         err = PTR_ERR(inode);
510         if (IS_ERR(inode))
511                 goto out_dir;
512
513         inode->i_nlink = 1;
514         ext2_inc_count(inode);
515
516         err = ext2_make_empty(inode, dir);
517         if (err)
518                 goto out_fail;
519
520         /* no directory data updates when intents rule */
521         if (dentry->d_it->it_disposition == 0) {
522                 err = ll_add_link(dentry, inode);
523                 if (err)
524                         goto out_fail;
525         }
526
527         d_instantiate(dentry, inode);
528 out:
529         EXIT;
530         return err;
531
532 out_fail:
533         ext2_dec_count(inode);
534         ext2_dec_count(inode);
535         iput(inode);
536         EXIT;
537 out_dir:
538         ext2_dec_count(dir);
539         EXIT;
540         goto out;
541 }
542
543 static int ll_unlink(struct inode * dir, struct dentry *dentry)
544 {
545         struct inode * inode = dentry->d_inode;
546         struct ext2_dir_entry_2 * de;
547         struct page * page;
548         int err = -ENOENT;
549
550         if (dentry->d_it && dentry->d_it->it_disposition) {
551                 inode->i_nlink = 0;
552                 GOTO(out, err = dentry->d_it->it_status);
553         }
554
555         de = ext2_find_entry (dir, dentry, &page);
556         if (!de)
557                 goto out;
558
559         err = ll_mdc_unlink(dir, dentry->d_inode,
560                             dentry->d_name.name, dentry->d_name.len);
561         if (err)
562                 goto out;
563
564         err = ext2_delete_entry (de, page);
565         if (err)
566                 goto out;
567
568         inode->i_ctime = dir->i_ctime;
569         ext2_dec_count(inode);
570 out:
571         return err;
572 }
573
574 static int ll_rmdir(struct inode * dir, struct dentry *dentry)
575 {
576         struct inode * inode = dentry->d_inode;
577         int err = 0;
578         int intent_did = dentry->d_it && dentry->d_it->it_disposition;
579
580         if (!intent_did) {
581                 if (!ext2_empty_dir(inode))
582                 LBUG();
583
584                 err = ll_unlink(dir, dentry);
585                 if (err)
586                         RETURN(err);
587         } else
588                 err = dentry->d_it->it_status;
589         inode->i_size = 0;
590         ext2_dec_count(inode);
591         ext2_dec_count(dir);
592         RETURN(err);
593 }
594
595 static int ll_rename(struct inode * old_dir, struct dentry * old_dentry,
596                      struct inode * new_dir, struct dentry * new_dentry)
597 {
598         struct inode * old_inode = old_dentry->d_inode;
599         struct inode * new_inode = new_dentry->d_inode;
600         struct page * dir_page = NULL;
601         struct ext2_dir_entry_2 * dir_de = NULL;
602         struct page * old_page;
603         struct ext2_dir_entry_2 * old_de;
604         int err = -ENOENT;
605
606         if (new_dentry->d_it && new_dentry->d_it->it_disposition)
607                 GOTO(out, err = new_dentry->d_it->it_status);
608
609         err = ll_mdc_rename(old_dir, new_dir, old_dentry, new_dentry);
610         if (err)
611                 goto out;
612
613         old_de = ext2_find_entry (old_dir, old_dentry, &old_page);
614         if (!old_de)
615                 goto out;
616
617         if (S_ISDIR(old_inode->i_mode)) {
618                 err = -EIO;
619                 dir_de = ext2_dotdot(old_inode, &dir_page);
620                 if (!dir_de)
621                         goto out_old;
622         }
623
624         if (new_inode) {
625                 struct page *new_page;
626                 struct ext2_dir_entry_2 *new_de;
627
628                 err = -ENOTEMPTY;
629                 if (dir_de && !ext2_empty_dir (new_inode))
630                         goto out_dir;
631
632                 err = -ENOENT;
633                 new_de = ext2_find_entry (new_dir, new_dentry, &new_page);
634                 if (!new_de)
635                         goto out_dir;
636                 ext2_inc_count(old_inode);
637                 ext2_set_link(new_dir, new_de, new_page, old_inode);
638                 new_inode->i_ctime = CURRENT_TIME;
639                 if (dir_de)
640                         new_inode->i_nlink--;
641                 ext2_dec_count(new_inode);
642         } else {
643                 if (dir_de) {
644                         err = -EMLINK;
645                         if (new_dir->i_nlink >= EXT2_LINK_MAX)
646                                 goto out_dir;
647                 }
648                 ext2_inc_count(old_inode);
649                 err = ll_add_link(new_dentry, old_inode);
650                 if (err) {
651                         ext2_dec_count(old_inode);
652                         goto out_dir;
653                 }
654                 if (dir_de)
655                         ext2_inc_count(new_dir);
656         }
657
658         ext2_delete_entry (old_de, old_page);
659         ext2_dec_count(old_inode);
660
661         if (dir_de) {
662                 ext2_set_link(old_inode, dir_de, dir_page, new_dir);
663                 ext2_dec_count(old_dir);
664         }
665         return 0;
666
667 out_dir:
668         if (dir_de) {
669                 kunmap(dir_page);
670                 page_cache_release(dir_page);
671         }
672 out_old:
673         kunmap(old_page);
674         page_cache_release(old_page);
675 out:
676         return err;
677 }
678
679 struct inode_operations ll_dir_inode_operations = {
680         create:         ll_create,
681         lookup2:        ll_lookup2,
682         link:           ll_link,
683         unlink:         ll_unlink,
684         symlink:        ll_symlink,
685         mkdir:          ll_mkdir,
686         rmdir:          ll_rmdir,
687         mknod:          ll_mknod,
688         rename:         ll_rename,
689         setattr:        ll_setattr
690 };