Whamcloud - gitweb
7a439766228fe24dbd6839e844712ab14da83292
[fs/lustre-release.git] / lustre / llite / namei.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * This code is issued under the GNU General Public License.
5  * See the file COPYING in this distribution
6  *
7  * Copyright (C) 1992, 1993, 1994, 1995
8  * Remy Card (card@masi.ibp.fr)
9  * Laboratoire MASI - Institut Blaise Pascal
10  * Universite Pierre et Marie Curie (Paris VI)
11  *
12  *  from
13  *
14  *  linux/fs/ext2/namei.c
15  *
16  *  Copyright (C) 1991, 1992  Linus Torvalds
17  *
18  *  Big-endian to little-endian byte-swapping/bitmaps by
19  *        David S. Miller (davem@caip.rutgers.edu), 1995
20  *  Directory entry file type support and forward compatibility hooks
21  *      for B-tree directories by Theodore Ts'o (tytso@mit.edu), 1998
22  *
23  *  Changes for use in OBDFS
24  *  Copyright (c) 1999, Seagate Technology Inc.
25  *  Copyright (C) 2001, Cluster File Systems, Inc.
26  *                       Rewritten based on recent ext2 page cache use.
27  *
28  */
29
30 #include <linux/fs.h>
31 #include <linux/locks.h>
32 #include <linux/quotaops.h>
33
34 #define DEBUG_SUBSYSTEM S_LLITE
35
36 #include <linux/obd_support.h>
37 #include <linux/lustre_lite.h>
38 #include <linux/lustre_dlm.h>
39 extern struct address_space_operations ll_aops;
40
41 /* from super.c */
42 extern void ll_change_inode(struct inode *inode);
43 extern int ll_setattr(struct dentry *de, struct iattr *attr);
44
45 /* from dir.c */
46 extern int ll_add_link (struct dentry *dentry, struct inode *inode);
47 obd_id ll_inode_by_name(struct inode * dir, struct dentry *dentry, int *typ);
48 int ext2_make_empty(struct inode *inode, struct inode *parent);
49 struct ext2_dir_entry_2 * ext2_find_entry (struct inode * dir,
50                    struct dentry *dentry, struct page ** res_page);
51 int ext2_delete_entry (struct ext2_dir_entry_2 * dir, struct page * page );
52 int ext2_empty_dir (struct inode * inode);
53 struct ext2_dir_entry_2 * ext2_dotdot (struct inode *dir, struct page **p);
54 void ext2_set_link(struct inode *dir, struct ext2_dir_entry_2 *de,
55                    struct page *page, struct inode *inode);
56
57 /*
58  * Couple of helper functions - make the code slightly cleaner.
59  */
60 static inline void ext2_inc_count(struct inode *inode)
61 {
62         inode->i_nlink++;
63 }
64
65 /* postpone the disk update until the inode really goes away */
66 static inline void ext2_dec_count(struct inode *inode)
67 {
68         inode->i_nlink--;
69 }
70
71 static inline int ext2_add_nondir(struct dentry *dentry, struct inode *inode)
72 {
73         int err;
74         err = ll_add_link(dentry, inode);
75         if (!err) {
76                 d_instantiate(dentry, inode);
77                 return 0;
78         }
79         ext2_dec_count(inode);
80         iput(inode);
81         return err;
82 }
83
84 /* methods */
85 static int ll_find_inode(struct inode *inode, unsigned long ino, void *opaque)
86 {
87         struct mds_body *body = (struct mds_body *)opaque;
88
89         if (inode->i_generation != body->generation)
90                 return 0;
91
92         return 1;
93 }
94
95 extern struct dentry_operations ll_d_ops;
96
97 int ll_lock(struct inode *dir, struct dentry *dentry,
98             struct lookup_intent *it, struct lustre_handle *lockh)
99 {
100         struct ll_sb_info *sbi = ll_i2sbi(dir);
101         int err, lock_mode;
102
103         if ((it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_SETATTR |
104                           IT_MKNOD)))
105                 lock_mode = LCK_PW;
106         else if (it->it_op & (IT_READDIR | IT_GETATTR | IT_OPEN | IT_UNLINK |
107                               IT_RMDIR | IT_RENAME | IT_RENAME2 | IT_READLINK))
108                 lock_mode = LCK_PR;
109         else if (it->it_op & IT_LOOKUP)
110                 lock_mode = LCK_CR;
111         else {
112                 LBUG();
113                 RETURN(-EINVAL);
114         }
115
116 #warning FIXME: add symlink tgt to intent and as a parameter here
117         err = mdc_enqueue(&sbi->ll_mdc_conn, LDLM_MDSINTENT, it, lock_mode, dir,
118                           dentry, lockh, 0, NULL, 0, dir, sizeof(*dir));
119
120         RETURN(err);
121 }
122
123 int ll_unlock(__u32 mode, struct lustre_handle *lockh)
124 {
125         ENTRY;
126
127         ldlm_lock_decref(lockh, mode);
128
129         RETURN(0);
130 }
131
132 static struct dentry *ll_lookup2(struct inode * dir, struct dentry *dentry,
133                                  struct lookup_intent *it)
134 {
135         struct ptlrpc_request *request = NULL;
136         struct inode * inode = NULL;
137         struct ll_sb_info *sbi = ll_i2sbi(dir);
138         struct ll_inode_md md;
139         struct lustre_handle lockh;
140         int err, type, offset;
141         struct lookup_intent lookup_it = { IT_LOOKUP };
142         obd_id ino = 0;
143
144         ENTRY;
145
146         if (it == NULL) {
147                 it = &lookup_it;
148                 dentry->d_it = it;
149         }
150
151         CDEBUG(D_INFO, "name: %*s, intent op: %d\n", dentry->d_name.len,
152                dentry->d_name.name, it->it_op);
153
154         if (dentry->d_name.len > EXT2_NAME_LEN)
155                 RETURN(ERR_PTR(-ENAMETOOLONG));
156
157         err = ll_lock(dir, dentry, it, &lockh);
158         if (err < 0)
159                 RETURN(ERR_PTR(err));
160         memcpy(it->it_lock_handle, &lockh, sizeof(lockh));
161
162         if (it->it_disposition) {
163                 offset = 1;
164                 if (it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_MKNOD)) {
165                         /* For create ops, we want the lookup to be negative */
166                         request = (struct ptlrpc_request *)it->it_data;
167                         if (!it->it_status)
168                                 GOTO(negative, NULL);
169                         //else
170                         //        GOTO(err, it->it_status);
171                 } else if (it->it_op & (IT_RENAME | IT_GETATTR | IT_UNLINK |
172                                         IT_RMDIR | IT_SETATTR | IT_LOOKUP |
173                                         IT_OPEN)) {
174                         /* For remove/check, we want the lookup to succeed */
175                         request = (struct ptlrpc_request *)it->it_data;
176                         if (it->it_status)
177                                 GOTO(negative, NULL);
178                         //else
179                         //        GOTO(err, it->it_status);
180                 } else if (it->it_op == IT_RENAME2) {
181                         /* Set below to be a dentry from the IT_RENAME op */
182                         inode = ((struct dentry *)(it->it_data))->d_inode;
183                         GOTO(out_req, NULL);
184                 }
185         } else {
186                 struct ll_inode_info *lli = ll_i2info(dir);
187                 request = (struct ptlrpc_request *)it->it_data;
188                 memcpy(&lli->lli_intent_lock_handle, &lockh, sizeof(lockh));
189                 offset = 0;
190
191                 ino = ll_inode_by_name(dir, dentry, &type);
192 #warning FIXME: handle negative inode case (see old ll_lookup)
193
194                 err = mdc_getattr(&sbi->ll_mdc_conn, ino, type,
195                                   OBD_MD_FLNOTOBD|OBD_MD_FLEASIZE, 0, &request);
196                 if (err) {
197                         CERROR("failure %d inode %Ld\n", err, (long long)ino);
198                         ptlrpc_free_req(request);
199                         RETURN(ERR_PTR(-abs(err)));
200                 }
201         }
202
203         md.body = lustre_msg_buf(request->rq_repmsg, offset);
204         if (S_ISREG(md.body->mode)) {
205                 if (request->rq_repmsg->bufcount < offset + 1)
206                         LBUG();
207                 md.md = lustre_msg_buf(request->rq_repmsg, offset + 1);
208         } else
209                 md.md = NULL;
210
211         /* No rpc's happen during iget4, -ENOMEM's are possible */
212         inode = iget4(dir->i_sb, ino, ll_find_inode, &md);
213         if (it->it_op & IT_RENAME)
214                 it->it_data = dentry;
215
216  out_req:
217         ptlrpc_free_req(request);
218         request = NULL;
219         if (!inode || IS_ERR(inode)) {
220                 ll_intent_release(dentry);
221                 RETURN(ERR_PTR(-ENOMEM));
222         }
223         EXIT;
224  negative:
225         dentry->d_op = &ll_d_ops;
226         d_add(dentry, inode);
227         if (it->it_op == IT_LOOKUP || (it->it_op == IT_OPEN && it->it_status)) {
228                 ll_intent_release(dentry);
229                 ptlrpc_free_req(request);
230         }
231
232         return NULL;
233 }
234
235 static struct inode *ll_create_node(struct inode *dir, const char *name,
236                                     int namelen, const char *tgt, int tgtlen,
237                                     int mode, __u64 extra,
238                                     struct lookup_intent *it,
239                                     struct lov_stripe_md *smd)
240 {
241         struct inode *inode;
242         struct ptlrpc_request *request = NULL;
243         struct mds_body *body;
244         int rc;
245         time_t time = CURRENT_TIME;
246         struct ll_sb_info *sbi = ll_i2sbi(dir);
247         int gid = current->fsgid;
248         struct ll_inode_md md;
249
250         ENTRY;
251
252         if (dir->i_mode & S_ISGID) {
253                 gid = dir->i_gid;
254                 if (S_ISDIR(mode))
255                         mode |= S_ISGID;
256         }
257
258         if (!it || !it->it_disposition) {
259                 rc = mdc_create(&sbi->ll_mdc_conn, dir, name, namelen, tgt,
260                                  tgtlen, mode, current->fsuid,
261                                  gid, time, extra, smd, &request);
262                 if (rc) {
263                         inode = ERR_PTR(rc);
264                         GOTO(out, rc);
265                 }
266                 body = lustre_msg_buf(request->rq_repmsg, 0);
267                 md.md = smd;
268         } else {
269                 request = it->it_data;
270                 body = lustre_msg_buf(request->rq_repmsg, 1);
271                 md.md = NULL;
272         }
273
274         body->valid = OBD_MD_FLNOTOBD;
275
276         body->nlink = 1;
277         body->atime = body->ctime = body->mtime = time;
278         body->uid = current->fsuid;
279         body->gid = gid;
280         body->mode = mode;
281
282         md.body = body;
283
284         inode = iget4(dir->i_sb, body->ino, ll_find_inode, &md);
285         if (IS_ERR(inode)) {
286                 rc = PTR_ERR(inode);
287                 CERROR("new_inode -fatal: rc %d\n", rc);
288                 LBUG();
289                 GOTO(out, rc);
290         }
291
292         if (!list_empty(&inode->i_dentry)) {
293                 CERROR("new_inode -fatal: inode %d, ct %d lnk %d\n",
294                        body->ino, atomic_read(&inode->i_count),
295                        inode->i_nlink);
296                 iput(inode);
297                 LBUG();
298                 inode = ERR_PTR(-EIO);
299                 GOTO(out, -EIO);
300         }
301
302         EXIT;
303  out:
304         ptlrpc_free_req(request);
305         return inode;
306 }
307
308 int ll_mdc_unlink(struct inode *dir, struct inode *child,
309                   const char *name, int len)
310 {
311         struct ptlrpc_request *request = NULL;
312         int err;
313         struct ll_sb_info *sbi = ll_i2sbi(dir);
314
315         ENTRY;
316
317         err = mdc_unlink(&sbi->ll_mdc_conn, dir, child,
318                          name, len, &request);
319         ptlrpc_free_req(request);
320
321         RETURN(err);
322 }
323
324 int ll_mdc_link(struct dentry *src, struct inode *dir,
325                 const char *name, int len)
326 {
327         struct ptlrpc_request *request = NULL;
328         int err;
329         struct ll_sb_info *sbi = ll_i2sbi(dir);
330
331         ENTRY;
332
333         err = mdc_link(&sbi->ll_mdc_conn, src, dir, name,
334                        len, &request);
335         ptlrpc_free_req(request);
336
337         RETURN(err);
338 }
339
340 int ll_mdc_rename(struct inode *src, struct inode *tgt,
341                   struct dentry *old, struct dentry *new)
342 {
343         struct ptlrpc_request *request = NULL;
344         struct ll_sb_info *sbi = ll_i2sbi(src);
345         int err;
346
347         ENTRY;
348
349         err = mdc_rename(&sbi->ll_mdc_conn, src, tgt,
350                          old->d_name.name, old->d_name.len,
351                          new->d_name.name, new->d_name.len, &request);
352         ptlrpc_free_req(request);
353
354         RETURN(err);
355 }
356
357 /*
358  * By the time this is called, we already have created
359  * the directory cache entry for the new file, but it
360  * is so far negative - it has no inode.
361  *
362  * If the create succeeds, we fill in the inode information
363  * with d_instantiate().
364  */
365
366 static int ll_create(struct inode * dir, struct dentry * dentry, int mode)
367 {
368         int err, rc = 0;
369         struct obdo oa;
370         struct inode *inode;
371         struct lov_stripe_md *smd;
372         struct ll_inode_info *ii = NULL;
373         ENTRY;
374
375         if (dentry->d_it->it_disposition == 0) {
376                 memset(&oa, 0, sizeof(oa));
377                 oa.o_valid = OBD_MD_FLMODE;
378                 oa.o_mode = S_IFREG | 0600;
379                 rc = obd_create(ll_i2obdconn(dir), &oa, &smd);
380                 CDEBUG(D_DENTRY, "name %s mode %o o_id %lld: rc = %d\n",
381                        dentry->d_name.name, mode, (long long)oa.o_id, rc);
382                 if (rc)
383                         RETURN(rc);
384         }
385
386         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
387                                NULL, 0, mode, 0, dentry->d_it, smd);
388
389         if (IS_ERR(inode)) {
390                 rc = PTR_ERR(inode);
391                 CERROR("error creating MDS object for id %Ld: rc = %d\n",
392                        (unsigned long long)oa.o_id, rc);
393 #warning FIXME: 'ii' needs to be set before this goto
394                 GOTO(out_destroy, rc);
395         }
396
397         if (dentry->d_it->it_disposition) {
398                 ii = ll_i2info(inode);
399                 ii->lli_flags |= OBD_FL_CREATEONOPEN;
400                 memcpy(&ii->lli_intent_lock_handle,
401                        dentry->d_it->it_lock_handle,
402                        sizeof(struct lustre_handle));
403         }
404
405         /* no directory data updates when intents rule */
406         if (dentry->d_it->it_disposition == 0)
407                 rc = ext2_add_nondir(dentry, inode);
408         else
409                 d_instantiate(dentry, inode);
410         RETURN(rc);
411
412 out_destroy:
413 #warning FIXME: what about ii???
414         oa.o_easize = ii->lli_smd->lmd_easize;
415         err = obd_destroy(ll_i2obdconn(dir), &oa, ii->lli_smd);
416         if (err)
417                 CERROR("error destroying object %Ld in error path: err = %d\n",
418                        (unsigned long long)oa.o_id, err);
419         return rc;
420 }
421
422 static int ll_mknod(struct inode *dir, struct dentry *dentry, int mode,
423                     int rdev)
424 {
425         struct inode *inode;
426         int err = 0;
427
428         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
429                                NULL, 0, mode, rdev, dentry->d_it, NULL);
430
431         if (IS_ERR(inode))
432                 RETURN(PTR_ERR(inode));
433
434         /* no directory data updates when intents rule */
435         if (dentry->d_it->it_disposition == 0)
436                 err = ext2_add_nondir(dentry, inode);
437         else
438                 d_instantiate(dentry, inode);
439
440         return err;
441 }
442
443 static int ll_symlink(struct inode *dir, struct dentry *dentry,
444                       const char *symname)
445 {
446         unsigned l = strlen(symname);
447         struct inode *inode;
448         struct ll_inode_info *oinfo;
449
450         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
451                                symname, l, S_IFLNK | S_IRWXUGO, 0,
452                                dentry->d_it, NULL);
453         if (IS_ERR(inode))
454                 RETURN(PTR_ERR(inode));
455
456         oinfo = ll_i2info(inode);
457
458         if (dentry->d_it->it_disposition) {
459                 d_instantiate(dentry, inode);
460                 return 0;
461         }
462
463         OBD_ALLOC(oinfo->lli_symlink_name, l + 1);
464         if (!oinfo->lli_symlink_name)
465                 RETURN(-ENOMEM);
466
467         memcpy(oinfo->lli_symlink_name, symname, l + 1);
468         inode->i_size = l;
469
470         return ext2_add_nondir(dentry, inode);
471 }
472
473 static int ll_link(struct dentry *old_dentry, struct inode * dir,
474                    struct dentry *dentry)
475 {
476         int err;
477         struct inode *inode = old_dentry->d_inode;
478
479         if (S_ISDIR(inode->i_mode))
480                 return -EPERM;
481
482         if (inode->i_nlink >= EXT2_LINK_MAX)
483                 return -EMLINK;
484
485         err = ll_mdc_link(old_dentry, dir,
486                           dentry->d_name.name, dentry->d_name.len);
487         if (err)
488                 RETURN(err);
489
490         inode->i_ctime = CURRENT_TIME;
491         ext2_inc_count(inode);
492         atomic_inc(&inode->i_count);
493
494         return ext2_add_nondir(dentry, inode);
495 }
496
497 static int ll_mkdir(struct inode * dir, struct dentry * dentry, int mode)
498 {
499         struct inode * inode;
500         int err = -EMLINK;
501         ENTRY;
502
503         if (dir->i_nlink >= EXT2_LINK_MAX)
504                 goto out;
505
506         ext2_inc_count(dir);
507
508         inode = ll_create_node (dir, dentry->d_name.name,
509                                 dentry->d_name.len, NULL, 0,
510                                 S_IFDIR | mode, 0, dentry->d_it, NULL);
511         err = PTR_ERR(inode);
512         if (IS_ERR(inode))
513                 goto out_dir;
514
515         ext2_inc_count(inode);
516
517         err = ext2_make_empty(inode, dir);
518         if (err)
519                 goto out_fail;
520
521         /* no directory data updates when intents rule */
522         if (dentry->d_it->it_disposition == 0) {
523                 err = ll_add_link(dentry, inode);
524                 if (err)
525                         goto out_fail;
526         }
527
528         d_instantiate(dentry, inode);
529 out:
530         EXIT;
531         return err;
532
533 out_fail:
534         ext2_dec_count(inode);
535         ext2_dec_count(inode);
536         iput(inode);
537         EXIT;
538 out_dir:
539         ext2_dec_count(dir);
540         EXIT;
541         goto out;
542 }
543
544 static int ll_unlink(struct inode * dir, struct dentry *dentry)
545 {
546         struct inode * inode = dentry->d_inode;
547         struct ext2_dir_entry_2 * de;
548         struct page * page;
549         int err = -ENOENT;
550
551         if (dentry->d_it && dentry->d_it->it_disposition) {
552                 inode->i_nlink = 0;
553                 GOTO(out, err = dentry->d_it->it_status);
554         }
555
556         de = ext2_find_entry (dir, dentry, &page);
557         if (!de)
558                 goto out;
559
560         err = ll_mdc_unlink(dir, dentry->d_inode,
561                             dentry->d_name.name, dentry->d_name.len);
562         if (err)
563                 goto out;
564
565         err = ext2_delete_entry (de, page);
566         if (err)
567                 goto out;
568
569         inode->i_ctime = dir->i_ctime;
570         ext2_dec_count(inode);
571 out:
572         return err;
573 }
574
575 static int ll_rmdir(struct inode * dir, struct dentry *dentry)
576 {
577         struct inode * inode = dentry->d_inode;
578         int err = 0;
579         int intent_did = dentry->d_it && dentry->d_it->it_disposition;
580
581         if (!intent_did) {
582                 if (!ext2_empty_dir(inode))
583                 LBUG();
584
585                 err = ll_unlink(dir, dentry);
586                 if (err)
587                         RETURN(err);
588         } else
589                 err = dentry->d_it->it_status;
590         inode->i_size = 0;
591         ext2_dec_count(inode);
592         ext2_dec_count(dir);
593         RETURN(err);
594 }
595
596 static int ll_rename(struct inode * old_dir, struct dentry * old_dentry,
597                      struct inode * new_dir, struct dentry * new_dentry)
598 {
599         struct inode * old_inode = old_dentry->d_inode;
600         struct inode * new_inode = new_dentry->d_inode;
601         struct page * dir_page = NULL;
602         struct ext2_dir_entry_2 * dir_de = NULL;
603         struct page * old_page;
604         struct ext2_dir_entry_2 * old_de;
605         int err = -ENOENT;
606
607         if (new_dentry->d_it && new_dentry->d_it->it_disposition)
608                 GOTO(out, err = new_dentry->d_it->it_status);
609
610         err = ll_mdc_rename(old_dir, new_dir, old_dentry, new_dentry);
611         if (err)
612                 goto out;
613
614         old_de = ext2_find_entry (old_dir, old_dentry, &old_page);
615         if (!old_de)
616                 goto out;
617
618         if (S_ISDIR(old_inode->i_mode)) {
619                 err = -EIO;
620                 dir_de = ext2_dotdot(old_inode, &dir_page);
621                 if (!dir_de)
622                         goto out_old;
623         }
624
625         if (new_inode) {
626                 struct page *new_page;
627                 struct ext2_dir_entry_2 *new_de;
628
629                 err = -ENOTEMPTY;
630                 if (dir_de && !ext2_empty_dir (new_inode))
631                         goto out_dir;
632
633                 err = -ENOENT;
634                 new_de = ext2_find_entry (new_dir, new_dentry, &new_page);
635                 if (!new_de)
636                         goto out_dir;
637                 ext2_inc_count(old_inode);
638                 ext2_set_link(new_dir, new_de, new_page, old_inode);
639                 new_inode->i_ctime = CURRENT_TIME;
640                 if (dir_de)
641                         new_inode->i_nlink--;
642                 ext2_dec_count(new_inode);
643         } else {
644                 if (dir_de) {
645                         err = -EMLINK;
646                         if (new_dir->i_nlink >= EXT2_LINK_MAX)
647                                 goto out_dir;
648                 }
649                 ext2_inc_count(old_inode);
650                 err = ll_add_link(new_dentry, old_inode);
651                 if (err) {
652                         ext2_dec_count(old_inode);
653                         goto out_dir;
654                 }
655                 if (dir_de)
656                         ext2_inc_count(new_dir);
657         }
658
659         ext2_delete_entry (old_de, old_page);
660         ext2_dec_count(old_inode);
661
662         if (dir_de) {
663                 ext2_set_link(old_inode, dir_de, dir_page, new_dir);
664                 ext2_dec_count(old_dir);
665         }
666         return 0;
667
668 out_dir:
669         if (dir_de) {
670                 kunmap(dir_page);
671                 page_cache_release(dir_page);
672         }
673 out_old:
674         kunmap(old_page);
675         page_cache_release(old_page);
676 out:
677         return err;
678 }
679
680 struct inode_operations ll_dir_inode_operations = {
681         create:         ll_create,
682         lookup2:        ll_lookup2,
683         link:           ll_link,
684         unlink:         ll_unlink,
685         symlink:        ll_symlink,
686         mkdir:          ll_mkdir,
687         rmdir:          ll_rmdir,
688         mknod:          ll_mknod,
689         rename:         ll_rename,
690         setattr:        ll_setattr
691 };