Whamcloud - gitweb
Many dlm and intent lock fixes.
[fs/lustre-release.git] / lustre / llite / namei.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * This code is issued under the GNU General Public License.
5  * See the file COPYING in this distribution
6  *
7  * Copyright (C) 1992, 1993, 1994, 1995
8  * Remy Card (card@masi.ibp.fr)
9  * Laboratoire MASI - Institut Blaise Pascal
10  * Universite Pierre et Marie Curie (Paris VI)
11  *
12  *  from
13  *
14  *  linux/fs/ext2/namei.c
15  *
16  *  Copyright (C) 1991, 1992  Linus Torvalds
17  *
18  *  Big-endian to little-endian byte-swapping/bitmaps by
19  *        David S. Miller (davem@caip.rutgers.edu), 1995
20  *  Directory entry file type support and forward compatibility hooks
21  *      for B-tree directories by Theodore Ts'o (tytso@mit.edu), 1998
22  *
23  *  Changes for use in OBDFS
24  *  Copyright (c) 1999, Seagate Technology Inc.
25  *  Copyright (C) 2001, Cluster File Systems, Inc.
26  *                       Rewritten based on recent ext2 page cache use.
27  *
28  */
29
30 #include <linux/fs.h>
31 #include <linux/locks.h>
32 #include <linux/quotaops.h>
33
34 #define DEBUG_SUBSYSTEM S_LLITE
35
36 #include <linux/obd_support.h>
37 #include <linux/lustre_lite.h>
38 #include <linux/lustre_dlm.h>
39 extern struct address_space_operations ll_aops;
40
41 /* from super.c */
42 extern void ll_change_inode(struct inode *inode);
43 extern int ll_setattr(struct dentry *de, struct iattr *attr);
44
45 /* from dir.c */
46 extern int ll_add_link (struct dentry *dentry, struct inode *inode);
47 ino_t ll_inode_by_name(struct inode * dir, struct dentry *dentry, int *typ);
48 int ext2_make_empty(struct inode *inode, struct inode *parent);
49 struct ext2_dir_entry_2 * ext2_find_entry (struct inode * dir,
50                    struct dentry *dentry, struct page ** res_page);
51 int ext2_delete_entry (struct ext2_dir_entry_2 * dir, struct page * page );
52 int ext2_empty_dir (struct inode * inode);
53 struct ext2_dir_entry_2 * ext2_dotdot (struct inode *dir, struct page **p);
54 void ext2_set_link(struct inode *dir, struct ext2_dir_entry_2 *de,
55                    struct page *page, struct inode *inode);
56
57 /*
58  * Couple of helper functions - make the code slightly cleaner.
59  */
60 static inline void ext2_inc_count(struct inode *inode)
61 {
62         inode->i_nlink++;
63 }
64
65 /* postpone the disk update until the inode really goes away */
66 static inline void ext2_dec_count(struct inode *inode)
67 {
68         inode->i_nlink--;
69 }
70
71 static inline int ext2_add_nondir(struct dentry *dentry, struct inode *inode)
72 {
73         int err;
74         err = ll_add_link(dentry, inode);
75         if (!err) {
76                 d_instantiate(dentry, inode);
77                 return 0;
78         }
79         ext2_dec_count(inode);
80         iput(inode);
81         return err;
82 }
83
84 /* methods */
85 static int ll_find_inode(struct inode *inode, unsigned long ino, void *opaque)
86 {
87         struct mds_body *body = (struct mds_body *)opaque;
88
89         if (inode->i_generation != body->generation)
90                 return 0;
91
92         return 1;
93 }
94
95 extern struct dentry_operations ll_d_ops;
96
97 int ll_lock(struct inode *dir, struct dentry *dentry,
98             struct lookup_intent *it, struct lustre_handle *lockh)
99 {
100         struct ll_sb_info *sbi = ll_i2sbi(dir);
101         int err;
102
103         if ((it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_SETATTR |
104                           IT_MKNOD)) )
105                 err = mdc_enqueue(&sbi->ll_mdc_conn, LDLM_MDSINTENT,
106                                   it, LCK_PW, dir, dentry, lockh, 0, NULL, 0,
107                                   dir, sizeof(*dir));
108         else if (it->it_op & (IT_READDIR | IT_GETATTR | IT_OPEN | IT_UNLINK))
109                 err = mdc_enqueue(&sbi->ll_mdc_conn, LDLM_MDSINTENT,
110                                   it, LCK_PR, dir, dentry, lockh, 0, NULL, 0,
111                                   dir, sizeof(*dir));
112
113         else
114                 LBUG();
115
116         RETURN(err);
117 }
118
119 int ll_unlock(__u32 mode, struct lustre_handle *lockh)
120 {
121         struct ldlm_lock *lock;
122         ENTRY;
123
124         lock = lustre_handle2object(lockh);
125         ldlm_lock_decref(lock, mode);
126
127         RETURN(0);
128 }
129
130 static struct dentry *ll_lookup2(struct inode * dir, struct dentry *dentry,
131                                  struct lookup_intent *it)
132 {
133         struct ptlrpc_request *request = NULL;
134         struct inode * inode = NULL;
135         struct ll_sb_info *sbi = ll_i2sbi(dir);
136         struct ll_inode_md md;
137         struct lustre_handle lockh;
138         int err, type, offset;
139         ino_t ino;
140
141         ENTRY;
142
143         CDEBUG(D_INFO, "name: %*s, intent op: %d\n", dentry->d_name.len,
144                dentry->d_name.name, it->it_op);
145
146         if (dentry->d_name.len > EXT2_NAME_LEN)
147                 RETURN(ERR_PTR(-ENAMETOOLONG));
148
149         err = ll_lock(dir, dentry, it, &lockh);
150         memcpy(it->it_lock_handle, &lockh, sizeof(lockh));
151
152         if ( (it->it_op & (IT_CREAT | IT_MKDIR | IT_SYMLINK | IT_MKNOD)) &&
153              it->it_disposition && !it->it_status)
154                 GOTO(negative, NULL);
155
156         if ( (it->it_op & (IT_GETATTR | IT_UNLINK)) &&
157              it->it_disposition && it->it_status)
158                 GOTO(negative, NULL);
159
160         if (!it->it_disposition) {
161                 struct ll_inode_info *lli = ll_i2info(dir);
162                 memcpy(&lli->lli_intent_lock_handle, &lockh, sizeof(lockh));
163
164                 ino = ll_inode_by_name(dir, dentry, &type);
165
166                 err = mdc_getattr(&sbi->ll_mdc_conn, ino, type,
167                                   OBD_MD_FLNOTOBD|OBD_MD_FLBLOCKS, 0, &request);
168                 if (err) {
169                         CERROR("failure %d inode %ld\n", err, (long)ino);
170                         ptlrpc_free_req(request);
171                         RETURN(ERR_PTR(-abs(err)));
172                 }
173                 offset = 0;
174         } else if (it->it_op == IT_UNLINK) { 
175                 struct obdo *obdo;
176                 request = (struct ptlrpc_request *)it->it_data;
177                 obdo = lustre_msg_buf(request->rq_repmsg, 1);
178                 inode = new_inode(dir->i_sb);
179                 ll_i2info(inode)->lli_obdo = obdo_alloc();
180
181                 /* XXX fix mem allocation error */
182                 memcpy(ll_i2info(inode)->lli_obdo, obdo, sizeof(*obdo));
183
184                 if (!inode) 
185                         GOTO(out_req, -ENOMEM);
186                 inode->i_mode= S_IFREG;
187                 inode->i_nlink = 1;
188                 GOTO(out_req, 0);
189         } else {
190                 struct mds_body *body;
191
192                 offset = 1;
193                 request = (struct ptlrpc_request *)it->it_data;
194                 body = lustre_msg_buf(request->rq_repmsg, 1);
195                 type = body->mode;
196         }
197
198         if (S_ISREG(type)) {
199                 if (request->rq_repmsg->bufcount < offset + 2 ||
200                     request->rq_repmsg->buflens[offset + 1] !=
201                     sizeof(struct obdo))
202                         LBUG();
203
204                 md.obdo = lustre_msg_buf(request->rq_repmsg, offset + 1);
205         } else
206                 md.obdo = NULL;
207
208         md.body = lustre_msg_buf(request->rq_repmsg, offset);
209
210         inode = iget4(dir->i_sb, ino, ll_find_inode, &md);
211
212         if (it->it_op & IT_RENAME)
213                 it->it_data = dentry;
214
215  out_req:
216         ptlrpc_free_req(request);
217         if (!inode)
218                 RETURN(ERR_PTR(-ENOMEM));
219
220         EXIT;
221  negative:
222         dentry->d_op = &ll_d_ops;
223         d_add(dentry, inode);
224         return NULL;
225 }
226
227 static struct inode *ll_create_node(struct inode *dir, const char *name,
228                                     int namelen, const char *tgt, int tgtlen,
229                                     int mode, __u64 extra,
230                                     struct lookup_intent *it, struct obdo *obdo)
231 {
232         struct inode *inode;
233         struct ptlrpc_request *request = NULL;
234         struct mds_body *body;
235         int rc;
236         time_t time = CURRENT_TIME;
237         struct ll_sb_info *sbi = ll_i2sbi(dir);
238         struct ll_inode_md md;
239
240         ENTRY;
241
242         if (!it->it_disposition) {
243                 rc = mdc_create(&sbi->ll_mdc_conn, dir, name, namelen, tgt,
244                                  tgtlen, mode, current->fsuid,
245                                  current->fsgid, time, extra, obdo, &request);
246                 if (rc) {
247                         inode = ERR_PTR(rc);
248                         GOTO(out, rc);
249                 }
250                 body = lustre_msg_buf(request->rq_repmsg, 0);
251                 md.obdo = obdo;
252         } else {
253                 request = it->it_data;
254                 body = lustre_msg_buf(request->rq_repmsg, 1);
255                 md.obdo = NULL;
256         }
257
258         body->valid = (__u32)OBD_MD_FLNOTOBD;
259
260         body->nlink = 1;
261         body->atime = body->ctime = body->mtime = time;
262         body->uid = current->fsuid;
263         body->gid = current->fsgid;
264         body->mode = mode;
265
266         md.body = body;
267
268         inode = iget4(dir->i_sb, body->ino, ll_find_inode, &md);
269         if (IS_ERR(inode)) {
270                 CERROR("new_inode -fatal:  %ld\n", PTR_ERR(inode));
271                 inode = ERR_PTR(-EIO);
272                 LBUG();
273                 GOTO(out, -EIO);
274         }
275
276         if (!list_empty(&inode->i_dentry)) {
277                 CERROR("new_inode -fatal: inode %d, ct %d lnk %d\n",
278                        body->ino, atomic_read(&inode->i_count),
279                        inode->i_nlink);
280                 iput(inode);
281                 LBUG();
282                 inode = ERR_PTR(-EIO);
283                 GOTO(out, -EIO);
284         }
285
286         EXIT;
287  out:
288         ptlrpc_free_req(request);
289         return inode;
290 }
291
292 int ll_mdc_unlink(struct inode *dir, struct inode *child,
293                   const char *name, int len)
294 {
295         struct ptlrpc_request *request = NULL;
296         int err;
297         struct ll_sb_info *sbi = ll_i2sbi(dir);
298
299         ENTRY;
300
301         err = mdc_unlink(&sbi->ll_mdc_conn, dir, child,
302                          name, len, &request);
303         ptlrpc_free_req(request);
304
305         RETURN(err);
306 }
307
308 int ll_mdc_link(struct dentry *src, struct inode *dir,
309                 const char *name, int len)
310 {
311         struct ptlrpc_request *request = NULL;
312         int err;
313         struct ll_sb_info *sbi = ll_i2sbi(dir);
314
315         ENTRY;
316
317         err = mdc_link(&sbi->ll_mdc_conn, src, dir, name,
318                        len, &request);
319         ptlrpc_free_req(request);
320
321         RETURN(err);
322 }
323
324 int ll_mdc_rename(struct inode *src, struct inode *tgt,
325                   struct dentry *old, struct dentry *new)
326 {
327         struct ptlrpc_request *request = NULL;
328         struct ll_sb_info *sbi = ll_i2sbi(src);
329         int err;
330
331         ENTRY;
332
333         err = mdc_rename(&sbi->ll_mdc_conn, src, tgt,
334                          old->d_name.name, old->d_name.len,
335                          new->d_name.name, new->d_name.len, &request);
336         ptlrpc_free_req(request);
337
338         RETURN(err);
339 }
340
341 /*
342  * By the time this is called, we already have created
343  * the directory cache entry for the new file, but it
344  * is so far negative - it has no inode.
345  *
346  * If the create succeeds, we fill in the inode information
347  * with d_instantiate().
348  */
349
350 static int ll_create(struct inode * dir, struct dentry * dentry, int mode)
351 {
352         int rc = 0;
353         struct obdo oa;
354         struct inode *inode;
355
356         if (dentry->d_it->it_disposition == 0) {
357                 memset(&oa, 0, sizeof(oa));
358                 oa.o_valid = OBD_MD_FLMODE;
359                 oa.o_mode = S_IFREG | 0600;
360                 rc = obd_create(ll_i2obdconn(dir), &oa);
361                 if (rc)
362                         RETURN(rc);
363         }
364
365         mode = mode | S_IFREG;
366         CDEBUG(D_DENTRY, "name %s mode %o o_id %lld\n",
367                dentry->d_name.name, mode, (unsigned long long)oa.o_id);
368         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
369                                NULL, 0, mode, 0, dentry->d_it, &oa);
370
371         if (IS_ERR(inode)) {
372                 rc = PTR_ERR(inode);
373                 CERROR("error creating MDS object for id %Ld: rc = %d\n",
374                        (unsigned long long)oa.o_id, rc);
375                 GOTO(out_destroy, rc);
376         }
377
378         // XXX clean up the object
379         inode->i_op = &ll_file_inode_operations;
380         inode->i_fop = &ll_file_operations;
381         inode->i_mapping->a_ops = &ll_aops;
382
383         if (dentry->d_it->it_disposition) {
384                 struct ll_inode_info *ii = ll_i2info(inode);
385                 ii->lli_flags |= OBD_FL_CREATEONOPEN;
386                 memcpy(&ii->lli_intent_lock_handle,
387                        dentry->d_it->it_lock_handle,
388                        sizeof(struct lustre_handle));
389         }
390
391         /* no directory data updates when intents rule */
392         if (dentry->d_it->it_disposition == 0)
393                 rc = ext2_add_nondir(dentry, inode);
394         else
395                 d_instantiate(dentry, inode);
396         RETURN(rc);
397
398 out_destroy:
399         rc = obd_destroy(ll_i2obdconn(dir), &oa);
400         if (rc)
401                 CERROR("error destroying object %Ld in error path: err = %d\n",
402                        (unsigned long long)oa.o_id, rc);
403         return rc;
404 }
405
406 static int ll_mknod(struct inode *dir, struct dentry *dentry, int mode,
407                     int rdev)
408 {
409         struct inode * inode = ll_create_node(dir, dentry->d_name.name,
410                                               dentry->d_name.len, NULL, 0,
411                                               mode, rdev, NULL, NULL);
412         int err = PTR_ERR(inode);
413         if (!IS_ERR(inode)) {
414                 init_special_inode(inode, mode, rdev);
415                 err = ext2_add_nondir(dentry, inode);
416         }
417         return err;
418 }
419
420 static int ll_symlink(struct inode *dir, struct dentry *dentry,
421                       const char *symname)
422 {
423         int err = -ENAMETOOLONG;
424         unsigned l = strlen(symname);
425         struct inode * inode;
426         struct ll_inode_info *oinfo;
427
428         if (l > LL_INLINESZ)
429                 return err;
430
431         inode = ll_create_node(dir, dentry->d_name.name,
432                                dentry->d_name.len, symname, l,
433                                S_IFLNK | S_IRWXUGO, 0, dentry->d_it, NULL);
434         err = PTR_ERR(inode);
435         if (IS_ERR(inode))
436                 return err;
437
438         oinfo = ll_i2info(inode);
439
440         inode->i_op = &ll_fast_symlink_inode_operations;
441         memcpy(oinfo->lli_inline, symname, l);
442         inode->i_size = l-1;
443
444         err = ext2_add_nondir(dentry, inode);
445
446         if (err) {
447                 ext2_dec_count(inode);
448                 iput (inode);
449         }
450         return err;
451 }
452
453 static int ll_link(struct dentry * old_dentry, struct inode * dir,
454                    struct dentry *dentry)
455 {
456         int err;
457         struct inode *inode = old_dentry->d_inode;
458
459         if (S_ISDIR(inode->i_mode))
460                 return -EPERM;
461
462         if (inode->i_nlink >= EXT2_LINK_MAX)
463                 return -EMLINK;
464
465         err = ll_mdc_link(old_dentry, dir,
466                           dentry->d_name.name, dentry->d_name.len);
467         if (err) {
468                 EXIT;
469                 return err;
470         }
471
472         inode->i_ctime = CURRENT_TIME;
473         ext2_inc_count(inode);
474         atomic_inc(&inode->i_count);
475
476         return ext2_add_nondir(dentry, inode);
477 }
478
479 static int ll_mkdir(struct inode * dir, struct dentry * dentry, int mode)
480 {
481         struct inode * inode;
482         int err = -EMLINK;
483         ENTRY;
484
485         if (dir->i_nlink >= EXT2_LINK_MAX)
486                 goto out;
487
488         ext2_inc_count(dir);
489
490         inode = ll_create_node (dir, dentry->d_name.name,
491                                 dentry->d_name.len, NULL, 0,
492                                 S_IFDIR | mode, 0, dentry->d_it, NULL);
493         err = PTR_ERR(inode);
494         if (IS_ERR(inode))
495                 goto out_dir;
496
497         inode->i_op = &ll_dir_inode_operations;
498         inode->i_fop = &ll_dir_operations;
499         inode->i_mapping->a_ops = &ll_aops;
500         inode->i_nlink = 1;
501         ext2_inc_count(inode);
502
503         err = ext2_make_empty(inode, dir);
504         if (err)
505                 goto out_fail;
506
507         /* no directory data updates when intents rule */
508         if (dentry->d_it->it_disposition == 0) {
509                 err = ll_add_link(dentry, inode);
510                 if (err)
511                         goto out_fail;
512         }
513
514         d_instantiate(dentry, inode);
515 out:
516         EXIT;
517         return err;
518
519 out_fail:
520         ext2_dec_count(inode);
521         ext2_dec_count(inode);
522         iput(inode);
523         EXIT;
524 out_dir:
525         ext2_dec_count(dir);
526         EXIT;
527         goto out;
528 }
529
530 static int ll_unlink(struct inode * dir, struct dentry *dentry)
531 {
532         struct inode * inode = dentry->d_inode;
533         struct ext2_dir_entry_2 * de;
534         struct page * page;
535         int err = -ENOENT;
536
537         if (dentry->d_it && dentry->d_it->it_disposition) { 
538                 inode->i_nlink = 0;
539                 GOTO(out, err=0);
540         }
541
542         de = ext2_find_entry (dir, dentry, &page);
543         if (!de)
544                 goto out;
545
546         err = ll_mdc_unlink(dir, dentry->d_inode,
547                             dentry->d_name.name, dentry->d_name.len);
548         if (err)
549                 goto out;
550
551         err = ext2_delete_entry (de, page);
552         if (err)
553                 goto out;
554
555         inode->i_ctime = dir->i_ctime;
556         ext2_dec_count(inode);
557         err = 0;
558 out:
559         return err;
560 }
561
562 static int ll_rmdir(struct inode * dir, struct dentry *dentry)
563 {
564         struct inode * inode = dentry->d_inode;
565         int err = -ENOTEMPTY;
566
567         if (ext2_empty_dir(inode)) {
568                 err = ll_unlink(dir, dentry);
569                 if (!err) {
570                         inode->i_size = 0;
571                         ext2_dec_count(inode);
572                         ext2_dec_count(dir);
573                 }
574         }
575         return err;
576 }
577
578 static int ll_rename (struct inode * old_dir, struct dentry * old_dentry,
579                       struct inode * new_dir, struct dentry * new_dentry )
580 {
581         struct inode * old_inode = old_dentry->d_inode;
582         struct inode * new_inode = new_dentry->d_inode;
583         struct page * dir_page = NULL;
584         struct ext2_dir_entry_2 * dir_de = NULL;
585         struct page * old_page;
586         struct ext2_dir_entry_2 * old_de;
587         int err = -ENOENT;
588
589         if (new_dentry->d_it) {
590                 struct ptlrpc_request *req = new_dentry->d_it->it_data;
591                 err = req->rq_status;
592                 goto out;
593         }
594
595         err = ll_mdc_rename(old_dir, new_dir, old_dentry, new_dentry);
596         if (err)
597                 goto out;
598
599         old_de = ext2_find_entry (old_dir, old_dentry, &old_page);
600         if (!old_de)
601                 goto out;
602
603         if (S_ISDIR(old_inode->i_mode)) {
604                 err = -EIO;
605                 dir_de = ext2_dotdot(old_inode, &dir_page);
606                 if (!dir_de)
607                         goto out_old;
608         }
609
610         if (new_inode) {
611                 struct page *new_page;
612                 struct ext2_dir_entry_2 *new_de;
613
614                 err = -ENOTEMPTY;
615                 if (dir_de && !ext2_empty_dir (new_inode))
616                         goto out_dir;
617
618                 err = -ENOENT;
619                 new_de = ext2_find_entry (new_dir, new_dentry, &new_page);
620                 if (!new_de)
621                         goto out_dir;
622                 ext2_inc_count(old_inode);
623                 ext2_set_link(new_dir, new_de, new_page, old_inode);
624                 new_inode->i_ctime = CURRENT_TIME;
625                 if (dir_de)
626                         new_inode->i_nlink--;
627                 ext2_dec_count(new_inode);
628         } else {
629                 if (dir_de) {
630                         err = -EMLINK;
631                         if (new_dir->i_nlink >= EXT2_LINK_MAX)
632                                 goto out_dir;
633                 }
634                 ext2_inc_count(old_inode);
635                 err = ll_add_link(new_dentry, old_inode);
636                 if (err) {
637                         ext2_dec_count(old_inode);
638                         goto out_dir;
639                 }
640                 if (dir_de)
641                         ext2_inc_count(new_dir);
642         }
643
644         ext2_delete_entry (old_de, old_page);
645         ext2_dec_count(old_inode);
646
647         if (dir_de) {
648                 ext2_set_link(old_inode, dir_de, dir_page, new_dir);
649                 ext2_dec_count(old_dir);
650         }
651         return 0;
652
653 out_dir:
654         if (dir_de) {
655                 kunmap(dir_page);
656                 page_cache_release(dir_page);
657         }
658 out_old:
659         kunmap(old_page);
660         page_cache_release(old_page);
661 out:
662         return err;
663 }
664
665 struct inode_operations ll_dir_inode_operations = {
666         create:         ll_create,
667         lookup2:        ll_lookup2,
668         link:           ll_link,
669         unlink:         ll_unlink,
670         symlink:        ll_symlink,
671         mkdir:          ll_mkdir,
672         rmdir:          ll_rmdir,
673         mknod:          ll_mknod,
674         rename:         ll_rename,
675         setattr:        ll_setattr
676 };