Whamcloud - gitweb
b=1021,2720
[fs/lustre-release.git] / lustre / llite / namei.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  *  Copyright (c) 2002, 2003 Cluster File Systems, Inc.
5  *
6  *   This file is part of Lustre, http://www.lustre.org.
7  *
8  *   Lustre is free software; you can redistribute it and/or
9  *   modify it under the terms of version 2 of the GNU General Public
10  *   License as published by the Free Software Foundation.
11  *
12  *   Lustre is distributed in the hope that it will be useful,
13  *   but WITHOUT ANY WARRANTY; without even the implied warranty of
14  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  *   GNU General Public License for more details.
16  *
17  *   You should have received a copy of the GNU General Public License
18  *   along with Lustre; if not, write to the Free Software
19  *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
20  *
21  *  derived in small part from linux/fs/ext2/namei.c
22  *
23  *  Copyright (C) 1991, 1992  Linus Torvalds
24  *
25  *  Big-endian to little-endian byte-swapping/bitmaps by
26  *        David S. Miller (davem@caip.rutgers.edu), 1995
27  *  Directory entry file type support and forward compatibility hooks
28  *      for B-tree directories by Theodore Ts'o (tytso@mit.edu), 1998
29  */
30
31 #include <linux/fs.h>
32 #include <linux/sched.h>
33 #include <linux/mm.h>
34 #include <linux/smp_lock.h>
35 #include <linux/quotaops.h>
36 #include <linux/highmem.h>
37 #include <linux/pagemap.h>
38
39 #define DEBUG_SUBSYSTEM S_LLITE
40
41 #include <linux/obd_support.h>
42 #include <linux/lustre_lite.h>
43 #include <linux/lustre_dlm.h>
44 #include <linux/lustre_version.h>
45 #include "llite_internal.h"
46
47 /* methods */
48
49 #if (LINUX_VERSION_CODE < KERNEL_VERSION(2,5,0))
50 static int ll_test_inode(struct inode *inode, unsigned long ino, void *opaque)
51 #else
52 static int ll_test_inode(struct inode *inode, void *opaque)
53 #endif
54 {
55         static int last_ino, last_gen, last_count;
56         struct lustre_md *md = opaque;
57
58         if (!(md->body->valid & (OBD_MD_FLGENER | OBD_MD_FLID))) {
59                 CERROR("MDS body missing inum or generation\n");
60                 return 0;
61         }
62
63         if (last_ino == md->body->ino && last_gen == md->body->generation &&
64             last_count < 500) {
65                 last_count++;
66         } else {
67                 if (last_count > 1)
68                         CDEBUG(D_VFSTRACE, "compared %u/%u %u times\n",
69                                last_ino, last_gen, last_count);
70                 last_count = 0;
71                 last_ino = md->body->ino;
72                 last_gen = md->body->generation;
73                 CDEBUG(D_VFSTRACE,
74                        "comparing inode %p ino %lu/%u to body %u/%u\n",
75                        inode, inode->i_ino, inode->i_generation,
76                        md->body->ino, md->body->generation);
77         }
78
79         if (inode->i_generation != md->body->generation)
80                 return 0;
81
82         /* Apply the attributes in 'opaque' to this inode */
83         ll_update_inode(inode, md->body, md->lsm);
84         return 1;
85 }
86
87 extern struct dentry_operations ll_d_ops;
88
89 int ll_unlock(__u32 mode, struct lustre_handle *lockh)
90 {
91         ENTRY;
92
93         ldlm_lock_decref(lockh, mode);
94
95         RETURN(0);
96 }
97
98 /* Get an inode by inode number (already instantiated by the intent lookup).
99  * Returns inode or NULL
100  */
101 #if (LINUX_VERSION_CODE >= KERNEL_VERSION(2,5,0))
102 int ll_set_inode(struct inode *inode, void *opaque)
103 {
104         ll_read_inode2(inode, opaque);
105         return 0;
106 }
107 struct inode *ll_iget(struct super_block *sb, ino_t hash,
108                       struct lustre_md *md)
109 {
110         struct inode *inode;
111
112         LASSERT(hash != 0);
113         inode = iget5_locked(sb, hash, ll_test_inode, ll_set_inode, md);
114
115         if (inode) {
116                 if (inode->i_state & I_NEW)
117                         unlock_new_inode(inode);
118                 CDEBUG(D_VFSTRACE, "inode: %lu/%u(%p)\n", inode->i_ino,
119                        inode->i_generation, inode);
120         }
121
122         return inode;
123 }
124 #else
125 struct inode *ll_iget(struct super_block *sb, ino_t hash,
126                       struct lustre_md *md)
127 {
128         struct inode *inode;
129         LASSERT(hash != 0);
130         inode = iget4(sb, hash, ll_test_inode, md);
131         if (inode)
132                 CDEBUG(D_VFSTRACE, "inode: %lu/%u(%p)\n", inode->i_ino,
133                        inode->i_generation, inode);
134         return inode;
135 }
136 #endif
137
138 int ll_mdc_blocking_ast(struct ldlm_lock *lock, struct ldlm_lock_desc *desc,
139                         void *data, int flag)
140 {
141         int rc;
142         struct lustre_handle lockh;
143         ENTRY;
144
145         switch (flag) {
146         case LDLM_CB_BLOCKING:
147                 ldlm_lock2handle(lock, &lockh);
148                 rc = ldlm_cli_cancel(&lockh);
149                 if (rc < 0) {
150                         CDEBUG(D_INODE, "ldlm_cli_cancel: %d\n", rc);
151                         RETURN(rc);
152                 }
153                 break;
154         case LDLM_CB_CANCELING: {
155                 struct inode *inode = ll_inode_from_lock(lock);
156
157                 /* Invalidate all dentries associated with this inode */
158                 if (inode == NULL)
159                         break;
160
161                 clear_bit(LLI_F_HAVE_MDS_SIZE_LOCK,
162                           &(ll_i2info(inode)->lli_flags));
163
164                 if (lock->l_resource->lr_name.name[0] != inode->i_ino ||
165                     lock->l_resource->lr_name.name[1] != inode->i_generation) {
166                         LDLM_ERROR(lock, "data mismatch with ino %lu/%u",
167                                    inode->i_ino, inode->i_generation);
168                 }
169                 if (S_ISDIR(inode->i_mode)) {
170                         CDEBUG(D_INODE, "invalidating inode %lu\n",
171                                inode->i_ino);
172
173                         ll_invalidate_inode_pages(inode);
174                 }
175
176                 if (inode->i_sb->s_root &&
177                     inode != inode->i_sb->s_root->d_inode)
178                         ll_unhash_aliases(inode);
179                 iput(inode);
180                 break;
181         }
182         default:
183                 LBUG();
184         }
185
186         RETURN(0);
187 }
188
189 int ll_mdc_cancel_unused(struct lustre_handle *conn, struct inode *inode,
190                          int flags, void *opaque)
191 {
192         struct ldlm_res_id res_id =
193                 { .name = {inode->i_ino, inode->i_generation} };
194         struct obd_device *obddev = class_conn2obd(conn);
195         ENTRY;
196         RETURN(ldlm_cli_cancel_unused(obddev->obd_namespace, &res_id, flags,
197                                       opaque));
198 }
199
200
201 void ll_prepare_mdc_op_data(struct mdc_op_data *data, struct inode *i1,
202                             struct inode *i2, const char *name, int namelen,
203                             int mode)
204 {
205         LASSERT(i1);
206
207         ll_i2uctxt(&data->ctxt, i1, i2);
208         ll_inode2fid(&data->fid1, i1);
209
210         if (i2)
211                 ll_inode2fid(&data->fid2, i2);
212
213         data->name = name;
214         data->namelen = namelen;
215         data->create_mode = mode;
216         data->mod_time = LTIME_S(CURRENT_TIME);
217 }
218
219 /* Search "inode"'s alias list for a dentry that has the same name and parent as
220  * de.  If found, return it.  If not found, return de. */
221 struct dentry *ll_find_alias(struct inode *inode, struct dentry *de)
222 {
223         struct list_head *tmp;
224
225         spin_lock(&dcache_lock);
226         list_for_each(tmp, &inode->i_dentry) {
227                 struct dentry *dentry = list_entry(tmp, struct dentry, d_alias);
228
229                 /* We are called here with 'de' already on the aliases list. */
230                 if (dentry == de) {
231                         CERROR("whoops\n");
232                         continue;
233                 }
234
235                 if (dentry->d_parent != de->d_parent)
236                         continue;
237
238                 if (dentry->d_name.len != de->d_name.len)
239                         continue;
240
241                 if (memcmp(dentry->d_name.name, de->d_name.name,
242                            de->d_name.len) != 0)
243                         continue;
244
245                 if (!list_empty(&dentry->d_lru))
246                         list_del_init(&dentry->d_lru);
247
248                 hlist_del_init(&dentry->d_hash);
249                 __d_rehash(dentry, 0); /* avoid taking dcache_lock inside */
250                 spin_unlock(&dcache_lock);
251                 atomic_inc(&dentry->d_count);
252                 iput(inode);
253                 dentry->d_flags &= ~DCACHE_LUSTRE_INVALID;
254                 return dentry;
255         }
256
257         spin_unlock(&dcache_lock);
258
259         return de;
260 }
261
262 static int lookup_it_finish(struct ptlrpc_request *request, int offset,
263                             struct lookup_intent *it, void *data)
264 {
265         struct it_cb_data *icbd = data;
266         struct dentry **de = icbd->icbd_childp;
267         struct inode *parent = icbd->icbd_parent;
268         struct ll_sb_info *sbi = ll_i2sbi(parent);
269         struct dentry *dentry = *de, *saved = *de;
270         struct inode *inode = NULL;
271         int rc;
272
273         /* NB 1 request reference will be taken away by ll_intent_lock()
274          * when I return */
275         if (!it_disposition(it, DISP_LOOKUP_NEG)) {
276                 ENTRY;
277
278                 rc = ll_prep_inode(sbi->ll_osc_exp, &inode, request, offset,
279                                    dentry->d_sb);
280                 if (rc)
281                         RETURN(rc);
282
283                 CDEBUG(D_DLMTRACE, "setting l_data to inode %p (%lu/%u)\n",
284                        inode, inode->i_ino, inode->i_generation);
285                 mdc_set_lock_data(&it->d.lustre.it_lock_handle, inode);
286
287                 /* If this is a stat, get the authoritative file size */
288                 if (it->it_op == IT_GETATTR && S_ISREG(inode->i_mode) &&
289                     ll_i2info(inode)->lli_smd != NULL) {
290                         struct lov_stripe_md *lsm = ll_i2info(inode)->lli_smd;
291                         struct ost_lvb lvb;
292                         ldlm_error_t rc;
293
294                         LASSERT(lsm->lsm_object_id != 0);
295
296                         /* bug 2334: drop MDS lock before acquiring OST lock */
297                         ll_intent_drop_lock(it);
298
299                         rc = ll_glimpse_size(inode, &lvb);
300                         if (rc) {
301                                 iput(inode);
302                                 RETURN(-EIO);
303                         }
304                         inode->i_size = lvb.lvb_size;
305                 }
306
307                 dentry = *de = ll_find_alias(inode, dentry);
308         } else {
309                 ENTRY;
310         }
311
312         dentry->d_op = &ll_d_ops;
313         ll_set_dd(dentry);
314
315         if (dentry == saved)
316                 d_add(dentry, inode);
317
318         RETURN(0);
319 }
320
321
322 #if (LUSTRE_KERNEL_VERSION < 33)
323 static struct dentry *ll_lookup_it(struct inode *parent, struct dentry *dentry,
324                                    struct lookup_intent *it, int flags)
325 #else
326 static struct dentry *ll_lookup_it(struct inode *parent, struct dentry *dentry,
327                                    struct nameidata *nd,
328                                    struct lookup_intent *it, int flags)
329 #endif
330 {
331         struct dentry *save = dentry, *retval;
332         struct ll_fid pfid;
333         struct ll_uctxt ctxt;
334         struct it_cb_data icbd;
335         struct ptlrpc_request *req = NULL;
336         struct lookup_intent lookup_it = { .it_op = IT_LOOKUP };
337         int rc;
338         ENTRY;
339
340         if (dentry->d_name.len > EXT3_NAME_LEN)
341                 RETURN(ERR_PTR(-ENAMETOOLONG));
342
343         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p),intent=%s\n",
344                dentry->d_name.name, parent->i_ino, parent->i_generation,
345                parent, LL_IT2STR(it));
346
347         if (d_mountpoint(dentry))
348                 CERROR("Tell Peter, lookup on mtpt, it %s\n", LL_IT2STR(it));
349
350         ll_frob_intent(&it, &lookup_it);
351
352         icbd.icbd_childp = &dentry;
353         icbd.icbd_parent = parent;
354         ll_inode2fid(&pfid, parent);
355         ll_i2uctxt(&ctxt, parent, NULL);
356
357         rc = mdc_intent_lock(ll_i2mdcexp(parent), &ctxt, &pfid,
358                              dentry->d_name.name, dentry->d_name.len, NULL, 0,
359                              NULL, it, flags, &req, ll_mdc_blocking_ast);
360         if (rc < 0)
361                 GOTO(out, retval = ERR_PTR(rc));
362
363         rc = lookup_it_finish(req, 1, it, &icbd);
364         if (rc != 0) {
365                 ll_intent_release(it);
366                 GOTO(out, retval = ERR_PTR(rc));
367         }
368
369         ll_lookup_finish_locks(it, dentry);
370
371         if (dentry == save)
372                 GOTO(out, retval = NULL);
373         else
374                 GOTO(out, retval = dentry);
375  out:
376         if (req)
377                 ptlrpc_req_finished(req);
378         return retval;
379 }
380
381 #if (LINUX_VERSION_CODE > KERNEL_VERSION(2,5,0))
382 static struct dentry *ll_lookup_nd(struct inode *parent, struct dentry *dentry,
383                                    struct nameidata *nd)
384 {
385         struct dentry *de;
386         ENTRY;
387
388         if (nd && nd->flags & LOOKUP_LAST && !(nd->flags & LOOKUP_LINK_NOTLAST))
389                 de = ll_lookup_it(parent, dentry, &nd->intent, nd->flags);
390         else
391                 de = ll_lookup_it(parent, dentry, NULL, 0);
392
393         RETURN(de);
394 }
395 #endif
396
397 /* We depend on "mode" being set with the proper file type/umask by now */
398 static struct inode *ll_create_node(struct inode *dir, const char *name,
399                                     int namelen, const void *data, int datalen,
400                                     int mode, __u64 extra,
401                                     struct lookup_intent *it)
402 {
403         struct inode *inode = NULL;
404         struct ptlrpc_request *request = NULL;
405         struct ll_sb_info *sbi = ll_i2sbi(dir);
406         int rc;
407         ENTRY;
408
409         LASSERT(it && it->d.lustre.it_disposition);
410
411         request = it->d.lustre.it_data;
412         rc = ll_prep_inode(sbi->ll_osc_exp, &inode, request, 1, dir->i_sb);
413         if (rc)
414                 GOTO(out, inode = ERR_PTR(rc));
415
416         LASSERT(list_empty(&inode->i_dentry));
417
418         /* We asked for a lock on the directory, but were granted a
419          * lock on the inode.  Since we finally have an inode pointer,
420          * stuff it in the lock. */
421         CDEBUG(D_DLMTRACE, "setting l_ast_data to inode %p (%lu/%u)\n",
422                inode, inode->i_ino, inode->i_generation);
423         mdc_set_lock_data(&it->d.lustre.it_lock_handle, inode);
424         EXIT;
425  out:
426         ptlrpc_req_finished(request);
427         return inode;
428 }
429
430 /*
431  * By the time this is called, we already have created the directory cache
432  * entry for the new file, but it is so far negative - it has no inode.
433  *
434  * We defer creating the OBD object(s) until open, to keep the intent and
435  * non-intent code paths similar, and also because we do not have the MDS
436  * inode number before calling ll_create_node() (which is needed for LOV),
437  * so we would need to do yet another RPC to the MDS to store the LOV EA
438  * data on the MDS.  If needed, we would pass the PACKED lmm as data and
439  * lmm_size in datalen (the MDS still has code which will handle that).
440  *
441  * If the create succeeds, we fill in the inode information
442  * with d_instantiate().
443  */
444 static int ll_create_it(struct inode *dir, struct dentry *dentry, int mode,
445                         struct lookup_intent *it)
446 {
447         struct inode *inode;
448         struct ptlrpc_request *request = it->d.lustre.it_data;
449         int rc = 0;
450         ENTRY;
451
452         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p),intent=%s\n",
453                dentry->d_name.name, dir->i_ino, dir->i_generation, dir,
454                LL_IT2STR(it));
455
456         rc = it_open_error(DISP_OPEN_CREATE, it);
457         if (rc)
458                 RETURN(rc);
459
460         mdc_store_inode_generation(request, 2, 1);
461         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
462                                NULL, 0, mode, 0, it);
463         if (IS_ERR(inode)) {
464                 RETURN(PTR_ERR(inode));
465         }
466
467         d_instantiate(dentry, inode);
468         RETURN(0);
469 }
470
471 #if (LINUX_VERSION_CODE > KERNEL_VERSION(2,5,0))
472 static int ll_create_nd(struct inode *dir, struct dentry *dentry, int mode, struct nameidata *nd)
473 {
474         return ll_create_it(dir, dentry, mode, &nd->intent);
475 }
476 #endif
477
478 static int ll_mknod_raw(struct nameidata *nd, int mode, dev_t rdev)
479 {
480         struct ptlrpc_request *request = NULL;
481         struct inode *dir = nd->dentry->d_inode;
482         const char *name = nd->last.name;
483         int len = nd->last.len;
484         struct ll_sb_info *sbi = ll_i2sbi(dir);
485         struct mdc_op_data op_data;
486         int err = -EMLINK;
487         ENTRY;
488
489         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p)\n",
490                name, dir->i_ino, dir->i_generation, dir);
491
492         if (dir->i_nlink >= EXT3_LINK_MAX)
493                 RETURN(err);
494
495         mode &= ~current->fs->umask;
496
497         switch (mode & S_IFMT) {
498         case 0:
499         case S_IFREG:
500                 mode |= S_IFREG; /* for mode = 0 case, fallthrough */
501         case S_IFCHR:
502         case S_IFBLK:
503         case S_IFIFO:
504         case S_IFSOCK:
505                 ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, 0);
506                 err = mdc_create(sbi->ll_mdc_exp, &op_data, NULL, 0, mode,
507                                  current->fsuid, current->fsgid,
508                                  rdev, &request);
509                 ptlrpc_req_finished(request);
510                 break;
511         case S_IFDIR:
512                 err = -EPERM;
513                 break;
514         default:
515                 err = -EINVAL;
516         }
517         RETURN(err);
518 }
519
520 static int ll_mknod(struct inode *dir, struct dentry *child, int mode,
521                     ll_dev_t rdev)
522 {
523         struct ptlrpc_request *request = NULL;
524         struct inode *inode = NULL;
525         const char *name = child->d_name.name;
526         int len = child->d_name.len;
527         struct ll_sb_info *sbi = ll_i2sbi(dir);
528         struct mdc_op_data op_data;
529         int err = -EMLINK;
530         ENTRY;
531
532         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p)\n",
533                name, dir->i_ino, dir->i_generation, dir);
534
535         if (dir->i_nlink >= EXT3_LINK_MAX)
536                 RETURN(err);
537
538         mode &= ~current->fs->umask;
539
540         switch (mode & S_IFMT) {
541         case 0:
542         case S_IFREG:
543                 mode |= S_IFREG; /* for mode = 0 case, fallthrough */
544         case S_IFCHR:
545         case S_IFBLK:
546         case S_IFIFO:
547         case S_IFSOCK:
548                 ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, 0);
549                 err = mdc_create(sbi->ll_mdc_exp, &op_data, NULL, 0, mode,
550                                  current->fsuid, current->fsgid,
551                                  rdev, &request);
552                 err = ll_prep_inode(sbi->ll_osc_exp, &inode, request, 0,
553                                     child->d_sb);
554                 if (err)
555                         GOTO(out_err, err);
556                 break;
557         case S_IFDIR:
558                 RETURN(-EPERM);
559                 break;
560         default:
561                 RETURN(-EINVAL);
562         }
563
564         d_instantiate(child, inode);
565  out_err:
566         ptlrpc_req_finished(request);
567         RETURN(err);
568 }
569
570 static int ll_symlink_raw(struct nameidata *nd, const char *tgt)
571 {
572         struct inode *dir = nd->dentry->d_inode;
573         const char *name = nd->last.name;
574         int len = nd->last.len;
575         struct ptlrpc_request *request = NULL;
576         struct ll_sb_info *sbi = ll_i2sbi(dir);
577         struct mdc_op_data op_data;
578         int err = -EMLINK;
579         ENTRY;
580
581         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p),target=%s\n",
582                name, dir->i_ino, dir->i_generation, dir, tgt);
583
584         if (dir->i_nlink >= EXT3_LINK_MAX)
585                 RETURN(err);
586
587         ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, 0);
588         err = mdc_create(sbi->ll_mdc_exp, &op_data,
589                          tgt, strlen(tgt) + 1, S_IFLNK | S_IRWXUGO,
590                          current->fsuid, current->fsgid, 0, &request);
591         ptlrpc_req_finished(request);
592         RETURN(err);
593 }
594
595 static int ll_link_raw(struct nameidata *srcnd, struct nameidata *tgtnd)
596 {
597         struct inode *src = srcnd->dentry->d_inode;
598         struct inode *dir = tgtnd->dentry->d_inode;
599         const char *name = tgtnd->last.name;
600         int len = tgtnd->last.len;
601         struct ptlrpc_request *request = NULL;
602         struct mdc_op_data op_data;
603         int err;
604         struct ll_sb_info *sbi = ll_i2sbi(dir);
605
606         ENTRY;
607         CDEBUG(D_VFSTRACE, "VFS Op:inode=%lu/%u(%p),dir=%lu/%u(%p),target=%s\n",
608                src->i_ino, src->i_generation, src,
609                dir->i_ino, dir->i_generation, dir, name);
610
611         ll_prepare_mdc_op_data(&op_data, src, dir, name, len, 0);
612         err = mdc_link(sbi->ll_mdc_exp, &op_data, &request);
613         ptlrpc_req_finished(request);
614
615         RETURN(err);
616 }
617
618
619 static int ll_mkdir_raw(struct nameidata *nd, int mode)
620 {
621         struct inode *dir = nd->dentry->d_inode;
622         const char *name = nd->last.name;
623         int len = nd->last.len;
624         struct ptlrpc_request *request = NULL;
625         struct ll_sb_info *sbi = ll_i2sbi(dir);
626         struct mdc_op_data op_data;
627         int err = -EMLINK;
628         ENTRY;
629         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p)\n",
630                name, dir->i_ino, dir->i_generation, dir);
631
632         if (dir->i_nlink >= EXT3_LINK_MAX)
633                 RETURN(err);
634
635         mode = (mode & (S_IRWXUGO|S_ISVTX) & ~current->fs->umask) | S_IFDIR;
636         ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, 0);
637         err = mdc_create(sbi->ll_mdc_exp, &op_data, NULL, 0, mode,
638                          current->fsuid, current->fsgid, 0, &request);
639         ptlrpc_req_finished(request);
640         RETURN(err);
641 }
642
643 static int ll_rmdir_raw(struct nameidata *nd)
644 {
645         struct inode *dir = nd->dentry->d_inode;
646         const char *name = nd->last.name;
647         int len = nd->last.len;
648         struct ptlrpc_request *request = NULL;
649         struct mdc_op_data op_data;
650         int rc;
651         ENTRY;
652         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p)\n",
653                name, dir->i_ino, dir->i_generation, dir);
654
655         ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, S_IFDIR);
656         rc = mdc_unlink(ll_i2sbi(dir)->ll_mdc_exp, &op_data, &request);
657         ptlrpc_req_finished(request);
658         RETURN(rc);
659 }
660
661 int ll_objects_destroy(struct ptlrpc_request *request, struct inode *dir)
662 {
663         struct mds_body *body;
664         struct lov_mds_md *eadata;
665         struct lov_stripe_md *lsm = NULL;
666         struct obd_trans_info oti = { 0 };
667         struct obdo *oa;
668         int rc;
669         ENTRY;
670
671         /* req is swabbed so this is safe */
672         body = lustre_msg_buf(request->rq_repmsg, 0, sizeof(*body));
673
674         if (!(body->valid & OBD_MD_FLEASIZE))
675                 RETURN(0);
676
677         if (body->eadatasize == 0) {
678                 CERROR("OBD_MD_FLEASIZE set but eadatasize zero\n");
679                 GOTO(out, rc = -EPROTO);
680         }
681
682         /* The MDS sent back the EA because we unlinked the last reference
683          * to this file. Use this EA to unlink the objects on the OST.
684          * It's opaque so we don't swab here; we leave it to obd_unpackmd() to
685          * check it is complete and sensible. */
686         eadata = lustre_swab_repbuf(request, 1, body->eadatasize, NULL);
687         LASSERT(eadata != NULL);
688         if (eadata == NULL) {
689                 CERROR("Can't unpack MDS EA data\n");
690                 GOTO(out, rc = -EPROTO);
691         }
692
693         rc = obd_unpackmd(ll_i2obdexp(dir), &lsm, eadata, body->eadatasize);
694         if (rc < 0) {
695                 CERROR("obd_unpackmd: %d\n", rc);
696                 GOTO(out, rc);
697         }
698         LASSERT(rc >= sizeof(*lsm));
699
700         oa = obdo_alloc();
701         if (oa == NULL)
702                 GOTO(out_free_memmd, rc = -ENOMEM);
703
704         oa->o_id = lsm->lsm_object_id;
705         oa->o_mode = body->mode & S_IFMT;
706         oa->o_valid = OBD_MD_FLID | OBD_MD_FLTYPE;
707
708         if (body->valid & OBD_MD_FLCOOKIE) {
709                 oa->o_valid |= OBD_MD_FLCOOKIE;
710                 oti.oti_logcookies =
711                         lustre_msg_buf(request->rq_repmsg, 2,
712                                        sizeof(struct llog_cookie) *
713                                        lsm->lsm_stripe_count);
714                 if (oti.oti_logcookies == NULL) {
715                         oa->o_valid &= ~OBD_MD_FLCOOKIE;
716                         body->valid &= ~OBD_MD_FLCOOKIE;
717                 }
718         }
719
720         rc = obd_destroy(ll_i2obdexp(dir), oa, lsm, &oti);
721         obdo_free(oa);
722         if (rc)
723                 CERROR("obd destroy objid "LPX64" error %d\n",
724                        lsm->lsm_object_id, rc);
725  out_free_memmd:
726         obd_free_memmd(ll_i2obdexp(dir), &lsm);
727  out:
728         return rc;
729 }
730
731 static int ll_unlink_raw(struct nameidata *nd)
732 {
733         struct inode *dir = nd->dentry->d_inode;
734         const char *name = nd->last.name;
735         int len = nd->last.len;
736         struct ptlrpc_request *request = NULL;
737         struct mdc_op_data op_data;
738         int rc;
739         ENTRY;
740         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p)\n",
741                name, dir->i_ino, dir->i_generation, dir);
742
743         ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, 0);
744         rc = mdc_unlink(ll_i2sbi(dir)->ll_mdc_exp, &op_data, &request);
745         if (rc)
746                 GOTO(out, rc);
747
748         rc = ll_objects_destroy(request, dir);
749  out:
750         ptlrpc_req_finished(request);
751         RETURN(rc);
752 }
753
754 static int ll_rename_raw(struct nameidata *oldnd, struct nameidata *newnd)
755 {
756         struct inode *src = oldnd->dentry->d_inode;
757         struct inode *tgt = newnd->dentry->d_inode;
758         const char *oldname = oldnd->last.name;
759         int oldlen  = oldnd->last.len;
760         const char *newname = newnd->last.name;
761         int newlen  = newnd->last.len;
762         struct ptlrpc_request *request = NULL;
763         struct ll_sb_info *sbi = ll_i2sbi(src);
764         struct mdc_op_data op_data;
765         int err;
766         ENTRY;
767         CDEBUG(D_VFSTRACE, "VFS Op:oldname=%s,src_dir=%lu/%u(%p),newname=%s,"
768                "tgt_dir=%lu/%u(%p)\n", oldname, src->i_ino, src->i_generation,
769                src, newname, tgt->i_ino, tgt->i_generation, tgt);
770
771         ll_prepare_mdc_op_data(&op_data, src, tgt, NULL, 0, 0);
772         err = mdc_rename(sbi->ll_mdc_exp, &op_data,
773                          oldname, oldlen, newname, newlen, &request);
774         if (!err) {
775                 err = ll_objects_destroy(request, src);
776         }
777
778         ptlrpc_req_finished(request);
779
780         RETURN(err);
781 }
782
783 struct inode_operations ll_dir_inode_operations = {
784         link_raw:           ll_link_raw,
785         unlink_raw:         ll_unlink_raw,
786         symlink_raw:        ll_symlink_raw,
787         mkdir_raw:          ll_mkdir_raw,
788         rmdir_raw:          ll_rmdir_raw,
789         mknod_raw:          ll_mknod_raw,
790         mknod:              ll_mknod,
791         rename_raw:         ll_rename_raw,
792         setattr:            ll_setattr,
793         setattr_raw:        ll_setattr_raw,
794 #if (LINUX_VERSION_CODE < KERNEL_VERSION(2,5,0))
795         create_it:          ll_create_it,
796         lookup_it:          ll_lookup_it,
797         revalidate_it:      ll_inode_revalidate_it,
798 #else
799         lookup:             ll_lookup_nd,
800         create:             ll_create_nd,
801         getattr_it:         ll_getattr,
802 #endif
803 };