Whamcloud - gitweb
Don't leave stale dentries around after renames (from 1.0.4).
[fs/lustre-release.git] / lustre / llite / namei.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  *  Copyright (c) 2002, 2003 Cluster File Systems, Inc.
5  *
6  *   This file is part of Lustre, http://www.lustre.org.
7  *
8  *   Lustre is free software; you can redistribute it and/or
9  *   modify it under the terms of version 2 of the GNU General Public
10  *   License as published by the Free Software Foundation.
11  *
12  *   Lustre is distributed in the hope that it will be useful,
13  *   but WITHOUT ANY WARRANTY; without even the implied warranty of
14  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  *   GNU General Public License for more details.
16  *
17  *   You should have received a copy of the GNU General Public License
18  *   along with Lustre; if not, write to the Free Software
19  *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
20  *
21  *  derived in small part from linux/fs/ext2/namei.c
22  *
23  *  Copyright (C) 1991, 1992  Linus Torvalds
24  *
25  *  Big-endian to little-endian byte-swapping/bitmaps by
26  *        David S. Miller (davem@caip.rutgers.edu), 1995
27  *  Directory entry file type support and forward compatibility hooks
28  *      for B-tree directories by Theodore Ts'o (tytso@mit.edu), 1998
29  */
30
31 #include <linux/fs.h>
32 #include <linux/sched.h>
33 #include <linux/mm.h>
34 #include <linux/smp_lock.h>
35 #include <linux/quotaops.h>
36 #include <linux/highmem.h>
37 #include <linux/pagemap.h>
38
39 #define DEBUG_SUBSYSTEM S_LLITE
40
41 #include <linux/obd_support.h>
42 #include <linux/lustre_lite.h>
43 #include <linux/lustre_dlm.h>
44 #include "llite_internal.h"
45
46 /* methods */
47
48 #if (LINUX_VERSION_CODE < KERNEL_VERSION(2,5,0))
49 static int ll_test_inode(struct inode *inode, unsigned long ino, void *opaque)
50 #else
51 static int ll_test_inode(struct inode *inode, void *opaque)
52 #endif
53 {
54         static int last_ino, last_gen, last_count;
55         struct lustre_md *md = opaque;
56
57         if (!(md->body->valid & (OBD_MD_FLGENER | OBD_MD_FLID))) {
58                 CERROR("MDS body missing inum or generation\n");
59                 return 0;
60         }
61
62         if (last_ino == md->body->ino && last_gen == md->body->generation &&
63             last_count < 500) {
64                 last_count++;
65         } else {
66                 if (last_count > 1)
67                         CDEBUG(D_VFSTRACE, "compared %u/%u %u times\n",
68                                last_ino, last_gen, last_count);
69                 last_count = 0;
70                 last_ino = md->body->ino;
71                 last_gen = md->body->generation;
72                 CDEBUG(D_VFSTRACE,
73                        "comparing inode %p ino %lu/%u to body %u/%u\n",
74                        inode, inode->i_ino, inode->i_generation,
75                        md->body->ino, md->body->generation);
76         }
77
78         if (inode->i_generation != md->body->generation)
79                 return 0;
80
81         /* Apply the attributes in 'opaque' to this inode */
82         ll_update_inode(inode, md->body, md->lsm);
83         return 1;
84 }
85
86 extern struct dentry_operations ll_d_ops;
87
88 int ll_unlock(__u32 mode, struct lustre_handle *lockh)
89 {
90         ENTRY;
91
92         ldlm_lock_decref(lockh, mode);
93
94         RETURN(0);
95 }
96
97 /* Get an inode by inode number (already instantiated by the intent lookup).
98  * Returns inode or NULL
99  */
100 #if (LINUX_VERSION_CODE >= KERNEL_VERSION(2,5,0))
101 int ll_set_inode(struct inode *inode, void *opaque)
102 {
103         ll_read_inode2(inode, opaque);
104         return 0;
105 }
106 struct inode *ll_iget(struct super_block *sb, ino_t hash,
107                       struct lustre_md *md)
108 {
109         struct inode *inode;
110
111         LASSERT(hash != 0);
112         inode = iget5_locked(sb, hash, ll_test_inode, ll_set_inode, md);
113
114         if (inode) {
115                 if (inode->i_state & I_NEW)
116                         unlock_new_inode(inode);
117                 CDEBUG(D_VFSTRACE, "inode: %lu/%u(%p)\n", inode->i_ino,
118                        inode->i_generation, inode);
119         }
120
121         return inode;
122 }
123 #else
124 struct inode *ll_iget(struct super_block *sb, ino_t hash,
125                       struct lustre_md *md)
126 {
127         struct inode *inode;
128         LASSERT(hash != 0);
129         inode = iget4(sb, hash, ll_test_inode, md);
130         if (inode)
131                 CDEBUG(D_VFSTRACE, "inode: %lu/%u(%p)\n", inode->i_ino,
132                        inode->i_generation, inode);
133         return inode;
134 }
135 #endif
136
137 int ll_mdc_blocking_ast(struct ldlm_lock *lock, struct ldlm_lock_desc *desc,
138                         void *data, int flag)
139 {
140         int rc;
141         struct lustre_handle lockh;
142         ENTRY;
143
144         switch (flag) {
145         case LDLM_CB_BLOCKING:
146                 ldlm_lock2handle(lock, &lockh);
147                 rc = ldlm_cli_cancel(&lockh);
148                 if (rc < 0) {
149                         CDEBUG(D_INODE, "ldlm_cli_cancel: %d\n", rc);
150                         RETURN(rc);
151                 }
152                 break;
153         case LDLM_CB_CANCELING: {
154                 struct inode *inode = ll_inode_from_lock(lock);
155
156                 /* Invalidate all dentries associated with this inode */
157                 if (inode == NULL)
158                         break;
159
160                 clear_bit(LLI_F_HAVE_MDS_SIZE_LOCK,
161                           &(ll_i2info(inode)->lli_flags));
162
163                 if (lock->l_resource->lr_name.name[0] != inode->i_ino ||
164                     lock->l_resource->lr_name.name[1] != inode->i_generation) {
165                         LDLM_ERROR(lock, "data mismatch with ino %lu/%u",
166                                    inode->i_ino, inode->i_generation);
167                 }
168                 if (S_ISDIR(inode->i_mode)) {
169                         CDEBUG(D_INODE, "invalidating inode %lu\n",
170                                inode->i_ino);
171
172                         ll_invalidate_inode_pages(inode);
173                 }
174
175                 if (inode->i_sb->s_root &&
176                     inode != inode->i_sb->s_root->d_inode)
177                         ll_unhash_aliases(inode);
178                 iput(inode);
179                 break;
180         }
181         default:
182                 LBUG();
183         }
184
185         RETURN(0);
186 }
187
188 int ll_mdc_cancel_unused(struct lustre_handle *conn, struct inode *inode,
189                          int flags, void *opaque)
190 {
191         struct ldlm_res_id res_id =
192                 { .name = {inode->i_ino, inode->i_generation} };
193         struct obd_device *obddev = class_conn2obd(conn);
194         ENTRY;
195         RETURN(ldlm_cli_cancel_unused(obddev->obd_namespace, &res_id, flags,
196                                       opaque));
197 }
198
199
200 void ll_prepare_mdc_op_data(struct mdc_op_data *data, struct inode *i1,
201                             struct inode *i2, const char *name, int namelen,
202                             int mode)
203 {
204         LASSERT(i1);
205
206         ll_i2uctxt(&data->ctxt, i1, i2);
207         ll_inode2fid(&data->fid1, i1);
208
209         if (i2)
210                 ll_inode2fid(&data->fid2, i2);
211
212         data->name = name;
213         data->namelen = namelen;
214         data->create_mode = mode;
215         data->mod_time = LTIME_S(CURRENT_TIME);
216 }
217
218 /* Search "inode"'s alias list for a dentry that has the same name and parent as
219  * de.  If found, return it.  If not found, return de. */
220 struct dentry *ll_find_alias(struct inode *inode, struct dentry *de)
221 {
222         struct list_head *tmp;
223
224         spin_lock(&dcache_lock);
225         list_for_each(tmp, &inode->i_dentry) {
226                 struct dentry *dentry = list_entry(tmp, struct dentry, d_alias);
227
228                 /* We are called here with 'de' already on the aliases list. */
229                 if (dentry == de) {
230                         CERROR("whoops\n");
231                         continue;
232                 }
233
234                 if (dentry->d_parent != de->d_parent)
235                         continue;
236
237                 if (dentry->d_name.len != de->d_name.len)
238                         continue;
239
240                 if (memcmp(dentry->d_name.name, de->d_name.name,
241                            de->d_name.len) != 0)
242                         continue;
243
244                 if (!list_empty(&dentry->d_lru))
245                         list_del_init(&dentry->d_lru);
246
247                 hlist_del_init(&dentry->d_hash);
248                 __d_rehash(dentry, 0); /* avoid taking dcache_lock inside */
249                 spin_unlock(&dcache_lock);
250                 atomic_inc(&dentry->d_count);
251                 iput(inode);
252                 dentry->d_flags &= ~DCACHE_LUSTRE_INVALID;
253                 return dentry;
254         }
255
256         spin_unlock(&dcache_lock);
257
258         return de;
259 }
260
261 static int lookup_it_finish(struct ptlrpc_request *request, int offset,
262                             struct lookup_intent *it, void *data)
263 {
264         struct it_cb_data *icbd = data;
265         struct dentry **de = icbd->icbd_childp;
266         struct inode *parent = icbd->icbd_parent;
267         struct ll_sb_info *sbi = ll_i2sbi(parent);
268         struct dentry *dentry = *de, *saved = *de;
269         struct inode *inode = NULL;
270         int rc;
271
272         /* NB 1 request reference will be taken away by ll_intent_lock()
273          * when I return */
274         if (!it_disposition(it, DISP_LOOKUP_NEG)) {
275                 ENTRY;
276
277                 rc = ll_prep_inode(sbi->ll_osc_exp, &inode, request, offset,
278                                    dentry->d_sb);
279                 if (rc)
280                         RETURN(rc);
281
282                 CDEBUG(D_DLMTRACE, "setting l_data to inode %p (%lu/%u)\n",
283                        inode, inode->i_ino, inode->i_generation);
284                 mdc_set_lock_data(&it->d.lustre.it_lock_handle, inode);
285
286                 /* If this is a stat, get the authoritative file size */
287                 if (it->it_op == IT_GETATTR && S_ISREG(inode->i_mode) &&
288                     ll_i2info(inode)->lli_smd != NULL) {
289                         struct ldlm_extent extent = {0, OBD_OBJECT_EOF};
290                         struct lustre_handle lockh = {0};
291                         struct lov_stripe_md *lsm = ll_i2info(inode)->lli_smd;
292                         ldlm_error_t rc;
293
294                         LASSERT(lsm->lsm_object_id != 0);
295
296                         /* bug 2334: drop MDS lock before acquiring OST lock */
297                         ll_intent_drop_lock(it);
298
299                         rc = ll_extent_lock(NULL, inode, lsm, LCK_PR, &extent,
300                                             &lockh);
301                         if (rc != ELDLM_OK) {
302                                 iput(inode);
303                                 RETURN(-EIO);
304                         }
305                         ll_extent_unlock(NULL, inode, lsm, LCK_PR, &lockh);
306                 }
307
308                 dentry = *de = ll_find_alias(inode, dentry);
309         } else {
310                 ENTRY;
311         }
312
313         dentry->d_op = &ll_d_ops;
314         ll_set_dd(dentry);
315
316         if (dentry == saved)
317                 d_add(dentry, inode);
318
319         RETURN(0);
320 }
321
322
323 static struct dentry *ll_lookup_it(struct inode *parent, struct dentry *dentry,
324                                    struct lookup_intent *it, int flags)
325 {
326         struct dentry *save = dentry, *retval;
327         struct ll_fid pfid;
328         struct ll_uctxt ctxt;
329         struct it_cb_data icbd;
330         struct ptlrpc_request *req = NULL;
331         struct lookup_intent lookup_it = { .it_op = IT_LOOKUP };
332         int rc;
333         ENTRY;
334
335         if (dentry->d_name.len > EXT3_NAME_LEN)
336                 RETURN(ERR_PTR(-ENAMETOOLONG));
337
338         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p),intent=%s\n",
339                dentry->d_name.name, parent->i_ino, parent->i_generation,
340                parent, LL_IT2STR(it));
341
342         if (d_mountpoint(dentry))
343                 CERROR("Tell Peter, lookup on mtpt, it %s\n", LL_IT2STR(it));
344
345         ll_frob_intent(&it, &lookup_it);
346
347         icbd.icbd_childp = &dentry;
348         icbd.icbd_parent = parent;
349         ll_inode2fid(&pfid, parent);
350         ll_i2uctxt(&ctxt, parent, NULL);
351
352         rc = mdc_intent_lock(ll_i2mdcexp(parent), &ctxt, &pfid,
353                              dentry->d_name.name, dentry->d_name.len, NULL, 0,
354                              NULL, it, flags, &req, ll_mdc_blocking_ast);
355         if (rc < 0)
356                 GOTO(out, retval = ERR_PTR(rc));
357
358         rc = lookup_it_finish(req, 1, it, &icbd);
359         if (rc != 0) {
360                 ll_intent_release(it);
361                 GOTO(out, retval = ERR_PTR(rc));
362         }
363
364         ll_lookup_finish_locks(it, dentry);
365
366         if (dentry == save)
367                 GOTO(out, retval = NULL);
368         else
369                 GOTO(out, retval = dentry);
370  out:
371         if (req)
372                 ptlrpc_req_finished(req);
373         return retval;
374 }
375
376 #if (LINUX_VERSION_CODE > KERNEL_VERSION(2,5,0))
377 static struct dentry *ll_lookup_nd(struct inode *parent, struct dentry *dentry,
378                                    struct nameidata *nd)
379 {
380         struct dentry *de;
381         ENTRY;
382
383         if (nd && nd->flags & LOOKUP_LAST && !(nd->flags & LOOKUP_LINK_NOTLAST))
384                 de = ll_lookup_it(parent, dentry, &nd->intent, nd->flags);
385         else
386                 de = ll_lookup_it(parent, dentry, NULL, 0);
387
388         RETURN(de);
389 }
390 #endif
391
392 /* We depend on "mode" being set with the proper file type/umask by now */
393 static struct inode *ll_create_node(struct inode *dir, const char *name,
394                                     int namelen, const void *data, int datalen,
395                                     int mode, __u64 extra,
396                                     struct lookup_intent *it)
397 {
398         struct inode *inode = NULL;
399         struct ptlrpc_request *request = NULL;
400         struct ll_sb_info *sbi = ll_i2sbi(dir);
401         int rc;
402         ENTRY;
403
404         LASSERT(it && it->d.lustre.it_disposition);
405
406         request = it->d.lustre.it_data;
407         rc = ll_prep_inode(sbi->ll_osc_exp, &inode, request, 1, dir->i_sb);
408         if (rc)
409                 GOTO(out, inode = ERR_PTR(rc));
410
411         LASSERT(list_empty(&inode->i_dentry));
412
413         /* We asked for a lock on the directory, but were granted a
414          * lock on the inode.  Since we finally have an inode pointer,
415          * stuff it in the lock. */
416         CDEBUG(D_DLMTRACE, "setting l_ast_data to inode %p (%lu/%u)\n",
417                inode, inode->i_ino, inode->i_generation);
418         mdc_set_lock_data(&it->d.lustre.it_lock_handle, inode);
419         EXIT;
420  out:
421         ptlrpc_req_finished(request);
422         return inode;
423 }
424
425 /*
426  * By the time this is called, we already have created the directory cache
427  * entry for the new file, but it is so far negative - it has no inode.
428  *
429  * We defer creating the OBD object(s) until open, to keep the intent and
430  * non-intent code paths similar, and also because we do not have the MDS
431  * inode number before calling ll_create_node() (which is needed for LOV),
432  * so we would need to do yet another RPC to the MDS to store the LOV EA
433  * data on the MDS.  If needed, we would pass the PACKED lmm as data and
434  * lmm_size in datalen (the MDS still has code which will handle that).
435  *
436  * If the create succeeds, we fill in the inode information
437  * with d_instantiate().
438  */
439 static int ll_create_it(struct inode *dir, struct dentry *dentry, int mode,
440                         struct lookup_intent *it)
441 {
442         struct inode *inode;
443         struct ptlrpc_request *request = it->d.lustre.it_data;
444         int rc = 0;
445         ENTRY;
446
447         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p),intent=%s\n",
448                dentry->d_name.name, dir->i_ino, dir->i_generation, dir,
449                LL_IT2STR(it));
450
451         rc = it_open_error(DISP_OPEN_CREATE, it);
452         if (rc)
453                 RETURN(rc);
454
455         mdc_store_inode_generation(request, 2, 1);
456         inode = ll_create_node(dir, dentry->d_name.name, dentry->d_name.len,
457                                NULL, 0, mode, 0, it);
458         if (IS_ERR(inode)) {
459                 RETURN(PTR_ERR(inode));
460         }
461
462         d_instantiate(dentry, inode);
463         RETURN(0);
464 }
465
466 #if (LINUX_VERSION_CODE > KERNEL_VERSION(2,5,0))
467 static int ll_create_nd(struct inode *dir, struct dentry *dentry, int mode, struct nameidata *nd)
468 {
469         return ll_create_it(dir, dentry, mode, &nd->intent);
470 }
471 #endif
472
473 static int ll_mknod_raw(struct nameidata *nd, int mode, dev_t rdev)
474 {
475         struct ptlrpc_request *request = NULL;
476         struct inode *dir = nd->dentry->d_inode;
477         const char *name = nd->last.name;
478         int len = nd->last.len;
479         struct ll_sb_info *sbi = ll_i2sbi(dir);
480         struct mdc_op_data op_data;
481         int err = -EMLINK;
482         ENTRY;
483
484         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p)\n",
485                name, dir->i_ino, dir->i_generation, dir);
486
487         if (dir->i_nlink >= EXT3_LINK_MAX)
488                 RETURN(err);
489
490         mode &= ~current->fs->umask;
491
492         switch (mode & S_IFMT) {
493         case 0:
494         case S_IFREG:
495                 mode |= S_IFREG; /* for mode = 0 case, fallthrough */
496         case S_IFCHR:
497         case S_IFBLK:
498         case S_IFIFO:
499         case S_IFSOCK:
500                 ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, 0);
501                 err = mdc_create(sbi->ll_mdc_exp, &op_data, NULL, 0, mode,
502                                  current->fsuid, current->fsgid,
503                                  rdev, &request);
504                 ptlrpc_req_finished(request);
505                 break;
506         case S_IFDIR:
507                 err = -EPERM;
508                 break;
509         default:
510                 err = -EINVAL;
511         }
512         RETURN(err);
513 }
514
515 static int ll_mknod(struct inode *dir, struct dentry *child, int mode,
516                     ll_dev_t rdev)
517 {
518         struct ptlrpc_request *request = NULL;
519         struct inode *inode = NULL;
520         const char *name = child->d_name.name;
521         int len = child->d_name.len;
522         struct ll_sb_info *sbi = ll_i2sbi(dir);
523         struct mdc_op_data op_data;
524         int err = -EMLINK;
525         ENTRY;
526
527         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p)\n",
528                name, dir->i_ino, dir->i_generation, dir);
529
530         if (dir->i_nlink >= EXT3_LINK_MAX)
531                 RETURN(err);
532
533         mode &= ~current->fs->umask;
534
535         switch (mode & S_IFMT) {
536         case 0:
537         case S_IFREG:
538                 mode |= S_IFREG; /* for mode = 0 case, fallthrough */
539         case S_IFCHR:
540         case S_IFBLK:
541         case S_IFIFO:
542         case S_IFSOCK:
543                 ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, 0);
544                 err = mdc_create(sbi->ll_mdc_exp, &op_data, NULL, 0, mode,
545                                  current->fsuid, current->fsgid,
546                                  rdev, &request);
547                 err = ll_prep_inode(sbi->ll_osc_exp, &inode, request, 0,
548                                     child->d_sb);
549                 if (err)
550                         GOTO(out_err, err);
551                 break;
552         case S_IFDIR:
553                 RETURN(-EPERM);
554                 break;
555         default:
556                 RETURN(-EINVAL);
557         }
558
559         d_instantiate(child, inode);
560  out_err:
561         ptlrpc_req_finished(request);
562         RETURN(err);
563 }
564
565 static int ll_symlink_raw(struct nameidata *nd, const char *tgt)
566 {
567         struct inode *dir = nd->dentry->d_inode;
568         const char *name = nd->last.name;
569         int len = nd->last.len;
570         struct ptlrpc_request *request = NULL;
571         struct ll_sb_info *sbi = ll_i2sbi(dir);
572         struct mdc_op_data op_data;
573         int err = -EMLINK;
574         ENTRY;
575
576         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p),target=%s\n",
577                name, dir->i_ino, dir->i_generation, dir, tgt);
578
579         if (dir->i_nlink >= EXT3_LINK_MAX)
580                 RETURN(err);
581
582         ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, 0);
583         err = mdc_create(sbi->ll_mdc_exp, &op_data,
584                          tgt, strlen(tgt) + 1, S_IFLNK | S_IRWXUGO,
585                          current->fsuid, current->fsgid, 0, &request);
586         ptlrpc_req_finished(request);
587         RETURN(err);
588 }
589
590 static int ll_link_raw(struct nameidata *srcnd, struct nameidata *tgtnd)
591 {
592         struct inode *src = srcnd->dentry->d_inode;
593         struct inode *dir = tgtnd->dentry->d_inode;
594         const char *name = tgtnd->last.name;
595         int len = tgtnd->last.len;
596         struct ptlrpc_request *request = NULL;
597         struct mdc_op_data op_data;
598         int err;
599         struct ll_sb_info *sbi = ll_i2sbi(dir);
600
601         ENTRY;
602         CDEBUG(D_VFSTRACE, "VFS Op:inode=%lu/%u(%p),dir=%lu/%u(%p),target=%s\n",
603                src->i_ino, src->i_generation, src,
604                dir->i_ino, dir->i_generation, dir, name);
605
606         ll_prepare_mdc_op_data(&op_data, src, dir, name, len, 0);
607         err = mdc_link(sbi->ll_mdc_exp, &op_data, &request);
608         ptlrpc_req_finished(request);
609
610         RETURN(err);
611 }
612
613
614 static int ll_mkdir_raw(struct nameidata *nd, int mode)
615 {
616         struct inode *dir = nd->dentry->d_inode;
617         const char *name = nd->last.name;
618         int len = nd->last.len;
619         struct ptlrpc_request *request = NULL;
620         struct ll_sb_info *sbi = ll_i2sbi(dir);
621         struct mdc_op_data op_data;
622         int err = -EMLINK;
623         ENTRY;
624         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p)\n",
625                name, dir->i_ino, dir->i_generation, dir);
626
627         if (dir->i_nlink >= EXT3_LINK_MAX)
628                 RETURN(err);
629
630         mode = (mode & (S_IRWXUGO|S_ISVTX) & ~current->fs->umask) | S_IFDIR;
631         ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, 0);
632         err = mdc_create(sbi->ll_mdc_exp, &op_data, NULL, 0, mode,
633                          current->fsuid, current->fsgid, 0, &request);
634         ptlrpc_req_finished(request);
635         RETURN(err);
636 }
637
638 static int ll_rmdir_raw(struct nameidata *nd)
639 {
640         struct inode *dir = nd->dentry->d_inode;
641         const char *name = nd->last.name;
642         int len = nd->last.len;
643         struct ptlrpc_request *request = NULL;
644         struct mdc_op_data op_data;
645         int rc;
646         ENTRY;
647         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p)\n",
648                name, dir->i_ino, dir->i_generation, dir);
649
650         ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, S_IFDIR);
651         rc = mdc_unlink(ll_i2sbi(dir)->ll_mdc_exp, &op_data, &request);
652         ptlrpc_req_finished(request);
653         RETURN(rc);
654 }
655
656 int ll_objects_destroy(struct ptlrpc_request *request, struct inode *dir)
657 {
658         struct mds_body *body;
659         struct lov_mds_md *eadata;
660         struct lov_stripe_md *lsm = NULL;
661         struct obd_trans_info oti = { 0 };
662         struct obdo *oa;
663         int rc;
664         ENTRY;
665
666         /* req is swabbed so this is safe */
667         body = lustre_msg_buf(request->rq_repmsg, 0, sizeof(*body));
668
669         if (!(body->valid & OBD_MD_FLEASIZE))
670                 RETURN(0);
671
672         if (body->eadatasize == 0) {
673                 CERROR("OBD_MD_FLEASIZE set but eadatasize zero\n");
674                 GOTO(out, rc = -EPROTO);
675         }
676
677         /* The MDS sent back the EA because we unlinked the last reference
678          * to this file. Use this EA to unlink the objects on the OST.
679          * It's opaque so we don't swab here; we leave it to obd_unpackmd() to
680          * check it is complete and sensible. */
681         eadata = lustre_swab_repbuf(request, 1, body->eadatasize, NULL);
682         LASSERT(eadata != NULL);
683         if (eadata == NULL) {
684                 CERROR("Can't unpack MDS EA data\n");
685                 GOTO(out, rc = -EPROTO);
686         }
687
688         rc = obd_unpackmd(ll_i2obdexp(dir), &lsm, eadata, body->eadatasize);
689         if (rc < 0) {
690                 CERROR("obd_unpackmd: %d\n", rc);
691                 GOTO(out, rc);
692         }
693         LASSERT(rc >= sizeof(*lsm));
694
695         oa = obdo_alloc();
696         if (oa == NULL)
697                 GOTO(out_free_memmd, rc = -ENOMEM);
698
699         oa->o_id = lsm->lsm_object_id;
700         oa->o_mode = body->mode & S_IFMT;
701         oa->o_valid = OBD_MD_FLID | OBD_MD_FLTYPE;
702
703         if (body->valid & OBD_MD_FLCOOKIE) {
704                 oa->o_valid |= OBD_MD_FLCOOKIE;
705                 oti.oti_logcookies =
706                         lustre_msg_buf(request->rq_repmsg, 2,
707                                        sizeof(struct llog_cookie) *
708                                        lsm->lsm_stripe_count);
709                 if (oti.oti_logcookies == NULL) {
710                         oa->o_valid &= ~OBD_MD_FLCOOKIE;
711                         body->valid &= ~OBD_MD_FLCOOKIE;
712                 }
713         }
714
715         rc = obd_destroy(ll_i2obdexp(dir), oa, lsm, &oti);
716         obdo_free(oa);
717         if (rc)
718                 CERROR("obd destroy objid "LPX64" error %d\n",
719                        lsm->lsm_object_id, rc);
720  out_free_memmd:
721         obd_free_memmd(ll_i2obdexp(dir), &lsm);
722  out:
723         return rc;
724 }
725
726 static int ll_unlink_raw(struct nameidata *nd)
727 {
728         struct inode *dir = nd->dentry->d_inode;
729         const char *name = nd->last.name;
730         int len = nd->last.len;
731         struct ptlrpc_request *request = NULL;
732         struct mdc_op_data op_data;
733         int rc;
734         ENTRY;
735         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,dir=%lu/%u(%p)\n",
736                name, dir->i_ino, dir->i_generation, dir);
737
738         ll_prepare_mdc_op_data(&op_data, dir, NULL, name, len, 0);
739         rc = mdc_unlink(ll_i2sbi(dir)->ll_mdc_exp, &op_data, &request);
740         if (rc)
741                 GOTO(out, rc);
742
743         rc = ll_objects_destroy(request, dir);
744  out:
745         ptlrpc_req_finished(request);
746         RETURN(rc);
747 }
748
749 static int ll_rename_raw(struct nameidata *oldnd, struct nameidata *newnd)
750 {
751         struct inode *src = oldnd->dentry->d_inode;
752         struct inode *tgt = newnd->dentry->d_inode;
753         const char *oldname = oldnd->last.name;
754         int oldlen  = oldnd->last.len;
755         const char *newname = newnd->last.name;
756         int newlen  = newnd->last.len;
757         struct ptlrpc_request *request = NULL;
758         struct ll_sb_info *sbi = ll_i2sbi(src);
759         struct mdc_op_data op_data;
760         int err;
761         ENTRY;
762         CDEBUG(D_VFSTRACE, "VFS Op:oldname=%s,src_dir=%lu/%u(%p),newname=%s,"
763                "tgt_dir=%lu/%u(%p)\n", oldname, src->i_ino, src->i_generation,
764                src, newname, tgt->i_ino, tgt->i_generation, tgt);
765
766         ll_prepare_mdc_op_data(&op_data, src, tgt, NULL, 0, 0);
767         err = mdc_rename(sbi->ll_mdc_exp, &op_data,
768                          oldname, oldlen, newname, newlen, &request);
769         if (!err) {
770                 err = ll_objects_destroy(request, src);
771         }
772
773         ptlrpc_req_finished(request);
774
775         RETURN(err);
776 }
777
778 struct inode_operations ll_dir_inode_operations = {
779         link_raw:           ll_link_raw,
780         unlink_raw:         ll_unlink_raw,
781         symlink_raw:        ll_symlink_raw,
782         mkdir_raw:          ll_mkdir_raw,
783         rmdir_raw:          ll_rmdir_raw,
784         mknod_raw:          ll_mknod_raw,
785         mknod:              ll_mknod,
786         rename_raw:         ll_rename_raw,
787         setattr:         ll_setattr,
788         setattr_raw:     ll_setattr_raw,
789 #if (LINUX_VERSION_CODE < KERNEL_VERSION(2,5,0))
790         create_it:          ll_create_it,
791         lookup_it:            ll_lookup_it,
792         revalidate_it:      ll_inode_revalidate_it,
793 #else
794         lookup:          ll_lookup_nd,
795         create:          ll_create_nd,
796         getattr_it:         ll_getattr,
797 #endif
798 };