Whamcloud - gitweb
Branch HEAD
[fs/lustre-release.git] / lustre / llite / dcache.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  *  Copyright (c) 2001-2003 Cluster File Systems, Inc.
5  *
6  *   This file is part of Lustre, http://www.lustre.org.
7  *
8  *   Lustre is free software; you can redistribute it and/or
9  *   modify it under the terms of version 2 of the GNU General Public
10  *   License as published by the Free Software Foundation.
11  *
12  *   Lustre is distributed in the hope that it will be useful,
13  *   but WITHOUT ANY WARRANTY; without even the implied warranty of
14  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  *   GNU General Public License for more details.
16  *
17  *   You should have received a copy of the GNU General Public License
18  *   along with Lustre; if not, write to the Free Software
19  *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
20  */
21
22 #include <linux/fs.h>
23 #include <linux/sched.h>
24 #include <linux/smp_lock.h>
25 #include <linux/quotaops.h>
26
27 #define DEBUG_SUBSYSTEM S_LLITE
28
29 #include <obd_support.h>
30 #include <lustre_lite.h>
31 #include <lustre/lustre_idl.h>
32 #include <lustre_dlm.h>
33 #include <lustre_mdc.h>
34 //#include <lustre_ver.h>
35 //#include <lustre_version.h>
36
37 #include "llite_internal.h"
38
39 /* should NOT be called with the dcache lock, see fs/dcache.c */
40 static void ll_release(struct dentry *de)
41 {
42         struct ll_dentry_data *lld;
43         ENTRY;
44         LASSERT(de != NULL);
45         lld = ll_d2d(de);
46         if (lld == NULL) { /* NFS copies the de->d_op methods (bug 4655) */
47                 EXIT;
48                 return;
49         }
50 #ifndef LUSTRE_KERNEL_VERSION
51         if (lld->lld_it) {
52                 ll_intent_release(lld->lld_it);
53                 OBD_FREE(lld->lld_it, sizeof(*lld->lld_it));
54         }
55 #endif
56         LASSERT(lld->lld_cwd_count == 0);
57         LASSERT(lld->lld_mnt_count == 0);
58         OBD_FREE(de->d_fsdata, sizeof(*lld));
59
60         EXIT;
61 }
62
63 #ifdef LUSTRE_KERNEL_VERSION
64 /* Compare if two dentries are the same.  Don't match if the existing dentry
65  * is marked DCACHE_LUSTRE_INVALID.  Returns 1 if different, 0 if the same.
66  *
67  * This avoids a race where ll_lookup_it() instantiates a dentry, but we get
68  * an AST before calling d_revalidate_it().  The dentry still exists (marked
69  * INVALID) so d_lookup() matches it, but we have no lock on it (so
70  * lock_match() fails) and we spin around real_lookup(). */
71 int ll_dcompare(struct dentry *parent, struct qstr *d_name, struct qstr *name)
72 {
73         struct dentry *dchild;
74         ENTRY;
75
76         if (d_name->len != name->len)
77                 RETURN(1);
78
79         if (memcmp(d_name->name, name->name, name->len))
80                 RETURN(1);
81
82         /* XXX: d_name must be in-dentry structure */
83         dchild = container_of(d_name, struct dentry, d_name); /* ugh */
84         if (dchild->d_flags & DCACHE_LUSTRE_INVALID) {
85                 CDEBUG(D_DENTRY,"INVALID dentry %p not matched, was bug 3784\n",
86                        dchild);
87                 RETURN(1);
88         }
89
90         RETURN(0);
91 }
92 #endif
93
94 /* should NOT be called with the dcache lock, see fs/dcache.c */
95 static int ll_ddelete(struct dentry *de)
96 {
97         ENTRY;
98         LASSERT(de);
99 #ifndef DCACHE_LUSTRE_INVALID
100 #define DCACHE_LUSTRE_INVALID 0
101 #endif
102
103         CDEBUG(D_DENTRY, "%s dentry %.*s (%p, parent %p, inode %p) %s%s\n",
104                (de->d_flags & DCACHE_LUSTRE_INVALID ? "deleting" : "keeping"),
105                de->d_name.len, de->d_name.name, de, de->d_parent, de->d_inode,
106                d_unhashed(de) ? "" : "hashed,",
107                list_empty(&de->d_subdirs) ? "" : "subdirs");
108 #if DCACHE_LUSTRE_INVALID == 0
109 #undef DCACHE_LUSTRE_INVALID
110 #endif
111
112         RETURN(0);
113 }
114
115 void ll_set_dd(struct dentry *de)
116 {
117         ENTRY;
118         LASSERT(de != NULL);
119
120         CDEBUG(D_DENTRY, "ldd on dentry %.*s (%p) parent %p inode %p refc %d\n",
121                de->d_name.len, de->d_name.name, de, de->d_parent, de->d_inode,
122                atomic_read(&de->d_count));
123         lock_kernel();
124         if (de->d_fsdata == NULL) {
125                 OBD_ALLOC(de->d_fsdata, sizeof(struct ll_dentry_data));
126         }
127         unlock_kernel();
128
129         EXIT;
130 }
131
132 void ll_intent_drop_lock(struct lookup_intent *it)
133 {
134         struct lustre_handle *handle;
135
136         if (it->it_op && it->d.lustre.it_lock_mode) {
137                 handle = (struct lustre_handle *)&it->d.lustre.it_lock_handle;
138                 CDEBUG(D_DLMTRACE, "releasing lock with cookie "LPX64
139                        " from it %p\n", handle->cookie, it);
140                 ldlm_lock_decref(handle, it->d.lustre.it_lock_mode);
141
142                 /* bug 494: intent_release may be called multiple times, from
143                  * this thread and we don't want to double-decref this lock */
144                 it->d.lustre.it_lock_mode = 0;
145         }
146 }
147
148 void ll_intent_release(struct lookup_intent *it)
149 {
150         ENTRY;
151
152         CDEBUG(D_INFO, "intent %p released\n", it);
153         ll_intent_drop_lock(it);
154 #ifdef LUSTRE_KERNEL_VERSION
155         it->it_magic = 0;
156         it->it_op_release = 0;
157 #endif
158         /* We are still holding extra reference on a request, need to free it */
159         if (it_disposition(it, DISP_ENQ_OPEN_REF)) /* open req for llfile_open*/
160                 ptlrpc_req_finished(it->d.lustre.it_data);
161         if (it_disposition(it, DISP_ENQ_CREATE_REF)) /* create rec */
162                 ptlrpc_req_finished(it->d.lustre.it_data);
163         if (it_disposition(it, DISP_ENQ_COMPLETE)) /* saved req from revalidate
164                                                     * to lookup */
165                 ptlrpc_req_finished(it->d.lustre.it_data);
166
167         it->d.lustre.it_disposition = 0;
168         it->d.lustre.it_data = NULL;
169         EXIT;
170 }
171
172 /* Drop dentry if it is not used already, unhash otherwise.
173    Should be called with dcache lock held!
174    Returns: 1 if dentry was dropped, 0 if unhashed. */
175 int ll_drop_dentry(struct dentry *dentry)
176 {
177         lock_dentry(dentry);
178         if (atomic_read(&dentry->d_count) == 0) {
179                 CDEBUG(D_DENTRY, "deleting dentry %.*s (%p) parent %p "
180                        "inode %p\n", dentry->d_name.len,
181                        dentry->d_name.name, dentry, dentry->d_parent,
182                        dentry->d_inode);
183                 dget_locked(dentry);
184                 __d_drop(dentry);
185                 unlock_dentry(dentry);
186                 spin_unlock(&dcache_lock);
187                 dput(dentry);
188                 spin_lock(&dcache_lock);
189                 return 1;
190         }
191         /* disconected dentry can not be find without lookup, because we 
192          * not need his to unhash or mark invalid. */
193         if (dentry->d_flags & DCACHE_DISCONNECTED) {
194                 unlock_dentry(dentry);
195                 RETURN (0);
196         }
197
198 #ifdef LUSTRE_KERNEL_VERSION
199         if (!(dentry->d_flags & DCACHE_LUSTRE_INVALID)) {
200 #else
201         if (!d_unhashed(dentry)) {
202 #endif
203                 CDEBUG(D_DENTRY, "unhashing dentry %.*s (%p) parent %p "
204                        "inode %p refc %d\n", dentry->d_name.len,
205                        dentry->d_name.name, dentry, dentry->d_parent,
206                        dentry->d_inode, atomic_read(&dentry->d_count));
207                 /* actually we don't unhash the dentry, rather just
208                  * mark it inaccessible for to __d_lookup(). otherwise
209                  * sys_getcwd() could return -ENOENT -bzzz */
210 #ifdef LUSTRE_KERNEL_VERSION
211                 dentry->d_flags |= DCACHE_LUSTRE_INVALID;
212 #endif
213                 if (!dentry->d_inode || !S_ISDIR(dentry->d_inode->i_mode))
214                         __d_drop(dentry);
215
216         }
217         unlock_dentry(dentry);
218         return 0;
219 }
220
221 void ll_unhash_aliases(struct inode *inode)
222 {
223         struct list_head *tmp, *head;
224         ENTRY;
225
226         if (inode == NULL) {
227                 CERROR("unexpected NULL inode, tell phil\n");
228                 return;
229         }
230
231         CDEBUG(D_INODE, "marking dentries for ino %lu/%u(%p) invalid\n",
232                inode->i_ino, inode->i_generation, inode);
233
234         head = &inode->i_dentry;
235         spin_lock(&dcache_lock);
236 restart:
237         tmp = head;
238         while ((tmp = tmp->next) != head) {
239                 struct dentry *dentry = list_entry(tmp, struct dentry, d_alias);
240
241                 CDEBUG(D_DENTRY, "dentry in drop %.*s (%p) parent %p "
242                        "inode %p flags %d\n", dentry->d_name.len,
243                        dentry->d_name.name, dentry, dentry->d_parent,
244                        dentry->d_inode, dentry->d_flags);
245
246                 if (dentry->d_name.len == 1 && dentry->d_name.name[0] == '/') {
247                         CERROR("called on root (?) dentry=%p, inode=%p "
248                                "ino=%lu\n", dentry, inode, inode->i_ino);
249                         lustre_dump_dentry(dentry, 1);
250                         libcfs_debug_dumpstack(NULL);
251                 } else if (d_mountpoint(dentry)) {
252                         /* For mountpoints we skip removal of the dentry
253                            which happens solely because we have a lock on it
254                            obtained when this dentry was not a mountpoint yet */
255                         CDEBUG(D_DENTRY, "Skippind mountpoint dentry removal "
256                                          "%.*s (%p) parent %p\n",
257                                           dentry->d_name.len,
258                                           dentry->d_name.name,
259                                           dentry, dentry->d_parent);
260
261                         continue;
262                 }
263
264                 if (ll_drop_dentry(dentry))
265                           goto restart;
266         }
267         spin_unlock(&dcache_lock);
268         EXIT;
269 }
270
271 int ll_revalidate_it_finish(struct ptlrpc_request *request,
272                             int offset, struct lookup_intent *it,
273                             struct dentry *de)
274 {
275         int rc = 0;
276         ENTRY;
277
278         if (!request)
279                 RETURN(0);
280
281         if (it_disposition(it, DISP_LOOKUP_NEG)) 
282                 RETURN(-ENOENT);
283
284         rc = ll_prep_inode(&de->d_inode,
285                            request, offset, NULL);
286
287         RETURN(rc);
288 }
289
290 void ll_lookup_finish_locks(struct lookup_intent *it, struct dentry *dentry)
291 {
292         LASSERT(it != NULL);
293         LASSERT(dentry != NULL);
294
295         if (it->d.lustre.it_lock_mode && dentry->d_inode != NULL) {
296                 struct inode *inode = dentry->d_inode;
297                 struct ll_sb_info *sbi = ll_i2sbi(dentry->d_inode);
298
299                 CDEBUG(D_DLMTRACE, "setting l_data to inode %p (%lu/%u)\n",
300                        inode, inode->i_ino, inode->i_generation);
301                 md_set_lock_data(sbi->ll_md_exp, &it->d.lustre.it_lock_handle,
302                                  inode);
303         }
304
305         /* drop lookup or getattr locks immediately */
306         if (it->it_op == IT_LOOKUP || it->it_op == IT_GETATTR) {
307                 /* on 2.6 there are situation when several lookups and
308                  * revalidations may be requested during single operation.
309                  * therefore, we don't release intent here -bzzz */
310                 ll_intent_drop_lock(it);
311         }
312 }
313
314 void ll_frob_intent(struct lookup_intent **itp, struct lookup_intent *deft)
315 {
316         struct lookup_intent *it = *itp;
317 #if defined(LUSTRE_KERNEL_VERSION)
318         if (it) {
319                 LASSERTF(it->it_magic == INTENT_MAGIC, 
320                          "%p has bad intent magic: %x\n",
321                          it, it->it_magic);
322         }
323 #endif
324
325         if (!it || it->it_op == IT_GETXATTR)
326                 it = *itp = deft;
327
328 #ifdef LUSTRE_KERNEL_VERSION
329         it->it_op_release = ll_intent_release;
330 #endif
331 }
332
333 int ll_revalidate_it(struct dentry *de, int lookup_flags,
334                      struct lookup_intent *it)
335 {
336         int rc;
337         struct md_op_data *op_data;
338         struct ptlrpc_request *req = NULL;
339         struct lookup_intent lookup_it = { .it_op = IT_LOOKUP };
340         struct obd_export *exp;
341         struct inode *parent;
342
343         ENTRY;
344         CDEBUG(D_VFSTRACE, "VFS Op:name=%s,intent=%s\n", de->d_name.name,
345                LL_IT2STR(it));
346
347         if (de->d_inode == NULL) {
348                 /* We can only use negative dentries if this is stat or lookup,
349                    for opens and stuff we do need to query server. */
350                 /* If there is IT_CREAT in intent op set, then we must throw
351                    away this negative dentry and actually do the request to
352                    kernel to create whatever needs to be created (if possible)*/
353                 if (it && (it->it_op & IT_CREAT))
354                         RETURN(0);
355
356 #ifdef LUSTRE_KERNEL_VERSION
357                 if (de->d_flags & DCACHE_LUSTRE_INVALID)
358                         RETURN(0);
359 #endif
360
361                 rc = ll_have_md_lock(de->d_parent->d_inode, 
362                                      MDS_INODELOCK_UPDATE);
363         
364                 RETURN(rc);
365         }
366
367         exp = ll_i2mdexp(de->d_inode);
368
369         /* Never execute intents for mount points.
370          * Attributes will be fixed up in ll_inode_revalidate_it */
371         if (d_mountpoint(de))
372                 RETURN(1);
373
374         /* Root of the lustre tree. Always valid.
375          * Attributes will be fixed up in ll_inode_revalidate_it */
376         if (de == de->d_sb->s_root)
377                 RETURN(1);
378
379         OBD_FAIL_TIMEOUT(OBD_FAIL_MDC_REVALIDATE_PAUSE, 5);
380         ll_frob_intent(&it, &lookup_it);
381         LASSERT(it);
382
383         parent = de->d_parent->d_inode;
384
385         if (it->it_op & IT_CREAT) {
386                 op_data = ll_prep_md_op_data(NULL, parent, NULL,
387                                              de->d_name.name, de->d_name.len,
388                                              0, LUSTRE_OPC_CREATE, NULL);
389         } else {
390                 op_data = ll_prep_md_op_data(NULL, parent, de->d_inode,
391                                              de->d_name.name, de->d_name.len,
392                                              0, LUSTRE_OPC_ANY, NULL);
393         }
394         if (IS_ERR(op_data))
395                 RETURN(PTR_ERR(op_data));
396
397
398         if ((it->it_op == IT_OPEN) && de->d_inode) {
399                 struct inode *inode = de->d_inode;
400                 struct ll_inode_info *lli = ll_i2info(inode);
401                 struct obd_client_handle **och_p;
402                 __u64 *och_usecount;
403                 
404                 /*
405                  * We used to check for MDS_INODELOCK_OPEN here, but in fact
406                  * just having LOOKUP lock is enough to justify inode is the
407                  * same. And if inode is the same and we have suitable
408                  * openhandle, then there is no point in doing another OPEN RPC
409                  * just to throw away newly received openhandle.  There are no
410                  * security implications too, if file owner or access mode is
411                  * change, LOOKUP lock is revoked.
412                  */
413
414
415                 if (it->it_flags & FMODE_WRITE) {
416                         och_p = &lli->lli_mds_write_och;
417                         och_usecount = &lli->lli_open_fd_write_count;
418                 } else if (it->it_flags & FMODE_EXEC) {
419                         och_p = &lli->lli_mds_exec_och;
420                         och_usecount = &lli->lli_open_fd_exec_count;
421                 } else {
422                         och_p = &lli->lli_mds_read_och;
423                         och_usecount = &lli->lli_open_fd_read_count;
424                 }
425                 /* Check for the proper lock. */
426                 if (!ll_have_md_lock(inode, MDS_INODELOCK_LOOKUP))
427                         goto do_lock;
428                 down(&lli->lli_och_sem);
429                 if (*och_p) { /* Everything is open already, do nothing */
430                         /*(*och_usecount)++;  Do not let them steal our open
431                           handle from under us */
432                         /* XXX The code above was my original idea, but in case
433                            we have the handle, but we cannot use it due to later
434                            checks (e.g. O_CREAT|O_EXCL flags set), nobody
435                            would decrement counter increased here. So we just
436                            hope the lock won't be invalidated in between. But
437                            if it would be, we'll reopen the open request to
438                            MDS later during file open path */
439                         up(&lli->lli_och_sem);
440                         ll_finish_md_op_data(op_data);
441                         RETURN(1);
442                 } else {
443                         up(&lli->lli_och_sem);
444                 }
445         }
446
447 do_lock:
448         it->it_create_mode &= ~current->fs->umask;
449         it->it_flags |= O_CHECK_STALE;
450         rc = md_intent_lock(exp, op_data, NULL, 0, it,
451                             lookup_flags,
452                             &req, ll_md_blocking_ast, 0);
453         it->it_flags &= ~O_CHECK_STALE;
454         ll_finish_md_op_data(op_data);
455         /* If req is NULL, then md_intent_lock only tried to do a lock match;
456          * if all was well, it will return 1 if it found locks, 0 otherwise. */
457         if (req == NULL && rc >= 0) {
458                 if (!rc)
459                         goto do_lookup;
460                 GOTO(out, rc);
461         }
462
463         if (rc < 0) {
464                 if (rc != -ESTALE) {
465                         CDEBUG(D_INFO, "ll_intent_lock: rc %d : it->it_status "
466                                "%d\n", rc, it->d.lustre.it_status);
467                 }
468                 GOTO(out, rc = 0);
469         }
470
471 revalidate_finish:
472         rc = ll_revalidate_it_finish(req, DLM_REPLY_REC_OFF, it, de);
473         if (rc != 0) {
474                 if (rc != -ESTALE && rc != -ENOENT)
475                         ll_intent_release(it);
476                 GOTO(out, rc = 0);
477         }
478
479         if ((it->it_op & IT_OPEN) && de->d_inode && 
480             !S_ISREG(de->d_inode->i_mode) && 
481             !S_ISDIR(de->d_inode->i_mode)) {
482                 ll_release_openhandle(de, it);
483         }
484         rc = 1;
485
486         /* unfortunately ll_intent_lock may cause a callback and revoke our
487          * dentry */
488         spin_lock(&dcache_lock);
489         lock_dentry(de);
490         __d_drop(de);
491         unlock_dentry(de);
492         __d_rehash(de, 0);
493         spin_unlock(&dcache_lock);
494
495 out:
496         /* We do not free request as it may be reused during following lookup
497          * (see comment in mdc/mdc_locks.c::mdc_intent_lock()), request will
498          * be freed in ll_lookup_it or in ll_intent_release. But if
499          * request was not completed, we need to free it. (bug 5154, 9903) */
500         if (req != NULL && !it_disposition(it, DISP_ENQ_COMPLETE))
501                 ptlrpc_req_finished(req);
502         if (rc == 0) {
503 #ifdef LUSTRE_KERNEL_VERSION
504                 ll_unhash_aliases(de->d_inode);
505                 /* done in ll_unhash_aliases()
506                    dentry->d_flags |= DCACHE_LUSTRE_INVALID; */
507 #else
508                 /* We do not want d_invalidate to kill all child dentries too */
509                 d_drop(de);
510 #endif
511         } else {
512                 CDEBUG(D_DENTRY, "revalidated dentry %.*s (%p) parent %p "
513                        "inode %p refc %d\n", de->d_name.len,
514                        de->d_name.name, de, de->d_parent, de->d_inode,
515                        atomic_read(&de->d_count));
516                 ll_lookup_finish_locks(it, de);
517 #ifdef LUSTRE_KERNEL_VERSION
518                 lock_dentry(de);
519                 de->d_flags &= ~DCACHE_LUSTRE_INVALID;
520                 unlock_dentry(de);
521 #endif
522         }
523         RETURN(rc);
524         
525         /*
526          * This part is here to combat evil-evil race in real_lookup on 2.6
527          * kernels.  The race details are: We enter do_lookup() looking for some
528          * name, there is nothing in dcache for this name yet and d_lookup()
529          * returns NULL.  We proceed to real_lookup(), and while we do this,
530          * another process does open on the same file we looking up (most simple
531          * reproducer), open succeeds and the dentry is added. Now back to
532          * us. In real_lookup() we do d_lookup() again and suddenly find the
533          * dentry, so we call d_revalidate on it, but there is no lock, so
534          * without this code we would return 0, but unpatched real_lookup just
535          * returns -ENOENT in such a case instead of retrying the lookup. Once
536          * this is dealt with in real_lookup(), all of this ugly mess can go and
537          * we can just check locks in ->d_revalidate without doing any RPCs
538          * ever.
539          */
540 do_lookup:
541         if (it != &lookup_it) {
542                 /* MDS_INODELOCK_UPDATE needed for IT_GETATTR case. */
543                 if (it->it_op == IT_GETATTR)
544                         lookup_it.it_op = IT_GETATTR;
545                 ll_lookup_finish_locks(it, de);
546                 it = &lookup_it;
547         }
548         
549         /* Do real lookup here. */
550         op_data = ll_prep_md_op_data(NULL, parent, NULL, de->d_name.name,
551                                      de->d_name.len, 0, (it->it_op & IT_CREAT ?
552                                                          LUSTRE_OPC_CREATE :
553                                                          LUSTRE_OPC_ANY), NULL);
554         if (IS_ERR(op_data))
555                 RETURN(PTR_ERR(op_data));
556
557         rc = md_intent_lock(exp, op_data, NULL, 0,  it, 0, &req,
558                             ll_md_blocking_ast, 0);
559         if (rc >= 0) {
560                 struct mdt_body *mdt_body = lustre_msg_buf(req->rq_repmsg,
561                                                            DLM_REPLY_REC_OFF,
562                                                            sizeof(*mdt_body));
563                 struct lu_fid fid = {.f_seq = 0, .f_oid = 0, .f_ver = 0};
564                 
565                 if (de->d_inode)
566                         fid = *ll_inode2fid(de->d_inode);
567
568                 /* see if we got same inode, if not - return error */
569                 if (lu_fid_eq(&fid, &mdt_body->fid1)) {
570                         ll_finish_md_op_data(op_data);
571                         op_data = NULL;
572                         goto revalidate_finish;
573                 }
574                 ll_intent_release(it);
575         }
576         ll_finish_md_op_data(op_data);
577         GOTO(out, rc = 0);
578 }
579
580 /*static*/ void ll_pin(struct dentry *de, struct vfsmount *mnt, int flag)
581 {
582         struct inode *inode= de->d_inode;
583         struct ll_sb_info *sbi = ll_i2sbi(inode);
584         struct ll_dentry_data *ldd = ll_d2d(de);
585         struct obd_client_handle *handle;
586         struct obd_capa *oc;
587         int rc = 0;
588         ENTRY;
589         LASSERT(ldd);
590
591         lock_kernel();
592         /* Strictly speaking this introduces an additional race: the
593          * increments should wait until the rpc has returned.
594          * However, given that at present the function is void, this
595          * issue is moot. */
596         if (flag == 1 && (++ldd->lld_mnt_count) > 1) {
597                 unlock_kernel();
598                 EXIT;
599                 return;
600         }
601
602         if (flag == 0 && (++ldd->lld_cwd_count) > 1) {
603                 unlock_kernel();
604                 EXIT;
605                 return;
606         }
607         unlock_kernel();
608
609         handle = (flag) ? &ldd->lld_mnt_och : &ldd->lld_cwd_och;
610         oc = ll_mdscapa_get(inode);
611         rc = obd_pin(sbi->ll_md_exp, ll_inode2fid(inode), oc, handle, flag);
612         capa_put(oc);
613         if (rc) {
614                 lock_kernel();
615                 memset(handle, 0, sizeof(*handle));
616                 if (flag == 0)
617                         ldd->lld_cwd_count--;
618                 else
619                         ldd->lld_mnt_count--;
620                 unlock_kernel();
621         }
622
623         EXIT;
624         return;
625 }
626
627 /*static*/ void ll_unpin(struct dentry *de, struct vfsmount *mnt, int flag)
628 {
629         struct ll_sb_info *sbi = ll_i2sbi(de->d_inode);
630         struct ll_dentry_data *ldd = ll_d2d(de);
631         struct obd_client_handle handle;
632         int count, rc = 0;
633         ENTRY;
634         LASSERT(ldd);
635
636         lock_kernel();
637         /* Strictly speaking this introduces an additional race: the
638          * increments should wait until the rpc has returned.
639          * However, given that at present the function is void, this
640          * issue is moot. */
641         handle = (flag) ? ldd->lld_mnt_och : ldd->lld_cwd_och;
642         if (handle.och_magic != OBD_CLIENT_HANDLE_MAGIC) {
643                 /* the "pin" failed */
644                 unlock_kernel();
645                 EXIT;
646                 return;
647         }
648
649         if (flag)
650                 count = --ldd->lld_mnt_count;
651         else
652                 count = --ldd->lld_cwd_count;
653         unlock_kernel();
654
655         if (count != 0) {
656                 EXIT;
657                 return;
658         }
659
660         rc = obd_unpin(sbi->ll_md_exp, &handle, flag);
661         EXIT;
662         return;
663 }
664
665 #ifdef LUSTRE_KERNEL_VERSION
666 static int ll_revalidate_nd(struct dentry *dentry, struct nameidata *nd)
667 {
668         int rc;
669         ENTRY;
670
671         if (nd && nd->flags & LOOKUP_LAST && !(nd->flags & LOOKUP_LINK_NOTLAST))
672                 rc = ll_revalidate_it(dentry, nd->flags, &nd->intent);
673         else
674                 rc = ll_revalidate_it(dentry, 0, NULL);
675
676         RETURN(rc);
677 }
678 #else
679 int ll_revalidate_nd(struct dentry *dentry, struct nameidata *nd)
680 {
681         int rc;
682         ENTRY;
683
684         if (nd && !(nd->flags & (LOOKUP_CONTINUE|LOOKUP_PARENT))) {
685                 struct lookup_intent *it;
686                 it = ll_convert_intent(&nd->intent.open, nd->flags);
687                 if (IS_ERR(it))
688                         RETURN(0);
689                 if (it->it_op == (IT_OPEN|IT_CREAT))
690                         if (nd->intent.open.flags & O_EXCL) {
691                                 CDEBUG(D_VFSTRACE, "create O_EXCL, returning 0\n");
692                                 rc = 0;
693                                 goto out_it;
694                         }
695
696                 rc = ll_revalidate_it(dentry, nd->flags, it);
697
698                 if (rc && (nd->flags & LOOKUP_OPEN) &&
699                     it_disposition(it, DISP_OPEN_OPEN)) {/*Open*/
700 #ifdef HAVE_FILE_IN_STRUCT_INTENT
701 // XXX Code duplication with ll_lookup_nd
702                         if (S_ISFIFO(dentry->d_inode->i_mode)) {
703                                 // We cannot call open here as it would
704                                 // deadlock.
705                                 ptlrpc_req_finished(
706                                                (struct ptlrpc_request *)
707                                                   it->d.lustre.it_data);
708                         } else {
709                                 struct file *filp;
710
711                                 nd->intent.open.file->private_data = it;
712                                 filp = lookup_instantiate_filp(nd, dentry,NULL);
713 #if (LINUX_VERSION_CODE < KERNEL_VERSION(2,6,17))
714 /* 2.6.1[456] have a bug in open_namei() that forgets to check
715  * nd->intent.open.file for error, so we need to return it as lookup's result
716  * instead */
717                                 if (IS_ERR(filp))
718                                         rc = 0;
719 #endif
720                         }
721 #else
722                         ll_release_openhandle(dentry, it);
723 #endif /* HAVE_FILE_IN_STRUCT_INTENT */
724                 }
725                 if (!rc && (nd->flags & LOOKUP_CREATE) &&
726                     it_disposition(it, DISP_OPEN_CREATE)) {
727                         /* We created something but we may only return
728                          * negative dentry here, so save request in dentry,
729                          * if lookup will be called later on, it will
730                          * pick the request, otherwise it would be freed
731                          * with dentry */
732                         ll_d2d(dentry)->lld_it = it;
733                         it = NULL; /* avoid freeing */
734                 }
735                         
736 out_it:
737                 if (it) {
738                         ll_intent_release(it);
739                         OBD_FREE(it, sizeof(*it));
740                 }
741         } else {
742                 rc = ll_revalidate_it(dentry, 0, NULL);
743         }
744
745         RETURN(rc);
746 }
747 #endif
748
749 struct dentry_operations ll_d_ops = {
750         .d_revalidate = ll_revalidate_nd,
751         .d_release = ll_release,
752         .d_delete = ll_ddelete,
753 #ifdef LUSTRE_KERNEL_VERSION
754         .d_compare = ll_dcompare,
755 #endif
756 #if 0
757         .d_pin = ll_pin,
758         .d_unpin = ll_unpin,
759 #endif
760 };