Whamcloud - gitweb
LU-3952 nfs: don't panic NFS server if MDS fails to find FID
[fs/lustre-release.git] / lustre / llite / llite_nfs.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2003, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2013, Intel Corporation.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/lustre/llite/llite_nfs.c
37  *
38  * NFS export of Lustre Light File System
39  *
40  * Author: Yury Umanets <umka@clusterfs.com>
41  * Author: Huang Hua <huanghua@clusterfs.com>
42  */
43
44 #define DEBUG_SUBSYSTEM S_LLITE
45 #include <lustre_lite.h>
46 #include "llite_internal.h"
47 #include <linux/exportfs.h>
48
49 __u32 get_uuid2int(const char *name, int len)
50 {
51         __u32 key0 = 0x12a3fe2d, key1 = 0x37abe8f9;
52         while (len--) {
53                 __u32 key = key1 + (key0 ^ (*name++ * 7152373));
54                 if (key & 0x80000000) key -= 0x7fffffff;
55                 key1 = key0;
56                 key0 = key;
57         }
58         return (key0 << 1);
59 }
60
61 static int ll_nfs_test_inode(struct inode *inode, void *opaque)
62 {
63         return lu_fid_eq(&ll_i2info(inode)->lli_fid,
64                          (struct lu_fid *)opaque);
65 }
66
67 struct inode *search_inode_for_lustre(struct super_block *sb,
68                                       const struct lu_fid *fid)
69 {
70         struct ll_sb_info     *sbi = ll_s2sbi(sb);
71         struct ptlrpc_request *req = NULL;
72         struct inode          *inode = NULL;
73         int                   eadatalen = 0;
74         unsigned long         hash = cl_fid_build_ino(fid,
75                                                       ll_need_32bit_api(sbi));
76         struct  md_op_data    *op_data;
77         int                   rc;
78         ENTRY;
79
80         CDEBUG(D_INFO, "searching inode for:(%lu,"DFID")\n", hash, PFID(fid));
81
82         inode = ilookup5(sb, hash, ll_nfs_test_inode, (void *)fid);
83         if (inode)
84                 RETURN(inode);
85
86         rc = ll_get_max_mdsize(sbi, &eadatalen);
87         if (rc)
88                 RETURN(ERR_PTR(rc));
89
90         /* Because inode is NULL, ll_prep_md_op_data can not
91          * be used here. So we allocate op_data ourselves */
92         OBD_ALLOC_PTR(op_data);
93         if (op_data == NULL)
94                 return ERR_PTR(-ENOMEM);
95
96         op_data->op_fid1 = *fid;
97         op_data->op_mode = eadatalen;
98         op_data->op_valid = OBD_MD_FLEASIZE;
99
100         /* mds_fid2dentry ignores f_type */
101         rc = md_getattr(sbi->ll_md_exp, op_data, &req);
102         OBD_FREE_PTR(op_data);
103         if (rc) {
104                 /* Suppress erroneous/confusing messages when NFS
105                  * is out of sync and requests old data. */
106                 CDEBUG(D_INFO, "can't get object attrs, fid "DFID", rc %d\n",
107                                 PFID(fid), rc);
108                 RETURN(ERR_PTR(rc));
109         }
110         rc = ll_prep_inode(&inode, req, sb, NULL);
111         ptlrpc_req_finished(req);
112         if (rc)
113                 RETURN(ERR_PTR(rc));
114
115         RETURN(inode);
116 }
117
118 struct lustre_nfs_fid {
119         struct lu_fid   lnf_child;
120         struct lu_fid   lnf_parent;
121 };
122
123 static struct dentry *
124 ll_iget_for_nfs(struct super_block *sb, struct lu_fid *fid, struct lu_fid *parent)
125 {
126         struct inode  *inode;
127         struct dentry *result;
128         ENTRY;
129
130         if (!fid_is_sane(fid))
131                 RETURN(ERR_PTR(-ESTALE));
132
133         CDEBUG(D_INFO, "Get dentry for fid: "DFID"\n", PFID(fid));
134
135         inode = search_inode_for_lustre(sb, fid);
136         if (IS_ERR(inode))
137                 RETURN(ERR_PTR(PTR_ERR(inode)));
138
139         if (is_bad_inode(inode)) {
140                 /* we didn't find the right inode.. */
141                 iput(inode);
142                 RETURN(ERR_PTR(-ESTALE));
143         }
144
145         /**
146          * It is an anonymous dentry without OST objects created yet.
147          * We have to find the parent to tell MDS how to init lov objects.
148          */
149         if (S_ISREG(inode->i_mode) && !ll_i2info(inode)->lli_has_smd &&
150             parent != NULL && !fid_is_zero(parent)) {
151                 struct ll_inode_info *lli = ll_i2info(inode);
152
153                 spin_lock(&lli->lli_lock);
154                 lli->lli_pfid = *parent;
155                 spin_unlock(&lli->lli_lock);
156         }
157
158         result = d_obtain_alias(inode);
159         if (IS_ERR(result)) {
160                 iput(inode);
161                 RETURN(result);
162         }
163
164         RETURN(result);
165 }
166
167 #ifndef FILEID_INVALID
168 #define FILEID_INVALID 0xff
169 #endif
170 #ifndef FILEID_LUSTRE
171 #define FILEID_LUSTRE  0x97
172 #endif
173
174 /**
175  * \a connectable - is nfsd will connect himself or this should be done
176  *                  at lustre
177  *
178  * The return value is file handle type:
179  * 1 -- contains child file handle;
180  * 2 -- contains child file handle and parent file handle;
181  * 255 -- error.
182  */
183 #ifndef HAVE_ENCODE_FH_PARENT
184 static int ll_encode_fh(struct dentry *de, __u32 *fh, int *plen,
185                         int connectable)
186 {
187         struct inode *inode = de->d_inode;
188         struct inode *parent = de->d_parent->d_inode;
189 #else
190 static int ll_encode_fh(struct inode *inode, __u32 *fh, int *plen,
191                         struct inode *parent)
192 {
193 #endif
194         int fileid_len = sizeof(struct lustre_nfs_fid) / 4;
195         struct lustre_nfs_fid *nfs_fid = (void *)fh;
196         ENTRY;
197
198         CDEBUG(D_INFO, "%s: encoding for ("DFID") maxlen=%d minlen=%d\n",
199                ll_get_fsname(inode->i_sb, NULL, 0),
200                PFID(ll_inode2fid(inode)), *plen, fileid_len);
201
202         if (*plen < fileid_len) {
203                 *plen = fileid_len;
204                 RETURN(FILEID_INVALID);
205         }
206
207         nfs_fid->lnf_child = *ll_inode2fid(inode);
208         if (parent != NULL)
209                 nfs_fid->lnf_parent = *ll_inode2fid(parent);
210         else
211                 fid_zero(&nfs_fid->lnf_parent);
212         *plen = fileid_len;
213
214         RETURN(FILEID_LUSTRE);
215 }
216
217 static int ll_nfs_get_name_filldir(void *cookie, const char *name, int namelen,
218                                    loff_t hash, u64 ino, unsigned type)
219 {
220         /* It is hack to access lde_fid for comparison with lgd_fid.
221          * So the input 'name' must be part of the 'lu_dirent'. */
222         struct lu_dirent *lde = container_of0(name, struct lu_dirent, lde_name);
223         struct ll_getname_data *lgd = cookie;
224         struct lu_fid fid;
225
226         fid_le_to_cpu(&fid, &lde->lde_fid);
227         if (lu_fid_eq(&fid, &lgd->lgd_fid)) {
228                 memcpy(lgd->lgd_name, name, namelen);
229                 lgd->lgd_name[namelen] = 0;
230                 lgd->lgd_found = 1;
231         }
232         return lgd->lgd_found;
233 }
234
235 static int ll_get_name(struct dentry *dentry, char *name,
236                        struct dentry *child)
237 {
238         struct inode *dir = dentry->d_inode;
239         struct ll_getname_data lgd;
240         __u64 offset = 0;
241         int rc;
242         ENTRY;
243
244         if (!dir || !S_ISDIR(dir->i_mode))
245                 GOTO(out, rc = -ENOTDIR);
246
247         if (!dir->i_fop)
248                 GOTO(out, rc = -EINVAL);
249
250         lgd.lgd_name = name;
251         lgd.lgd_fid = ll_i2info(child->d_inode)->lli_fid;
252         lgd.lgd_found = 0;
253
254         mutex_lock(&dir->i_mutex);
255         rc = ll_dir_read(dir, &offset, &lgd, ll_nfs_get_name_filldir);
256         mutex_unlock(&dir->i_mutex);
257         if (!rc && !lgd.lgd_found)
258                 rc = -ENOENT;
259         EXIT;
260
261 out:
262         return rc;
263 }
264
265 static struct dentry *ll_fh_to_dentry(struct super_block *sb, struct fid *fid,
266                                       int fh_len, int fh_type)
267 {
268         struct lustre_nfs_fid *nfs_fid = (struct lustre_nfs_fid *)fid;
269
270         if (fh_type != FILEID_LUSTRE)
271                 RETURN(ERR_PTR(-EPROTO));
272
273         RETURN(ll_iget_for_nfs(sb, &nfs_fid->lnf_child, &nfs_fid->lnf_parent));
274 }
275
276 static struct dentry *ll_fh_to_parent(struct super_block *sb, struct fid *fid,
277                                       int fh_len, int fh_type)
278 {
279         struct lustre_nfs_fid *nfs_fid = (struct lustre_nfs_fid *)fid;
280
281         if (fh_type != FILEID_LUSTRE)
282                 RETURN(ERR_PTR(-EPROTO));
283
284         RETURN(ll_iget_for_nfs(sb, &nfs_fid->lnf_parent, NULL));
285 }
286
287 static struct dentry *ll_get_parent(struct dentry *dchild)
288 {
289         struct ptlrpc_request *req = NULL;
290         struct inode          *dir = dchild->d_inode;
291         struct ll_sb_info     *sbi;
292         struct dentry         *result = NULL;
293         struct mdt_body       *body;
294         static char           dotdot[] = "..";
295         struct md_op_data     *op_data;
296         int                   rc;
297         int                   lmmsize;
298         ENTRY;
299
300         LASSERT(dir && S_ISDIR(dir->i_mode));
301
302         sbi = ll_s2sbi(dir->i_sb);
303
304         CDEBUG(D_INFO, "%s: getting parent for ("DFID")\n",
305                ll_get_fsname(dir->i_sb, NULL, 0),
306                PFID(ll_inode2fid(dir)));
307
308         rc = ll_get_max_mdsize(sbi, &lmmsize);
309         if (rc != 0)
310                 RETURN(ERR_PTR(rc));
311
312         op_data = ll_prep_md_op_data(NULL, dir, NULL, dotdot,
313                                      strlen(dotdot), lmmsize,
314                                      LUSTRE_OPC_ANY, NULL);
315         if (IS_ERR(op_data))
316                 RETURN((void *)op_data);
317
318         rc = md_getattr_name(sbi->ll_md_exp, op_data, &req);
319         ll_finish_md_op_data(op_data);
320         if (rc) {
321                 CERROR("%s: failure inode "DFID" get parent: rc = %d\n",
322                        ll_get_fsname(dir->i_sb, NULL, 0),
323                        PFID(ll_inode2fid(dir)), rc);
324                 RETURN(ERR_PTR(rc));
325         }
326         body = req_capsule_server_get(&req->rq_pill, &RMF_MDT_BODY);
327         /*
328          * LU-3952: MDT may lost the FID of its parent, we should not crash
329          * the NFS server, ll_iget_for_nfs() will handle the error.
330          */
331         if (body->valid & OBD_MD_FLID) {
332                 CDEBUG(D_INFO, "parent for "DFID" is "DFID"\n",
333                        PFID(ll_inode2fid(dir)), PFID(&body->fid1));
334         }
335         result = ll_iget_for_nfs(dir->i_sb, &body->fid1, NULL);
336
337         ptlrpc_req_finished(req);
338         RETURN(result);
339 }
340
341 struct export_operations lustre_export_operations = {
342        .get_parent = ll_get_parent,
343        .encode_fh  = ll_encode_fh,
344        .get_name   = ll_get_name,
345         .fh_to_dentry = ll_fh_to_dentry,
346         .fh_to_parent = ll_fh_to_parent,
347 };