Whamcloud - gitweb
LU-12616 obclass: fix MDS start/stop race
[fs/lustre-release.git] / lustre / llite / llite_nfs.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2003, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2011, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/lustre/llite/llite_nfs.c
33  *
34  * NFS export of Lustre Light File System
35  *
36  * Author: Yury Umanets <umka@clusterfs.com>
37  * Author: Huang Hua <huanghua@clusterfs.com>
38  */
39
40 #define DEBUG_SUBSYSTEM S_LLITE
41 #include "llite_internal.h"
42 #include <linux/exportfs.h>
43
44 u32 get_uuid2int(const char *name, int len)
45 {
46         u32 key0 = 0x12a3fe2d, key1 = 0x37abe8f9;
47
48         while (len--) {
49                 u32 key = key1 + (key0 ^ (*name++ * 7152373));
50
51                 if (key & 0x80000000)
52                         key -= 0x7fffffff;
53
54                 key1 = key0;
55                 key0 = key;
56         }
57         return (key0 << 1);
58 }
59
60 struct inode *search_inode_for_lustre(struct super_block *sb,
61                                       const struct lu_fid *fid)
62 {
63         struct ll_sb_info *sbi = ll_s2sbi(sb);
64         struct ptlrpc_request *req = NULL;
65         struct inode *inode = NULL;
66         int eadatalen = 0;
67         unsigned long hash = cl_fid_build_ino(fid, ll_need_32bit_api(sbi));
68         struct md_op_data *op_data;
69         int rc;
70
71         ENTRY;
72
73         CDEBUG(D_INFO, "searching inode for:(%lu,"DFID")\n", hash, PFID(fid));
74
75         inode = ilookup5(sb, hash, ll_test_inode_by_fid, (void *)fid);
76         if (inode)
77                 RETURN(inode);
78
79         rc = ll_get_default_mdsize(sbi, &eadatalen);
80         if (rc)
81                 RETURN(ERR_PTR(rc));
82
83         /*
84          * Because inode is NULL, ll_prep_md_op_data can not
85          * be used here. So we allocate op_data ourselves
86          */
87         OBD_ALLOC_PTR(op_data);
88         if (!op_data)
89                 return ERR_PTR(-ENOMEM);
90
91         op_data->op_fid1 = *fid;
92         op_data->op_mode = eadatalen;
93         op_data->op_valid = OBD_MD_FLEASIZE;
94
95         /* mds_fid2dentry ignores f_type */
96         rc = md_getattr(sbi->ll_md_exp, op_data, &req);
97         OBD_FREE_PTR(op_data);
98         if (rc) {
99                 /*
100                  * Suppress erroneous/confusing messages when NFS
101                  * is out of sync and requests old data.
102                  */
103                 CDEBUG(D_INFO, "can't get object attrs, fid "DFID", rc %d\n",
104                                 PFID(fid), rc);
105                 RETURN(ERR_PTR(rc));
106         }
107         rc = ll_prep_inode(&inode, req, sb, NULL);
108         ptlrpc_req_finished(req);
109         if (rc)
110                 RETURN(ERR_PTR(rc));
111
112         RETURN(inode);
113 }
114
115 struct lustre_nfs_fid {
116         struct lu_fid lnf_child;
117         struct lu_fid lnf_parent;
118 };
119
120 static struct dentry *
121 ll_iget_for_nfs(struct super_block *sb, struct lu_fid *fid, struct lu_fid *parent)
122 {
123         struct inode  *inode;
124         struct dentry *result;
125
126         ENTRY;
127
128         if (!fid_is_sane(fid))
129                 RETURN(ERR_PTR(-ESTALE));
130
131         CDEBUG(D_INFO, "Get dentry for fid: "DFID"\n", PFID(fid));
132
133         inode = search_inode_for_lustre(sb, fid);
134         if (IS_ERR(inode))
135                 RETURN(ERR_PTR(PTR_ERR(inode)));
136
137         if (is_bad_inode(inode)) {
138                 /* we didn't find the right inode.. */
139                 iput(inode);
140                 RETURN(ERR_PTR(-ESTALE));
141         }
142
143         /* N.B. d_obtain_alias() drops inode ref on error */
144         result = d_obtain_alias(inode);
145         if (!IS_ERR(result)) {
146                 int rc;
147
148                 rc = ll_d_init(result);
149                 if (rc < 0) {
150                         dput(result);
151                         result = ERR_PTR(rc);
152                 } else {
153                         struct ll_dentry_data *ldd = ll_d2d(result);
154
155                         /*
156                          * Need to signal to the ll_file_open that
157                          * we came from NFS and so opencache needs to be
158                          * enabled for this one
159                          */
160                         spin_lock(&result->d_lock);
161                         ldd->lld_nfs_dentry = 1;
162                         spin_unlock(&result->d_lock);
163                 }
164         }
165
166         RETURN(result);
167 }
168
169 #ifndef FILEID_INVALID
170 #define FILEID_INVALID 0xff
171 #endif
172 #ifndef FILEID_LUSTRE
173 #define FILEID_LUSTRE  0x97
174 #endif
175
176 /**
177  * \a connectable - is nfsd will connect himself or this should be done
178  *                  at lustre
179  *
180  * The return value is file handle type:
181  * 1 -- contains child file handle;
182  * 2 -- contains child file handle and parent file handle;
183  * 255 -- error.
184  */
185 #ifndef HAVE_ENCODE_FH_PARENT
186 static int ll_encode_fh(struct dentry *de, u32 *fh, int *plen,
187                         int connectable)
188 {
189         struct inode *inode = de->d_inode;
190         struct inode *parent = de->d_parent->d_inode;
191 #else
192 static int ll_encode_fh(struct inode *inode, u32 *fh, int *plen,
193                         struct inode *parent)
194 {
195 #endif
196         int fileid_len = sizeof(struct lustre_nfs_fid) / 4;
197         struct lustre_nfs_fid *nfs_fid = (void *)fh;
198
199         ENTRY;
200
201         CDEBUG(D_INFO, "%s: encoding for ("DFID") maxlen=%d minlen=%d\n",
202                ll_i2sbi(inode)->ll_fsname,
203                PFID(ll_inode2fid(inode)), *plen, fileid_len);
204
205         if (*plen < fileid_len) {
206                 *plen = fileid_len;
207                 RETURN(FILEID_INVALID);
208         }
209
210         nfs_fid->lnf_child = *ll_inode2fid(inode);
211         if (parent)
212                 nfs_fid->lnf_parent = *ll_inode2fid(parent);
213         else
214                 fid_zero(&nfs_fid->lnf_parent);
215         *plen = fileid_len;
216
217         RETURN(FILEID_LUSTRE);
218 }
219
220 static int
221 #ifndef HAVE_FILLDIR_USE_CTX
222 ll_nfs_get_name_filldir(void *cookie, const char *name, int namelen,
223                         loff_t hash, u64 ino, unsigned type)
224 {
225         struct ll_getname_data *lgd = cookie;
226 #else
227 ll_nfs_get_name_filldir(struct dir_context *ctx, const char *name, int namelen,
228                         loff_t hash, u64 ino, unsigned type)
229 {
230         struct ll_getname_data *lgd =
231                 container_of(ctx, struct ll_getname_data, ctx);
232 #endif /* HAVE_FILLDIR_USE_CTX */
233         /*
234          * It is hack to access lde_fid for comparison with lgd_fid.
235          * So the input 'name' must be part of the 'lu_dirent'.
236          */
237         struct lu_dirent *lde = container_of0(name, struct lu_dirent, lde_name);
238         struct lu_fid fid;
239
240         fid_le_to_cpu(&fid, &lde->lde_fid);
241         if (lu_fid_eq(&fid, &lgd->lgd_fid)) {
242                 memcpy(lgd->lgd_name, name, namelen);
243                 lgd->lgd_name[namelen] = 0;
244                 lgd->lgd_found = 1;
245         }
246         return lgd->lgd_found;
247 }
248
249 static int ll_get_name(struct dentry *dentry, char *name,
250                        struct dentry *child)
251 {
252         struct inode *dir = dentry->d_inode;
253         struct ll_getname_data lgd = {
254                 .lgd_name = name,
255                 .lgd_fid = ll_i2info(child->d_inode)->lli_fid,
256 #ifdef HAVE_DIR_CONTEXT
257                 .ctx.actor = ll_nfs_get_name_filldir,
258 #endif
259                 .lgd_found = 0,
260         };
261         struct md_op_data *op_data;
262         u64 pos = 0;
263         int rc;
264
265         ENTRY;
266
267         if (!dir || !S_ISDIR(dir->i_mode))
268                 GOTO(out, rc = -ENOTDIR);
269
270         if (!dir->i_fop)
271                 GOTO(out, rc = -EINVAL);
272
273         op_data = ll_prep_md_op_data(NULL, dir, dir, NULL, 0, 0,
274                                      LUSTRE_OPC_ANY, dir);
275         if (IS_ERR(op_data))
276                 GOTO(out, rc = PTR_ERR(op_data));
277
278         inode_lock(dir);
279 #ifdef HAVE_DIR_CONTEXT
280         rc = ll_dir_read(dir, &pos, op_data, &lgd.ctx);
281 #else
282         rc = ll_dir_read(dir, &pos, op_data, &lgd, ll_nfs_get_name_filldir);
283 #endif
284         inode_unlock(dir);
285         ll_finish_md_op_data(op_data);
286         if (!rc && !lgd.lgd_found)
287                 rc = -ENOENT;
288         EXIT;
289 out:
290         return rc;
291 }
292
293 static struct dentry *ll_fh_to_dentry(struct super_block *sb, struct fid *fid,
294                                       int fh_len, int fh_type)
295 {
296         struct lustre_nfs_fid *nfs_fid = (struct lustre_nfs_fid *)fid;
297
298         if (fh_type != FILEID_LUSTRE)
299                 RETURN(ERR_PTR(-EPROTO));
300
301         RETURN(ll_iget_for_nfs(sb, &nfs_fid->lnf_child, &nfs_fid->lnf_parent));
302 }
303
304 static struct dentry *ll_fh_to_parent(struct super_block *sb, struct fid *fid,
305                                       int fh_len, int fh_type)
306 {
307         struct lustre_nfs_fid *nfs_fid = (struct lustre_nfs_fid *)fid;
308
309         if (fh_type != FILEID_LUSTRE)
310                 RETURN(ERR_PTR(-EPROTO));
311
312         RETURN(ll_iget_for_nfs(sb, &nfs_fid->lnf_parent, NULL));
313 }
314
315 int ll_dir_get_parent_fid(struct inode *dir, struct lu_fid *parent_fid)
316 {
317         struct ptlrpc_request   *req = NULL;
318         struct ll_sb_info       *sbi;
319         struct mdt_body         *body;
320         static const char       dotdot[] = "..";
321         struct md_op_data       *op_data;
322         int                     rc;
323         int                     lmmsize;
324
325         ENTRY;
326
327         LASSERT(dir && S_ISDIR(dir->i_mode));
328
329         sbi = ll_s2sbi(dir->i_sb);
330
331         CDEBUG(D_INFO, "%s: getting parent for ("DFID")\n",
332                sbi->ll_fsname, PFID(ll_inode2fid(dir)));
333
334         rc = ll_get_default_mdsize(sbi, &lmmsize);
335         if (rc != 0)
336                 RETURN(rc);
337
338         op_data = ll_prep_md_op_data(NULL, dir, NULL, dotdot,
339                                      strlen(dotdot), lmmsize,
340                                      LUSTRE_OPC_ANY, NULL);
341         if (IS_ERR(op_data))
342                 RETURN(PTR_ERR(op_data));
343
344         rc = md_getattr_name(sbi->ll_md_exp, op_data, &req);
345         ll_finish_md_op_data(op_data);
346         if (rc != 0) {
347                 CERROR("%s: failure inode "DFID" get parent: rc = %d\n",
348                        sbi->ll_fsname, PFID(ll_inode2fid(dir)), rc);
349                 RETURN(rc);
350         }
351         body = req_capsule_server_get(&req->rq_pill, &RMF_MDT_BODY);
352
353         /*
354          * LU-3952: MDT may lost the FID of its parent, we should not crash
355          * the NFS server, ll_iget_for_nfs() will handle the error.
356          */
357         if (body->mbo_valid & OBD_MD_FLID) {
358                 CDEBUG(D_INFO, "parent for "DFID" is "DFID"\n",
359                        PFID(ll_inode2fid(dir)), PFID(&body->mbo_fid1));
360                 *parent_fid = body->mbo_fid1;
361         }
362
363         ptlrpc_req_finished(req);
364         RETURN(0);
365 }
366
367 static struct dentry *ll_get_parent(struct dentry *dchild)
368 {
369         struct lu_fid parent_fid = { 0 };
370         int rc;
371         struct dentry *dentry;
372
373         ENTRY;
374
375         rc = ll_dir_get_parent_fid(dchild->d_inode, &parent_fid);
376         if (rc != 0)
377                 RETURN(ERR_PTR(rc));
378
379         dentry = ll_iget_for_nfs(dchild->d_inode->i_sb, &parent_fid, NULL);
380
381         RETURN(dentry);
382 }
383
384 struct export_operations lustre_export_operations = {
385         .get_parent = ll_get_parent,
386         .encode_fh  = ll_encode_fh,
387         .get_name   = ll_get_name,
388         .fh_to_dentry = ll_fh_to_dentry,
389         .fh_to_parent = ll_fh_to_parent,
390 };