Whamcloud - gitweb
b=20595
[fs/lustre-release.git] / lustre / mgs / mgs_fs.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/mgs/mgs_fs.c
37  *
38  * Lustre Management Server (MGS) filesystem interface code
39  *
40  * Author: Nathan Rutman <nathan@clusterfs.com>
41  */
42
43 #ifndef EXPORT_SYMTAB
44 # define EXPORT_SYMTAB
45 #endif
46 #define DEBUG_SUBSYSTEM S_MGS
47
48 #include <linux/module.h>
49 #include <linux/kmod.h>
50 #include <linux/version.h>
51 #include <linux/sched.h>
52 #include <linux/mount.h>
53 #include <obd_class.h>
54 #include <obd_support.h>
55 #include <lustre_disk.h>
56 #include <lustre_lib.h>
57 #include <lustre_fsfilt.h>
58 #include <libcfs/list.h>
59 #include "mgs_internal.h"
60
61 static int mgs_export_stats_init(struct obd_device *obd, struct obd_export *exp,
62                                  void *localdata)
63 {
64         lnet_nid_t *client_nid = localdata;
65         int rc, newnid;
66
67         rc = lprocfs_exp_setup(exp, client_nid, &newnid);
68         if (rc) {
69                 /* Mask error for already created
70                  * /proc entries */
71                 if (rc == -EALREADY)
72                         rc = 0;
73                 return rc;
74         }
75
76         if ((obd->md_stats == NULL) &&
77             (rc = lprocfs_alloc_md_stats(obd, LPROC_MGS_LAST)))
78                 return rc;
79         if (newnid) {
80                 /* Always add in ldlm_stats */
81                 exp->exp_nid_stats->nid_ldlm_stats =
82                         lprocfs_alloc_stats(LDLM_LAST_OPC - LDLM_FIRST_OPC, 
83                                             LPROCFS_STATS_FLAG_NOPERCPU);
84                 if (exp->exp_nid_stats->nid_ldlm_stats == NULL)
85                         return -ENOMEM;
86                 lprocfs_init_ldlm_stats(exp->exp_nid_stats->nid_ldlm_stats);
87                 rc = lprocfs_register_stats(exp->exp_nid_stats->nid_proc,
88                                             "ldlm_stats",
89                                             exp->exp_nid_stats->nid_ldlm_stats);
90         }
91         return rc;
92 }
93
94 /**
95  * Add client export data to the MGS.  This data is currently NOT stored on
96  * disk in the last_rcvd file or anywhere else.  In the event of a MGS
97  * crash all connections are treated as new connections.
98  */
99 int mgs_client_add(struct obd_device *obd, struct obd_export *exp,
100                    void *localdata)
101 {
102         return mgs_export_stats_init(obd, exp, localdata);
103 }
104
105 /* Remove client export data from the MGS */
106 int mgs_client_free(struct obd_export *exp)
107 {
108         return 0;
109 }
110
111 /* Same as mds_fid2dentry */
112 /* Look up an entry by inode number. */
113 /* this function ONLY returns valid dget'd dentries with an initialized inode
114    or errors */
115 static struct dentry *mgs_fid2dentry(struct mgs_obd *mgs,
116                                      __u64 ino, __u32 gen)
117 {
118         char fid_name[32];
119         struct inode *inode;
120         struct dentry *result;
121         ENTRY;
122
123         CDEBUG(D_DENTRY, "--> mgs_fid2dentry: ino/gen %lu/%u, sb %p\n",
124                (unsigned long)ino, gen, mgs->mgs_sb);
125
126         if (ino == 0)
127                 RETURN(ERR_PTR(-ESTALE));
128
129         snprintf(fid_name, sizeof(fid_name), "0x%lx", (unsigned long)ino);
130
131         /* under ext3 this is neither supposed to return bad inodes nor NULL
132            inodes. */
133         result = ll_lookup_one_len(fid_name, mgs->mgs_fid_de, strlen(fid_name));
134         if (IS_ERR(result))
135                 RETURN(result);
136
137         inode = result->d_inode;
138         if (!inode)
139                 RETURN(ERR_PTR(-ENOENT));
140
141         if (inode->i_generation == 0 || inode->i_nlink == 0) {
142                 LCONSOLE_WARN("Found inode with zero generation or link -- this"
143                               " may indicate disk corruption (inode: %lu, link:"
144                               " %lu, count: %d)\n", inode->i_ino,
145                               (unsigned long)inode->i_nlink,
146                               atomic_read(&inode->i_count));
147                 l_dput(result);
148                 RETURN(ERR_PTR(-ENOENT));
149         }
150
151         if (gen && inode->i_generation != gen) {
152                 /* we didn't find the right inode.. */
153                 CDEBUG(D_INODE, "found wrong generation: inode %lu, link: %lu, "
154                        "count: %d, generation %u/%u\n", inode->i_ino,
155                        (unsigned long)inode->i_nlink, atomic_read(&inode->i_count),
156                        inode->i_generation, gen);
157                 l_dput(result);
158                 RETURN(ERR_PTR(-ENOENT));
159         }
160
161         RETURN(result);
162 }
163
164 static struct dentry *mgs_lvfs_fid2dentry(__u64 id, __u32 gen,
165                                           __u64 gr, void *data)
166 {
167         struct obd_device *obd = data;
168         return mgs_fid2dentry(&obd->u.mgs, id, gen);
169 }
170
171 struct lvfs_callback_ops mgs_lvfs_ops = {
172         l_fid2dentry:     mgs_lvfs_fid2dentry,
173 };
174
175 int mgs_fs_setup(struct obd_device *obd, struct vfsmount *mnt)
176 {
177         struct mgs_obd *mgs = &obd->u.mgs;
178         struct lvfs_run_ctxt saved;
179         struct dentry *dentry;
180         int rc;
181         ENTRY;
182
183         /* FIXME what's this?  Do I need it? */
184         rc = cleanup_group_info();
185         if (rc)
186                 RETURN(rc);
187
188         mgs->mgs_vfsmnt = mnt;
189         mgs->mgs_sb = mnt->mnt_root->d_inode->i_sb;
190
191         fsfilt_setup(obd, mgs->mgs_sb);
192
193         OBD_SET_CTXT_MAGIC(&obd->obd_lvfs_ctxt);
194         obd->obd_lvfs_ctxt.pwdmnt = mnt;
195         obd->obd_lvfs_ctxt.pwd = mnt->mnt_root;
196         obd->obd_lvfs_ctxt.fs = get_ds();
197         obd->obd_lvfs_ctxt.cb_ops = mgs_lvfs_ops;
198
199         push_ctxt(&saved, &obd->obd_lvfs_ctxt, NULL);
200
201         /* Setup the configs dir */
202         dentry = simple_mkdir(current->fs->pwd, mnt, MOUNT_CONFIGS_DIR, 0777, 1);
203         if (IS_ERR(dentry)) {
204                 rc = PTR_ERR(dentry);
205                 CERROR("cannot create %s directory: rc = %d\n",
206                        MOUNT_CONFIGS_DIR, rc);
207                 GOTO(err_pop, rc);
208         }
209         mgs->mgs_configs_dir = dentry;
210
211         /* Need the iopen dir for fid2dentry, required by
212            LLOG_ORIGIN_HANDLE_READ_HEADER */
213         dentry = lookup_one_len("__iopen__", current->fs->pwd,
214                                 strlen("__iopen__"));
215         if (IS_ERR(dentry)) {
216                 rc = PTR_ERR(dentry);
217                 CERROR("cannot lookup __iopen__ directory: rc = %d\n", rc);
218                 GOTO(err_configs, rc);
219         }
220         mgs->mgs_fid_de = dentry;
221         if (!dentry->d_inode || is_bad_inode(dentry->d_inode)) {
222                 rc = -ENOENT;
223                 CERROR("__iopen__ directory has no inode? rc = %d\n", rc);
224                 GOTO(err_fid, rc);
225         }
226
227 err_pop:
228         pop_ctxt(&saved, &obd->obd_lvfs_ctxt, NULL);
229         return rc;
230 err_fid:
231         dput(mgs->mgs_fid_de);
232 err_configs:
233         dput(mgs->mgs_configs_dir);
234         goto err_pop;
235 }
236
237 int mgs_fs_cleanup(struct obd_device *obd)
238 {
239         struct mgs_obd *mgs = &obd->u.mgs;
240         struct lvfs_run_ctxt saved;
241         int rc = 0;
242
243         class_disconnect_exports(obd); /* cleans up client info too */
244
245         push_ctxt(&saved, &obd->obd_lvfs_ctxt, NULL);
246
247         if (mgs->mgs_configs_dir) {
248                 /*CERROR("configs dir dcount=%d\n",
249                        atomic_read(&mgs->mgs_configs_dir->d_count));*/
250                 l_dput(mgs->mgs_configs_dir);
251                 mgs->mgs_configs_dir = NULL;
252         }
253
254         shrink_dcache_parent(mgs->mgs_fid_de);
255         /*CERROR("fid dir dcount=%d\n",
256                atomic_read(&mgs->mgs_fid_de->d_count));*/
257         dput(mgs->mgs_fid_de);
258
259         pop_ctxt(&saved, &obd->obd_lvfs_ctxt, NULL);
260
261         return rc;
262 }