Whamcloud - gitweb
b=18690 Enable rehashing and increase max hash table sizes.
[fs/lustre-release.git] / lustre / mgs / mgs_fs.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/mgs/mgs_fs.c
37  *
38  * Lustre Management Server (MGS) filesystem interface code
39  *
40  * Author: Nathan Rutman <nathan@clusterfs.com>
41  */
42
43 #ifndef EXPORT_SYMTAB
44 # define EXPORT_SYMTAB
45 #endif
46 #define DEBUG_SUBSYSTEM S_MGS
47
48 #include <linux/module.h>
49 #include <linux/kmod.h>
50 #include <linux/version.h>
51 #include <linux/sched.h>
52 #include <linux/mount.h>
53 #include <obd_class.h>
54 #include <obd_support.h>
55 #include <lustre_disk.h>
56 #include <lustre_lib.h>
57 #include <lustre_fsfilt.h>
58 #include <libcfs/list.h>
59 #include "mgs_internal.h"
60
61 static int mgs_export_stats_init(struct obd_device *obd, struct obd_export *exp,
62                                  void *localdata)
63 {
64         lnet_nid_t *client_nid = localdata;
65         int rc, newnid;
66
67         rc = lprocfs_exp_setup(exp, client_nid, &newnid);
68         if (rc) {
69                 /* Mask error for already created
70                  * /proc entries */
71                 if (rc == -EALREADY)
72                         rc = 0;
73                 return rc;
74         }
75
76         if (newnid) {
77                 /* Always add in ldlm_stats */
78                 exp->exp_nid_stats->nid_ldlm_stats =
79                         lprocfs_alloc_stats(LDLM_LAST_OPC - LDLM_FIRST_OPC,
80                                             LPROCFS_STATS_FLAG_NOPERCPU);
81                 if (exp->exp_nid_stats->nid_ldlm_stats == NULL)
82                         return -ENOMEM;
83                 lprocfs_init_ldlm_stats(exp->exp_nid_stats->nid_ldlm_stats);
84                 rc = lprocfs_register_stats(exp->exp_nid_stats->nid_proc,
85                                             "ldlm_stats",
86                                             exp->exp_nid_stats->nid_ldlm_stats);
87         }
88         return rc;
89 }
90
91 /**
92  * Add client export data to the MGS.  This data is currently NOT stored on
93  * disk in the last_rcvd file or anywhere else.  In the event of a MGS
94  * crash all connections are treated as new connections.
95  */
96 int mgs_client_add(struct obd_device *obd, struct obd_export *exp,
97                    void *localdata)
98 {
99         return mgs_export_stats_init(obd, exp, localdata);
100 }
101
102 /* Remove client export data from the MGS */
103 int mgs_client_free(struct obd_export *exp)
104 {
105         return 0;
106 }
107
108 /* Same as mds_fid2dentry */
109 /* Look up an entry by inode number. */
110 /* this function ONLY returns valid dget'd dentries with an initialized inode
111    or errors */
112 static struct dentry *mgs_fid2dentry(struct mgs_obd *mgs,
113                                      __u64 ino, __u32 gen)
114 {
115         char fid_name[32];
116         struct inode *inode;
117         struct dentry *result;
118         ENTRY;
119
120         CDEBUG(D_DENTRY, "--> mgs_fid2dentry: ino/gen %lu/%u, sb %p\n",
121                (unsigned long)ino, gen, mgs->mgs_sb);
122
123         if (ino == 0)
124                 RETURN(ERR_PTR(-ESTALE));
125
126         snprintf(fid_name, sizeof(fid_name), "0x%lx", (unsigned long)ino);
127
128         /* under ext3 this is neither supposed to return bad inodes nor NULL
129            inodes. */
130         result = ll_lookup_one_len(fid_name, mgs->mgs_fid_de, strlen(fid_name));
131         if (IS_ERR(result))
132                 RETURN(result);
133
134         inode = result->d_inode;
135         if (!inode)
136                 RETURN(ERR_PTR(-ENOENT));
137
138         if (inode->i_generation == 0 || inode->i_nlink == 0) {
139                 LCONSOLE_WARN("Found inode with zero generation or link -- this"
140                               " may indicate disk corruption (inode: %lu, link:"
141                               " %lu, count: %d)\n", inode->i_ino,
142                               (unsigned long)inode->i_nlink,
143                               atomic_read(&inode->i_count));
144                 l_dput(result);
145                 RETURN(ERR_PTR(-ENOENT));
146         }
147
148         if (gen && inode->i_generation != gen) {
149                 /* we didn't find the right inode.. */
150                 CDEBUG(D_INODE, "found wrong generation: inode %lu, link: %lu, "
151                        "count: %d, generation %u/%u\n", inode->i_ino,
152                        (unsigned long)inode->i_nlink,
153                        atomic_read(&inode->i_count),
154                        inode->i_generation, gen);
155                 l_dput(result);
156                 RETURN(ERR_PTR(-ENOENT));
157         }
158
159         RETURN(result);
160 }
161
162 static struct dentry *mgs_lvfs_fid2dentry(__u64 id, __u32 gen,
163                                           __u64 gr, void *data)
164 {
165         struct obd_device *obd = data;
166         return mgs_fid2dentry(&obd->u.mgs, id, gen);
167 }
168
169 struct lvfs_callback_ops mgs_lvfs_ops = {
170         l_fid2dentry:     mgs_lvfs_fid2dentry,
171 };
172
173 int mgs_fs_setup(struct obd_device *obd, struct vfsmount *mnt)
174 {
175         struct mgs_obd *mgs = &obd->u.mgs;
176         struct lvfs_run_ctxt saved;
177         struct dentry *dentry;
178         int rc;
179         ENTRY;
180
181         /* FIXME what's this?  Do I need it? */
182         rc = cfs_cleanup_group_info();
183         if (rc)
184                 RETURN(rc);
185
186         mgs->mgs_vfsmnt = mnt;
187         mgs->mgs_sb = mnt->mnt_root->d_inode->i_sb;
188
189         fsfilt_setup(obd, mgs->mgs_sb);
190
191         OBD_SET_CTXT_MAGIC(&obd->obd_lvfs_ctxt);
192         obd->obd_lvfs_ctxt.pwdmnt = mnt;
193         obd->obd_lvfs_ctxt.pwd = mnt->mnt_root;
194         obd->obd_lvfs_ctxt.fs = get_ds();
195         obd->obd_lvfs_ctxt.cb_ops = mgs_lvfs_ops;
196
197         push_ctxt(&saved, &obd->obd_lvfs_ctxt, NULL);
198
199         /* Setup the configs dir */
200         dentry = simple_mkdir(current->fs->pwd, mnt, MOUNT_CONFIGS_DIR, 0777, 1);
201         if (IS_ERR(dentry)) {
202                 rc = PTR_ERR(dentry);
203                 CERROR("cannot create %s directory: rc = %d\n",
204                        MOUNT_CONFIGS_DIR, rc);
205                 GOTO(err_pop, rc);
206         }
207         mgs->mgs_configs_dir = dentry;
208
209         /* Need the iopen dir for fid2dentry, required by
210            LLOG_ORIGIN_HANDLE_READ_HEADER */
211         dentry = lookup_one_len("__iopen__", current->fs->pwd,
212                                 strlen("__iopen__"));
213         if (IS_ERR(dentry)) {
214                 rc = PTR_ERR(dentry);
215                 CERROR("cannot lookup __iopen__ directory: rc = %d\n", rc);
216                 GOTO(err_configs, rc);
217         }
218         mgs->mgs_fid_de = dentry;
219         if (!dentry->d_inode || is_bad_inode(dentry->d_inode)) {
220                 rc = -ENOENT;
221                 CERROR("__iopen__ directory has no inode? rc = %d\n", rc);
222                 GOTO(err_fid, rc);
223         }
224
225 err_pop:
226         pop_ctxt(&saved, &obd->obd_lvfs_ctxt, NULL);
227         return rc;
228 err_fid:
229         dput(mgs->mgs_fid_de);
230 err_configs:
231         dput(mgs->mgs_configs_dir);
232         goto err_pop;
233 }
234
235 int mgs_fs_cleanup(struct obd_device *obd)
236 {
237         struct mgs_obd *mgs = &obd->u.mgs;
238         struct lvfs_run_ctxt saved;
239         int rc = 0;
240
241         class_disconnect_exports(obd); /* cleans up client info too */
242
243         push_ctxt(&saved, &obd->obd_lvfs_ctxt, NULL);
244
245         if (mgs->mgs_configs_dir) {
246                 l_dput(mgs->mgs_configs_dir);
247                 mgs->mgs_configs_dir = NULL;
248         }
249
250         dput(mgs->mgs_fid_de);
251         shrink_dcache_sb(mgs->mgs_sb);
252
253         pop_ctxt(&saved, &obd->obd_lvfs_ctxt, NULL);
254
255         return rc;
256 }