Whamcloud - gitweb
LU-3126 osd: remove fld lookup during configuration
[fs/lustre-release.git] / lustre / obdclass / obd_mount.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2013, Intel Corporation.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/obdclass/obd_mount.c
37  *
38  * Client mount routines
39  *
40  * Author: Nathan Rutman <nathan@clusterfs.com>
41  */
42
43
44 #define DEBUG_SUBSYSTEM S_CLASS
45 #define D_MOUNT (D_SUPER|D_CONFIG/*|D_WARNING */)
46 #define PRINT_CMD CDEBUG
47
48 #include <obd.h>
49 #include <lvfs.h>
50 #include <obd_class.h>
51 #include <lustre/lustre_user.h>
52 #include <linux/version.h>
53 #include <lustre_log.h>
54 #include <lustre_disk.h>
55 #include <lustre_param.h>
56
57 static int (*client_fill_super)(struct super_block *sb,
58                                 struct vfsmount *mnt);
59
60 static void (*kill_super_cb)(struct super_block *sb);
61
62 /**************** config llog ********************/
63
64 /** Get a config log from the MGS and process it.
65  * This func is called for both clients and servers.
66  * Continue to process new statements appended to the logs
67  * (whenever the config lock is revoked) until lustre_end_log
68  * is called.
69  * @param sb The superblock is used by the MGC to write to the local copy of
70  *   the config log
71  * @param logname The name of the llog to replicate from the MGS
72  * @param cfg Since the same mgc may be used to follow multiple config logs
73  *   (e.g. ost1, ost2, client), the config_llog_instance keeps the state for
74  *   this log, and is added to the mgc's list of logs to follow.
75  */
76 int lustre_process_log(struct super_block *sb, char *logname,
77                      struct config_llog_instance *cfg)
78 {
79         struct lustre_cfg *lcfg;
80         struct lustre_cfg_bufs *bufs;
81         struct lustre_sb_info *lsi = s2lsi(sb);
82         struct obd_device *mgc = lsi->lsi_mgc;
83         int rc;
84         ENTRY;
85
86         LASSERT(mgc);
87         LASSERT(cfg);
88
89         OBD_ALLOC_PTR(bufs);
90         if (bufs == NULL)
91                 RETURN(-ENOMEM);
92
93         /* mgc_process_config */
94         lustre_cfg_bufs_reset(bufs, mgc->obd_name);
95         lustre_cfg_bufs_set_string(bufs, 1, logname);
96         lustre_cfg_bufs_set(bufs, 2, cfg, sizeof(*cfg));
97         lustre_cfg_bufs_set(bufs, 3, &sb, sizeof(sb));
98         lcfg = lustre_cfg_new(LCFG_LOG_START, bufs);
99         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
100         lustre_cfg_free(lcfg);
101
102         OBD_FREE_PTR(bufs);
103
104         if (rc == -EINVAL)
105                 LCONSOLE_ERROR_MSG(0x15b, "%s: The configuration from log '%s'"
106                                    "failed from the MGS (%d).  Make sure this "
107                                    "client and the MGS are running compatible "
108                                    "versions of Lustre.\n",
109                                    mgc->obd_name, logname, rc);
110
111         if (rc)
112                 LCONSOLE_ERROR_MSG(0x15c, "%s: The configuration from log '%s' "
113                                    "failed (%d). This may be the result of "
114                                    "communication errors between this node and "
115                                    "the MGS, a bad configuration, or other "
116                                    "errors. See the syslog for more "
117                                    "information.\n", mgc->obd_name, logname,
118                                    rc);
119
120         /* class_obd_list(); */
121         RETURN(rc);
122 }
123 EXPORT_SYMBOL(lustre_process_log);
124
125 /* Stop watching this config log for updates */
126 int lustre_end_log(struct super_block *sb, char *logname,
127                        struct config_llog_instance *cfg)
128 {
129         struct lustre_cfg *lcfg;
130         struct lustre_cfg_bufs bufs;
131         struct lustre_sb_info *lsi = s2lsi(sb);
132         struct obd_device *mgc = lsi->lsi_mgc;
133         int rc;
134         ENTRY;
135
136         if (!mgc)
137                 RETURN(-ENOENT);
138
139         /* mgc_process_config */
140         lustre_cfg_bufs_reset(&bufs, mgc->obd_name);
141         lustre_cfg_bufs_set_string(&bufs, 1, logname);
142         if (cfg)
143                 lustre_cfg_bufs_set(&bufs, 2, cfg, sizeof(*cfg));
144         lcfg = lustre_cfg_new(LCFG_LOG_END, &bufs);
145         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
146         lustre_cfg_free(lcfg);
147         RETURN(rc);
148 }
149 EXPORT_SYMBOL(lustre_end_log);
150
151 /**************** obd start *******************/
152
153 /** lustre_cfg_bufs are a holdover from 1.4; we can still set these up from
154  * lctl (and do for echo cli/srv.
155  */
156 int do_lcfg(char *cfgname, lnet_nid_t nid, int cmd,
157             char *s1, char *s2, char *s3, char *s4)
158 {
159         struct lustre_cfg_bufs bufs;
160         struct lustre_cfg    * lcfg = NULL;
161         int rc;
162
163         CDEBUG(D_TRACE, "lcfg %s %#x %s %s %s %s\n", cfgname,
164                cmd, s1, s2, s3, s4);
165
166         lustre_cfg_bufs_reset(&bufs, cfgname);
167         if (s1)
168                 lustre_cfg_bufs_set_string(&bufs, 1, s1);
169         if (s2)
170                 lustre_cfg_bufs_set_string(&bufs, 2, s2);
171         if (s3)
172                 lustre_cfg_bufs_set_string(&bufs, 3, s3);
173         if (s4)
174                 lustre_cfg_bufs_set_string(&bufs, 4, s4);
175
176         lcfg = lustre_cfg_new(cmd, &bufs);
177         lcfg->lcfg_nid = nid;
178         rc = class_process_config(lcfg);
179         lustre_cfg_free(lcfg);
180         return(rc);
181 }
182 EXPORT_SYMBOL(do_lcfg);
183
184 /** Call class_attach and class_setup.  These methods in turn call
185  * obd type-specific methods.
186  */
187 int lustre_start_simple(char *obdname, char *type, char *uuid,
188                         char *s1, char *s2, char *s3, char *s4)
189 {
190         int rc;
191         CDEBUG(D_MOUNT, "Starting obd %s (typ=%s)\n", obdname, type);
192
193         rc = do_lcfg(obdname, 0, LCFG_ATTACH, type, uuid, 0, 0);
194         if (rc) {
195                 CERROR("%s attach error %d\n", obdname, rc);
196                 return rc;
197         }
198         rc = do_lcfg(obdname, 0, LCFG_SETUP, s1, s2, s3, s4);
199         if (rc) {
200                 CERROR("%s setup error %d\n", obdname, rc);
201                 do_lcfg(obdname, 0, LCFG_DETACH, 0, 0, 0, 0);
202         }
203         return rc;
204 }
205
206 DEFINE_MUTEX(mgc_start_lock);
207
208 /** Set up a mgc obd to process startup logs
209  *
210  * \param sb [in] super block of the mgc obd
211  *
212  * \retval 0 success, otherwise error code
213  */
214 int lustre_start_mgc(struct super_block *sb)
215 {
216         struct obd_connect_data *data = NULL;
217         struct lustre_sb_info *lsi = s2lsi(sb);
218         struct obd_device *obd;
219         struct obd_export *exp;
220         struct obd_uuid *uuid;
221         class_uuid_t uuidc;
222         lnet_nid_t nid;
223         char *mgcname = NULL, *niduuid = NULL, *mgssec = NULL;
224         char *ptr;
225         int recov_bk;
226         int rc = 0, i = 0, j, len;
227         ENTRY;
228
229         LASSERT(lsi->lsi_lmd);
230
231         /* Find the first non-lo MGS nid for our MGC name */
232         if (IS_SERVER(lsi)) {
233                 /* mount -o mgsnode=nid */
234                 ptr = lsi->lsi_lmd->lmd_mgs;
235                 if (lsi->lsi_lmd->lmd_mgs &&
236                     (class_parse_nid(lsi->lsi_lmd->lmd_mgs, &nid, &ptr) == 0)) {
237                         i++;
238                 } else if (IS_MGS(lsi)) {
239                         lnet_process_id_t id;
240                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
241                                 if (LNET_NETTYP(LNET_NIDNET(id.nid)) == LOLND)
242                                         continue;
243                                 nid = id.nid;
244                                 i++;
245                                 break;
246                         }
247                 }
248         } else { /* client */
249                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
250                 ptr = lsi->lsi_lmd->lmd_dev;
251                 if (class_parse_nid(ptr, &nid, &ptr) == 0)
252                         i++;
253         }
254         if (i == 0) {
255                 CERROR("No valid MGS nids found.\n");
256                 RETURN(-EINVAL);
257         }
258
259         mutex_lock(&mgc_start_lock);
260
261         len = strlen(LUSTRE_MGC_OBDNAME) + strlen(libcfs_nid2str(nid)) + 1;
262         OBD_ALLOC(mgcname, len);
263         OBD_ALLOC(niduuid, len + 2);
264         if (!mgcname || !niduuid)
265                 GOTO(out_free, rc = -ENOMEM);
266         sprintf(mgcname, "%s%s", LUSTRE_MGC_OBDNAME, libcfs_nid2str(nid));
267
268         mgssec = lsi->lsi_lmd->lmd_mgssec ? lsi->lsi_lmd->lmd_mgssec : "";
269
270         OBD_ALLOC_PTR(data);
271         if (data == NULL)
272                 GOTO(out_free, rc = -ENOMEM);
273
274         obd = class_name2obd(mgcname);
275         if (obd && !obd->obd_stopping) {
276                 rc = obd_set_info_async(NULL, obd->obd_self_export,
277                                         strlen(KEY_MGSSEC), KEY_MGSSEC,
278                                         strlen(mgssec), mgssec, NULL);
279                 if (rc)
280                         GOTO(out_free, rc);
281
282                 /* Re-using an existing MGC */
283                 cfs_atomic_inc(&obd->u.cli.cl_mgc_refcount);
284
285                 /* IR compatibility check, only for clients */
286                 if (lmd_is_client(lsi->lsi_lmd)) {
287                         int has_ir;
288                         int vallen = sizeof(*data);
289                         __u32 *flags = &lsi->lsi_lmd->lmd_flags;
290
291                         rc = obd_get_info(NULL, obd->obd_self_export,
292                                           strlen(KEY_CONN_DATA), KEY_CONN_DATA,
293                                           &vallen, data, NULL);
294                         LASSERT(rc == 0);
295                         has_ir = OCD_HAS_FLAG(data, IMP_RECOV);
296                         if (has_ir ^ !(*flags & LMD_FLG_NOIR)) {
297                                 /* LMD_FLG_NOIR is for test purpose only */
298                                 LCONSOLE_WARN(
299                                     "Trying to mount a client with IR setting "
300                                     "not compatible with current mgc. "
301                                     "Force to use current mgc setting that is "
302                                     "IR %s.\n",
303                                     has_ir ? "enabled" : "disabled");
304                                 if (has_ir)
305                                         *flags &= ~LMD_FLG_NOIR;
306                                 else
307                                         *flags |= LMD_FLG_NOIR;
308                         }
309                 }
310
311                 recov_bk = 0;
312                 /* If we are restarting the MGS, don't try to keep the MGC's
313                    old connection, or registration will fail. */
314                 if (IS_MGS(lsi)) {
315                         CDEBUG(D_MOUNT, "New MGS with live MGC\n");
316                         recov_bk = 1;
317                 }
318
319                 /* Try all connections, but only once (again).
320                    We don't want to block another target from starting
321                    (using its local copy of the log), but we do want to connect
322                    if at all possible. */
323                 recov_bk++;
324                 CDEBUG(D_MOUNT, "%s: Set MGC reconnect %d\n", mgcname,recov_bk);
325                 rc = obd_set_info_async(NULL, obd->obd_self_export,
326                                         sizeof(KEY_INIT_RECOV_BACKUP),
327                                         KEY_INIT_RECOV_BACKUP,
328                                         sizeof(recov_bk), &recov_bk, NULL);
329                 GOTO(out, rc = 0);
330         }
331
332         CDEBUG(D_MOUNT, "Start MGC '%s'\n", mgcname);
333
334         /* Add the primary nids for the MGS */
335         i = 0;
336         sprintf(niduuid, "%s_%x", mgcname, i);
337         if (IS_SERVER(lsi)) {
338                 ptr = lsi->lsi_lmd->lmd_mgs;
339                 if (IS_MGS(lsi)) {
340                         /* Use local nids (including LO) */
341                         lnet_process_id_t id;
342                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
343                                 rc = do_lcfg(mgcname, id.nid,
344                                              LCFG_ADD_UUID, niduuid, 0,0,0);
345                         }
346                 } else {
347                         /* Use mgsnode= nids */
348                         /* mount -o mgsnode=nid */
349                         if (lsi->lsi_lmd->lmd_mgs) {
350                                 ptr = lsi->lsi_lmd->lmd_mgs;
351                         } else if (class_find_param(ptr, PARAM_MGSNODE,
352                                                     &ptr) != 0) {
353                                 CERROR("No MGS nids given.\n");
354                                 GOTO(out_free, rc = -EINVAL);
355                         }
356                         while (class_parse_nid(ptr, &nid, &ptr) == 0) {
357                                 rc = do_lcfg(mgcname, nid,
358                                              LCFG_ADD_UUID, niduuid, 0,0,0);
359                                 i++;
360                         }
361                 }
362         } else { /* client */
363                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
364                 ptr = lsi->lsi_lmd->lmd_dev;
365                 while (class_parse_nid(ptr, &nid, &ptr) == 0) {
366                         rc = do_lcfg(mgcname, nid,
367                                      LCFG_ADD_UUID, niduuid, 0,0,0);
368                         i++;
369                         /* Stop at the first failover nid */
370                         if (*ptr == ':')
371                                 break;
372                 }
373         }
374         if (i == 0) {
375                 CERROR("No valid MGS nids found.\n");
376                 GOTO(out_free, rc = -EINVAL);
377         }
378         lsi->lsi_lmd->lmd_mgs_failnodes = 1;
379
380         /* Random uuid for MGC allows easier reconnects */
381         OBD_ALLOC_PTR(uuid);
382         ll_generate_random_uuid(uuidc);
383         class_uuid_unparse(uuidc, uuid);
384
385         /* Start the MGC */
386         rc = lustre_start_simple(mgcname, LUSTRE_MGC_NAME,
387                                  (char *)uuid->uuid, LUSTRE_MGS_OBDNAME,
388                                  niduuid, 0, 0);
389         OBD_FREE_PTR(uuid);
390         if (rc)
391                 GOTO(out_free, rc);
392
393         /* Add any failover MGS nids */
394         i = 1;
395         while (ptr && ((*ptr == ':' ||
396                class_find_param(ptr, PARAM_MGSNODE, &ptr) == 0))) {
397                 /* New failover node */
398                 sprintf(niduuid, "%s_%x", mgcname, i);
399                 j = 0;
400                 while (class_parse_nid_quiet(ptr, &nid, &ptr) == 0) {
401                         j++;
402                         rc = do_lcfg(mgcname, nid,
403                                      LCFG_ADD_UUID, niduuid, 0,0,0);
404                         if (*ptr == ':')
405                                 break;
406                 }
407                 if (j > 0) {
408                         rc = do_lcfg(mgcname, 0, LCFG_ADD_CONN,
409                                      niduuid, 0, 0, 0);
410                         i++;
411                 } else {
412                         /* at ":/fsname" */
413                         break;
414                 }
415         }
416         lsi->lsi_lmd->lmd_mgs_failnodes = i;
417
418         obd = class_name2obd(mgcname);
419         if (!obd) {
420                 CERROR("Can't find mgcobd %s\n", mgcname);
421                 GOTO(out_free, rc = -ENOTCONN);
422         }
423
424         rc = obd_set_info_async(NULL, obd->obd_self_export,
425                                 strlen(KEY_MGSSEC), KEY_MGSSEC,
426                                 strlen(mgssec), mgssec, NULL);
427         if (rc)
428                 GOTO(out_free, rc);
429
430         /* Keep a refcount of servers/clients who started with "mount",
431            so we know when we can get rid of the mgc. */
432         cfs_atomic_set(&obd->u.cli.cl_mgc_refcount, 1);
433
434         /* Try all connections, but only once. */
435         recov_bk = 1;
436         rc = obd_set_info_async(NULL, obd->obd_self_export,
437                                 sizeof(KEY_INIT_RECOV_BACKUP),
438                                 KEY_INIT_RECOV_BACKUP,
439                                 sizeof(recov_bk), &recov_bk, NULL);
440         if (rc)
441                 /* nonfatal */
442                 CWARN("can't set %s %d\n", KEY_INIT_RECOV_BACKUP, rc);
443
444         /* We connect to the MGS at setup, and don't disconnect until cleanup */
445         data->ocd_connect_flags = OBD_CONNECT_VERSION | OBD_CONNECT_AT |
446                                   OBD_CONNECT_FULL20 | OBD_CONNECT_IMP_RECOV |
447                                   OBD_CONNECT_LVB_TYPE;
448
449 #if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(3, 2, 50, 0)
450         data->ocd_connect_flags |= OBD_CONNECT_MNE_SWAB;
451 #else
452 #warning "LU-1644: Remove old OBD_CONNECT_MNE_SWAB fixup and imp_need_mne_swab"
453 #endif
454
455         if (lmd_is_client(lsi->lsi_lmd) &&
456             lsi->lsi_lmd->lmd_flags & LMD_FLG_NOIR)
457                 data->ocd_connect_flags &= ~OBD_CONNECT_IMP_RECOV;
458         data->ocd_version = LUSTRE_VERSION_CODE;
459         rc = obd_connect(NULL, &exp, obd, &(obd->obd_uuid), data, NULL);
460         if (rc) {
461                 CERROR("connect failed %d\n", rc);
462                 GOTO(out, rc);
463         }
464
465         obd->u.cli.cl_mgc_mgsexp = exp;
466
467 out:
468         /* Keep the mgc info in the sb. Note that many lsi's can point
469            to the same mgc.*/
470         lsi->lsi_mgc = obd;
471 out_free:
472         mutex_unlock(&mgc_start_lock);
473
474         if (data)
475                 OBD_FREE_PTR(data);
476         if (mgcname)
477                 OBD_FREE(mgcname, len);
478         if (niduuid)
479                 OBD_FREE(niduuid, len + 2);
480         RETURN(rc);
481 }
482
483 static int lustre_stop_mgc(struct super_block *sb)
484 {
485         struct lustre_sb_info *lsi = s2lsi(sb);
486         struct obd_device *obd;
487         char *niduuid = 0, *ptr = 0;
488         int i, rc = 0, len = 0;
489         ENTRY;
490
491         if (!lsi)
492                 RETURN(-ENOENT);
493         obd = lsi->lsi_mgc;
494         if (!obd)
495                 RETURN(-ENOENT);
496         lsi->lsi_mgc = NULL;
497
498         mutex_lock(&mgc_start_lock);
499         LASSERT(cfs_atomic_read(&obd->u.cli.cl_mgc_refcount) > 0);
500         if (!cfs_atomic_dec_and_test(&obd->u.cli.cl_mgc_refcount)) {
501                 /* This is not fatal, every client that stops
502                    will call in here. */
503                 CDEBUG(D_MOUNT, "mgc still has %d references.\n",
504                        cfs_atomic_read(&obd->u.cli.cl_mgc_refcount));
505                 GOTO(out, rc = -EBUSY);
506         }
507
508         /* The MGC has no recoverable data in any case.
509          * force shotdown set in umount_begin */
510         obd->obd_no_recov = 1;
511
512         if (obd->u.cli.cl_mgc_mgsexp) {
513                 /* An error is not fatal, if we are unable to send the
514                    disconnect mgs ping evictor cleans up the export */
515                 rc = obd_disconnect(obd->u.cli.cl_mgc_mgsexp);
516                 if (rc)
517                         CDEBUG(D_MOUNT, "disconnect failed %d\n", rc);
518         }
519
520         /* Save the obdname for cleaning the nid uuids, which are
521            obdname_XX */
522         len = strlen(obd->obd_name) + 6;
523         OBD_ALLOC(niduuid, len);
524         if (niduuid) {
525                 strcpy(niduuid, obd->obd_name);
526                 ptr = niduuid + strlen(niduuid);
527         }
528
529         rc = class_manual_cleanup(obd);
530         if (rc)
531                 GOTO(out, rc);
532
533         /* Clean the nid uuids */
534         if (!niduuid)
535                 GOTO(out, rc = -ENOMEM);
536
537         for (i = 0; i < lsi->lsi_lmd->lmd_mgs_failnodes; i++) {
538                 sprintf(ptr, "_%x", i);
539                 rc = do_lcfg(LUSTRE_MGC_OBDNAME, 0, LCFG_DEL_UUID,
540                              niduuid, 0, 0, 0);
541                 if (rc)
542                         CERROR("del MDC UUID %s failed: rc = %d\n",
543                                niduuid, rc);
544         }
545 out:
546         if (niduuid)
547                 OBD_FREE(niduuid, len);
548
549         /* class_import_put will get rid of the additional connections */
550         mutex_unlock(&mgc_start_lock);
551         RETURN(rc);
552 }
553
554 /***************** lustre superblock **************/
555
556 struct lustre_sb_info *lustre_init_lsi(struct super_block *sb)
557 {
558         struct lustre_sb_info *lsi;
559         ENTRY;
560
561         OBD_ALLOC_PTR(lsi);
562         if (!lsi)
563                 RETURN(NULL);
564         OBD_ALLOC_PTR(lsi->lsi_lmd);
565         if (!lsi->lsi_lmd) {
566                 OBD_FREE_PTR(lsi);
567                 RETURN(NULL);
568         }
569
570         lsi->lsi_lmd->lmd_exclude_count = 0;
571         lsi->lsi_lmd->lmd_recovery_time_soft = 0;
572         lsi->lsi_lmd->lmd_recovery_time_hard = 0;
573         s2lsi_nocast(sb) = lsi;
574         /* we take 1 extra ref for our setup */
575         cfs_atomic_set(&lsi->lsi_mounts, 1);
576
577         /* Default umount style */
578         lsi->lsi_flags = LSI_UMOUNT_FAILOVER;
579
580         RETURN(lsi);
581 }
582
583 static int lustre_free_lsi(struct super_block *sb)
584 {
585         struct lustre_sb_info *lsi = s2lsi(sb);
586         ENTRY;
587
588         LASSERT(lsi != NULL);
589         CDEBUG(D_MOUNT, "Freeing lsi %p\n", lsi);
590
591         /* someone didn't call server_put_mount. */
592         LASSERT(cfs_atomic_read(&lsi->lsi_mounts) == 0);
593
594         if (lsi->lsi_lmd != NULL) {
595                 if (lsi->lsi_lmd->lmd_dev != NULL)
596                         OBD_FREE(lsi->lsi_lmd->lmd_dev,
597                                  strlen(lsi->lsi_lmd->lmd_dev) + 1);
598                 if (lsi->lsi_lmd->lmd_profile != NULL)
599                         OBD_FREE(lsi->lsi_lmd->lmd_profile,
600                                  strlen(lsi->lsi_lmd->lmd_profile) + 1);
601                 if (lsi->lsi_lmd->lmd_mgssec != NULL)
602                         OBD_FREE(lsi->lsi_lmd->lmd_mgssec,
603                                  strlen(lsi->lsi_lmd->lmd_mgssec) + 1);
604                 if (lsi->lsi_lmd->lmd_opts != NULL)
605                         OBD_FREE(lsi->lsi_lmd->lmd_opts,
606                                  strlen(lsi->lsi_lmd->lmd_opts) + 1);
607                 if (lsi->lsi_lmd->lmd_exclude_count)
608                         OBD_FREE(lsi->lsi_lmd->lmd_exclude,
609                                  sizeof(lsi->lsi_lmd->lmd_exclude[0]) *
610                                  lsi->lsi_lmd->lmd_exclude_count);
611                 if (lsi->lsi_lmd->lmd_mgs != NULL)
612                         OBD_FREE(lsi->lsi_lmd->lmd_mgs,
613                                  strlen(lsi->lsi_lmd->lmd_mgs) + 1);
614                 if (lsi->lsi_lmd->lmd_osd_type != NULL)
615                         OBD_FREE(lsi->lsi_lmd->lmd_osd_type,
616                                  strlen(lsi->lsi_lmd->lmd_osd_type) + 1);
617                 if (lsi->lsi_lmd->lmd_params != NULL)
618                         OBD_FREE(lsi->lsi_lmd->lmd_params, 4096);
619
620                 OBD_FREE(lsi->lsi_lmd, sizeof(*lsi->lsi_lmd));
621         }
622
623         LASSERT(lsi->lsi_llsbi == NULL);
624         OBD_FREE(lsi, sizeof(*lsi));
625         s2lsi_nocast(sb) = NULL;
626
627         RETURN(0);
628 }
629
630 /* The lsi has one reference for every server that is using the disk -
631    e.g. MDT, MGS, and potentially MGC */
632 int lustre_put_lsi(struct super_block *sb)
633 {
634         struct lustre_sb_info *lsi = s2lsi(sb);
635         ENTRY;
636
637         LASSERT(lsi != NULL);
638
639         CDEBUG(D_MOUNT, "put %p %d\n", sb, cfs_atomic_read(&lsi->lsi_mounts));
640         if (cfs_atomic_dec_and_test(&lsi->lsi_mounts)) {
641                 if (IS_SERVER(lsi) && lsi->lsi_osd_exp) {
642                         lu_device_put(&lsi->lsi_dt_dev->dd_lu_dev);
643                         lsi->lsi_osd_exp->exp_obd->obd_lvfs_ctxt.dt = NULL;
644                         lsi->lsi_dt_dev = NULL;
645                         obd_disconnect(lsi->lsi_osd_exp);
646                         /* wait till OSD is gone */
647                         obd_zombie_barrier();
648                 }
649                 lustre_free_lsi(sb);
650                 RETURN(1);
651         }
652         RETURN(0);
653 }
654
655 /*** SERVER NAME ***
656  * <FSNAME><SEPERATOR><TYPE><INDEX>
657  * FSNAME is between 1 and 8 characters (inclusive).
658  *      Excluded characters are '/' and ':'
659  * SEPERATOR is either ':' or '-'
660  * TYPE: "OST", "MDT", etc.
661  * INDEX: Hex representation of the index
662  */
663
664 /** Get the fsname ("lustre") from the server name ("lustre-OST003F").
665  * @param [in] svname server name including type and index
666  * @param [out] fsname Buffer to copy filesystem name prefix into.
667  *  Must have at least 'strlen(fsname) + 1' chars.
668  * @param [out] endptr if endptr isn't NULL it is set to end of fsname
669  * rc < 0  on error
670  */
671 int server_name2fsname(const char *svname, char *fsname, const char **endptr)
672 {
673         const char *dash;
674
675         dash = svname + strnlen(svname, 8); /* max fsname length is 8 */
676         for (; dash > svname && *dash != '-' && *dash != ':'; dash--)
677                 ;
678         if (dash == svname)
679                 return -EINVAL;
680
681         if (fsname != NULL) {
682                 strncpy(fsname, svname, dash - svname);
683                 fsname[dash - svname] = '\0';
684         }
685
686         if (endptr != NULL)
687                 *endptr = dash;
688
689         return 0;
690 }
691 EXPORT_SYMBOL(server_name2fsname);
692
693 /**
694  * Get service name (svname) from string
695  * rc < 0 on error
696  * if endptr isn't NULL it is set to end of fsname *
697  */
698 int server_name2svname(const char *label, char *svname, const char **endptr,
699                        size_t svsize)
700 {
701         int rc;
702         const char *dash;
703
704         /* We use server_name2fsname() just for parsing */
705         rc = server_name2fsname(label, NULL, &dash);
706         if (rc != 0)
707                 return rc;
708
709         if (endptr != NULL)
710                 *endptr = dash;
711
712         if (strlcpy(svname, dash + 1, svsize) >= svsize)
713                 return -E2BIG;
714
715         return 0;
716 }
717 EXPORT_SYMBOL(server_name2svname);
718
719 /**
720  * check server name is OST.
721  **/
722 int server_name_is_ost(const char *svname)
723 {
724         const char *dash;
725         int rc;
726
727         /* We use server_name2fsname() just for parsing */
728         rc = server_name2fsname(svname, NULL, &dash);
729         if (rc != 0)
730                 return rc;
731
732         dash++;
733
734         if (strncmp(dash, "OST", 3) == 0)
735                 return 1;
736         return 0;
737 }
738 EXPORT_SYMBOL(server_name_is_ost);
739
740 /* Get the index from the obd name.
741    rc = server type, or
742    rc < 0  on error
743    if endptr isn't NULL it is set to end of name */
744 int server_name2index(const char *svname, __u32 *idx, const char **endptr)
745 {
746         unsigned long index;
747         int rc;
748         const char *dash;
749
750         /* We use server_name2fsname() just for parsing */
751         rc = server_name2fsname(svname, NULL, &dash);
752         if (rc != 0)
753                 return rc;
754
755         dash++;
756
757         if (strncmp(dash, "MDT", 3) == 0)
758                 rc = LDD_F_SV_TYPE_MDT;
759         else if (strncmp(dash, "OST", 3) == 0)
760                 rc = LDD_F_SV_TYPE_OST;
761         else
762                 return -EINVAL;
763
764         dash += 3;
765
766         if (strncmp(dash, "all", 3) == 0) {
767                 if (endptr != NULL)
768                         *endptr = dash + 3;
769                 return rc | LDD_F_SV_ALL;
770         }
771
772         index = simple_strtoul(dash, (char **)endptr, 16);
773         if (idx != NULL)
774                 *idx = index;
775
776         /* Account for -mdc after index that is possible when specifying mdt */
777         if (endptr != NULL && strncmp(LUSTRE_MDC_NAME, *endptr + 1,
778                                       sizeof(LUSTRE_MDC_NAME)-1) == 0)
779                 *endptr += sizeof(LUSTRE_MDC_NAME);
780
781         return rc;
782 }
783 EXPORT_SYMBOL(server_name2index);
784
785 /*************** mount common betweeen server and client ***************/
786
787 /* Common umount */
788 int lustre_common_put_super(struct super_block *sb)
789 {
790         int rc;
791         ENTRY;
792
793         CDEBUG(D_MOUNT, "dropping sb %p\n", sb);
794
795         /* Drop a ref to the MGC */
796         rc = lustre_stop_mgc(sb);
797         if (rc && (rc != -ENOENT)) {
798                 if (rc != -EBUSY) {
799                         CERROR("Can't stop MGC: %d\n", rc);
800                         RETURN(rc);
801                 }
802                 /* BUSY just means that there's some other obd that
803                    needs the mgc.  Let him clean it up. */
804                 CDEBUG(D_MOUNT, "MGC still in use\n");
805         }
806         /* Drop a ref to the mounted disk */
807         lustre_put_lsi(sb);
808         lu_types_stop();
809         RETURN(rc);
810 }
811 EXPORT_SYMBOL(lustre_common_put_super);
812
813 static void lmd_print(struct lustre_mount_data *lmd)
814 {
815         int i;
816
817         PRINT_CMD(D_MOUNT, "  mount data:\n");
818         if (lmd_is_client(lmd))
819                 PRINT_CMD(D_MOUNT, "profile: %s\n", lmd->lmd_profile);
820         PRINT_CMD(D_MOUNT, "device:  %s\n", lmd->lmd_dev);
821         PRINT_CMD(D_MOUNT, "flags:   %x\n", lmd->lmd_flags);
822
823         if (lmd->lmd_opts)
824                 PRINT_CMD(D_MOUNT, "options: %s\n", lmd->lmd_opts);
825
826         if (lmd->lmd_recovery_time_soft)
827                 PRINT_CMD(D_MOUNT, "recovery time soft: %d\n",
828                           lmd->lmd_recovery_time_soft);
829
830         if (lmd->lmd_recovery_time_hard)
831                 PRINT_CMD(D_MOUNT, "recovery time hard: %d\n",
832                           lmd->lmd_recovery_time_hard);
833
834         for (i = 0; i < lmd->lmd_exclude_count; i++) {
835                 PRINT_CMD(D_MOUNT, "exclude %d:  OST%04x\n", i,
836                           lmd->lmd_exclude[i]);
837         }
838 }
839
840 /* Is this server on the exclusion list */
841 int lustre_check_exclusion(struct super_block *sb, char *svname)
842 {
843         struct lustre_sb_info *lsi = s2lsi(sb);
844         struct lustre_mount_data *lmd = lsi->lsi_lmd;
845         __u32 index;
846         int i, rc;
847         ENTRY;
848
849         rc = server_name2index(svname, &index, NULL);
850         if (rc != LDD_F_SV_TYPE_OST)
851                 /* Only exclude OSTs */
852                 RETURN(0);
853
854         CDEBUG(D_MOUNT, "Check exclusion %s (%d) in %d of %s\n", svname,
855                index, lmd->lmd_exclude_count, lmd->lmd_dev);
856
857         for(i = 0; i < lmd->lmd_exclude_count; i++) {
858                 if (index == lmd->lmd_exclude[i]) {
859                         CWARN("Excluding %s (on exclusion list)\n", svname);
860                         RETURN(1);
861                 }
862         }
863         RETURN(0);
864 }
865
866 /* mount -v  -o exclude=lustre-OST0001:lustre-OST0002 -t lustre ... */
867 static int lmd_make_exclusion(struct lustre_mount_data *lmd, const char *ptr)
868 {
869         const char *s1 = ptr, *s2;
870         __u32 index, *exclude_list;
871         int rc = 0, devmax;
872         ENTRY;
873
874         /* The shortest an ost name can be is 8 chars: -OST0000.
875            We don't actually know the fsname at this time, so in fact
876            a user could specify any fsname. */
877         devmax = strlen(ptr) / 8 + 1;
878
879         /* temp storage until we figure out how many we have */
880         OBD_ALLOC(exclude_list, sizeof(index) * devmax);
881         if (!exclude_list)
882                 RETURN(-ENOMEM);
883
884         /* we enter this fn pointing at the '=' */
885         while (*s1 && *s1 != ' ' && *s1 != ',') {
886                 s1++;
887                 rc = server_name2index(s1, &index, &s2);
888                 if (rc < 0) {
889                         CERROR("Can't parse server name '%s': rc = %d\n",
890                                s1, rc);
891                         break;
892                 }
893                 if (rc == LDD_F_SV_TYPE_OST)
894                         exclude_list[lmd->lmd_exclude_count++] = index;
895                 else
896                         CDEBUG(D_MOUNT, "ignoring exclude %.*s: type = %#x\n",
897                                (uint)(s2-s1), s1, rc);
898                 s1 = s2;
899                 /* now we are pointing at ':' (next exclude)
900                    or ',' (end of excludes) */
901                 if (lmd->lmd_exclude_count >= devmax)
902                         break;
903         }
904         if (rc >= 0) /* non-err */
905                 rc = 0;
906
907         if (lmd->lmd_exclude_count) {
908                 /* permanent, freed in lustre_free_lsi */
909                 OBD_ALLOC(lmd->lmd_exclude, sizeof(index) *
910                           lmd->lmd_exclude_count);
911                 if (lmd->lmd_exclude) {
912                         memcpy(lmd->lmd_exclude, exclude_list,
913                                sizeof(index) * lmd->lmd_exclude_count);
914                 } else {
915                         rc = -ENOMEM;
916                         lmd->lmd_exclude_count = 0;
917                 }
918         }
919         OBD_FREE(exclude_list, sizeof(index) * devmax);
920         RETURN(rc);
921 }
922
923 static int lmd_parse_mgssec(struct lustre_mount_data *lmd, char *ptr)
924 {
925         char   *tail;
926         int     length;
927
928         if (lmd->lmd_mgssec != NULL) {
929                 OBD_FREE(lmd->lmd_mgssec, strlen(lmd->lmd_mgssec) + 1);
930                 lmd->lmd_mgssec = NULL;
931         }
932
933         tail = strchr(ptr, ',');
934         if (tail == NULL)
935                 length = strlen(ptr);
936         else
937                 length = tail - ptr;
938
939         OBD_ALLOC(lmd->lmd_mgssec, length + 1);
940         if (lmd->lmd_mgssec == NULL)
941                 return -ENOMEM;
942
943         memcpy(lmd->lmd_mgssec, ptr, length);
944         lmd->lmd_mgssec[length] = '\0';
945         return 0;
946 }
947
948 static int lmd_parse_string(char **handle, char *ptr)
949 {
950         char   *tail;
951         int     length;
952
953         if ((handle == NULL) || (ptr == NULL))
954                 return -EINVAL;
955
956         if (*handle != NULL) {
957                 OBD_FREE(*handle, strlen(*handle) + 1);
958                 *handle = NULL;
959         }
960
961         tail = strchr(ptr, ',');
962         if (tail == NULL)
963                 length = strlen(ptr);
964         else
965                 length = tail - ptr;
966
967         OBD_ALLOC(*handle, length + 1);
968         if (*handle == NULL)
969                 return -ENOMEM;
970
971         memcpy(*handle, ptr, length);
972         (*handle)[length] = '\0';
973
974         return 0;
975 }
976
977 /* Collect multiple values for mgsnid specifiers */
978 static int lmd_parse_mgs(struct lustre_mount_data *lmd, char **ptr)
979 {
980         lnet_nid_t nid;
981         char *tail = *ptr;
982         char *mgsnid;
983         int   length;
984         int   oldlen = 0;
985
986         /* Find end of nidlist */
987         while (class_parse_nid_quiet(tail, &nid, &tail) == 0) {}
988         length = tail - *ptr;
989         if (length == 0) {
990                 LCONSOLE_ERROR_MSG(0x159, "Can't parse NID '%s'\n", *ptr);
991                 return -EINVAL;
992         }
993
994         if (lmd->lmd_mgs != NULL)
995                 oldlen = strlen(lmd->lmd_mgs) + 1;
996
997         OBD_ALLOC(mgsnid, oldlen + length + 1);
998         if (mgsnid == NULL)
999                 return -ENOMEM;
1000
1001         if (lmd->lmd_mgs != NULL) {
1002                 /* Multiple mgsnid= are taken to mean failover locations */
1003                 memcpy(mgsnid, lmd->lmd_mgs, oldlen);
1004                 mgsnid[oldlen - 1] = ':';
1005                 OBD_FREE(lmd->lmd_mgs, oldlen);
1006         }
1007         memcpy(mgsnid + oldlen, *ptr, length);
1008         mgsnid[oldlen + length] = '\0';
1009         lmd->lmd_mgs = mgsnid;
1010         *ptr = tail;
1011
1012         return 0;
1013 }
1014
1015 /** Parse mount line options
1016  * e.g. mount -v -t lustre -o abort_recov uml1:uml2:/lustre-client /mnt/lustre
1017  * dev is passed as device=uml1:/lustre by mount.lustre
1018  */
1019 static int lmd_parse(char *options, struct lustre_mount_data *lmd)
1020 {
1021         char *s1, *s2, *devname = NULL;
1022         struct lustre_mount_data *raw = (struct lustre_mount_data *)options;
1023         int rc = 0;
1024         ENTRY;
1025
1026         LASSERT(lmd);
1027         if (!options) {
1028                 LCONSOLE_ERROR_MSG(0x162, "Missing mount data: check that "
1029                                    "/sbin/mount.lustre is installed.\n");
1030                 RETURN(-EINVAL);
1031         }
1032
1033         /* Options should be a string - try to detect old lmd data */
1034         if ((raw->lmd_magic & 0xffffff00) == (LMD_MAGIC & 0xffffff00)) {
1035                 LCONSOLE_ERROR_MSG(0x163, "You're using an old version of "
1036                                    "/sbin/mount.lustre.  Please install "
1037                                    "version %s\n", LUSTRE_VERSION_STRING);
1038                 RETURN(-EINVAL);
1039         }
1040         lmd->lmd_magic = LMD_MAGIC;
1041
1042         OBD_ALLOC(lmd->lmd_params, 4096);
1043         if (lmd->lmd_params == NULL)
1044                 RETURN(-ENOMEM);
1045         lmd->lmd_params[0] = '\0';
1046
1047         /* Set default flags here */
1048
1049         s1 = options;
1050         while (*s1) {
1051                 int clear = 0;
1052                 int time_min = OBD_RECOVERY_TIME_MIN;
1053
1054                 /* Skip whitespace and extra commas */
1055                 while (*s1 == ' ' || *s1 == ',')
1056                         s1++;
1057
1058                 /* Client options are parsed in ll_options: eg. flock,
1059                    user_xattr, acl */
1060
1061                 /* Parse non-ldiskfs options here. Rather than modifying
1062                    ldiskfs, we just zero these out here */
1063                 if (strncmp(s1, "abort_recov", 11) == 0) {
1064                         lmd->lmd_flags |= LMD_FLG_ABORT_RECOV;
1065                         clear++;
1066                 } else if (strncmp(s1, "recovery_time_soft=", 19) == 0) {
1067                         lmd->lmd_recovery_time_soft = max_t(int,
1068                                 simple_strtoul(s1 + 19, NULL, 10), time_min);
1069                         clear++;
1070                 } else if (strncmp(s1, "recovery_time_hard=", 19) == 0) {
1071                         lmd->lmd_recovery_time_hard = max_t(int,
1072                                 simple_strtoul(s1 + 19, NULL, 10), time_min);
1073                         clear++;
1074                 } else if (strncmp(s1, "noir", 4) == 0) {
1075                         lmd->lmd_flags |= LMD_FLG_NOIR; /* test purpose only. */
1076                         clear++;
1077                 } else if (strncmp(s1, "nosvc", 5) == 0) {
1078                         lmd->lmd_flags |= LMD_FLG_NOSVC;
1079                         clear++;
1080                 } else if (strncmp(s1, "nomgs", 5) == 0) {
1081                         lmd->lmd_flags |= LMD_FLG_NOMGS;
1082                         clear++;
1083                 } else if (strncmp(s1, "noscrub", 7) == 0) {
1084                         lmd->lmd_flags |= LMD_FLG_NOSCRUB;
1085                         clear++;
1086                 } else if (strncmp(s1, PARAM_MGSNODE,
1087                                    sizeof(PARAM_MGSNODE) - 1) == 0) {
1088                         s2 = s1 + sizeof(PARAM_MGSNODE) - 1;
1089                         /* Assume the next mount opt is the first
1090                            invalid nid we get to. */
1091                         rc = lmd_parse_mgs(lmd, &s2);
1092                         if (rc)
1093                                 goto invalid;
1094                         clear++;
1095                 } else if (strncmp(s1, "writeconf", 9) == 0) {
1096                         lmd->lmd_flags |= LMD_FLG_WRITECONF;
1097                         clear++;
1098                 } else if (strncmp(s1, "update", 6) == 0) {
1099                         lmd->lmd_flags |= LMD_FLG_UPDATE;
1100                         clear++;
1101                 } else if (strncmp(s1, "virgin", 6) == 0) {
1102                         lmd->lmd_flags |= LMD_FLG_VIRGIN;
1103                         clear++;
1104                 } else if (strncmp(s1, "noprimnode", 10) == 0) {
1105                         lmd->lmd_flags |= LMD_FLG_NO_PRIMNODE;
1106                         clear++;
1107                 } else if (strncmp(s1, "mgssec=", 7) == 0) {
1108                         rc = lmd_parse_mgssec(lmd, s1 + 7);
1109                         if (rc)
1110                                 goto invalid;
1111                         clear++;
1112                 /* ost exclusion list */
1113                 } else if (strncmp(s1, "exclude=", 8) == 0) {
1114                         rc = lmd_make_exclusion(lmd, s1 + 7);
1115                         if (rc)
1116                                 goto invalid;
1117                         clear++;
1118                 } else if (strncmp(s1, "mgs", 3) == 0) {
1119                         /* We are an MGS */
1120                         lmd->lmd_flags |= LMD_FLG_MGS;
1121                         clear++;
1122                 } else if (strncmp(s1, "svname=", 7) == 0) {
1123                         rc = lmd_parse_string(&lmd->lmd_profile, s1 + 7);
1124                         if (rc)
1125                                 goto invalid;
1126                         clear++;
1127                 } else if (strncmp(s1, "param=", 6) == 0) {
1128                         int length;
1129                         char *tail = strchr(s1 + 6, ',');
1130                         if (tail == NULL)
1131                                 length = strlen(s1);
1132                         else
1133                                 length = tail - s1;
1134                         length -= 6;
1135                         strncat(lmd->lmd_params, s1 + 6, length);
1136                         strcat(lmd->lmd_params, " ");
1137                         clear++;
1138                 } else if (strncmp(s1, "osd=", 4) == 0) {
1139                         rc = lmd_parse_string(&lmd->lmd_osd_type, s1 + 4);
1140                         if (rc)
1141                                 goto invalid;
1142                         clear++;
1143                 }
1144                 /* Linux 2.4 doesn't pass the device, so we stuck it at the
1145                    end of the options. */
1146                 else if (strncmp(s1, "device=", 7) == 0) {
1147                         devname = s1 + 7;
1148                         /* terminate options right before device.  device
1149                            must be the last one. */
1150                         *s1 = '\0';
1151                         break;
1152                 }
1153
1154                 /* Find next opt */
1155                 s2 = strchr(s1, ',');
1156                 if (s2 == NULL) {
1157                         if (clear)
1158                                 *s1 = '\0';
1159                         break;
1160                 }
1161                 s2++;
1162                 if (clear)
1163                         memmove(s1, s2, strlen(s2) + 1);
1164                 else
1165                         s1 = s2;
1166         }
1167
1168         if (!devname) {
1169                 LCONSOLE_ERROR_MSG(0x164, "Can't find the device name "
1170                                    "(need mount option 'device=...')\n");
1171                 goto invalid;
1172         }
1173
1174         s1 = strstr(devname, ":/");
1175         if (s1) {
1176                 ++s1;
1177                 lmd->lmd_flags |= LMD_FLG_CLIENT;
1178                 /* Remove leading /s from fsname */
1179                 while (*++s1 == '/') ;
1180                 /* Freed in lustre_free_lsi */
1181                 OBD_ALLOC(lmd->lmd_profile, strlen(s1) + 8);
1182                 if (!lmd->lmd_profile)
1183                         RETURN(-ENOMEM);
1184                 sprintf(lmd->lmd_profile, "%s-client", s1);
1185         }
1186
1187         /* Freed in lustre_free_lsi */
1188         OBD_ALLOC(lmd->lmd_dev, strlen(devname) + 1);
1189         if (!lmd->lmd_dev)
1190                 RETURN(-ENOMEM);
1191         strcpy(lmd->lmd_dev, devname);
1192
1193         /* Save mount options */
1194         s1 = options + strlen(options) - 1;
1195         while (s1 >= options && (*s1 == ',' || *s1 == ' '))
1196                 *s1-- = 0;
1197         if (*options != 0) {
1198                 /* Freed in lustre_free_lsi */
1199                 OBD_ALLOC(lmd->lmd_opts, strlen(options) + 1);
1200                 if (!lmd->lmd_opts)
1201                         RETURN(-ENOMEM);
1202                 strcpy(lmd->lmd_opts, options);
1203         }
1204
1205         lmd_print(lmd);
1206         lmd->lmd_magic = LMD_MAGIC;
1207
1208         RETURN(rc);
1209
1210 invalid:
1211         CERROR("Bad mount options %s\n", options);
1212         RETURN(-EINVAL);
1213 }
1214
1215 struct lustre_mount_data2 {
1216         void *lmd2_data;
1217         struct vfsmount *lmd2_mnt;
1218 };
1219
1220 /** This is the entry point for the mount call into Lustre.
1221  * This is called when a server or client is mounted,
1222  * and this is where we start setting things up.
1223  * @param data Mount options (e.g. -o flock,abort_recov)
1224  */
1225 int lustre_fill_super(struct super_block *sb, void *data, int silent)
1226 {
1227         struct lustre_mount_data *lmd;
1228         struct lustre_mount_data2 *lmd2 = data;
1229         struct lustre_sb_info *lsi;
1230         int rc;
1231         ENTRY;
1232
1233         CDEBUG(D_MOUNT|D_VFSTRACE, "VFS Op: sb %p\n", sb);
1234
1235         lsi = lustre_init_lsi(sb);
1236         if (!lsi)
1237                 RETURN(-ENOMEM);
1238         lmd = lsi->lsi_lmd;
1239
1240         /*
1241          * Disable lockdep during mount, because mount locking patterns are
1242          * `special'.
1243          */
1244         lockdep_off();
1245
1246         /*
1247          * LU-639: the obd cleanup of last mount may not finish yet, wait here.
1248          */
1249         obd_zombie_barrier();
1250
1251         /* Figure out the lmd from the mount options */
1252         if (lmd_parse((char *)(lmd2->lmd2_data), lmd)) {
1253                 lustre_put_lsi(sb);
1254                 GOTO(out, rc = -EINVAL);
1255         }
1256
1257         if (lmd_is_client(lmd)) {
1258                 CDEBUG(D_MOUNT, "Mounting client %s\n", lmd->lmd_profile);
1259                 if (!client_fill_super) {
1260                         LCONSOLE_ERROR_MSG(0x165, "Nothing registered for "
1261                                            "client mount! Is the 'lustre' "
1262                                            "module loaded?\n");
1263                         lustre_put_lsi(sb);
1264                         rc = -ENODEV;
1265                 } else {
1266                         rc = lustre_start_mgc(sb);
1267                         if (rc) {
1268                                 lustre_put_lsi(sb);
1269                                 GOTO(out, rc);
1270                         }
1271                         /* Connect and start */
1272                         /* (should always be ll_fill_super) */
1273                         rc = (*client_fill_super)(sb, lmd2->lmd2_mnt);
1274                         /* c_f_s will call lustre_common_put_super on failure */
1275                 }
1276         } else {
1277 #ifdef HAVE_SERVER_SUPPORT
1278                 CDEBUG(D_MOUNT, "Mounting server from %s\n", lmd->lmd_dev);
1279                 rc = server_fill_super(sb);
1280                 /* s_f_s calls lustre_start_mgc after the mount because we need
1281                    the MGS nids which are stored on disk.  Plus, we may
1282                    need to start the MGS first. */
1283                 /* s_f_s will call server_put_super on failure */
1284 #else
1285                 CERROR("This is client-side-only module, "
1286                        "cannot handle server mount.\n");
1287                 rc = -EINVAL;
1288 #endif
1289         }
1290
1291         /* If error happens in fill_super() call, @lsi will be killed there.
1292          * This is why we do not put it here. */
1293         GOTO(out, rc);
1294 out:
1295         if (rc) {
1296                 CERROR("Unable to mount %s (%d)\n",
1297                        s2lsi(sb) ? lmd->lmd_dev : "", rc);
1298         } else {
1299                 CDEBUG(D_SUPER, "Mount %s complete\n",
1300                        lmd->lmd_dev);
1301         }
1302         lockdep_on();
1303         return rc;
1304 }
1305
1306
1307 /* We can't call ll_fill_super by name because it lives in a module that
1308    must be loaded after this one. */
1309 void lustre_register_client_fill_super(int (*cfs)(struct super_block *sb,
1310                                                   struct vfsmount *mnt))
1311 {
1312         client_fill_super = cfs;
1313 }
1314 EXPORT_SYMBOL(lustre_register_client_fill_super);
1315
1316 void lustre_register_kill_super_cb(void (*cfs)(struct super_block *sb))
1317 {
1318         kill_super_cb = cfs;
1319 }
1320 EXPORT_SYMBOL(lustre_register_kill_super_cb);
1321
1322 /***************** FS registration ******************/
1323 #ifdef HAVE_FSTYPE_MOUNT
1324 struct dentry *lustre_mount(struct file_system_type *fs_type, int flags,
1325                                 const char *devname, void *data)
1326 {
1327         struct lustre_mount_data2 lmd2 = { data, NULL };
1328
1329         return mount_nodev(fs_type, flags, &lmd2, lustre_fill_super);
1330 }
1331 #else
1332 int lustre_get_sb(struct file_system_type *fs_type, int flags,
1333                   const char *devname, void * data, struct vfsmount *mnt)
1334 {
1335         struct lustre_mount_data2 lmd2 = { data, mnt };
1336
1337         return get_sb_nodev(fs_type, flags, &lmd2, lustre_fill_super, mnt);
1338 }
1339 #endif
1340
1341 void lustre_kill_super(struct super_block *sb)
1342 {
1343         struct lustre_sb_info *lsi = s2lsi(sb);
1344
1345         if (kill_super_cb && lsi && !IS_SERVER(lsi))
1346                 (*kill_super_cb)(sb);
1347
1348         kill_anon_super(sb);
1349 }
1350
1351 /** Register the "lustre" fs type
1352  */
1353 struct file_system_type lustre_fs_type = {
1354         .owner        = THIS_MODULE,
1355         .name         = "lustre",
1356 #ifdef HAVE_FSTYPE_MOUNT
1357         .mount        = lustre_mount,
1358 #else
1359         .get_sb       = lustre_get_sb,
1360 #endif
1361         .kill_sb      = lustre_kill_super,
1362         .fs_flags     = FS_BINARY_MOUNTDATA | FS_REQUIRES_DEV |
1363                         FS_HAS_FIEMAP | FS_RENAME_DOES_D_MOVE,
1364 };
1365
1366 int lustre_register_fs(void)
1367 {
1368         return register_filesystem(&lustre_fs_type);
1369 }
1370
1371 int lustre_unregister_fs(void)
1372 {
1373         return unregister_filesystem(&lustre_fs_type);
1374 }