Whamcloud - gitweb
153986adee220faa4f3a1d4e0c1d4b62aaa6969f
[fs/lustre-release.git] / lustre / obdclass / obd_mount.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2015, Intel Corporation.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/obdclass/obd_mount.c
37  *
38  * Client mount routines
39  *
40  * Author: Nathan Rutman <nathan@clusterfs.com>
41  */
42
43
44 #define DEBUG_SUBSYSTEM S_CLASS
45 #define D_MOUNT (D_SUPER|D_CONFIG/*|D_WARNING */)
46 #define PRINT_CMD CDEBUG
47
48 #include <obd.h>
49 #include <obd_class.h>
50 #include <lustre/lustre_user.h>
51 #include <linux/version.h>
52 #include <lustre_log.h>
53 #include <lustre_disk.h>
54 #include <lustre_param.h>
55
56 static int (*client_fill_super)(struct super_block *sb,
57                                 struct vfsmount *mnt);
58
59 static void (*kill_super_cb)(struct super_block *sb);
60
61 /**************** config llog ********************/
62
63 /** Get a config log from the MGS and process it.
64  * This func is called for both clients and servers.
65  * Continue to process new statements appended to the logs
66  * (whenever the config lock is revoked) until lustre_end_log
67  * is called.
68  * @param sb The superblock is used by the MGC to write to the local copy of
69  *   the config log
70  * @param logname The name of the llog to replicate from the MGS
71  * @param cfg Since the same mgc may be used to follow multiple config logs
72  *   (e.g. ost1, ost2, client), the config_llog_instance keeps the state for
73  *   this log, and is added to the mgc's list of logs to follow.
74  */
75 int lustre_process_log(struct super_block *sb, char *logname,
76                      struct config_llog_instance *cfg)
77 {
78         struct lustre_cfg *lcfg;
79         struct lustre_cfg_bufs *bufs;
80         struct lustre_sb_info *lsi = s2lsi(sb);
81         struct obd_device *mgc = lsi->lsi_mgc;
82         int rc;
83         ENTRY;
84
85         LASSERT(mgc);
86         LASSERT(cfg);
87
88         OBD_ALLOC_PTR(bufs);
89         if (bufs == NULL)
90                 RETURN(-ENOMEM);
91
92         /* mgc_process_config */
93         lustre_cfg_bufs_reset(bufs, mgc->obd_name);
94         lustre_cfg_bufs_set_string(bufs, 1, logname);
95         lustre_cfg_bufs_set(bufs, 2, cfg, sizeof(*cfg));
96         lustre_cfg_bufs_set(bufs, 3, &sb, sizeof(sb));
97         lcfg = lustre_cfg_new(LCFG_LOG_START, bufs);
98         if (lcfg == NULL)
99                 GOTO(out, rc = -ENOMEM);
100         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
101         lustre_cfg_free(lcfg);
102 out:
103         OBD_FREE_PTR(bufs);
104
105         if (rc == -EINVAL)
106                 LCONSOLE_ERROR_MSG(0x15b, "%s: The configuration from log '%s'"
107                                    "failed from the MGS (%d).  Make sure this "
108                                    "client and the MGS are running compatible "
109                                    "versions of Lustre.\n",
110                                    mgc->obd_name, logname, rc);
111         else if (rc != 0)
112                 LCONSOLE_ERROR_MSG(0x15c, "%s: The configuration from log '%s' "
113                                    "failed (%d). This may be the result of "
114                                    "communication errors between this node and "
115                                    "the MGS, a bad configuration, or other "
116                                    "errors. See the syslog for more "
117                                    "information.\n", mgc->obd_name, logname,
118                                    rc);
119
120         /* class_obd_list(); */
121         RETURN(rc);
122 }
123 EXPORT_SYMBOL(lustre_process_log);
124
125 /* Stop watching this config log for updates */
126 int lustre_end_log(struct super_block *sb, char *logname,
127                        struct config_llog_instance *cfg)
128 {
129         struct lustre_cfg *lcfg;
130         struct lustre_cfg_bufs bufs;
131         struct lustre_sb_info *lsi = s2lsi(sb);
132         struct obd_device *mgc = lsi->lsi_mgc;
133         int rc;
134         ENTRY;
135
136         if (!mgc)
137                 RETURN(-ENOENT);
138
139         /* mgc_process_config */
140         lustre_cfg_bufs_reset(&bufs, mgc->obd_name);
141         lustre_cfg_bufs_set_string(&bufs, 1, logname);
142         if (cfg)
143                 lustre_cfg_bufs_set(&bufs, 2, cfg, sizeof(*cfg));
144         lcfg = lustre_cfg_new(LCFG_LOG_END, &bufs);
145         if (lcfg == NULL)
146                 RETURN(-ENOMEM);
147         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
148         lustre_cfg_free(lcfg);
149         RETURN(rc);
150 }
151 EXPORT_SYMBOL(lustre_end_log);
152
153 /**************** obd start *******************/
154
155 /** lustre_cfg_bufs are a holdover from 1.4; we can still set these up from
156  * lctl (and do for echo cli/srv.
157  */
158 int do_lcfg(char *cfgname, lnet_nid_t nid, int cmd,
159             char *s1, char *s2, char *s3, char *s4)
160 {
161         struct lustre_cfg_bufs bufs;
162         struct lustre_cfg    * lcfg = NULL;
163         int rc;
164
165         CDEBUG(D_TRACE, "lcfg %s %#x %s %s %s %s\n", cfgname,
166                cmd, s1, s2, s3, s4);
167
168         lustre_cfg_bufs_reset(&bufs, cfgname);
169         if (s1)
170                 lustre_cfg_bufs_set_string(&bufs, 1, s1);
171         if (s2)
172                 lustre_cfg_bufs_set_string(&bufs, 2, s2);
173         if (s3)
174                 lustre_cfg_bufs_set_string(&bufs, 3, s3);
175         if (s4)
176                 lustre_cfg_bufs_set_string(&bufs, 4, s4);
177
178         lcfg = lustre_cfg_new(cmd, &bufs);
179         if (lcfg == NULL)
180                 return -ENOMEM;
181         lcfg->lcfg_nid = nid;
182         rc = class_process_config(lcfg);
183         lustre_cfg_free(lcfg);
184         return(rc);
185 }
186
187 /** Call class_attach and class_setup.  These methods in turn call
188  * obd type-specific methods.
189  */
190 int lustre_start_simple(char *obdname, char *type, char *uuid,
191                         char *s1, char *s2, char *s3, char *s4)
192 {
193         int rc;
194         CDEBUG(D_MOUNT, "Starting obd %s (typ=%s)\n", obdname, type);
195
196         rc = do_lcfg(obdname, 0, LCFG_ATTACH, type, uuid, NULL, NULL);
197         if (rc) {
198                 CERROR("%s attach error %d\n", obdname, rc);
199                 return rc;
200         }
201         rc = do_lcfg(obdname, 0, LCFG_SETUP, s1, s2, s3, s4);
202         if (rc) {
203                 CERROR("%s setup error %d\n", obdname, rc);
204                 do_lcfg(obdname, 0, LCFG_DETACH, NULL, NULL, NULL, NULL);
205         }
206         return rc;
207 }
208
209 static DEFINE_MUTEX(mgc_start_lock);
210
211 /** Set up a mgc obd to process startup logs
212  *
213  * \param sb [in] super block of the mgc obd
214  *
215  * \retval 0 success, otherwise error code
216  */
217 int lustre_start_mgc(struct super_block *sb)
218 {
219         struct obd_connect_data *data = NULL;
220         struct lustre_sb_info *lsi = s2lsi(sb);
221         struct obd_device *obd;
222         struct obd_export *exp;
223         struct obd_uuid *uuid;
224         class_uuid_t uuidc;
225         lnet_nid_t nid;
226         char nidstr[LNET_NIDSTR_SIZE];
227         char *mgcname = NULL, *niduuid = NULL, *mgssec = NULL;
228         char *ptr;
229         int rc = 0, i = 0, j;
230         size_t len;
231         ENTRY;
232
233         LASSERT(lsi->lsi_lmd);
234
235         /* Find the first non-lo MGS nid for our MGC name */
236         if (IS_SERVER(lsi)) {
237                 /* mount -o mgsnode=nid */
238                 ptr = lsi->lsi_lmd->lmd_mgs;
239                 if (lsi->lsi_lmd->lmd_mgs &&
240                     (class_parse_nid(lsi->lsi_lmd->lmd_mgs, &nid, &ptr) == 0)) {
241                         i++;
242                 } else if (IS_MGS(lsi)) {
243                         lnet_process_id_t id;
244                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
245                                 if (LNET_NETTYP(LNET_NIDNET(id.nid)) == LOLND)
246                                         continue;
247                                 nid = id.nid;
248                                 i++;
249                                 break;
250                         }
251                 }
252         } else { /* client */
253                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
254                 ptr = lsi->lsi_lmd->lmd_dev;
255                 if (class_parse_nid(ptr, &nid, &ptr) == 0)
256                         i++;
257         }
258         if (i == 0) {
259                 CERROR("No valid MGS nids found.\n");
260                 RETURN(-EINVAL);
261         }
262
263         mutex_lock(&mgc_start_lock);
264
265         libcfs_nid2str_r(nid, nidstr, sizeof(nidstr));
266         len = strlen(LUSTRE_MGC_OBDNAME) + strlen(nidstr) + 1;
267         OBD_ALLOC(mgcname, len);
268         OBD_ALLOC(niduuid, len + 2);
269         if (mgcname == NULL || niduuid == NULL)
270                 GOTO(out_free, rc = -ENOMEM);
271         snprintf(mgcname, len, "%s%s", LUSTRE_MGC_OBDNAME, nidstr);
272
273         mgssec = lsi->lsi_lmd->lmd_mgssec ? lsi->lsi_lmd->lmd_mgssec : "";
274
275         OBD_ALLOC_PTR(data);
276         if (data == NULL)
277                 GOTO(out_free, rc = -ENOMEM);
278
279         obd = class_name2obd(mgcname);
280         if (obd && !obd->obd_stopping) {
281                 int recov_bk;
282
283                 rc = obd_set_info_async(NULL, obd->obd_self_export,
284                                         strlen(KEY_MGSSEC), KEY_MGSSEC,
285                                         strlen(mgssec), mgssec, NULL);
286                 if (rc)
287                         GOTO(out_free, rc);
288
289                 /* Re-using an existing MGC */
290                 atomic_inc(&obd->u.cli.cl_mgc_refcount);
291
292                 /* IR compatibility check, only for clients */
293                 if (lmd_is_client(lsi->lsi_lmd)) {
294                         int has_ir;
295                         int vallen = sizeof(*data);
296                         __u32 *flags = &lsi->lsi_lmd->lmd_flags;
297
298                         rc = obd_get_info(NULL, obd->obd_self_export,
299                                           strlen(KEY_CONN_DATA), KEY_CONN_DATA,
300                                           &vallen, data);
301                         LASSERT(rc == 0);
302                         has_ir = OCD_HAS_FLAG(data, IMP_RECOV);
303                         if (has_ir ^ !(*flags & LMD_FLG_NOIR)) {
304                                 /* LMD_FLG_NOIR is for test purpose only */
305                                 LCONSOLE_WARN(
306                                     "Trying to mount a client with IR setting "
307                                     "not compatible with current mgc. "
308                                     "Force to use current mgc setting that is "
309                                     "IR %s.\n",
310                                     has_ir ? "enabled" : "disabled");
311                                 if (has_ir)
312                                         *flags &= ~LMD_FLG_NOIR;
313                                 else
314                                         *flags |= LMD_FLG_NOIR;
315                         }
316                 }
317
318                 recov_bk = 0;
319                 /* If we are restarting the MGS, don't try to keep the MGC's
320                    old connection, or registration will fail. */
321                 if (IS_MGS(lsi)) {
322                         CDEBUG(D_MOUNT, "New MGS with live MGC\n");
323                         recov_bk = 1;
324                 }
325
326                 /* Try all connections, but only once (again).
327                    We don't want to block another target from starting
328                    (using its local copy of the log), but we do want to connect
329                    if at all possible. */
330                 recov_bk++;
331                 CDEBUG(D_MOUNT, "%s: Set MGC reconnect %d\n", mgcname,recov_bk);
332                 rc = obd_set_info_async(NULL, obd->obd_self_export,
333                                         sizeof(KEY_INIT_RECOV_BACKUP),
334                                         KEY_INIT_RECOV_BACKUP,
335                                         sizeof(recov_bk), &recov_bk, NULL);
336                 GOTO(out, rc = 0);
337         }
338
339         CDEBUG(D_MOUNT, "Start MGC '%s'\n", mgcname);
340
341         /* Add the primary nids for the MGS */
342         i = 0;
343         snprintf(niduuid, len + 2, "%s_%x", mgcname, i);
344         if (IS_SERVER(lsi)) {
345                 ptr = lsi->lsi_lmd->lmd_mgs;
346                 CDEBUG(D_MOUNT, "mgs nids %s.\n", ptr);
347                 if (IS_MGS(lsi)) {
348                         /* Use local nids (including LO) */
349                         lnet_process_id_t id;
350                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
351                                 rc = do_lcfg(mgcname, id.nid, LCFG_ADD_UUID,
352                                              niduuid, NULL, NULL, NULL);
353                         }
354                 } else {
355                         /* Use mgsnode= nids */
356                         /* mount -o mgsnode=nid */
357                         if (lsi->lsi_lmd->lmd_mgs) {
358                                 ptr = lsi->lsi_lmd->lmd_mgs;
359                         } else if (class_find_param(ptr, PARAM_MGSNODE,
360                                                     &ptr) != 0) {
361                                 CERROR("No MGS nids given.\n");
362                                 GOTO(out_free, rc = -EINVAL);
363                         }
364                         /*
365                          * LU-3829.
366                          * Here we only take the first mgsnid as its primary
367                          * serving mgs node, the rest mgsnid will be taken as
368                          * failover mgs node, otherwise they would be takens
369                          * as multiple nids of a single mgs node.
370                          */
371                         while (class_parse_nid(ptr, &nid, &ptr) == 0) {
372                                 rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
373                                              niduuid, NULL, NULL, NULL);
374                                 if (rc == 0) {
375                                         i = 1;
376                                         break;
377                                 }
378                         }
379                 }
380         } else { /* client */
381                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
382                 ptr = lsi->lsi_lmd->lmd_dev;
383                 while (class_parse_nid(ptr, &nid, &ptr) == 0) {
384                         rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
385                                      niduuid, NULL, NULL, NULL);
386                         if (rc == 0)
387                                 ++i;
388                         /* Stop at the first failover nid */
389                         if (*ptr == ':')
390                                 break;
391                 }
392         }
393         if (i == 0) {
394                 CERROR("No valid MGS nids found.\n");
395                 GOTO(out_free, rc = -EINVAL);
396         }
397         lsi->lsi_lmd->lmd_mgs_failnodes = 1;
398
399         /* Random uuid for MGC allows easier reconnects */
400         OBD_ALLOC_PTR(uuid);
401         ll_generate_random_uuid(uuidc);
402         class_uuid_unparse(uuidc, uuid);
403
404         /* Start the MGC */
405         rc = lustre_start_simple(mgcname, LUSTRE_MGC_NAME,
406                                  (char *)uuid->uuid, LUSTRE_MGS_OBDNAME,
407                                  niduuid, NULL, NULL);
408         OBD_FREE_PTR(uuid);
409         if (rc)
410                 GOTO(out_free, rc);
411
412         /* Add any failover MGS nids */
413         i = 1;
414         while (ptr && ((*ptr == ':' ||
415                class_find_param(ptr, PARAM_MGSNODE, &ptr) == 0))) {
416                 /* New failover node */
417                 sprintf(niduuid, "%s_%x", mgcname, i);
418                 j = 0;
419                 while (class_parse_nid_quiet(ptr, &nid, &ptr) == 0) {
420                         rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
421                                      niduuid, NULL, NULL, NULL);
422                         if (rc == 0)
423                                 ++j;
424                         if (*ptr == ':')
425                                 break;
426                 }
427                 if (j > 0) {
428                         rc = do_lcfg(mgcname, 0, LCFG_ADD_CONN,
429                                      niduuid, NULL, NULL, NULL);
430                         if (rc == 0)
431                                 ++i;
432                 } else {
433                         /* at ":/fsname" */
434                         break;
435                 }
436         }
437         lsi->lsi_lmd->lmd_mgs_failnodes = i;
438
439         obd = class_name2obd(mgcname);
440         if (!obd) {
441                 CERROR("Can't find mgcobd %s\n", mgcname);
442                 GOTO(out_free, rc = -ENOTCONN);
443         }
444
445         rc = obd_set_info_async(NULL, obd->obd_self_export,
446                                 strlen(KEY_MGSSEC), KEY_MGSSEC,
447                                 strlen(mgssec), mgssec, NULL);
448         if (rc)
449                 GOTO(out_free, rc);
450
451         /* Keep a refcount of servers/clients who started with "mount",
452            so we know when we can get rid of the mgc. */
453         atomic_set(&obd->u.cli.cl_mgc_refcount, 1);
454
455         /* We connect to the MGS at setup, and don't disconnect until cleanup */
456         data->ocd_connect_flags = OBD_CONNECT_VERSION | OBD_CONNECT_AT |
457                                   OBD_CONNECT_FULL20 | OBD_CONNECT_IMP_RECOV |
458                                   OBD_CONNECT_LVB_TYPE | OBD_CONNECT_BULK_MBITS;
459
460 #if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(3, 0, 53, 0)
461         data->ocd_connect_flags |= OBD_CONNECT_MNE_SWAB;
462 #endif
463
464         if (lmd_is_client(lsi->lsi_lmd) &&
465             lsi->lsi_lmd->lmd_flags & LMD_FLG_NOIR)
466                 data->ocd_connect_flags &= ~OBD_CONNECT_IMP_RECOV;
467         data->ocd_version = LUSTRE_VERSION_CODE;
468         rc = obd_connect(NULL, &exp, obd, &(obd->obd_uuid), data, NULL);
469         if (rc) {
470                 CERROR("connect failed %d\n", rc);
471                 GOTO(out, rc);
472         }
473
474         obd->u.cli.cl_mgc_mgsexp = exp;
475
476 out:
477         /* Keep the mgc info in the sb. Note that many lsi's can point
478            to the same mgc.*/
479         lsi->lsi_mgc = obd;
480 out_free:
481         mutex_unlock(&mgc_start_lock);
482
483         if (data)
484                 OBD_FREE_PTR(data);
485         if (mgcname)
486                 OBD_FREE(mgcname, len);
487         if (niduuid)
488                 OBD_FREE(niduuid, len + 2);
489         RETURN(rc);
490 }
491
492 static int lustre_stop_mgc(struct super_block *sb)
493 {
494         struct lustre_sb_info *lsi = s2lsi(sb);
495         struct obd_device *obd;
496         char *niduuid = NULL, *ptr = NULL;
497         int i, rc = 0, len = 0;
498         ENTRY;
499
500         if (!lsi)
501                 RETURN(-ENOENT);
502         obd = lsi->lsi_mgc;
503         if (!obd)
504                 RETURN(-ENOENT);
505         lsi->lsi_mgc = NULL;
506
507         mutex_lock(&mgc_start_lock);
508         LASSERT(atomic_read(&obd->u.cli.cl_mgc_refcount) > 0);
509         if (!atomic_dec_and_test(&obd->u.cli.cl_mgc_refcount)) {
510                 /* This is not fatal, every client that stops
511                    will call in here. */
512                 CDEBUG(D_MOUNT, "mgc still has %d references.\n",
513                        atomic_read(&obd->u.cli.cl_mgc_refcount));
514                 GOTO(out, rc = -EBUSY);
515         }
516
517         /* The MGC has no recoverable data in any case.
518          * force shotdown set in umount_begin */
519         obd->obd_no_recov = 1;
520
521         if (obd->u.cli.cl_mgc_mgsexp) {
522                 /* An error is not fatal, if we are unable to send the
523                    disconnect mgs ping evictor cleans up the export */
524                 rc = obd_disconnect(obd->u.cli.cl_mgc_mgsexp);
525                 if (rc)
526                         CDEBUG(D_MOUNT, "disconnect failed %d\n", rc);
527         }
528
529         /* Save the obdname for cleaning the nid uuids, which are
530            obdname_XX */
531         len = strlen(obd->obd_name) + 6;
532         OBD_ALLOC(niduuid, len);
533         if (niduuid) {
534                 strcpy(niduuid, obd->obd_name);
535                 ptr = niduuid + strlen(niduuid);
536         }
537
538         rc = class_manual_cleanup(obd);
539         if (rc)
540                 GOTO(out, rc);
541
542         /* Clean the nid uuids */
543         if (!niduuid)
544                 GOTO(out, rc = -ENOMEM);
545
546         for (i = 0; i < lsi->lsi_lmd->lmd_mgs_failnodes; i++) {
547                 sprintf(ptr, "_%x", i);
548                 rc = do_lcfg(LUSTRE_MGC_OBDNAME, 0, LCFG_DEL_UUID,
549                              niduuid, NULL, NULL, NULL);
550                 if (rc)
551                         CERROR("del MDC UUID %s failed: rc = %d\n",
552                                niduuid, rc);
553         }
554 out:
555         if (niduuid)
556                 OBD_FREE(niduuid, len);
557
558         /* class_import_put will get rid of the additional connections */
559         mutex_unlock(&mgc_start_lock);
560         RETURN(rc);
561 }
562
563 /***************** lustre superblock **************/
564
565 static struct lustre_sb_info *lustre_init_lsi(struct super_block *sb)
566 {
567         struct lustre_sb_info *lsi;
568         ENTRY;
569
570         OBD_ALLOC_PTR(lsi);
571         if (!lsi)
572                 RETURN(NULL);
573         OBD_ALLOC_PTR(lsi->lsi_lmd);
574         if (!lsi->lsi_lmd) {
575                 OBD_FREE_PTR(lsi);
576                 RETURN(NULL);
577         }
578
579         lsi->lsi_lmd->lmd_exclude_count = 0;
580         lsi->lsi_lmd->lmd_recovery_time_soft = 0;
581         lsi->lsi_lmd->lmd_recovery_time_hard = 0;
582         s2lsi_nocast(sb) = lsi;
583         /* we take 1 extra ref for our setup */
584         atomic_set(&lsi->lsi_mounts, 1);
585
586         /* Default umount style */
587         lsi->lsi_flags = LSI_UMOUNT_FAILOVER;
588         INIT_LIST_HEAD(&lsi->lsi_lwp_list);
589         spin_lock_init(&lsi->lsi_lwp_lock);
590
591         RETURN(lsi);
592 }
593
594 static int lustre_free_lsi(struct super_block *sb)
595 {
596         struct lustre_sb_info *lsi = s2lsi(sb);
597         ENTRY;
598
599         LASSERT(lsi != NULL);
600         CDEBUG(D_MOUNT, "Freeing lsi %p\n", lsi);
601
602         /* someone didn't call server_put_mount. */
603         LASSERT(atomic_read(&lsi->lsi_mounts) == 0);
604
605         if (lsi->lsi_lmd != NULL) {
606                 if (lsi->lsi_lmd->lmd_dev != NULL)
607                         OBD_FREE(lsi->lsi_lmd->lmd_dev,
608                                  strlen(lsi->lsi_lmd->lmd_dev) + 1);
609                 if (lsi->lsi_lmd->lmd_profile != NULL)
610                         OBD_FREE(lsi->lsi_lmd->lmd_profile,
611                                  strlen(lsi->lsi_lmd->lmd_profile) + 1);
612                 if (lsi->lsi_lmd->lmd_mgssec != NULL)
613                         OBD_FREE(lsi->lsi_lmd->lmd_mgssec,
614                                  strlen(lsi->lsi_lmd->lmd_mgssec) + 1);
615                 if (lsi->lsi_lmd->lmd_opts != NULL)
616                         OBD_FREE(lsi->lsi_lmd->lmd_opts,
617                                  strlen(lsi->lsi_lmd->lmd_opts) + 1);
618                 if (lsi->lsi_lmd->lmd_exclude_count)
619                         OBD_FREE(lsi->lsi_lmd->lmd_exclude,
620                                  sizeof(lsi->lsi_lmd->lmd_exclude[0]) *
621                                  lsi->lsi_lmd->lmd_exclude_count);
622                 if (lsi->lsi_lmd->lmd_mgs != NULL)
623                         OBD_FREE(lsi->lsi_lmd->lmd_mgs,
624                                  strlen(lsi->lsi_lmd->lmd_mgs) + 1);
625                 if (lsi->lsi_lmd->lmd_osd_type != NULL)
626                         OBD_FREE(lsi->lsi_lmd->lmd_osd_type,
627                                  strlen(lsi->lsi_lmd->lmd_osd_type) + 1);
628                 if (lsi->lsi_lmd->lmd_params != NULL)
629                         OBD_FREE(lsi->lsi_lmd->lmd_params, 4096);
630
631                 OBD_FREE(lsi->lsi_lmd, sizeof(*lsi->lsi_lmd));
632         }
633
634         LASSERT(lsi->lsi_llsbi == NULL);
635         OBD_FREE(lsi, sizeof(*lsi));
636         s2lsi_nocast(sb) = NULL;
637
638         RETURN(0);
639 }
640
641 /* The lsi has one reference for every server that is using the disk -
642    e.g. MDT, MGS, and potentially MGC */
643 int lustre_put_lsi(struct super_block *sb)
644 {
645         struct lustre_sb_info *lsi = s2lsi(sb);
646         ENTRY;
647
648         LASSERT(lsi != NULL);
649
650         CDEBUG(D_MOUNT, "put %p %d\n", sb, atomic_read(&lsi->lsi_mounts));
651         if (atomic_dec_and_test(&lsi->lsi_mounts)) {
652                 if (IS_SERVER(lsi) && lsi->lsi_osd_exp) {
653                         lu_device_put(&lsi->lsi_dt_dev->dd_lu_dev);
654                         lsi->lsi_osd_exp->exp_obd->obd_lvfs_ctxt.dt = NULL;
655                         lsi->lsi_dt_dev = NULL;
656                         obd_disconnect(lsi->lsi_osd_exp);
657                         /* wait till OSD is gone */
658                         obd_zombie_barrier();
659                 }
660                 lustre_free_lsi(sb);
661                 RETURN(1);
662         }
663         RETURN(0);
664 }
665
666 /*** SERVER NAME ***
667  * <FSNAME><SEPARATOR><TYPE><INDEX>
668  * FSNAME is between 1 and 8 characters (inclusive).
669  *      Excluded characters are '/' and ':'
670  * SEPARATOR is either ':' or '-'
671  * TYPE: "OST", "MDT", etc.
672  * INDEX: Hex representation of the index
673  */
674
675 /** Get the fsname ("lustre") from the server name ("lustre-OST003F").
676  * @param [in] svname server name including type and index
677  * @param [out] fsname Buffer to copy filesystem name prefix into.
678  *  Must have at least 'strlen(fsname) + 1' chars.
679  * @param [out] endptr if endptr isn't NULL it is set to end of fsname
680  * rc < 0  on error
681  */
682 int server_name2fsname(const char *svname, char *fsname, const char **endptr)
683 {
684         const char *dash;
685
686         dash = svname + strnlen(svname, 8); /* max fsname length is 8 */
687         for (; dash > svname && *dash != '-' && *dash != ':'; dash--)
688                 ;
689         if (dash == svname)
690                 return -EINVAL;
691
692         if (fsname != NULL) {
693                 strncpy(fsname, svname, dash - svname);
694                 fsname[dash - svname] = '\0';
695         }
696
697         if (endptr != NULL)
698                 *endptr = dash;
699
700         return 0;
701 }
702 EXPORT_SYMBOL(server_name2fsname);
703
704 /**
705  * Get service name (svname) from string
706  * rc < 0 on error
707  * if endptr isn't NULL it is set to end of fsname *
708  */
709 int server_name2svname(const char *label, char *svname, const char **endptr,
710                        size_t svsize)
711 {
712         int rc;
713         const char *dash;
714
715         /* We use server_name2fsname() just for parsing */
716         rc = server_name2fsname(label, NULL, &dash);
717         if (rc != 0)
718                 return rc;
719
720         if (endptr != NULL)
721                 *endptr = dash;
722
723         if (strlcpy(svname, dash + 1, svsize) >= svsize)
724                 return -E2BIG;
725
726         return 0;
727 }
728 EXPORT_SYMBOL(server_name2svname);
729
730 /**
731  * check server name is OST.
732  **/
733 int server_name_is_ost(const char *svname)
734 {
735         const char *dash;
736         int rc;
737
738         /* We use server_name2fsname() just for parsing */
739         rc = server_name2fsname(svname, NULL, &dash);
740         if (rc != 0)
741                 return rc;
742
743         dash++;
744
745         if (strncmp(dash, "OST", 3) == 0)
746                 return 1;
747         return 0;
748 }
749 EXPORT_SYMBOL(server_name_is_ost);
750
751 /**
752  * Get the index from the target name MDTXXXX/OSTXXXX
753  * rc = server type, or rc < 0  on error
754  **/
755 int target_name2index(const char *tgtname, __u32 *idx, const char **endptr)
756 {
757         const char *dash = tgtname;
758         unsigned long index;
759         int rc;
760
761         if (strncmp(dash, "MDT", 3) == 0)
762                 rc = LDD_F_SV_TYPE_MDT;
763         else if (strncmp(dash, "OST", 3) == 0)
764                 rc = LDD_F_SV_TYPE_OST;
765         else
766                 return -EINVAL;
767
768         dash += 3;
769
770         if (strncmp(dash, "all", 3) == 0) {
771                 if (endptr != NULL)
772                         *endptr = dash + 3;
773                 return rc | LDD_F_SV_ALL;
774         }
775
776         index = simple_strtoul(dash, (char **)endptr, 16);
777         if (idx != NULL)
778                 *idx = index;
779         return rc;
780 }
781 EXPORT_SYMBOL(target_name2index);
782
783 /* Get the index from the obd name.
784    rc = server type, or
785    rc < 0  on error
786    if endptr isn't NULL it is set to end of name */
787 int server_name2index(const char *svname, __u32 *idx, const char **endptr)
788 {
789         const char *dash;
790         int rc;
791
792         /* We use server_name2fsname() just for parsing */
793         rc = server_name2fsname(svname, NULL, &dash);
794         if (rc != 0)
795                 return rc;
796
797         dash++;
798         rc = target_name2index(dash, idx, endptr);
799         if (rc < 0)
800                 return rc;
801
802         /* Account for -mdc after index that is possible when specifying mdt */
803         if (endptr != NULL && strncmp(LUSTRE_MDC_NAME, *endptr + 1,
804                                       sizeof(LUSTRE_MDC_NAME)-1) == 0)
805                 *endptr += sizeof(LUSTRE_MDC_NAME);
806
807         return rc;
808 }
809 EXPORT_SYMBOL(server_name2index);
810
811 /*************** mount common betweeen server and client ***************/
812
813 /* Common umount */
814 int lustre_common_put_super(struct super_block *sb)
815 {
816         int rc;
817         ENTRY;
818
819         CDEBUG(D_MOUNT, "dropping sb %p\n", sb);
820
821         /* Drop a ref to the MGC */
822         rc = lustre_stop_mgc(sb);
823         if (rc && (rc != -ENOENT)) {
824                 if (rc != -EBUSY) {
825                         CERROR("Can't stop MGC: %d\n", rc);
826                         RETURN(rc);
827                 }
828                 /* BUSY just means that there's some other obd that
829                    needs the mgc.  Let him clean it up. */
830                 CDEBUG(D_MOUNT, "MGC still in use\n");
831         }
832         /* Drop a ref to the mounted disk */
833         lustre_put_lsi(sb);
834
835         RETURN(rc);
836 }
837 EXPORT_SYMBOL(lustre_common_put_super);
838
839 static void lmd_print(struct lustre_mount_data *lmd)
840 {
841         int i;
842
843         PRINT_CMD(D_MOUNT, "  mount data:\n");
844         if (lmd_is_client(lmd))
845                 PRINT_CMD(D_MOUNT, "profile: %s\n", lmd->lmd_profile);
846         PRINT_CMD(D_MOUNT, "device:  %s\n", lmd->lmd_dev);
847         PRINT_CMD(D_MOUNT, "flags:   %x\n", lmd->lmd_flags);
848
849         if (lmd->lmd_opts)
850                 PRINT_CMD(D_MOUNT, "options: %s\n", lmd->lmd_opts);
851
852         if (lmd->lmd_recovery_time_soft)
853                 PRINT_CMD(D_MOUNT, "recovery time soft: %d\n",
854                           lmd->lmd_recovery_time_soft);
855
856         if (lmd->lmd_recovery_time_hard)
857                 PRINT_CMD(D_MOUNT, "recovery time hard: %d\n",
858                           lmd->lmd_recovery_time_hard);
859
860         for (i = 0; i < lmd->lmd_exclude_count; i++) {
861                 PRINT_CMD(D_MOUNT, "exclude %d:  OST%04x\n", i,
862                           lmd->lmd_exclude[i]);
863         }
864 }
865
866 /* Is this server on the exclusion list */
867 int lustre_check_exclusion(struct super_block *sb, char *svname)
868 {
869         struct lustre_sb_info *lsi = s2lsi(sb);
870         struct lustre_mount_data *lmd = lsi->lsi_lmd;
871         __u32 index;
872         int i, rc;
873         ENTRY;
874
875         rc = server_name2index(svname, &index, NULL);
876         if (rc != LDD_F_SV_TYPE_OST)
877                 /* Only exclude OSTs */
878                 RETURN(0);
879
880         CDEBUG(D_MOUNT, "Check exclusion %s (%d) in %d of %s\n", svname,
881                index, lmd->lmd_exclude_count, lmd->lmd_dev);
882
883         for(i = 0; i < lmd->lmd_exclude_count; i++) {
884                 if (index == lmd->lmd_exclude[i]) {
885                         CWARN("Excluding %s (on exclusion list)\n", svname);
886                         RETURN(1);
887                 }
888         }
889         RETURN(0);
890 }
891
892 /* mount -v  -o exclude=lustre-OST0001:lustre-OST0002 -t lustre ... */
893 static int lmd_make_exclusion(struct lustre_mount_data *lmd, const char *ptr)
894 {
895         const char *s1 = ptr, *s2;
896         __u32 *exclude_list;
897         __u32 index = 0;
898         int rc = 0, devmax;
899         ENTRY;
900
901         /* The shortest an ost name can be is 8 chars: -OST0000.
902            We don't actually know the fsname at this time, so in fact
903            a user could specify any fsname. */
904         devmax = strlen(ptr) / 8 + 1;
905
906         /* temp storage until we figure out how many we have */
907         OBD_ALLOC(exclude_list, sizeof(index) * devmax);
908         if (!exclude_list)
909                 RETURN(-ENOMEM);
910
911         /* we enter this fn pointing at the '=' */
912         while (*s1 && *s1 != ' ' && *s1 != ',') {
913                 s1++;
914                 rc = server_name2index(s1, &index, &s2);
915                 if (rc < 0) {
916                         CERROR("Can't parse server name '%s': rc = %d\n",
917                                s1, rc);
918                         break;
919                 }
920                 if (rc == LDD_F_SV_TYPE_OST)
921                         exclude_list[lmd->lmd_exclude_count++] = index;
922                 else
923                         CDEBUG(D_MOUNT, "ignoring exclude %.*s: type = %#x\n",
924                                (uint)(s2-s1), s1, rc);
925                 s1 = s2;
926                 /* now we are pointing at ':' (next exclude)
927                    or ',' (end of excludes) */
928                 if (lmd->lmd_exclude_count >= devmax)
929                         break;
930         }
931         if (rc >= 0) /* non-err */
932                 rc = 0;
933
934         if (lmd->lmd_exclude_count) {
935                 /* permanent, freed in lustre_free_lsi */
936                 OBD_ALLOC(lmd->lmd_exclude, sizeof(index) *
937                           lmd->lmd_exclude_count);
938                 if (lmd->lmd_exclude) {
939                         memcpy(lmd->lmd_exclude, exclude_list,
940                                sizeof(index) * lmd->lmd_exclude_count);
941                 } else {
942                         rc = -ENOMEM;
943                         lmd->lmd_exclude_count = 0;
944                 }
945         }
946         OBD_FREE(exclude_list, sizeof(index) * devmax);
947         RETURN(rc);
948 }
949
950 static int lmd_parse_mgssec(struct lustre_mount_data *lmd, char *ptr)
951 {
952         char   *tail;
953         int     length;
954
955         if (lmd->lmd_mgssec != NULL) {
956                 OBD_FREE(lmd->lmd_mgssec, strlen(lmd->lmd_mgssec) + 1);
957                 lmd->lmd_mgssec = NULL;
958         }
959
960         tail = strchr(ptr, ',');
961         if (tail == NULL)
962                 length = strlen(ptr);
963         else
964                 length = tail - ptr;
965
966         OBD_ALLOC(lmd->lmd_mgssec, length + 1);
967         if (lmd->lmd_mgssec == NULL)
968                 return -ENOMEM;
969
970         memcpy(lmd->lmd_mgssec, ptr, length);
971         lmd->lmd_mgssec[length] = '\0';
972         return 0;
973 }
974
975 static int lmd_parse_string(char **handle, char *ptr)
976 {
977         char   *tail;
978         int     length;
979
980         if ((handle == NULL) || (ptr == NULL))
981                 return -EINVAL;
982
983         if (*handle != NULL) {
984                 OBD_FREE(*handle, strlen(*handle) + 1);
985                 *handle = NULL;
986         }
987
988         tail = strchr(ptr, ',');
989         if (tail == NULL)
990                 length = strlen(ptr);
991         else
992                 length = tail - ptr;
993
994         OBD_ALLOC(*handle, length + 1);
995         if (*handle == NULL)
996                 return -ENOMEM;
997
998         memcpy(*handle, ptr, length);
999         (*handle)[length] = '\0';
1000
1001         return 0;
1002 }
1003
1004 /* Collect multiple values for mgsnid specifiers */
1005 static int lmd_parse_mgs(struct lustre_mount_data *lmd, char **ptr)
1006 {
1007         lnet_nid_t nid;
1008         char *tail = *ptr;
1009         char *mgsnid;
1010         int   length;
1011         int   oldlen = 0;
1012
1013         /* Find end of nidlist */
1014         while (class_parse_nid_quiet(tail, &nid, &tail) == 0) {}
1015         length = tail - *ptr;
1016         if (length == 0) {
1017                 LCONSOLE_ERROR_MSG(0x159, "Can't parse NID '%s'\n", *ptr);
1018                 return -EINVAL;
1019         }
1020
1021         if (lmd->lmd_mgs != NULL)
1022                 oldlen = strlen(lmd->lmd_mgs) + 1;
1023
1024         OBD_ALLOC(mgsnid, oldlen + length + 1);
1025         if (mgsnid == NULL)
1026                 return -ENOMEM;
1027
1028         if (lmd->lmd_mgs != NULL) {
1029                 /* Multiple mgsnid= are taken to mean failover locations */
1030                 memcpy(mgsnid, lmd->lmd_mgs, oldlen);
1031                 mgsnid[oldlen - 1] = ':';
1032                 OBD_FREE(lmd->lmd_mgs, oldlen);
1033         }
1034         memcpy(mgsnid + oldlen, *ptr, length);
1035         mgsnid[oldlen + length] = '\0';
1036         lmd->lmd_mgs = mgsnid;
1037         *ptr = tail;
1038
1039         return 0;
1040 }
1041
1042 /**
1043  * Find the first comma delimiter from the specified \a buf and make \a *endh
1044  * point to the string starting with the comma. The commas in expression list
1045  * [...] will be skipped.
1046  *
1047  * \param[in] buf       a comma-separated string
1048  * \param[in] endh      a pointer to a pointer that will point to the string
1049  *                      starting with the comma
1050  *
1051  * \retval 0            if comma delimiter is found
1052  * \retval 1            if comma delimiter is not found
1053  */
1054 static int lmd_find_comma(char *buf, char **endh)
1055 {
1056         char *c = buf;
1057         int   skip = 0;
1058
1059         if (buf == NULL)
1060                 return 1;
1061
1062         while (*c != '\0') {
1063                 if (*c == '[')
1064                         skip++;
1065                 else if (*c == ']')
1066                         skip--;
1067
1068                 if (*c == ',' && skip == 0) {
1069                         if (endh != NULL)
1070                                 *endh = c;
1071                         return 0;
1072                 }
1073
1074                 c++;
1075         }
1076
1077         return 1;
1078 }
1079
1080 /**
1081  * Find the first valid string delimited by comma from the specified \a buf
1082  # and parse it to see whether it's a valid nid list. If yes, \a *endh will
1083  * point to the next string starting with the comma.
1084  *
1085  * \param[in] buf       a comma-separated string
1086  * \param[in] endh      a pointer to a pointer that will point to the string
1087  *                      starting with the comma
1088  *
1089  * \retval 0            if the string is a valid nid list
1090  * \retval 1            if the string is not a valid nid list
1091  */
1092 static int lmd_parse_nidlist(char *buf, char **endh)
1093 {
1094         struct list_head nidlist;
1095         char            *endp = buf;
1096         char             tmp;
1097         int              rc = 0;
1098
1099         if (buf == NULL)
1100                 return 1;
1101         while (*buf == ',' || *buf == ':')
1102                 buf++;
1103         if (*buf == ' ' || *buf == '/' || *buf == '\0')
1104                 return 1;
1105
1106         if (lmd_find_comma(buf, &endp) != 0)
1107                 endp = buf + strlen(buf);
1108
1109         tmp = *endp;
1110         *endp = '\0';
1111
1112         INIT_LIST_HEAD(&nidlist);
1113         if (cfs_parse_nidlist(buf, strlen(buf), &nidlist) <= 0)
1114                 rc = 1;
1115         cfs_free_nidlist(&nidlist);
1116
1117         *endp = tmp;
1118         if (rc != 0)
1119                 return rc;
1120         if (endh != NULL)
1121                 *endh = endp;
1122         return 0;
1123 }
1124
1125 /** Parse mount line options
1126  * e.g. mount -v -t lustre -o abort_recov uml1:uml2:/lustre-client /mnt/lustre
1127  * dev is passed as device=uml1:/lustre by mount.lustre
1128  */
1129 static int lmd_parse(char *options, struct lustre_mount_data *lmd)
1130 {
1131         char *s1, *s2, *s3, *devname = NULL;
1132         struct lustre_mount_data *raw = (struct lustre_mount_data *)options;
1133         int rc = 0;
1134         ENTRY;
1135
1136         LASSERT(lmd);
1137         if (!options) {
1138                 LCONSOLE_ERROR_MSG(0x162, "Missing mount data: check that "
1139                                    "/sbin/mount.lustre is installed.\n");
1140                 RETURN(-EINVAL);
1141         }
1142
1143         /* Options should be a string - try to detect old lmd data */
1144         if ((raw->lmd_magic & 0xffffff00) == (LMD_MAGIC & 0xffffff00)) {
1145                 LCONSOLE_ERROR_MSG(0x163, "You're using an old version of "
1146                                    "/sbin/mount.lustre.  Please install "
1147                                    "version %s\n", LUSTRE_VERSION_STRING);
1148                 RETURN(-EINVAL);
1149         }
1150         lmd->lmd_magic = LMD_MAGIC;
1151
1152         OBD_ALLOC(lmd->lmd_params, LMD_PARAMS_MAXLEN);
1153         if (lmd->lmd_params == NULL)
1154                 RETURN(-ENOMEM);
1155         lmd->lmd_params[0] = '\0';
1156
1157         /* Set default flags here */
1158
1159         s1 = options;
1160         while (*s1) {
1161                 int clear = 0;
1162                 int time_min = OBD_RECOVERY_TIME_MIN;
1163
1164                 /* Skip whitespace and extra commas */
1165                 while (*s1 == ' ' || *s1 == ',')
1166                         s1++;
1167                 s3 = s1;
1168
1169                 /* Client options are parsed in ll_options: eg. flock,
1170                    user_xattr, acl */
1171
1172                 /* Parse non-ldiskfs options here. Rather than modifying
1173                    ldiskfs, we just zero these out here */
1174                 if (strncmp(s1, "abort_recov", 11) == 0) {
1175                         lmd->lmd_flags |= LMD_FLG_ABORT_RECOV;
1176                         clear++;
1177                 } else if (strncmp(s1, "recovery_time_soft=", 19) == 0) {
1178                         lmd->lmd_recovery_time_soft = max_t(int,
1179                                 simple_strtoul(s1 + 19, NULL, 10), time_min);
1180                         clear++;
1181                 } else if (strncmp(s1, "recovery_time_hard=", 19) == 0) {
1182                         lmd->lmd_recovery_time_hard = max_t(int,
1183                                 simple_strtoul(s1 + 19, NULL, 10), time_min);
1184                         clear++;
1185                 } else if (strncmp(s1, "noir", 4) == 0) {
1186                         lmd->lmd_flags |= LMD_FLG_NOIR; /* test purpose only. */
1187                         clear++;
1188                 } else if (strncmp(s1, "nosvc", 5) == 0) {
1189                         lmd->lmd_flags |= LMD_FLG_NOSVC;
1190                         clear++;
1191                 } else if (strncmp(s1, "nomgs", 5) == 0) {
1192                         lmd->lmd_flags |= LMD_FLG_NOMGS;
1193                         clear++;
1194                 } else if (strncmp(s1, "noscrub", 7) == 0) {
1195                         lmd->lmd_flags |= LMD_FLG_NOSCRUB;
1196                         clear++;
1197                 } else if (strncmp(s1, "skip_lfsck", 10) == 0) {
1198                         lmd->lmd_flags |= LMD_FLG_SKIP_LFSCK;
1199                         clear++;
1200                 } else if (strncmp(s1, PARAM_MGSNODE,
1201                                    sizeof(PARAM_MGSNODE) - 1) == 0) {
1202                         s2 = s1 + sizeof(PARAM_MGSNODE) - 1;
1203                         /* Assume the next mount opt is the first
1204                            invalid nid we get to. */
1205                         rc = lmd_parse_mgs(lmd, &s2);
1206                         if (rc)
1207                                 goto invalid;
1208                         s3 = s2;
1209                         clear++;
1210                 } else if (strncmp(s1, "writeconf", 9) == 0) {
1211                         lmd->lmd_flags |= LMD_FLG_WRITECONF;
1212                         clear++;
1213                 } else if (strncmp(s1, "update", 6) == 0) {
1214                         lmd->lmd_flags |= LMD_FLG_UPDATE;
1215                         clear++;
1216                 } else if (strncmp(s1, "virgin", 6) == 0) {
1217                         lmd->lmd_flags |= LMD_FLG_VIRGIN;
1218                         clear++;
1219                 } else if (strncmp(s1, "noprimnode", 10) == 0) {
1220                         lmd->lmd_flags |= LMD_FLG_NO_PRIMNODE;
1221                         clear++;
1222                 } else if (strncmp(s1, "mgssec=", 7) == 0) {
1223                         rc = lmd_parse_mgssec(lmd, s1 + 7);
1224                         if (rc)
1225                                 goto invalid;
1226                         clear++;
1227                 /* ost exclusion list */
1228                 } else if (strncmp(s1, "exclude=", 8) == 0) {
1229                         rc = lmd_make_exclusion(lmd, s1 + 7);
1230                         if (rc)
1231                                 goto invalid;
1232                         clear++;
1233                 } else if (strncmp(s1, "mgs", 3) == 0) {
1234                         /* We are an MGS */
1235                         lmd->lmd_flags |= LMD_FLG_MGS;
1236                         clear++;
1237                 } else if (strncmp(s1, "svname=", 7) == 0) {
1238                         rc = lmd_parse_string(&lmd->lmd_profile, s1 + 7);
1239                         if (rc)
1240                                 goto invalid;
1241                         clear++;
1242                 } else if (strncmp(s1, "param=", 6) == 0) {
1243                         size_t length, params_length;
1244                         char  *tail = s1;
1245                         if (lmd_find_comma(s1 + 6, &tail) != 0)
1246                                 length = strlen(s1);
1247                         else {
1248                                 char *param_str = tail + 1;
1249                                 int   supplementary = 1;
1250                                 while (lmd_parse_nidlist(param_str,
1251                                                          &param_str) == 0) {
1252                                         supplementary = 0;
1253                                 }
1254                                 length = param_str - s1 - supplementary;
1255                         }
1256                         length -= 6;
1257                         params_length = strlen(lmd->lmd_params);
1258                         if (params_length + length + 1 >= LMD_PARAMS_MAXLEN)
1259                                 RETURN(-E2BIG);
1260                         strncat(lmd->lmd_params, s1 + 6, length);
1261                         lmd->lmd_params[params_length + length] = '\0';
1262                         strlcat(lmd->lmd_params, " ", LMD_PARAMS_MAXLEN);
1263                         s3 = s1 + 6 + length;
1264                         clear++;
1265                 } else if (strncmp(s1, "osd=", 4) == 0) {
1266                         rc = lmd_parse_string(&lmd->lmd_osd_type, s1 + 4);
1267                         if (rc)
1268                                 goto invalid;
1269                         clear++;
1270                 }
1271                 /* Linux 2.4 doesn't pass the device, so we stuck it at the
1272                    end of the options. */
1273                 else if (strncmp(s1, "device=", 7) == 0) {
1274                         devname = s1 + 7;
1275                         /* terminate options right before device.  device
1276                            must be the last one. */
1277                         *s1 = '\0';
1278                         break;
1279                 }
1280
1281                 /* Find next opt */
1282                 s2 = strchr(s3, ',');
1283                 if (s2 == NULL) {
1284                         if (clear)
1285                                 *s1 = '\0';
1286                         break;
1287                 }
1288                 s2++;
1289                 if (clear)
1290                         memmove(s1, s2, strlen(s2) + 1);
1291                 else
1292                         s1 = s2;
1293         }
1294
1295         if (!devname) {
1296                 LCONSOLE_ERROR_MSG(0x164, "Can't find the device name "
1297                                    "(need mount option 'device=...')\n");
1298                 goto invalid;
1299         }
1300
1301         s1 = strstr(devname, ":/");
1302         if (s1) {
1303                 ++s1;
1304                 lmd->lmd_flags |= LMD_FLG_CLIENT;
1305                 /* Remove leading /s from fsname */
1306                 while (*++s1 == '/') ;
1307                 /* Freed in lustre_free_lsi */
1308                 OBD_ALLOC(lmd->lmd_profile, strlen(s1) + 8);
1309                 if (!lmd->lmd_profile)
1310                         RETURN(-ENOMEM);
1311                 sprintf(lmd->lmd_profile, "%s-client", s1);
1312         }
1313
1314         /* Freed in lustre_free_lsi */
1315         OBD_ALLOC(lmd->lmd_dev, strlen(devname) + 1);
1316         if (!lmd->lmd_dev)
1317                 RETURN(-ENOMEM);
1318         strcpy(lmd->lmd_dev, devname);
1319
1320         /* Save mount options */
1321         s1 = options + strlen(options) - 1;
1322         while (s1 >= options && (*s1 == ',' || *s1 == ' '))
1323                 *s1-- = 0;
1324         if (*options != 0) {
1325                 /* Freed in lustre_free_lsi */
1326                 OBD_ALLOC(lmd->lmd_opts, strlen(options) + 1);
1327                 if (!lmd->lmd_opts)
1328                         RETURN(-ENOMEM);
1329                 strcpy(lmd->lmd_opts, options);
1330         }
1331
1332         lmd_print(lmd);
1333         lmd->lmd_magic = LMD_MAGIC;
1334
1335         RETURN(rc);
1336
1337 invalid:
1338         CERROR("Bad mount options %s\n", options);
1339         RETURN(-EINVAL);
1340 }
1341
1342 struct lustre_mount_data2 {
1343         void *lmd2_data;
1344         struct vfsmount *lmd2_mnt;
1345 };
1346
1347 /** This is the entry point for the mount call into Lustre.
1348  * This is called when a server or client is mounted,
1349  * and this is where we start setting things up.
1350  * @param data Mount options (e.g. -o flock,abort_recov)
1351  */
1352 static int lustre_fill_super(struct super_block *sb, void *data, int silent)
1353 {
1354         struct lustre_mount_data *lmd;
1355         struct lustre_mount_data2 *lmd2 = data;
1356         struct lustre_sb_info *lsi;
1357         int rc;
1358         ENTRY;
1359
1360         CDEBUG(D_MOUNT|D_VFSTRACE, "VFS Op: sb %p\n", sb);
1361
1362         lsi = lustre_init_lsi(sb);
1363         if (!lsi)
1364                 RETURN(-ENOMEM);
1365         lmd = lsi->lsi_lmd;
1366
1367         /*
1368          * Disable lockdep during mount, because mount locking patterns are
1369          * `special'.
1370          */
1371         lockdep_off();
1372
1373         /*
1374          * LU-639: the obd cleanup of last mount may not finish yet, wait here.
1375          */
1376         obd_zombie_barrier();
1377
1378         /* Figure out the lmd from the mount options */
1379         if (lmd_parse((char *)(lmd2->lmd2_data), lmd)) {
1380                 lustre_put_lsi(sb);
1381                 GOTO(out, rc = -EINVAL);
1382         }
1383
1384         if (lmd_is_client(lmd)) {
1385                 CDEBUG(D_MOUNT, "Mounting client %s\n", lmd->lmd_profile);
1386                 if (client_fill_super == NULL)
1387                         request_module("lustre");
1388                 if (client_fill_super == NULL) {
1389                         LCONSOLE_ERROR_MSG(0x165, "Nothing registered for "
1390                                            "client mount! Is the 'lustre' "
1391                                            "module loaded?\n");
1392                         lustre_put_lsi(sb);
1393                         rc = -ENODEV;
1394                 } else {
1395                         rc = lustre_start_mgc(sb);
1396                         if (rc) {
1397                                 lustre_put_lsi(sb);
1398                                 GOTO(out, rc);
1399                         }
1400                         /* Connect and start */
1401                         /* (should always be ll_fill_super) */
1402                         rc = (*client_fill_super)(sb, lmd2->lmd2_mnt);
1403                         /* c_f_s will call lustre_common_put_super on failure */
1404                 }
1405         } else {
1406 #ifdef HAVE_SERVER_SUPPORT
1407                 CDEBUG(D_MOUNT, "Mounting server from %s\n", lmd->lmd_dev);
1408                 rc = server_fill_super(sb);
1409                 /* s_f_s calls lustre_start_mgc after the mount because we need
1410                    the MGS nids which are stored on disk.  Plus, we may
1411                    need to start the MGS first. */
1412                 /* s_f_s will call server_put_super on failure */
1413 #else
1414                 CERROR("This is client-side-only module, "
1415                        "cannot handle server mount.\n");
1416                 rc = -EINVAL;
1417 #endif
1418         }
1419
1420         /* If error happens in fill_super() call, @lsi will be killed there.
1421          * This is why we do not put it here. */
1422         GOTO(out, rc);
1423 out:
1424         if (rc) {
1425                 CERROR("Unable to mount %s (%d)\n",
1426                        s2lsi(sb) ? lmd->lmd_dev : "", rc);
1427         } else {
1428                 CDEBUG(D_SUPER, "Mount %s complete\n",
1429                        lmd->lmd_dev);
1430         }
1431         lockdep_on();
1432         return rc;
1433 }
1434
1435
1436 /* We can't call ll_fill_super by name because it lives in a module that
1437    must be loaded after this one. */
1438 void lustre_register_client_fill_super(int (*cfs)(struct super_block *sb,
1439                                                   struct vfsmount *mnt))
1440 {
1441         client_fill_super = cfs;
1442 }
1443 EXPORT_SYMBOL(lustre_register_client_fill_super);
1444
1445 void lustre_register_kill_super_cb(void (*cfs)(struct super_block *sb))
1446 {
1447         kill_super_cb = cfs;
1448 }
1449 EXPORT_SYMBOL(lustre_register_kill_super_cb);
1450
1451 /***************** FS registration ******************/
1452 #ifdef HAVE_FSTYPE_MOUNT
1453 static struct dentry *lustre_mount(struct file_system_type *fs_type, int flags,
1454                                    const char *devname, void *data)
1455 {
1456         struct lustre_mount_data2 lmd2 = { data, NULL };
1457
1458         return mount_nodev(fs_type, flags, &lmd2, lustre_fill_super);
1459 }
1460 #else
1461 static int lustre_get_sb(struct file_system_type *fs_type, int flags,
1462                          const char *devname, void *data, struct vfsmount *mnt)
1463 {
1464         struct lustre_mount_data2 lmd2 = { data, mnt };
1465
1466         return get_sb_nodev(fs_type, flags, &lmd2, lustre_fill_super, mnt);
1467 }
1468 #endif
1469
1470 static void lustre_kill_super(struct super_block *sb)
1471 {
1472         struct lustre_sb_info *lsi = s2lsi(sb);
1473
1474         if (kill_super_cb && lsi && !IS_SERVER(lsi))
1475                 (*kill_super_cb)(sb);
1476
1477         kill_anon_super(sb);
1478 }
1479
1480 /** Register the "lustre" fs type
1481  */
1482 static struct file_system_type lustre_fs_type = {
1483         .owner        = THIS_MODULE,
1484         .name         = "lustre",
1485 #ifdef HAVE_FSTYPE_MOUNT
1486         .mount        = lustre_mount,
1487 #else
1488         .get_sb       = lustre_get_sb,
1489 #endif
1490         .kill_sb      = lustre_kill_super,
1491         .fs_flags     = FS_REQUIRES_DEV | FS_HAS_FIEMAP | FS_RENAME_DOES_D_MOVE,
1492 };
1493 MODULE_ALIAS_FS("lustre");
1494
1495 int lustre_register_fs(void)
1496 {
1497         return register_filesystem(&lustre_fs_type);
1498 }
1499
1500 int lustre_unregister_fs(void)
1501 {
1502         return unregister_filesystem(&lustre_fs_type);
1503 }