Whamcloud - gitweb
LU-9019 libcfs: remove cfs_time_XXX_64 wrappers
[fs/lustre-release.git] / lustre / obdclass / obd_mount.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2011, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/obdclass/obd_mount.c
33  *
34  * Client mount routines
35  *
36  * Author: Nathan Rutman <nathan@clusterfs.com>
37  */
38
39
40 #define DEBUG_SUBSYSTEM S_CLASS
41 #define D_MOUNT (D_SUPER|D_CONFIG/*|D_WARNING */)
42 #define PRINT_CMD CDEBUG
43
44 #include <obd.h>
45 #include <obd_class.h>
46 #include <linux/version.h>
47 #include <lustre_log.h>
48 #include <lustre_disk.h>
49 #include <uapi/linux/lustre/lustre_param.h>
50
51 static int (*client_fill_super)(struct super_block *sb,
52                                 struct vfsmount *mnt);
53
54 static void (*kill_super_cb)(struct super_block *sb);
55
56 /**************** config llog ********************/
57
58 /** Get a config log from the MGS and process it.
59  * This func is called for both clients and servers.
60  * Continue to process new statements appended to the logs
61  * (whenever the config lock is revoked) until lustre_end_log
62  * is called.
63  * @param sb The superblock is used by the MGC to write to the local copy of
64  *   the config log
65  * @param logname The name of the llog to replicate from the MGS
66  * @param cfg Since the same mgc may be used to follow multiple config logs
67  *   (e.g. ost1, ost2, client), the config_llog_instance keeps the state for
68  *   this log, and is added to the mgc's list of logs to follow.
69  */
70 int lustre_process_log(struct super_block *sb, char *logname,
71                      struct config_llog_instance *cfg)
72 {
73         struct lustre_cfg *lcfg;
74         struct lustre_cfg_bufs *bufs;
75         struct lustre_sb_info *lsi = s2lsi(sb);
76         struct obd_device *mgc = lsi->lsi_mgc;
77         int rc;
78         ENTRY;
79
80         LASSERT(mgc);
81         LASSERT(cfg);
82
83         OBD_ALLOC_PTR(bufs);
84         if (bufs == NULL)
85                 RETURN(-ENOMEM);
86
87         /* mgc_process_config */
88         lustre_cfg_bufs_reset(bufs, mgc->obd_name);
89         lustre_cfg_bufs_set_string(bufs, 1, logname);
90         lustre_cfg_bufs_set(bufs, 2, cfg, sizeof(*cfg));
91         lustre_cfg_bufs_set(bufs, 3, &sb, sizeof(sb));
92         OBD_ALLOC(lcfg, lustre_cfg_len(bufs->lcfg_bufcount, bufs->lcfg_buflen));
93         if (!lcfg)
94                 GOTO(out, rc = -ENOMEM);
95         lustre_cfg_init(lcfg, LCFG_LOG_START, bufs);
96
97         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
98         OBD_FREE(lcfg, lustre_cfg_len(lcfg->lcfg_bufcount, lcfg->lcfg_buflens));
99 out:
100         OBD_FREE_PTR(bufs);
101
102         if (rc == -EINVAL)
103                 LCONSOLE_ERROR_MSG(0x15b, "%s: The configuration from log '%s'"
104                                    "failed from the MGS (%d).  Make sure this "
105                                    "client and the MGS are running compatible "
106                                    "versions of Lustre.\n",
107                                    mgc->obd_name, logname, rc);
108         else if (rc != 0)
109                 LCONSOLE_ERROR_MSG(0x15c, "%s: The configuration from log '%s' "
110                                    "failed (%d). This may be the result of "
111                                    "communication errors between this node and "
112                                    "the MGS, a bad configuration, or other "
113                                    "errors. See the syslog for more "
114                                    "information.\n", mgc->obd_name, logname,
115                                    rc);
116
117         /* class_obd_list(); */
118         RETURN(rc);
119 }
120 EXPORT_SYMBOL(lustre_process_log);
121
122 /* Stop watching this config log for updates */
123 int lustre_end_log(struct super_block *sb, char *logname,
124                        struct config_llog_instance *cfg)
125 {
126         struct lustre_cfg *lcfg;
127         struct lustre_cfg_bufs bufs;
128         struct lustre_sb_info *lsi = s2lsi(sb);
129         struct obd_device *mgc = lsi->lsi_mgc;
130         int rc;
131         ENTRY;
132
133         if (!mgc)
134                 RETURN(-ENOENT);
135
136         /* mgc_process_config */
137         lustre_cfg_bufs_reset(&bufs, mgc->obd_name);
138         lustre_cfg_bufs_set_string(&bufs, 1, logname);
139         if (cfg)
140                 lustre_cfg_bufs_set(&bufs, 2, cfg, sizeof(*cfg));
141         OBD_ALLOC(lcfg, lustre_cfg_len(bufs.lcfg_bufcount, bufs.lcfg_buflen));
142         if (!lcfg)
143                 RETURN(-ENOMEM);
144         lustre_cfg_init(lcfg, LCFG_LOG_END, &bufs);
145         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
146         OBD_FREE(lcfg, lustre_cfg_len(lcfg->lcfg_bufcount, lcfg->lcfg_buflens));
147         RETURN(rc);
148 }
149 EXPORT_SYMBOL(lustre_end_log);
150
151 /**************** obd start *******************/
152
153 /** lustre_cfg_bufs are a holdover from 1.4; we can still set these up from
154  * lctl (and do for echo cli/srv.
155  */
156 static int do_lcfg(char *cfgname, lnet_nid_t nid, int cmd,
157                    char *s1, char *s2, char *s3, char *s4)
158 {
159         struct lustre_cfg_bufs bufs;
160         struct lustre_cfg *lcfg = NULL;
161         int rc;
162
163         CDEBUG(D_TRACE, "lcfg %s %#x %s %s %s %s\n", cfgname,
164                cmd, s1, s2, s3, s4);
165
166         lustre_cfg_bufs_reset(&bufs, cfgname);
167         if (s1)
168                 lustre_cfg_bufs_set_string(&bufs, 1, s1);
169         if (s2)
170                 lustre_cfg_bufs_set_string(&bufs, 2, s2);
171         if (s3)
172                 lustre_cfg_bufs_set_string(&bufs, 3, s3);
173         if (s4)
174                 lustre_cfg_bufs_set_string(&bufs, 4, s4);
175
176         OBD_ALLOC(lcfg, lustre_cfg_len(bufs.lcfg_bufcount, bufs.lcfg_buflen));
177         if (!lcfg)
178                 return -ENOMEM;
179         lustre_cfg_init(lcfg, cmd, &bufs);
180         lcfg->lcfg_nid = nid;
181         rc = class_process_config(lcfg);
182         OBD_FREE(lcfg, lustre_cfg_len(lcfg->lcfg_bufcount, lcfg->lcfg_buflens));
183         return rc;
184 }
185
186 /** Call class_attach and class_setup.  These methods in turn call
187  * obd type-specific methods.
188  */
189 int lustre_start_simple(char *obdname, char *type, char *uuid,
190                         char *s1, char *s2, char *s3, char *s4)
191 {
192         int rc;
193         CDEBUG(D_MOUNT, "Starting obd %s (typ=%s)\n", obdname, type);
194
195         rc = do_lcfg(obdname, 0, LCFG_ATTACH, type, uuid, NULL, NULL);
196         if (rc) {
197                 CERROR("%s attach error %d\n", obdname, rc);
198                 return rc;
199         }
200         rc = do_lcfg(obdname, 0, LCFG_SETUP, s1, s2, s3, s4);
201         if (rc) {
202                 CERROR("%s setup error %d\n", obdname, rc);
203                 do_lcfg(obdname, 0, LCFG_DETACH, NULL, NULL, NULL, NULL);
204         }
205         return rc;
206 }
207
208 static DEFINE_MUTEX(mgc_start_lock);
209
210 /** Set up a mgc obd to process startup logs
211  *
212  * \param sb [in] super block of the mgc obd
213  *
214  * \retval 0 success, otherwise error code
215  */
216 int lustre_start_mgc(struct super_block *sb)
217 {
218         struct obd_connect_data *data = NULL;
219         struct lustre_sb_info *lsi = s2lsi(sb);
220         struct obd_device *obd;
221         struct obd_export *exp;
222         struct obd_uuid *uuid = NULL;
223         class_uuid_t uuidc;
224         lnet_nid_t nid;
225         char nidstr[LNET_NIDSTR_SIZE];
226         char *mgcname = NULL, *niduuid = NULL, *mgssec = NULL;
227         char *ptr;
228         int rc = 0, i = 0, j;
229         size_t len;
230         ENTRY;
231
232         LASSERT(lsi->lsi_lmd);
233
234         /* Find the first non-lo MGS nid for our MGC name */
235         if (IS_SERVER(lsi)) {
236                 /* mount -o mgsnode=nid */
237                 ptr = lsi->lsi_lmd->lmd_mgs;
238                 if (lsi->lsi_lmd->lmd_mgs &&
239                     (class_parse_nid(lsi->lsi_lmd->lmd_mgs, &nid, &ptr) == 0)) {
240                         i++;
241                 } else if (IS_MGS(lsi)) {
242                         struct lnet_process_id id;
243
244                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
245                                 if (LNET_NETTYP(LNET_NIDNET(id.nid)) == LOLND)
246                                         continue;
247                                 nid = id.nid;
248                                 i++;
249                                 break;
250                         }
251                 }
252         } else { /* client */
253                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
254                 ptr = lsi->lsi_lmd->lmd_dev;
255                 if (class_parse_nid(ptr, &nid, &ptr) == 0)
256                         i++;
257         }
258         if (i == 0) {
259                 CERROR("No valid MGS nids found.\n");
260                 RETURN(-EINVAL);
261         }
262
263         mutex_lock(&mgc_start_lock);
264
265         libcfs_nid2str_r(nid, nidstr, sizeof(nidstr));
266         len = strlen(LUSTRE_MGC_OBDNAME) + strlen(nidstr) + 1;
267         OBD_ALLOC(mgcname, len);
268         OBD_ALLOC(niduuid, len + 2);
269         if (mgcname == NULL || niduuid == NULL)
270                 GOTO(out_free, rc = -ENOMEM);
271         snprintf(mgcname, len, "%s%s", LUSTRE_MGC_OBDNAME, nidstr);
272
273         mgssec = lsi->lsi_lmd->lmd_mgssec ? lsi->lsi_lmd->lmd_mgssec : "";
274
275         OBD_ALLOC_PTR(data);
276         if (data == NULL)
277                 GOTO(out_free, rc = -ENOMEM);
278
279         obd = class_name2obd(mgcname);
280         if (obd && !obd->obd_stopping) {
281                 int recov_bk;
282
283                 rc = obd_set_info_async(NULL, obd->obd_self_export,
284                                         strlen(KEY_MGSSEC), KEY_MGSSEC,
285                                         strlen(mgssec), mgssec, NULL);
286                 if (rc)
287                         GOTO(out_free, rc);
288
289                 /* Re-using an existing MGC */
290                 atomic_inc(&obd->u.cli.cl_mgc_refcount);
291
292                 /* IR compatibility check, only for clients */
293                 if (lmd_is_client(lsi->lsi_lmd)) {
294                         int has_ir;
295                         int vallen = sizeof(*data);
296                         __u32 *flags = &lsi->lsi_lmd->lmd_flags;
297
298                         rc = obd_get_info(NULL, obd->obd_self_export,
299                                           strlen(KEY_CONN_DATA), KEY_CONN_DATA,
300                                           &vallen, data);
301                         LASSERT(rc == 0);
302                         has_ir = OCD_HAS_FLAG(data, IMP_RECOV);
303                         if (has_ir ^ !(*flags & LMD_FLG_NOIR)) {
304                                 /* LMD_FLG_NOIR is for test purpose only */
305                                 LCONSOLE_WARN(
306                                     "Trying to mount a client with IR setting "
307                                     "not compatible with current mgc. "
308                                     "Force to use current mgc setting that is "
309                                     "IR %s.\n",
310                                     has_ir ? "enabled" : "disabled");
311                                 if (has_ir)
312                                         *flags &= ~LMD_FLG_NOIR;
313                                 else
314                                         *flags |= LMD_FLG_NOIR;
315                         }
316                 }
317
318                 recov_bk = 0;
319                 /* If we are restarting the MGS, don't try to keep the MGC's
320                    old connection, or registration will fail. */
321                 if (IS_MGS(lsi)) {
322                         CDEBUG(D_MOUNT, "New MGS with live MGC\n");
323                         recov_bk = 1;
324                 }
325
326                 /* Try all connections, but only once (again).
327                    We don't want to block another target from starting
328                    (using its local copy of the log), but we do want to connect
329                    if at all possible. */
330                 recov_bk++;
331                 CDEBUG(D_MOUNT, "%s: Set MGC reconnect %d\n", mgcname,recov_bk);
332                 rc = obd_set_info_async(NULL, obd->obd_self_export,
333                                         sizeof(KEY_INIT_RECOV_BACKUP),
334                                         KEY_INIT_RECOV_BACKUP,
335                                         sizeof(recov_bk), &recov_bk, NULL);
336                 GOTO(out, rc = 0);
337         }
338
339         CDEBUG(D_MOUNT, "Start MGC '%s'\n", mgcname);
340
341         /* Add the primary nids for the MGS */
342         i = 0;
343         snprintf(niduuid, len + 2, "%s_%x", mgcname, i);
344         if (IS_SERVER(lsi)) {
345                 ptr = lsi->lsi_lmd->lmd_mgs;
346                 CDEBUG(D_MOUNT, "mgs nids %s.\n", ptr);
347                 if (IS_MGS(lsi)) {
348                         /* Use local nids (including LO) */
349                         struct lnet_process_id id;
350
351                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
352                                 rc = do_lcfg(mgcname, id.nid, LCFG_ADD_UUID,
353                                              niduuid, NULL, NULL, NULL);
354                         }
355                 } else {
356                         /* Use mgsnode= nids */
357                         /* mount -o mgsnode=nid */
358                         if (lsi->lsi_lmd->lmd_mgs) {
359                                 ptr = lsi->lsi_lmd->lmd_mgs;
360                         } else if (class_find_param(ptr, PARAM_MGSNODE,
361                                                     &ptr) != 0) {
362                                 CERROR("No MGS nids given.\n");
363                                 GOTO(out_free, rc = -EINVAL);
364                         }
365                         /*
366                          * Add primary MGS nid(s).
367                          * Multiple nids on one MGS node are separated
368                          * by commas.
369                          */
370                         while (class_parse_nid(ptr, &nid, &ptr) == 0) {
371                                 rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
372                                              niduuid, NULL, NULL, NULL);
373                                 if (rc == 0)
374                                         ++i;
375                                 /* Stop at the first failover nid */
376                                 if (*ptr == ':')
377                                         break;
378                         }
379                 }
380         } else { /* client */
381                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
382                 ptr = lsi->lsi_lmd->lmd_dev;
383                 while (class_parse_nid(ptr, &nid, &ptr) == 0) {
384                         rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
385                                      niduuid, NULL, NULL, NULL);
386                         if (rc == 0)
387                                 ++i;
388                         /* Stop at the first failover nid */
389                         if (*ptr == ':')
390                                 break;
391                 }
392         }
393         if (i == 0) {
394                 CERROR("No valid MGS nids found.\n");
395                 GOTO(out_free, rc = -EINVAL);
396         }
397         lsi->lsi_lmd->lmd_mgs_failnodes = 1;
398
399         /* Random uuid for MGC allows easier reconnects */
400         OBD_ALLOC_PTR(uuid);
401         if (uuid == NULL)
402                 GOTO(out_free, rc = -ENOMEM);
403
404         ll_generate_random_uuid(uuidc);
405         class_uuid_unparse(uuidc, uuid);
406
407         /* Start the MGC */
408         rc = lustre_start_simple(mgcname, LUSTRE_MGC_NAME,
409                                  (char *)uuid->uuid, LUSTRE_MGS_OBDNAME,
410                                  niduuid, NULL, NULL);
411         if (rc)
412                 GOTO(out_free, rc);
413
414         /* Add any failover MGS nids */
415         i = 1;
416         while (ptr && ((*ptr == ':' ||
417                class_find_param(ptr, PARAM_MGSNODE, &ptr) == 0))) {
418                 /* New failover node */
419                 sprintf(niduuid, "%s_%x", mgcname, i);
420                 j = 0;
421                 while (class_parse_nid_quiet(ptr, &nid, &ptr) == 0) {
422                         rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
423                                      niduuid, NULL, NULL, NULL);
424                         if (rc == 0)
425                                 ++j;
426                         if (*ptr == ':')
427                                 break;
428                 }
429                 if (j > 0) {
430                         rc = do_lcfg(mgcname, 0, LCFG_ADD_CONN,
431                                      niduuid, NULL, NULL, NULL);
432                         if (rc == 0)
433                                 ++i;
434                 } else {
435                         /* at ":/fsname" */
436                         break;
437                 }
438         }
439         lsi->lsi_lmd->lmd_mgs_failnodes = i;
440
441         obd = class_name2obd(mgcname);
442         if (!obd) {
443                 CERROR("Can't find mgcobd %s\n", mgcname);
444                 GOTO(out_free, rc = -ENOTCONN);
445         }
446
447         rc = obd_set_info_async(NULL, obd->obd_self_export,
448                                 strlen(KEY_MGSSEC), KEY_MGSSEC,
449                                 strlen(mgssec), mgssec, NULL);
450         if (rc)
451                 GOTO(out_free, rc);
452
453         /* Keep a refcount of servers/clients who started with "mount",
454            so we know when we can get rid of the mgc. */
455         atomic_set(&obd->u.cli.cl_mgc_refcount, 1);
456
457         /* We connect to the MGS at setup, and don't disconnect until cleanup */
458         data->ocd_connect_flags = OBD_CONNECT_VERSION | OBD_CONNECT_AT |
459                                   OBD_CONNECT_FULL20 | OBD_CONNECT_IMP_RECOV |
460                                   OBD_CONNECT_LVB_TYPE |
461                                   OBD_CONNECT_BULK_MBITS | OBD_CONNECT_BARRIER;
462
463 #if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(3, 0, 53, 0)
464         data->ocd_connect_flags |= OBD_CONNECT_MNE_SWAB;
465 #endif
466
467         if (lmd_is_client(lsi->lsi_lmd) &&
468             lsi->lsi_lmd->lmd_flags & LMD_FLG_NOIR)
469                 data->ocd_connect_flags &= ~OBD_CONNECT_IMP_RECOV;
470         data->ocd_version = LUSTRE_VERSION_CODE;
471         rc = obd_connect(NULL, &exp, obd, uuid, data, NULL);
472         if (rc) {
473                 CERROR("connect failed %d\n", rc);
474                 GOTO(out, rc);
475         }
476
477         obd->u.cli.cl_mgc_mgsexp = exp;
478
479 out:
480         /* Keep the mgc info in the sb. Note that many lsi's can point
481            to the same mgc.*/
482         lsi->lsi_mgc = obd;
483 out_free:
484         mutex_unlock(&mgc_start_lock);
485
486         if (uuid)
487                 OBD_FREE_PTR(uuid);
488         if (data)
489                 OBD_FREE_PTR(data);
490         if (mgcname)
491                 OBD_FREE(mgcname, len);
492         if (niduuid)
493                 OBD_FREE(niduuid, len + 2);
494         RETURN(rc);
495 }
496
497 static int lustre_stop_mgc(struct super_block *sb)
498 {
499         struct lustre_sb_info *lsi = s2lsi(sb);
500         struct obd_device *obd;
501         char *niduuid = NULL, *ptr = NULL;
502         int i, rc = 0, len = 0;
503         ENTRY;
504
505         if (!lsi)
506                 RETURN(-ENOENT);
507         obd = lsi->lsi_mgc;
508         if (!obd)
509                 RETURN(-ENOENT);
510         lsi->lsi_mgc = NULL;
511
512         mutex_lock(&mgc_start_lock);
513         LASSERT(atomic_read(&obd->u.cli.cl_mgc_refcount) > 0);
514         if (!atomic_dec_and_test(&obd->u.cli.cl_mgc_refcount)) {
515                 /* This is not fatal, every client that stops
516                    will call in here. */
517                 CDEBUG(D_MOUNT, "mgc still has %d references.\n",
518                        atomic_read(&obd->u.cli.cl_mgc_refcount));
519                 GOTO(out, rc = -EBUSY);
520         }
521
522         /* The MGC has no recoverable data in any case.
523          * force shotdown set in umount_begin */
524         obd->obd_no_recov = 1;
525
526         if (obd->u.cli.cl_mgc_mgsexp) {
527                 /* An error is not fatal, if we are unable to send the
528                    disconnect mgs ping evictor cleans up the export */
529                 rc = obd_disconnect(obd->u.cli.cl_mgc_mgsexp);
530                 if (rc)
531                         CDEBUG(D_MOUNT, "disconnect failed %d\n", rc);
532         }
533
534         /* Save the obdname for cleaning the nid uuids, which are
535            obdname_XX */
536         len = strlen(obd->obd_name) + 6;
537         OBD_ALLOC(niduuid, len);
538         if (niduuid) {
539                 strcpy(niduuid, obd->obd_name);
540                 ptr = niduuid + strlen(niduuid);
541         }
542
543         rc = class_manual_cleanup(obd);
544         if (rc)
545                 GOTO(out, rc);
546
547         /* Clean the nid uuids */
548         if (!niduuid)
549                 GOTO(out, rc = -ENOMEM);
550
551         for (i = 0; i < lsi->lsi_lmd->lmd_mgs_failnodes; i++) {
552                 sprintf(ptr, "_%x", i);
553                 rc = do_lcfg(LUSTRE_MGC_OBDNAME, 0, LCFG_DEL_UUID,
554                              niduuid, NULL, NULL, NULL);
555                 if (rc)
556                         CERROR("del MDC UUID %s failed: rc = %d\n",
557                                niduuid, rc);
558         }
559 out:
560         if (niduuid)
561                 OBD_FREE(niduuid, len);
562
563         /* class_import_put will get rid of the additional connections */
564         mutex_unlock(&mgc_start_lock);
565         RETURN(rc);
566 }
567
568 /***************** lustre superblock **************/
569
570 static struct lustre_sb_info *lustre_init_lsi(struct super_block *sb)
571 {
572         struct lustre_sb_info *lsi;
573         ENTRY;
574
575         OBD_ALLOC_PTR(lsi);
576         if (!lsi)
577                 RETURN(NULL);
578         OBD_ALLOC_PTR(lsi->lsi_lmd);
579         if (!lsi->lsi_lmd) {
580                 OBD_FREE_PTR(lsi);
581                 RETURN(NULL);
582         }
583
584         lsi->lsi_lmd->lmd_exclude_count = 0;
585         lsi->lsi_lmd->lmd_recovery_time_soft = 0;
586         lsi->lsi_lmd->lmd_recovery_time_hard = 0;
587         s2lsi_nocast(sb) = lsi;
588         /* we take 1 extra ref for our setup */
589         atomic_set(&lsi->lsi_mounts, 1);
590
591         /* Default umount style */
592         lsi->lsi_flags = LSI_UMOUNT_FAILOVER;
593         INIT_LIST_HEAD(&lsi->lsi_lwp_list);
594         spin_lock_init(&lsi->lsi_lwp_lock);
595
596         RETURN(lsi);
597 }
598
599 static int lustre_free_lsi(struct super_block *sb)
600 {
601         struct lustre_sb_info *lsi = s2lsi(sb);
602         ENTRY;
603
604         LASSERT(lsi != NULL);
605         CDEBUG(D_MOUNT, "Freeing lsi %p\n", lsi);
606
607         /* someone didn't call server_put_mount. */
608         LASSERT(atomic_read(&lsi->lsi_mounts) == 0);
609
610         if (lsi->lsi_lmd != NULL) {
611                 if (lsi->lsi_lmd->lmd_dev != NULL)
612                         OBD_FREE(lsi->lsi_lmd->lmd_dev,
613                                 strlen(lsi->lsi_lmd->lmd_dev) + 1);
614                 if (lsi->lsi_lmd->lmd_profile != NULL)
615                         OBD_FREE(lsi->lsi_lmd->lmd_profile,
616                                 strlen(lsi->lsi_lmd->lmd_profile) + 1);
617                 if (lsi->lsi_lmd->lmd_fileset != NULL)
618                         OBD_FREE(lsi->lsi_lmd->lmd_fileset,
619                                 strlen(lsi->lsi_lmd->lmd_fileset) + 1);
620                 if (lsi->lsi_lmd->lmd_mgssec != NULL)
621                         OBD_FREE(lsi->lsi_lmd->lmd_mgssec,
622                                 strlen(lsi->lsi_lmd->lmd_mgssec) + 1);
623                 if (lsi->lsi_lmd->lmd_opts != NULL)
624                         OBD_FREE(lsi->lsi_lmd->lmd_opts,
625                                 strlen(lsi->lsi_lmd->lmd_opts) + 1);
626                 if (lsi->lsi_lmd->lmd_exclude_count)
627                         OBD_FREE(lsi->lsi_lmd->lmd_exclude,
628                                 sizeof(lsi->lsi_lmd->lmd_exclude[0]) *
629                                 lsi->lsi_lmd->lmd_exclude_count);
630                 if (lsi->lsi_lmd->lmd_mgs != NULL)
631                         OBD_FREE(lsi->lsi_lmd->lmd_mgs,
632                                  strlen(lsi->lsi_lmd->lmd_mgs) + 1);
633                 if (lsi->lsi_lmd->lmd_osd_type != NULL)
634                         OBD_FREE(lsi->lsi_lmd->lmd_osd_type,
635                                  strlen(lsi->lsi_lmd->lmd_osd_type) + 1);
636                 if (lsi->lsi_lmd->lmd_params != NULL)
637                         OBD_FREE(lsi->lsi_lmd->lmd_params, 4096);
638                 if (lsi->lsi_lmd->lmd_nidnet != NULL)
639                         OBD_FREE(lsi->lsi_lmd->lmd_nidnet,
640                                 strlen(lsi->lsi_lmd->lmd_nidnet) + 1);
641
642                 OBD_FREE_PTR(lsi->lsi_lmd);
643         }
644
645         LASSERT(lsi->lsi_llsbi == NULL);
646         OBD_FREE_PTR(lsi);
647         s2lsi_nocast(sb) = NULL;
648
649         RETURN(0);
650 }
651
652 /* The lsi has one reference for every server that is using the disk -
653    e.g. MDT, MGS, and potentially MGC */
654 int lustre_put_lsi(struct super_block *sb)
655 {
656         struct lustre_sb_info *lsi = s2lsi(sb);
657         ENTRY;
658
659         LASSERT(lsi != NULL);
660
661         CDEBUG(D_MOUNT, "put %p %d\n", sb, atomic_read(&lsi->lsi_mounts));
662         if (atomic_dec_and_test(&lsi->lsi_mounts)) {
663                 if (IS_SERVER(lsi) && lsi->lsi_osd_exp) {
664                         lu_device_put(&lsi->lsi_dt_dev->dd_lu_dev);
665                         lsi->lsi_osd_exp->exp_obd->obd_lvfs_ctxt.dt = NULL;
666                         lsi->lsi_dt_dev = NULL;
667                         obd_disconnect(lsi->lsi_osd_exp);
668                         /* wait till OSD is gone */
669                         obd_zombie_barrier();
670                 }
671                 lustre_free_lsi(sb);
672                 RETURN(1);
673         }
674         RETURN(0);
675 }
676
677 /*
678  * The goal of this function is to extract the file system name
679  * from the obd name. This can come in two flavors. One is
680  * fsname-MDTXXXX or fsname-XXXXXXX were X is a hexadecimal
681  * number. In both cases we should return fsname. If it is
682  * not a valid obd name it is assumed to be the file system
683  * name itself.
684  */
685 void obdname2fsname(const char *tgt, char *fsname, size_t buflen)
686 {
687         const char *ptr;
688         const char *tmp;
689         size_t len = 0;
690
691         /* First we have to see if the @tgt has '-' at all. It is
692          * valid for the user to request something like
693          * lctl set_param -P llite.lustre*.xattr_cache=0
694          */
695         ptr = strrchr(tgt, '-');
696         if (!ptr) {
697                 /* No '-' means it should end in '*' */
698                 ptr = strchr(tgt, '*');
699                 if (!ptr)
700                         goto no_fsname;
701                 len = ptr - tgt;
702                 goto valid_obd_name;
703         }
704
705         /* tgt format fsname-MDT0000-* */
706         if ((!strncmp(ptr, "-MDT", 4) ||
707              !strncmp(ptr, "-OST", 4)) &&
708              (isxdigit(ptr[4]) && isxdigit(ptr[5]) &&
709               isxdigit(ptr[6]) && isxdigit(ptr[7]))) {
710                 len = ptr - tgt;
711                 goto valid_obd_name;
712         }
713
714         /* tgt_format fsname-cli'dev'-'uuid' except for the llite case
715          * which are named fsname-'uuid'. Examples:
716          *
717          * lustre-clilov-ffff88104db5b800
718          * lustre-ffff88104db5b800  (for llite device)
719          *
720          * The length of the obd uuid can vary on different platforms.
721          * This test if any invalid characters are in string. Allow
722          * wildcards with '*' character.
723          */
724         ptr++;
725         if (!strspn(ptr, "0123456789abcdefABCDEF*")) {
726                 len = 0;
727                 goto no_fsname;
728         }
729
730         /* Now that we validated the device name lets extract the
731          * file system name. Most of the names in this class will
732          * have '-cli' in its name which needs to be dropped. If
733          * it doesn't have '-cli' then its a llite device which
734          * ptr already points to the start of the uuid string.
735          */
736         tmp = strstr(tgt, "-cli");
737         if (tmp)
738                 ptr = tmp;
739         else
740                 ptr--;
741         len = ptr - tgt;
742 valid_obd_name:
743         len = min_t(size_t, len, LUSTRE_MAXFSNAME);
744         snprintf(fsname, buflen, "%.*s", (int)len, tgt);
745 no_fsname:
746         fsname[len] = '\0';
747 }
748 EXPORT_SYMBOL(obdname2fsname);
749
750 /*** SERVER NAME ***
751  * <FSNAME><SEPARATOR><TYPE><INDEX>
752  * FSNAME is between 1 and 8 characters (inclusive).
753  *      Excluded characters are '/' and ':'
754  * SEPARATOR is either ':' or '-'
755  * TYPE: "OST", "MDT", etc.
756  * INDEX: Hex representation of the index
757  */
758
759 /** Get the fsname ("lustre") from the server name ("lustre-OST003F").
760  * @param [in] svname server name including type and index
761  * @param [out] fsname Buffer to copy filesystem name prefix into.
762  *  Must have at least 'strlen(fsname) + 1' chars.
763  * @param [out] endptr if endptr isn't NULL it is set to end of fsname
764  * rc < 0  on error
765  */
766 int server_name2fsname(const char *svname, char *fsname, const char **endptr)
767 {
768         const char *dash;
769
770         dash = svname + strnlen(svname, LUSTRE_MAXFSNAME);
771         for (; dash > svname && *dash != '-' && *dash != ':'; dash--)
772                 ;
773         if (dash == svname)
774                 return -EINVAL;
775
776         if (fsname != NULL) {
777                 strncpy(fsname, svname, dash - svname);
778                 fsname[dash - svname] = '\0';
779         }
780
781         if (endptr != NULL)
782                 *endptr = dash;
783
784         return 0;
785 }
786 EXPORT_SYMBOL(server_name2fsname);
787
788 /**
789  * Get service name (svname) from string
790  * rc < 0 on error
791  * if endptr isn't NULL it is set to end of fsname *
792  */
793 int server_name2svname(const char *label, char *svname, const char **endptr,
794                        size_t svsize)
795 {
796         int rc;
797         const char *dash;
798
799         /* We use server_name2fsname() just for parsing */
800         rc = server_name2fsname(label, NULL, &dash);
801         if (rc != 0)
802                 return rc;
803
804         if (endptr != NULL)
805                 *endptr = dash;
806
807         if (strlcpy(svname, dash + 1, svsize) >= svsize)
808                 return -E2BIG;
809
810         return 0;
811 }
812 EXPORT_SYMBOL(server_name2svname);
813
814 /**
815  * check server name is OST.
816  **/
817 int server_name_is_ost(const char *svname)
818 {
819         const char *dash;
820         int rc;
821
822         /* We use server_name2fsname() just for parsing */
823         rc = server_name2fsname(svname, NULL, &dash);
824         if (rc != 0)
825                 return rc;
826
827         dash++;
828
829         if (strncmp(dash, "OST", 3) == 0)
830                 return 1;
831         return 0;
832 }
833 EXPORT_SYMBOL(server_name_is_ost);
834
835 /**
836  * Get the index from the target name MDTXXXX/OSTXXXX
837  * rc = server type, or rc < 0  on error
838  **/
839 int target_name2index(const char *tgtname, __u32 *idx, const char **endptr)
840 {
841         const char *dash = tgtname;
842         unsigned long index;
843         int rc;
844
845         if (strncmp(dash, "MDT", 3) == 0)
846                 rc = LDD_F_SV_TYPE_MDT;
847         else if (strncmp(dash, "OST", 3) == 0)
848                 rc = LDD_F_SV_TYPE_OST;
849         else
850                 return -EINVAL;
851
852         dash += 3;
853
854         if (strncmp(dash, "all", 3) == 0) {
855                 if (endptr != NULL)
856                         *endptr = dash + 3;
857                 return rc | LDD_F_SV_ALL;
858         }
859
860         index = simple_strtoul(dash, (char **)endptr, 16);
861         if (idx != NULL)
862                 *idx = index;
863         return rc;
864 }
865 EXPORT_SYMBOL(target_name2index);
866
867 /* Get the index from the obd name.
868    rc = server type, or
869    rc < 0  on error
870    if endptr isn't NULL it is set to end of name */
871 int server_name2index(const char *svname, __u32 *idx, const char **endptr)
872 {
873         const char *dash;
874         int rc;
875
876         /* We use server_name2fsname() just for parsing */
877         rc = server_name2fsname(svname, NULL, &dash);
878         if (rc != 0)
879                 return rc;
880
881         dash++;
882         rc = target_name2index(dash, idx, endptr);
883         if (rc < 0)
884                 return rc;
885
886         /* Account for -mdc after index that is possible when specifying mdt */
887         if (endptr != NULL && strncmp(LUSTRE_MDC_NAME, *endptr + 1,
888                                       sizeof(LUSTRE_MDC_NAME)-1) == 0)
889                 *endptr += sizeof(LUSTRE_MDC_NAME);
890
891         return rc;
892 }
893 EXPORT_SYMBOL(server_name2index);
894
895 /*************** mount common betweeen server and client ***************/
896
897 /* Common umount */
898 int lustre_common_put_super(struct super_block *sb)
899 {
900         int rc;
901         ENTRY;
902
903         CDEBUG(D_MOUNT, "dropping sb %p\n", sb);
904
905         /* Drop a ref to the MGC */
906         rc = lustre_stop_mgc(sb);
907         if (rc && (rc != -ENOENT)) {
908                 if (rc != -EBUSY) {
909                         CERROR("Can't stop MGC: %d\n", rc);
910                         RETURN(rc);
911                 }
912                 /* BUSY just means that there's some other obd that
913                    needs the mgc.  Let him clean it up. */
914                 CDEBUG(D_MOUNT, "MGC still in use\n");
915         }
916         /* Drop a ref to the mounted disk */
917         lustre_put_lsi(sb);
918
919         RETURN(rc);
920 }
921 EXPORT_SYMBOL(lustre_common_put_super);
922
923 static void lmd_print(struct lustre_mount_data *lmd)
924 {
925         int i;
926
927         PRINT_CMD(D_MOUNT, "  mount data:\n");
928         if (lmd_is_client(lmd))
929                 PRINT_CMD(D_MOUNT, "profile: %s\n", lmd->lmd_profile);
930         PRINT_CMD(D_MOUNT, "device:  %s\n", lmd->lmd_dev);
931         PRINT_CMD(D_MOUNT, "flags:   %x\n", lmd->lmd_flags);
932
933         if (lmd->lmd_opts)
934                 PRINT_CMD(D_MOUNT, "options: %s\n", lmd->lmd_opts);
935
936         if (lmd->lmd_recovery_time_soft)
937                 PRINT_CMD(D_MOUNT, "recovery time soft: %d\n",
938                           lmd->lmd_recovery_time_soft);
939
940         if (lmd->lmd_recovery_time_hard)
941                 PRINT_CMD(D_MOUNT, "recovery time hard: %d\n",
942                           lmd->lmd_recovery_time_hard);
943
944         for (i = 0; i < lmd->lmd_exclude_count; i++) {
945                 PRINT_CMD(D_MOUNT, "exclude %d:  OST%04x\n", i,
946                           lmd->lmd_exclude[i]);
947         }
948 }
949
950 /* Is this server on the exclusion list */
951 int lustre_check_exclusion(struct super_block *sb, char *svname)
952 {
953         struct lustre_sb_info *lsi = s2lsi(sb);
954         struct lustre_mount_data *lmd = lsi->lsi_lmd;
955         __u32 index;
956         int i, rc;
957         ENTRY;
958
959         rc = server_name2index(svname, &index, NULL);
960         if (rc != LDD_F_SV_TYPE_OST)
961                 /* Only exclude OSTs */
962                 RETURN(0);
963
964         CDEBUG(D_MOUNT, "Check exclusion %s (%d) in %d of %s\n", svname,
965                index, lmd->lmd_exclude_count, lmd->lmd_dev);
966
967         for(i = 0; i < lmd->lmd_exclude_count; i++) {
968                 if (index == lmd->lmd_exclude[i]) {
969                         CWARN("Excluding %s (on exclusion list)\n", svname);
970                         RETURN(1);
971                 }
972         }
973         RETURN(0);
974 }
975
976 /* mount -v  -o exclude=lustre-OST0001:lustre-OST0002 -t lustre ... */
977 static int lmd_make_exclusion(struct lustre_mount_data *lmd, const char *ptr)
978 {
979         const char *s1 = ptr, *s2;
980         __u32 *exclude_list;
981         __u32 index = 0;
982         int rc = 0, devmax;
983         ENTRY;
984
985         /* The shortest an ost name can be is 8 chars: -OST0000.
986            We don't actually know the fsname at this time, so in fact
987            a user could specify any fsname. */
988         devmax = strlen(ptr) / 8 + 1;
989
990         /* temp storage until we figure out how many we have */
991         OBD_ALLOC(exclude_list, sizeof(index) * devmax);
992         if (!exclude_list)
993                 RETURN(-ENOMEM);
994
995         /* we enter this fn pointing at the '=' */
996         while (*s1 && *s1 != ' ' && *s1 != ',') {
997                 s1++;
998                 rc = server_name2index(s1, &index, &s2);
999                 if (rc < 0) {
1000                         CERROR("Can't parse server name '%s': rc = %d\n",
1001                                s1, rc);
1002                         break;
1003                 }
1004                 if (rc == LDD_F_SV_TYPE_OST)
1005                         exclude_list[lmd->lmd_exclude_count++] = index;
1006                 else
1007                         CDEBUG(D_MOUNT, "ignoring exclude %.*s: type = %#x\n",
1008                                (uint)(s2-s1), s1, rc);
1009                 s1 = s2;
1010                 /* now we are pointing at ':' (next exclude)
1011                    or ',' (end of excludes) */
1012                 if (lmd->lmd_exclude_count >= devmax)
1013                         break;
1014         }
1015         if (rc >= 0) /* non-err */
1016                 rc = 0;
1017
1018         if (lmd->lmd_exclude_count) {
1019                 /* permanent, freed in lustre_free_lsi */
1020                 OBD_ALLOC(lmd->lmd_exclude, sizeof(index) *
1021                           lmd->lmd_exclude_count);
1022                 if (lmd->lmd_exclude) {
1023                         memcpy(lmd->lmd_exclude, exclude_list,
1024                                sizeof(index) * lmd->lmd_exclude_count);
1025                 } else {
1026                         rc = -ENOMEM;
1027                         lmd->lmd_exclude_count = 0;
1028                 }
1029         }
1030         OBD_FREE(exclude_list, sizeof(index) * devmax);
1031         RETURN(rc);
1032 }
1033
1034 static int lmd_parse_mgssec(struct lustre_mount_data *lmd, char *ptr)
1035 {
1036         char   *tail;
1037         int     length;
1038
1039         if (lmd->lmd_mgssec != NULL) {
1040                 OBD_FREE(lmd->lmd_mgssec, strlen(lmd->lmd_mgssec) + 1);
1041                 lmd->lmd_mgssec = NULL;
1042         }
1043
1044         tail = strchr(ptr, ',');
1045         if (tail == NULL)
1046                 length = strlen(ptr);
1047         else
1048                 length = tail - ptr;
1049
1050         OBD_ALLOC(lmd->lmd_mgssec, length + 1);
1051         if (lmd->lmd_mgssec == NULL)
1052                 return -ENOMEM;
1053
1054         memcpy(lmd->lmd_mgssec, ptr, length);
1055         lmd->lmd_mgssec[length] = '\0';
1056         return 0;
1057 }
1058
1059 static int lmd_parse_network(struct lustre_mount_data *lmd, char *ptr)
1060 {
1061         char   *tail;
1062         int     length;
1063
1064         if (lmd->lmd_nidnet != NULL) {
1065                 OBD_FREE(lmd->lmd_nidnet, strlen(lmd->lmd_nidnet) + 1);
1066                 lmd->lmd_nidnet = NULL;
1067         }
1068
1069         tail = strchr(ptr, ',');
1070         if (tail == NULL)
1071                 length = strlen(ptr);
1072         else
1073                 length = tail - ptr;
1074
1075         OBD_ALLOC(lmd->lmd_nidnet, length + 1);
1076         if (lmd->lmd_nidnet == NULL)
1077                 return -ENOMEM;
1078
1079         memcpy(lmd->lmd_nidnet, ptr, length);
1080         lmd->lmd_nidnet[length] = '\0';
1081         return 0;
1082 }
1083
1084 static int lmd_parse_string(char **handle, char *ptr)
1085 {
1086         char   *tail;
1087         int     length;
1088
1089         if ((handle == NULL) || (ptr == NULL))
1090                 return -EINVAL;
1091
1092         if (*handle != NULL) {
1093                 OBD_FREE(*handle, strlen(*handle) + 1);
1094                 *handle = NULL;
1095         }
1096
1097         tail = strchr(ptr, ',');
1098         if (tail == NULL)
1099                 length = strlen(ptr);
1100         else
1101                 length = tail - ptr;
1102
1103         OBD_ALLOC(*handle, length + 1);
1104         if (*handle == NULL)
1105                 return -ENOMEM;
1106
1107         memcpy(*handle, ptr, length);
1108         (*handle)[length] = '\0';
1109
1110         return 0;
1111 }
1112
1113 /* Collect multiple values for mgsnid specifiers */
1114 static int lmd_parse_mgs(struct lustre_mount_data *lmd, char **ptr)
1115 {
1116         lnet_nid_t nid;
1117         char *tail = *ptr;
1118         char *mgsnid;
1119         int   length;
1120         int   oldlen = 0;
1121
1122         /* Find end of nidlist */
1123         while (class_parse_nid_quiet(tail, &nid, &tail) == 0) {}
1124         length = tail - *ptr;
1125         if (length == 0) {
1126                 LCONSOLE_ERROR_MSG(0x159, "Can't parse NID '%s'\n", *ptr);
1127                 return -EINVAL;
1128         }
1129
1130         if (lmd->lmd_mgs != NULL)
1131                 oldlen = strlen(lmd->lmd_mgs) + 1;
1132
1133         OBD_ALLOC(mgsnid, oldlen + length + 1);
1134         if (mgsnid == NULL)
1135                 return -ENOMEM;
1136
1137         if (lmd->lmd_mgs != NULL) {
1138                 /* Multiple mgsnid= are taken to mean failover locations */
1139                 memcpy(mgsnid, lmd->lmd_mgs, oldlen);
1140                 mgsnid[oldlen - 1] = ':';
1141                 OBD_FREE(lmd->lmd_mgs, oldlen);
1142         }
1143         memcpy(mgsnid + oldlen, *ptr, length);
1144         mgsnid[oldlen + length] = '\0';
1145         lmd->lmd_mgs = mgsnid;
1146         *ptr = tail;
1147
1148         return 0;
1149 }
1150
1151 /**
1152  * Find the first delimiter (comma or colon) from the specified \a buf and
1153  * make \a *endh point to the string starting with the delimiter. The commas
1154  * in expression list [...] will be skipped.
1155  *
1156  * \param[in] buf       a delimiter-separated string
1157  * \param[in] endh      a pointer to a pointer that will point to the string
1158  *                      starting with the delimiter
1159  *
1160  * \retval 0            if delimiter is found
1161  * \retval 1            if delimiter is not found
1162  */
1163 static int lmd_find_delimiter(char *buf, char **endh)
1164 {
1165         char *c = buf;
1166         int   skip = 0;
1167
1168         if (buf == NULL)
1169                 return 1;
1170
1171         while (*c != '\0') {
1172                 if (*c == '[')
1173                         skip++;
1174                 else if (*c == ']')
1175                         skip--;
1176
1177                 if ((*c == ',' || *c == ':') && skip == 0) {
1178                         if (endh != NULL)
1179                                 *endh = c;
1180                         return 0;
1181                 }
1182
1183                 c++;
1184         }
1185
1186         return 1;
1187 }
1188
1189 /**
1190  * Find the first valid string delimited by comma or colon from the specified
1191  * \a buf and parse it to see whether it's a valid nid list. If yes, \a *endh
1192  * will point to the next string starting with the delimiter.
1193  *
1194  * \param[in] buf       a delimiter-separated string
1195  * \param[in] endh      a pointer to a pointer that will point to the string
1196  *                      starting with the delimiter
1197  *
1198  * \retval 0            if the string is a valid nid list
1199  * \retval 1            if the string is not a valid nid list
1200  */
1201 static int lmd_parse_nidlist(char *buf, char **endh)
1202 {
1203         struct list_head nidlist;
1204         char            *endp = buf;
1205         char             tmp;
1206         int              rc = 0;
1207
1208         if (buf == NULL)
1209                 return 1;
1210         while (*buf == ',' || *buf == ':')
1211                 buf++;
1212         if (*buf == ' ' || *buf == '/' || *buf == '\0')
1213                 return 1;
1214
1215         if (lmd_find_delimiter(buf, &endp) != 0)
1216                 endp = buf + strlen(buf);
1217
1218         tmp = *endp;
1219         *endp = '\0';
1220
1221         INIT_LIST_HEAD(&nidlist);
1222         if (cfs_parse_nidlist(buf, strlen(buf), &nidlist) <= 0)
1223                 rc = 1;
1224         cfs_free_nidlist(&nidlist);
1225
1226         *endp = tmp;
1227         if (rc != 0)
1228                 return rc;
1229         if (endh != NULL)
1230                 *endh = endp;
1231         return 0;
1232 }
1233
1234 /** Parse mount line options
1235  * e.g. mount -v -t lustre -o abort_recov uml1:uml2:/lustre-client /mnt/lustre
1236  * dev is passed as device=uml1:/lustre by mount.lustre
1237  */
1238 static int lmd_parse(char *options, struct lustre_mount_data *lmd)
1239 {
1240         char *s1, *s2, *devname = NULL;
1241         struct lustre_mount_data *raw = (struct lustre_mount_data *)options;
1242         int rc = 0;
1243         ENTRY;
1244
1245         LASSERT(lmd);
1246         if (!options) {
1247                 LCONSOLE_ERROR_MSG(0x162, "Missing mount data: check that "
1248                                    "/sbin/mount.lustre is installed.\n");
1249                 RETURN(-EINVAL);
1250         }
1251
1252         /* Options should be a string - try to detect old lmd data */
1253         if ((raw->lmd_magic & 0xffffff00) == (LMD_MAGIC & 0xffffff00)) {
1254                 LCONSOLE_ERROR_MSG(0x163, "You're using an old version of "
1255                                    "/sbin/mount.lustre.  Please install "
1256                                    "version %s\n", LUSTRE_VERSION_STRING);
1257                 RETURN(-EINVAL);
1258         }
1259         lmd->lmd_magic = LMD_MAGIC;
1260
1261         OBD_ALLOC(lmd->lmd_params, LMD_PARAMS_MAXLEN);
1262         if (lmd->lmd_params == NULL)
1263                 RETURN(-ENOMEM);
1264         lmd->lmd_params[0] = '\0';
1265
1266         /* Set default flags here */
1267
1268         s1 = options;
1269         while (*s1) {
1270                 int clear = 0;
1271                 int time_min = OBD_RECOVERY_TIME_MIN;
1272                 char *s3;
1273
1274                 /* Skip whitespace and extra commas */
1275                 while (*s1 == ' ' || *s1 == ',')
1276                         s1++;
1277                 s3 = s1;
1278
1279                 /* Client options are parsed in ll_options: eg. flock,
1280                    user_xattr, acl */
1281
1282                 /* Parse non-ldiskfs options here. Rather than modifying
1283                    ldiskfs, we just zero these out here */
1284                 if (strncmp(s1, "abort_recov", 11) == 0) {
1285                         lmd->lmd_flags |= LMD_FLG_ABORT_RECOV;
1286                         clear++;
1287                 } else if (strncmp(s1, "recovery_time_soft=", 19) == 0) {
1288                         lmd->lmd_recovery_time_soft =
1289                                 max_t(int, simple_strtoul(s1 + 19, NULL, 10),
1290                                       time_min);
1291                         clear++;
1292                 } else if (strncmp(s1, "recovery_time_hard=", 19) == 0) {
1293                         lmd->lmd_recovery_time_hard =
1294                                 max_t(int, simple_strtoul(s1 + 19, NULL, 10),
1295                                       time_min);
1296                         clear++;
1297                 } else if (strncmp(s1, "noir", 4) == 0) {
1298                         lmd->lmd_flags |= LMD_FLG_NOIR; /* test purpose only. */
1299                         clear++;
1300                 } else if (strncmp(s1, "nosvc", 5) == 0) {
1301                         lmd->lmd_flags |= LMD_FLG_NOSVC;
1302                         clear++;
1303                 } else if (strncmp(s1, "nomgs", 5) == 0) {
1304                         lmd->lmd_flags |= LMD_FLG_NOMGS;
1305                         clear++;
1306                 } else if (strncmp(s1, "noscrub", 7) == 0) {
1307                         lmd->lmd_flags |= LMD_FLG_NOSCRUB;
1308                         clear++;
1309                 } else if (strncmp(s1, "skip_lfsck", 10) == 0) {
1310                         lmd->lmd_flags |= LMD_FLG_SKIP_LFSCK;
1311                         clear++;
1312                 } else if (strncmp(s1, "rdonly_dev", 10) == 0) {
1313                         lmd->lmd_flags |= LMD_FLG_DEV_RDONLY;
1314                         clear++;
1315                 } else if (strncmp(s1, PARAM_MGSNODE,
1316                                    sizeof(PARAM_MGSNODE) - 1) == 0) {
1317                         s2 = s1 + sizeof(PARAM_MGSNODE) - 1;
1318                         /* Assume the next mount opt is the first
1319                            invalid nid we get to. */
1320                         rc = lmd_parse_mgs(lmd, &s2);
1321                         if (rc)
1322                                 goto invalid;
1323                         s3 = s2;
1324                         clear++;
1325                 } else if (strncmp(s1, "writeconf", 9) == 0) {
1326                         lmd->lmd_flags |= LMD_FLG_WRITECONF;
1327                         clear++;
1328                 } else if (strncmp(s1, "update", 6) == 0) {
1329                         lmd->lmd_flags |= LMD_FLG_UPDATE;
1330                         clear++;
1331                 } else if (strncmp(s1, "virgin", 6) == 0) {
1332                         lmd->lmd_flags |= LMD_FLG_VIRGIN;
1333                         clear++;
1334                 } else if (strncmp(s1, "noprimnode", 10) == 0) {
1335                         lmd->lmd_flags |= LMD_FLG_NO_PRIMNODE;
1336                         clear++;
1337                 } else if (strncmp(s1, "mgssec=", 7) == 0) {
1338                         rc = lmd_parse_mgssec(lmd, s1 + 7);
1339                         if (rc)
1340                                 goto invalid;
1341                         clear++;
1342                         /* ost exclusion list */
1343                 } else if (strncmp(s1, "exclude=", 8) == 0) {
1344                         rc = lmd_make_exclusion(lmd, s1 + 7);
1345                         if (rc)
1346                                 goto invalid;
1347                         clear++;
1348                 } else if (strncmp(s1, "mgs", 3) == 0) {
1349                         /* We are an MGS */
1350                         lmd->lmd_flags |= LMD_FLG_MGS;
1351                         clear++;
1352                 } else if (strncmp(s1, "svname=", 7) == 0) {
1353                         rc = lmd_parse_string(&lmd->lmd_profile, s1 + 7);
1354                         if (rc)
1355                                 goto invalid;
1356                         clear++;
1357                 } else if (strncmp(s1, "param=", 6) == 0) {
1358                         size_t length, params_length;
1359                         char  *tail = s1;
1360                         if (lmd_find_delimiter(s1 + 6, &tail) != 0)
1361                                 length = strlen(s1);
1362                         else {
1363                                 char *param_str = tail + 1;
1364                                 int   supplementary = 1;
1365                                 while (lmd_parse_nidlist(param_str,
1366                                                          &param_str) == 0) {
1367                                         supplementary = 0;
1368                                 }
1369                                 length = param_str - s1 - supplementary;
1370                         }
1371                         length -= 6;
1372                         params_length = strlen(lmd->lmd_params);
1373                         if (params_length + length + 1 >= LMD_PARAMS_MAXLEN)
1374                                 RETURN(-E2BIG);
1375                         strncat(lmd->lmd_params, s1 + 6, length);
1376                         lmd->lmd_params[params_length + length] = '\0';
1377                         strlcat(lmd->lmd_params, " ", LMD_PARAMS_MAXLEN);
1378                         s3 = s1 + 6 + length;
1379                         clear++;
1380                 } else if (strncmp(s1, "osd=", 4) == 0) {
1381                         rc = lmd_parse_string(&lmd->lmd_osd_type, s1 + 4);
1382                         if (rc)
1383                                 goto invalid;
1384                         clear++;
1385                 }
1386                 /* Linux 2.4 doesn't pass the device, so we stuck it at the
1387                    end of the options. */
1388                 else if (strncmp(s1, "device=", 7) == 0) {
1389                         devname = s1 + 7;
1390                         /* terminate options right before device.  device
1391                            must be the last one. */
1392                         *s1 = '\0';
1393                         break;
1394                 } else if (strncmp(s1, "network=", 8) == 0) {
1395                         rc = lmd_parse_network(lmd, s1 + 8);
1396                         if (rc)
1397                                 goto invalid;
1398                         clear++;
1399                 }
1400
1401                 /* Find next opt */
1402                 s2 = strchr(s3, ',');
1403                 if (s2 == NULL) {
1404                         if (clear)
1405                                 *s1 = '\0';
1406                         break;
1407                 }
1408                 s2++;
1409                 if (clear)
1410                         memmove(s1, s2, strlen(s2) + 1);
1411                 else
1412                         s1 = s2;
1413         }
1414
1415         if (!devname) {
1416                 LCONSOLE_ERROR_MSG(0x164, "Can't find the device name "
1417                                    "(need mount option 'device=...')\n");
1418                 goto invalid;
1419         }
1420
1421         s1 = strstr(devname, ":/");
1422         if (s1) {
1423                 ++s1;
1424                 lmd->lmd_flags |= LMD_FLG_CLIENT;
1425                 /* Remove leading /s from fsname */
1426                 while (*++s1 == '/')
1427                         ;
1428                 s2 = s1;
1429                 while (*s2 != '/' && *s2 != '\0')
1430                         s2++;
1431                 /* Freed in lustre_free_lsi */
1432                 OBD_ALLOC(lmd->lmd_profile, s2 - s1 + 8);
1433                 if (!lmd->lmd_profile)
1434                         RETURN(-ENOMEM);
1435
1436                 strncat(lmd->lmd_profile, s1, s2 - s1);
1437                 strncat(lmd->lmd_profile, "-client", 7);
1438
1439                 s1 = s2;
1440                 s2 = s1 + strlen(s1) - 1;
1441                 /* Remove padding /s from fileset */
1442                 while (*s2 == '/')
1443                         s2--;
1444                 if (s2 > s1) {
1445                         OBD_ALLOC(lmd->lmd_fileset, s2 - s1 + 2);
1446                         if (lmd->lmd_fileset == NULL) {
1447                                 OBD_FREE(lmd->lmd_profile,
1448                                          strlen(lmd->lmd_profile) + 1);
1449                                 RETURN(-ENOMEM);
1450                         }
1451                         strncat(lmd->lmd_fileset, s1, s2 - s1 + 1);
1452                 }
1453         } else {
1454                 /* server mount */
1455                 if (lmd->lmd_nidnet != NULL) {
1456                         /* 'network=' mount option forbidden for server */
1457                         OBD_FREE(lmd->lmd_nidnet, strlen(lmd->lmd_nidnet) + 1);
1458                         lmd->lmd_nidnet = NULL;
1459                         rc = -EINVAL;
1460                         CERROR("%s: option 'network=' not allowed for Lustre "
1461                                "servers: rc = %d\n", devname, rc);
1462                         RETURN(rc);
1463                 }
1464         }
1465
1466         /* Freed in lustre_free_lsi */
1467         OBD_ALLOC(lmd->lmd_dev, strlen(devname) + 1);
1468         if (!lmd->lmd_dev)
1469                 RETURN(-ENOMEM);
1470         strncpy(lmd->lmd_dev, devname, strlen(devname)+1);
1471
1472         /* Save mount options */
1473         s1 = options + strlen(options) - 1;
1474         while (s1 >= options && (*s1 == ',' || *s1 == ' '))
1475                 *s1-- = 0;
1476         while (*options && (*options == ',' || *options == ' '))
1477                 options++;
1478         if (*options != 0) {
1479                 /* Freed in lustre_free_lsi */
1480                 OBD_ALLOC(lmd->lmd_opts, strlen(options) + 1);
1481                 if (!lmd->lmd_opts)
1482                         RETURN(-ENOMEM);
1483                 strncpy(lmd->lmd_opts, options, strlen(options)+1);
1484         }
1485
1486         lmd_print(lmd);
1487         lmd->lmd_magic = LMD_MAGIC;
1488
1489         RETURN(rc);
1490
1491 invalid:
1492         CERROR("Bad mount options %s\n", options);
1493         RETURN(-EINVAL);
1494 }
1495
1496 struct lustre_mount_data2 {
1497         void *lmd2_data;
1498         struct vfsmount *lmd2_mnt;
1499 };
1500
1501 /** This is the entry point for the mount call into Lustre.
1502  * This is called when a server or client is mounted,
1503  * and this is where we start setting things up.
1504  * @param data Mount options (e.g. -o flock,abort_recov)
1505  */
1506 static int lustre_fill_super(struct super_block *sb, void *data, int silent)
1507 {
1508         struct lustre_mount_data *lmd;
1509         struct lustre_mount_data2 *lmd2 = data;
1510         struct lustre_sb_info *lsi;
1511         int rc;
1512         ENTRY;
1513
1514         CDEBUG(D_MOUNT|D_VFSTRACE, "VFS Op: sb %p\n", sb);
1515
1516         lsi = lustre_init_lsi(sb);
1517         if (!lsi)
1518                 RETURN(-ENOMEM);
1519         lmd = lsi->lsi_lmd;
1520
1521         /*
1522          * Disable lockdep during mount, because mount locking patterns are
1523          * `special'.
1524          */
1525         lockdep_off();
1526
1527         /*
1528          * LU-639: the obd cleanup of last mount may not finish yet, wait here.
1529          */
1530         obd_zombie_barrier();
1531
1532         /* Figure out the lmd from the mount options */
1533         if (lmd_parse((char *)(lmd2->lmd2_data), lmd)) {
1534                 lustre_put_lsi(sb);
1535                 GOTO(out, rc = -EINVAL);
1536         }
1537
1538         if (lmd_is_client(lmd)) {
1539                 CDEBUG(D_MOUNT, "Mounting client %s\n", lmd->lmd_profile);
1540                 if (client_fill_super == NULL)
1541                         request_module("lustre");
1542                 if (client_fill_super == NULL) {
1543                         LCONSOLE_ERROR_MSG(0x165, "Nothing registered for "
1544                                            "client mount! Is the 'lustre' "
1545                                            "module loaded?\n");
1546                         lustre_put_lsi(sb);
1547                         rc = -ENODEV;
1548                 } else {
1549                         rc = lustre_start_mgc(sb);
1550                         if (rc) {
1551                                 lustre_common_put_super(sb);
1552                                 GOTO(out, rc);
1553                         }
1554                         /* Connect and start */
1555                         /* (should always be ll_fill_super) */
1556                         rc = (*client_fill_super)(sb, lmd2->lmd2_mnt);
1557                         /* c_f_s will call lustre_common_put_super on failure */
1558                 }
1559         } else {
1560 #ifdef HAVE_SERVER_SUPPORT
1561                 CDEBUG(D_MOUNT, "Mounting server from %s\n", lmd->lmd_dev);
1562                 rc = server_fill_super(sb);
1563                 /* s_f_s calls lustre_start_mgc after the mount because we need
1564                    the MGS nids which are stored on disk.  Plus, we may
1565                    need to start the MGS first. */
1566                 /* s_f_s will call server_put_super on failure */
1567 #else
1568                 CERROR("This is client-side-only module, "
1569                        "cannot handle server mount.\n");
1570                 rc = -EINVAL;
1571 #endif
1572         }
1573
1574         /* If error happens in fill_super() call, @lsi will be killed there.
1575          * This is why we do not put it here. */
1576         GOTO(out, rc);
1577 out:
1578         if (rc) {
1579                 CERROR("Unable to mount %s (%d)\n",
1580                        s2lsi(sb) ? lmd->lmd_dev : "", rc);
1581         } else {
1582                 CDEBUG(D_SUPER, "Mount %s complete\n",
1583                        lmd->lmd_dev);
1584         }
1585         lockdep_on();
1586         return rc;
1587 }
1588
1589
1590 /* We can't call ll_fill_super by name because it lives in a module that
1591    must be loaded after this one. */
1592 void lustre_register_client_fill_super(int (*cfs)(struct super_block *sb,
1593                                                   struct vfsmount *mnt))
1594 {
1595         client_fill_super = cfs;
1596 }
1597 EXPORT_SYMBOL(lustre_register_client_fill_super);
1598
1599 void lustre_register_kill_super_cb(void (*cfs)(struct super_block *sb))
1600 {
1601         kill_super_cb = cfs;
1602 }
1603 EXPORT_SYMBOL(lustre_register_kill_super_cb);
1604
1605 /***************** FS registration ******************/
1606 #ifdef HAVE_FSTYPE_MOUNT
1607 static struct dentry *lustre_mount(struct file_system_type *fs_type, int flags,
1608                                    const char *devname, void *data)
1609 {
1610         struct lustre_mount_data2 lmd2 = {
1611                 .lmd2_data = data,
1612         };
1613
1614         return mount_nodev(fs_type, flags, &lmd2, lustre_fill_super);
1615 }
1616 #else
1617 static int lustre_get_sb(struct file_system_type *fs_type, int flags,
1618                          const char *devname, void *data, struct vfsmount *mnt)
1619 {
1620         struct lustre_mount_data2 lmd2 = {
1621                 .lmd2_data = data,
1622                 .lmd2_mnt = mnt,
1623         };
1624
1625         return get_sb_nodev(fs_type, flags, &lmd2, lustre_fill_super, mnt);
1626 }
1627 #endif
1628
1629 static void lustre_kill_super(struct super_block *sb)
1630 {
1631         struct lustre_sb_info *lsi = s2lsi(sb);
1632
1633         if (kill_super_cb && lsi && !IS_SERVER(lsi))
1634                 (*kill_super_cb)(sb);
1635
1636         kill_anon_super(sb);
1637 }
1638
1639 /** Register the "lustre" fs type
1640  */
1641 static struct file_system_type lustre_fs_type = {
1642         .owner        = THIS_MODULE,
1643         .name         = "lustre",
1644 #ifdef HAVE_FSTYPE_MOUNT
1645         .mount        = lustre_mount,
1646 #else
1647         .get_sb       = lustre_get_sb,
1648 #endif
1649         .kill_sb      = lustre_kill_super,
1650         .fs_flags     = FS_REQUIRES_DEV | FS_HAS_FIEMAP | FS_RENAME_DOES_D_MOVE,
1651 };
1652 MODULE_ALIAS_FS("lustre");
1653
1654 int lustre_register_fs(void)
1655 {
1656         return register_filesystem(&lustre_fs_type);
1657 }
1658
1659 int lustre_unregister_fs(void)
1660 {
1661         return unregister_filesystem(&lustre_fs_type);
1662 }