Whamcloud - gitweb
f6e4690dcee14a46ca1d972aca2616bd6fb4b272
[fs/lustre-release.git] / lustre / obdclass / obd_mount.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2013, Intel Corporation.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/obdclass/obd_mount.c
37  *
38  * Client mount routines
39  *
40  * Author: Nathan Rutman <nathan@clusterfs.com>
41  */
42
43
44 #define DEBUG_SUBSYSTEM S_CLASS
45 #define D_MOUNT (D_SUPER|D_CONFIG/*|D_WARNING */)
46 #define PRINT_CMD CDEBUG
47
48 #include <obd.h>
49 #include <obd_class.h>
50 #include <lustre/lustre_user.h>
51 #include <linux/version.h>
52 #include <lustre_log.h>
53 #include <lustre_disk.h>
54 #include <lustre_param.h>
55
56 static int (*client_fill_super)(struct super_block *sb,
57                                 struct vfsmount *mnt);
58
59 static void (*kill_super_cb)(struct super_block *sb);
60
61 /**************** config llog ********************/
62
63 /** Get a config log from the MGS and process it.
64  * This func is called for both clients and servers.
65  * Continue to process new statements appended to the logs
66  * (whenever the config lock is revoked) until lustre_end_log
67  * is called.
68  * @param sb The superblock is used by the MGC to write to the local copy of
69  *   the config log
70  * @param logname The name of the llog to replicate from the MGS
71  * @param cfg Since the same mgc may be used to follow multiple config logs
72  *   (e.g. ost1, ost2, client), the config_llog_instance keeps the state for
73  *   this log, and is added to the mgc's list of logs to follow.
74  */
75 int lustre_process_log(struct super_block *sb, char *logname,
76                      struct config_llog_instance *cfg)
77 {
78         struct lustre_cfg *lcfg;
79         struct lustre_cfg_bufs *bufs;
80         struct lustre_sb_info *lsi = s2lsi(sb);
81         struct obd_device *mgc = lsi->lsi_mgc;
82         int rc;
83         ENTRY;
84
85         LASSERT(mgc);
86         LASSERT(cfg);
87
88         OBD_ALLOC_PTR(bufs);
89         if (bufs == NULL)
90                 RETURN(-ENOMEM);
91
92         /* mgc_process_config */
93         lustre_cfg_bufs_reset(bufs, mgc->obd_name);
94         lustre_cfg_bufs_set_string(bufs, 1, logname);
95         lustre_cfg_bufs_set(bufs, 2, cfg, sizeof(*cfg));
96         lustre_cfg_bufs_set(bufs, 3, &sb, sizeof(sb));
97         lcfg = lustre_cfg_new(LCFG_LOG_START, bufs);
98         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
99         lustre_cfg_free(lcfg);
100
101         OBD_FREE_PTR(bufs);
102
103         if (rc == -EINVAL)
104                 LCONSOLE_ERROR_MSG(0x15b, "%s: The configuration from log '%s'"
105                                    "failed from the MGS (%d).  Make sure this "
106                                    "client and the MGS are running compatible "
107                                    "versions of Lustre.\n",
108                                    mgc->obd_name, logname, rc);
109         else if (rc != 0)
110                 LCONSOLE_ERROR_MSG(0x15c, "%s: The configuration from log '%s' "
111                                    "failed (%d). This may be the result of "
112                                    "communication errors between this node and "
113                                    "the MGS, a bad configuration, or other "
114                                    "errors. See the syslog for more "
115                                    "information.\n", mgc->obd_name, logname,
116                                    rc);
117
118         /* class_obd_list(); */
119         RETURN(rc);
120 }
121 EXPORT_SYMBOL(lustre_process_log);
122
123 /* Stop watching this config log for updates */
124 int lustre_end_log(struct super_block *sb, char *logname,
125                        struct config_llog_instance *cfg)
126 {
127         struct lustre_cfg *lcfg;
128         struct lustre_cfg_bufs bufs;
129         struct lustre_sb_info *lsi = s2lsi(sb);
130         struct obd_device *mgc = lsi->lsi_mgc;
131         int rc;
132         ENTRY;
133
134         if (!mgc)
135                 RETURN(-ENOENT);
136
137         /* mgc_process_config */
138         lustre_cfg_bufs_reset(&bufs, mgc->obd_name);
139         lustre_cfg_bufs_set_string(&bufs, 1, logname);
140         if (cfg)
141                 lustre_cfg_bufs_set(&bufs, 2, cfg, sizeof(*cfg));
142         lcfg = lustre_cfg_new(LCFG_LOG_END, &bufs);
143         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
144         lustre_cfg_free(lcfg);
145         RETURN(rc);
146 }
147 EXPORT_SYMBOL(lustre_end_log);
148
149 /**************** obd start *******************/
150
151 /** lustre_cfg_bufs are a holdover from 1.4; we can still set these up from
152  * lctl (and do for echo cli/srv.
153  */
154 int do_lcfg(char *cfgname, lnet_nid_t nid, int cmd,
155             char *s1, char *s2, char *s3, char *s4)
156 {
157         struct lustre_cfg_bufs bufs;
158         struct lustre_cfg    * lcfg = NULL;
159         int rc;
160
161         CDEBUG(D_TRACE, "lcfg %s %#x %s %s %s %s\n", cfgname,
162                cmd, s1, s2, s3, s4);
163
164         lustre_cfg_bufs_reset(&bufs, cfgname);
165         if (s1)
166                 lustre_cfg_bufs_set_string(&bufs, 1, s1);
167         if (s2)
168                 lustre_cfg_bufs_set_string(&bufs, 2, s2);
169         if (s3)
170                 lustre_cfg_bufs_set_string(&bufs, 3, s3);
171         if (s4)
172                 lustre_cfg_bufs_set_string(&bufs, 4, s4);
173
174         lcfg = lustre_cfg_new(cmd, &bufs);
175         lcfg->lcfg_nid = nid;
176         rc = class_process_config(lcfg);
177         lustre_cfg_free(lcfg);
178         return(rc);
179 }
180 EXPORT_SYMBOL(do_lcfg);
181
182 /** Call class_attach and class_setup.  These methods in turn call
183  * obd type-specific methods.
184  */
185 int lustre_start_simple(char *obdname, char *type, char *uuid,
186                         char *s1, char *s2, char *s3, char *s4)
187 {
188         int rc;
189         CDEBUG(D_MOUNT, "Starting obd %s (typ=%s)\n", obdname, type);
190
191         rc = do_lcfg(obdname, 0, LCFG_ATTACH, type, uuid, 0, 0);
192         if (rc) {
193                 CERROR("%s attach error %d\n", obdname, rc);
194                 return rc;
195         }
196         rc = do_lcfg(obdname, 0, LCFG_SETUP, s1, s2, s3, s4);
197         if (rc) {
198                 CERROR("%s setup error %d\n", obdname, rc);
199                 do_lcfg(obdname, 0, LCFG_DETACH, 0, 0, 0, 0);
200         }
201         return rc;
202 }
203
204 DEFINE_MUTEX(mgc_start_lock);
205
206 /** Set up a mgc obd to process startup logs
207  *
208  * \param sb [in] super block of the mgc obd
209  *
210  * \retval 0 success, otherwise error code
211  */
212 int lustre_start_mgc(struct super_block *sb)
213 {
214         struct obd_connect_data *data = NULL;
215         struct lustre_sb_info *lsi = s2lsi(sb);
216         struct obd_device *obd;
217         struct obd_export *exp;
218         struct obd_uuid *uuid;
219         class_uuid_t uuidc;
220         lnet_nid_t nid;
221         char *mgcname = NULL, *niduuid = NULL, *mgssec = NULL;
222         char *ptr;
223         int recov_bk;
224         int rc = 0, i = 0, j, len;
225         ENTRY;
226
227         LASSERT(lsi->lsi_lmd);
228
229         /* Find the first non-lo MGS nid for our MGC name */
230         if (IS_SERVER(lsi)) {
231                 /* mount -o mgsnode=nid */
232                 ptr = lsi->lsi_lmd->lmd_mgs;
233                 if (lsi->lsi_lmd->lmd_mgs &&
234                     (class_parse_nid(lsi->lsi_lmd->lmd_mgs, &nid, &ptr) == 0)) {
235                         i++;
236                 } else if (IS_MGS(lsi)) {
237                         lnet_process_id_t id;
238                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
239                                 if (LNET_NETTYP(LNET_NIDNET(id.nid)) == LOLND)
240                                         continue;
241                                 nid = id.nid;
242                                 i++;
243                                 break;
244                         }
245                 }
246         } else { /* client */
247                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
248                 ptr = lsi->lsi_lmd->lmd_dev;
249                 if (class_parse_nid(ptr, &nid, &ptr) == 0)
250                         i++;
251         }
252         if (i == 0) {
253                 CERROR("No valid MGS nids found.\n");
254                 RETURN(-EINVAL);
255         }
256
257         mutex_lock(&mgc_start_lock);
258
259         len = strlen(LUSTRE_MGC_OBDNAME) + strlen(libcfs_nid2str(nid)) + 1;
260         OBD_ALLOC(mgcname, len);
261         OBD_ALLOC(niduuid, len + 2);
262         if (!mgcname || !niduuid)
263                 GOTO(out_free, rc = -ENOMEM);
264         sprintf(mgcname, "%s%s", LUSTRE_MGC_OBDNAME, libcfs_nid2str(nid));
265
266         mgssec = lsi->lsi_lmd->lmd_mgssec ? lsi->lsi_lmd->lmd_mgssec : "";
267
268         OBD_ALLOC_PTR(data);
269         if (data == NULL)
270                 GOTO(out_free, rc = -ENOMEM);
271
272         obd = class_name2obd(mgcname);
273         if (obd && !obd->obd_stopping) {
274                 rc = obd_set_info_async(NULL, obd->obd_self_export,
275                                         strlen(KEY_MGSSEC), KEY_MGSSEC,
276                                         strlen(mgssec), mgssec, NULL);
277                 if (rc)
278                         GOTO(out_free, rc);
279
280                 /* Re-using an existing MGC */
281                 atomic_inc(&obd->u.cli.cl_mgc_refcount);
282
283                 /* IR compatibility check, only for clients */
284                 if (lmd_is_client(lsi->lsi_lmd)) {
285                         int has_ir;
286                         int vallen = sizeof(*data);
287                         __u32 *flags = &lsi->lsi_lmd->lmd_flags;
288
289                         rc = obd_get_info(NULL, obd->obd_self_export,
290                                           strlen(KEY_CONN_DATA), KEY_CONN_DATA,
291                                           &vallen, data, NULL);
292                         LASSERT(rc == 0);
293                         has_ir = OCD_HAS_FLAG(data, IMP_RECOV);
294                         if (has_ir ^ !(*flags & LMD_FLG_NOIR)) {
295                                 /* LMD_FLG_NOIR is for test purpose only */
296                                 LCONSOLE_WARN(
297                                     "Trying to mount a client with IR setting "
298                                     "not compatible with current mgc. "
299                                     "Force to use current mgc setting that is "
300                                     "IR %s.\n",
301                                     has_ir ? "enabled" : "disabled");
302                                 if (has_ir)
303                                         *flags &= ~LMD_FLG_NOIR;
304                                 else
305                                         *flags |= LMD_FLG_NOIR;
306                         }
307                 }
308
309                 recov_bk = 0;
310                 /* If we are restarting the MGS, don't try to keep the MGC's
311                    old connection, or registration will fail. */
312                 if (IS_MGS(lsi)) {
313                         CDEBUG(D_MOUNT, "New MGS with live MGC\n");
314                         recov_bk = 1;
315                 }
316
317                 /* Try all connections, but only once (again).
318                    We don't want to block another target from starting
319                    (using its local copy of the log), but we do want to connect
320                    if at all possible. */
321                 recov_bk++;
322                 CDEBUG(D_MOUNT, "%s: Set MGC reconnect %d\n", mgcname,recov_bk);
323                 rc = obd_set_info_async(NULL, obd->obd_self_export,
324                                         sizeof(KEY_INIT_RECOV_BACKUP),
325                                         KEY_INIT_RECOV_BACKUP,
326                                         sizeof(recov_bk), &recov_bk, NULL);
327                 GOTO(out, rc = 0);
328         }
329
330         CDEBUG(D_MOUNT, "Start MGC '%s'\n", mgcname);
331
332         /* Add the primary nids for the MGS */
333         i = 0;
334         sprintf(niduuid, "%s_%x", mgcname, i);
335         if (IS_SERVER(lsi)) {
336                 ptr = lsi->lsi_lmd->lmd_mgs;
337                 CDEBUG(D_MOUNT, "mgs nids %s.\n", ptr);
338                 if (IS_MGS(lsi)) {
339                         /* Use local nids (including LO) */
340                         lnet_process_id_t id;
341                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
342                                 rc = do_lcfg(mgcname, id.nid, LCFG_ADD_UUID,
343                                              niduuid, 0, 0, 0);
344                         }
345                 } else {
346                         /* Use mgsnode= nids */
347                         /* mount -o mgsnode=nid */
348                         if (lsi->lsi_lmd->lmd_mgs) {
349                                 ptr = lsi->lsi_lmd->lmd_mgs;
350                         } else if (class_find_param(ptr, PARAM_MGSNODE,
351                                                     &ptr) != 0) {
352                                 CERROR("No MGS nids given.\n");
353                                 GOTO(out_free, rc = -EINVAL);
354                         }
355                         /*
356                          * LU-3829.
357                          * Here we only take the first mgsnid as its primary
358                          * serving mgs node, the rest mgsnid will be taken as
359                          * failover mgs node, otherwise they would be takens
360                          * as multiple nids of a single mgs node.
361                          */
362                         while (class_parse_nid(ptr, &nid, &ptr) == 0) {
363                                 rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
364                                              niduuid, 0, 0, 0);
365                                 if (rc == 0) {
366                                         i = 1;
367                                         break;
368                                 }
369                         }
370                 }
371         } else { /* client */
372                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
373                 ptr = lsi->lsi_lmd->lmd_dev;
374                 while (class_parse_nid(ptr, &nid, &ptr) == 0) {
375                         rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
376                                      niduuid, 0, 0, 0);
377                         if (rc == 0)
378                                 ++i;
379                         /* Stop at the first failover nid */
380                         if (*ptr == ':')
381                                 break;
382                 }
383         }
384         if (i == 0) {
385                 CERROR("No valid MGS nids found.\n");
386                 GOTO(out_free, rc = -EINVAL);
387         }
388         lsi->lsi_lmd->lmd_mgs_failnodes = 1;
389
390         /* Random uuid for MGC allows easier reconnects */
391         OBD_ALLOC_PTR(uuid);
392         ll_generate_random_uuid(uuidc);
393         class_uuid_unparse(uuidc, uuid);
394
395         /* Start the MGC */
396         rc = lustre_start_simple(mgcname, LUSTRE_MGC_NAME,
397                                  (char *)uuid->uuid, LUSTRE_MGS_OBDNAME,
398                                  niduuid, 0, 0);
399         OBD_FREE_PTR(uuid);
400         if (rc)
401                 GOTO(out_free, rc);
402
403         /* Add any failover MGS nids */
404         i = 1;
405         while (ptr && ((*ptr == ':' ||
406                class_find_param(ptr, PARAM_MGSNODE, &ptr) == 0))) {
407                 /* New failover node */
408                 sprintf(niduuid, "%s_%x", mgcname, i);
409                 j = 0;
410                 while (class_parse_nid_quiet(ptr, &nid, &ptr) == 0) {
411                         rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
412                                      niduuid, 0, 0, 0);
413                         if (rc == 0)
414                                 ++j;
415                         if (*ptr == ':')
416                                 break;
417                 }
418                 if (j > 0) {
419                         rc = do_lcfg(mgcname, 0, LCFG_ADD_CONN,
420                                      niduuid, 0, 0, 0);
421                         if (rc == 0)
422                                 ++i;
423                 } else {
424                         /* at ":/fsname" */
425                         break;
426                 }
427         }
428         lsi->lsi_lmd->lmd_mgs_failnodes = i;
429
430         obd = class_name2obd(mgcname);
431         if (!obd) {
432                 CERROR("Can't find mgcobd %s\n", mgcname);
433                 GOTO(out_free, rc = -ENOTCONN);
434         }
435
436         rc = obd_set_info_async(NULL, obd->obd_self_export,
437                                 strlen(KEY_MGSSEC), KEY_MGSSEC,
438                                 strlen(mgssec), mgssec, NULL);
439         if (rc)
440                 GOTO(out_free, rc);
441
442         /* Keep a refcount of servers/clients who started with "mount",
443            so we know when we can get rid of the mgc. */
444         atomic_set(&obd->u.cli.cl_mgc_refcount, 1);
445
446         /* Try all connections, but only once. */
447         recov_bk = 1;
448         rc = obd_set_info_async(NULL, obd->obd_self_export,
449                                 sizeof(KEY_INIT_RECOV_BACKUP),
450                                 KEY_INIT_RECOV_BACKUP,
451                                 sizeof(recov_bk), &recov_bk, NULL);
452         if (rc)
453                 /* nonfatal */
454                 CWARN("can't set %s %d\n", KEY_INIT_RECOV_BACKUP, rc);
455
456         /* We connect to the MGS at setup, and don't disconnect until cleanup */
457         data->ocd_connect_flags = OBD_CONNECT_VERSION | OBD_CONNECT_AT |
458                                   OBD_CONNECT_FULL20 | OBD_CONNECT_IMP_RECOV |
459                                   OBD_CONNECT_LVB_TYPE;
460
461 #if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(3, 2, 50, 0)
462         data->ocd_connect_flags |= OBD_CONNECT_MNE_SWAB;
463 #else
464 #warning "LU-1644: Remove old OBD_CONNECT_MNE_SWAB fixup and imp_need_mne_swab"
465 #endif
466
467         if (lmd_is_client(lsi->lsi_lmd) &&
468             lsi->lsi_lmd->lmd_flags & LMD_FLG_NOIR)
469                 data->ocd_connect_flags &= ~OBD_CONNECT_IMP_RECOV;
470         data->ocd_version = LUSTRE_VERSION_CODE;
471         rc = obd_connect(NULL, &exp, obd, &(obd->obd_uuid), data, NULL);
472         if (rc) {
473                 CERROR("connect failed %d\n", rc);
474                 GOTO(out, rc);
475         }
476
477         obd->u.cli.cl_mgc_mgsexp = exp;
478
479 out:
480         /* Keep the mgc info in the sb. Note that many lsi's can point
481            to the same mgc.*/
482         lsi->lsi_mgc = obd;
483 out_free:
484         mutex_unlock(&mgc_start_lock);
485
486         if (data)
487                 OBD_FREE_PTR(data);
488         if (mgcname)
489                 OBD_FREE(mgcname, len);
490         if (niduuid)
491                 OBD_FREE(niduuid, len + 2);
492         RETURN(rc);
493 }
494
495 static int lustre_stop_mgc(struct super_block *sb)
496 {
497         struct lustre_sb_info *lsi = s2lsi(sb);
498         struct obd_device *obd;
499         char *niduuid = 0, *ptr = 0;
500         int i, rc = 0, len = 0;
501         ENTRY;
502
503         if (!lsi)
504                 RETURN(-ENOENT);
505         obd = lsi->lsi_mgc;
506         if (!obd)
507                 RETURN(-ENOENT);
508         lsi->lsi_mgc = NULL;
509
510         mutex_lock(&mgc_start_lock);
511         LASSERT(atomic_read(&obd->u.cli.cl_mgc_refcount) > 0);
512         if (!atomic_dec_and_test(&obd->u.cli.cl_mgc_refcount)) {
513                 /* This is not fatal, every client that stops
514                    will call in here. */
515                 CDEBUG(D_MOUNT, "mgc still has %d references.\n",
516                        atomic_read(&obd->u.cli.cl_mgc_refcount));
517                 GOTO(out, rc = -EBUSY);
518         }
519
520         /* The MGC has no recoverable data in any case.
521          * force shotdown set in umount_begin */
522         obd->obd_no_recov = 1;
523
524         if (obd->u.cli.cl_mgc_mgsexp) {
525                 /* An error is not fatal, if we are unable to send the
526                    disconnect mgs ping evictor cleans up the export */
527                 rc = obd_disconnect(obd->u.cli.cl_mgc_mgsexp);
528                 if (rc)
529                         CDEBUG(D_MOUNT, "disconnect failed %d\n", rc);
530         }
531
532         /* Save the obdname for cleaning the nid uuids, which are
533            obdname_XX */
534         len = strlen(obd->obd_name) + 6;
535         OBD_ALLOC(niduuid, len);
536         if (niduuid) {
537                 strcpy(niduuid, obd->obd_name);
538                 ptr = niduuid + strlen(niduuid);
539         }
540
541         rc = class_manual_cleanup(obd);
542         if (rc)
543                 GOTO(out, rc);
544
545         /* Clean the nid uuids */
546         if (!niduuid)
547                 GOTO(out, rc = -ENOMEM);
548
549         for (i = 0; i < lsi->lsi_lmd->lmd_mgs_failnodes; i++) {
550                 sprintf(ptr, "_%x", i);
551                 rc = do_lcfg(LUSTRE_MGC_OBDNAME, 0, LCFG_DEL_UUID,
552                              niduuid, 0, 0, 0);
553                 if (rc)
554                         CERROR("del MDC UUID %s failed: rc = %d\n",
555                                niduuid, rc);
556         }
557 out:
558         if (niduuid)
559                 OBD_FREE(niduuid, len);
560
561         /* class_import_put will get rid of the additional connections */
562         mutex_unlock(&mgc_start_lock);
563         RETURN(rc);
564 }
565
566 /***************** lustre superblock **************/
567
568 struct lustre_sb_info *lustre_init_lsi(struct super_block *sb)
569 {
570         struct lustre_sb_info *lsi;
571         ENTRY;
572
573         OBD_ALLOC_PTR(lsi);
574         if (!lsi)
575                 RETURN(NULL);
576         OBD_ALLOC_PTR(lsi->lsi_lmd);
577         if (!lsi->lsi_lmd) {
578                 OBD_FREE_PTR(lsi);
579                 RETURN(NULL);
580         }
581
582         lsi->lsi_lmd->lmd_exclude_count = 0;
583         lsi->lsi_lmd->lmd_recovery_time_soft = 0;
584         lsi->lsi_lmd->lmd_recovery_time_hard = 0;
585         s2lsi_nocast(sb) = lsi;
586         /* we take 1 extra ref for our setup */
587         atomic_set(&lsi->lsi_mounts, 1);
588
589         /* Default umount style */
590         lsi->lsi_flags = LSI_UMOUNT_FAILOVER;
591         INIT_LIST_HEAD(&lsi->lsi_lwp_list);
592         spin_lock_init(&lsi->lsi_lwp_lock);
593
594         RETURN(lsi);
595 }
596
597 static int lustre_free_lsi(struct super_block *sb)
598 {
599         struct lustre_sb_info *lsi = s2lsi(sb);
600         ENTRY;
601
602         LASSERT(lsi != NULL);
603         CDEBUG(D_MOUNT, "Freeing lsi %p\n", lsi);
604
605         /* someone didn't call server_put_mount. */
606         LASSERT(atomic_read(&lsi->lsi_mounts) == 0);
607
608         if (lsi->lsi_lmd != NULL) {
609                 if (lsi->lsi_lmd->lmd_dev != NULL)
610                         OBD_FREE(lsi->lsi_lmd->lmd_dev,
611                                  strlen(lsi->lsi_lmd->lmd_dev) + 1);
612                 if (lsi->lsi_lmd->lmd_profile != NULL)
613                         OBD_FREE(lsi->lsi_lmd->lmd_profile,
614                                  strlen(lsi->lsi_lmd->lmd_profile) + 1);
615                 if (lsi->lsi_lmd->lmd_mgssec != NULL)
616                         OBD_FREE(lsi->lsi_lmd->lmd_mgssec,
617                                  strlen(lsi->lsi_lmd->lmd_mgssec) + 1);
618                 if (lsi->lsi_lmd->lmd_opts != NULL)
619                         OBD_FREE(lsi->lsi_lmd->lmd_opts,
620                                  strlen(lsi->lsi_lmd->lmd_opts) + 1);
621                 if (lsi->lsi_lmd->lmd_exclude_count)
622                         OBD_FREE(lsi->lsi_lmd->lmd_exclude,
623                                  sizeof(lsi->lsi_lmd->lmd_exclude[0]) *
624                                  lsi->lsi_lmd->lmd_exclude_count);
625                 if (lsi->lsi_lmd->lmd_mgs != NULL)
626                         OBD_FREE(lsi->lsi_lmd->lmd_mgs,
627                                  strlen(lsi->lsi_lmd->lmd_mgs) + 1);
628                 if (lsi->lsi_lmd->lmd_osd_type != NULL)
629                         OBD_FREE(lsi->lsi_lmd->lmd_osd_type,
630                                  strlen(lsi->lsi_lmd->lmd_osd_type) + 1);
631                 if (lsi->lsi_lmd->lmd_params != NULL)
632                         OBD_FREE(lsi->lsi_lmd->lmd_params, 4096);
633
634                 OBD_FREE(lsi->lsi_lmd, sizeof(*lsi->lsi_lmd));
635         }
636
637         LASSERT(lsi->lsi_llsbi == NULL);
638         OBD_FREE(lsi, sizeof(*lsi));
639         s2lsi_nocast(sb) = NULL;
640
641         RETURN(0);
642 }
643
644 /* The lsi has one reference for every server that is using the disk -
645    e.g. MDT, MGS, and potentially MGC */
646 int lustre_put_lsi(struct super_block *sb)
647 {
648         struct lustre_sb_info *lsi = s2lsi(sb);
649         ENTRY;
650
651         LASSERT(lsi != NULL);
652
653         CDEBUG(D_MOUNT, "put %p %d\n", sb, atomic_read(&lsi->lsi_mounts));
654         if (atomic_dec_and_test(&lsi->lsi_mounts)) {
655                 if (IS_SERVER(lsi) && lsi->lsi_osd_exp) {
656                         lu_device_put(&lsi->lsi_dt_dev->dd_lu_dev);
657                         lsi->lsi_osd_exp->exp_obd->obd_lvfs_ctxt.dt = NULL;
658                         lsi->lsi_dt_dev = NULL;
659                         obd_disconnect(lsi->lsi_osd_exp);
660                         /* wait till OSD is gone */
661                         obd_zombie_barrier();
662                 }
663                 lustre_free_lsi(sb);
664                 RETURN(1);
665         }
666         RETURN(0);
667 }
668
669 /*** SERVER NAME ***
670  * <FSNAME><SEPERATOR><TYPE><INDEX>
671  * FSNAME is between 1 and 8 characters (inclusive).
672  *      Excluded characters are '/' and ':'
673  * SEPERATOR is either ':' or '-'
674  * TYPE: "OST", "MDT", etc.
675  * INDEX: Hex representation of the index
676  */
677
678 /** Get the fsname ("lustre") from the server name ("lustre-OST003F").
679  * @param [in] svname server name including type and index
680  * @param [out] fsname Buffer to copy filesystem name prefix into.
681  *  Must have at least 'strlen(fsname) + 1' chars.
682  * @param [out] endptr if endptr isn't NULL it is set to end of fsname
683  * rc < 0  on error
684  */
685 int server_name2fsname(const char *svname, char *fsname, const char **endptr)
686 {
687         const char *dash;
688
689         dash = svname + strnlen(svname, 8); /* max fsname length is 8 */
690         for (; dash > svname && *dash != '-' && *dash != ':'; dash--)
691                 ;
692         if (dash == svname)
693                 return -EINVAL;
694
695         if (fsname != NULL) {
696                 strncpy(fsname, svname, dash - svname);
697                 fsname[dash - svname] = '\0';
698         }
699
700         if (endptr != NULL)
701                 *endptr = dash;
702
703         return 0;
704 }
705 EXPORT_SYMBOL(server_name2fsname);
706
707 /**
708  * Get service name (svname) from string
709  * rc < 0 on error
710  * if endptr isn't NULL it is set to end of fsname *
711  */
712 int server_name2svname(const char *label, char *svname, const char **endptr,
713                        size_t svsize)
714 {
715         int rc;
716         const char *dash;
717
718         /* We use server_name2fsname() just for parsing */
719         rc = server_name2fsname(label, NULL, &dash);
720         if (rc != 0)
721                 return rc;
722
723         if (endptr != NULL)
724                 *endptr = dash;
725
726         if (strlcpy(svname, dash + 1, svsize) >= svsize)
727                 return -E2BIG;
728
729         return 0;
730 }
731 EXPORT_SYMBOL(server_name2svname);
732
733 /**
734  * check server name is OST.
735  **/
736 int server_name_is_ost(const char *svname)
737 {
738         const char *dash;
739         int rc;
740
741         /* We use server_name2fsname() just for parsing */
742         rc = server_name2fsname(svname, NULL, &dash);
743         if (rc != 0)
744                 return rc;
745
746         dash++;
747
748         if (strncmp(dash, "OST", 3) == 0)
749                 return 1;
750         return 0;
751 }
752 EXPORT_SYMBOL(server_name_is_ost);
753
754 /**
755  * Get the index from the target name MDTXXXX/OSTXXXX
756  * rc = server type, or rc < 0  on error
757  **/
758 int target_name2index(const char *tgtname, __u32 *idx, const char **endptr)
759 {
760         const char *dash = tgtname;
761         unsigned long index;
762         int rc;
763
764         if (strncmp(dash, "MDT", 3) == 0)
765                 rc = LDD_F_SV_TYPE_MDT;
766         else if (strncmp(dash, "OST", 3) == 0)
767                 rc = LDD_F_SV_TYPE_OST;
768         else
769                 return -EINVAL;
770
771         dash += 3;
772
773         if (strncmp(dash, "all", 3) == 0) {
774                 if (endptr != NULL)
775                         *endptr = dash + 3;
776                 return rc | LDD_F_SV_ALL;
777         }
778
779         index = simple_strtoul(dash, (char **)endptr, 16);
780         if (idx != NULL)
781                 *idx = index;
782         return rc;
783 }
784 EXPORT_SYMBOL(target_name2index);
785
786 /* Get the index from the obd name.
787    rc = server type, or
788    rc < 0  on error
789    if endptr isn't NULL it is set to end of name */
790 int server_name2index(const char *svname, __u32 *idx, const char **endptr)
791 {
792         const char *dash;
793         int rc;
794
795         /* We use server_name2fsname() just for parsing */
796         rc = server_name2fsname(svname, NULL, &dash);
797         if (rc != 0)
798                 return rc;
799
800         dash++;
801         rc = target_name2index(dash, idx, endptr);
802         if (rc < 0)
803                 return rc;
804
805         /* Account for -mdc after index that is possible when specifying mdt */
806         if (endptr != NULL && strncmp(LUSTRE_MDC_NAME, *endptr + 1,
807                                       sizeof(LUSTRE_MDC_NAME)-1) == 0)
808                 *endptr += sizeof(LUSTRE_MDC_NAME);
809
810         return rc;
811 }
812 EXPORT_SYMBOL(server_name2index);
813
814 /*************** mount common betweeen server and client ***************/
815
816 /* Common umount */
817 int lustre_common_put_super(struct super_block *sb)
818 {
819         int rc;
820         ENTRY;
821
822         CDEBUG(D_MOUNT, "dropping sb %p\n", sb);
823
824         /* Drop a ref to the MGC */
825         rc = lustre_stop_mgc(sb);
826         if (rc && (rc != -ENOENT)) {
827                 if (rc != -EBUSY) {
828                         CERROR("Can't stop MGC: %d\n", rc);
829                         RETURN(rc);
830                 }
831                 /* BUSY just means that there's some other obd that
832                    needs the mgc.  Let him clean it up. */
833                 CDEBUG(D_MOUNT, "MGC still in use\n");
834         }
835         /* Drop a ref to the mounted disk */
836         lustre_put_lsi(sb);
837
838         RETURN(rc);
839 }
840 EXPORT_SYMBOL(lustre_common_put_super);
841
842 static void lmd_print(struct lustre_mount_data *lmd)
843 {
844         int i;
845
846         PRINT_CMD(D_MOUNT, "  mount data:\n");
847         if (lmd_is_client(lmd))
848                 PRINT_CMD(D_MOUNT, "profile: %s\n", lmd->lmd_profile);
849         PRINT_CMD(D_MOUNT, "device:  %s\n", lmd->lmd_dev);
850         PRINT_CMD(D_MOUNT, "flags:   %x\n", lmd->lmd_flags);
851
852         if (lmd->lmd_opts)
853                 PRINT_CMD(D_MOUNT, "options: %s\n", lmd->lmd_opts);
854
855         if (lmd->lmd_recovery_time_soft)
856                 PRINT_CMD(D_MOUNT, "recovery time soft: %d\n",
857                           lmd->lmd_recovery_time_soft);
858
859         if (lmd->lmd_recovery_time_hard)
860                 PRINT_CMD(D_MOUNT, "recovery time hard: %d\n",
861                           lmd->lmd_recovery_time_hard);
862
863         for (i = 0; i < lmd->lmd_exclude_count; i++) {
864                 PRINT_CMD(D_MOUNT, "exclude %d:  OST%04x\n", i,
865                           lmd->lmd_exclude[i]);
866         }
867 }
868
869 /* Is this server on the exclusion list */
870 int lustre_check_exclusion(struct super_block *sb, char *svname)
871 {
872         struct lustre_sb_info *lsi = s2lsi(sb);
873         struct lustre_mount_data *lmd = lsi->lsi_lmd;
874         __u32 index;
875         int i, rc;
876         ENTRY;
877
878         rc = server_name2index(svname, &index, NULL);
879         if (rc != LDD_F_SV_TYPE_OST)
880                 /* Only exclude OSTs */
881                 RETURN(0);
882
883         CDEBUG(D_MOUNT, "Check exclusion %s (%d) in %d of %s\n", svname,
884                index, lmd->lmd_exclude_count, lmd->lmd_dev);
885
886         for(i = 0; i < lmd->lmd_exclude_count; i++) {
887                 if (index == lmd->lmd_exclude[i]) {
888                         CWARN("Excluding %s (on exclusion list)\n", svname);
889                         RETURN(1);
890                 }
891         }
892         RETURN(0);
893 }
894
895 /* mount -v  -o exclude=lustre-OST0001:lustre-OST0002 -t lustre ... */
896 static int lmd_make_exclusion(struct lustre_mount_data *lmd, const char *ptr)
897 {
898         const char *s1 = ptr, *s2;
899         __u32 index, *exclude_list;
900         int rc = 0, devmax;
901         ENTRY;
902
903         /* The shortest an ost name can be is 8 chars: -OST0000.
904            We don't actually know the fsname at this time, so in fact
905            a user could specify any fsname. */
906         devmax = strlen(ptr) / 8 + 1;
907
908         /* temp storage until we figure out how many we have */
909         OBD_ALLOC(exclude_list, sizeof(index) * devmax);
910         if (!exclude_list)
911                 RETURN(-ENOMEM);
912
913         /* we enter this fn pointing at the '=' */
914         while (*s1 && *s1 != ' ' && *s1 != ',') {
915                 s1++;
916                 rc = server_name2index(s1, &index, &s2);
917                 if (rc < 0) {
918                         CERROR("Can't parse server name '%s': rc = %d\n",
919                                s1, rc);
920                         break;
921                 }
922                 if (rc == LDD_F_SV_TYPE_OST)
923                         exclude_list[lmd->lmd_exclude_count++] = index;
924                 else
925                         CDEBUG(D_MOUNT, "ignoring exclude %.*s: type = %#x\n",
926                                (uint)(s2-s1), s1, rc);
927                 s1 = s2;
928                 /* now we are pointing at ':' (next exclude)
929                    or ',' (end of excludes) */
930                 if (lmd->lmd_exclude_count >= devmax)
931                         break;
932         }
933         if (rc >= 0) /* non-err */
934                 rc = 0;
935
936         if (lmd->lmd_exclude_count) {
937                 /* permanent, freed in lustre_free_lsi */
938                 OBD_ALLOC(lmd->lmd_exclude, sizeof(index) *
939                           lmd->lmd_exclude_count);
940                 if (lmd->lmd_exclude) {
941                         memcpy(lmd->lmd_exclude, exclude_list,
942                                sizeof(index) * lmd->lmd_exclude_count);
943                 } else {
944                         rc = -ENOMEM;
945                         lmd->lmd_exclude_count = 0;
946                 }
947         }
948         OBD_FREE(exclude_list, sizeof(index) * devmax);
949         RETURN(rc);
950 }
951
952 static int lmd_parse_mgssec(struct lustre_mount_data *lmd, char *ptr)
953 {
954         char   *tail;
955         int     length;
956
957         if (lmd->lmd_mgssec != NULL) {
958                 OBD_FREE(lmd->lmd_mgssec, strlen(lmd->lmd_mgssec) + 1);
959                 lmd->lmd_mgssec = NULL;
960         }
961
962         tail = strchr(ptr, ',');
963         if (tail == NULL)
964                 length = strlen(ptr);
965         else
966                 length = tail - ptr;
967
968         OBD_ALLOC(lmd->lmd_mgssec, length + 1);
969         if (lmd->lmd_mgssec == NULL)
970                 return -ENOMEM;
971
972         memcpy(lmd->lmd_mgssec, ptr, length);
973         lmd->lmd_mgssec[length] = '\0';
974         return 0;
975 }
976
977 static int lmd_parse_string(char **handle, char *ptr)
978 {
979         char   *tail;
980         int     length;
981
982         if ((handle == NULL) || (ptr == NULL))
983                 return -EINVAL;
984
985         if (*handle != NULL) {
986                 OBD_FREE(*handle, strlen(*handle) + 1);
987                 *handle = NULL;
988         }
989
990         tail = strchr(ptr, ',');
991         if (tail == NULL)
992                 length = strlen(ptr);
993         else
994                 length = tail - ptr;
995
996         OBD_ALLOC(*handle, length + 1);
997         if (*handle == NULL)
998                 return -ENOMEM;
999
1000         memcpy(*handle, ptr, length);
1001         (*handle)[length] = '\0';
1002
1003         return 0;
1004 }
1005
1006 /* Collect multiple values for mgsnid specifiers */
1007 static int lmd_parse_mgs(struct lustre_mount_data *lmd, char **ptr)
1008 {
1009         lnet_nid_t nid;
1010         char *tail = *ptr;
1011         char *mgsnid;
1012         int   length;
1013         int   oldlen = 0;
1014
1015         /* Find end of nidlist */
1016         while (class_parse_nid_quiet(tail, &nid, &tail) == 0) {}
1017         length = tail - *ptr;
1018         if (length == 0) {
1019                 LCONSOLE_ERROR_MSG(0x159, "Can't parse NID '%s'\n", *ptr);
1020                 return -EINVAL;
1021         }
1022
1023         if (lmd->lmd_mgs != NULL)
1024                 oldlen = strlen(lmd->lmd_mgs) + 1;
1025
1026         OBD_ALLOC(mgsnid, oldlen + length + 1);
1027         if (mgsnid == NULL)
1028                 return -ENOMEM;
1029
1030         if (lmd->lmd_mgs != NULL) {
1031                 /* Multiple mgsnid= are taken to mean failover locations */
1032                 memcpy(mgsnid, lmd->lmd_mgs, oldlen);
1033                 mgsnid[oldlen - 1] = ':';
1034                 OBD_FREE(lmd->lmd_mgs, oldlen);
1035         }
1036         memcpy(mgsnid + oldlen, *ptr, length);
1037         mgsnid[oldlen + length] = '\0';
1038         lmd->lmd_mgs = mgsnid;
1039         *ptr = tail;
1040
1041         return 0;
1042 }
1043
1044 /** Parse mount line options
1045  * e.g. mount -v -t lustre -o abort_recov uml1:uml2:/lustre-client /mnt/lustre
1046  * dev is passed as device=uml1:/lustre by mount.lustre
1047  */
1048 static int lmd_parse(char *options, struct lustre_mount_data *lmd)
1049 {
1050         char *s1, *s2, *s3, *devname = NULL;
1051         struct lustre_mount_data *raw = (struct lustre_mount_data *)options;
1052         int rc = 0;
1053         ENTRY;
1054
1055         LASSERT(lmd);
1056         if (!options) {
1057                 LCONSOLE_ERROR_MSG(0x162, "Missing mount data: check that "
1058                                    "/sbin/mount.lustre is installed.\n");
1059                 RETURN(-EINVAL);
1060         }
1061
1062         /* Options should be a string - try to detect old lmd data */
1063         if ((raw->lmd_magic & 0xffffff00) == (LMD_MAGIC & 0xffffff00)) {
1064                 LCONSOLE_ERROR_MSG(0x163, "You're using an old version of "
1065                                    "/sbin/mount.lustre.  Please install "
1066                                    "version %s\n", LUSTRE_VERSION_STRING);
1067                 RETURN(-EINVAL);
1068         }
1069         lmd->lmd_magic = LMD_MAGIC;
1070
1071         OBD_ALLOC(lmd->lmd_params, 4096);
1072         if (lmd->lmd_params == NULL)
1073                 RETURN(-ENOMEM);
1074         lmd->lmd_params[0] = '\0';
1075
1076         /* Set default flags here */
1077
1078         s1 = options;
1079         while (*s1) {
1080                 int clear = 0;
1081                 int time_min = OBD_RECOVERY_TIME_MIN;
1082
1083                 /* Skip whitespace and extra commas */
1084                 while (*s1 == ' ' || *s1 == ',')
1085                         s1++;
1086                 s3 = s1;
1087
1088                 /* Client options are parsed in ll_options: eg. flock,
1089                    user_xattr, acl */
1090
1091                 /* Parse non-ldiskfs options here. Rather than modifying
1092                    ldiskfs, we just zero these out here */
1093                 if (strncmp(s1, "abort_recov", 11) == 0) {
1094                         lmd->lmd_flags |= LMD_FLG_ABORT_RECOV;
1095                         clear++;
1096                 } else if (strncmp(s1, "recovery_time_soft=", 19) == 0) {
1097                         lmd->lmd_recovery_time_soft = max_t(int,
1098                                 simple_strtoul(s1 + 19, NULL, 10), time_min);
1099                         clear++;
1100                 } else if (strncmp(s1, "recovery_time_hard=", 19) == 0) {
1101                         lmd->lmd_recovery_time_hard = max_t(int,
1102                                 simple_strtoul(s1 + 19, NULL, 10), time_min);
1103                         clear++;
1104                 } else if (strncmp(s1, "noir", 4) == 0) {
1105                         lmd->lmd_flags |= LMD_FLG_NOIR; /* test purpose only. */
1106                         clear++;
1107                 } else if (strncmp(s1, "nosvc", 5) == 0) {
1108                         lmd->lmd_flags |= LMD_FLG_NOSVC;
1109                         clear++;
1110                 } else if (strncmp(s1, "nomgs", 5) == 0) {
1111                         lmd->lmd_flags |= LMD_FLG_NOMGS;
1112                         clear++;
1113                 } else if (strncmp(s1, "noscrub", 7) == 0) {
1114                         lmd->lmd_flags |= LMD_FLG_NOSCRUB;
1115                         clear++;
1116                 } else if (strncmp(s1, PARAM_MGSNODE,
1117                                    sizeof(PARAM_MGSNODE) - 1) == 0) {
1118                         s2 = s1 + sizeof(PARAM_MGSNODE) - 1;
1119                         /* Assume the next mount opt is the first
1120                            invalid nid we get to. */
1121                         rc = lmd_parse_mgs(lmd, &s2);
1122                         if (rc)
1123                                 goto invalid;
1124                         s3 = s2;
1125                         clear++;
1126                 } else if (strncmp(s1, "writeconf", 9) == 0) {
1127                         lmd->lmd_flags |= LMD_FLG_WRITECONF;
1128                         clear++;
1129                 } else if (strncmp(s1, "update", 6) == 0) {
1130                         lmd->lmd_flags |= LMD_FLG_UPDATE;
1131                         clear++;
1132                 } else if (strncmp(s1, "virgin", 6) == 0) {
1133                         lmd->lmd_flags |= LMD_FLG_VIRGIN;
1134                         clear++;
1135                 } else if (strncmp(s1, "noprimnode", 10) == 0) {
1136                         lmd->lmd_flags |= LMD_FLG_NO_PRIMNODE;
1137                         clear++;
1138                 } else if (strncmp(s1, "mgssec=", 7) == 0) {
1139                         rc = lmd_parse_mgssec(lmd, s1 + 7);
1140                         if (rc)
1141                                 goto invalid;
1142                         clear++;
1143                 /* ost exclusion list */
1144                 } else if (strncmp(s1, "exclude=", 8) == 0) {
1145                         rc = lmd_make_exclusion(lmd, s1 + 7);
1146                         if (rc)
1147                                 goto invalid;
1148                         clear++;
1149                 } else if (strncmp(s1, "mgs", 3) == 0) {
1150                         /* We are an MGS */
1151                         lmd->lmd_flags |= LMD_FLG_MGS;
1152                         clear++;
1153                 } else if (strncmp(s1, "svname=", 7) == 0) {
1154                         rc = lmd_parse_string(&lmd->lmd_profile, s1 + 7);
1155                         if (rc)
1156                                 goto invalid;
1157                         clear++;
1158                 } else if (strncmp(s1, "param=", 6) == 0) {
1159                         int length;
1160                         char *tail = strchr(s1 + 6, ',');
1161                         if (tail == NULL) {
1162                                 length = strlen(s1);
1163                         } else {
1164                                 lnet_nid_t nid;
1165                                 char      *param_str = tail + 1;
1166                                 int        supplementary = 1;
1167
1168                                 while (class_parse_nid_quiet(param_str, &nid,
1169                                                              &param_str) == 0) {
1170                                         supplementary = 0;
1171                                 }
1172                                 length = param_str - s1 - supplementary;
1173                         }
1174                         length -= 6;
1175                         strncat(lmd->lmd_params, s1 + 6, length);
1176                         strcat(lmd->lmd_params, " ");
1177                         s3 = s1 + 6 + length;
1178                         clear++;
1179                 } else if (strncmp(s1, "osd=", 4) == 0) {
1180                         rc = lmd_parse_string(&lmd->lmd_osd_type, s1 + 4);
1181                         if (rc)
1182                                 goto invalid;
1183                         clear++;
1184                 }
1185                 /* Linux 2.4 doesn't pass the device, so we stuck it at the
1186                    end of the options. */
1187                 else if (strncmp(s1, "device=", 7) == 0) {
1188                         devname = s1 + 7;
1189                         /* terminate options right before device.  device
1190                            must be the last one. */
1191                         *s1 = '\0';
1192                         break;
1193                 }
1194
1195                 /* Find next opt */
1196                 s2 = strchr(s3, ',');
1197                 if (s2 == NULL) {
1198                         if (clear)
1199                                 *s1 = '\0';
1200                         break;
1201                 }
1202                 s2++;
1203                 if (clear)
1204                         memmove(s1, s2, strlen(s2) + 1);
1205                 else
1206                         s1 = s2;
1207         }
1208
1209         if (!devname) {
1210                 LCONSOLE_ERROR_MSG(0x164, "Can't find the device name "
1211                                    "(need mount option 'device=...')\n");
1212                 goto invalid;
1213         }
1214
1215         s1 = strstr(devname, ":/");
1216         if (s1) {
1217                 ++s1;
1218                 lmd->lmd_flags |= LMD_FLG_CLIENT;
1219                 /* Remove leading /s from fsname */
1220                 while (*++s1 == '/') ;
1221                 /* Freed in lustre_free_lsi */
1222                 OBD_ALLOC(lmd->lmd_profile, strlen(s1) + 8);
1223                 if (!lmd->lmd_profile)
1224                         RETURN(-ENOMEM);
1225                 sprintf(lmd->lmd_profile, "%s-client", s1);
1226         }
1227
1228         /* Freed in lustre_free_lsi */
1229         OBD_ALLOC(lmd->lmd_dev, strlen(devname) + 1);
1230         if (!lmd->lmd_dev)
1231                 RETURN(-ENOMEM);
1232         strcpy(lmd->lmd_dev, devname);
1233
1234         /* Save mount options */
1235         s1 = options + strlen(options) - 1;
1236         while (s1 >= options && (*s1 == ',' || *s1 == ' '))
1237                 *s1-- = 0;
1238         if (*options != 0) {
1239                 /* Freed in lustre_free_lsi */
1240                 OBD_ALLOC(lmd->lmd_opts, strlen(options) + 1);
1241                 if (!lmd->lmd_opts)
1242                         RETURN(-ENOMEM);
1243                 strcpy(lmd->lmd_opts, options);
1244         }
1245
1246         lmd_print(lmd);
1247         lmd->lmd_magic = LMD_MAGIC;
1248
1249         RETURN(rc);
1250
1251 invalid:
1252         CERROR("Bad mount options %s\n", options);
1253         RETURN(-EINVAL);
1254 }
1255
1256 struct lustre_mount_data2 {
1257         void *lmd2_data;
1258         struct vfsmount *lmd2_mnt;
1259 };
1260
1261 /** This is the entry point for the mount call into Lustre.
1262  * This is called when a server or client is mounted,
1263  * and this is where we start setting things up.
1264  * @param data Mount options (e.g. -o flock,abort_recov)
1265  */
1266 int lustre_fill_super(struct super_block *sb, void *data, int silent)
1267 {
1268         struct lustre_mount_data *lmd;
1269         struct lustre_mount_data2 *lmd2 = data;
1270         struct lustre_sb_info *lsi;
1271         int rc;
1272         ENTRY;
1273
1274         CDEBUG(D_MOUNT|D_VFSTRACE, "VFS Op: sb %p\n", sb);
1275
1276         lsi = lustre_init_lsi(sb);
1277         if (!lsi)
1278                 RETURN(-ENOMEM);
1279         lmd = lsi->lsi_lmd;
1280
1281         /*
1282          * Disable lockdep during mount, because mount locking patterns are
1283          * `special'.
1284          */
1285         lockdep_off();
1286
1287         /*
1288          * LU-639: the obd cleanup of last mount may not finish yet, wait here.
1289          */
1290         obd_zombie_barrier();
1291
1292         /* Figure out the lmd from the mount options */
1293         if (lmd_parse((char *)(lmd2->lmd2_data), lmd)) {
1294                 lustre_put_lsi(sb);
1295                 GOTO(out, rc = -EINVAL);
1296         }
1297
1298         if (lmd_is_client(lmd)) {
1299                 CDEBUG(D_MOUNT, "Mounting client %s\n", lmd->lmd_profile);
1300                 if (!client_fill_super) {
1301                         LCONSOLE_ERROR_MSG(0x165, "Nothing registered for "
1302                                            "client mount! Is the 'lustre' "
1303                                            "module loaded?\n");
1304                         lustre_put_lsi(sb);
1305                         rc = -ENODEV;
1306                 } else {
1307                         rc = lustre_start_mgc(sb);
1308                         if (rc) {
1309                                 lustre_put_lsi(sb);
1310                                 GOTO(out, rc);
1311                         }
1312                         /* Connect and start */
1313                         /* (should always be ll_fill_super) */
1314                         rc = (*client_fill_super)(sb, lmd2->lmd2_mnt);
1315                         /* c_f_s will call lustre_common_put_super on failure */
1316                 }
1317         } else {
1318 #ifdef HAVE_SERVER_SUPPORT
1319                 CDEBUG(D_MOUNT, "Mounting server from %s\n", lmd->lmd_dev);
1320                 rc = server_fill_super(sb);
1321                 /* s_f_s calls lustre_start_mgc after the mount because we need
1322                    the MGS nids which are stored on disk.  Plus, we may
1323                    need to start the MGS first. */
1324                 /* s_f_s will call server_put_super on failure */
1325 #else
1326                 CERROR("This is client-side-only module, "
1327                        "cannot handle server mount.\n");
1328                 rc = -EINVAL;
1329 #endif
1330         }
1331
1332         /* If error happens in fill_super() call, @lsi will be killed there.
1333          * This is why we do not put it here. */
1334         GOTO(out, rc);
1335 out:
1336         if (rc) {
1337                 CERROR("Unable to mount %s (%d)\n",
1338                        s2lsi(sb) ? lmd->lmd_dev : "", rc);
1339         } else {
1340                 CDEBUG(D_SUPER, "Mount %s complete\n",
1341                        lmd->lmd_dev);
1342         }
1343         lockdep_on();
1344         return rc;
1345 }
1346
1347
1348 /* We can't call ll_fill_super by name because it lives in a module that
1349    must be loaded after this one. */
1350 void lustre_register_client_fill_super(int (*cfs)(struct super_block *sb,
1351                                                   struct vfsmount *mnt))
1352 {
1353         client_fill_super = cfs;
1354 }
1355 EXPORT_SYMBOL(lustre_register_client_fill_super);
1356
1357 void lustre_register_kill_super_cb(void (*cfs)(struct super_block *sb))
1358 {
1359         kill_super_cb = cfs;
1360 }
1361 EXPORT_SYMBOL(lustre_register_kill_super_cb);
1362
1363 /***************** FS registration ******************/
1364 #ifdef HAVE_FSTYPE_MOUNT
1365 struct dentry *lustre_mount(struct file_system_type *fs_type, int flags,
1366                                 const char *devname, void *data)
1367 {
1368         struct lustre_mount_data2 lmd2 = { data, NULL };
1369
1370         return mount_nodev(fs_type, flags, &lmd2, lustre_fill_super);
1371 }
1372 #else
1373 int lustre_get_sb(struct file_system_type *fs_type, int flags,
1374                   const char *devname, void * data, struct vfsmount *mnt)
1375 {
1376         struct lustre_mount_data2 lmd2 = { data, mnt };
1377
1378         return get_sb_nodev(fs_type, flags, &lmd2, lustre_fill_super, mnt);
1379 }
1380 #endif
1381
1382 void lustre_kill_super(struct super_block *sb)
1383 {
1384         struct lustre_sb_info *lsi = s2lsi(sb);
1385
1386         if (kill_super_cb && lsi && !IS_SERVER(lsi))
1387                 (*kill_super_cb)(sb);
1388
1389         kill_anon_super(sb);
1390 }
1391
1392 /** Register the "lustre" fs type
1393  */
1394 struct file_system_type lustre_fs_type = {
1395         .owner        = THIS_MODULE,
1396         .name         = "lustre",
1397 #ifdef HAVE_FSTYPE_MOUNT
1398         .mount        = lustre_mount,
1399 #else
1400         .get_sb       = lustre_get_sb,
1401 #endif
1402         .kill_sb      = lustre_kill_super,
1403         .fs_flags     = FS_BINARY_MOUNTDATA | FS_REQUIRES_DEV |
1404                         FS_HAS_FIEMAP | FS_RENAME_DOES_D_MOVE,
1405 };
1406
1407 int lustre_register_fs(void)
1408 {
1409         return register_filesystem(&lustre_fs_type);
1410 }
1411
1412 int lustre_unregister_fs(void)
1413 {
1414         return unregister_filesystem(&lustre_fs_type);
1415 }