Whamcloud - gitweb
LU-4629 ldlm: fix uninitialized variable
[fs/lustre-release.git] / lustre / obdclass / obd_mount.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2013, Intel Corporation.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/obdclass/obd_mount.c
37  *
38  * Client mount routines
39  *
40  * Author: Nathan Rutman <nathan@clusterfs.com>
41  */
42
43
44 #define DEBUG_SUBSYSTEM S_CLASS
45 #define D_MOUNT (D_SUPER|D_CONFIG/*|D_WARNING */)
46 #define PRINT_CMD CDEBUG
47
48 #include <obd.h>
49 #include <obd_class.h>
50 #include <lustre/lustre_user.h>
51 #include <linux/version.h>
52 #include <lustre_log.h>
53 #include <lustre_disk.h>
54 #include <lustre_param.h>
55
56 static int (*client_fill_super)(struct super_block *sb,
57                                 struct vfsmount *mnt);
58
59 static void (*kill_super_cb)(struct super_block *sb);
60
61 /**************** config llog ********************/
62
63 /** Get a config log from the MGS and process it.
64  * This func is called for both clients and servers.
65  * Continue to process new statements appended to the logs
66  * (whenever the config lock is revoked) until lustre_end_log
67  * is called.
68  * @param sb The superblock is used by the MGC to write to the local copy of
69  *   the config log
70  * @param logname The name of the llog to replicate from the MGS
71  * @param cfg Since the same mgc may be used to follow multiple config logs
72  *   (e.g. ost1, ost2, client), the config_llog_instance keeps the state for
73  *   this log, and is added to the mgc's list of logs to follow.
74  */
75 int lustre_process_log(struct super_block *sb, char *logname,
76                      struct config_llog_instance *cfg)
77 {
78         struct lustre_cfg *lcfg;
79         struct lustre_cfg_bufs *bufs;
80         struct lustre_sb_info *lsi = s2lsi(sb);
81         struct obd_device *mgc = lsi->lsi_mgc;
82         int rc;
83         ENTRY;
84
85         LASSERT(mgc);
86         LASSERT(cfg);
87
88         OBD_ALLOC_PTR(bufs);
89         if (bufs == NULL)
90                 RETURN(-ENOMEM);
91
92         /* mgc_process_config */
93         lustre_cfg_bufs_reset(bufs, mgc->obd_name);
94         lustre_cfg_bufs_set_string(bufs, 1, logname);
95         lustre_cfg_bufs_set(bufs, 2, cfg, sizeof(*cfg));
96         lustre_cfg_bufs_set(bufs, 3, &sb, sizeof(sb));
97         lcfg = lustre_cfg_new(LCFG_LOG_START, bufs);
98         if (lcfg == NULL)
99                 GOTO(out, rc = -ENOMEM);
100         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
101         lustre_cfg_free(lcfg);
102 out:
103         OBD_FREE_PTR(bufs);
104
105         if (rc == -EINVAL)
106                 LCONSOLE_ERROR_MSG(0x15b, "%s: The configuration from log '%s'"
107                                    "failed from the MGS (%d).  Make sure this "
108                                    "client and the MGS are running compatible "
109                                    "versions of Lustre.\n",
110                                    mgc->obd_name, logname, rc);
111         else if (rc != 0)
112                 LCONSOLE_ERROR_MSG(0x15c, "%s: The configuration from log '%s' "
113                                    "failed (%d). This may be the result of "
114                                    "communication errors between this node and "
115                                    "the MGS, a bad configuration, or other "
116                                    "errors. See the syslog for more "
117                                    "information.\n", mgc->obd_name, logname,
118                                    rc);
119
120         /* class_obd_list(); */
121         RETURN(rc);
122 }
123 EXPORT_SYMBOL(lustre_process_log);
124
125 /* Stop watching this config log for updates */
126 int lustre_end_log(struct super_block *sb, char *logname,
127                        struct config_llog_instance *cfg)
128 {
129         struct lustre_cfg *lcfg;
130         struct lustre_cfg_bufs bufs;
131         struct lustre_sb_info *lsi = s2lsi(sb);
132         struct obd_device *mgc = lsi->lsi_mgc;
133         int rc;
134         ENTRY;
135
136         if (!mgc)
137                 RETURN(-ENOENT);
138
139         /* mgc_process_config */
140         lustre_cfg_bufs_reset(&bufs, mgc->obd_name);
141         lustre_cfg_bufs_set_string(&bufs, 1, logname);
142         if (cfg)
143                 lustre_cfg_bufs_set(&bufs, 2, cfg, sizeof(*cfg));
144         lcfg = lustre_cfg_new(LCFG_LOG_END, &bufs);
145         if (lcfg == NULL)
146                 RETURN(-ENOMEM);
147         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
148         lustre_cfg_free(lcfg);
149         RETURN(rc);
150 }
151 EXPORT_SYMBOL(lustre_end_log);
152
153 /**************** obd start *******************/
154
155 /** lustre_cfg_bufs are a holdover from 1.4; we can still set these up from
156  * lctl (and do for echo cli/srv.
157  */
158 int do_lcfg(char *cfgname, lnet_nid_t nid, int cmd,
159             char *s1, char *s2, char *s3, char *s4)
160 {
161         struct lustre_cfg_bufs bufs;
162         struct lustre_cfg    * lcfg = NULL;
163         int rc;
164
165         CDEBUG(D_TRACE, "lcfg %s %#x %s %s %s %s\n", cfgname,
166                cmd, s1, s2, s3, s4);
167
168         lustre_cfg_bufs_reset(&bufs, cfgname);
169         if (s1)
170                 lustre_cfg_bufs_set_string(&bufs, 1, s1);
171         if (s2)
172                 lustre_cfg_bufs_set_string(&bufs, 2, s2);
173         if (s3)
174                 lustre_cfg_bufs_set_string(&bufs, 3, s3);
175         if (s4)
176                 lustre_cfg_bufs_set_string(&bufs, 4, s4);
177
178         lcfg = lustre_cfg_new(cmd, &bufs);
179         if (lcfg == NULL)
180                 return -ENOMEM;
181         lcfg->lcfg_nid = nid;
182         rc = class_process_config(lcfg);
183         lustre_cfg_free(lcfg);
184         return(rc);
185 }
186 EXPORT_SYMBOL(do_lcfg);
187
188 /** Call class_attach and class_setup.  These methods in turn call
189  * obd type-specific methods.
190  */
191 int lustre_start_simple(char *obdname, char *type, char *uuid,
192                         char *s1, char *s2, char *s3, char *s4)
193 {
194         int rc;
195         CDEBUG(D_MOUNT, "Starting obd %s (typ=%s)\n", obdname, type);
196
197         rc = do_lcfg(obdname, 0, LCFG_ATTACH, type, uuid, 0, 0);
198         if (rc) {
199                 CERROR("%s attach error %d\n", obdname, rc);
200                 return rc;
201         }
202         rc = do_lcfg(obdname, 0, LCFG_SETUP, s1, s2, s3, s4);
203         if (rc) {
204                 CERROR("%s setup error %d\n", obdname, rc);
205                 do_lcfg(obdname, 0, LCFG_DETACH, 0, 0, 0, 0);
206         }
207         return rc;
208 }
209
210 DEFINE_MUTEX(mgc_start_lock);
211
212 /** Set up a mgc obd to process startup logs
213  *
214  * \param sb [in] super block of the mgc obd
215  *
216  * \retval 0 success, otherwise error code
217  */
218 int lustre_start_mgc(struct super_block *sb)
219 {
220         struct obd_connect_data *data = NULL;
221         struct lustre_sb_info *lsi = s2lsi(sb);
222         struct obd_device *obd;
223         struct obd_export *exp;
224         struct obd_uuid *uuid;
225         class_uuid_t uuidc;
226         lnet_nid_t nid;
227         char *mgcname = NULL, *niduuid = NULL, *mgssec = NULL;
228         char *ptr;
229         int rc = 0, i = 0, j, len;
230         ENTRY;
231
232         LASSERT(lsi->lsi_lmd);
233
234         /* Find the first non-lo MGS nid for our MGC name */
235         if (IS_SERVER(lsi)) {
236                 /* mount -o mgsnode=nid */
237                 ptr = lsi->lsi_lmd->lmd_mgs;
238                 if (lsi->lsi_lmd->lmd_mgs &&
239                     (class_parse_nid(lsi->lsi_lmd->lmd_mgs, &nid, &ptr) == 0)) {
240                         i++;
241                 } else if (IS_MGS(lsi)) {
242                         lnet_process_id_t id;
243                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
244                                 if (LNET_NETTYP(LNET_NIDNET(id.nid)) == LOLND)
245                                         continue;
246                                 nid = id.nid;
247                                 i++;
248                                 break;
249                         }
250                 }
251         } else { /* client */
252                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
253                 ptr = lsi->lsi_lmd->lmd_dev;
254                 if (class_parse_nid(ptr, &nid, &ptr) == 0)
255                         i++;
256         }
257         if (i == 0) {
258                 CERROR("No valid MGS nids found.\n");
259                 RETURN(-EINVAL);
260         }
261
262         mutex_lock(&mgc_start_lock);
263
264         len = strlen(LUSTRE_MGC_OBDNAME) + strlen(libcfs_nid2str(nid)) + 1;
265         OBD_ALLOC(mgcname, len);
266         OBD_ALLOC(niduuid, len + 2);
267         if (!mgcname || !niduuid)
268                 GOTO(out_free, rc = -ENOMEM);
269         sprintf(mgcname, "%s%s", LUSTRE_MGC_OBDNAME, libcfs_nid2str(nid));
270
271         mgssec = lsi->lsi_lmd->lmd_mgssec ? lsi->lsi_lmd->lmd_mgssec : "";
272
273         OBD_ALLOC_PTR(data);
274         if (data == NULL)
275                 GOTO(out_free, rc = -ENOMEM);
276
277         obd = class_name2obd(mgcname);
278         if (obd && !obd->obd_stopping) {
279                 int recov_bk;
280
281                 rc = obd_set_info_async(NULL, obd->obd_self_export,
282                                         strlen(KEY_MGSSEC), KEY_MGSSEC,
283                                         strlen(mgssec), mgssec, NULL);
284                 if (rc)
285                         GOTO(out_free, rc);
286
287                 /* Re-using an existing MGC */
288                 atomic_inc(&obd->u.cli.cl_mgc_refcount);
289
290                 /* IR compatibility check, only for clients */
291                 if (lmd_is_client(lsi->lsi_lmd)) {
292                         int has_ir;
293                         int vallen = sizeof(*data);
294                         __u32 *flags = &lsi->lsi_lmd->lmd_flags;
295
296                         rc = obd_get_info(NULL, obd->obd_self_export,
297                                           strlen(KEY_CONN_DATA), KEY_CONN_DATA,
298                                           &vallen, data, NULL);
299                         LASSERT(rc == 0);
300                         has_ir = OCD_HAS_FLAG(data, IMP_RECOV);
301                         if (has_ir ^ !(*flags & LMD_FLG_NOIR)) {
302                                 /* LMD_FLG_NOIR is for test purpose only */
303                                 LCONSOLE_WARN(
304                                     "Trying to mount a client with IR setting "
305                                     "not compatible with current mgc. "
306                                     "Force to use current mgc setting that is "
307                                     "IR %s.\n",
308                                     has_ir ? "enabled" : "disabled");
309                                 if (has_ir)
310                                         *flags &= ~LMD_FLG_NOIR;
311                                 else
312                                         *flags |= LMD_FLG_NOIR;
313                         }
314                 }
315
316                 recov_bk = 0;
317                 /* If we are restarting the MGS, don't try to keep the MGC's
318                    old connection, or registration will fail. */
319                 if (IS_MGS(lsi)) {
320                         CDEBUG(D_MOUNT, "New MGS with live MGC\n");
321                         recov_bk = 1;
322                 }
323
324                 /* Try all connections, but only once (again).
325                    We don't want to block another target from starting
326                    (using its local copy of the log), but we do want to connect
327                    if at all possible. */
328                 recov_bk++;
329                 CDEBUG(D_MOUNT, "%s: Set MGC reconnect %d\n", mgcname,recov_bk);
330                 rc = obd_set_info_async(NULL, obd->obd_self_export,
331                                         sizeof(KEY_INIT_RECOV_BACKUP),
332                                         KEY_INIT_RECOV_BACKUP,
333                                         sizeof(recov_bk), &recov_bk, NULL);
334                 GOTO(out, rc = 0);
335         }
336
337         CDEBUG(D_MOUNT, "Start MGC '%s'\n", mgcname);
338
339         /* Add the primary nids for the MGS */
340         i = 0;
341         sprintf(niduuid, "%s_%x", mgcname, i);
342         if (IS_SERVER(lsi)) {
343                 ptr = lsi->lsi_lmd->lmd_mgs;
344                 CDEBUG(D_MOUNT, "mgs nids %s.\n", ptr);
345                 if (IS_MGS(lsi)) {
346                         /* Use local nids (including LO) */
347                         lnet_process_id_t id;
348                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
349                                 rc = do_lcfg(mgcname, id.nid, LCFG_ADD_UUID,
350                                              niduuid, 0, 0, 0);
351                         }
352                 } else {
353                         /* Use mgsnode= nids */
354                         /* mount -o mgsnode=nid */
355                         if (lsi->lsi_lmd->lmd_mgs) {
356                                 ptr = lsi->lsi_lmd->lmd_mgs;
357                         } else if (class_find_param(ptr, PARAM_MGSNODE,
358                                                     &ptr) != 0) {
359                                 CERROR("No MGS nids given.\n");
360                                 GOTO(out_free, rc = -EINVAL);
361                         }
362                         /*
363                          * LU-3829.
364                          * Here we only take the first mgsnid as its primary
365                          * serving mgs node, the rest mgsnid will be taken as
366                          * failover mgs node, otherwise they would be takens
367                          * as multiple nids of a single mgs node.
368                          */
369                         while (class_parse_nid(ptr, &nid, &ptr) == 0) {
370                                 rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
371                                              niduuid, 0, 0, 0);
372                                 if (rc == 0) {
373                                         i = 1;
374                                         break;
375                                 }
376                         }
377                 }
378         } else { /* client */
379                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
380                 ptr = lsi->lsi_lmd->lmd_dev;
381                 while (class_parse_nid(ptr, &nid, &ptr) == 0) {
382                         rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
383                                      niduuid, 0, 0, 0);
384                         if (rc == 0)
385                                 ++i;
386                         /* Stop at the first failover nid */
387                         if (*ptr == ':')
388                                 break;
389                 }
390         }
391         if (i == 0) {
392                 CERROR("No valid MGS nids found.\n");
393                 GOTO(out_free, rc = -EINVAL);
394         }
395         lsi->lsi_lmd->lmd_mgs_failnodes = 1;
396
397         /* Random uuid for MGC allows easier reconnects */
398         OBD_ALLOC_PTR(uuid);
399         ll_generate_random_uuid(uuidc);
400         class_uuid_unparse(uuidc, uuid);
401
402         /* Start the MGC */
403         rc = lustre_start_simple(mgcname, LUSTRE_MGC_NAME,
404                                  (char *)uuid->uuid, LUSTRE_MGS_OBDNAME,
405                                  niduuid, 0, 0);
406         OBD_FREE_PTR(uuid);
407         if (rc)
408                 GOTO(out_free, rc);
409
410         /* Add any failover MGS nids */
411         i = 1;
412         while (ptr && ((*ptr == ':' ||
413                class_find_param(ptr, PARAM_MGSNODE, &ptr) == 0))) {
414                 /* New failover node */
415                 sprintf(niduuid, "%s_%x", mgcname, i);
416                 j = 0;
417                 while (class_parse_nid_quiet(ptr, &nid, &ptr) == 0) {
418                         rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
419                                      niduuid, 0, 0, 0);
420                         if (rc == 0)
421                                 ++j;
422                         if (*ptr == ':')
423                                 break;
424                 }
425                 if (j > 0) {
426                         rc = do_lcfg(mgcname, 0, LCFG_ADD_CONN,
427                                      niduuid, 0, 0, 0);
428                         if (rc == 0)
429                                 ++i;
430                 } else {
431                         /* at ":/fsname" */
432                         break;
433                 }
434         }
435         lsi->lsi_lmd->lmd_mgs_failnodes = i;
436
437         obd = class_name2obd(mgcname);
438         if (!obd) {
439                 CERROR("Can't find mgcobd %s\n", mgcname);
440                 GOTO(out_free, rc = -ENOTCONN);
441         }
442
443         rc = obd_set_info_async(NULL, obd->obd_self_export,
444                                 strlen(KEY_MGSSEC), KEY_MGSSEC,
445                                 strlen(mgssec), mgssec, NULL);
446         if (rc)
447                 GOTO(out_free, rc);
448
449         /* Keep a refcount of servers/clients who started with "mount",
450            so we know when we can get rid of the mgc. */
451         atomic_set(&obd->u.cli.cl_mgc_refcount, 1);
452
453         /* We connect to the MGS at setup, and don't disconnect until cleanup */
454         data->ocd_connect_flags = OBD_CONNECT_VERSION | OBD_CONNECT_AT |
455                                   OBD_CONNECT_FULL20 | OBD_CONNECT_IMP_RECOV |
456                                   OBD_CONNECT_LVB_TYPE;
457
458 #if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(3, 2, 50, 0)
459         data->ocd_connect_flags |= OBD_CONNECT_MNE_SWAB;
460 #else
461 #warning "LU-1644: Remove old OBD_CONNECT_MNE_SWAB fixup and imp_need_mne_swab"
462 #endif
463
464         if (lmd_is_client(lsi->lsi_lmd) &&
465             lsi->lsi_lmd->lmd_flags & LMD_FLG_NOIR)
466                 data->ocd_connect_flags &= ~OBD_CONNECT_IMP_RECOV;
467         data->ocd_version = LUSTRE_VERSION_CODE;
468         rc = obd_connect(NULL, &exp, obd, &(obd->obd_uuid), data, NULL);
469         if (rc) {
470                 CERROR("connect failed %d\n", rc);
471                 GOTO(out, rc);
472         }
473
474         obd->u.cli.cl_mgc_mgsexp = exp;
475
476 out:
477         /* Keep the mgc info in the sb. Note that many lsi's can point
478            to the same mgc.*/
479         lsi->lsi_mgc = obd;
480 out_free:
481         mutex_unlock(&mgc_start_lock);
482
483         if (data)
484                 OBD_FREE_PTR(data);
485         if (mgcname)
486                 OBD_FREE(mgcname, len);
487         if (niduuid)
488                 OBD_FREE(niduuid, len + 2);
489         RETURN(rc);
490 }
491
492 static int lustre_stop_mgc(struct super_block *sb)
493 {
494         struct lustre_sb_info *lsi = s2lsi(sb);
495         struct obd_device *obd;
496         char *niduuid = 0, *ptr = 0;
497         int i, rc = 0, len = 0;
498         ENTRY;
499
500         if (!lsi)
501                 RETURN(-ENOENT);
502         obd = lsi->lsi_mgc;
503         if (!obd)
504                 RETURN(-ENOENT);
505         lsi->lsi_mgc = NULL;
506
507         mutex_lock(&mgc_start_lock);
508         LASSERT(atomic_read(&obd->u.cli.cl_mgc_refcount) > 0);
509         if (!atomic_dec_and_test(&obd->u.cli.cl_mgc_refcount)) {
510                 /* This is not fatal, every client that stops
511                    will call in here. */
512                 CDEBUG(D_MOUNT, "mgc still has %d references.\n",
513                        atomic_read(&obd->u.cli.cl_mgc_refcount));
514                 GOTO(out, rc = -EBUSY);
515         }
516
517         /* The MGC has no recoverable data in any case.
518          * force shotdown set in umount_begin */
519         obd->obd_no_recov = 1;
520
521         if (obd->u.cli.cl_mgc_mgsexp) {
522                 /* An error is not fatal, if we are unable to send the
523                    disconnect mgs ping evictor cleans up the export */
524                 rc = obd_disconnect(obd->u.cli.cl_mgc_mgsexp);
525                 if (rc)
526                         CDEBUG(D_MOUNT, "disconnect failed %d\n", rc);
527         }
528
529         /* Save the obdname for cleaning the nid uuids, which are
530            obdname_XX */
531         len = strlen(obd->obd_name) + 6;
532         OBD_ALLOC(niduuid, len);
533         if (niduuid) {
534                 strcpy(niduuid, obd->obd_name);
535                 ptr = niduuid + strlen(niduuid);
536         }
537
538         rc = class_manual_cleanup(obd);
539         if (rc)
540                 GOTO(out, rc);
541
542         /* Clean the nid uuids */
543         if (!niduuid)
544                 GOTO(out, rc = -ENOMEM);
545
546         for (i = 0; i < lsi->lsi_lmd->lmd_mgs_failnodes; i++) {
547                 sprintf(ptr, "_%x", i);
548                 rc = do_lcfg(LUSTRE_MGC_OBDNAME, 0, LCFG_DEL_UUID,
549                              niduuid, 0, 0, 0);
550                 if (rc)
551                         CERROR("del MDC UUID %s failed: rc = %d\n",
552                                niduuid, rc);
553         }
554 out:
555         if (niduuid)
556                 OBD_FREE(niduuid, len);
557
558         /* class_import_put will get rid of the additional connections */
559         mutex_unlock(&mgc_start_lock);
560         RETURN(rc);
561 }
562
563 /***************** lustre superblock **************/
564
565 struct lustre_sb_info *lustre_init_lsi(struct super_block *sb)
566 {
567         struct lustre_sb_info *lsi;
568         ENTRY;
569
570         OBD_ALLOC_PTR(lsi);
571         if (!lsi)
572                 RETURN(NULL);
573         OBD_ALLOC_PTR(lsi->lsi_lmd);
574         if (!lsi->lsi_lmd) {
575                 OBD_FREE_PTR(lsi);
576                 RETURN(NULL);
577         }
578
579         lsi->lsi_lmd->lmd_exclude_count = 0;
580         lsi->lsi_lmd->lmd_recovery_time_soft = 0;
581         lsi->lsi_lmd->lmd_recovery_time_hard = 0;
582         s2lsi_nocast(sb) = lsi;
583         /* we take 1 extra ref for our setup */
584         atomic_set(&lsi->lsi_mounts, 1);
585
586         /* Default umount style */
587         lsi->lsi_flags = LSI_UMOUNT_FAILOVER;
588         INIT_LIST_HEAD(&lsi->lsi_lwp_list);
589         spin_lock_init(&lsi->lsi_lwp_lock);
590
591         RETURN(lsi);
592 }
593
594 static int lustre_free_lsi(struct super_block *sb)
595 {
596         struct lustre_sb_info *lsi = s2lsi(sb);
597         ENTRY;
598
599         LASSERT(lsi != NULL);
600         CDEBUG(D_MOUNT, "Freeing lsi %p\n", lsi);
601
602         /* someone didn't call server_put_mount. */
603         LASSERT(atomic_read(&lsi->lsi_mounts) == 0);
604
605         if (lsi->lsi_lmd != NULL) {
606                 if (lsi->lsi_lmd->lmd_dev != NULL)
607                         OBD_FREE(lsi->lsi_lmd->lmd_dev,
608                                  strlen(lsi->lsi_lmd->lmd_dev) + 1);
609                 if (lsi->lsi_lmd->lmd_profile != NULL)
610                         OBD_FREE(lsi->lsi_lmd->lmd_profile,
611                                  strlen(lsi->lsi_lmd->lmd_profile) + 1);
612                 if (lsi->lsi_lmd->lmd_mgssec != NULL)
613                         OBD_FREE(lsi->lsi_lmd->lmd_mgssec,
614                                  strlen(lsi->lsi_lmd->lmd_mgssec) + 1);
615                 if (lsi->lsi_lmd->lmd_opts != NULL)
616                         OBD_FREE(lsi->lsi_lmd->lmd_opts,
617                                  strlen(lsi->lsi_lmd->lmd_opts) + 1);
618                 if (lsi->lsi_lmd->lmd_exclude_count)
619                         OBD_FREE(lsi->lsi_lmd->lmd_exclude,
620                                  sizeof(lsi->lsi_lmd->lmd_exclude[0]) *
621                                  lsi->lsi_lmd->lmd_exclude_count);
622                 if (lsi->lsi_lmd->lmd_mgs != NULL)
623                         OBD_FREE(lsi->lsi_lmd->lmd_mgs,
624                                  strlen(lsi->lsi_lmd->lmd_mgs) + 1);
625                 if (lsi->lsi_lmd->lmd_osd_type != NULL)
626                         OBD_FREE(lsi->lsi_lmd->lmd_osd_type,
627                                  strlen(lsi->lsi_lmd->lmd_osd_type) + 1);
628                 if (lsi->lsi_lmd->lmd_params != NULL)
629                         OBD_FREE(lsi->lsi_lmd->lmd_params, 4096);
630
631                 OBD_FREE(lsi->lsi_lmd, sizeof(*lsi->lsi_lmd));
632         }
633
634         LASSERT(lsi->lsi_llsbi == NULL);
635         OBD_FREE(lsi, sizeof(*lsi));
636         s2lsi_nocast(sb) = NULL;
637
638         RETURN(0);
639 }
640
641 /* The lsi has one reference for every server that is using the disk -
642    e.g. MDT, MGS, and potentially MGC */
643 int lustre_put_lsi(struct super_block *sb)
644 {
645         struct lustre_sb_info *lsi = s2lsi(sb);
646         ENTRY;
647
648         LASSERT(lsi != NULL);
649
650         CDEBUG(D_MOUNT, "put %p %d\n", sb, atomic_read(&lsi->lsi_mounts));
651         if (atomic_dec_and_test(&lsi->lsi_mounts)) {
652                 if (IS_SERVER(lsi) && lsi->lsi_osd_exp) {
653                         lu_device_put(&lsi->lsi_dt_dev->dd_lu_dev);
654                         lsi->lsi_osd_exp->exp_obd->obd_lvfs_ctxt.dt = NULL;
655                         lsi->lsi_dt_dev = NULL;
656                         obd_disconnect(lsi->lsi_osd_exp);
657                         /* wait till OSD is gone */
658                         obd_zombie_barrier();
659                 }
660                 lustre_free_lsi(sb);
661                 RETURN(1);
662         }
663         RETURN(0);
664 }
665
666 /*** SERVER NAME ***
667  * <FSNAME><SEPERATOR><TYPE><INDEX>
668  * FSNAME is between 1 and 8 characters (inclusive).
669  *      Excluded characters are '/' and ':'
670  * SEPERATOR is either ':' or '-'
671  * TYPE: "OST", "MDT", etc.
672  * INDEX: Hex representation of the index
673  */
674
675 /** Get the fsname ("lustre") from the server name ("lustre-OST003F").
676  * @param [in] svname server name including type and index
677  * @param [out] fsname Buffer to copy filesystem name prefix into.
678  *  Must have at least 'strlen(fsname) + 1' chars.
679  * @param [out] endptr if endptr isn't NULL it is set to end of fsname
680  * rc < 0  on error
681  */
682 int server_name2fsname(const char *svname, char *fsname, const char **endptr)
683 {
684         const char *dash;
685
686         dash = svname + strnlen(svname, 8); /* max fsname length is 8 */
687         for (; dash > svname && *dash != '-' && *dash != ':'; dash--)
688                 ;
689         if (dash == svname)
690                 return -EINVAL;
691
692         if (fsname != NULL) {
693                 strncpy(fsname, svname, dash - svname);
694                 fsname[dash - svname] = '\0';
695         }
696
697         if (endptr != NULL)
698                 *endptr = dash;
699
700         return 0;
701 }
702 EXPORT_SYMBOL(server_name2fsname);
703
704 /**
705  * Get service name (svname) from string
706  * rc < 0 on error
707  * if endptr isn't NULL it is set to end of fsname *
708  */
709 int server_name2svname(const char *label, char *svname, const char **endptr,
710                        size_t svsize)
711 {
712         int rc;
713         const char *dash;
714
715         /* We use server_name2fsname() just for parsing */
716         rc = server_name2fsname(label, NULL, &dash);
717         if (rc != 0)
718                 return rc;
719
720         if (endptr != NULL)
721                 *endptr = dash;
722
723         if (strlcpy(svname, dash + 1, svsize) >= svsize)
724                 return -E2BIG;
725
726         return 0;
727 }
728 EXPORT_SYMBOL(server_name2svname);
729
730 /**
731  * check server name is OST.
732  **/
733 int server_name_is_ost(const char *svname)
734 {
735         const char *dash;
736         int rc;
737
738         /* We use server_name2fsname() just for parsing */
739         rc = server_name2fsname(svname, NULL, &dash);
740         if (rc != 0)
741                 return rc;
742
743         dash++;
744
745         if (strncmp(dash, "OST", 3) == 0)
746                 return 1;
747         return 0;
748 }
749 EXPORT_SYMBOL(server_name_is_ost);
750
751 /**
752  * Get the index from the target name MDTXXXX/OSTXXXX
753  * rc = server type, or rc < 0  on error
754  **/
755 int target_name2index(const char *tgtname, __u32 *idx, const char **endptr)
756 {
757         const char *dash = tgtname;
758         unsigned long index;
759         int rc;
760
761         if (strncmp(dash, "MDT", 3) == 0)
762                 rc = LDD_F_SV_TYPE_MDT;
763         else if (strncmp(dash, "OST", 3) == 0)
764                 rc = LDD_F_SV_TYPE_OST;
765         else
766                 return -EINVAL;
767
768         dash += 3;
769
770         if (strncmp(dash, "all", 3) == 0) {
771                 if (endptr != NULL)
772                         *endptr = dash + 3;
773                 return rc | LDD_F_SV_ALL;
774         }
775
776         index = simple_strtoul(dash, (char **)endptr, 16);
777         if (idx != NULL)
778                 *idx = index;
779         return rc;
780 }
781 EXPORT_SYMBOL(target_name2index);
782
783 /* Get the index from the obd name.
784    rc = server type, or
785    rc < 0  on error
786    if endptr isn't NULL it is set to end of name */
787 int server_name2index(const char *svname, __u32 *idx, const char **endptr)
788 {
789         const char *dash;
790         int rc;
791
792         /* We use server_name2fsname() just for parsing */
793         rc = server_name2fsname(svname, NULL, &dash);
794         if (rc != 0)
795                 return rc;
796
797         dash++;
798         rc = target_name2index(dash, idx, endptr);
799         if (rc < 0)
800                 return rc;
801
802         /* Account for -mdc after index that is possible when specifying mdt */
803         if (endptr != NULL && strncmp(LUSTRE_MDC_NAME, *endptr + 1,
804                                       sizeof(LUSTRE_MDC_NAME)-1) == 0)
805                 *endptr += sizeof(LUSTRE_MDC_NAME);
806
807         return rc;
808 }
809 EXPORT_SYMBOL(server_name2index);
810
811 /*************** mount common betweeen server and client ***************/
812
813 /* Common umount */
814 int lustre_common_put_super(struct super_block *sb)
815 {
816         int rc;
817         ENTRY;
818
819         CDEBUG(D_MOUNT, "dropping sb %p\n", sb);
820
821         /* Drop a ref to the MGC */
822         rc = lustre_stop_mgc(sb);
823         if (rc && (rc != -ENOENT)) {
824                 if (rc != -EBUSY) {
825                         CERROR("Can't stop MGC: %d\n", rc);
826                         RETURN(rc);
827                 }
828                 /* BUSY just means that there's some other obd that
829                    needs the mgc.  Let him clean it up. */
830                 CDEBUG(D_MOUNT, "MGC still in use\n");
831         }
832         /* Drop a ref to the mounted disk */
833         lustre_put_lsi(sb);
834
835         RETURN(rc);
836 }
837 EXPORT_SYMBOL(lustre_common_put_super);
838
839 static void lmd_print(struct lustre_mount_data *lmd)
840 {
841         int i;
842
843         PRINT_CMD(D_MOUNT, "  mount data:\n");
844         if (lmd_is_client(lmd))
845                 PRINT_CMD(D_MOUNT, "profile: %s\n", lmd->lmd_profile);
846         PRINT_CMD(D_MOUNT, "device:  %s\n", lmd->lmd_dev);
847         PRINT_CMD(D_MOUNT, "flags:   %x\n", lmd->lmd_flags);
848
849         if (lmd->lmd_opts)
850                 PRINT_CMD(D_MOUNT, "options: %s\n", lmd->lmd_opts);
851
852         if (lmd->lmd_recovery_time_soft)
853                 PRINT_CMD(D_MOUNT, "recovery time soft: %d\n",
854                           lmd->lmd_recovery_time_soft);
855
856         if (lmd->lmd_recovery_time_hard)
857                 PRINT_CMD(D_MOUNT, "recovery time hard: %d\n",
858                           lmd->lmd_recovery_time_hard);
859
860         for (i = 0; i < lmd->lmd_exclude_count; i++) {
861                 PRINT_CMD(D_MOUNT, "exclude %d:  OST%04x\n", i,
862                           lmd->lmd_exclude[i]);
863         }
864 }
865
866 /* Is this server on the exclusion list */
867 int lustre_check_exclusion(struct super_block *sb, char *svname)
868 {
869         struct lustre_sb_info *lsi = s2lsi(sb);
870         struct lustre_mount_data *lmd = lsi->lsi_lmd;
871         __u32 index;
872         int i, rc;
873         ENTRY;
874
875         rc = server_name2index(svname, &index, NULL);
876         if (rc != LDD_F_SV_TYPE_OST)
877                 /* Only exclude OSTs */
878                 RETURN(0);
879
880         CDEBUG(D_MOUNT, "Check exclusion %s (%d) in %d of %s\n", svname,
881                index, lmd->lmd_exclude_count, lmd->lmd_dev);
882
883         for(i = 0; i < lmd->lmd_exclude_count; i++) {
884                 if (index == lmd->lmd_exclude[i]) {
885                         CWARN("Excluding %s (on exclusion list)\n", svname);
886                         RETURN(1);
887                 }
888         }
889         RETURN(0);
890 }
891
892 /* mount -v  -o exclude=lustre-OST0001:lustre-OST0002 -t lustre ... */
893 static int lmd_make_exclusion(struct lustre_mount_data *lmd, const char *ptr)
894 {
895         const char *s1 = ptr, *s2;
896         __u32 index, *exclude_list;
897         int rc = 0, devmax;
898         ENTRY;
899
900         /* The shortest an ost name can be is 8 chars: -OST0000.
901            We don't actually know the fsname at this time, so in fact
902            a user could specify any fsname. */
903         devmax = strlen(ptr) / 8 + 1;
904
905         /* temp storage until we figure out how many we have */
906         OBD_ALLOC(exclude_list, sizeof(index) * devmax);
907         if (!exclude_list)
908                 RETURN(-ENOMEM);
909
910         /* we enter this fn pointing at the '=' */
911         while (*s1 && *s1 != ' ' && *s1 != ',') {
912                 s1++;
913                 rc = server_name2index(s1, &index, &s2);
914                 if (rc < 0) {
915                         CERROR("Can't parse server name '%s': rc = %d\n",
916                                s1, rc);
917                         break;
918                 }
919                 if (rc == LDD_F_SV_TYPE_OST)
920                         exclude_list[lmd->lmd_exclude_count++] = index;
921                 else
922                         CDEBUG(D_MOUNT, "ignoring exclude %.*s: type = %#x\n",
923                                (uint)(s2-s1), s1, rc);
924                 s1 = s2;
925                 /* now we are pointing at ':' (next exclude)
926                    or ',' (end of excludes) */
927                 if (lmd->lmd_exclude_count >= devmax)
928                         break;
929         }
930         if (rc >= 0) /* non-err */
931                 rc = 0;
932
933         if (lmd->lmd_exclude_count) {
934                 /* permanent, freed in lustre_free_lsi */
935                 OBD_ALLOC(lmd->lmd_exclude, sizeof(index) *
936                           lmd->lmd_exclude_count);
937                 if (lmd->lmd_exclude) {
938                         memcpy(lmd->lmd_exclude, exclude_list,
939                                sizeof(index) * lmd->lmd_exclude_count);
940                 } else {
941                         rc = -ENOMEM;
942                         lmd->lmd_exclude_count = 0;
943                 }
944         }
945         OBD_FREE(exclude_list, sizeof(index) * devmax);
946         RETURN(rc);
947 }
948
949 static int lmd_parse_mgssec(struct lustre_mount_data *lmd, char *ptr)
950 {
951         char   *tail;
952         int     length;
953
954         if (lmd->lmd_mgssec != NULL) {
955                 OBD_FREE(lmd->lmd_mgssec, strlen(lmd->lmd_mgssec) + 1);
956                 lmd->lmd_mgssec = NULL;
957         }
958
959         tail = strchr(ptr, ',');
960         if (tail == NULL)
961                 length = strlen(ptr);
962         else
963                 length = tail - ptr;
964
965         OBD_ALLOC(lmd->lmd_mgssec, length + 1);
966         if (lmd->lmd_mgssec == NULL)
967                 return -ENOMEM;
968
969         memcpy(lmd->lmd_mgssec, ptr, length);
970         lmd->lmd_mgssec[length] = '\0';
971         return 0;
972 }
973
974 static int lmd_parse_string(char **handle, char *ptr)
975 {
976         char   *tail;
977         int     length;
978
979         if ((handle == NULL) || (ptr == NULL))
980                 return -EINVAL;
981
982         if (*handle != NULL) {
983                 OBD_FREE(*handle, strlen(*handle) + 1);
984                 *handle = NULL;
985         }
986
987         tail = strchr(ptr, ',');
988         if (tail == NULL)
989                 length = strlen(ptr);
990         else
991                 length = tail - ptr;
992
993         OBD_ALLOC(*handle, length + 1);
994         if (*handle == NULL)
995                 return -ENOMEM;
996
997         memcpy(*handle, ptr, length);
998         (*handle)[length] = '\0';
999
1000         return 0;
1001 }
1002
1003 /* Collect multiple values for mgsnid specifiers */
1004 static int lmd_parse_mgs(struct lustre_mount_data *lmd, char **ptr)
1005 {
1006         lnet_nid_t nid;
1007         char *tail = *ptr;
1008         char *mgsnid;
1009         int   length;
1010         int   oldlen = 0;
1011
1012         /* Find end of nidlist */
1013         while (class_parse_nid_quiet(tail, &nid, &tail) == 0) {}
1014         length = tail - *ptr;
1015         if (length == 0) {
1016                 LCONSOLE_ERROR_MSG(0x159, "Can't parse NID '%s'\n", *ptr);
1017                 return -EINVAL;
1018         }
1019
1020         if (lmd->lmd_mgs != NULL)
1021                 oldlen = strlen(lmd->lmd_mgs) + 1;
1022
1023         OBD_ALLOC(mgsnid, oldlen + length + 1);
1024         if (mgsnid == NULL)
1025                 return -ENOMEM;
1026
1027         if (lmd->lmd_mgs != NULL) {
1028                 /* Multiple mgsnid= are taken to mean failover locations */
1029                 memcpy(mgsnid, lmd->lmd_mgs, oldlen);
1030                 mgsnid[oldlen - 1] = ':';
1031                 OBD_FREE(lmd->lmd_mgs, oldlen);
1032         }
1033         memcpy(mgsnid + oldlen, *ptr, length);
1034         mgsnid[oldlen + length] = '\0';
1035         lmd->lmd_mgs = mgsnid;
1036         *ptr = tail;
1037
1038         return 0;
1039 }
1040
1041 /** Parse mount line options
1042  * e.g. mount -v -t lustre -o abort_recov uml1:uml2:/lustre-client /mnt/lustre
1043  * dev is passed as device=uml1:/lustre by mount.lustre
1044  */
1045 static int lmd_parse(char *options, struct lustre_mount_data *lmd)
1046 {
1047         char *s1, *s2, *s3, *devname = NULL;
1048         struct lustre_mount_data *raw = (struct lustre_mount_data *)options;
1049         int rc = 0;
1050         ENTRY;
1051
1052         LASSERT(lmd);
1053         if (!options) {
1054                 LCONSOLE_ERROR_MSG(0x162, "Missing mount data: check that "
1055                                    "/sbin/mount.lustre is installed.\n");
1056                 RETURN(-EINVAL);
1057         }
1058
1059         /* Options should be a string - try to detect old lmd data */
1060         if ((raw->lmd_magic & 0xffffff00) == (LMD_MAGIC & 0xffffff00)) {
1061                 LCONSOLE_ERROR_MSG(0x163, "You're using an old version of "
1062                                    "/sbin/mount.lustre.  Please install "
1063                                    "version %s\n", LUSTRE_VERSION_STRING);
1064                 RETURN(-EINVAL);
1065         }
1066         lmd->lmd_magic = LMD_MAGIC;
1067
1068         OBD_ALLOC(lmd->lmd_params, 4096);
1069         if (lmd->lmd_params == NULL)
1070                 RETURN(-ENOMEM);
1071         lmd->lmd_params[0] = '\0';
1072
1073         /* Set default flags here */
1074
1075         s1 = options;
1076         while (*s1) {
1077                 int clear = 0;
1078                 int time_min = OBD_RECOVERY_TIME_MIN;
1079
1080                 /* Skip whitespace and extra commas */
1081                 while (*s1 == ' ' || *s1 == ',')
1082                         s1++;
1083                 s3 = s1;
1084
1085                 /* Client options are parsed in ll_options: eg. flock,
1086                    user_xattr, acl */
1087
1088                 /* Parse non-ldiskfs options here. Rather than modifying
1089                    ldiskfs, we just zero these out here */
1090                 if (strncmp(s1, "abort_recov", 11) == 0) {
1091                         lmd->lmd_flags |= LMD_FLG_ABORT_RECOV;
1092                         clear++;
1093                 } else if (strncmp(s1, "recovery_time_soft=", 19) == 0) {
1094                         lmd->lmd_recovery_time_soft = max_t(int,
1095                                 simple_strtoul(s1 + 19, NULL, 10), time_min);
1096                         clear++;
1097                 } else if (strncmp(s1, "recovery_time_hard=", 19) == 0) {
1098                         lmd->lmd_recovery_time_hard = max_t(int,
1099                                 simple_strtoul(s1 + 19, NULL, 10), time_min);
1100                         clear++;
1101                 } else if (strncmp(s1, "noir", 4) == 0) {
1102                         lmd->lmd_flags |= LMD_FLG_NOIR; /* test purpose only. */
1103                         clear++;
1104                 } else if (strncmp(s1, "nosvc", 5) == 0) {
1105                         lmd->lmd_flags |= LMD_FLG_NOSVC;
1106                         clear++;
1107                 } else if (strncmp(s1, "nomgs", 5) == 0) {
1108                         lmd->lmd_flags |= LMD_FLG_NOMGS;
1109                         clear++;
1110                 } else if (strncmp(s1, "noscrub", 7) == 0) {
1111                         lmd->lmd_flags |= LMD_FLG_NOSCRUB;
1112                         clear++;
1113                 } else if (strncmp(s1, PARAM_MGSNODE,
1114                                    sizeof(PARAM_MGSNODE) - 1) == 0) {
1115                         s2 = s1 + sizeof(PARAM_MGSNODE) - 1;
1116                         /* Assume the next mount opt is the first
1117                            invalid nid we get to. */
1118                         rc = lmd_parse_mgs(lmd, &s2);
1119                         if (rc)
1120                                 goto invalid;
1121                         s3 = s2;
1122                         clear++;
1123                 } else if (strncmp(s1, "writeconf", 9) == 0) {
1124                         lmd->lmd_flags |= LMD_FLG_WRITECONF;
1125                         clear++;
1126                 } else if (strncmp(s1, "update", 6) == 0) {
1127                         lmd->lmd_flags |= LMD_FLG_UPDATE;
1128                         clear++;
1129                 } else if (strncmp(s1, "virgin", 6) == 0) {
1130                         lmd->lmd_flags |= LMD_FLG_VIRGIN;
1131                         clear++;
1132                 } else if (strncmp(s1, "noprimnode", 10) == 0) {
1133                         lmd->lmd_flags |= LMD_FLG_NO_PRIMNODE;
1134                         clear++;
1135                 } else if (strncmp(s1, "mgssec=", 7) == 0) {
1136                         rc = lmd_parse_mgssec(lmd, s1 + 7);
1137                         if (rc)
1138                                 goto invalid;
1139                         clear++;
1140                 /* ost exclusion list */
1141                 } else if (strncmp(s1, "exclude=", 8) == 0) {
1142                         rc = lmd_make_exclusion(lmd, s1 + 7);
1143                         if (rc)
1144                                 goto invalid;
1145                         clear++;
1146                 } else if (strncmp(s1, "mgs", 3) == 0) {
1147                         /* We are an MGS */
1148                         lmd->lmd_flags |= LMD_FLG_MGS;
1149                         clear++;
1150                 } else if (strncmp(s1, "svname=", 7) == 0) {
1151                         rc = lmd_parse_string(&lmd->lmd_profile, s1 + 7);
1152                         if (rc)
1153                                 goto invalid;
1154                         clear++;
1155                 } else if (strncmp(s1, "param=", 6) == 0) {
1156                         int length;
1157                         char *tail = strchr(s1 + 6, ',');
1158                         if (tail == NULL) {
1159                                 length = strlen(s1);
1160                         } else {
1161                                 lnet_nid_t nid;
1162                                 char      *param_str = tail + 1;
1163                                 int        supplementary = 1;
1164
1165                                 while (class_parse_nid_quiet(param_str, &nid,
1166                                                              &param_str) == 0) {
1167                                         supplementary = 0;
1168                                 }
1169                                 length = param_str - s1 - supplementary;
1170                         }
1171                         length -= 6;
1172                         strncat(lmd->lmd_params, s1 + 6, length);
1173                         strcat(lmd->lmd_params, " ");
1174                         s3 = s1 + 6 + length;
1175                         clear++;
1176                 } else if (strncmp(s1, "osd=", 4) == 0) {
1177                         rc = lmd_parse_string(&lmd->lmd_osd_type, s1 + 4);
1178                         if (rc)
1179                                 goto invalid;
1180                         clear++;
1181                 }
1182                 /* Linux 2.4 doesn't pass the device, so we stuck it at the
1183                    end of the options. */
1184                 else if (strncmp(s1, "device=", 7) == 0) {
1185                         devname = s1 + 7;
1186                         /* terminate options right before device.  device
1187                            must be the last one. */
1188                         *s1 = '\0';
1189                         break;
1190                 }
1191
1192                 /* Find next opt */
1193                 s2 = strchr(s3, ',');
1194                 if (s2 == NULL) {
1195                         if (clear)
1196                                 *s1 = '\0';
1197                         break;
1198                 }
1199                 s2++;
1200                 if (clear)
1201                         memmove(s1, s2, strlen(s2) + 1);
1202                 else
1203                         s1 = s2;
1204         }
1205
1206         if (!devname) {
1207                 LCONSOLE_ERROR_MSG(0x164, "Can't find the device name "
1208                                    "(need mount option 'device=...')\n");
1209                 goto invalid;
1210         }
1211
1212         s1 = strstr(devname, ":/");
1213         if (s1) {
1214                 ++s1;
1215                 lmd->lmd_flags |= LMD_FLG_CLIENT;
1216                 /* Remove leading /s from fsname */
1217                 while (*++s1 == '/') ;
1218                 /* Freed in lustre_free_lsi */
1219                 OBD_ALLOC(lmd->lmd_profile, strlen(s1) + 8);
1220                 if (!lmd->lmd_profile)
1221                         RETURN(-ENOMEM);
1222                 sprintf(lmd->lmd_profile, "%s-client", s1);
1223         }
1224
1225         /* Freed in lustre_free_lsi */
1226         OBD_ALLOC(lmd->lmd_dev, strlen(devname) + 1);
1227         if (!lmd->lmd_dev)
1228                 RETURN(-ENOMEM);
1229         strcpy(lmd->lmd_dev, devname);
1230
1231         /* Save mount options */
1232         s1 = options + strlen(options) - 1;
1233         while (s1 >= options && (*s1 == ',' || *s1 == ' '))
1234                 *s1-- = 0;
1235         if (*options != 0) {
1236                 /* Freed in lustre_free_lsi */
1237                 OBD_ALLOC(lmd->lmd_opts, strlen(options) + 1);
1238                 if (!lmd->lmd_opts)
1239                         RETURN(-ENOMEM);
1240                 strcpy(lmd->lmd_opts, options);
1241         }
1242
1243         lmd_print(lmd);
1244         lmd->lmd_magic = LMD_MAGIC;
1245
1246         RETURN(rc);
1247
1248 invalid:
1249         CERROR("Bad mount options %s\n", options);
1250         RETURN(-EINVAL);
1251 }
1252
1253 struct lustre_mount_data2 {
1254         void *lmd2_data;
1255         struct vfsmount *lmd2_mnt;
1256 };
1257
1258 /** This is the entry point for the mount call into Lustre.
1259  * This is called when a server or client is mounted,
1260  * and this is where we start setting things up.
1261  * @param data Mount options (e.g. -o flock,abort_recov)
1262  */
1263 int lustre_fill_super(struct super_block *sb, void *data, int silent)
1264 {
1265         struct lustre_mount_data *lmd;
1266         struct lustre_mount_data2 *lmd2 = data;
1267         struct lustre_sb_info *lsi;
1268         int rc;
1269         ENTRY;
1270
1271         CDEBUG(D_MOUNT|D_VFSTRACE, "VFS Op: sb %p\n", sb);
1272
1273         lsi = lustre_init_lsi(sb);
1274         if (!lsi)
1275                 RETURN(-ENOMEM);
1276         lmd = lsi->lsi_lmd;
1277
1278         /*
1279          * Disable lockdep during mount, because mount locking patterns are
1280          * `special'.
1281          */
1282         lockdep_off();
1283
1284         /*
1285          * LU-639: the obd cleanup of last mount may not finish yet, wait here.
1286          */
1287         obd_zombie_barrier();
1288
1289         /* Figure out the lmd from the mount options */
1290         if (lmd_parse((char *)(lmd2->lmd2_data), lmd)) {
1291                 lustre_put_lsi(sb);
1292                 GOTO(out, rc = -EINVAL);
1293         }
1294
1295         if (lmd_is_client(lmd)) {
1296                 CDEBUG(D_MOUNT, "Mounting client %s\n", lmd->lmd_profile);
1297                 if (client_fill_super == NULL)
1298                         request_module("lustre");
1299                 if (client_fill_super == NULL) {
1300                         LCONSOLE_ERROR_MSG(0x165, "Nothing registered for "
1301                                            "client mount! Is the 'lustre' "
1302                                            "module loaded?\n");
1303                         lustre_put_lsi(sb);
1304                         rc = -ENODEV;
1305                 } else {
1306                         rc = lustre_start_mgc(sb);
1307                         if (rc) {
1308                                 lustre_put_lsi(sb);
1309                                 GOTO(out, rc);
1310                         }
1311                         /* Connect and start */
1312                         /* (should always be ll_fill_super) */
1313                         rc = (*client_fill_super)(sb, lmd2->lmd2_mnt);
1314                         /* c_f_s will call lustre_common_put_super on failure */
1315                 }
1316         } else {
1317 #ifdef HAVE_SERVER_SUPPORT
1318                 CDEBUG(D_MOUNT, "Mounting server from %s\n", lmd->lmd_dev);
1319                 rc = server_fill_super(sb);
1320                 /* s_f_s calls lustre_start_mgc after the mount because we need
1321                    the MGS nids which are stored on disk.  Plus, we may
1322                    need to start the MGS first. */
1323                 /* s_f_s will call server_put_super on failure */
1324 #else
1325                 CERROR("This is client-side-only module, "
1326                        "cannot handle server mount.\n");
1327                 rc = -EINVAL;
1328 #endif
1329         }
1330
1331         /* If error happens in fill_super() call, @lsi will be killed there.
1332          * This is why we do not put it here. */
1333         GOTO(out, rc);
1334 out:
1335         if (rc) {
1336                 CERROR("Unable to mount %s (%d)\n",
1337                        s2lsi(sb) ? lmd->lmd_dev : "", rc);
1338         } else {
1339                 CDEBUG(D_SUPER, "Mount %s complete\n",
1340                        lmd->lmd_dev);
1341         }
1342         lockdep_on();
1343         return rc;
1344 }
1345
1346
1347 /* We can't call ll_fill_super by name because it lives in a module that
1348    must be loaded after this one. */
1349 void lustre_register_client_fill_super(int (*cfs)(struct super_block *sb,
1350                                                   struct vfsmount *mnt))
1351 {
1352         client_fill_super = cfs;
1353 }
1354 EXPORT_SYMBOL(lustre_register_client_fill_super);
1355
1356 void lustre_register_kill_super_cb(void (*cfs)(struct super_block *sb))
1357 {
1358         kill_super_cb = cfs;
1359 }
1360 EXPORT_SYMBOL(lustre_register_kill_super_cb);
1361
1362 /***************** FS registration ******************/
1363 #ifdef HAVE_FSTYPE_MOUNT
1364 struct dentry *lustre_mount(struct file_system_type *fs_type, int flags,
1365                                 const char *devname, void *data)
1366 {
1367         struct lustre_mount_data2 lmd2 = { data, NULL };
1368
1369         return mount_nodev(fs_type, flags, &lmd2, lustre_fill_super);
1370 }
1371 #else
1372 int lustre_get_sb(struct file_system_type *fs_type, int flags,
1373                   const char *devname, void * data, struct vfsmount *mnt)
1374 {
1375         struct lustre_mount_data2 lmd2 = { data, mnt };
1376
1377         return get_sb_nodev(fs_type, flags, &lmd2, lustre_fill_super, mnt);
1378 }
1379 #endif
1380
1381 void lustre_kill_super(struct super_block *sb)
1382 {
1383         struct lustre_sb_info *lsi = s2lsi(sb);
1384
1385         if (kill_super_cb && lsi && !IS_SERVER(lsi))
1386                 (*kill_super_cb)(sb);
1387
1388         kill_anon_super(sb);
1389 }
1390
1391 /** Register the "lustre" fs type
1392  */
1393 struct file_system_type lustre_fs_type = {
1394         .owner        = THIS_MODULE,
1395         .name         = "lustre",
1396 #ifdef HAVE_FSTYPE_MOUNT
1397         .mount        = lustre_mount,
1398 #else
1399         .get_sb       = lustre_get_sb,
1400 #endif
1401         .kill_sb      = lustre_kill_super,
1402         .fs_flags     = FS_BINARY_MOUNTDATA | FS_REQUIRES_DEV |
1403                         FS_HAS_FIEMAP | FS_RENAME_DOES_D_MOVE,
1404 };
1405 MODULE_ALIAS_FS("lustre");
1406
1407 int lustre_register_fs(void)
1408 {
1409         return register_filesystem(&lustre_fs_type);
1410 }
1411
1412 int lustre_unregister_fs(void)
1413 {
1414         return unregister_filesystem(&lustre_fs_type);
1415 }