Whamcloud - gitweb
LU-4604 obdclass: handle ldt_device_nr/ldt_linkage properly
[fs/lustre-release.git] / lustre / obdclass / obd_mount.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2013, Intel Corporation.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/obdclass/obd_mount.c
37  *
38  * Client mount routines
39  *
40  * Author: Nathan Rutman <nathan@clusterfs.com>
41  */
42
43
44 #define DEBUG_SUBSYSTEM S_CLASS
45 #define D_MOUNT (D_SUPER|D_CONFIG/*|D_WARNING */)
46 #define PRINT_CMD CDEBUG
47
48 #include <obd.h>
49 #include <lvfs.h>
50 #include <obd_class.h>
51 #include <lustre/lustre_user.h>
52 #include <linux/version.h>
53 #include <lustre_log.h>
54 #include <lustre_disk.h>
55 #include <lustre_param.h>
56
57 static int (*client_fill_super)(struct super_block *sb,
58                                 struct vfsmount *mnt);
59
60 static void (*kill_super_cb)(struct super_block *sb);
61
62 /**************** config llog ********************/
63
64 /** Get a config log from the MGS and process it.
65  * This func is called for both clients and servers.
66  * Continue to process new statements appended to the logs
67  * (whenever the config lock is revoked) until lustre_end_log
68  * is called.
69  * @param sb The superblock is used by the MGC to write to the local copy of
70  *   the config log
71  * @param logname The name of the llog to replicate from the MGS
72  * @param cfg Since the same mgc may be used to follow multiple config logs
73  *   (e.g. ost1, ost2, client), the config_llog_instance keeps the state for
74  *   this log, and is added to the mgc's list of logs to follow.
75  */
76 int lustre_process_log(struct super_block *sb, char *logname,
77                      struct config_llog_instance *cfg)
78 {
79         struct lustre_cfg *lcfg;
80         struct lustre_cfg_bufs *bufs;
81         struct lustre_sb_info *lsi = s2lsi(sb);
82         struct obd_device *mgc = lsi->lsi_mgc;
83         int rc;
84         ENTRY;
85
86         LASSERT(mgc);
87         LASSERT(cfg);
88
89         OBD_ALLOC_PTR(bufs);
90         if (bufs == NULL)
91                 RETURN(-ENOMEM);
92
93         /* mgc_process_config */
94         lustre_cfg_bufs_reset(bufs, mgc->obd_name);
95         lustre_cfg_bufs_set_string(bufs, 1, logname);
96         lustre_cfg_bufs_set(bufs, 2, cfg, sizeof(*cfg));
97         lustre_cfg_bufs_set(bufs, 3, &sb, sizeof(sb));
98         lcfg = lustre_cfg_new(LCFG_LOG_START, bufs);
99         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
100         lustre_cfg_free(lcfg);
101
102         OBD_FREE_PTR(bufs);
103
104         if (rc == -EINVAL)
105                 LCONSOLE_ERROR_MSG(0x15b, "%s: The configuration from log '%s'"
106                                    "failed from the MGS (%d).  Make sure this "
107                                    "client and the MGS are running compatible "
108                                    "versions of Lustre.\n",
109                                    mgc->obd_name, logname, rc);
110
111         if (rc)
112                 LCONSOLE_ERROR_MSG(0x15c, "%s: The configuration from log '%s' "
113                                    "failed (%d). This may be the result of "
114                                    "communication errors between this node and "
115                                    "the MGS, a bad configuration, or other "
116                                    "errors. See the syslog for more "
117                                    "information.\n", mgc->obd_name, logname,
118                                    rc);
119
120         /* class_obd_list(); */
121         RETURN(rc);
122 }
123 EXPORT_SYMBOL(lustre_process_log);
124
125 /* Stop watching this config log for updates */
126 int lustre_end_log(struct super_block *sb, char *logname,
127                        struct config_llog_instance *cfg)
128 {
129         struct lustre_cfg *lcfg;
130         struct lustre_cfg_bufs bufs;
131         struct lustre_sb_info *lsi = s2lsi(sb);
132         struct obd_device *mgc = lsi->lsi_mgc;
133         int rc;
134         ENTRY;
135
136         if (!mgc)
137                 RETURN(-ENOENT);
138
139         /* mgc_process_config */
140         lustre_cfg_bufs_reset(&bufs, mgc->obd_name);
141         lustre_cfg_bufs_set_string(&bufs, 1, logname);
142         if (cfg)
143                 lustre_cfg_bufs_set(&bufs, 2, cfg, sizeof(*cfg));
144         lcfg = lustre_cfg_new(LCFG_LOG_END, &bufs);
145         rc = obd_process_config(mgc, sizeof(*lcfg), lcfg);
146         lustre_cfg_free(lcfg);
147         RETURN(rc);
148 }
149 EXPORT_SYMBOL(lustre_end_log);
150
151 /**************** obd start *******************/
152
153 /** lustre_cfg_bufs are a holdover from 1.4; we can still set these up from
154  * lctl (and do for echo cli/srv.
155  */
156 int do_lcfg(char *cfgname, lnet_nid_t nid, int cmd,
157             char *s1, char *s2, char *s3, char *s4)
158 {
159         struct lustre_cfg_bufs bufs;
160         struct lustre_cfg    * lcfg = NULL;
161         int rc;
162
163         CDEBUG(D_TRACE, "lcfg %s %#x %s %s %s %s\n", cfgname,
164                cmd, s1, s2, s3, s4);
165
166         lustre_cfg_bufs_reset(&bufs, cfgname);
167         if (s1)
168                 lustre_cfg_bufs_set_string(&bufs, 1, s1);
169         if (s2)
170                 lustre_cfg_bufs_set_string(&bufs, 2, s2);
171         if (s3)
172                 lustre_cfg_bufs_set_string(&bufs, 3, s3);
173         if (s4)
174                 lustre_cfg_bufs_set_string(&bufs, 4, s4);
175
176         lcfg = lustre_cfg_new(cmd, &bufs);
177         lcfg->lcfg_nid = nid;
178         rc = class_process_config(lcfg);
179         lustre_cfg_free(lcfg);
180         return(rc);
181 }
182 EXPORT_SYMBOL(do_lcfg);
183
184 /** Call class_attach and class_setup.  These methods in turn call
185  * obd type-specific methods.
186  */
187 int lustre_start_simple(char *obdname, char *type, char *uuid,
188                         char *s1, char *s2, char *s3, char *s4)
189 {
190         int rc;
191         CDEBUG(D_MOUNT, "Starting obd %s (typ=%s)\n", obdname, type);
192
193         rc = do_lcfg(obdname, 0, LCFG_ATTACH, type, uuid, 0, 0);
194         if (rc) {
195                 CERROR("%s attach error %d\n", obdname, rc);
196                 return rc;
197         }
198         rc = do_lcfg(obdname, 0, LCFG_SETUP, s1, s2, s3, s4);
199         if (rc) {
200                 CERROR("%s setup error %d\n", obdname, rc);
201                 do_lcfg(obdname, 0, LCFG_DETACH, 0, 0, 0, 0);
202         }
203         return rc;
204 }
205
206 DEFINE_MUTEX(mgc_start_lock);
207
208 /** Set up a mgc obd to process startup logs
209  *
210  * \param sb [in] super block of the mgc obd
211  *
212  * \retval 0 success, otherwise error code
213  */
214 int lustre_start_mgc(struct super_block *sb)
215 {
216         struct obd_connect_data *data = NULL;
217         struct lustre_sb_info *lsi = s2lsi(sb);
218         struct obd_device *obd;
219         struct obd_export *exp;
220         struct obd_uuid *uuid;
221         class_uuid_t uuidc;
222         lnet_nid_t nid;
223         char *mgcname = NULL, *niduuid = NULL, *mgssec = NULL;
224         char *ptr;
225         int recov_bk;
226         int rc = 0, i = 0, j, len;
227         ENTRY;
228
229         LASSERT(lsi->lsi_lmd);
230
231         /* Find the first non-lo MGS nid for our MGC name */
232         if (IS_SERVER(lsi)) {
233                 /* mount -o mgsnode=nid */
234                 ptr = lsi->lsi_lmd->lmd_mgs;
235                 if (lsi->lsi_lmd->lmd_mgs &&
236                     (class_parse_nid(lsi->lsi_lmd->lmd_mgs, &nid, &ptr) == 0)) {
237                         i++;
238                 } else if (IS_MGS(lsi)) {
239                         lnet_process_id_t id;
240                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
241                                 if (LNET_NETTYP(LNET_NIDNET(id.nid)) == LOLND)
242                                         continue;
243                                 nid = id.nid;
244                                 i++;
245                                 break;
246                         }
247                 }
248         } else { /* client */
249                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
250                 ptr = lsi->lsi_lmd->lmd_dev;
251                 if (class_parse_nid(ptr, &nid, &ptr) == 0)
252                         i++;
253         }
254         if (i == 0) {
255                 CERROR("No valid MGS nids found.\n");
256                 RETURN(-EINVAL);
257         }
258
259         mutex_lock(&mgc_start_lock);
260
261         len = strlen(LUSTRE_MGC_OBDNAME) + strlen(libcfs_nid2str(nid)) + 1;
262         OBD_ALLOC(mgcname, len);
263         OBD_ALLOC(niduuid, len + 2);
264         if (!mgcname || !niduuid)
265                 GOTO(out_free, rc = -ENOMEM);
266         sprintf(mgcname, "%s%s", LUSTRE_MGC_OBDNAME, libcfs_nid2str(nid));
267
268         mgssec = lsi->lsi_lmd->lmd_mgssec ? lsi->lsi_lmd->lmd_mgssec : "";
269
270         OBD_ALLOC_PTR(data);
271         if (data == NULL)
272                 GOTO(out_free, rc = -ENOMEM);
273
274         obd = class_name2obd(mgcname);
275         if (obd && !obd->obd_stopping) {
276                 rc = obd_set_info_async(NULL, obd->obd_self_export,
277                                         strlen(KEY_MGSSEC), KEY_MGSSEC,
278                                         strlen(mgssec), mgssec, NULL);
279                 if (rc)
280                         GOTO(out_free, rc);
281
282                 /* Re-using an existing MGC */
283                 cfs_atomic_inc(&obd->u.cli.cl_mgc_refcount);
284
285                 /* IR compatibility check, only for clients */
286                 if (lmd_is_client(lsi->lsi_lmd)) {
287                         int has_ir;
288                         int vallen = sizeof(*data);
289                         __u32 *flags = &lsi->lsi_lmd->lmd_flags;
290
291                         rc = obd_get_info(NULL, obd->obd_self_export,
292                                           strlen(KEY_CONN_DATA), KEY_CONN_DATA,
293                                           &vallen, data, NULL);
294                         LASSERT(rc == 0);
295                         has_ir = OCD_HAS_FLAG(data, IMP_RECOV);
296                         if (has_ir ^ !(*flags & LMD_FLG_NOIR)) {
297                                 /* LMD_FLG_NOIR is for test purpose only */
298                                 LCONSOLE_WARN(
299                                     "Trying to mount a client with IR setting "
300                                     "not compatible with current mgc. "
301                                     "Force to use current mgc setting that is "
302                                     "IR %s.\n",
303                                     has_ir ? "enabled" : "disabled");
304                                 if (has_ir)
305                                         *flags &= ~LMD_FLG_NOIR;
306                                 else
307                                         *flags |= LMD_FLG_NOIR;
308                         }
309                 }
310
311                 recov_bk = 0;
312                 /* If we are restarting the MGS, don't try to keep the MGC's
313                    old connection, or registration will fail. */
314                 if (IS_MGS(lsi)) {
315                         CDEBUG(D_MOUNT, "New MGS with live MGC\n");
316                         recov_bk = 1;
317                 }
318
319                 /* Try all connections, but only once (again).
320                    We don't want to block another target from starting
321                    (using its local copy of the log), but we do want to connect
322                    if at all possible. */
323                 recov_bk++;
324                 CDEBUG(D_MOUNT, "%s: Set MGC reconnect %d\n", mgcname,recov_bk);
325                 rc = obd_set_info_async(NULL, obd->obd_self_export,
326                                         sizeof(KEY_INIT_RECOV_BACKUP),
327                                         KEY_INIT_RECOV_BACKUP,
328                                         sizeof(recov_bk), &recov_bk, NULL);
329                 GOTO(out, rc = 0);
330         }
331
332         CDEBUG(D_MOUNT, "Start MGC '%s'\n", mgcname);
333
334         /* Add the primary nids for the MGS */
335         i = 0;
336         sprintf(niduuid, "%s_%x", mgcname, i);
337         if (IS_SERVER(lsi)) {
338                 ptr = lsi->lsi_lmd->lmd_mgs;
339                 CDEBUG(D_MOUNT, "mgs nids %s.\n", ptr);
340                 if (IS_MGS(lsi)) {
341                         /* Use local nids (including LO) */
342                         lnet_process_id_t id;
343                         while ((rc = LNetGetId(i++, &id)) != -ENOENT) {
344                                 rc = do_lcfg(mgcname, id.nid, LCFG_ADD_UUID,
345                                              niduuid, 0, 0, 0);
346                         }
347                 } else {
348                         /* Use mgsnode= nids */
349                         /* mount -o mgsnode=nid */
350                         if (lsi->lsi_lmd->lmd_mgs) {
351                                 ptr = lsi->lsi_lmd->lmd_mgs;
352                         } else if (class_find_param(ptr, PARAM_MGSNODE,
353                                                     &ptr) != 0) {
354                                 CERROR("No MGS nids given.\n");
355                                 GOTO(out_free, rc = -EINVAL);
356                         }
357                         /*
358                          * LU-3829.
359                          * Here we only take the first mgsnid as its primary
360                          * serving mgs node, the rest mgsnid will be taken as
361                          * failover mgs node, otherwise they would be takens
362                          * as multiple nids of a single mgs node.
363                          */
364                         while (class_parse_nid(ptr, &nid, &ptr) == 0) {
365                                 rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
366                                              niduuid, 0, 0, 0);
367                                 if (rc == 0) {
368                                         i = 1;
369                                         break;
370                                 }
371                         }
372                 }
373         } else { /* client */
374                 /* Use nids from mount line: uml1,1@elan:uml2,2@elan:/lustre */
375                 ptr = lsi->lsi_lmd->lmd_dev;
376                 while (class_parse_nid(ptr, &nid, &ptr) == 0) {
377                         rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
378                                      niduuid, 0, 0, 0);
379                         if (rc == 0)
380                                 ++i;
381                         /* Stop at the first failover nid */
382                         if (*ptr == ':')
383                                 break;
384                 }
385         }
386         if (i == 0) {
387                 CERROR("No valid MGS nids found.\n");
388                 GOTO(out_free, rc = -EINVAL);
389         }
390         lsi->lsi_lmd->lmd_mgs_failnodes = 1;
391
392         /* Random uuid for MGC allows easier reconnects */
393         OBD_ALLOC_PTR(uuid);
394         ll_generate_random_uuid(uuidc);
395         class_uuid_unparse(uuidc, uuid);
396
397         /* Start the MGC */
398         rc = lustre_start_simple(mgcname, LUSTRE_MGC_NAME,
399                                  (char *)uuid->uuid, LUSTRE_MGS_OBDNAME,
400                                  niduuid, 0, 0);
401         OBD_FREE_PTR(uuid);
402         if (rc)
403                 GOTO(out_free, rc);
404
405         /* Add any failover MGS nids */
406         i = 1;
407         while (ptr && ((*ptr == ':' ||
408                class_find_param(ptr, PARAM_MGSNODE, &ptr) == 0))) {
409                 /* New failover node */
410                 sprintf(niduuid, "%s_%x", mgcname, i);
411                 j = 0;
412                 while (class_parse_nid_quiet(ptr, &nid, &ptr) == 0) {
413                         rc = do_lcfg(mgcname, nid, LCFG_ADD_UUID,
414                                      niduuid, 0, 0, 0);
415                         if (rc == 0)
416                                 ++j;
417                         if (*ptr == ':')
418                                 break;
419                 }
420                 if (j > 0) {
421                         rc = do_lcfg(mgcname, 0, LCFG_ADD_CONN,
422                                      niduuid, 0, 0, 0);
423                         if (rc == 0)
424                                 ++i;
425                 } else {
426                         /* at ":/fsname" */
427                         break;
428                 }
429         }
430         lsi->lsi_lmd->lmd_mgs_failnodes = i;
431
432         obd = class_name2obd(mgcname);
433         if (!obd) {
434                 CERROR("Can't find mgcobd %s\n", mgcname);
435                 GOTO(out_free, rc = -ENOTCONN);
436         }
437
438         rc = obd_set_info_async(NULL, obd->obd_self_export,
439                                 strlen(KEY_MGSSEC), KEY_MGSSEC,
440                                 strlen(mgssec), mgssec, NULL);
441         if (rc)
442                 GOTO(out_free, rc);
443
444         /* Keep a refcount of servers/clients who started with "mount",
445            so we know when we can get rid of the mgc. */
446         cfs_atomic_set(&obd->u.cli.cl_mgc_refcount, 1);
447
448         /* Try all connections, but only once. */
449         recov_bk = 1;
450         rc = obd_set_info_async(NULL, obd->obd_self_export,
451                                 sizeof(KEY_INIT_RECOV_BACKUP),
452                                 KEY_INIT_RECOV_BACKUP,
453                                 sizeof(recov_bk), &recov_bk, NULL);
454         if (rc)
455                 /* nonfatal */
456                 CWARN("can't set %s %d\n", KEY_INIT_RECOV_BACKUP, rc);
457
458         /* We connect to the MGS at setup, and don't disconnect until cleanup */
459         data->ocd_connect_flags = OBD_CONNECT_VERSION | OBD_CONNECT_AT |
460                                   OBD_CONNECT_FULL20 | OBD_CONNECT_IMP_RECOV |
461                                   OBD_CONNECT_LVB_TYPE;
462
463 #if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(3, 2, 50, 0)
464         data->ocd_connect_flags |= OBD_CONNECT_MNE_SWAB;
465 #else
466 #warning "LU-1644: Remove old OBD_CONNECT_MNE_SWAB fixup and imp_need_mne_swab"
467 #endif
468
469         if (lmd_is_client(lsi->lsi_lmd) &&
470             lsi->lsi_lmd->lmd_flags & LMD_FLG_NOIR)
471                 data->ocd_connect_flags &= ~OBD_CONNECT_IMP_RECOV;
472         data->ocd_version = LUSTRE_VERSION_CODE;
473         rc = obd_connect(NULL, &exp, obd, &(obd->obd_uuid), data, NULL);
474         if (rc) {
475                 CERROR("connect failed %d\n", rc);
476                 GOTO(out, rc);
477         }
478
479         obd->u.cli.cl_mgc_mgsexp = exp;
480
481 out:
482         /* Keep the mgc info in the sb. Note that many lsi's can point
483            to the same mgc.*/
484         lsi->lsi_mgc = obd;
485 out_free:
486         mutex_unlock(&mgc_start_lock);
487
488         if (data)
489                 OBD_FREE_PTR(data);
490         if (mgcname)
491                 OBD_FREE(mgcname, len);
492         if (niduuid)
493                 OBD_FREE(niduuid, len + 2);
494         RETURN(rc);
495 }
496
497 static int lustre_stop_mgc(struct super_block *sb)
498 {
499         struct lustre_sb_info *lsi = s2lsi(sb);
500         struct obd_device *obd;
501         char *niduuid = 0, *ptr = 0;
502         int i, rc = 0, len = 0;
503         ENTRY;
504
505         if (!lsi)
506                 RETURN(-ENOENT);
507         obd = lsi->lsi_mgc;
508         if (!obd)
509                 RETURN(-ENOENT);
510         lsi->lsi_mgc = NULL;
511
512         mutex_lock(&mgc_start_lock);
513         LASSERT(cfs_atomic_read(&obd->u.cli.cl_mgc_refcount) > 0);
514         if (!cfs_atomic_dec_and_test(&obd->u.cli.cl_mgc_refcount)) {
515                 /* This is not fatal, every client that stops
516                    will call in here. */
517                 CDEBUG(D_MOUNT, "mgc still has %d references.\n",
518                        cfs_atomic_read(&obd->u.cli.cl_mgc_refcount));
519                 GOTO(out, rc = -EBUSY);
520         }
521
522         /* The MGC has no recoverable data in any case.
523          * force shotdown set in umount_begin */
524         obd->obd_no_recov = 1;
525
526         if (obd->u.cli.cl_mgc_mgsexp) {
527                 /* An error is not fatal, if we are unable to send the
528                    disconnect mgs ping evictor cleans up the export */
529                 rc = obd_disconnect(obd->u.cli.cl_mgc_mgsexp);
530                 if (rc)
531                         CDEBUG(D_MOUNT, "disconnect failed %d\n", rc);
532         }
533
534         /* Save the obdname for cleaning the nid uuids, which are
535            obdname_XX */
536         len = strlen(obd->obd_name) + 6;
537         OBD_ALLOC(niduuid, len);
538         if (niduuid) {
539                 strcpy(niduuid, obd->obd_name);
540                 ptr = niduuid + strlen(niduuid);
541         }
542
543         rc = class_manual_cleanup(obd);
544         if (rc)
545                 GOTO(out, rc);
546
547         /* Clean the nid uuids */
548         if (!niduuid)
549                 GOTO(out, rc = -ENOMEM);
550
551         for (i = 0; i < lsi->lsi_lmd->lmd_mgs_failnodes; i++) {
552                 sprintf(ptr, "_%x", i);
553                 rc = do_lcfg(LUSTRE_MGC_OBDNAME, 0, LCFG_DEL_UUID,
554                              niduuid, 0, 0, 0);
555                 if (rc)
556                         CERROR("del MDC UUID %s failed: rc = %d\n",
557                                niduuid, rc);
558         }
559 out:
560         if (niduuid)
561                 OBD_FREE(niduuid, len);
562
563         /* class_import_put will get rid of the additional connections */
564         mutex_unlock(&mgc_start_lock);
565         RETURN(rc);
566 }
567
568 /***************** lustre superblock **************/
569
570 struct lustre_sb_info *lustre_init_lsi(struct super_block *sb)
571 {
572         struct lustre_sb_info *lsi;
573         ENTRY;
574
575         OBD_ALLOC_PTR(lsi);
576         if (!lsi)
577                 RETURN(NULL);
578         OBD_ALLOC_PTR(lsi->lsi_lmd);
579         if (!lsi->lsi_lmd) {
580                 OBD_FREE_PTR(lsi);
581                 RETURN(NULL);
582         }
583
584         lsi->lsi_lmd->lmd_exclude_count = 0;
585         lsi->lsi_lmd->lmd_recovery_time_soft = 0;
586         lsi->lsi_lmd->lmd_recovery_time_hard = 0;
587         s2lsi_nocast(sb) = lsi;
588         /* we take 1 extra ref for our setup */
589         cfs_atomic_set(&lsi->lsi_mounts, 1);
590
591         /* Default umount style */
592         lsi->lsi_flags = LSI_UMOUNT_FAILOVER;
593
594         RETURN(lsi);
595 }
596
597 static int lustre_free_lsi(struct super_block *sb)
598 {
599         struct lustre_sb_info *lsi = s2lsi(sb);
600         ENTRY;
601
602         LASSERT(lsi != NULL);
603         CDEBUG(D_MOUNT, "Freeing lsi %p\n", lsi);
604
605         /* someone didn't call server_put_mount. */
606         LASSERT(cfs_atomic_read(&lsi->lsi_mounts) == 0);
607
608         if (lsi->lsi_lmd != NULL) {
609                 if (lsi->lsi_lmd->lmd_dev != NULL)
610                         OBD_FREE(lsi->lsi_lmd->lmd_dev,
611                                  strlen(lsi->lsi_lmd->lmd_dev) + 1);
612                 if (lsi->lsi_lmd->lmd_profile != NULL)
613                         OBD_FREE(lsi->lsi_lmd->lmd_profile,
614                                  strlen(lsi->lsi_lmd->lmd_profile) + 1);
615                 if (lsi->lsi_lmd->lmd_mgssec != NULL)
616                         OBD_FREE(lsi->lsi_lmd->lmd_mgssec,
617                                  strlen(lsi->lsi_lmd->lmd_mgssec) + 1);
618                 if (lsi->lsi_lmd->lmd_opts != NULL)
619                         OBD_FREE(lsi->lsi_lmd->lmd_opts,
620                                  strlen(lsi->lsi_lmd->lmd_opts) + 1);
621                 if (lsi->lsi_lmd->lmd_exclude_count)
622                         OBD_FREE(lsi->lsi_lmd->lmd_exclude,
623                                  sizeof(lsi->lsi_lmd->lmd_exclude[0]) *
624                                  lsi->lsi_lmd->lmd_exclude_count);
625                 if (lsi->lsi_lmd->lmd_mgs != NULL)
626                         OBD_FREE(lsi->lsi_lmd->lmd_mgs,
627                                  strlen(lsi->lsi_lmd->lmd_mgs) + 1);
628                 if (lsi->lsi_lmd->lmd_osd_type != NULL)
629                         OBD_FREE(lsi->lsi_lmd->lmd_osd_type,
630                                  strlen(lsi->lsi_lmd->lmd_osd_type) + 1);
631                 if (lsi->lsi_lmd->lmd_params != NULL)
632                         OBD_FREE(lsi->lsi_lmd->lmd_params, 4096);
633
634                 OBD_FREE(lsi->lsi_lmd, sizeof(*lsi->lsi_lmd));
635         }
636
637         LASSERT(lsi->lsi_llsbi == NULL);
638         OBD_FREE(lsi, sizeof(*lsi));
639         s2lsi_nocast(sb) = NULL;
640
641         RETURN(0);
642 }
643
644 /* The lsi has one reference for every server that is using the disk -
645    e.g. MDT, MGS, and potentially MGC */
646 int lustre_put_lsi(struct super_block *sb)
647 {
648         struct lustre_sb_info *lsi = s2lsi(sb);
649         ENTRY;
650
651         LASSERT(lsi != NULL);
652
653         CDEBUG(D_MOUNT, "put %p %d\n", sb, cfs_atomic_read(&lsi->lsi_mounts));
654         if (cfs_atomic_dec_and_test(&lsi->lsi_mounts)) {
655                 if (IS_SERVER(lsi) && lsi->lsi_osd_exp) {
656                         lu_device_put(&lsi->lsi_dt_dev->dd_lu_dev);
657                         lsi->lsi_osd_exp->exp_obd->obd_lvfs_ctxt.dt = NULL;
658                         lsi->lsi_dt_dev = NULL;
659                         obd_disconnect(lsi->lsi_osd_exp);
660                         /* wait till OSD is gone */
661                         obd_zombie_barrier();
662                 }
663                 lustre_free_lsi(sb);
664                 RETURN(1);
665         }
666         RETURN(0);
667 }
668
669 /*** SERVER NAME ***
670  * <FSNAME><SEPERATOR><TYPE><INDEX>
671  * FSNAME is between 1 and 8 characters (inclusive).
672  *      Excluded characters are '/' and ':'
673  * SEPERATOR is either ':' or '-'
674  * TYPE: "OST", "MDT", etc.
675  * INDEX: Hex representation of the index
676  */
677
678 /** Get the fsname ("lustre") from the server name ("lustre-OST003F").
679  * @param [in] svname server name including type and index
680  * @param [out] fsname Buffer to copy filesystem name prefix into.
681  *  Must have at least 'strlen(fsname) + 1' chars.
682  * @param [out] endptr if endptr isn't NULL it is set to end of fsname
683  * rc < 0  on error
684  */
685 int server_name2fsname(const char *svname, char *fsname, const char **endptr)
686 {
687         const char *dash;
688
689         dash = svname + strnlen(svname, 8); /* max fsname length is 8 */
690         for (; dash > svname && *dash != '-' && *dash != ':'; dash--)
691                 ;
692         if (dash == svname)
693                 return -EINVAL;
694
695         if (fsname != NULL) {
696                 strncpy(fsname, svname, dash - svname);
697                 fsname[dash - svname] = '\0';
698         }
699
700         if (endptr != NULL)
701                 *endptr = dash;
702
703         return 0;
704 }
705 EXPORT_SYMBOL(server_name2fsname);
706
707 /**
708  * Get service name (svname) from string
709  * rc < 0 on error
710  * if endptr isn't NULL it is set to end of fsname *
711  */
712 int server_name2svname(const char *label, char *svname, const char **endptr,
713                        size_t svsize)
714 {
715         int rc;
716         const char *dash;
717
718         /* We use server_name2fsname() just for parsing */
719         rc = server_name2fsname(label, NULL, &dash);
720         if (rc != 0)
721                 return rc;
722
723         if (endptr != NULL)
724                 *endptr = dash;
725
726         if (strlcpy(svname, dash + 1, svsize) >= svsize)
727                 return -E2BIG;
728
729         return 0;
730 }
731 EXPORT_SYMBOL(server_name2svname);
732
733 /**
734  * check server name is OST.
735  **/
736 int server_name_is_ost(const char *svname)
737 {
738         const char *dash;
739         int rc;
740
741         /* We use server_name2fsname() just for parsing */
742         rc = server_name2fsname(svname, NULL, &dash);
743         if (rc != 0)
744                 return rc;
745
746         dash++;
747
748         if (strncmp(dash, "OST", 3) == 0)
749                 return 1;
750         return 0;
751 }
752 EXPORT_SYMBOL(server_name_is_ost);
753
754 /* Get the index from the obd name.
755    rc = server type, or
756    rc < 0  on error
757    if endptr isn't NULL it is set to end of name */
758 int server_name2index(const char *svname, __u32 *idx, const char **endptr)
759 {
760         unsigned long index;
761         int rc;
762         const char *dash;
763
764         /* We use server_name2fsname() just for parsing */
765         rc = server_name2fsname(svname, NULL, &dash);
766         if (rc != 0)
767                 return rc;
768
769         dash++;
770
771         if (strncmp(dash, "MDT", 3) == 0)
772                 rc = LDD_F_SV_TYPE_MDT;
773         else if (strncmp(dash, "OST", 3) == 0)
774                 rc = LDD_F_SV_TYPE_OST;
775         else
776                 return -EINVAL;
777
778         dash += 3;
779
780         if (strncmp(dash, "all", 3) == 0) {
781                 if (endptr != NULL)
782                         *endptr = dash + 3;
783                 return rc | LDD_F_SV_ALL;
784         }
785
786         index = simple_strtoul(dash, (char **)endptr, 16);
787         if (idx != NULL)
788                 *idx = index;
789
790         /* Account for -mdc after index that is possible when specifying mdt */
791         if (endptr != NULL && strncmp(LUSTRE_MDC_NAME, *endptr + 1,
792                                       sizeof(LUSTRE_MDC_NAME)-1) == 0)
793                 *endptr += sizeof(LUSTRE_MDC_NAME);
794
795         return rc;
796 }
797 EXPORT_SYMBOL(server_name2index);
798
799 /*************** mount common betweeen server and client ***************/
800
801 /* Common umount */
802 int lustre_common_put_super(struct super_block *sb)
803 {
804         int rc;
805         ENTRY;
806
807         CDEBUG(D_MOUNT, "dropping sb %p\n", sb);
808
809         /* Drop a ref to the MGC */
810         rc = lustre_stop_mgc(sb);
811         if (rc && (rc != -ENOENT)) {
812                 if (rc != -EBUSY) {
813                         CERROR("Can't stop MGC: %d\n", rc);
814                         RETURN(rc);
815                 }
816                 /* BUSY just means that there's some other obd that
817                    needs the mgc.  Let him clean it up. */
818                 CDEBUG(D_MOUNT, "MGC still in use\n");
819         }
820         /* Drop a ref to the mounted disk */
821         lustre_put_lsi(sb);
822         RETURN(rc);
823 }
824 EXPORT_SYMBOL(lustre_common_put_super);
825
826 static void lmd_print(struct lustre_mount_data *lmd)
827 {
828         int i;
829
830         PRINT_CMD(D_MOUNT, "  mount data:\n");
831         if (lmd_is_client(lmd))
832                 PRINT_CMD(D_MOUNT, "profile: %s\n", lmd->lmd_profile);
833         PRINT_CMD(D_MOUNT, "device:  %s\n", lmd->lmd_dev);
834         PRINT_CMD(D_MOUNT, "flags:   %x\n", lmd->lmd_flags);
835
836         if (lmd->lmd_opts)
837                 PRINT_CMD(D_MOUNT, "options: %s\n", lmd->lmd_opts);
838
839         if (lmd->lmd_recovery_time_soft)
840                 PRINT_CMD(D_MOUNT, "recovery time soft: %d\n",
841                           lmd->lmd_recovery_time_soft);
842
843         if (lmd->lmd_recovery_time_hard)
844                 PRINT_CMD(D_MOUNT, "recovery time hard: %d\n",
845                           lmd->lmd_recovery_time_hard);
846
847         for (i = 0; i < lmd->lmd_exclude_count; i++) {
848                 PRINT_CMD(D_MOUNT, "exclude %d:  OST%04x\n", i,
849                           lmd->lmd_exclude[i]);
850         }
851 }
852
853 /* Is this server on the exclusion list */
854 int lustre_check_exclusion(struct super_block *sb, char *svname)
855 {
856         struct lustre_sb_info *lsi = s2lsi(sb);
857         struct lustre_mount_data *lmd = lsi->lsi_lmd;
858         __u32 index;
859         int i, rc;
860         ENTRY;
861
862         rc = server_name2index(svname, &index, NULL);
863         if (rc != LDD_F_SV_TYPE_OST)
864                 /* Only exclude OSTs */
865                 RETURN(0);
866
867         CDEBUG(D_MOUNT, "Check exclusion %s (%d) in %d of %s\n", svname,
868                index, lmd->lmd_exclude_count, lmd->lmd_dev);
869
870         for(i = 0; i < lmd->lmd_exclude_count; i++) {
871                 if (index == lmd->lmd_exclude[i]) {
872                         CWARN("Excluding %s (on exclusion list)\n", svname);
873                         RETURN(1);
874                 }
875         }
876         RETURN(0);
877 }
878
879 /* mount -v  -o exclude=lustre-OST0001:lustre-OST0002 -t lustre ... */
880 static int lmd_make_exclusion(struct lustre_mount_data *lmd, const char *ptr)
881 {
882         const char *s1 = ptr, *s2;
883         __u32 index, *exclude_list;
884         int rc = 0, devmax;
885         ENTRY;
886
887         /* The shortest an ost name can be is 8 chars: -OST0000.
888            We don't actually know the fsname at this time, so in fact
889            a user could specify any fsname. */
890         devmax = strlen(ptr) / 8 + 1;
891
892         /* temp storage until we figure out how many we have */
893         OBD_ALLOC(exclude_list, sizeof(index) * devmax);
894         if (!exclude_list)
895                 RETURN(-ENOMEM);
896
897         /* we enter this fn pointing at the '=' */
898         while (*s1 && *s1 != ' ' && *s1 != ',') {
899                 s1++;
900                 rc = server_name2index(s1, &index, &s2);
901                 if (rc < 0) {
902                         CERROR("Can't parse server name '%s': rc = %d\n",
903                                s1, rc);
904                         break;
905                 }
906                 if (rc == LDD_F_SV_TYPE_OST)
907                         exclude_list[lmd->lmd_exclude_count++] = index;
908                 else
909                         CDEBUG(D_MOUNT, "ignoring exclude %.*s: type = %#x\n",
910                                (uint)(s2-s1), s1, rc);
911                 s1 = s2;
912                 /* now we are pointing at ':' (next exclude)
913                    or ',' (end of excludes) */
914                 if (lmd->lmd_exclude_count >= devmax)
915                         break;
916         }
917         if (rc >= 0) /* non-err */
918                 rc = 0;
919
920         if (lmd->lmd_exclude_count) {
921                 /* permanent, freed in lustre_free_lsi */
922                 OBD_ALLOC(lmd->lmd_exclude, sizeof(index) *
923                           lmd->lmd_exclude_count);
924                 if (lmd->lmd_exclude) {
925                         memcpy(lmd->lmd_exclude, exclude_list,
926                                sizeof(index) * lmd->lmd_exclude_count);
927                 } else {
928                         rc = -ENOMEM;
929                         lmd->lmd_exclude_count = 0;
930                 }
931         }
932         OBD_FREE(exclude_list, sizeof(index) * devmax);
933         RETURN(rc);
934 }
935
936 static int lmd_parse_mgssec(struct lustre_mount_data *lmd, char *ptr)
937 {
938         char   *tail;
939         int     length;
940
941         if (lmd->lmd_mgssec != NULL) {
942                 OBD_FREE(lmd->lmd_mgssec, strlen(lmd->lmd_mgssec) + 1);
943                 lmd->lmd_mgssec = NULL;
944         }
945
946         tail = strchr(ptr, ',');
947         if (tail == NULL)
948                 length = strlen(ptr);
949         else
950                 length = tail - ptr;
951
952         OBD_ALLOC(lmd->lmd_mgssec, length + 1);
953         if (lmd->lmd_mgssec == NULL)
954                 return -ENOMEM;
955
956         memcpy(lmd->lmd_mgssec, ptr, length);
957         lmd->lmd_mgssec[length] = '\0';
958         return 0;
959 }
960
961 static int lmd_parse_string(char **handle, char *ptr)
962 {
963         char   *tail;
964         int     length;
965
966         if ((handle == NULL) || (ptr == NULL))
967                 return -EINVAL;
968
969         if (*handle != NULL) {
970                 OBD_FREE(*handle, strlen(*handle) + 1);
971                 *handle = NULL;
972         }
973
974         tail = strchr(ptr, ',');
975         if (tail == NULL)
976                 length = strlen(ptr);
977         else
978                 length = tail - ptr;
979
980         OBD_ALLOC(*handle, length + 1);
981         if (*handle == NULL)
982                 return -ENOMEM;
983
984         memcpy(*handle, ptr, length);
985         (*handle)[length] = '\0';
986
987         return 0;
988 }
989
990 /* Collect multiple values for mgsnid specifiers */
991 static int lmd_parse_mgs(struct lustre_mount_data *lmd, char **ptr)
992 {
993         lnet_nid_t nid;
994         char *tail = *ptr;
995         char *mgsnid;
996         int   length;
997         int   oldlen = 0;
998
999         /* Find end of nidlist */
1000         while (class_parse_nid_quiet(tail, &nid, &tail) == 0) {}
1001         length = tail - *ptr;
1002         if (length == 0) {
1003                 LCONSOLE_ERROR_MSG(0x159, "Can't parse NID '%s'\n", *ptr);
1004                 return -EINVAL;
1005         }
1006
1007         if (lmd->lmd_mgs != NULL)
1008                 oldlen = strlen(lmd->lmd_mgs) + 1;
1009
1010         OBD_ALLOC(mgsnid, oldlen + length + 1);
1011         if (mgsnid == NULL)
1012                 return -ENOMEM;
1013
1014         if (lmd->lmd_mgs != NULL) {
1015                 /* Multiple mgsnid= are taken to mean failover locations */
1016                 memcpy(mgsnid, lmd->lmd_mgs, oldlen);
1017                 mgsnid[oldlen - 1] = ':';
1018                 OBD_FREE(lmd->lmd_mgs, oldlen);
1019         }
1020         memcpy(mgsnid + oldlen, *ptr, length);
1021         mgsnid[oldlen + length] = '\0';
1022         lmd->lmd_mgs = mgsnid;
1023         *ptr = tail;
1024
1025         return 0;
1026 }
1027
1028 /** Parse mount line options
1029  * e.g. mount -v -t lustre -o abort_recov uml1:uml2:/lustre-client /mnt/lustre
1030  * dev is passed as device=uml1:/lustre by mount.lustre
1031  */
1032 static int lmd_parse(char *options, struct lustre_mount_data *lmd)
1033 {
1034         char *s1, *s2, *s3, *devname = NULL;
1035         struct lustre_mount_data *raw = (struct lustre_mount_data *)options;
1036         int rc = 0;
1037         ENTRY;
1038
1039         LASSERT(lmd);
1040         if (!options) {
1041                 LCONSOLE_ERROR_MSG(0x162, "Missing mount data: check that "
1042                                    "/sbin/mount.lustre is installed.\n");
1043                 RETURN(-EINVAL);
1044         }
1045
1046         /* Options should be a string - try to detect old lmd data */
1047         if ((raw->lmd_magic & 0xffffff00) == (LMD_MAGIC & 0xffffff00)) {
1048                 LCONSOLE_ERROR_MSG(0x163, "You're using an old version of "
1049                                    "/sbin/mount.lustre.  Please install "
1050                                    "version %s\n", LUSTRE_VERSION_STRING);
1051                 RETURN(-EINVAL);
1052         }
1053         lmd->lmd_magic = LMD_MAGIC;
1054
1055         OBD_ALLOC(lmd->lmd_params, 4096);
1056         if (lmd->lmd_params == NULL)
1057                 RETURN(-ENOMEM);
1058         lmd->lmd_params[0] = '\0';
1059
1060         /* Set default flags here */
1061
1062         s1 = options;
1063         while (*s1) {
1064                 int clear = 0;
1065                 int time_min = OBD_RECOVERY_TIME_MIN;
1066
1067                 /* Skip whitespace and extra commas */
1068                 while (*s1 == ' ' || *s1 == ',')
1069                         s1++;
1070                 s3 = s1;
1071
1072                 /* Client options are parsed in ll_options: eg. flock,
1073                    user_xattr, acl */
1074
1075                 /* Parse non-ldiskfs options here. Rather than modifying
1076                    ldiskfs, we just zero these out here */
1077                 if (strncmp(s1, "abort_recov", 11) == 0) {
1078                         lmd->lmd_flags |= LMD_FLG_ABORT_RECOV;
1079                         clear++;
1080                 } else if (strncmp(s1, "recovery_time_soft=", 19) == 0) {
1081                         lmd->lmd_recovery_time_soft = max_t(int,
1082                                 simple_strtoul(s1 + 19, NULL, 10), time_min);
1083                         clear++;
1084                 } else if (strncmp(s1, "recovery_time_hard=", 19) == 0) {
1085                         lmd->lmd_recovery_time_hard = max_t(int,
1086                                 simple_strtoul(s1 + 19, NULL, 10), time_min);
1087                         clear++;
1088                 } else if (strncmp(s1, "noir", 4) == 0) {
1089                         lmd->lmd_flags |= LMD_FLG_NOIR; /* test purpose only. */
1090                         clear++;
1091                 } else if (strncmp(s1, "nosvc", 5) == 0) {
1092                         lmd->lmd_flags |= LMD_FLG_NOSVC;
1093                         clear++;
1094                 } else if (strncmp(s1, "nomgs", 5) == 0) {
1095                         lmd->lmd_flags |= LMD_FLG_NOMGS;
1096                         clear++;
1097                 } else if (strncmp(s1, "noscrub", 7) == 0) {
1098                         lmd->lmd_flags |= LMD_FLG_NOSCRUB;
1099                         clear++;
1100                 } else if (strncmp(s1, PARAM_MGSNODE,
1101                                    sizeof(PARAM_MGSNODE) - 1) == 0) {
1102                         s2 = s1 + sizeof(PARAM_MGSNODE) - 1;
1103                         /* Assume the next mount opt is the first
1104                            invalid nid we get to. */
1105                         rc = lmd_parse_mgs(lmd, &s2);
1106                         if (rc)
1107                                 goto invalid;
1108                         s3 = s2;
1109                         clear++;
1110                 } else if (strncmp(s1, "writeconf", 9) == 0) {
1111                         lmd->lmd_flags |= LMD_FLG_WRITECONF;
1112                         clear++;
1113                 } else if (strncmp(s1, "update", 6) == 0) {
1114                         lmd->lmd_flags |= LMD_FLG_UPDATE;
1115                         clear++;
1116                 } else if (strncmp(s1, "virgin", 6) == 0) {
1117                         lmd->lmd_flags |= LMD_FLG_VIRGIN;
1118                         clear++;
1119                 } else if (strncmp(s1, "noprimnode", 10) == 0) {
1120                         lmd->lmd_flags |= LMD_FLG_NO_PRIMNODE;
1121                         clear++;
1122                 } else if (strncmp(s1, "mgssec=", 7) == 0) {
1123                         rc = lmd_parse_mgssec(lmd, s1 + 7);
1124                         if (rc)
1125                                 goto invalid;
1126                         clear++;
1127                 /* ost exclusion list */
1128                 } else if (strncmp(s1, "exclude=", 8) == 0) {
1129                         rc = lmd_make_exclusion(lmd, s1 + 7);
1130                         if (rc)
1131                                 goto invalid;
1132                         clear++;
1133                 } else if (strncmp(s1, "mgs", 3) == 0) {
1134                         /* We are an MGS */
1135                         lmd->lmd_flags |= LMD_FLG_MGS;
1136                         clear++;
1137                 } else if (strncmp(s1, "svname=", 7) == 0) {
1138                         rc = lmd_parse_string(&lmd->lmd_profile, s1 + 7);
1139                         if (rc)
1140                                 goto invalid;
1141                         clear++;
1142                 } else if (strncmp(s1, "param=", 6) == 0) {
1143                         int length;
1144                         char *tail = strchr(s1 + 6, ',');
1145                         if (tail == NULL) {
1146                                 length = strlen(s1);
1147                         } else {
1148                                 lnet_nid_t nid;
1149                                 char      *param_str = tail + 1;
1150                                 int        supplementary = 1;
1151
1152                                 while (class_parse_nid_quiet(param_str, &nid,
1153                                                              &param_str) == 0) {
1154                                         supplementary = 0;
1155                                 }
1156                                 length = param_str - s1 - supplementary;
1157                         }
1158                         length -= 6;
1159                         strncat(lmd->lmd_params, s1 + 6, length);
1160                         strcat(lmd->lmd_params, " ");
1161                         s3 = s1 + 6 + length;
1162                         clear++;
1163                 } else if (strncmp(s1, "osd=", 4) == 0) {
1164                         rc = lmd_parse_string(&lmd->lmd_osd_type, s1 + 4);
1165                         if (rc)
1166                                 goto invalid;
1167                         clear++;
1168                 }
1169                 /* Linux 2.4 doesn't pass the device, so we stuck it at the
1170                    end of the options. */
1171                 else if (strncmp(s1, "device=", 7) == 0) {
1172                         devname = s1 + 7;
1173                         /* terminate options right before device.  device
1174                            must be the last one. */
1175                         *s1 = '\0';
1176                         break;
1177                 }
1178
1179                 /* Find next opt */
1180                 s2 = strchr(s3, ',');
1181                 if (s2 == NULL) {
1182                         if (clear)
1183                                 *s1 = '\0';
1184                         break;
1185                 }
1186                 s2++;
1187                 if (clear)
1188                         memmove(s1, s2, strlen(s2) + 1);
1189                 else
1190                         s1 = s2;
1191         }
1192
1193         if (!devname) {
1194                 LCONSOLE_ERROR_MSG(0x164, "Can't find the device name "
1195                                    "(need mount option 'device=...')\n");
1196                 goto invalid;
1197         }
1198
1199         s1 = strstr(devname, ":/");
1200         if (s1) {
1201                 ++s1;
1202                 lmd->lmd_flags |= LMD_FLG_CLIENT;
1203                 /* Remove leading /s from fsname */
1204                 while (*++s1 == '/') ;
1205                 /* Freed in lustre_free_lsi */
1206                 OBD_ALLOC(lmd->lmd_profile, strlen(s1) + 8);
1207                 if (!lmd->lmd_profile)
1208                         RETURN(-ENOMEM);
1209                 sprintf(lmd->lmd_profile, "%s-client", s1);
1210         }
1211
1212         /* Freed in lustre_free_lsi */
1213         OBD_ALLOC(lmd->lmd_dev, strlen(devname) + 1);
1214         if (!lmd->lmd_dev)
1215                 RETURN(-ENOMEM);
1216         strcpy(lmd->lmd_dev, devname);
1217
1218         /* Save mount options */
1219         s1 = options + strlen(options) - 1;
1220         while (s1 >= options && (*s1 == ',' || *s1 == ' '))
1221                 *s1-- = 0;
1222         if (*options != 0) {
1223                 /* Freed in lustre_free_lsi */
1224                 OBD_ALLOC(lmd->lmd_opts, strlen(options) + 1);
1225                 if (!lmd->lmd_opts)
1226                         RETURN(-ENOMEM);
1227                 strcpy(lmd->lmd_opts, options);
1228         }
1229
1230         lmd_print(lmd);
1231         lmd->lmd_magic = LMD_MAGIC;
1232
1233         RETURN(rc);
1234
1235 invalid:
1236         CERROR("Bad mount options %s\n", options);
1237         RETURN(-EINVAL);
1238 }
1239
1240 struct lustre_mount_data2 {
1241         void *lmd2_data;
1242         struct vfsmount *lmd2_mnt;
1243 };
1244
1245 /** This is the entry point for the mount call into Lustre.
1246  * This is called when a server or client is mounted,
1247  * and this is where we start setting things up.
1248  * @param data Mount options (e.g. -o flock,abort_recov)
1249  */
1250 int lustre_fill_super(struct super_block *sb, void *data, int silent)
1251 {
1252         struct lustre_mount_data *lmd;
1253         struct lustre_mount_data2 *lmd2 = data;
1254         struct lustre_sb_info *lsi;
1255         int rc;
1256         ENTRY;
1257
1258         CDEBUG(D_MOUNT|D_VFSTRACE, "VFS Op: sb %p\n", sb);
1259
1260         lsi = lustre_init_lsi(sb);
1261         if (!lsi)
1262                 RETURN(-ENOMEM);
1263         lmd = lsi->lsi_lmd;
1264
1265         /*
1266          * Disable lockdep during mount, because mount locking patterns are
1267          * `special'.
1268          */
1269         lockdep_off();
1270
1271         /*
1272          * LU-639: the obd cleanup of last mount may not finish yet, wait here.
1273          */
1274         obd_zombie_barrier();
1275
1276         /* Figure out the lmd from the mount options */
1277         if (lmd_parse((char *)(lmd2->lmd2_data), lmd)) {
1278                 lustre_put_lsi(sb);
1279                 GOTO(out, rc = -EINVAL);
1280         }
1281
1282         if (lmd_is_client(lmd)) {
1283                 CDEBUG(D_MOUNT, "Mounting client %s\n", lmd->lmd_profile);
1284                 if (client_fill_super == NULL)
1285                         request_module("lustre");
1286                 if (client_fill_super == NULL) {
1287                         LCONSOLE_ERROR_MSG(0x165, "Nothing registered for "
1288                                            "client mount! Is the 'lustre' "
1289                                            "module loaded?\n");
1290                         lustre_put_lsi(sb);
1291                         rc = -ENODEV;
1292                 } else {
1293                         rc = lustre_start_mgc(sb);
1294                         if (rc) {
1295                                 lustre_put_lsi(sb);
1296                                 GOTO(out, rc);
1297                         }
1298                         /* Connect and start */
1299                         /* (should always be ll_fill_super) */
1300                         rc = (*client_fill_super)(sb, lmd2->lmd2_mnt);
1301                         /* c_f_s will call lustre_common_put_super on failure */
1302                 }
1303         } else {
1304 #ifdef HAVE_SERVER_SUPPORT
1305                 CDEBUG(D_MOUNT, "Mounting server from %s\n", lmd->lmd_dev);
1306                 rc = server_fill_super(sb);
1307                 /* s_f_s calls lustre_start_mgc after the mount because we need
1308                    the MGS nids which are stored on disk.  Plus, we may
1309                    need to start the MGS first. */
1310                 /* s_f_s will call server_put_super on failure */
1311 #else
1312                 CERROR("This is client-side-only module, "
1313                        "cannot handle server mount.\n");
1314                 rc = -EINVAL;
1315 #endif
1316         }
1317
1318         /* If error happens in fill_super() call, @lsi will be killed there.
1319          * This is why we do not put it here. */
1320         GOTO(out, rc);
1321 out:
1322         if (rc) {
1323                 CERROR("Unable to mount %s (%d)\n",
1324                        s2lsi(sb) ? lmd->lmd_dev : "", rc);
1325         } else {
1326                 CDEBUG(D_SUPER, "Mount %s complete\n",
1327                        lmd->lmd_dev);
1328         }
1329         lockdep_on();
1330         return rc;
1331 }
1332
1333
1334 /* We can't call ll_fill_super by name because it lives in a module that
1335    must be loaded after this one. */
1336 void lustre_register_client_fill_super(int (*cfs)(struct super_block *sb,
1337                                                   struct vfsmount *mnt))
1338 {
1339         client_fill_super = cfs;
1340 }
1341 EXPORT_SYMBOL(lustre_register_client_fill_super);
1342
1343 void lustre_register_kill_super_cb(void (*cfs)(struct super_block *sb))
1344 {
1345         kill_super_cb = cfs;
1346 }
1347 EXPORT_SYMBOL(lustre_register_kill_super_cb);
1348
1349 /***************** FS registration ******************/
1350 #ifdef HAVE_FSTYPE_MOUNT
1351 struct dentry *lustre_mount(struct file_system_type *fs_type, int flags,
1352                                 const char *devname, void *data)
1353 {
1354         struct lustre_mount_data2 lmd2 = { data, NULL };
1355
1356         return mount_nodev(fs_type, flags, &lmd2, lustre_fill_super);
1357 }
1358 #else
1359 int lustre_get_sb(struct file_system_type *fs_type, int flags,
1360                   const char *devname, void * data, struct vfsmount *mnt)
1361 {
1362         struct lustre_mount_data2 lmd2 = { data, mnt };
1363
1364         return get_sb_nodev(fs_type, flags, &lmd2, lustre_fill_super, mnt);
1365 }
1366 #endif
1367
1368 void lustre_kill_super(struct super_block *sb)
1369 {
1370         struct lustre_sb_info *lsi = s2lsi(sb);
1371
1372         if (kill_super_cb && lsi && !IS_SERVER(lsi))
1373                 (*kill_super_cb)(sb);
1374
1375         kill_anon_super(sb);
1376 }
1377
1378 /** Register the "lustre" fs type
1379  */
1380 struct file_system_type lustre_fs_type = {
1381         .owner        = THIS_MODULE,
1382         .name         = "lustre",
1383 #ifdef HAVE_FSTYPE_MOUNT
1384         .mount        = lustre_mount,
1385 #else
1386         .get_sb       = lustre_get_sb,
1387 #endif
1388         .kill_sb      = lustre_kill_super,
1389         .fs_flags     = FS_BINARY_MOUNTDATA | FS_REQUIRES_DEV |
1390                         FS_HAS_FIEMAP | FS_RENAME_DOES_D_MOVE,
1391 };
1392 MODULE_ALIAS_FS("lustre");
1393
1394 int lustre_register_fs(void)
1395 {
1396         return register_filesystem(&lustre_fs_type);
1397 }
1398
1399 int lustre_unregister_fs(void)
1400 {
1401         return unregister_filesystem(&lustre_fs_type);
1402 }