Whamcloud - gitweb
LU-1347 build: remove the vim/emacs modelines
[fs/lustre-release.git] / lustre / utils / mount_lustre.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2012, Whamcloud, Inc.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/utils/mount_lustre.c
37  *
38  * Author: Robert Read <rread@clusterfs.com>
39  * Author: Nathan Rutman <nathan@clusterfs.com>
40  */
41
42 #ifndef _GNU_SOURCE
43 #define _GNU_SOURCE
44 #endif
45 #include <stdlib.h>
46 #include <stdio.h>
47 #include <unistd.h>
48 #include <fcntl.h>
49 #include <errno.h>
50 #include <string.h>
51 #include <sys/mount.h>
52 #include <linux/fs.h>
53 #include <mntent.h>
54 #include <getopt.h>
55 #include "obdctl.h"
56 #include <lustre_ver.h>
57 #include <glob.h>
58 #include <ctype.h>
59 #include <limits.h>
60 #include "mount_utils.h"
61
62 #define MAX_HW_SECTORS_KB_PATH  "queue/max_hw_sectors_kb"
63 #define MAX_SECTORS_KB_PATH     "queue/max_sectors_kb"
64 #define STRIPE_CACHE_SIZE       "md/stripe_cache_size"
65 #define MAX_RETRIES 99
66
67 int          verbose = 0;
68 int          nomtab = 0;
69 int          fake = 0;
70 int          force = 0;
71 int          retry = 0;
72 int          md_stripe_cache_size = 16384;
73 char         *progname = NULL;
74
75 void usage(FILE *out)
76 {
77         fprintf(out, "%s v"LUSTRE_VERSION_STRING"\n", progname);
78         fprintf(out, "\nThis mount helper should only be invoked via the "
79                 "mount (8) command,\ne.g. mount -t lustre dev dir\n\n");
80         fprintf(out, "usage: %s [-fhnv] [-o <mntopt>] <device> <mountpt>\n",
81                 progname);
82         fprintf(out,
83                 "\t<device>: the disk device, or for a client:\n"
84                 "\t\t<mgmtnid>[:<altmgtnid>...]:/<filesystem>-client\n"
85                 "\t<filesystem>: name of the Lustre filesystem (e.g. lustre1)\n"
86                 "\t<mountpt>: filesystem mountpoint (e.g. /mnt/lustre)\n"
87                 "\t-f|--fake: fake mount (updates /etc/mtab)\n"
88                 "\t-o force|--force: force mount even if already in /etc/mtab\n"
89                 "\t-h|--help: print this usage message\n"
90                 "\t-n|--nomtab: do not update /etc/mtab after mount\n"
91                 "\t-v|--verbose: print verbose config settings\n"
92                 "\t<mntopt>: one or more comma separated of:\n"
93                 "\t\t(no)flock,(no)user_xattr,(no)acl\n"
94                 "\t\tabort_recov: abort server recovery handling\n"
95                 "\t\tnosvc: only start MGC/MGS obds\n"
96                 "\t\tnomgs: only start target obds, using existing MGS\n"
97                 "\t\texclude=<ostname>[:<ostname>] : colon-separated list of "
98                 "inactive OSTs (e.g. lustre-OST0001)\n"
99                 "\t\tretry=<num>: number of times mount is retried by client\n"
100                 "\t\tmd_stripe_cache_size=<num>: set the raid stripe cache "
101                 "size for the underlying raid if present\n"
102                 );
103         exit((out != stdout) ? EINVAL : 0);
104 }
105
106 static int check_mtab_entry(char *spec1, char *spec2, char *mtpt, char *type)
107 {
108         FILE *fp;
109         struct mntent *mnt;
110
111         fp = setmntent(MOUNTED, "r");
112         if (fp == NULL)
113                 return(0);
114
115         while ((mnt = getmntent(fp)) != NULL) {
116                 if ((strcmp(mnt->mnt_fsname, spec1) == 0 ||
117                      strcmp(mnt->mnt_fsname, spec2) == 0) &&
118                         strcmp(mnt->mnt_dir, mtpt) == 0 &&
119                         strcmp(mnt->mnt_type, type) == 0) {
120                         endmntent(fp);
121                         return(EEXIST);
122                 }
123         }
124         endmntent(fp);
125
126         return(0);
127 }
128
129 static int
130 update_mtab_entry(char *spec, char *mtpt, char *type, char *opts,
131                   int flags, int freq, int pass)
132 {
133         FILE *fp;
134         struct mntent mnt;
135         int rc = 0;
136
137         mnt.mnt_fsname = spec;
138         mnt.mnt_dir = mtpt;
139         mnt.mnt_type = type;
140         mnt.mnt_opts = opts ? opts : "";
141         mnt.mnt_freq = freq;
142         mnt.mnt_passno = pass;
143
144         fp = setmntent(MOUNTED, "a+");
145         if (fp == NULL) {
146                 fprintf(stderr, "%s: setmntent(%s): %s:",
147                         progname, MOUNTED, strerror (errno));
148                 rc = 16;
149         } else {
150                 if ((addmntent(fp, &mnt)) == 1) {
151                         fprintf(stderr, "%s: addmntent: %s:",
152                                 progname, strerror (errno));
153                         rc = 16;
154                 }
155                 endmntent(fp);
156         }
157
158         return rc;
159 }
160
161 /* Get rid of symbolic hostnames for tcp, since kernel can't do lookups */
162 #define MAXNIDSTR 1024
163 static char *convert_hostnames(char *s1)
164 {
165         char *converted, *s2 = 0, *c;
166         char sep;
167         int left = MAXNIDSTR;
168         lnet_nid_t nid;
169
170         converted = malloc(left);
171         if (converted == NULL) {
172                 fprintf(stderr, "out of memory: needed %d bytes\n",
173                         MAXNIDSTR);
174                 return NULL;
175         }
176         c = converted;
177         while ((left > 0) && (*s1 != '/')) {
178                 s2 = strpbrk(s1, ",:");
179                 if (!s2)
180                         goto out_free;
181                 sep = *s2;
182                 *s2 = '\0';
183                 nid = libcfs_str2nid(s1);
184                 *s2 = sep;                      /* back to original string */
185                 if (nid == LNET_NID_ANY)
186                         goto out_free;
187                 c += snprintf(c, left, "%s%c", libcfs_nid2str(nid), sep);
188                 left = converted + MAXNIDSTR - c;
189                 s1 = s2 + 1;
190         }
191         snprintf(c, left, "%s", s1);
192         return converted;
193 out_free:
194         fprintf(stderr, "%s: Can't parse NID '%s'\n", progname, s1);
195         free(converted);
196         return NULL;
197 }
198
199 /*****************************************************************************
200  *
201  * This part was cribbed from util-linux/mount/mount.c.  There was no clear
202  * license information, but many other files in the package are identified as
203  * GNU GPL, so it's a pretty safe bet that was their intent.
204  *
205  ****************************************************************************/
206 struct opt_map {
207         const char *opt;        /* option name */
208         int inv;                /* true if flag value should be inverted */
209         int mask;               /* flag mask value */
210 };
211
212 static const struct opt_map opt_map[] = {
213   /*"optname", inv,ms_mask */
214   /* These flags are parsed by mount, not lustre */
215   { "defaults", 0, 0         },      /* default options */
216   { "remount",  0, MS_REMOUNT},      /* remount with different options */
217   { "rw",       1, MS_RDONLY },      /* read-write */
218   { "ro",       0, MS_RDONLY },      /* read-only */
219   { "exec",     1, MS_NOEXEC },      /* permit execution of binaries */
220   { "noexec",   0, MS_NOEXEC },      /* don't execute binaries */
221   { "suid",     1, MS_NOSUID },      /* honor suid executables */
222   { "nosuid",   0, MS_NOSUID },      /* don't honor suid executables */
223   { "dev",      1, MS_NODEV  },      /* interpret device files  */
224   { "nodev",    0, MS_NODEV  },      /* don't interpret devices */
225   { "sync",     0, MS_SYNCHRONOUS},  /* synchronous I/O */
226   { "async",    1, MS_SYNCHRONOUS},  /* asynchronous I/O */
227   { "atime",    1, MS_NOATIME  },    /* set file access time on read */
228   { "noatime",  0, MS_NOATIME  },    /* do not set file access time on read */
229 #ifdef MS_NODIRATIME
230   { "diratime", 1, MS_NODIRATIME },  /* set file access time on read */
231   { "nodiratime",0,MS_NODIRATIME },  /* do not set file access time on read */
232 #endif
233 #ifdef MS_RELATIME
234   { "relatime", 0, MS_RELATIME },  /* set file access time on read */
235   { "norelatime",1,MS_RELATIME },  /* do not set file access time on read */
236 #endif
237 #ifdef MS_STRICTATIME
238   { "strictatime",0,MS_STRICTATIME },  /* update access time strictly */
239 #endif
240   { "auto",     0, 0         },      /* Can be mounted using -a */
241   { "noauto",   0, 0         },      /* Can only be mounted explicitly */
242   { "nousers",  1, 0         },      /* Forbid ordinary user to mount */
243   { "nouser",   1, 0         },      /* Forbid ordinary user to mount */
244   { "noowner",  1, 0         },      /* Device owner has no special privs */
245   { "_netdev",  0, 0         },      /* Device accessible only via network */
246   { "loop",     0, 0         },
247   { NULL,       0, 0         }
248 };
249 /****************************************************************************/
250
251 /* 1  = don't pass on to lustre
252    0  = pass on to lustre */
253 static int parse_one_option(const char *check, int *flagp)
254 {
255         const struct opt_map *opt;
256
257         for (opt = &opt_map[0]; opt->opt != NULL; opt++) {
258                 if (strncmp(check, opt->opt, strlen(opt->opt)) == 0) {
259                         if (opt->mask) {
260                                 if (opt->inv)
261                                         *flagp &= ~(opt->mask);
262                                 else
263                                         *flagp |= opt->mask;
264                         }
265                         return 1;
266                 }
267         }
268         /* Assume any unknown options are valid and pass them on.  The mount
269            will fail if lmd_parse, ll_options or ldiskfs doesn't recognize it.*/
270         return 0;
271 }
272
273 static void append_option(char *options, const char *one)
274 {
275         if (*options)
276                 strcat(options, ",");
277         strcat(options, one);
278 }
279
280 /* Replace options with subset of Lustre-specific options, and
281    fill in mount flags */
282 int parse_options(char *orig_options, int *flagp)
283 {
284         char *options, *opt, *nextopt, *arg, *val;
285
286         options = calloc(strlen(orig_options) + 1, 1);
287         *flagp = 0;
288         nextopt = orig_options;
289         while ((opt = strsep(&nextopt, ","))) {
290                 if (!*opt)
291                         /* empty option */
292                         continue;
293
294                 /* Handle retries in a slightly different
295                  * manner */
296                 arg = opt;
297                 val = strchr(opt, '=');
298                 /* please note that some ldiskfs mount options are also in the form
299                  * of param=value. We should pay attention not to remove those
300                  * mount options, see bug 22097. */
301                 if (val && strncmp(arg, "md_stripe_cache_size", 20) == 0) {
302                         md_stripe_cache_size = atoi(val + 1);
303                 } else if (val && strncmp(arg, "retry", 5) == 0) {
304                         retry = atoi(val + 1);
305                         if (retry > MAX_RETRIES)
306                                 retry = MAX_RETRIES;
307                         else if (retry < 0)
308                                 retry = 0;
309                 } else if (val && strncmp(arg, "mgssec", 6) == 0) {
310                         append_option(options, opt);
311                 } else if (strcmp(opt, "force") == 0) {
312                         //XXX special check for 'force' option
313                         ++force;
314                         printf("force: %d\n", force);
315                 } else if (parse_one_option(opt, flagp) == 0) {
316                         /* pass this on as an option */
317                         append_option(options, opt);
318                 }
319         }
320 #ifdef MS_STRICTATIME
321                 /* set strictatime to default if NOATIME or RELATIME
322                    not given explicit */
323         if (!(*flagp & (MS_NOATIME | MS_RELATIME)))
324                 *flagp |= MS_STRICTATIME;
325 #endif
326         strcpy(orig_options, options);
327         free(options);
328         return 0;
329 }
330
331
332 int read_file(char *path, char *buf, int size)
333 {
334         FILE *fd;
335
336         fd = fopen(path, "r");
337         if (fd == NULL)
338                 return errno;
339
340         /* should not ignore fgets(3)'s return value */
341         if (!fgets(buf, size, fd)) {
342                 fprintf(stderr, "reading from %s: %s", path, strerror(errno));
343                 fclose(fd);
344                 return 1;
345         }
346         fclose(fd);
347         return 0;
348 }
349
350 int write_file(char *path, char *buf)
351 {
352         FILE *fd;
353
354         fd = fopen(path, "w");
355         if (fd == NULL)
356                 return errno;
357
358         fputs(buf, fd);
359         fclose(fd);
360         return 0;
361 }
362
363 /* This is to tune the kernel for good SCSI performance.
364  * For that we set the value of /sys/block/{dev}/queue/max_sectors_kb
365  * to the value of /sys/block/{dev}/queue/max_hw_sectors_kb */
366 int set_blockdev_tunables(char *source, int fan_out)
367 {
368         glob_t glob_info = { 0 };
369         struct stat stat_buf;
370         char *chk_major, *chk_minor;
371         char *savept = NULL, *dev;
372         char *ret_path;
373         char buf[PATH_MAX] = {'\0'}, path[PATH_MAX] = {'\0'};
374         char real_path[PATH_MAX] = {'\0'};
375         int i, rc = 0;
376         int major, minor;
377
378         if (!source)
379                 return -EINVAL;
380
381         ret_path = realpath(source, real_path);
382         if (ret_path == NULL) {
383                 if (verbose)
384                         fprintf(stderr, "warning: %s: cannot resolve: %s\n",
385                                 source, strerror(errno));
386                 return -EINVAL;
387         }
388
389         if (strncmp(real_path, "/dev/loop", 9) == 0)
390                 return 0;
391
392         if ((real_path[0] != '/') && (strpbrk(real_path, ",:") != NULL))
393                 return 0;
394
395         snprintf(path, sizeof(path), "/sys/block%s", real_path + 4);
396         if (access(path, X_OK) == 0)
397                 goto set_params;
398
399         /* The name of the device say 'X' specified in /dev/X may not
400          * match any entry under /sys/block/. In that case we need to
401          * match the major/minor number to find the entry under
402          * sys/block corresponding to /dev/X */
403
404         /* Don't chop tail digit on /dev/mapper/xxx, LU-478 */
405         if (strncmp(real_path, "/dev/mapper", 11) != 0) {
406                 dev = real_path + strlen(real_path);
407                 while (--dev > real_path && isdigit(*dev))
408                         *dev = 0;
409
410                 if (strncmp(real_path, "/dev/md_", 8) == 0)
411                         *dev = 0;
412         }
413
414         rc = stat(real_path, &stat_buf);
415         if (rc) {
416                 if (verbose)
417                         fprintf(stderr, "warning: %s, device %s stat failed\n",
418                                 strerror(errno), real_path);
419                 return rc;
420         }
421
422         major = major(stat_buf.st_rdev);
423         minor = minor(stat_buf.st_rdev);
424         rc = glob("/sys/block/*", GLOB_NOSORT, NULL, &glob_info);
425         if (rc) {
426                 if (verbose)
427                         fprintf(stderr, "warning: failed to read entries under "
428                                 "/sys/block\n");
429                 globfree(&glob_info);
430                 return rc;
431         }
432
433         for (i = 0; i < glob_info.gl_pathc; i++){
434                 snprintf(path, sizeof(path), "%s/dev", glob_info.gl_pathv[i]);
435
436                 rc = read_file(path, buf, sizeof(buf));
437                 if (rc)
438                         continue;
439
440                 if (buf[strlen(buf) - 1] == '\n')
441                         buf[strlen(buf) - 1] = '\0';
442
443                 chk_major = strtok_r(buf, ":", &savept);
444                 chk_minor = savept;
445                 if (major == atoi(chk_major) &&minor == atoi(chk_minor))
446                         break;
447         }
448
449         if (i == glob_info.gl_pathc) {
450                 if (verbose)
451                         fprintf(stderr,"warning: device %s does not match any "
452                                 "entry under /sys/block\n", real_path);
453                 globfree(&glob_info);
454                 return -EINVAL;
455         }
456
457         /* Chop off "/dev" from path we found */
458         path[strlen(glob_info.gl_pathv[i])] = '\0';
459         globfree(&glob_info);
460
461 set_params:
462         if (strncmp(real_path, "/dev/md", 7) == 0) {
463                 snprintf(real_path, sizeof(real_path), "%s/%s", path,
464                          STRIPE_CACHE_SIZE);
465
466                 rc = read_file(real_path, buf, sizeof(buf));
467                 if (rc) {
468                         if (verbose)
469                                 fprintf(stderr, "warning: opening %s: %s\n",
470                                         real_path, strerror(errno));
471                         return 0;
472                 }
473
474                 if (atoi(buf) >= md_stripe_cache_size)
475                         return 0;
476
477                 if (strlen(buf) - 1 > 0) {
478                         snprintf(buf, sizeof(buf), "%d", md_stripe_cache_size);
479                         rc = write_file(real_path, buf);
480                         if (rc && verbose)
481                                 fprintf(stderr, "warning: opening %s: %s\n",
482                                         real_path, strerror(errno));
483                 }
484                 /* Return since raid and disk tunables are different */
485                 return rc;
486         }
487
488         snprintf(real_path, sizeof(real_path), "%s/%s", path,
489                  MAX_HW_SECTORS_KB_PATH);
490         rc = read_file(real_path, buf, sizeof(buf));
491         if (rc) {
492                 if (verbose)
493                         fprintf(stderr, "warning: opening %s: %s\n",
494                                 real_path, strerror(errno));
495                 /* No MAX_HW_SECTORS_KB_PATH isn't necessary an
496                  * error for some device. */
497                 rc = 0;
498         }
499
500         if (strlen(buf) - 1 > 0) {
501                 snprintf(real_path, sizeof(real_path), "%s/%s", path,
502                          MAX_SECTORS_KB_PATH);
503                 rc = write_file(real_path, buf);
504                 if (rc) {
505                         if (verbose)
506                                 fprintf(stderr, "warning: writing to %s: %s\n",
507                                         real_path, strerror(errno));
508                         /* No MAX_SECTORS_KB_PATH isn't necessary an
509                          * error for some device. */
510                         rc = 0;
511                 }
512         }
513
514         if (fan_out) {
515                 char *slave = NULL;
516                 glob_info.gl_pathc = 0;
517                 glob_info.gl_offs = 0;
518                 /* if device is multipath device, tune its slave devices */
519                 snprintf(real_path, sizeof(real_path), "%s/slaves/*", path);
520                 rc = glob(real_path, GLOB_NOSORT, NULL, &glob_info);
521
522                 for (i = 0; rc == 0 && i < glob_info.gl_pathc; i++){
523                         slave = basename(glob_info.gl_pathv[i]);
524                         snprintf(real_path, sizeof(real_path), "/dev/%s", slave);
525                         rc = set_blockdev_tunables(real_path, 0);
526                 }
527
528                 if (rc == GLOB_NOMATCH) {
529                         /* no slave device is not an error */
530                         rc = 0;
531                 } else if (rc && verbose) {
532                         if (slave == NULL) {
533                                 fprintf(stderr, "warning: %s, failed to read"
534                                         " entries under %s/slaves\n",
535                                         strerror(errno), path);
536                         } else {
537                                 fprintf(stderr, "unable to set tunables for"
538                                         " slave device %s (slave would be"
539                                         " unable to handle IO request from"
540                                         " master %s)\n",
541                                         real_path, source);
542                         }
543                 }
544                 globfree(&glob_info);
545         }
546
547         return rc;
548 }
549
550 int main(int argc, char *const argv[])
551 {
552         char default_options[] = "";
553         char *usource, *source, *ptr;
554         char target[PATH_MAX] = {'\0'};
555         char real_path[PATH_MAX] = {'\0'};
556         char path[256], name[256];
557         FILE *f;
558         size_t sz;
559         char *options, *optcopy, *orig_options = default_options;
560         int i, nargs = 3, opt, rc, flags, optlen;
561         static struct option long_opt[] = {
562                 {"fake", 0, 0, 'f'},
563                 {"force", 0, 0, 1},
564                 {"help", 0, 0, 'h'},
565                 {"nomtab", 0, 0, 'n'},
566                 {"options", 1, 0, 'o'},
567                 {"verbose", 0, 0, 'v'},
568                 {0, 0, 0, 0}
569         };
570
571         progname = strrchr(argv[0], '/');
572         progname = progname ? progname + 1 : argv[0];
573
574         while ((opt = getopt_long(argc, argv, "fhno:v",
575                                   long_opt, NULL)) != EOF){
576                 switch (opt) {
577                 case 1:
578                         ++force;
579                         printf("force: %d\n", force);
580                         nargs++;
581                         break;
582                 case 'f':
583                         ++fake;
584                         printf("fake: %d\n", fake);
585                         nargs++;
586                         break;
587                 case 'h':
588                         usage(stdout);
589                         break;
590                 case 'n':
591                         ++nomtab;
592                         printf("nomtab: %d\n", nomtab);
593                         nargs++;
594                         break;
595                 case 'o':
596                         orig_options = optarg;
597                         nargs++;
598                         break;
599                 case 'v':
600                         ++verbose;
601                         nargs++;
602                         break;
603                 default:
604                         fprintf(stderr, "%s: unknown option '%c'\n",
605                                 progname, opt);
606                         usage(stderr);
607                         break;
608                 }
609         }
610
611         if (optind + 2 > argc) {
612                 fprintf(stderr, "%s: too few arguments\n", progname);
613                 usage(stderr);
614         }
615
616         usource = argv[optind];
617         if (!usource) {
618                 usage(stderr);
619         }
620
621         /**
622          * Try to get the real path to the device, in case it is a
623          * symbolic link for instance
624          */
625         if (realpath(usource, real_path) != NULL) {
626                 usource = real_path;
627
628                 ptr = strrchr(real_path, '/');
629                 if (ptr && strncmp(ptr, "/dm-", 4) == 0 && isdigit(*(ptr + 4))) {
630                         snprintf(path, sizeof(path), "/sys/block/%s/dm/name", ptr+1);
631                         if ((f = fopen(path, "r"))) {
632                                 /* read "<name>\n" from sysfs */
633                                 if (fgets(name, sizeof(name), f) && (sz = strlen(name)) > 1) {
634                                         name[sz - 1] = '\0';
635                                         snprintf(real_path, sizeof(real_path), "/dev/mapper/%s", name);
636                                 }
637                                 fclose(f);
638                         }
639                 }
640         }
641
642         source = convert_hostnames(usource);
643         if (!source) {
644                 usage(stderr);
645         }
646
647         if (realpath(argv[optind + 1], target) == NULL) {
648                 rc = errno;
649                 fprintf(stderr, "warning: %s: cannot resolve: %s\n",
650                         argv[optind + 1], strerror(errno));
651                 return rc;
652         }
653
654         if (verbose) {
655                 for (i = 0; i < argc; i++)
656                         printf("arg[%d] = %s\n", i, argv[i]);
657                 printf("source = %s (%s), target = %s\n", usource, source,
658                        target);
659                 printf("options = %s\n", orig_options);
660         }
661
662         options = malloc(strlen(orig_options) + 1);
663         if (options == NULL) {
664                 fprintf(stderr, "can't allocate memory for options\n");
665                 return -1;
666         }
667         strcpy(options, orig_options);
668         rc = parse_options(options, &flags);
669         if (rc) {
670                 fprintf(stderr, "%s: can't parse options: %s\n",
671                         progname, options);
672                 return(EINVAL);
673         }
674
675         if (!force) {
676                 rc = check_mtab_entry(usource, source, target, "lustre");
677                 if (rc && !(flags & MS_REMOUNT)) {
678                         fprintf(stderr, "%s: according to %s %s is "
679                                 "already mounted on %s\n",
680                                 progname, MOUNTED, usource, target);
681                         return(EEXIST);
682                 }
683                 if (!rc && (flags & MS_REMOUNT)) {
684                         fprintf(stderr, "%s: according to %s %s is "
685                                 "not already mounted on %s\n",
686                                 progname, MOUNTED, usource, target);
687                         return(ENOENT);
688                 }
689         }
690         if (flags & MS_REMOUNT)
691                 nomtab++;
692
693         rc = access(target, F_OK);
694         if (rc) {
695                 rc = errno;
696                 fprintf(stderr, "%s: %s inaccessible: %s\n", progname, target,
697                         strerror(errno));
698                 return rc;
699         }
700
701         /* In Linux 2.4, the target device doesn't get passed to any of our
702            functions.  So we'll stick it on the end of the options. */
703         optlen = strlen(options) + strlen(",device=") + strlen(source) + 1;
704         optcopy = malloc(optlen);
705         if (optcopy == NULL) {
706                 fprintf(stderr, "can't allocate memory to optcopy\n");
707                 return -1;
708         }
709         strcpy(optcopy, options);
710         if (*optcopy)
711                 strcat(optcopy, ",");
712         strcat(optcopy, "device=");
713         strcat(optcopy, source);
714
715         if (verbose)
716                 printf("mounting device %s at %s, flags=%#x options=%s\n",
717                        source, target, flags, optcopy);
718
719         if (!strstr(usource, ":/") && set_blockdev_tunables(source, 1)) {
720                 if (verbose)
721                         fprintf(stderr, "%s: unable to set tunables for %s"
722                                 " (may cause reduced IO performance)\n",
723                                 argv[0], source);
724         }
725
726         if (!fake) {
727                 /* flags and target get to lustre_get_sb, but not
728                    lustre_fill_super.  Lustre ignores the flags, but mount
729                    does not. */
730                 for (i = 0, rc = -EAGAIN; i <= retry && rc != 0; i++) {
731                         rc = mount(source, target, "lustre", flags,
732                                    (void *)optcopy);
733                         if (rc) {
734                                 if (verbose) {
735                                         fprintf(stderr, "%s: mount %s at %s "
736                                                 "failed: %s retries left: "
737                                                 "%d\n", basename(progname),
738                                                 usource, target,
739                                                 strerror(errno), retry-i);
740                                 }
741
742                                 if (retry) {
743                                         sleep(1 << max((i/2), 5));
744                                 }
745                                 else {
746                                         rc = errno;
747                                 }
748                         }
749                 }
750         }
751
752         if (rc) {
753                 char *cli;
754
755                 rc = errno;
756
757                 cli = strrchr(usource, ':');
758                 if (cli && (strlen(cli) > 2))
759                         cli += 2;
760                 else
761                         cli = NULL;
762
763                 fprintf(stderr, "%s: mount %s at %s failed: %s\n", progname,
764                         usource, target, strerror(errno));
765                 if (errno == ENODEV)
766                         fprintf(stderr, "Are the lustre modules loaded?\n"
767                                 "Check /etc/modprobe.conf and "
768                                 "/proc/filesystems\n");
769                 if (errno == ENOTBLK)
770                         fprintf(stderr, "Do you need -o loop?\n");
771                 if (errno == ENOMEDIUM)
772                         fprintf(stderr,
773                                 "This filesystem needs at least 1 OST\n");
774                 if (errno == ENOENT) {
775                         fprintf(stderr, "Is the MGS specification correct?\n");
776                         fprintf(stderr, "Is the filesystem name correct?\n");
777                         fprintf(stderr, "If upgrading, is the copied client log"
778                                 " valid? (see upgrade docs)\n");
779                 }
780                 if (errno == EALREADY)
781                         fprintf(stderr, "The target service is already running."
782                                 " (%s)\n", usource);
783                 if (errno == ENXIO)
784                         fprintf(stderr, "The target service failed to start "
785                                 "(bad config log?) (%s).  "
786                                 "See /var/log/messages.\n", usource);
787                 if (errno == EIO)
788                         fprintf(stderr, "Is the MGS running?\n");
789                 if (errno == EADDRINUSE)
790                         fprintf(stderr, "The target service's index is already "
791                                 "in use. (%s)\n", usource);
792                 if (errno == EINVAL) {
793                         fprintf(stderr, "This may have multiple causes.\n");
794                         if (cli)
795                                 fprintf(stderr, "Is '%s' the correct filesystem"
796                                         " name?\n", cli);
797                         fprintf(stderr, "Are the mount options correct?\n");
798                         fprintf(stderr, "Check the syslog for more info.\n");
799                 }
800
801                 /* May as well try to clean up loop devs */
802                 if (strncmp(usource, "/dev/loop", 9) == 0) {
803                         char cmd[256];
804                         int ret;
805                         sprintf(cmd, "/sbin/losetup -d %s", usource);
806                         if ((ret = system(cmd)) < 0)
807                                 rc = errno;
808                         else if (ret > 0)
809                                 rc = WEXITSTATUS(ret);
810                 }
811
812         } else if (!nomtab) {
813                 rc = update_mtab_entry(usource, target, "lustre", orig_options,
814                                        0,0,0);
815         }
816
817         free(optcopy);
818         free(source);
819         return rc;
820 }