Whamcloud - gitweb
LU-1581 utils: extract ldiskfs specifics from mkfs_lustre.c
[fs/lustre-release.git] / lustre / utils / mount_utils_ldiskfs.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, Whamcloud, Inc.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/utils/mount_utils_ldiskfs.c
37  *
38  * Author: Nathan Rutman <nathan@clusterfs.com>
39 */
40
41 /* This source file is compiled into both mkfs.lustre and tunefs.lustre */
42
43 #if HAVE_CONFIG_H
44 #  include "config.h"
45 #endif /* HAVE_CONFIG_H */
46
47 #ifndef _GNU_SOURCE
48 #define _GNU_SOURCE
49 #endif
50 #include <stdlib.h>
51 #include <stdio.h>
52 #include <unistd.h>
53 #include <fcntl.h>
54 #include <stdarg.h>
55 #include <mntent.h>
56
57 #include <sys/types.h>
58 #include <sys/stat.h>
59 #include <sys/mount.h>
60 #include <sys/utsname.h>
61
62 #include <string.h>
63 #include <getopt.h>
64 #include <limits.h>
65 #include <ctype.h>
66
67 #ifdef __linux__
68 /* libcfs.h is not really needed here, but on SLES10/PPC, fs.h includes idr.h
69  * which requires BITS_PER_LONG to be defined */
70 #include <libcfs/libcfs.h>
71 #ifndef BLKGETSIZE64
72 #include <linux/fs.h> /* for BLKGETSIZE64 */
73 #endif
74 #include <linux/version.h>
75 #endif
76 #include <lustre_disk.h>
77 #include <lustre_param.h>
78 #include <lnet/lnetctl.h>
79 #include <lustre_ver.h>
80 #include "mount_utils.h"
81
82 extern char *progname;
83
84 #define L_BLOCK_SIZE 4096
85 /* keep it less than LL_FID_NAMELEN */
86 #define DUMMY_FILE_NAME_LEN             25
87 #define EXT3_DIRENT_SIZE                DUMMY_FILE_NAME_LEN
88
89 /* Write the server config files */
90 int write_local_files(struct mkfs_opts *mop)
91 {
92         char mntpt[] = "/tmp/mntXXXXXX";
93         char filepnm[128];
94         char *dev;
95         FILE *filep;
96         int ret = 0;
97         size_t num;
98
99         /* Mount this device temporarily in order to write these files */
100         if (!mkdtemp(mntpt)) {
101                 fprintf(stderr, "%s: Can't create temp mount point %s: %s\n",
102                         progname, mntpt, strerror(errno));
103                 return errno;
104         }
105
106         dev = mop->mo_device;
107         if (mop->mo_flags & MO_IS_LOOP)
108                 dev = mop->mo_loopdev;
109
110         ret = mount(dev, mntpt, MT_STR(&mop->mo_ldd), 0,
111                     mop->mo_ldd.ldd_mount_opts);
112         if (ret) {
113                 fprintf(stderr, "%s: Unable to mount %s: %s\n",
114                         progname, dev, strerror(errno));
115                 ret = errno;
116                 if (errno == ENODEV) {
117                         fprintf(stderr, "Is the %s module available?\n",
118                                 MT_STR(&mop->mo_ldd));
119                 }
120                 goto out_rmdir;
121         }
122
123         /* Set up initial directories */
124         sprintf(filepnm, "%s/%s", mntpt, MOUNT_CONFIGS_DIR);
125         ret = mkdir(filepnm, 0777);
126         if ((ret != 0) && (errno != EEXIST)) {
127                 fprintf(stderr, "%s: Can't make configs dir %s (%s)\n",
128                         progname, filepnm, strerror(errno));
129                 goto out_umnt;
130         } else if (errno == EEXIST) {
131                 ret = 0;
132         }
133
134         /* Save the persistent mount data into a file. Lustre must pre-read
135            this file to get the real mount options. */
136         vprint("Writing %s\n", MOUNT_DATA_FILE);
137         sprintf(filepnm, "%s/%s", mntpt, MOUNT_DATA_FILE);
138         filep = fopen(filepnm, "w");
139         if (!filep) {
140                 fprintf(stderr, "%s: Unable to create %s file: %s\n",
141                         progname, filepnm, strerror(errno));
142                 goto out_umnt;
143         }
144         num = fwrite(&mop->mo_ldd, sizeof(mop->mo_ldd), 1, filep);
145         if (num < 1 && ferror(filep)) {
146                 fprintf(stderr, "%s: Unable to write to file (%s): %s\n",
147                         progname, filepnm, strerror(errno));
148                 goto out_umnt;
149         }
150         fclose(filep);
151
152 out_umnt:
153         umount(mntpt);
154 out_rmdir:
155         rmdir(mntpt);
156         return ret;
157 }
158
159 int read_local_files(struct mkfs_opts *mop)
160 {
161         char tmpdir[] = "/tmp/dirXXXXXX";
162         char cmd[PATH_MAX];
163         char filepnm[128];
164         char *dev;
165         FILE *filep;
166         int ret = 0;
167         int cmdsz = sizeof(cmd);
168
169         /* Make a temporary directory to hold Lustre data files. */
170         if (!mkdtemp(tmpdir)) {
171                 fprintf(stderr, "%s: Can't create temporary directory %s: %s\n",
172                         progname, tmpdir, strerror(errno));
173                 return errno;
174         }
175
176         dev = mop->mo_device;
177
178         /* TODO: it's worth observing the get_mountdata() function that is
179            in mount_utils.c for getting the mountdata out of the
180            filesystem */
181
182         /* Construct debugfs command line. */
183         snprintf(cmd, cmdsz, "%s -c -R 'dump /%s %s/mountdata' '%s'",
184                  DEBUGFS, MOUNT_DATA_FILE, tmpdir, dev);
185
186         ret = run_command(cmd, cmdsz);
187         if (ret)
188                 verrprint("%s: Unable to dump %s dir (%d)\n",
189                           progname, MOUNT_CONFIGS_DIR, ret);
190
191         sprintf(filepnm, "%s/mountdata", tmpdir);
192         filep = fopen(filepnm, "r");
193         if (filep) {
194                 size_t num_read;
195                 vprint("Reading %s\n", MOUNT_DATA_FILE);
196                 num_read = fread(&mop->mo_ldd, sizeof(mop->mo_ldd), 1, filep);
197                 if (num_read < 1 && ferror(filep)) {
198                         fprintf(stderr, "%s: Unable to read from file %s: %s\n",
199                                 progname, filepnm, strerror(errno));
200                         goto out_close;
201                 }
202         }
203 out_close:
204         fclose(filep);
205
206         snprintf(cmd, cmdsz, "rm -rf %s", tmpdir);
207         run_command(cmd, cmdsz);
208         if (ret)
209                 verrprint("Failed to read old data (%d)\n", ret);
210         return ret;
211 }
212
213
214 /* Display the need for the latest e2fsprogs to be installed. make_backfs
215  * indicates if the caller is make_lustre_backfs() or not. */
216 void disp_old_e2fsprogs_msg(const char *feature, int make_backfs)
217 {
218         static int msg_displayed;
219
220         if (msg_displayed) {
221                 fprintf(stderr, "WARNING: %s does not support %s "
222                         "feature.\n\n", E2FSPROGS, feature);
223                 return;
224         }
225
226         msg_displayed++;
227
228         fprintf(stderr, "WARNING: The %s package currently installed on "
229                 "your system does not support \"%s\" feature.\n",
230                 E2FSPROGS, feature);
231 #if !(HAVE_LDISKFSPROGS)
232         fprintf(stderr, "Please install the latest version of e2fsprogs from\n"
233                 "http://downloads.whamcloud.com/public/e2fsprogs/latest/\n"
234                 "to enable this feature.\n");
235 #endif
236         if (make_backfs)
237                 fprintf(stderr, "Feature will not be enabled until %s"
238                         "is updated and '%s -O %s %%{device}' "
239                         "is run.\n\n", E2FSPROGS, TUNE2FS, feature);
240 }
241
242 /* Check whether the file exists in the device */
243 static int file_in_dev(char *file_name, char *dev_name)
244 {
245         FILE *fp;
246         char debugfs_cmd[256];
247         unsigned int inode_num;
248         int i;
249
250         /* Construct debugfs command line. */
251         snprintf(debugfs_cmd, sizeof(debugfs_cmd),
252                  "%s -c -R 'stat %s' '%s' 2>&1 | egrep '(Inode|unsupported)'",
253                  DEBUGFS, file_name, dev_name);
254
255         fp = popen(debugfs_cmd, "r");
256         if (!fp) {
257                 fprintf(stderr, "%s: %s\n", progname, strerror(errno));
258                 return 0;
259         }
260
261         if (fscanf(fp, "Inode: %u", &inode_num) == 1) { /* exist */
262                 pclose(fp);
263                 return 1;
264         }
265         i = fread(debugfs_cmd, 1, sizeof(debugfs_cmd), fp);
266         if (i) {
267                 debugfs_cmd[i] = 0;
268                 fprintf(stderr, "%s", debugfs_cmd);
269                 if (strstr(debugfs_cmd, "unsupported feature")) {
270                         disp_old_e2fsprogs_msg("an unknown", 0);
271                 }
272                 pclose(fp);
273                 return -1;
274         }
275         pclose(fp);
276         return 0;
277 }
278
279 /* Check whether the device has already been used with lustre */
280 int is_lustre_target(struct mkfs_opts *mop)
281 {
282         int rc;
283
284         vprint("checking for existing Lustre data: ");
285
286         if ((rc = file_in_dev(MOUNT_DATA_FILE, mop->mo_device))) {
287                 vprint("found %s\n",
288                        (rc == 1) ? MOUNT_DATA_FILE : "extents");
289                 /* in the -1 case, 'extents' means this really IS a lustre
290                    target */
291                 return rc;
292         }
293
294         if ((rc = file_in_dev(LAST_RCVD, mop->mo_device))) {
295                 vprint("found %s\n", LAST_RCVD);
296                 return rc;
297         }
298
299         vprint("not found\n");
300         return 0; /* The device is not a lustre target. */
301 }
302
303
304
305 /* Check if a certain feature is supported by e2fsprogs.
306  * Firstly we try to use "debugfs supported_features" command to check if
307  * the feature is supported. If this fails we try to set this feature with
308  * mke2fs to check for its support. */
309 static int is_e2fsprogs_feature_supp(const char *feature)
310 {
311         static char supp_features[4096] = "";
312         FILE *fp;
313         char cmd[PATH_MAX];
314         char imgname[] = "/tmp/test-img-XXXXXX";
315         int fd = -1;
316         int ret = 1;
317
318         if (supp_features[0] == '\0') {
319                 snprintf(cmd, sizeof(cmd), "%s -c -R supported_features 2>&1",
320                          DEBUGFS);
321
322                 /* Using popen() instead of run_command() since debugfs does
323                  * not return proper error code if command is not supported */
324                 fp = popen(cmd, "r");
325                 if (!fp) {
326                         fprintf(stderr, "%s: %s\n", progname, strerror(errno));
327                         return 0;
328                 }
329                 ret = fread(supp_features, 1, sizeof(supp_features), fp);
330                 fclose(fp);
331         }
332         if (ret > 0 && strstr(supp_features,
333                               strncmp(feature, "-O ", 3) ? feature : feature+3))
334                 return 0;
335
336         if ((fd = mkstemp(imgname)) < 0)
337                 return -1;
338         else
339                 close(fd);
340
341         snprintf(cmd, sizeof(cmd), "%s -F %s %s 100 >/dev/null 2>&1",
342                  MKE2FS, feature, imgname);
343         /* run_command() displays the output of mke2fs when it fails for
344          * some feature, so use system() directly */
345         ret = system(cmd);
346         unlink(imgname);
347
348         return ret;
349 }
350
351
352 /**
353  * append_unique: append @key or @key=@val pair to @buf only if @key does not
354  *                exists
355  *      @buf: buffer to hold @key or @key=@val
356  *      @prefix: prefix string before @key
357  *      @key: key string
358  *      @val: value string if it's a @key=@val pair
359  */
360 static void append_unique(char *buf, char *prefix, char *key, char *val,
361                           size_t maxbuflen)
362 {
363         char *anchor, *end;
364         int  len;
365
366         if (key == NULL)
367                 return;
368
369         anchor = end = strstr(buf, key);
370         /* try to find exact match string in @buf */
371         while (end && *end != '\0' && *end != ',' && *end != ' ' && *end != '=')
372                 ++end;
373         len = end - anchor;
374         if (anchor == NULL || strlen(key) != len ||
375                         strncmp(anchor, key, len) != 0) {
376                 if (prefix != NULL)
377                         strscat(buf, prefix, maxbuflen);
378
379                 strscat(buf, key, maxbuflen);
380                 if (val != NULL) {
381                         strscat(buf, "=", maxbuflen);
382                         strscat(buf, val, maxbuflen);
383                 }
384         }
385 }
386
387 static void enable_default_ext4_features(struct mkfs_opts *mop, char *anchor,
388                                          size_t maxbuflen, int user_spec)
389 {
390         if (IS_OST(&mop->mo_ldd)) {
391                 append_unique(anchor, user_spec ? "," : " -O ",
392                               "extents", NULL, sizeof(mop->mo_mkfsopts));
393                 append_unique(anchor, ",", "uninit_bg", NULL, maxbuflen);
394         } else if (IS_MDT(&mop->mo_ldd)) {
395                 append_unique(anchor, user_spec ? "," : " -O ",
396                               "dirdata", NULL, maxbuflen);
397                 append_unique(anchor, ",", "uninit_bg", NULL, maxbuflen);
398                 append_unique(anchor, ",", "^extents", NULL, maxbuflen);
399         } else {
400                 append_unique(anchor, user_spec ? "," : " -O ",
401                               "uninit_bg", NULL, maxbuflen);
402         }
403
404         /* Multiple mount protection enabled only if failover node specified */
405         if (mop->mo_flags & MO_FAILOVER) {
406                 if (is_e2fsprogs_feature_supp("-O mmp") == 0)
407                         append_unique(anchor, ",", "mmp", NULL, maxbuflen);
408                 else
409                         disp_old_e2fsprogs_msg("mmp", 1);
410         }
411
412         /* Allow more than 65000 subdirectories */
413         if (is_e2fsprogs_feature_supp("-O dir_nlink") == 0)
414                 append_unique(anchor, ",", "dir_nlink", NULL, maxbuflen);
415
416         /* The following options are only valid for ext4-based ldiskfs.
417          * If --backfstype=ext3 is specified, do not enable them. */
418         if (mop->mo_ldd.ldd_mount_type == LDD_MT_EXT3)
419                 return;
420
421         /* Allow files larger than 2TB.  Also needs LU-16, but not harmful. */
422         if (is_e2fsprogs_feature_supp("-O huge_file") == 0)
423                 append_unique(anchor, ",", "huge_file", NULL, maxbuflen);
424
425         /* Enable large block addresses if the LUN is over 2^32 blocks. */
426         if (mop->mo_device_sz / (L_BLOCK_SIZE >> 10) >= 0x100002000ULL &&
427             is_e2fsprogs_feature_supp("-O 64bit") == 0)
428                 append_unique(anchor, ",", "64bit", NULL, maxbuflen);
429
430         /* Cluster inode/block bitmaps and inode table for more efficient IO.
431          * Align the flex groups on a 1MB boundary for better performance. */
432         /* This -O feature needs to go last, since it adds the "-G" option. */
433         if (is_e2fsprogs_feature_supp("-O flex_bg") == 0) {
434                 char tmp_buf[64];
435
436                 append_unique(anchor, ",", "flex_bg", NULL, maxbuflen);
437
438                 if (IS_OST(&mop->mo_ldd)) {
439                         snprintf(tmp_buf, sizeof(tmp_buf), " -G %u",
440                                  (1 << 20) / L_BLOCK_SIZE);
441                         strscat(anchor, tmp_buf, maxbuflen);
442                 }
443         }
444         /* Don't add any more "-O" options here, see last comment above */
445 }
446
447 /**
448  * moveopts_to_end: find the option string, move remaining strings to
449  *                  where option string starts, and append the option
450  *                  string at the end
451  *      @start: where the option string starts before the move
452  *      RETURN: where the option string starts after the move
453  */
454 static char *moveopts_to_end(char *start)
455 {
456         char save[512];
457         char *end, *idx;
458
459         /* skip whitespace before options */
460         end = start + 2;
461         while (*end == ' ')
462                 ++end;
463
464         /* find end of option characters */
465         while (*end != ' ' && *end != '\0')
466                 ++end;
467
468         /* save options */
469         strncpy(save, start, end - start);
470         save[end - start] = '\0';
471
472         /* move remaining options up front */
473         if (*end)
474                 memmove(start, end, strlen(end));
475         *(start + strlen(end)) = '\0';
476
477         /* append the specified options */
478         if (*(start + strlen(start) - 1) != ' ')
479                 strcat(start, " ");
480         idx = start + strlen(start);
481         strcat(start, save);
482
483         return idx;
484 }
485
486 /* Build fs according to type */
487 int make_lustre_backfs(struct mkfs_opts *mop)
488 {
489         __u64 device_sz = mop->mo_device_sz, block_count = 0;
490         char mkfs_cmd[PATH_MAX];
491         char buf[64];
492         char *start;
493         char *dev;
494         int ret = 0, ext_opts = 0;
495         size_t maxbuflen;
496
497         if (!(mop->mo_flags & MO_IS_LOOP)) {
498                 mop->mo_device_sz = get_device_size(mop->mo_device);
499
500                 if (mop->mo_device_sz == 0)
501                         return ENODEV;
502
503                 /* Compare to real size */
504                 if (device_sz == 0 || device_sz > mop->mo_device_sz)
505                         device_sz = mop->mo_device_sz;
506                 else
507                         mop->mo_device_sz = device_sz;
508         }
509
510         if (mop->mo_device_sz != 0) {
511                 if (mop->mo_device_sz < 8096){
512                         fprintf(stderr, "%s: size of filesystem must be larger "
513                                 "than 8MB, but is set to %lldKB\n",
514                                 progname, (long long)mop->mo_device_sz);
515                         return EINVAL;
516                 }
517                 block_count = mop->mo_device_sz / (L_BLOCK_SIZE >> 10);
518                 /* If the LUN size is just over 2^32 blocks, limit the
519                  * filesystem size to 2^32-1 blocks to avoid problems with
520                  * ldiskfs/mkfs not handling this size.  Bug 22906 */
521                 if (block_count > 0xffffffffULL && block_count < 0x100002000ULL)
522                         block_count = 0xffffffffULL;
523         }
524
525         if ((mop->mo_ldd.ldd_mount_type == LDD_MT_EXT3) ||
526             (mop->mo_ldd.ldd_mount_type == LDD_MT_LDISKFS) ||
527             (mop->mo_ldd.ldd_mount_type == LDD_MT_LDISKFS2)) {
528                 long inode_size = 0;
529
530                 /* Journal size in MB */
531                 if (strstr(mop->mo_mkfsopts, "-J") == NULL) {
532                         /* Choose our own default journal size */
533                         long journal_sz = 0, max_sz;
534                         if (device_sz > 1024 * 1024) /* 1GB */
535                                 journal_sz = (device_sz / 102400) * 4;
536                         /* cap journal size at 1GB */
537                         if (journal_sz > 1024L)
538                                 journal_sz = 1024L;
539                         /* man mkfs.ext3 */
540                         max_sz = (102400 * L_BLOCK_SIZE) >> 20; /* 400MB */
541                         if (journal_sz > max_sz)
542                                 journal_sz = max_sz;
543                         if (journal_sz) {
544                                 sprintf(buf, " -J size=%ld", journal_sz);
545                                 strscat(mop->mo_mkfsopts, buf,
546                                         sizeof(mop->mo_mkfsopts));
547                         }
548                 }
549
550                 /* Inode size (for extended attributes).  The LOV EA size is
551                  * 32 (EA hdr) + 32 (lov_mds_md) + stripes * 24 (lov_ost_data),
552                  * and we want some margin above that for ACLs, other EAs... */
553                 if (strstr(mop->mo_mkfsopts, "-I") == NULL) {
554                         if (IS_MDT(&mop->mo_ldd)) {
555                                 if (mop->mo_stripe_count > 72)
556                                         inode_size = 512; /* bz 7241 */
557                                 /* see also "-i" below for EA blocks */
558                                 else if (mop->mo_stripe_count > 32)
559                                         inode_size = 2048;
560                                 else if (mop->mo_stripe_count > 10)
561                                         inode_size = 1024;
562                                 else
563                                         inode_size = 512;
564                         } else if (IS_OST(&mop->mo_ldd)) {
565                                 /* We store MDS FID and OST objid in EA on OST
566                                  * we need to make inode bigger as well. */
567                                 inode_size = 256;
568                         }
569
570                         if (inode_size > 0) {
571                                 sprintf(buf, " -I %ld", inode_size);
572                                 strscat(mop->mo_mkfsopts, buf,
573                                         sizeof(mop->mo_mkfsopts));
574                         }
575                 }
576
577                 /* Bytes_per_inode: disk size / num inodes */
578                 if (strstr(mop->mo_mkfsopts, "-i") == NULL &&
579                     strstr(mop->mo_mkfsopts, "-N") == NULL) {
580                         long bytes_per_inode = 0;
581
582                         /* Allocate more inodes on MDT devices.  There is
583                          * no data stored on the MDT, and very little extra
584                          * metadata beyond the inode.  It could go down as
585                          * low as 1024 bytes, but this is conservative.
586                          * Account for external EA blocks for wide striping. */
587                         if (IS_MDT(&mop->mo_ldd)) {
588                                 bytes_per_inode = inode_size + 1536;
589
590                                 if (mop->mo_stripe_count > 72) {
591                                         int extra = mop->mo_stripe_count * 24;
592                                         extra = ((extra - 1) | 4095) + 1;
593                                         bytes_per_inode += extra;
594                                 }
595                         }
596
597                         /* Allocate fewer inodes on large OST devices.  Most
598                          * filesystems can be much more aggressive than even
599                          * this, but it is impossible to know in advance. */
600                         if (IS_OST(&mop->mo_ldd)) {
601                                 /* OST > 16TB assume average file size 1MB */
602                                 if (device_sz > (16ULL << 30))
603                                         bytes_per_inode = 1024 * 1024;
604                                 /* OST > 4TB assume average file size 512kB */
605                                 else if (device_sz > (4ULL << 30))
606                                         bytes_per_inode = 512 * 1024;
607                                 /* OST > 1TB assume average file size 256kB */
608                                 else if (device_sz > (1ULL << 30))
609                                         bytes_per_inode = 256 * 1024;
610                                 /* OST > 10GB assume average file size 64kB,
611                                  * plus a bit so that inodes will fit into a
612                                  * 256x flex_bg without overflowing */
613                                 else if (device_sz > (10ULL << 20))
614                                         bytes_per_inode = 69905;
615                         }
616
617                         if (bytes_per_inode > 0) {
618                                 sprintf(buf, " -i %ld", bytes_per_inode);
619                                 strscat(mop->mo_mkfsopts, buf,
620                                         sizeof(mop->mo_mkfsopts));
621                         }
622                 }
623
624                 if (verbose < 2) {
625                         strscat(mop->mo_mkfsopts, " -q",
626                                 sizeof(mop->mo_mkfsopts));
627                 }
628
629                 /* start handle -O mkfs options */
630                 if ((start = strstr(mop->mo_mkfsopts, "-O")) != NULL) {
631                         if (strstr(start + 2, "-O") != NULL) {
632                                 fprintf(stderr,
633                                         "%s: don't specify multiple -O options\n",
634                                         progname);
635                                 return EINVAL;
636                         }
637                         start = moveopts_to_end(start);
638                         maxbuflen = sizeof(mop->mo_mkfsopts) -
639                                 (start - mop->mo_mkfsopts) - strlen(start);
640                         enable_default_ext4_features(mop, start, maxbuflen, 1);
641                 } else {
642                         start = mop->mo_mkfsopts + strlen(mop->mo_mkfsopts),
643                               maxbuflen = sizeof(mop->mo_mkfsopts) -
644                                       strlen(mop->mo_mkfsopts);
645                         enable_default_ext4_features(mop, start, maxbuflen, 0);
646                 }
647                 /* end handle -O mkfs options */
648
649                 /* start handle -E mkfs options */
650                 if ((start = strstr(mop->mo_mkfsopts, "-E")) != NULL) {
651                         if (strstr(start + 2, "-E") != NULL) {
652                                 fprintf(stderr,
653                                         "%s: don't specify multiple -E options\n",
654                                         progname);
655                                 return EINVAL;
656                         }
657                         start = moveopts_to_end(start);
658                         maxbuflen = sizeof(mop->mo_mkfsopts) -
659                                 (start - mop->mo_mkfsopts) - strlen(start);
660                         ext_opts = 1;
661                 } else {
662                         start = mop->mo_mkfsopts + strlen(mop->mo_mkfsopts);
663                         maxbuflen = sizeof(mop->mo_mkfsopts) -
664                                 strlen(mop->mo_mkfsopts);
665                 }
666
667                 /* In order to align the filesystem metadata on 1MB boundaries,
668                  * give a resize value that will reserve a power-of-two group
669                  * descriptor blocks, but leave one block for the superblock.
670                  * Only useful for filesystems with < 2^32 blocks due to resize
671                  * limitations. */
672                 if (IS_OST(&mop->mo_ldd) && mop->mo_device_sz > 100 * 1024 &&
673                     mop->mo_device_sz * 1024 / L_BLOCK_SIZE <= 0xffffffffULL) {
674                         unsigned group_blocks = L_BLOCK_SIZE * 8;
675                         unsigned desc_per_block = L_BLOCK_SIZE / 32;
676                         unsigned resize_blks;
677
678                         resize_blks = (1ULL<<32) - desc_per_block*group_blocks;
679                         snprintf(buf, sizeof(buf), "%u", resize_blks);
680                         append_unique(start, ext_opts ? "," : " -E ",
681                                       "resize", buf, maxbuflen);
682                         ext_opts = 1;
683                 }
684
685                 /* Avoid zeroing out the full journal - speeds up mkfs */
686                 if (is_e2fsprogs_feature_supp("-E lazy_journal_init") == 0)
687                         append_unique(start, ext_opts ? "," : " -E ",
688                                       "lazy_journal_init", NULL, maxbuflen);
689                 /* end handle -E mkfs options */
690
691                 /* Allow reformat of full devices (as opposed to
692                    partitions.)  We already checked for mounted dev. */
693                 strscat(mop->mo_mkfsopts, " -F", sizeof(mop->mo_mkfsopts));
694
695                 snprintf(mkfs_cmd, sizeof(mkfs_cmd),
696                          "%s -j -b %d -L %s ", MKE2FS, L_BLOCK_SIZE,
697                          mop->mo_ldd.ldd_svname);
698         } else {
699                 fprintf(stderr,"%s: unsupported fs type: %d (%s)\n",
700                         progname, mop->mo_ldd.ldd_mount_type,
701                         MT_STR(&mop->mo_ldd));
702                 return EINVAL;
703         }
704
705         /* For loop device format the dev, not the filename */
706         dev = mop->mo_device;
707         if (mop->mo_flags & MO_IS_LOOP)
708                 dev = mop->mo_loopdev;
709
710         vprint("formatting backing filesystem %s on %s\n",
711                MT_STR(&mop->mo_ldd), dev);
712         vprint("\ttarget name  %s\n", mop->mo_ldd.ldd_svname);
713         vprint("\t4k blocks     "LPU64"\n", block_count);
714         vprint("\toptions       %s\n", mop->mo_mkfsopts);
715
716         /* mkfs_cmd's trailing space is important! */
717         strscat(mkfs_cmd, mop->mo_mkfsopts, sizeof(mkfs_cmd));
718         strscat(mkfs_cmd, " ", sizeof(mkfs_cmd));
719         strscat(mkfs_cmd, dev, sizeof(mkfs_cmd));
720         if (block_count != 0) {
721                 sprintf(buf, " "LPU64, block_count);
722                 strscat(mkfs_cmd, buf, sizeof(mkfs_cmd));
723         }
724
725         vprint("mkfs_cmd = %s\n", mkfs_cmd);
726         ret = run_command(mkfs_cmd, sizeof(mkfs_cmd));
727         if (ret) {
728                 fatal();
729                 fprintf(stderr, "Unable to build fs %s (%d)\n", dev, ret);
730         }
731         return ret;
732 }
733
734 /* return canonicalized absolute pathname, even if the target file does not
735  * exist, unlike realpath */
736 static char *absolute_path(char *devname)
737 {
738         char  buf[PATH_MAX + 1];
739         char *path;
740         char *ptr;
741
742         path = malloc(PATH_MAX + 1);
743         if (path == NULL)
744                 return NULL;
745
746         if (devname[0] != '/') {
747                 if (getcwd(buf, sizeof(buf) - 1) == NULL)
748                         return NULL;
749                 strcat(buf, "/");
750                 strcat(buf, devname);
751         } else {
752                 strcpy(buf, devname);
753         }
754         /* truncate filename before calling realpath */
755         ptr = strrchr(buf, '/');
756         if (ptr == NULL) {
757                 free(path);
758                 return NULL;
759         }
760         *ptr = '\0';
761         if (path != realpath(buf, path)) {
762                 free(path);
763                 return NULL;
764         }
765         /* add the filename back */
766         strcat(path, "/");
767         strcat(path, ptr + 1);
768         return path;
769 }
770
771 /* Determine if a device is a block device (as opposed to a file) */
772 int is_block(char* devname)
773 {
774         struct stat st;
775         int     ret = 0;
776         char    *devpath;
777
778         devpath = absolute_path(devname);
779         if (devpath == NULL) {
780                 fprintf(stderr, "%s: failed to resolve path to %s\n",
781                         progname, devname);
782                 return -1;
783         }
784
785         ret = access(devname, F_OK);
786         if (ret != 0) {
787                 if (strncmp(devpath, "/dev/", 5) == 0) {
788                         /* nobody sane wants to create a loopback file under
789                          * /dev. Let's just report the device doesn't exist */
790                         fprintf(stderr, "%s: %s apparently does not exist\n",
791                                 progname, devpath);
792                         ret = -1;
793                         goto out;
794                 }
795                 ret = 0;
796                 goto out;
797         }
798         ret = stat(devpath, &st);
799         if (ret != 0) {
800                 fprintf(stderr, "%s: cannot stat %s\n", progname, devpath);
801                 goto out;
802         }
803         ret = S_ISBLK(st.st_mode);
804 out:
805         free(devpath);
806         return ret;
807 }
808