Whamcloud - gitweb
LU-12705 build: fix building fail against Power9 little endian
[fs/lustre-release.git] / lustre / utils / obd.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2002, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2011, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/utils/obd.c
33  *
34  * Author: Peter J. Braam <braam@clusterfs.com>
35  * Author: Phil Schwan <phil@clusterfs.com>
36  * Author: Andreas Dilger <adilger@clusterfs.com>
37  * Author: Robert Read <rread@clusterfs.com>
38  */
39
40 #include <sys/ioctl.h>
41 #include <sys/socket.h>
42 #include <sys/stat.h>
43 #include <sys/time.h>
44 #include <sys/types.h>
45 #include <sys/un.h>
46 #include <sys/wait.h>
47
48 #include <ctype.h>
49 #include <errno.h>
50 #include <fcntl.h>
51 #include <getopt.h>
52 #include <signal.h>
53 #include <stdarg.h>
54 #include <stdbool.h>
55 #include <stdio.h>
56 #include <stdlib.h>
57 #include <string.h>
58 #include <time.h>
59 #include <unistd.h>
60 #include <limits.h>
61 #include "obdctl.h"
62 #include "lustreapi_internal.h"
63 #include <libcfs/util/list.h>
64 #include <libcfs/util/ioctl.h>
65 #include <libcfs/util/param.h>
66 #include <libcfs/util/parser.h>
67 #include <libcfs/util/string.h>
68
69 #include <linux/lnet/nidstr.h>
70 #include <linux/lnet/lnetctl.h>
71 #include <linux/lustre/lustre_barrier_user.h>
72 #include <linux/lustre/lustre_cfg.h>
73 #include <linux/lustre/lustre_ioctl.h>
74 #include <linux/lustre/lustre_ostid.h>
75 #include <linux/lustre/lustre_param.h>
76 #include <linux/lustre/lustre_ver.h>
77
78 #include <lustre/lustreapi.h>
79
80 #define MAX_STRING_SIZE 128
81
82 #if HAVE_LIBPTHREAD
83 #include <sys/ipc.h>
84 #include <sys/shm.h>
85 #include <pthread.h>
86
87 #define MAX_THREADS 4096
88 #define MAX_BASE_ID 0xffffffff
89 #define NIDSTRING_LENGTH 64
90 struct shared_data {
91         pthread_mutex_t mutex;
92         pthread_cond_t  cond;
93         int       stopping;
94         struct {
95                 __u64 counters[MAX_THREADS];
96                 __u64 offsets[MAX_THREADS];
97                 int   thr_running;
98                 int   start_barrier;
99                 int   stop_barrier;
100                 struct timeval start_time;
101                 struct timeval end_time;
102         } body;
103 };
104
105 static struct shared_data *shared_data;
106 static __u64 counter_snapshot[2][MAX_THREADS];
107 static int prev_valid;
108 static struct timeval prev_time;
109 static int thread;
110 static int nthreads;
111 #else
112 const int thread = 0;
113 const int nthreads = 1;
114 #endif
115
116 static int cur_device = -1;
117
118 int lcfg_ioctl(char *func, int dev_id, struct lustre_cfg *lcfg)
119 {
120         struct obd_ioctl_data data;
121         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
122         int rc;
123
124         memset(&data, 0, sizeof(data));
125         data.ioc_dev = cur_device;
126         data.ioc_type = LUSTRE_CFG_TYPE;
127         data.ioc_plen1 = lustre_cfg_len(lcfg->lcfg_bufcount,
128                                         lcfg->lcfg_buflens);
129         data.ioc_pbuf1 = (void *)lcfg;
130         memset(buf, 0, sizeof(rawbuf));
131         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
132         if (rc) {
133                 fprintf(stderr, "error: %s: invalid ioctl\n", jt_cmdname(func));
134                 return rc;
135         }
136
137         rc =  l_ioctl(dev_id, OBD_IOC_PROCESS_CFG, buf);
138
139         return rc;
140 }
141
142 static int do_device(char *func, char *devname);
143
144 static int get_mgs_device()
145 {
146         char mgs[] = "$MGS";
147         static int mgs_device = -1;
148
149         if (mgs_device == -1) {
150                 int rc;
151                 do_disconnect(NULL, 1);
152                 rc = do_device("mgsioc", mgs);
153                 if (rc) {
154                         fprintf(stderr,
155                                 "This command must be run on the MGS.\n");
156                         errno = ENODEV;
157                         return -1;
158                 }
159                 mgs_device = cur_device;
160         }
161         return mgs_device;
162 }
163
164 /* Returns -1 on error with errno set */
165 int lcfg_mgs_ioctl(char *func, int dev_id, struct lustre_cfg *lcfg)
166 {
167         struct obd_ioctl_data data;
168         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
169         int rc;
170
171         memset(&data, 0, sizeof(data));
172         rc = data.ioc_dev = get_mgs_device();
173         if (rc < 0)
174                 goto out;
175         data.ioc_type = LUSTRE_CFG_TYPE;
176         data.ioc_plen1 = lustre_cfg_len(lcfg->lcfg_bufcount,
177                                         lcfg->lcfg_buflens);
178         data.ioc_pbuf1 = (void *)lcfg;
179         memset(buf, 0, sizeof(rawbuf));
180         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
181         if (rc) {
182                 fprintf(stderr, "error: %s: invalid ioctl\n", jt_cmdname(func));
183                 return rc;
184         }
185
186         rc = l_ioctl(dev_id, OBD_IOC_PARAM, buf);
187 out:
188         if (rc && errno == ENOSYS)
189                 fprintf(stderr, "Make sure cfg_device is set first.\n");
190
191         return rc;
192 }
193
194 char *obdo_print(struct obdo *obd)
195 {
196         char buf[1024];
197
198         snprintf(buf, sizeof(buf), "id: %#jx\ngrp: %#jx\natime: %ju\n"
199                  "mtime: %ju\nctime: %ju\nsize: %ju\nblocks: %ju"
200                  "\nblksize: %u\nmode: %o\nuid: %d\ngid: %d\nflags: %x\n"
201                  "misc: %x\nnlink: %d,\nvalid %#jx\n",
202                  (uintmax_t)ostid_id(&obd->o_oi),
203                  (uintmax_t)ostid_seq(&obd->o_oi),
204                  (uintmax_t)obd->o_atime, (uintmax_t)obd->o_mtime,
205                  (uintmax_t)obd->o_ctime, (uintmax_t)obd->o_size,
206                  (uintmax_t)obd->o_blocks, obd->o_blksize, obd->o_mode,
207                  obd->o_uid, obd->o_gid, obd->o_flags, obd->o_misc,
208                  obd->o_nlink, (uintmax_t)obd->o_valid);
209         return strdup(buf);
210 }
211
212
213 #define BAD_VERBOSE (-999999999)
214
215 #define N2D_OFF 0x100      /* So we can tell between error codes and devices */
216
217 static int do_name2dev(char *func, char *name)
218 {
219         struct obd_ioctl_data data;
220         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
221         int rc;
222
223         memset(&data, 0, sizeof(data));
224         data.ioc_dev = cur_device;
225         data.ioc_inllen1 = strlen(name) + 1;
226         data.ioc_inlbuf1 = name;
227
228         memset(buf, 0, sizeof(rawbuf));
229         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
230         if (rc < 0) {
231                 fprintf(stderr, "error: %s: invalid ioctl\n", jt_cmdname(func));
232                 return -rc;
233         }
234         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_NAME2DEV, buf);
235         if (rc < 0)
236                 return errno;
237         rc = llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
238         if (rc) {
239                 fprintf(stderr, "error: %s: invalid reply\n", jt_cmdname(func));
240                 return rc;
241         }
242
243         return data.ioc_dev + N2D_OFF;
244 }
245
246 /*
247  * resolve a device name to a device number.
248  * supports a number, $name or %uuid.
249  */
250 int parse_devname(char *func, char *name)
251 {
252         int rc;
253         int ret = -1;
254         int try_digit;
255
256         if (!name)
257                 return ret;
258
259         try_digit = isdigit(name[0]);
260
261         if (name[0] == '$' || name[0] == '%')
262                 name++;
263
264         rc = do_name2dev(func, name);
265         if (rc >= N2D_OFF)
266                 return rc - N2D_OFF;
267
268         if (try_digit)
269                 ret = strtoul(name, NULL, 0);
270         else
271                 fprintf(stderr, "No device found for name %s: %s\n",
272                                 name, strerror(rc));
273         return ret;
274 }
275
276 char *jt_cmdname(char *func)
277 {
278         static char buf[512];
279
280         if (thread) {
281                 sprintf(buf, "%s-%d", func, thread);
282                 return buf;
283         }
284
285         return func;
286 }
287
288 #define difftime(a, b)                                  \
289         ((a)->tv_sec - (b)->tv_sec +                    \
290          ((a)->tv_usec - (b)->tv_usec) / 1000000.0)
291
292 static int be_verbose(int verbose, struct timeval *next_time,
293                       __u64 num, __u64 *next_num, int num_total)
294 {
295         struct timeval now;
296
297         if (!verbose)
298                 return 0;
299
300         if (next_time != NULL)
301                 gettimeofday(&now, NULL);
302
303         /* A positive verbosity means to print every X iterations */
304         if (verbose > 0 && (num >= *next_num || num >= num_total)) {
305                 *next_num += verbose;
306                 if (next_time) {
307                         next_time->tv_sec = now.tv_sec - verbose;
308                         next_time->tv_usec = now.tv_usec;
309                 }
310                 return 1;
311         }
312
313         /* A negative verbosity means to print at most each X seconds */
314         if (verbose < 0 && next_time != NULL &&
315             difftime(&now, next_time) >= 0.0){
316                 next_time->tv_sec = now.tv_sec - verbose;
317                 next_time->tv_usec = now.tv_usec;
318                 *next_num = num;
319                 return 1;
320         }
321
322         return 0;
323 }
324
325 static int get_verbose(char *func, const char *arg)
326 {
327         int verbose;
328         char *end;
329
330         if (!arg || arg[0] == 'v')
331                 verbose = 1;
332         else if (arg[0] == 's' || arg[0] == 'q')
333                 verbose = 0;
334         else {
335                 verbose = (int)strtoul(arg, &end, 0);
336                 if (*end) {
337                         fprintf(stderr, "error: %s: bad verbose option '%s'\n",
338                                 jt_cmdname(func), arg);
339                         return BAD_VERBOSE;
340                 }
341         }
342
343         if (verbose < 0)
344                 printf("Print status every %d seconds\n", -verbose);
345         else if (verbose == 1)
346                 printf("Print status every operation\n");
347         else if (verbose > 1)
348                 printf("Print status every %d operations\n", verbose);
349
350         return verbose;
351 }
352
353 int do_disconnect(char *func, int verbose)
354 {
355         lcfg_set_devname(NULL);
356         cur_device = -1;
357         return 0;
358 }
359
360 #ifdef MAX_THREADS
361 static int shmem_setup(void)
362 {
363         pthread_mutexattr_t mattr;
364         pthread_condattr_t  cattr;
365         int                 rc;
366         int                 shmid;
367
368         /* Create new segment */
369         shmid = shmget(IPC_PRIVATE, sizeof(*shared_data), 0600);
370         if (shmid == -1) {
371                 fprintf(stderr, "Can't create shared data: %s\n",
372                         strerror(errno));
373                 return errno;
374         }
375
376         /* Attatch to new segment */
377         shared_data = (struct shared_data *)shmat(shmid, NULL, 0);
378
379         if (shared_data == (struct shared_data *)(-1)) {
380                 fprintf(stderr, "Can't attach shared data: %s\n",
381                         strerror(errno));
382                 shared_data = NULL;
383                 return errno;
384         }
385
386         /* Mark segment as destroyed, so it will disappear when we exit.
387          * Forks will inherit attached segments, so we should be OK.
388          */
389         if (shmctl(shmid, IPC_RMID, NULL) == -1) {
390                 fprintf(stderr, "Can't destroy shared data: %s\n",
391                         strerror(errno));
392                 return errno;
393         }
394
395         pthread_mutexattr_init(&mattr);
396         pthread_condattr_init(&cattr);
397
398         rc = pthread_mutexattr_setpshared(&mattr, PTHREAD_PROCESS_SHARED);
399         if (rc != 0) {
400                 fprintf(stderr, "Can't set shared mutex attr\n");
401                 goto out;
402         }
403
404         rc = pthread_condattr_setpshared(&cattr, PTHREAD_PROCESS_SHARED);
405         if (rc != 0) {
406                 fprintf(stderr, "Can't set shared cond attr\n");
407                 goto out;
408         }
409
410         pthread_mutex_init(&shared_data->mutex, &mattr);
411         pthread_cond_init(&shared_data->cond, &cattr);
412 out:
413         pthread_mutexattr_destroy(&mattr);
414         pthread_condattr_destroy(&cattr);
415
416         return rc;
417 }
418
419 static inline void shmem_lock(void)
420 {
421         pthread_mutex_lock(&shared_data->mutex);
422 }
423
424 static inline void shmem_unlock(void)
425 {
426         pthread_mutex_unlock(&shared_data->mutex);
427 }
428
429 static inline void shmem_wait(void)
430 {
431         pthread_cond_wait(&shared_data->cond, &shared_data->mutex);
432 }
433
434 static inline void shmem_wakeup_all(void)
435 {
436         pthread_cond_broadcast(&shared_data->cond);
437 }
438
439 static inline void shmem_reset(int total_threads)
440 {
441         if (shared_data == NULL)
442                 return;
443
444         memset(&shared_data->body, 0, sizeof(shared_data->body));
445         memset(counter_snapshot, 0, sizeof(counter_snapshot));
446         prev_valid = 0;
447         shared_data->stopping = 0;
448         shared_data->body.start_barrier = total_threads;
449         shared_data->body.stop_barrier = total_threads;
450 }
451
452 static inline void shmem_bump(__u32 counter)
453 {
454         static bool running_not_bumped = true;
455
456         if (shared_data == NULL || thread <= 0 || thread > MAX_THREADS)
457                 return;
458
459         shmem_lock();
460         shared_data->body.counters[thread - 1] += counter;
461         if (running_not_bumped) {
462                 shared_data->body.thr_running++;
463                 running_not_bumped = false;
464         }
465         shmem_unlock();
466 }
467
468 static void shmem_total(int total_threads)
469 {
470         __u64 total = 0;
471         double secs;
472         int i;
473
474         if (shared_data == NULL || total_threads > MAX_THREADS)
475                 return;
476
477         shmem_lock();
478         for (i = 0; i < total_threads; i++)
479                 total += shared_data->body.counters[i];
480
481         secs = difftime(&shared_data->body.end_time,
482                         &shared_data->body.start_time);
483         shmem_unlock();
484
485         printf("Total: total %ju threads %d sec %f %f/second\n",
486                (uintmax_t)total, total_threads, secs, total / secs);
487
488         return;
489 }
490
491 static void shmem_snap(int total_threads, int live_threads)
492 {
493         struct timeval this_time;
494         int non_zero = 0;
495         __u64 total = 0;
496         double secs;
497         int running;
498         int i;
499
500         if (shared_data == NULL || total_threads > MAX_THREADS)
501                 return;
502
503         shmem_lock();
504         memcpy(counter_snapshot[0], shared_data->body.counters,
505                total_threads * sizeof(counter_snapshot[0][0]));
506         running = shared_data->body.thr_running;
507         shmem_unlock();
508
509         gettimeofday(&this_time, NULL);
510
511         for (i = 0; i < total_threads; i++) {
512                 long long this_count =
513                         counter_snapshot[0][i] - counter_snapshot[1][i];
514
515                 if (this_count != 0) {
516                         non_zero++;
517                         total += this_count;
518                 }
519         }
520
521         secs = difftime(&this_time, &prev_time);
522         if (prev_valid && secs > 1.0) {   /* someone screwed with the time? */
523                 printf("%d/%d Total: %f/second\n", non_zero, total_threads,
524                        total / secs);
525
526                 memcpy(counter_snapshot[1], counter_snapshot[0],
527                        total_threads * sizeof(counter_snapshot[0][0]));
528                 prev_time = this_time;
529         }
530         if (!prev_valid && running == total_threads) {
531                 prev_valid = 1;
532                 /* drop counters when all threads were started */
533                 memcpy(counter_snapshot[1], counter_snapshot[0],
534                        total_threads * sizeof(counter_snapshot[0][0]));
535                 prev_time = this_time;
536         }
537 }
538
539 static void shmem_stop(void)
540 {
541         if (shared_data == NULL)
542                 return;
543
544         shared_data->stopping = 1;
545 }
546
547 static void shmem_cleanup(void)
548 {
549         if (shared_data == NULL)
550                 return;
551
552         shmem_stop();
553
554         pthread_mutex_destroy(&shared_data->mutex);
555         pthread_cond_destroy(&shared_data->cond);
556 }
557
558 static int shmem_running(void)
559 {
560         return (shared_data == NULL || !shared_data->stopping);
561 }
562
563 static void shmem_end_time_locked(void)
564 {
565         shared_data->body.stop_barrier--;
566         if (shared_data->body.stop_barrier == 0)
567                 gettimeofday(&shared_data->body.end_time, NULL);
568 }
569
570 static void shmem_start_time_locked(void)
571 {
572         shared_data->body.start_barrier--;
573         if (shared_data->body.start_barrier == 0) {
574                 shmem_wakeup_all();
575                 gettimeofday(&shared_data->body.start_time, NULL);
576         } else {
577                 shmem_wait();
578         }
579 }
580
581 #else
582 static int shmem_setup(void)
583 {
584         return 0;
585 }
586
587 static inline void shmem_reset(int total_threads)
588 {
589 }
590
591 static inline void shmem_bump(__u32 counters)
592 {
593 }
594
595 static void shmem_lock()
596 {
597 }
598
599 static void shmem_unlock()
600 {
601 }
602
603 static void shmem_cleanup(void)
604 {
605 }
606
607 static int shmem_running(void)
608 {
609         return 1;
610 }
611 #endif
612
613 extern command_t cmdlist[];
614
615 static int do_device(char *func, char *devname)
616 {
617         int dev;
618
619         dev = parse_devname(func, devname);
620         if (dev < 0)
621                 return -1;
622
623         lcfg_set_devname(devname);
624         cur_device = dev;
625         return 0;
626 }
627
628 int jt_obd_get_device()
629 {
630         return cur_device;
631 }
632
633 int jt_obd_device(int argc, char **argv)
634 {
635         int rc;
636
637         if (argc > 2)
638                 return CMD_HELP;
639
640         if (argc == 1) {
641                 printf("current device is %d - %s\n",
642                        cur_device, lcfg_get_devname() ? : "not set");
643                 return 0;
644         }
645         rc = do_device("device", argv[1]);
646         return rc;
647 }
648
649 int jt_opt_device(int argc, char **argv)
650 {
651         int ret;
652         int rc;
653
654         if (argc < 3)
655                 return CMD_HELP;
656
657         rc = do_device("device", argv[1]);
658
659         if (!rc)
660                 rc = Parser_execarg(argc - 2, argv + 2, cmdlist);
661
662         ret = do_disconnect(argv[0], 0);
663         if (!rc)
664                 rc = ret;
665
666         return rc;
667 }
668
669 #ifdef MAX_THREADS
670 static void parent_sighandler (int sig)
671 {
672         return;
673 }
674
675 int jt_opt_threads(int argc, char **argv)
676 {
677         static char      cmdstr[129];
678         sigset_t         saveset;
679         sigset_t         sigset;
680         struct sigaction sigact;
681         struct sigaction saveact1;
682         struct sigaction saveact2;
683         unsigned long    threads;
684         __u64            next_thread;
685         int verbose;
686         int rc = 0;
687         int report_count = -1;
688         char *end;
689         int i;
690
691         if (argc < 5)
692                 return CMD_HELP;
693
694         threads = strtoul(argv[1], &end, 0);
695
696         if (*end == '.')
697                 report_count = strtoul(end + 1, &end, 0);
698
699         if (*end || threads > MAX_THREADS) {
700                 fprintf(stderr, "error: %s: invalid thread count '%s'\n",
701                         jt_cmdname(argv[0]), argv[1]);
702                 return CMD_HELP;
703         }
704
705         verbose = get_verbose(argv[0], argv[2]);
706         if (verbose == BAD_VERBOSE)
707                 return CMD_HELP;
708
709         if (verbose != 0) {
710                 snprintf(cmdstr, sizeof(cmdstr), "%s", argv[4]);
711                 for (i = 5; i < argc; i++)
712                         snprintf(cmdstr + strlen(cmdstr),
713                                  sizeof(cmdstr) - strlen(cmdstr),
714                                  " %s", argv[i]);
715
716                 printf("%s: starting %ld threads on device %s running %s\n",
717                        argv[0], threads, argv[3], cmdstr);
718         }
719
720         shmem_reset(threads);
721
722         sigemptyset(&sigset);
723         sigaddset(&sigset, SIGALRM);
724         sigaddset(&sigset, SIGCHLD);
725         sigprocmask(SIG_BLOCK, &sigset, &saveset);
726
727         nthreads = threads;
728
729         for (i = 1, next_thread = verbose; i <= threads; i++) {
730                 rc = fork();
731                 if (rc < 0) {
732                         fprintf(stderr, "error: %s: #%d - %s\n", argv[0], i,
733                                 strerror(rc = errno));
734                         break;
735                 } else if (rc == 0) {
736                         sigprocmask(SIG_SETMASK, &saveset, NULL);
737
738                         thread = i;
739                         argv[2] = "--device";
740                         exit(jt_opt_device(argc - 2, argv + 2));
741                 } else if (be_verbose(verbose, NULL, i, &next_thread, threads))
742                         printf("%s: thread #%d (PID %d) started\n",
743                                argv[0], i, rc);
744                 rc = 0;
745         }
746
747         if (!thread) {          /* parent process */
748                 int live_threads = threads;
749
750                 sigemptyset(&sigset);
751                 sigemptyset(&sigact.sa_mask);
752                 sigact.sa_handler = parent_sighandler;
753                 sigact.sa_flags = 0;
754
755                 sigaction(SIGALRM, &sigact, &saveact1);
756                 sigaction(SIGCHLD, &sigact, &saveact2);
757
758                 while (live_threads > 0) {
759                         int status;
760                         pid_t ret;
761
762                         if (verbose < 0)        /* periodic stats */
763                                 alarm(-verbose);
764
765                         sigsuspend(&sigset);
766                         alarm(0);
767
768                         while (live_threads > 0) {
769                                 ret = waitpid(0, &status, WNOHANG);
770                                 if (ret == 0)
771                                         break;
772
773                                 if (ret < 0) {
774                                         fprintf(stderr, "error: %s: wait - %s\n",
775                                                 argv[0], strerror(errno));
776                                         if (!rc)
777                                                 rc = errno;
778                                         continue;
779                                 } else {
780                                         /*
781                                          * This is a hack.  We _should_ be able
782                                          * to use WIFEXITED(status) to see if
783                                          * there was an error, but it appears
784                                          * to be broken and it always returns 1
785                                          * (OK).  See wait(2).
786                                          */
787                                         int err = WEXITSTATUS(status);
788                                         if (err || WIFSIGNALED(status))
789                                                 fprintf(stderr,
790                                                         "%s: PID %d had rc=%d\n",
791                                                         argv[0], ret, err);
792                                         if (!rc)
793                                                 rc = err;
794
795                                         live_threads--;
796                                 }
797                         }
798
799                         /* Show stats while all threads running */
800                         if (verbose < 0) {
801                                 shmem_snap(threads, live_threads);
802                                 if (report_count > 0 && --report_count == 0)
803                                         shmem_stop();
804                         }
805                 }
806                 sigaction(SIGCHLD, &saveact2, NULL);
807                 sigaction(SIGALRM, &saveact1, NULL);
808         }
809
810         shmem_total(threads);
811         sigprocmask(SIG_SETMASK, &saveset, NULL);
812
813         return rc;
814 }
815 #else
816 int jt_opt_threads(int argc, char **argv)
817 {
818         fprintf(stderr, "%s not-supported in a single-threaded runtime\n",
819                 jt_cmdname(argv[0]));
820         return CMD_HELP;
821 }
822 #endif
823
824 int jt_opt_net(int argc, char **argv)
825 {
826         char *arg2[3];
827         int rc;
828
829         if (argc < 3)
830                 return CMD_HELP;
831
832         arg2[0] = argv[0];
833         arg2[1] = argv[1];
834         arg2[2] = NULL;
835         rc = jt_ptl_network (2, arg2);
836
837         if (!rc)
838                 rc = Parser_execarg(argc - 2, argv + 2, cmdlist);
839
840         return rc;
841 }
842
843 int jt_obd_no_transno(int argc, char **argv)
844 {
845         struct obd_ioctl_data data;
846         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
847         int rc;
848
849         memset(&data, 0, sizeof(data));
850         data.ioc_dev = cur_device;
851
852         if (argc != 1)
853                 return CMD_HELP;
854
855         memset(buf, 0, sizeof(rawbuf));
856         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
857         if (rc) {
858                 fprintf(stderr, "error: %s: invalid ioctl\n",
859                         jt_cmdname(argv[0]));
860                 return rc;
861         }
862         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_NO_TRANSNO, buf);
863         if (rc < 0)
864                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
865                         strerror(rc = errno));
866
867         return rc;
868 }
869
870 int jt_obd_set_readonly(int argc, char **argv)
871 {
872         struct obd_ioctl_data data;
873         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
874         int rc;
875
876         memset(&data, 0, sizeof(data));
877         data.ioc_dev = cur_device;
878
879         if (argc != 1)
880                 return CMD_HELP;
881
882         memset(buf, 0, sizeof(rawbuf));
883         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
884         if (rc) {
885                 fprintf(stderr, "error: %s: invalid ioctl\n",
886                         jt_cmdname(argv[0]));
887                 return rc;
888         }
889         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_SET_READONLY, buf);
890         if (rc < 0)
891                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
892                         strerror(rc = errno));
893
894         return rc;
895 }
896
897 int jt_obd_abort_recovery(int argc, char **argv)
898 {
899         struct obd_ioctl_data data;
900         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
901         int rc;
902
903         memset(&data, 0, sizeof(data));
904         data.ioc_dev = cur_device;
905
906         if (argc != 1)
907                 return CMD_HELP;
908
909         memset(buf, 0, sizeof(rawbuf));
910         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
911         if (rc) {
912                 fprintf(stderr, "error: %s: invalid ioctl\n",
913                         jt_cmdname(argv[0]));
914                 return rc;
915         }
916         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_ABORT_RECOVERY, buf);
917         if (rc < 0)
918                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
919                         strerror(rc = errno));
920
921         return rc;
922 }
923
924 int jt_get_version(int argc, char **argv)
925 {
926         char version[128];
927         int rc;
928
929         if (argc != 1)
930                 return CMD_HELP;
931
932         rc = llapi_get_version_string(version, sizeof(version));
933         if (rc)
934                 printf("Lustre version: %s\n", LUSTRE_VERSION_STRING);
935         else
936                 printf("Lustre version: %s\n", version);
937
938         return 0;
939 }
940
941 static void print_obd_line(char *s)
942 {
943         const char *param = "osc/%s/ost_conn_uuid";
944         char buf[MAX_STRING_SIZE];
945         char obd_name[MAX_OBD_NAME];
946         FILE *fp = NULL;
947         glob_t path;
948         char *ptr;
949 retry:
950         /* obd device type is the first 3 characters of param name */
951         snprintf(buf, sizeof(buf), " %%*d %%*s %.3s %%%zus %%*s %%*d ",
952                  param, sizeof(obd_name) - 1);
953         if (sscanf(s, buf, obd_name) == 0)
954                 goto try_mdc;
955         if (cfs_get_param_paths(&path, param, obd_name) != 0)
956                 goto try_mdc;
957         fp = fopen(path.gl_pathv[0], "r");
958         if (fp == NULL) {
959                 /* need to free path data before retry */
960                 cfs_free_param_data(&path);
961 try_mdc:
962                 if (param[0] == 'o') { /* failed with osc, try mdc */
963                         param = "mdc/%s/mds_conn_uuid";
964                         goto retry;
965                 }
966                 buf[0] = '\0';
967                 goto fail_print;
968         }
969
970         /* should not ignore fgets(3)'s return value */
971         if (!fgets(buf, sizeof(buf), fp)) {
972                 fprintf(stderr, "reading from %s: %s", buf, strerror(errno));
973                 goto fail_close;
974         }
975
976 fail_close:
977         fclose(fp);
978         cfs_free_param_data(&path);
979
980         /* trim trailing newlines */
981         ptr = strrchr(buf, '\n');
982         if (ptr)
983                 *ptr = '\0';
984 fail_print:
985         ptr = strrchr(s, '\n');
986         if (ptr)
987                 *ptr = '\0';
988         printf("%s%s%s\n", s, buf[0] ? " " : "", buf);
989 }
990
991 /* get device list by ioctl */
992 int jt_obd_list_ioctl(int argc, char **argv)
993 {
994         int rc, index;
995         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
996         struct obd_ioctl_data *data = (struct obd_ioctl_data *)buf;
997
998         if (argc > 2)
999                 return CMD_HELP;
1000         /* Just ignore a -t option.  Only supported with /proc. */
1001         else if (argc == 2 && strcmp(argv[1], "-t") != 0)
1002                 return CMD_HELP;
1003
1004         for (index = 0;; index++) {
1005                 memset(buf, 0, sizeof(rawbuf));
1006                 data->ioc_version = OBD_IOCTL_VERSION;
1007                 data->ioc_inllen1 =
1008                         sizeof(rawbuf) - __ALIGN_KERNEL(sizeof(*data), 8);
1009                 data->ioc_inlbuf1 = buf + __ALIGN_KERNEL(sizeof(*data), 8);
1010                 data->ioc_len = obd_ioctl_packlen(data);
1011                 data->ioc_count = index;
1012
1013                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_GETDEVICE, buf);
1014                 if (rc != 0)
1015                         break;
1016                 printf("%s\n", (char *)data->ioc_bulk);
1017         }
1018         if (rc != 0) {
1019                 if (errno == ENOENT)
1020                         /* no device or the last device */
1021                         rc = 0;
1022                 else
1023                         fprintf(stderr,
1024                                 "Error getting device list: %s: check dmesg\n",
1025                                 strerror(errno));
1026         }
1027         return rc;
1028 }
1029
1030 int jt_obd_list(int argc, char **argv)
1031 {
1032         char buf[MAX_STRING_SIZE];
1033         int print_obd = 0;
1034         glob_t path;
1035         FILE *fp;
1036
1037         if (argc > 2)
1038                 return CMD_HELP;
1039
1040         if (argc == 2) {
1041                 if (strcmp(argv[1], "-t") == 0)
1042                         print_obd = 1;
1043                 else
1044                         return CMD_HELP;
1045         }
1046
1047         if (cfs_get_param_paths(&path, "devices") ||
1048             !(fp = fopen(path.gl_pathv[0], "r"))) {
1049                 cfs_free_param_data(&path);
1050
1051                 return jt_obd_list_ioctl(argc, argv);
1052         }
1053
1054         while (fgets(buf, sizeof(buf), fp) != NULL)
1055                 if (print_obd)
1056                         print_obd_line(buf);
1057                 else
1058                         printf("%s", buf);
1059
1060         cfs_free_param_data(&path);
1061         fclose(fp);
1062         return 0;
1063 }
1064
1065 struct jt_fid_space {
1066         __u64   jt_seq;
1067         __u64   jt_id;
1068         int     jt_width;
1069 };
1070
1071 int jt_obd_alloc_fids(struct jt_fid_space *space, struct lu_fid *fid,
1072                       __u64 *count)
1073 {
1074         int rc;
1075
1076         if (space->jt_seq == 0 || space->jt_id == space->jt_width) {
1077                 struct obd_ioctl_data  data;
1078                 char rawbuf[MAX_IOC_BUFLEN];
1079                 char *buf = rawbuf;
1080                 __u64 seqnr;
1081                 int max_count;
1082
1083                 memset(&data, 0, sizeof(data));
1084                 data.ioc_dev = cur_device;
1085
1086                 data.ioc_pbuf1 = (char *)&seqnr;
1087                 data.ioc_plen1 = sizeof(seqnr);
1088
1089                 data.ioc_pbuf2 = (char *)&max_count;
1090                 data.ioc_plen2 = sizeof(max_count);
1091
1092                 memset(buf, 0, sizeof(rawbuf));
1093                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1094                 if (rc) {
1095                         fprintf(stderr, "error: invalid ioctl rc = %d\n", rc);
1096                         return rc;
1097                 }
1098
1099                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_ECHO_ALLOC_SEQ, buf);
1100                 if (rc) {
1101                         fprintf(stderr, "ioctl error: rc = %d\n", rc);
1102                         return rc;
1103                 }
1104
1105                 space->jt_seq = *(__u64 *)data.ioc_pbuf1;
1106                 space->jt_width = *(int *)data.ioc_pbuf2;
1107                 space->jt_id = 1;
1108         }
1109         fid->f_seq = space->jt_seq;
1110         fid->f_oid = space->jt_id;
1111         fid->f_ver = 0;
1112
1113         space->jt_id = space->jt_id + *count;
1114         if (space->jt_id > space->jt_width)
1115                 space->jt_id = space->jt_width;
1116
1117         *count = space->jt_id - fid->f_oid;
1118         return 0;
1119 }
1120
1121 #define MD_STEP_COUNT 1000
1122 int jt_obd_md_common(int argc, char **argv, int cmd)
1123 {
1124         struct obd_ioctl_data  data;
1125         struct timeval         start;
1126         struct timeval         end_time;
1127         char                   rawbuf[MAX_IOC_BUFLEN];
1128         char                  *buf = rawbuf;
1129         int                    mode = 0000644;
1130         int                    create_mode;
1131         int                    rc = 0;
1132         char                  *parent_basedir = NULL;
1133         char                   dirname[4096];
1134         int                    parent_base_id = 0;
1135         int                    parent_count = 1;
1136         __u64                  child_base_id = -1;
1137         int                    stripe_count = 0;
1138         int                    stripe_index = -1;
1139         int                    count = 0;
1140         char                  *end;
1141         __u64                  seconds = 0;
1142         double                 diff;
1143         int                    c;
1144         __u64                  total_count = 0;
1145         char                  *name = NULL;
1146         struct jt_fid_space    fid_space = {0};
1147         int                    version = 0;
1148         struct option long_opts[] = {
1149         { .val = 'b',   .name = "child_base_id",
1150                                                 .has_arg = required_argument },
1151         { .val = 'c',   .name = "stripe_count",
1152                                                 .has_arg = required_argument },
1153         { .val = 'd',   .name = "parent_basedir",
1154                                                 .has_arg = required_argument },
1155         { .val = 'D',   .name = "parent_dircount",
1156                                                 .has_arg = required_argument },
1157         { .val = 'i',   .name = "stripe_index", .has_arg = required_argument },
1158         { .val = 'm',   .name = "mode",         .has_arg = required_argument },
1159         { .val = 'n',   .name = "count",        .has_arg = required_argument },
1160         { .val = 't',   .name = "time",         .has_arg = required_argument },
1161         { .val = 'v',   .name = "version",      .has_arg = no_argument },
1162         { .name = NULL } };
1163
1164         while ((c = getopt_long(argc, argv, "b:c:d:D:m:n:t:v",
1165                                 long_opts, NULL)) >= 0) {
1166                 switch (c) {
1167                 case 'b':
1168                         child_base_id = strtoull(optarg, &end, 0);
1169                         if (*end) {
1170                                 fprintf(stderr, "error: %s: bad child_base_id"
1171                                         " '%s'\n", jt_cmdname(argv[0]), optarg);
1172                                 return CMD_HELP;
1173                         }
1174                         break;
1175                 case 'c':
1176                         stripe_count = strtoul(optarg, &end, 0);
1177                         if (*end) {
1178                                 fprintf(stderr, "error: %s: bad stripe count"
1179                                         " '%s'\n", jt_cmdname(argv[0]), optarg);
1180                                 return CMD_HELP;
1181                         }
1182                         break;
1183                 case 'd':
1184                         parent_basedir = optarg;
1185                         break;
1186                 case 'D':
1187                         parent_count = strtoul(optarg, &end, 0);
1188                         if (*end) {
1189                                 fprintf(stderr, "error: %s: bad parent count"
1190                                         " '%s'\n", jt_cmdname(argv[0]), optarg);
1191                                 return CMD_HELP;
1192                         }
1193                         break;
1194                 case 'i':
1195                         stripe_index = strtoul(optarg, &end, 0);
1196                         if (*end) {
1197                                 fprintf(stderr, "error: %s: bad stripe index"
1198                                         " '%s'\n", jt_cmdname(argv[0]), optarg);
1199                                 return CMD_HELP;
1200                         }
1201                         break;
1202                 case 'm':
1203                         mode = strtoul(optarg, &end, 0);
1204                         if (*end) {
1205                                 fprintf(stderr, "error: %s: bad mode '%s'\n",
1206                                         jt_cmdname(argv[0]), optarg);
1207                                 return CMD_HELP;
1208                         }
1209                         break;
1210                 case 'n':
1211                         total_count = strtoul(optarg, &end, 0);
1212                         if (*end || total_count == 0) {
1213                                 fprintf(stderr, "%s: bad child count '%s'\n",
1214                                         jt_cmdname(argv[0]), optarg);
1215                                 return CMD_HELP;
1216                         }
1217                         break;
1218                 case 't':
1219                         seconds = strtoull(optarg, &end, 0);
1220                         if (*end) {
1221                                 fprintf(stderr, "error: %s: seconds '%s'\n",
1222                                         jt_cmdname(argv[0]), optarg);
1223                                 return CMD_HELP;
1224                         }
1225                         break;
1226                 case 'v':
1227                         version = 1;
1228                         break;
1229                 default:
1230                         fprintf(stderr, "error: %s: option '%s' "
1231                                 "unrecognized\n", argv[0], argv[optind - 1]);
1232                         return CMD_HELP;
1233                 }
1234         }
1235
1236         memset(&data, 0, sizeof(data));
1237         data.ioc_dev = cur_device;
1238         if (child_base_id == -1) {
1239                 if (optind >= argc)
1240                         return CMD_HELP;
1241                 name = argv[optind];
1242                 total_count = 1;
1243         } else {
1244                 if (optind < argc) {
1245                         fprintf(stderr, "child_base_id and name can not"
1246                                         " specified at the same time\n");
1247                         return CMD_HELP;
1248                 }
1249         }
1250
1251         if (stripe_count == 0 && stripe_index != -1) {
1252                 fprintf(stderr, "If stripe_count is 0, stripe_index can not"
1253                                 "be specified\n");
1254                 return CMD_HELP;
1255         }
1256
1257         if (total_count == 0 && seconds == 0) {
1258                 fprintf(stderr, "count or seconds needs to be indicated\n");
1259                 return CMD_HELP;
1260         }
1261
1262         if (parent_count <= 0) {
1263                 fprintf(stderr, "parent count must < 0\n");
1264                 return CMD_HELP;
1265         }
1266
1267 #ifdef MAX_THREADS
1268         if (thread) {
1269                 shmem_lock();
1270                 /* threads interleave */
1271                 if (parent_base_id != -1)
1272                         parent_base_id += (thread - 1) % parent_count;
1273
1274                 if (child_base_id != -1)
1275                         child_base_id +=  (thread - 1) * \
1276                                           (MAX_BASE_ID / nthreads);
1277
1278                 shmem_start_time_locked();
1279                 shmem_unlock();
1280         }
1281 #endif
1282         /* If parent directory is not specified, try to get the directory
1283          * from name */
1284         if (parent_basedir == NULL) {
1285                 char *last_lash;
1286                 if (name == NULL) {
1287                         fprintf(stderr, "parent_basedir or name must be"
1288                                         "indicated!\n");
1289                         return CMD_HELP;
1290                 }
1291                 /*Get directory and name from name*/
1292                 last_lash = strrchr(name, '/');
1293                 if (last_lash == NULL || name[0] != '/') {
1294                         fprintf(stderr, "Can not locate %s\n", name);
1295                         return CMD_HELP;
1296                 }
1297
1298                 if (last_lash == name) {
1299                         sprintf(dirname, "%s", "/");
1300                         name++;
1301                 } else {
1302                         int namelen = (unsigned long)last_lash -
1303                                       (unsigned long)name + 1;
1304                         snprintf(dirname, namelen, "%s", name);
1305                         name = last_lash + 1;
1306                 }
1307
1308                 data.ioc_pbuf1 = dirname;
1309                 data.ioc_plen1 = strlen(dirname);
1310
1311                 data.ioc_pbuf2 = name;
1312                 data.ioc_plen2 = strlen(name);
1313         } else {
1314                 if (name != NULL) {
1315                         data.ioc_pbuf2 = name;
1316                         data.ioc_plen2 = strlen(name);
1317                 }
1318                 if (parent_base_id > 0)
1319                         sprintf(dirname, "%s%d", parent_basedir,
1320                                 parent_base_id);
1321                 else
1322                         sprintf(dirname, "%s", parent_basedir);
1323                 data.ioc_pbuf1 = dirname;
1324                 data.ioc_plen1 = strlen(dirname);
1325         }
1326
1327         if (cmd == ECHO_MD_MKDIR || cmd == ECHO_MD_RMDIR)
1328                 create_mode = S_IFDIR;
1329         else
1330                 create_mode = S_IFREG;
1331
1332         data.ioc_obdo1.o_mode = mode | S_IFDIR;
1333         data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLMODE |
1334                                  OBD_MD_FLFLAGS | OBD_MD_FLGROUP;
1335         data.ioc_command = cmd;
1336
1337         gettimeofday(&start, NULL);
1338         while (shmem_running()) {
1339                 struct lu_fid fid = { 0 };
1340
1341                 if (child_base_id != -1)
1342                         data.ioc_obdo2.o_oi.oi.oi_id = child_base_id;
1343                 data.ioc_obdo2.o_mode = mode | create_mode;
1344                 data.ioc_obdo2.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE |
1345                                          OBD_MD_FLMODE | OBD_MD_FLFLAGS |
1346                                          OBD_MD_FLGROUP;
1347                 data.ioc_obdo2.o_misc = stripe_count;
1348                 data.ioc_obdo2.o_stripe_idx = stripe_index;
1349
1350                 if (total_count > 0) {
1351                         if ((total_count - count) > MD_STEP_COUNT)
1352                                 data.ioc_count = MD_STEP_COUNT;
1353                         else
1354                                 data.ioc_count = total_count - count;
1355                 } else {
1356                         data.ioc_count = MD_STEP_COUNT;
1357                 }
1358
1359                 if (cmd == ECHO_MD_CREATE || cmd == ECHO_MD_MKDIR) {
1360                         /*Allocate fids for the create */
1361                         rc = jt_obd_alloc_fids(&fid_space, &fid,
1362                                                &data.ioc_count);
1363                         if (rc) {
1364                                 fprintf(stderr, "Allocate fids error %d.\n",rc);
1365                                 return rc;
1366                         }
1367                         data.ioc_obdo1.o_oi.oi_fid = fid;
1368                 }
1369
1370                 child_base_id += data.ioc_count;
1371                 count += data.ioc_count;
1372
1373                 memset(buf, 0, sizeof(rawbuf));
1374                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1375                 if (rc) {
1376                         fprintf(stderr, "error: %s: invalid ioctl %d\n",
1377                                 jt_cmdname(argv[0]), rc);
1378                         return rc;
1379                 }
1380
1381                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_ECHO_MD, buf);
1382                 if (rc) {
1383                         fprintf(stderr, "error: %s: %s\n",
1384                                 jt_cmdname(argv[0]), strerror(rc = errno));
1385                         return rc;
1386                 }
1387                 shmem_bump(data.ioc_count);
1388
1389                 gettimeofday(&end_time, NULL);
1390                 diff = difftime(&end_time, &start);
1391                 if (seconds > 0 && (__u64)diff > seconds)
1392                         break;
1393
1394                 if (count >= total_count && total_count > 0)
1395                         break;
1396         }
1397
1398         if (count > 0 && version) {
1399                 gettimeofday(&end_time, NULL);
1400                 diff = difftime(&end_time, &start);
1401                 printf("%s: %d in %.3fs (%.3f /s): %s",
1402                         jt_cmdname(argv[0]), count, diff,
1403                         (double)count/diff, ctime(&end_time.tv_sec));
1404         }
1405
1406 #ifdef MAX_THREADS
1407         if (thread) {
1408                 shmem_lock();
1409                 shmem_end_time_locked();
1410                 shmem_unlock();
1411         }
1412 #endif
1413         return rc;
1414 }
1415
1416 int jt_obd_test_create(int argc, char **argv)
1417 {
1418         return jt_obd_md_common(argc, argv, ECHO_MD_CREATE);
1419 }
1420
1421 int jt_obd_test_mkdir(int argc, char **argv)
1422 {
1423         return jt_obd_md_common(argc, argv, ECHO_MD_MKDIR);
1424 }
1425
1426 int jt_obd_test_destroy(int argc, char **argv)
1427 {
1428         return jt_obd_md_common(argc, argv, ECHO_MD_DESTROY);
1429 }
1430
1431 int jt_obd_test_rmdir(int argc, char **argv)
1432 {
1433         return jt_obd_md_common(argc, argv, ECHO_MD_RMDIR);
1434 }
1435
1436 int jt_obd_test_lookup(int argc, char **argv)
1437 {
1438         return jt_obd_md_common(argc, argv, ECHO_MD_LOOKUP);
1439 }
1440
1441 int jt_obd_test_setxattr(int argc, char **argv)
1442 {
1443         return jt_obd_md_common(argc, argv, ECHO_MD_SETATTR);
1444 }
1445
1446 int jt_obd_test_md_getattr(int argc, char **argv)
1447 {
1448         return jt_obd_md_common(argc, argv, ECHO_MD_GETATTR);
1449 }
1450
1451 int jt_obd_create(int argc, char **argv)
1452 {
1453         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1454         struct obd_ioctl_data data;
1455         struct timeval next_time;
1456         __u64 count = 1, next_count, base_id = 1;
1457         int verbose = 1, mode = 0100644, rc = 0, i;
1458         char *end;
1459
1460         memset(&data, 0, sizeof(data));
1461         data.ioc_dev = cur_device;
1462         if (argc < 2 || argc > 4)
1463                 return CMD_HELP;
1464
1465         count = strtoull(argv[1], &end, 0);
1466         if (*end) {
1467                 fprintf(stderr, "error: %s: invalid iteration count '%s'\n",
1468                         jt_cmdname(argv[0]), argv[1]);
1469                 return CMD_HELP;
1470         }
1471
1472         if (argc > 2) {
1473                 mode = strtoul(argv[2], &end, 0);
1474                 if (*end) {
1475                         fprintf(stderr, "error: %s: invalid mode '%s'\n",
1476                                 jt_cmdname(argv[0]), argv[2]);
1477                         return CMD_HELP;
1478                 }
1479                 if (!(mode & S_IFMT))
1480                         mode |= S_IFREG;
1481         }
1482
1483         if (argc > 3) {
1484                 verbose = get_verbose(argv[0], argv[3]);
1485                 if (verbose == BAD_VERBOSE)
1486                         return CMD_HELP;
1487         }
1488
1489         printf("%s: %jd objects\n", jt_cmdname(argv[0]), (uintmax_t)count);
1490         gettimeofday(&next_time, NULL);
1491         next_time.tv_sec -= verbose;
1492
1493         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1494         for (i = 1, next_count = verbose; i <= count && shmem_running(); i++) {
1495                 /*
1496                  * base_id is 1 so we don't need to worry about it being
1497                  * greater than OBIF_MAX_OID
1498                  */
1499                 data.ioc_obdo1.o_oi.oi_fid.f_oid = base_id;
1500                 data.ioc_obdo1.o_mode = mode;
1501                 data.ioc_obdo1.o_uid = 0;
1502                 data.ioc_obdo1.o_gid = 0;
1503                 data.ioc_obdo1.o_projid = 0;
1504                 data.ioc_obdo1.o_valid = OBD_MD_FLTYPE | OBD_MD_FLMODE |
1505                                          OBD_MD_FLID | OBD_MD_FLUID |
1506                                          OBD_MD_FLGID | OBD_MD_FLGROUP |
1507                                          OBD_MD_FLPROJID;
1508
1509                 memset(buf, 0, sizeof(rawbuf));
1510                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1511                 if (rc) {
1512                         fprintf(stderr, "error: %s: invalid ioctl\n",
1513                                 jt_cmdname(argv[0]));
1514                         return rc;
1515                 }
1516                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_CREATE, buf);
1517                 llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
1518                 shmem_bump(1);
1519                 if (rc < 0) {
1520                         fprintf(stderr, "error: %s: #%d - %s\n",
1521                                 jt_cmdname(argv[0]), i, strerror(rc = errno));
1522                         break;
1523                 }
1524                 if (!(data.ioc_obdo1.o_valid & OBD_MD_FLID)) {
1525                         fprintf(stderr, "error: %s: oid not valid #%d:%#jx\n",
1526                                 jt_cmdname(argv[0]), i,
1527                                 (uintmax_t)data.ioc_obdo1.o_valid);
1528                         rc = EINVAL;
1529                         break;
1530                 }
1531
1532                 if (be_verbose(verbose, &next_time, i, &next_count, count))
1533                         printf("%s: #%d is object id %#jx\n",
1534                                jt_cmdname(argv[0]), i,
1535                                (uintmax_t) ostid_id(&data.ioc_obdo1.o_oi));
1536         }
1537
1538         return rc;
1539 }
1540
1541 int jt_obd_setattr(int argc, char **argv)
1542 {
1543         struct obd_ioctl_data data;
1544         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1545         __u64 objid;
1546         char *end;
1547         int mode;
1548         int rc;
1549
1550         memset(&data, 0, sizeof(data));
1551         data.ioc_dev = cur_device;
1552         if (argc != 2)
1553                 return CMD_HELP;
1554
1555         objid = strtoull(argv[1], &end, 0);
1556         if (*end) {
1557                 fprintf(stderr, "error: %s: objid '%s' is not a number\n",
1558                         jt_cmdname(argv[0]), argv[1]);
1559                 return CMD_HELP;
1560         }
1561
1562         if (objid >= OBIF_MAX_OID) {
1563                 fprintf(stderr, "error: %s: invalid objid '%s'\n",
1564                         jt_cmdname(argv[0]), argv[1]);
1565                 return CMD_HELP;
1566         }
1567
1568         mode = strtoul(argv[2], &end, 0);
1569         if (*end) {
1570                 fprintf(stderr, "error: %s: invalid mode '%s'\n",
1571                         jt_cmdname(argv[0]), argv[2]);
1572                 return CMD_HELP;
1573         }
1574
1575         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1576         data.ioc_obdo1.o_mode = S_IFREG | mode;
1577         data.ioc_obdo1.o_oi.oi_fid.f_oid = objid;
1578         data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLMODE;
1579
1580         memset(buf, 0, sizeof(rawbuf));
1581         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1582         if (rc) {
1583                 fprintf(stderr, "error: %s: invalid ioctl\n",
1584                         jt_cmdname(argv[0]));
1585                 return rc;
1586         }
1587         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_SETATTR, buf);
1588         if (rc < 0)
1589                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
1590                         strerror(rc = errno));
1591
1592         return rc;
1593 }
1594
1595 int jt_obd_test_setattr(int argc, char **argv)
1596 {
1597         struct obd_ioctl_data data;
1598         struct timeval start, next_time;
1599         __u64 i, count, next_count;
1600         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1601         int verbose = 1;
1602         __u64 objid = 3;
1603         char *end;
1604         int rc = 0;
1605
1606         if (argc < 2 || argc > 4)
1607                 return CMD_HELP;
1608
1609         memset(&data, 0, sizeof(data));
1610         data.ioc_dev = cur_device;
1611         count = strtoull(argv[1], &end, 0);
1612         if (*end) {
1613                 fprintf(stderr, "error: %s: invalid iteration count '%s'\n",
1614                         jt_cmdname(argv[0]), argv[1]);
1615                 return CMD_HELP;
1616         }
1617
1618         if (argc >= 3) {
1619                 verbose = get_verbose(argv[0], argv[2]);
1620                 if (verbose == BAD_VERBOSE)
1621                         return CMD_HELP;
1622         }
1623
1624         if (argc >= 4) {
1625                 if (argv[3][0] == 't') {
1626                         objid = strtoull(argv[3] + 1, &end, 0);
1627                         if (thread)
1628                                 objid += thread - 1;
1629                 } else
1630                         objid = strtoull(argv[3], &end, 0);
1631                 if (*end) {
1632                         fprintf(stderr, "error: %s: invalid objid '%s'\n",
1633                                 jt_cmdname(argv[0]), argv[3]);
1634                         return CMD_HELP;
1635                 }
1636         }
1637
1638         gettimeofday(&start, NULL);
1639         next_time.tv_sec = start.tv_sec - verbose;
1640         next_time.tv_usec = start.tv_usec;
1641         if (verbose != 0)
1642                 printf("%s: setting %jd attrs (objid %#jx): %s",
1643                        jt_cmdname(argv[0]), (uintmax_t)count,
1644                        (uintmax_t)objid, ctime(&start.tv_sec));
1645
1646         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1647         for (i = 1, next_count = verbose; i <= count && shmem_running(); i++) {
1648                 if (objid >= OBIF_MAX_OID) {
1649                         fprintf(stderr, "errr: %s: invalid objid '%llu'\n",
1650                                 jt_cmdname(argv[0]), (unsigned long long)objid);
1651                         return -E2BIG;
1652                 }
1653
1654                 data.ioc_obdo1.o_oi.oi_fid.f_oid = objid;
1655                 data.ioc_obdo1.o_mode = S_IFREG;
1656                 data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE |
1657                                          OBD_MD_FLMODE;
1658                 memset(buf, 0, sizeof(rawbuf));
1659                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1660                 if (rc) {
1661                         fprintf(stderr, "error: %s: invalid ioctl\n",
1662                                 jt_cmdname(argv[0]));
1663                         return rc;
1664                 }
1665                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_SETATTR, &data);
1666                 shmem_bump(1);
1667                 if (rc < 0) {
1668                         fprintf(stderr, "error: %s: #%jd - %d:%s\n",
1669                                 jt_cmdname(argv[0]), (uintmax_t)i,
1670                                 errno, strerror(rc = errno));
1671                         break;
1672                 }
1673                 if (be_verbose(verbose, &next_time, i, &next_count, count))
1674                         printf("%s: set attr #%jd\n",
1675                                jt_cmdname(argv[0]), (uintmax_t)i);
1676         }
1677
1678         if (!rc) {
1679                 struct timeval end;
1680                 double diff;
1681
1682                 gettimeofday(&end, NULL);
1683
1684                 diff = difftime(&end, &start);
1685
1686                 --i;
1687                 if (verbose != 0)
1688                         printf("%s: %jd attrs in %.3fs (%.3f attr/s): %s",
1689                                jt_cmdname(argv[0]), (uintmax_t)i, diff,
1690                                i / diff, ctime(&end.tv_sec));
1691         }
1692         return rc;
1693 }
1694
1695 int jt_obd_destroy(int argc, char **argv)
1696 {
1697         struct obd_ioctl_data data;
1698         struct timeval next_time;
1699         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1700         __u64 count = 1, next_count;
1701         int verbose = 1;
1702         __u64 id;
1703         char *end;
1704         int rc = 0, i;
1705
1706         memset(&data, 0, sizeof(data));
1707         data.ioc_dev = cur_device;
1708         if (argc < 2 || argc > 4)
1709                 return CMD_HELP;
1710
1711         errno = 0;
1712         id = strtoull(argv[1], &end, 0);
1713         if (*end || id == 0 || errno != 0) {
1714                 fprintf(stderr, "error: %s: invalid objid '%s'\n",
1715                         jt_cmdname(argv[0]), argv[1]);
1716                 return CMD_HELP;
1717         }
1718         if (argc > 2) {
1719                 count = strtoull(argv[2], &end, 0);
1720                 if (*end) {
1721                         fprintf(stderr,
1722                                 "error: %s: invalid iteration count '%s'\n",
1723                                 jt_cmdname(argv[0]), argv[2]);
1724                         return CMD_HELP;
1725                 }
1726         }
1727
1728         if (argc > 3) {
1729                 verbose = get_verbose(argv[0], argv[3]);
1730                 if (verbose == BAD_VERBOSE)
1731                         return CMD_HELP;
1732         }
1733
1734         printf("%s: %jd objects\n", jt_cmdname(argv[0]), (uintmax_t)count);
1735         gettimeofday(&next_time, NULL);
1736         next_time.tv_sec -= verbose;
1737
1738         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1739         for (i = 1, next_count = verbose; i <= count && shmem_running();
1740              i++, id++) {
1741                 if (id >= OBIF_MAX_OID) {
1742                         fprintf(stderr, "errr: %s: invalid objid '%llu'\n",
1743                                 jt_cmdname(argv[0]), (unsigned long long)id);
1744                         return -E2BIG;
1745                 }
1746
1747                 data.ioc_obdo1.o_oi.oi_fid.f_oid = id;
1748                 data.ioc_obdo1.o_mode = S_IFREG | 0644;
1749                 data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLMODE;
1750
1751                 memset(buf, 0, sizeof(rawbuf));
1752                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1753                 if (rc) {
1754                         fprintf(stderr, "error: %s: invalid ioctl\n",
1755                                 jt_cmdname(argv[0]));
1756                         return rc;
1757                 }
1758                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_DESTROY, buf);
1759                 llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
1760                 shmem_bump(1);
1761                 if (rc < 0) {
1762                         fprintf(stderr, "error: %s: objid %#jx: %s\n",
1763                                 jt_cmdname(argv[0]), (uintmax_t)id,
1764                                 strerror(rc = errno));
1765                         break;
1766                 }
1767
1768                 if (be_verbose(verbose, &next_time, i, &next_count, count))
1769                         printf("%s: #%d is object id %#jx\n",
1770                                jt_cmdname(argv[0]), i, (uintmax_t)id);
1771         }
1772
1773         return rc;
1774 }
1775
1776 int jt_obd_getattr(int argc, char **argv)
1777 {
1778         struct obd_ioctl_data data;
1779         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1780         __u64 objid;
1781         char *end;
1782         int rc;
1783
1784         if (argc != 2)
1785                 return CMD_HELP;
1786
1787         objid = strtoull(argv[1], &end, 0);
1788         if (*end) {
1789                 fprintf(stderr, "error: %s: objid '%s' is not a number\n",
1790                         jt_cmdname(argv[0]), argv[1]);
1791                 return CMD_HELP;
1792         }
1793
1794         if (objid >= OBIF_MAX_OID) {
1795                 fprintf(stderr, "error: %s: invalid objid '%s'\n",
1796                         jt_cmdname(argv[0]), argv[1]);
1797                 return CMD_HELP;
1798         }
1799
1800         memset(&data, 0, sizeof(data));
1801         data.ioc_dev = cur_device;
1802         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1803         data.ioc_obdo1.o_oi.oi_fid.f_oid = objid;
1804         /* to help obd filter */
1805         data.ioc_obdo1.o_mode = 0100644;
1806         data.ioc_obdo1.o_valid = 0xffffffff;
1807         printf("%s: object id %#jx\n", jt_cmdname(argv[0]),
1808                (uintmax_t)ostid_id(&data.ioc_obdo1.o_oi));
1809
1810         memset(buf, 0, sizeof(rawbuf));
1811         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1812         if (rc) {
1813                 fprintf(stderr, "error: %s: invalid ioctl\n",
1814                         jt_cmdname(argv[0]));
1815                 return rc;
1816         }
1817         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_GETATTR, buf);
1818         llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
1819         if (rc) {
1820                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
1821                         strerror(rc = errno));
1822         } else {
1823                 printf("%s: object id %ju, mode %o\n", jt_cmdname(argv[0]),
1824                        (uintmax_t)ostid_id(&data.ioc_obdo1.o_oi),
1825                        data.ioc_obdo1.o_mode);
1826         }
1827         return rc;
1828 }
1829
1830 int jt_obd_test_getattr(int argc, char **argv)
1831 {
1832         struct obd_ioctl_data data;
1833         struct timeval start, next_time;
1834         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1835         __u64 i, count, next_count;
1836         int verbose = 1;
1837         __u64 objid = 3;
1838         char *end;
1839         int rc = 0;
1840
1841         if (argc < 2 || argc > 4)
1842                 return CMD_HELP;
1843
1844         memset(&data, 0, sizeof(data));
1845         data.ioc_dev = cur_device;
1846         count = strtoull(argv[1], &end, 0);
1847         if (*end) {
1848                 fprintf(stderr, "error: %s: invalid iteration count '%s'\n",
1849                         jt_cmdname(argv[0]), argv[1]);
1850                 return CMD_HELP;
1851         }
1852
1853         if (argc >= 3) {
1854                 verbose = get_verbose(argv[0], argv[2]);
1855                 if (verbose == BAD_VERBOSE)
1856                         return CMD_HELP;
1857         }
1858
1859         if (argc >= 4) {
1860                 if (argv[3][0] == 't') {
1861                         objid = strtoull(argv[3] + 1, &end, 0);
1862                         if (thread)
1863                                 objid += thread - 1;
1864                 } else
1865                         objid = strtoull(argv[3], &end, 0);
1866                 if (*end) {
1867                         fprintf(stderr, "error: %s: invalid objid '%s'\n",
1868                                 jt_cmdname(argv[0]), argv[3]);
1869                         return CMD_HELP;
1870                 }
1871         }
1872
1873         gettimeofday(&start, NULL);
1874         next_time.tv_sec = start.tv_sec - verbose;
1875         next_time.tv_usec = start.tv_usec;
1876         if (verbose != 0)
1877                 printf("%s: getting %jd attrs (objid %#jx): %s",
1878                        jt_cmdname(argv[0]), (uintmax_t)count,
1879                        (uintmax_t)objid, ctime(&start.tv_sec));
1880
1881         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1882         for (i = 1, next_count = verbose; i <= count && shmem_running(); i++) {
1883                 if (objid >= OBIF_MAX_OID) {
1884                         fprintf(stderr, "errr: %s: invalid objid '%llu'\n",
1885                                 jt_cmdname(argv[0]), (unsigned long long)objid);
1886                         return -E2BIG;
1887                 }
1888
1889                 data.ioc_obdo1.o_oi.oi_fid.f_oid = objid;
1890                 data.ioc_obdo1.o_mode = S_IFREG;
1891                 data.ioc_obdo1.o_valid = 0xffffffff;
1892                 memset(buf, 0, sizeof(rawbuf));
1893                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1894                 if (rc) {
1895                         fprintf(stderr, "error: %s: invalid ioctl\n",
1896                                 jt_cmdname(argv[0]));
1897                         return rc;
1898                 }
1899                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_GETATTR, &data);
1900                 shmem_bump(1);
1901                 if (rc < 0) {
1902                         fprintf(stderr, "error: %s: #%jd - %d:%s\n",
1903                                 jt_cmdname(argv[0]), (uintmax_t)i,
1904                                 errno, strerror(rc = errno));
1905                         break;
1906                 }
1907                 if (be_verbose(verbose, &next_time, i, &next_count, count))
1908                         printf("%s: got attr #%jd\n",
1909                                jt_cmdname(argv[0]), (uintmax_t)i);
1910         }
1911
1912         if (!rc) {
1913                 struct timeval end;
1914                 double diff;
1915
1916                 gettimeofday(&end, NULL);
1917
1918                 diff = difftime(&end, &start);
1919
1920                 --i;
1921                 if (verbose != 0)
1922                         printf("%s: %jd attrs in %.3fs (%.3f attr/s): %s",
1923                                jt_cmdname(argv[0]), (uintmax_t)i, diff,
1924                                i / diff, ctime(&end.tv_sec));
1925         }
1926
1927         return rc;
1928 }
1929
1930 /* test_brw <cnt>                                               count
1931         <r|w[r(repeat)x(noverify)]>                             mode
1932         <q|v|#(print interval)>                                 verbosity
1933         <npages[+offset]>                                       blocksize
1934         <[[<interleave_threads>]t(inc obj by thread#)]obj>      object
1935         [p|g<args>]                                             batch */
1936 int jt_obd_test_brw(int argc, char **argv)
1937 {
1938         struct obd_ioctl_data data;
1939         struct timeval start, next_time;
1940         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1941         __u64 count, next_count, len, stride, thr_offset = 0, objid = 3;
1942         int write = 0, verbose = 1, cmd, i, rc = 0, pages = 1;
1943         int offset_pages = 0;
1944         long n;
1945         int repeat_offset = 0;
1946         unsigned long long ull;
1947         int  nthr_per_obj = 0;
1948         int  verify = 1;
1949         int  obj_idx = 0;
1950         char *end;
1951
1952         if (argc < 2 || argc > 7) {
1953                 fprintf(stderr, "error: %s: bad number of arguments: %d\n",
1954                         jt_cmdname(argv[0]), argc);
1955                 return CMD_HELP;
1956         }
1957
1958         count = strtoull(argv[1], &end, 0);
1959         if (*end) {
1960                 fprintf(stderr, "error: %s: bad iteration count '%s'\n",
1961                         jt_cmdname(argv[0]), argv[1]);
1962                 return CMD_HELP;
1963         }
1964
1965         if (argc >= 3) {
1966                 if (argv[2][0] == 'w' || argv[2][0] == '1')
1967                         write = 1;
1968                 /* else it's a read */
1969
1970                 if (argv[2][0] != 0)
1971                         for (i = 1; argv[2][i] != 0; i++)
1972                                 switch (argv[2][i]) {
1973                                 case 'r':
1974                                         repeat_offset = 1;
1975                                         break;
1976
1977                                 case 'x':
1978                                         verify = 0;
1979                                         break;
1980
1981                                 default:
1982                                         fprintf (stderr, "Can't parse cmd '%s'\n",
1983                                                  argv[2]);
1984                                         return CMD_HELP;
1985                                 }
1986         }
1987
1988         if (argc >= 4) {
1989                 verbose = get_verbose(argv[0], argv[3]);
1990                 if (verbose == BAD_VERBOSE)
1991                         return CMD_HELP;
1992         }
1993
1994         if (argc >= 5) {
1995                 pages = strtoul(argv[4], &end, 0);
1996
1997                 if (*end == '+')
1998                         offset_pages = strtoul(end + 1, &end, 0);
1999
2000                 if (*end != 0 ||
2001                     offset_pages < 0 || offset_pages >= pages) {
2002                         fprintf(stderr, "error: %s: bad npages[+offset] parameter '%s'\n",
2003                                 jt_cmdname(argv[0]), argv[4]);
2004                         return CMD_HELP;
2005                 }
2006         }
2007
2008         if (argc >= 6) {
2009                 if (thread &&
2010                     (n = strtol(argv[5], &end, 0)) > 0 &&
2011                     *end == 't' &&
2012                     (ull = strtoull(end + 1, &end, 0)) > 0 &&
2013                     *end == 0) {
2014                         nthr_per_obj = n;
2015                         objid = ull;
2016                 } else if (thread &&
2017                            argv[5][0] == 't') {
2018                         nthr_per_obj = 1;
2019                         objid = strtoull(argv[5] + 1, &end, 0);
2020                 } else {
2021                         nthr_per_obj = 0;
2022                         objid = strtoull(argv[5], &end, 0);
2023                 }
2024                 if (*end) {
2025                         fprintf(stderr, "error: %s: bad objid '%s'\n",
2026                                 jt_cmdname(argv[0]), argv[5]);
2027                         return CMD_HELP;
2028                 }
2029         }
2030
2031         memset(&data, 0, sizeof(data));
2032         data.ioc_dev = cur_device;
2033
2034         /* communicate the 'type' of brw test and batching to echo_client.
2035          * don't start.  we'd love to refactor this lctl->echo_client
2036          * interface */
2037         data.ioc_pbuf1 = (void *)1;
2038         data.ioc_plen1 = 1;
2039
2040         if (argc >= 7) {
2041                 switch(argv[6][0]) {
2042                         case 'g': /* plug and unplug */
2043                                 data.ioc_pbuf1 = (void *)2;
2044                                 data.ioc_plen1 = strtoull(argv[6] + 1, &end,
2045                                                           0);
2046                                 break;
2047                         case 'p': /* prep and commit */
2048                                 data.ioc_pbuf1 = (void *)3;
2049                                 data.ioc_plen1 = strtoull(argv[6] + 1, &end,
2050                                                           0);
2051                                 break;
2052                         default:
2053                                 fprintf(stderr, "error: %s: batching '%s' "
2054                                         "needs to specify 'p' or 'g'\n",
2055                                         jt_cmdname(argv[0]), argv[6]);
2056                                 return CMD_HELP;
2057                 }
2058
2059                 if (*end) {
2060                         fprintf(stderr, "error: %s: bad batching '%s'\n",
2061                                 jt_cmdname(argv[0]), argv[6]);
2062                         return CMD_HELP;
2063                 }
2064                 data.ioc_plen1 *= getpagesize();
2065         }
2066
2067         len = pages * getpagesize();
2068         thr_offset = offset_pages * getpagesize();
2069         stride = len;
2070
2071 #ifdef MAX_THREADS
2072         if (thread) {
2073                 shmem_lock ();
2074                 if (nthr_per_obj != 0) {
2075                         /* threads interleave */
2076                         obj_idx = (thread - 1)/nthr_per_obj;
2077                         objid += obj_idx;
2078                         stride *= nthr_per_obj;
2079                         if ((thread - 1) % nthr_per_obj == 0) {
2080                                 shared_data->body.offsets[obj_idx] =
2081                                         stride + thr_offset;
2082                         }
2083                         thr_offset += ((thread - 1) % nthr_per_obj) * len;
2084                 } else {
2085                         /* threads disjoint */
2086                         thr_offset += (thread - 1) * len;
2087                 }
2088
2089                 shmem_start_time_locked();
2090                 shmem_unlock ();
2091         }
2092 #endif
2093
2094         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
2095         if (objid >= OBIF_MAX_OID) {
2096                 fprintf(stderr, "errr: %s: invalid objid '%llu'\n",
2097                         jt_cmdname(argv[0]), (unsigned long long)objid);
2098                 return -E2BIG;
2099         }
2100
2101         data.ioc_obdo1.o_oi.oi_fid.f_oid = objid;
2102         data.ioc_obdo1.o_mode = S_IFREG;
2103         data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLMODE |
2104                                  OBD_MD_FLFLAGS | OBD_MD_FLGROUP;
2105         data.ioc_obdo1.o_flags = (verify ? OBD_FL_DEBUG_CHECK : 0);
2106         data.ioc_count = len;
2107         data.ioc_offset = (repeat_offset ? 0 : thr_offset);
2108
2109         gettimeofday(&start, NULL);
2110         next_time.tv_sec = start.tv_sec - verbose;
2111         next_time.tv_usec = start.tv_usec;
2112
2113         if (verbose != 0)
2114                 printf("%s: %s %jux%d pages (obj %#jx, off %ju): %s",
2115                        jt_cmdname(argv[0]), write ? "writing" : "reading",
2116                        (uintmax_t)count, pages, (uintmax_t) objid,
2117                        (uintmax_t)data.ioc_offset, ctime(&start.tv_sec));
2118
2119         cmd = write ? OBD_IOC_BRW_WRITE : OBD_IOC_BRW_READ;
2120         for (i = 1, next_count = verbose; i <= count && shmem_running(); i++) {
2121                 data.ioc_obdo1.o_valid &= ~(OBD_MD_FLBLOCKS|OBD_MD_FLGRANT);
2122                 memset(buf, 0, sizeof(rawbuf));
2123                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2124                 if (rc) {
2125                         fprintf(stderr, "error: %s: invalid ioctl\n",
2126                                 jt_cmdname(argv[0]));
2127                         return rc;
2128                 }
2129                 rc = l_ioctl(OBD_DEV_ID, cmd, buf);
2130                 shmem_bump(1);
2131                 if (rc) {
2132                         fprintf(stderr, "error: %s: #%d - %s on %s\n",
2133                                 jt_cmdname(argv[0]), i, strerror(rc = errno),
2134                                 write ? "write" : "read");
2135                         break;
2136                 } else if (be_verbose(verbose, &next_time, i,
2137                                       &next_count, count)) {
2138                         shmem_lock ();
2139                         printf("%s: %s number %d @ %jd:%ju for %d\n",
2140                                jt_cmdname(argv[0]), write ? "write" : "read", i,
2141                                (uintmax_t)ostid_id(&data.ioc_obdo1.o_oi),
2142                                (uintmax_t)data.ioc_offset,
2143                                (int)(pages * getpagesize()));
2144                         shmem_unlock ();
2145                 }
2146
2147                 if (!repeat_offset) {
2148 #ifdef MAX_THREADS
2149                         if (stride == len) {
2150                                 data.ioc_offset += stride;
2151                         } else if (i < count) {
2152                                 shmem_lock ();
2153                                 data.ioc_offset =
2154                                         shared_data->body.offsets[obj_idx];
2155                                 shared_data->body.offsets[obj_idx] += len;
2156                                 shmem_unlock ();
2157                         }
2158 #else
2159                         data.ioc_offset += len;
2160                         obj_idx = 0; /* avoids an unused var warning */
2161 #endif
2162                 }
2163         }
2164
2165         if (!rc) {
2166                 struct timeval end;
2167                 double diff;
2168
2169                 gettimeofday(&end, NULL);
2170
2171                 diff = difftime(&end, &start);
2172
2173                 --i;
2174                 if (verbose != 0)
2175                         printf("%s: %s %dx%d pages in %.3fs (%.3f MB/s): %s",
2176                                jt_cmdname(argv[0]), write ? "wrote" : "read",
2177                                i, pages, diff,
2178                                ((double)i * pages * getpagesize()) /
2179                                (diff * 1048576.0),
2180                                ctime(&end.tv_sec));
2181         }
2182
2183 #ifdef MAX_THREADS
2184         if (thread) {
2185                 shmem_lock();
2186                 shmem_end_time_locked();
2187                 shmem_unlock();
2188         }
2189 #endif
2190         return rc;
2191 }
2192
2193 int jt_obd_lov_getconfig(int argc, char **argv)
2194 {
2195         struct obd_ioctl_data data;
2196         struct lov_desc desc;
2197         struct obd_uuid *uuidarray;
2198         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2199         __u32 *obdgens;
2200         char *path;
2201         int rc, fd;
2202
2203         memset(&data, 0, sizeof(data));
2204         data.ioc_dev = cur_device;
2205
2206         if (argc != 2)
2207                 return CMD_HELP;
2208
2209         path = argv[1];
2210         fd = open(path, O_RDONLY);
2211         if (fd < 0) {
2212                 fprintf(stderr, "open \"%s\" failed: %s\n", path,
2213                         strerror(errno));
2214                 return -errno;
2215         }
2216
2217         memset(&desc, 0, sizeof(desc));
2218         obd_str2uuid(&desc.ld_uuid, argv[1]);
2219         desc.ld_tgt_count = ((MAX_IOC_BUFLEN-sizeof(data)-sizeof(desc)) /
2220                              (sizeof(*uuidarray) + sizeof(*obdgens)));
2221
2222 repeat:
2223         uuidarray = calloc(desc.ld_tgt_count, sizeof(*uuidarray));
2224         if (!uuidarray) {
2225                 fprintf(stderr, "error: %s: no memory for %d uuid's\n",
2226                         jt_cmdname(argv[0]), desc.ld_tgt_count);
2227                 rc = -ENOMEM;
2228                 goto out;
2229         }
2230         obdgens = calloc(desc.ld_tgt_count, sizeof(*obdgens));
2231         if (!obdgens) {
2232                 fprintf(stderr, "error: %s: no memory for %d generation #'s\n",
2233                         jt_cmdname(argv[0]), desc.ld_tgt_count);
2234                 rc = -ENOMEM;
2235                 goto out_uuidarray;
2236         }
2237
2238         memset(buf, 0, sizeof(rawbuf));
2239         data.ioc_inllen1 = sizeof(desc);
2240         data.ioc_inlbuf1 = (char *)&desc;
2241         data.ioc_inllen2 = desc.ld_tgt_count * sizeof(*uuidarray);
2242         data.ioc_inlbuf2 = (char *)uuidarray;
2243         data.ioc_inllen3 = desc.ld_tgt_count * sizeof(*obdgens);
2244         data.ioc_inlbuf3 = (char *)obdgens;
2245
2246         if (llapi_ioctl_pack(&data, &buf, sizeof(rawbuf))) {
2247                 fprintf(stderr, "error: %s: invalid ioctl\n",
2248                         jt_cmdname(argv[0]));
2249                 rc = -EINVAL;
2250                 goto out_obdgens;
2251         }
2252         rc = ioctl(fd, OBD_IOC_LOV_GET_CONFIG, buf);
2253         if (rc == -ENOSPC) {
2254                 free(uuidarray);
2255                 free(obdgens);
2256                 goto repeat;
2257         } else if (rc) {
2258                 fprintf(stderr, "error: %s: ioctl error: %s\n",
2259                         jt_cmdname(argv[0]), strerror(rc = errno));
2260         } else {
2261                 struct obd_uuid *uuidp;
2262                 __u32 *genp;
2263                 int i;
2264
2265                 if (llapi_ioctl_unpack(&data, buf, sizeof(rawbuf))) {
2266                         fprintf(stderr, "error: %s: invalid reply\n",
2267                                 jt_cmdname(argv[0]));
2268                         rc = -EINVAL;
2269                         goto out;
2270                 }
2271                 if (desc.ld_default_stripe_count == (__u32)-1)
2272                         printf("default_stripe_count: %d\n", -1);
2273                 else
2274                         printf("default_stripe_count: %u\n",
2275                                desc.ld_default_stripe_count);
2276                 printf("default_stripe_size: %ju\n",
2277                        (uintmax_t)desc.ld_default_stripe_size);
2278                 printf("default_stripe_offset: %jd\n",
2279                        (uintmax_t)desc.ld_default_stripe_offset);
2280                 printf("default_stripe_pattern: %u\n", desc.ld_pattern);
2281                 printf("obd_count: %u\n", desc.ld_tgt_count);
2282                 printf("OBDS:\tobdidx\t\tobdgen\t\t obduuid\n");
2283                 uuidp = uuidarray;
2284                 genp = obdgens;
2285                 for (i = 0; i < desc.ld_tgt_count; i++, uuidp++, genp++)
2286                         printf("\t%6u\t%14u\t\t %s\n", i, *genp, (char *)uuidp);
2287         }
2288 out_obdgens:
2289         free(obdgens);
2290 out_uuidarray:
2291         free(uuidarray);
2292 out:
2293         close(fd);
2294         return rc;
2295 }
2296
2297 static int do_activate(int argc, char **argv, int flag)
2298 {
2299         struct obd_ioctl_data data;
2300         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2301         int rc;
2302
2303         memset(&data, 0, sizeof(data));
2304         data.ioc_dev = cur_device;
2305         if (argc != 1)
2306                 return CMD_HELP;
2307
2308         /* reuse offset for 'active' */
2309         data.ioc_offset = flag;
2310
2311         memset(buf, 0, sizeof(rawbuf));
2312         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2313         if (rc) {
2314                 fprintf(stderr, "error: %s: invalid ioctl\n",
2315                         jt_cmdname(argv[0]));
2316                 return rc;
2317         }
2318         rc = l_ioctl(OBD_DEV_ID, IOC_OSC_SET_ACTIVE, buf);
2319         if (rc)
2320                 fprintf(stderr, "error: %s: failed: %s\n",
2321                         jt_cmdname(argv[0]), strerror(rc = errno));
2322
2323         return rc;
2324 }
2325
2326 /**
2327  * Replace nids for given device.
2328  * lctl replace_nids <devicename> <nid1>[,nid2,nid3]
2329  * Command should be started on MGS server.
2330  * Only MGS server should be started (command execution
2331  * returns error in another cases). Command mount
2332  * -t lustre <MDT partition> -o nosvc <mount point>
2333  * can be used for that.
2334  *
2335  * llogs for MDTs and clients are processed. All
2336  * records copied as is except add_uuid and setup. This records
2337  * are skipped and recorded with new nids and uuid.
2338  *
2339  * \see mgs_replace_nids
2340  * \see mgs_replace_log
2341  * \see mgs_replace_nids_handler
2342  */
2343 int jt_replace_nids(int argc, char **argv)
2344 {
2345         int rc;
2346         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2347         struct obd_ioctl_data data;
2348
2349         memset(&data, 0, sizeof(data));
2350         data.ioc_dev = get_mgs_device();
2351         if (argc != 3)
2352                 return CMD_HELP;
2353
2354         data.ioc_inllen1 = strlen(argv[1]) + 1;
2355         data.ioc_inlbuf1 = argv[1];
2356
2357         data.ioc_inllen2 = strlen(argv[2]) + 1;
2358         data.ioc_inlbuf2 = argv[2];
2359         memset(buf, 0, sizeof(rawbuf));
2360         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2361         if (rc) {
2362                 fprintf(stderr, "error: %s: invalid ioctl\n",
2363                         jt_cmdname(argv[0]));
2364                 return rc;
2365         }
2366
2367         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_REPLACE_NIDS, buf);
2368         if (rc < 0) {
2369                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
2370                         strerror(rc = errno));
2371         }
2372
2373         return rc;
2374 }
2375
2376 /**
2377  * Clear config logs for given device or filesystem.
2378  * lctl clear_conf <devicename|fsname>
2379  * Command has to be run on MGS node having MGS device mounted with -o
2380  * nosvc.
2381  *
2382  * Configuration logs for filesystem or one particular log is
2383  * processed. New log is created, original log is read, its records
2384  * marked SKIP do not get copied to new log. Others are copied as-is.
2385  * Original file is renamed to log.${time}.bak.
2386  *
2387  * \see mgs_clear_configs
2388  * \see mgs_replace_log
2389  * \see mgs_clear_config_handler
2390  **/
2391 int jt_lcfg_clear(int argc, char **argv)
2392 {
2393         int rc;
2394         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2395         struct obd_ioctl_data data;
2396
2397         memset(&data, 0, sizeof(data));
2398         data.ioc_dev = get_mgs_device();
2399         if (argc != 2)
2400                 return CMD_HELP;
2401
2402         data.ioc_inllen1 = strlen(argv[1]) + 1;
2403         data.ioc_inlbuf1 = argv[1];
2404
2405         memset(buf, 0, sizeof(rawbuf));
2406         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2407         if (rc) {
2408                 fprintf(stderr, "error: %s: invalid ioctl\n",
2409                         jt_cmdname(argv[0]));
2410                 return rc;
2411         }
2412
2413         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_CLEAR_CONFIGS, buf);
2414         if (rc < 0) {
2415                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
2416                         strerror(rc = errno));
2417         }
2418
2419         return rc;
2420 }
2421
2422 int jt_obd_deactivate(int argc, char **argv)
2423 {
2424         return do_activate(argc, argv, 0);
2425 }
2426
2427 int jt_obd_activate(int argc, char **argv)
2428 {
2429         return do_activate(argc, argv, 1);
2430 }
2431
2432 int jt_obd_recover(int argc, char **argv)
2433 {
2434         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2435         struct obd_ioctl_data data;
2436         int rc;
2437
2438         memset(&data, 0, sizeof(data));
2439         data.ioc_dev = cur_device;
2440         if (argc > 2)
2441                 return CMD_HELP;
2442
2443         if (argc == 2) {
2444                 data.ioc_inllen1 = strlen(argv[1]) + 1;
2445                 data.ioc_inlbuf1 = argv[1];
2446         }
2447
2448         memset(buf, 0, sizeof(rawbuf));
2449         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2450         if (rc) {
2451                 fprintf(stderr, "error: %s: invalid ioctl\n",
2452                         jt_cmdname(argv[0]));
2453                 return rc;
2454         }
2455         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_CLIENT_RECOVER, buf);
2456         if (rc < 0) {
2457                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
2458                         strerror(rc = errno));
2459         }
2460
2461         return rc;
2462 }
2463
2464 int jt_obd_mdc_lookup(int argc, char **argv)
2465 {
2466         struct obd_ioctl_data data;
2467         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2468         char *parent, *child;
2469         int rc, fd, verbose = 1;
2470
2471         if (argc < 3 || argc > 4)
2472                 return CMD_HELP;
2473
2474         parent = argv[1];
2475         child = argv[2];
2476         if (argc == 4)
2477                 verbose = get_verbose(argv[0], argv[3]);
2478
2479         memset(&data, 0, sizeof(data));
2480         data.ioc_dev = cur_device;
2481
2482         data.ioc_inllen1 = strlen(child) + 1;
2483         data.ioc_inlbuf1 = child;
2484
2485         memset(buf, 0, sizeof(rawbuf));
2486         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2487         if (rc) {
2488                 fprintf(stderr, "error: %s: invalid ioctl\n",
2489                         jt_cmdname(argv[0]));
2490                 return rc;
2491         }
2492
2493         fd = open(parent, O_RDONLY);
2494         if (fd < 0) {
2495                 fprintf(stderr, "open \"%s\" failed: %s\n", parent,
2496                         strerror(errno));
2497                 return -1;
2498         }
2499
2500         rc = ioctl(fd, IOC_MDC_LOOKUP, buf);
2501         if (rc < 0) {
2502                 fprintf(stderr, "error: %s: ioctl error: %s\n",
2503                         jt_cmdname(argv[0]), strerror(rc = errno));
2504         }
2505         close(fd);
2506
2507         if (verbose) {
2508                 rc = llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
2509                 if (rc) {
2510                         fprintf(stderr, "error: %s: invalid reply\n",
2511                                 jt_cmdname(argv[0]));
2512                         return rc;
2513                 }
2514                 printf("%s: mode %o uid %d gid %d\n", child,
2515                        data.ioc_obdo1.o_mode, data.ioc_obdo1.o_uid,
2516                        data.ioc_obdo1.o_gid);
2517         }
2518
2519         return rc;
2520 }
2521
2522 int jt_lcfg_fork(int argc, char **argv)
2523 {
2524         struct obd_ioctl_data data;
2525         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2526         int rc;
2527
2528         if (argc != 3)
2529                 return CMD_HELP;
2530
2531         memset(&data, 0, sizeof(data));
2532         data.ioc_dev = get_mgs_device();
2533         data.ioc_inllen1 = strlen(argv[1]) + 1;
2534         data.ioc_inlbuf1 = argv[1];
2535         data.ioc_inllen2 = strlen(argv[2]) + 1;
2536         data.ioc_inlbuf2 = argv[2];
2537
2538         memset(buf, 0, sizeof(rawbuf));
2539         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2540         if (rc) {
2541                 fprintf(stderr, "error: %s: invalid ioctl\n",
2542                         jt_cmdname(argv[0]));
2543                 return rc;
2544         }
2545
2546         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LCFG_FORK, buf);
2547         if (rc < 0)
2548                 fprintf(stderr, "error: %s: OBD_IOC_LCFG_FORK failed: %s\n",
2549                         jt_cmdname(argv[0]), strerror(errno));
2550
2551         return rc;
2552 }
2553
2554 int jt_lcfg_erase(int argc, char **argv)
2555 {
2556         struct obd_ioctl_data data;
2557         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2558         int rc;
2559
2560         if (argc == 3) {
2561                 if (strncmp(argv[2], "-q", strlen("-q")) != 0 &&
2562                     strncmp(argv[2], "--quiet", strlen("--quiet")) != 0)
2563                         return CMD_HELP;
2564         } else if (argc != 2) {
2565                 return CMD_HELP;
2566         }
2567
2568         memset(&data, 0, sizeof(data));
2569         data.ioc_dev = get_mgs_device();
2570         data.ioc_inllen1 = strlen(argv[1]) + 1;
2571         data.ioc_inlbuf1 = argv[1];
2572
2573         memset(buf, 0, sizeof(rawbuf));
2574         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2575         if (rc) {
2576                 fprintf(stderr, "error: %s: invalid ioctl\n",
2577                         jt_cmdname(argv[0]));
2578                 return rc;
2579         }
2580
2581         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LCFG_ERASE, buf);
2582         if (rc < 0)
2583                 fprintf(stderr, "error: %s: OBD_IOC_LCFG_ERASE failed: %s\n",
2584                         jt_cmdname(argv[0]), strerror(errno));
2585
2586         return rc;
2587 }
2588
2589 int jt_llog_catlist(int argc, char **argv)
2590 {
2591         struct obd_ioctl_data data;
2592         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2593         int rc;
2594
2595         if (argc != 1)
2596                 return CMD_HELP;
2597
2598         memset(&data, 0, sizeof(data));
2599         data.ioc_dev = cur_device;
2600         data.ioc_inllen1 = sizeof(rawbuf) - __ALIGN_KERNEL(sizeof(data), 8);
2601         memset(buf, 0, sizeof(rawbuf));
2602         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2603         if (rc) {
2604                 fprintf(stderr, "error: %s: invalid ioctl\n",
2605                         jt_cmdname(argv[0]));
2606                 return rc;
2607         }
2608         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_CATLOGLIST, buf);
2609         if (rc == 0)
2610                 fprintf(stdout, "%s", ((struct obd_ioctl_data *)buf)->ioc_bulk);
2611         else
2612                 fprintf(stderr, "OBD_IOC_CATLOGLIST failed: %s\n",
2613                         strerror(errno));
2614
2615         return rc;
2616 }
2617
2618 int jt_llog_info(int argc, char **argv)
2619 {
2620         const struct option long_opts[] = {
2621         /* Allow optional "--catalog" for compatibility with llog commands. */
2622         { .val = 'c',   .name = "catalog",      .has_arg = required_argument },
2623         { .val = 'h',   .name = "help",         .has_arg = no_argument },
2624         { .name = NULL } };
2625         struct obd_ioctl_data data = { 0 };
2626         char rawbuf[MAX_IOC_BUFLEN] = "", *buf = rawbuf;
2627         char *cmd = argv[0];
2628         char *catalog = NULL;
2629         int rc, c;
2630
2631         while ((c = getopt_long(argc, argv, "c:h", long_opts, NULL)) != -1) {
2632                 switch (c) {
2633                 case 'c':
2634                         catalog = optarg;
2635                         break;
2636                 case 'h':
2637                 default:
2638                         return CMD_HELP;
2639                 }
2640         }
2641         argc -= optind;
2642         argv += optind;
2643         /* support "logname" positional parameter */
2644         if (argc == 1) {
2645                 if (catalog) {
2646                         fprintf(stderr,
2647                                 "%s: catalog is set, unknown argument '%s'\n",
2648                                 cmd, optarg);
2649                         return CMD_HELP;
2650                 }
2651                 catalog = argv[0];
2652         } else if (!catalog || argc > 1) {
2653                 return CMD_HELP;
2654         }
2655
2656         data.ioc_dev = cur_device;
2657         data.ioc_inllen1 = strlen(catalog) + 1;
2658         data.ioc_inlbuf1 = catalog;
2659         data.ioc_inllen2 = sizeof(rawbuf) - __ALIGN_KERNEL(sizeof(data), 8) -
2660                            __ALIGN_KERNEL(data.ioc_inllen1, 8);
2661         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2662         if (rc) {
2663                 fprintf(stderr, "%s: ioctl_pack failed for catalog '%s': %s\n",
2664                         jt_cmdname(cmd), catalog, strerror(-rc));
2665                 return rc;
2666         }
2667
2668         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_INFO, buf);
2669         if (rc == 0)
2670                 fprintf(stdout, "%s", ((struct obd_ioctl_data *)buf)->ioc_bulk);
2671         else
2672                 fprintf(stderr, "%s: OBD_IOC_LLOG_INFO failed: %s\n",
2673                         jt_cmdname(cmd), strerror(errno));
2674
2675         return rc;
2676 }
2677
2678 int jt_llog_print_cb(const char *record, void *private)
2679 {
2680         printf("%s\n", record);
2681
2682         return 0;
2683 }
2684
2685 static int
2686 llog_process_records(int (record_cb)(const char *record, void *private),
2687                      const char *record, void *private, bool reverse)
2688 {
2689         char *ptr = NULL;
2690         char *tmp = NULL;
2691         int rc = 0;
2692
2693         if (!reverse) {
2694                 do {
2695                         ptr = strchr(record, '\n');
2696                         if (ptr)
2697                                 *ptr = '\0';
2698                         rc = record_cb(record, private);
2699                         if (rc)
2700                                 goto out;
2701                         if (ptr)
2702                                 record = ptr + 1;
2703                 } while (ptr && *(ptr + 1));
2704         } else {
2705                 tmp = (char *)record;
2706
2707                 ptr = strrchr(record, '\n');
2708                 if (ptr)
2709                         *ptr = '\0';
2710                 else
2711                         goto out;
2712                 while ((ptr = strrchr(record, '\n'))) {
2713                         tmp = ptr + 1;
2714                         *ptr = '\0';
2715                         rc = record_cb(tmp, private);
2716                         if (rc)
2717                                 goto out;
2718                 };
2719                 rc = record_cb(record, private);
2720                 if (rc)
2721                         goto out;
2722         }
2723 out:
2724         return rc;
2725 }
2726
2727 /**
2728  * Iterate over llog records, typically YAML-formatted configuration logs
2729  *
2730  * \param logname[in]   name of llog file or FID
2731  * \param start[in]     first record to process
2732  * \param end[in]       last record to process (inclusive)
2733  * \param cb[in]        callback for records. Return -ve error, or +ve abort.
2734  * \param private[in,out] private data passed to the \a record_cb function
2735  * \param reverse[in]   print the llog records from the beginning or the end
2736  *
2737  * \retval              0 on success
2738  *                      others handled by the caller
2739  */
2740 int jt_llog_print_iter(char *logname, long start, long end,
2741                        int (record_cb)(const char *record, void *private),
2742                        void *private, bool reverse)
2743 {
2744         struct obd_ioctl_data data = { 0 };
2745         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2746         char startbuf[16], endbuf[16];
2747         static long inc = sizeof(rawbuf) / 128;
2748         long rec;
2749         int rc = 0;
2750
2751         if (end == -1)
2752                 end = 0x7fffffff;
2753
2754         data.ioc_dev = cur_device;
2755         data.ioc_inlbuf1 = logname;
2756         data.ioc_inllen1 = strlen(logname) + 1;
2757
2758         /*
2759          * Estimate about 128 characters per configuration record.  Not all
2760          * records will be printed in any case, so they should easily fit.  If
2761          * not, the kernel will return -EOVERFLOW and ask for fewer records.
2762          *
2763          * We don't want to request records from the kernel one-at-a-time, as
2764          * it restarts the config llog iteration from the beginning, so we
2765          * fetch multiple records from the kernel per call and split locally.
2766          */
2767         for (rec = start; rec < end; rec += inc) {
2768                 char *record = ((struct obd_ioctl_data *)buf)->ioc_bulk;
2769
2770 retry:
2771                 snprintf(startbuf, sizeof(startbuf), "%lu", rec);
2772                 snprintf(endbuf, sizeof(endbuf), "%lu",
2773                          end < rec + inc - 1 ? end : rec + inc - 1);
2774
2775                 /* start and end record numbers are passed as ASCII digits */
2776                 data.ioc_inlbuf2 = startbuf;
2777                 data.ioc_inllen2 = strlen(startbuf) + 1;
2778                 data.ioc_inlbuf3 = endbuf;
2779                 data.ioc_inllen3 = strlen(endbuf) + 1;
2780
2781                 data.ioc_inllen4 = sizeof(rawbuf) -
2782                         __ALIGN_KERNEL(sizeof(data), 8) -
2783                         __ALIGN_KERNEL(data.ioc_inllen1, 8) -
2784                         __ALIGN_KERNEL(data.ioc_inllen2, 8) -
2785                         __ALIGN_KERNEL(data.ioc_inllen3, 8);
2786                 memset(buf, 0, sizeof(rawbuf));
2787                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2788                 if (rc) {
2789                         fprintf(stderr, "%s: invalid ioctl data\n", logname);
2790                         goto out;
2791                 }
2792
2793                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_PRINT, buf);
2794                 if (rc == -EOVERFLOW && inc > 2) {
2795                         inc /= 2;
2796                         goto retry;
2797                 }
2798                 if (rc) {
2799                         fprintf(stderr, "%s: OBD_IOC_LLOG_PRINT failed: %s\n",
2800                                 logname, strerror(errno));
2801                         rc = -errno;
2802                         goto out;
2803                 }
2804
2805                 /* There is no "end of list" marker, record was not modified */
2806                 if (strcmp(record, logname) == 0)
2807                         break;
2808
2809                 rc = llog_process_records(record_cb, record, private, reverse);
2810                 if (rc)
2811                         goto out;
2812         }
2813
2814 out:
2815         return rc;
2816 }
2817
2818 static int llog_parse_catalog_start_end(int *argc, char **argv[],
2819                                         char **catalog, long *start, long *end)
2820 {
2821         const struct option long_opts[] = {
2822         /* the --catalog option is not required, just for consistency */
2823         { .val = 'c',   .name = "catalog",      .has_arg = required_argument },
2824         { .val = 'e',   .name = "end",          .has_arg = required_argument },
2825         { .val = 'h',   .name = "help",         .has_arg = no_argument },
2826         { .val = 's',   .name = "start",        .has_arg = required_argument },
2827         { .name = NULL } };
2828         char *cmd = (*argv)[0];
2829         char *endp;
2830         int c;
2831
2832         if (catalog == NULL || start == NULL || end == NULL)
2833                 return -EINVAL;
2834
2835         /* now process command line arguments*/
2836         while ((c = getopt_long(*argc, *argv, "c:e:hs:",
2837                                 long_opts, NULL)) != -1) {
2838                 switch (c) {
2839                 case 'c':
2840                         *catalog = optarg;
2841                         break;
2842                 case 'e':
2843                         *end = strtol(optarg, &endp, 0);
2844                         if (*endp != '\0') {
2845                                 fprintf(stderr, "%s: bad end value '%s'\n",
2846                                         cmd, optarg);
2847                                 return CMD_HELP;
2848                         }
2849                         break;
2850                 case 's':
2851                         *start = strtol(optarg, &endp, 0);
2852                         if (*endp != '\0') {
2853                                 fprintf(stderr, "%s: bad start value '%s'\n",
2854                                         cmd, optarg);
2855                                 return CMD_HELP;
2856                         }
2857                         break;
2858                 case 'h':
2859                 default:
2860                         return CMD_HELP;
2861                 }
2862         }
2863         *argc -= optind;
2864         *argv += optind;
2865
2866         /* support old optional positional parameters only if they were
2867          * not already specified with named arguments: logname [start [end]]
2868          */
2869         if (*argc >= 1) {
2870                 if (*catalog) {
2871                         fprintf(stderr,
2872                                 "%s: catalog is set, unknown argument '%s'\n",
2873                                 cmd, (*argv)[0]);
2874                         return CMD_HELP;
2875                 }
2876                 *catalog = (*argv)[0];
2877                 (*argc)--;
2878                 (*argv)++;
2879         }
2880
2881         if (*argc >= 1) {
2882                 if (*start != 1) {
2883                         fprintf(stderr,
2884                                 "%s: --start is set, unknown argument '%s'\n",
2885                                 cmd, (*argv)[0]);
2886                         return CMD_HELP;
2887                 }
2888
2889                 *start = strtol((*argv)[0], &endp, 0);
2890                 if (*endp != '\0') {
2891                         fprintf(stderr, "%s: bad start value '%s'\n",
2892                                 cmd, (*argv)[0]);
2893                         return CMD_HELP;
2894                 }
2895                 (*argc)--;
2896                 (*argv)++;
2897         }
2898         if (*argc >= 1) {
2899                 if (*end != -1) {
2900                         fprintf(stderr,
2901                                 "%s: --end is set, unknown argument '%s'\n",
2902                                 cmd, (*argv)[0]);
2903                         return CMD_HELP;
2904                 }
2905
2906                 *end = strtol((*argv)[0], &endp, 0);
2907                 if (*endp != '\0') {
2908                         fprintf(stderr, "%s: bad end value '%s'\n",
2909                                 cmd, (*argv)[0]);
2910                         return CMD_HELP;
2911                 }
2912                 (*argc)--;
2913                 (*argv)++;
2914         }
2915         if (*argc > 1) {
2916                 fprintf(stderr, "%s: unknown argument '%s'\n", cmd, (*argv)[0]);
2917                 return CMD_HELP;
2918         }
2919
2920         if (*end != -1 && *end < *start) {
2921                 fprintf(stderr, "%s: end '%lu' less than than start '%lu'\n",
2922                         cmd, *end, *start);
2923                 return CMD_HELP;
2924         }
2925
2926         return 0;
2927 }
2928
2929 int jt_llog_print(int argc, char **argv)
2930 {
2931         char *catalog = NULL;
2932         long start = 1, end = -1;
2933         int rc;
2934
2935         rc = llog_parse_catalog_start_end(&argc, &argv, &catalog, &start, &end);
2936         if (rc)
2937                 return rc;
2938
2939         rc = jt_llog_print_iter(catalog, start, end, jt_llog_print_cb,
2940                                 NULL, false);
2941
2942         return rc;
2943 }
2944
2945 /* Parse catalog, log ID, and optionally a log index with either optional
2946  * arguments or positional arguments.  Only the initial catalog argument
2947  * may be positional with other optional arguments.
2948  *
2949  * The positional arguments option should eventually be phased out.
2950  */
2951 static int llog_parse_catalog_log_idx(int *argc, char ***argv, const char *opts,
2952                                       int max_args, struct obd_ioctl_data *data)
2953 {
2954         const struct option long_opts[] = {
2955         /* the --catalog option is not required, just for consistency */
2956         { .val = 'c',   .name = "catalog",      .has_arg = required_argument },
2957         { .val = 'h',   .name = "help",         .has_arg = no_argument },
2958         { .val = 'i',   .name = "log_idx",      .has_arg = required_argument },
2959         { .val = 'l',   .name = "log_id",       .has_arg = required_argument },
2960         { .name = NULL } };
2961         int c;
2962
2963         /* sanity check */
2964         if (!data || *argc <= 1)
2965                 return -1;
2966
2967         data->ioc_dev = cur_device;
2968
2969         /* now process command line arguments*/
2970         while ((c = getopt_long(*argc, *argv, opts, long_opts, NULL)) != -1) {
2971                 switch (c) {
2972                 case 'c':
2973                         data->ioc_inllen1 = strlen(optarg) + 1;
2974                         data->ioc_inlbuf1 = optarg;
2975                         break;
2976                 case 'i':
2977                         data->ioc_inllen3 = strlen(optarg) + 1;
2978                         data->ioc_inlbuf3 = optarg;
2979                         break;
2980                 case 'l': /* The log_id option isn't currently needed for
2981                            * cancel as mdt_iocontrol() handles IOC_LLOG_CANCEL,
2982                            * but we may as well keep it for now.
2983                            */
2984                         data->ioc_inllen2 = strlen(optarg) + 1;
2985                         data->ioc_inlbuf2 = optarg;
2986                         break;
2987                 case 'h':
2988                 default:
2989                         return CMD_HELP;
2990                 }
2991         }
2992
2993         *argc -= optind;
2994         *argv += optind;
2995
2996         /* Allow catalog to be specified as first option without --catalog */
2997         if (data->ioc_inlbuf1 == NULL && *argc > 0) {
2998                 data->ioc_inlbuf1 = (*argv)[0];
2999                 data->ioc_inllen1 = strlen((*argv)[0]) + 1;
3000                 (*argc)--;
3001                 (*argv)++;
3002         }
3003
3004         return 0;
3005 }
3006
3007 int jt_llog_cancel(int argc, char **argv)
3008 {
3009         struct obd_ioctl_data data = { 0 };
3010         char rawbuf[MAX_IOC_BUFLEN] = "", *buf = rawbuf;
3011         char *cmd = argv[0];
3012         int rc;
3013
3014         /* Parse catalog file (in inlbuf1) and named parameters */
3015         rc = llog_parse_catalog_log_idx(&argc, &argv, "c:hi:l:", 3, &data);
3016
3017         /* Handle old positional parameters if not using named parameters,
3018          * either "<catalog> <log_idx>" or "<catalog> <log_id> <log_idx>".
3019          * It was "inlbuf3 = log_idx", and "inlbuf2 = log_id" (ignored by
3020          * config log cancel), and shows why I hate positional parameters.
3021          */
3022         if (argc == 1) {
3023                 data.ioc_inllen3 = strlen(argv[0]) + 1;
3024                 data.ioc_inlbuf3 = argv[0];
3025         } else if (argc == 2) {
3026                 data.ioc_inllen2 = strlen(argv[0]) + 1;
3027                 data.ioc_inlbuf2 = argv[0];
3028                 data.ioc_inllen3 = strlen(argv[1]) + 1;
3029                 data.ioc_inlbuf3 = argv[1];
3030         }
3031
3032         if (data.ioc_inlbuf1 == NULL || data.ioc_inlbuf3 == NULL)
3033                 /* missing mandatory parameters */
3034                 return CMD_HELP;
3035
3036         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3037         if (rc) {
3038                 fprintf(stderr, "%s: ioctl_pack for catalog '%s' failed: %s\n",
3039                         jt_cmdname(cmd), data.ioc_inlbuf1, strerror(-rc));
3040                 return rc;
3041         }
3042
3043         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_CANCEL, buf);
3044         if (rc)
3045                 fprintf(stderr, "%s: cancel catalog '%s:%s' failed: %s\n",
3046                         jt_cmdname(cmd), data.ioc_inlbuf1, data.ioc_inlbuf3,
3047                         strerror(errno));
3048
3049         return rc;
3050 }
3051
3052 int jt_llog_check(int argc, char **argv)
3053 {
3054         struct obd_ioctl_data data = { 0 };
3055         char rawbuf[MAX_IOC_BUFLEN] = "", *buf = rawbuf;
3056         char *catalog = NULL;
3057         char startbuf[16], endbuf[16];
3058         long start = 1, end = -1;
3059         char *cmd = argv[0];
3060         int rc;
3061
3062         rc = llog_parse_catalog_start_end(&argc, &argv, &catalog, &start, &end);
3063         if (rc)
3064                 return rc;
3065
3066         if (end == -1)
3067                 end = 0x7fffffff;
3068
3069         data.ioc_dev = cur_device;
3070         data.ioc_inllen1 = strlen(catalog) + 1;
3071         data.ioc_inlbuf1 = catalog;
3072
3073         snprintf(startbuf, sizeof(startbuf), "%lu", start);
3074         snprintf(endbuf, sizeof(endbuf), "%lu", end);
3075         /* start and end record numbers are passed as ASCII digits */
3076         data.ioc_inllen2 = strlen(startbuf) + 1;
3077         data.ioc_inlbuf2 = startbuf;
3078         data.ioc_inllen3 = strlen(endbuf) + 1;
3079         data.ioc_inlbuf3 = endbuf;
3080
3081         data.ioc_inllen4 = sizeof(rawbuf) - __ALIGN_KERNEL(sizeof(data), 8) -
3082                            __ALIGN_KERNEL(data.ioc_inllen1, 8) -
3083                            __ALIGN_KERNEL(data.ioc_inllen2, 8) -
3084                            __ALIGN_KERNEL(data.ioc_inllen3, 8);
3085         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3086         if (rc) {
3087                 fprintf(stderr, "%s: ioctl_pack failed for catalog '%s': %s\n",
3088                         jt_cmdname(cmd), data.ioc_inlbuf1, strerror(-rc));
3089                 return rc;
3090         }
3091
3092         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_CHECK, buf);
3093         if (rc == 0)
3094                 fprintf(stdout, "%s", ((struct obd_ioctl_data *)buf)->ioc_bulk);
3095         else
3096                 fprintf(stderr, "%s: OBD_IOC_LLOG_CHECK failed: %s\n",
3097                         jt_cmdname(cmd), strerror(errno));
3098         return rc;
3099 }
3100
3101 int jt_llog_remove(int argc, char **argv)
3102 {
3103         struct obd_ioctl_data data = { 0 };
3104         char rawbuf[MAX_IOC_BUFLEN] = "", *buf = rawbuf;
3105         char *cmd = argv[0];
3106         int rc;
3107
3108         rc = llog_parse_catalog_log_idx(&argc, &argv, "c:hl:", 2, &data);
3109         if (rc)
3110                 return rc;
3111
3112         if (argc == 1) {
3113                 if (data.ioc_inlbuf2) {
3114                         fprintf(stderr,
3115                                 "%s: --log_id is set, unknown argument '%s'\n",
3116                                 jt_cmdname(cmd), argv[0]);
3117                         return CMD_HELP;
3118                 }
3119
3120                 data.ioc_inllen2 = strlen(argv[0]) + 1;
3121                 data.ioc_inlbuf2 = argv[0];
3122         }
3123         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3124         if (rc) {
3125                 fprintf(stderr, "%s: ioctl_pack for catalog '%s' failed: %s\n",
3126                         jt_cmdname(cmd), data.ioc_inlbuf1, strerror(-rc));
3127                 return rc;
3128         }
3129
3130         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_REMOVE, buf);
3131         if (rc)
3132                 fprintf(stderr, "%s: cancel catalog '%s:%s' failed: %s\n",
3133                         jt_cmdname(cmd), data.ioc_inlbuf1, data.ioc_inlbuf2,
3134                         strerror(-rc));
3135
3136         return rc;
3137 }
3138
3139 static void signal_server(int sig)
3140 {
3141         if (sig == SIGINT) {
3142                 do_disconnect("sigint", 1);
3143                 exit(1);
3144         } else {
3145                 fprintf(stderr, "%s: got signal %d\n", jt_cmdname("sigint"),
3146                         sig);
3147         }
3148 }
3149
3150 int obd_initialize(int argc, char **argv)
3151 {
3152         if (shmem_setup() != 0)
3153                 return -1;
3154
3155         register_ioc_dev(OBD_DEV_ID, OBD_DEV_PATH);
3156
3157         return 0;
3158 }
3159
3160 void obd_finalize(int argc, char **argv)
3161 {
3162         struct sigaction sigact;
3163
3164         /* sigact initialization */
3165         sigact.sa_handler = signal_server;
3166         sigfillset(&sigact.sa_mask);
3167         sigact.sa_flags = SA_RESTART;
3168         /* coverity[uninit_use_in_call] */
3169         sigaction(SIGINT, &sigact, NULL);
3170
3171         shmem_cleanup();
3172         do_disconnect(argv[0], 1);
3173 }
3174
3175 /**
3176  * Get the index of the last llog record
3177  *
3178  * logid:            [0x3:0xa:0x0]:0
3179  * flags:            4 (plain)
3180  * records_count:    57
3181  * last_index:       57
3182  *
3183  * \param logname[in]   pointer to config log name
3184  *
3185  * \retval              > 0 on success
3186  *                      <= 0 on error
3187  */
3188 static long llog_last_index(char *logname)
3189 {
3190         struct obd_ioctl_data data = { 0 };
3191         char rawbuf[MAX_IOC_BUFLEN] = "", *buf = rawbuf;
3192         char *last_index;
3193         long rc;
3194
3195         data.ioc_dev = cur_device;
3196         data.ioc_inllen1 = strlen(logname) + 1;
3197         data.ioc_inlbuf1 = logname;
3198         data.ioc_inllen2 = sizeof(rawbuf) - __ALIGN_KERNEL(sizeof(data), 8) -
3199                            __ALIGN_KERNEL(data.ioc_inllen1, 8);
3200         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3201         if (rc) {
3202                 fprintf(stderr, "%s: ioctl_pack failed for catalog '%s': %s\n",
3203                         __func__, logname, strerror(-rc));
3204                 return rc;
3205         }
3206
3207         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_INFO, buf);
3208         if (rc == 0) {
3209                 last_index = strstr(((struct obd_ioctl_data *)buf)->ioc_bulk,
3210                                     "last_index:");
3211                 return strtol(last_index + 11, NULL, 10);
3212         } else {
3213                 rc = -errno;
3214         }
3215
3216         return rc;
3217 }
3218
3219 /**
3220  * Callback to search ostname in llog
3221  * - { index: 23, event: attach, device: lustre-OST0000-osc, type: osc,
3222  *     UUID: lustre-clilov_UUID }
3223  * - { index: 24, event: setup, device: lustre-OST0000-osc,
3224  *     UUID: lustre-OST0000_UUID, node: 192.168.0.120@tcp }
3225  * - { index: 25, event: add_osc, device: lustre-clilov,
3226  *     ost: lustre-OST0000_UUID, index: 0, gen: 1 }
3227  *
3228  * \param record[in]    pointer to llog record
3229  * \param data[in]      pointer to ostname
3230  *
3231  * \retval              1 if ostname is found
3232  *                      0 if ostname is not found
3233  *                      -ENOENT if ostname is deleted
3234  */
3235 static int llog_search_ost_cb(const char *record, void *data)
3236 {
3237         char *ostname = data;
3238         char ost_filter[MAX_STRING_SIZE] = {'\0'};
3239
3240         if (ostname && ostname[0])
3241                 snprintf(ost_filter, sizeof(ost_filter), " %s,", ostname);
3242
3243         if (strstr(record, ost_filter)) {
3244                 if (strstr(record, "event: add_osc, ") ||
3245                     strstr(record, "event: setup, "))
3246                         return 1;
3247                 if (strstr(record, "event: del_osc, ") ||
3248                     strstr(record, "event: cleanup, "))
3249                         return -ENOENT;
3250         }
3251
3252         return 0;
3253 }
3254
3255 /**
3256  * Search ost in llog
3257  *
3258  * \param logname[in]           pointer to config log name
3259  * \param last_index[in]        the index of the last llog record
3260  * \param ostname[in]           pointer to ost name
3261  *
3262  * \retval                      1 if ostname is found
3263  *                              0 if ostname is not found
3264  */
3265 static int llog_search_ost(char *logname, long last_index, char *ostname)
3266 {
3267         long start, end, inc = MAX_IOC_BUFLEN / 128;
3268         int rc = 0;
3269
3270         for (end = last_index; end > 1; end -= inc) {
3271                 start = end - inc > 0 ? end - inc : 1;
3272                 rc = jt_llog_print_iter(logname, start, end, llog_search_ost_cb,
3273                                         ostname, true);
3274                 if (rc)
3275                         break;
3276         }
3277
3278         return (rc == 1 ? 1 : 0);
3279 }
3280
3281 struct llog_pool_data {
3282         char lpd_fsname[LUSTRE_MAXFSNAME + 1];
3283         char lpd_poolname[LOV_MAXPOOLNAME + 1];
3284         char lpd_ostname[MAX_OBD_NAME + 1];
3285         enum lcfg_command_type lpd_cmd_type;
3286         bool lpd_pool_exists;
3287         int lpd_ost_num;
3288 };
3289
3290 /**
3291  * Called for each formatted line in the config log (within range).
3292  *
3293  * - { index: 74, event: new_pool, device: tfs-clilov, fsname: tfs, pool: tmp }
3294  * - { index: 77, event: add_pool, device: tfs-clilov, fsname: tfs, pool: tmp,
3295  *     ost: tfs-OST0000_UUID }
3296  * - { index: 224, event: remove_pool, device: tfs-clilov, fsname: tfs,
3297  *     pool: tmp, ost: tfs-OST0003_UUID }
3298  * - { index: 227, event: del_pool, device: tfs-clilov, fsname: tfs, pool: tmp }
3299  *
3300  * \param record[in]    pointer to llog record
3301  * \param data[in]      pointer to llog_pool_data
3302  *
3303  * \retval              1 if pool or OST is found
3304  *                      0 if pool or OST is not found
3305  *                      -ENOENT if pool or OST is removed
3306  */
3307 static int llog_search_pool_cb(const char *record, void *data)
3308 {
3309         struct llog_pool_data *lpd = data;
3310         char pool_filter[MAX_STRING_SIZE] = "";
3311         char *found = NULL;
3312         int fs_pool_len = 0;
3313
3314         fs_pool_len = 16 + strlen(lpd->lpd_fsname) + strlen(lpd->lpd_poolname);
3315         snprintf(pool_filter, fs_pool_len + 1, "fsname: %s, pool: %s",
3316                  lpd->lpd_fsname, lpd->lpd_poolname);
3317
3318         /* search poolname */
3319         found = strstr(record, pool_filter);
3320         if (found &&
3321             (found[fs_pool_len] == ' ' || found[fs_pool_len] == ',')) {
3322                 if (strstr(record, "event: new_pool,")) {
3323                         lpd->lpd_pool_exists = true;
3324                         return 1;
3325                 }
3326                 if (strstr(record, "event: del_pool,")) {
3327                         lpd->lpd_pool_exists = false;
3328                         return -ENOENT;
3329                 }
3330
3331                 if (lpd->lpd_cmd_type == LCFG_POOL_NEW ||
3332                     lpd->lpd_cmd_type == LCFG_POOL_DEL) {
3333                         if (strstr(record, "event: add_pool,"))
3334                                 lpd->lpd_ost_num++;
3335                         if (strstr(record, "event: remove_pool,"))
3336                                 lpd->lpd_ost_num--;
3337                 } else if (lpd->lpd_ostname && lpd->lpd_ostname[0]) {
3338                         if (strstr(record, lpd->lpd_ostname)) {
3339                                 lpd->lpd_pool_exists = true;
3340                                 if (strstr(record, "event: add_pool,")) {
3341                                         lpd->lpd_ost_num = 1;
3342                                         return 1;
3343                                 }
3344                                 if (strstr(record, "event: remove_pool,")) {
3345                                         lpd->lpd_ost_num = 0;
3346                                         return -ENOENT;
3347                                 }
3348                         }
3349                 }
3350         }
3351
3352         return 0;
3353 }
3354
3355 /* Search pool and its ost in llog
3356  *
3357  * \param logname[in]           pointer to config log name
3358  * \param last_index[in]        the index of the last llog record
3359  * \param fsname[in]            pointer to filesystem name
3360  * \param poolname[in]          pointer pool name
3361  * \param ostname[in]           pointer to OST name(OSTnnnn-UUID)
3362  * \param cmd[in]               pool command type
3363  *
3364  * \retval                      < 0 on error
3365  *                              0 if pool is empty or OST is not found
3366  *                              1 if pool is not empty or OST is found
3367  */
3368 static int llog_search_pool(char *logname, long last_index, char *fsname,
3369                             char *poolname, char *ostname,
3370                             enum lcfg_command_type cmd)
3371 {
3372         struct llog_pool_data lpd;
3373         long start, end, inc = MAX_IOC_BUFLEN / 128;
3374         int rc = 0;
3375
3376         memset(&lpd, 0, sizeof(lpd));
3377         lpd.lpd_cmd_type = cmd;
3378         lpd.lpd_pool_exists = false;
3379         lpd.lpd_ost_num = 0;
3380         strncpy(lpd.lpd_fsname, fsname, sizeof(lpd.lpd_fsname) - 1);
3381         if (poolname && poolname[0])
3382                 strncpy(lpd.lpd_poolname, poolname,
3383                         sizeof(lpd.lpd_poolname) - 1);
3384         if (ostname && ostname[0])
3385                 strncpy(lpd.lpd_ostname, ostname, sizeof(lpd.lpd_ostname) - 1);
3386
3387         for (end = last_index; end > 1; end -= inc) {
3388                 start = end - inc > 0 ? end - inc : 1;
3389                 rc = jt_llog_print_iter(logname, start, end,
3390                                         llog_search_pool_cb, &lpd, true);
3391                 if (rc) {
3392                         if (rc == 1 && lpd.lpd_pool_exists)
3393                                 rc = lpd.lpd_ost_num ? 1 : 0;
3394                         else if (rc == -ENOENT && lpd.lpd_pool_exists &&
3395                                  !lpd.lpd_ost_num)
3396                                 rc = 0;
3397                         goto out;
3398                 }
3399         }
3400
3401         rc = -ENOENT;
3402 out:
3403         return rc;
3404 }
3405
3406 static bool combined_mgs_mds(char *fsname)
3407 {
3408         glob_t path;
3409         int rc;
3410
3411         rc = cfs_get_param_paths(&path, "mdt/%s-MDT0000", fsname);
3412         if (!rc)
3413                 cfs_free_param_data(&path);
3414
3415         if (get_mgs_device() > 0 && !rc)
3416                 return true;
3417
3418         return false;
3419 }
3420
3421 /*
3422  * if pool is NULL, search ostname in target_obd
3423  * if pool is not NULL:
3424  *  - if pool not found returns errno < 0
3425  *  - if ostname is NULL, returns 1 if pool is not empty and 0 if pool empty
3426  *  - if ostname is not NULL, returns 1 if OST is in pool and 0 if not
3427  */
3428 int lctl_search_ost(char *fsname, char *poolname, char *ostname,
3429                     enum lcfg_command_type cmd)
3430 {
3431         char logname[MAX_OBD_NAME] = {'\0'};
3432         long last_index;
3433
3434         if (fsname && fsname[0] == '\0')
3435                 fsname = NULL;
3436         if (!fsname)
3437                 return -EINVAL;
3438
3439         if (combined_mgs_mds(fsname))
3440                 return llapi_search_ost(fsname, poolname, ostname);
3441
3442         /* fetch the last_index of llog record */
3443         snprintf(logname, sizeof(logname), "%s-client", fsname);
3444         last_index = llog_last_index(logname);
3445         if (last_index < 0)
3446                 return last_index;
3447
3448         /* if pool is NULL, search ostname in target_obd */
3449         if (!poolname && ostname)
3450                 return llog_search_ost(logname, last_index, ostname);
3451
3452         return llog_search_pool(logname, last_index, fsname, poolname,
3453                                 ostname, cmd);
3454 }
3455
3456 static int check_pool_cmd(enum lcfg_command_type cmd,
3457                           char *fsname, char *poolname,
3458                           char *ostname)
3459 {
3460         int rc;
3461
3462         rc = lctl_search_ost(fsname, poolname, ostname, cmd);
3463         if (rc < 0 && (cmd != LCFG_POOL_NEW)) {
3464                 fprintf(stderr, "Pool %s.%s not found\n",
3465                         fsname, poolname);
3466                 return rc;
3467         }
3468
3469         switch (cmd) {
3470         case LCFG_POOL_NEW: {
3471                 if (ostname != NULL)
3472                         return -EINVAL;
3473
3474                 if (rc >= 0) {
3475                         fprintf(stderr, "Pool %s.%s already exists\n",
3476                                 fsname, poolname);
3477                         return -EEXIST;
3478                 }
3479                 return 0;
3480         }
3481         case LCFG_POOL_DEL: {
3482                 if (ostname != NULL)
3483                         return -EINVAL;
3484
3485                 if (rc == 1) {
3486                         fprintf(stderr, "Pool %s.%s not empty, "
3487                                 "please remove all members\n",
3488                                 fsname, poolname);
3489                         return -ENOTEMPTY;
3490                 }
3491                 return 0;
3492         }
3493         case LCFG_POOL_ADD: {
3494                 if (rc == 1) {
3495                         fprintf(stderr, "OST %s is already in pool %s.%s\n",
3496                                 ostname, fsname, poolname);
3497                         return -EEXIST;
3498                 }
3499                 rc = lctl_search_ost(fsname, NULL, ostname, cmd);
3500                 if (rc == 0) {
3501                         fprintf(stderr, "OST %s is not part of the '%s' fs.\n",
3502                                 ostname, fsname);
3503                         return -ENOENT;
3504                 }
3505                 return 0;
3506         }
3507         case LCFG_POOL_REM: {
3508                 if (rc == 0) {
3509                         fprintf(stderr, "OST %s not found in pool %s.%s\n",
3510                                 ostname, fsname, poolname);
3511                         return -ENOENT;
3512                 }
3513                 return 0;
3514         }
3515         default:
3516                 break;
3517         } /* switch */
3518         return -EINVAL;
3519 }
3520
3521 /* This check only verifies that the changes have been "pushed out" to
3522    the client successfully.  This involves waiting for a config update,
3523    and so may fail because of problems in that code or post-command
3524    network loss. So reporting a warning is appropriate, but not a failure.
3525 */
3526 static int check_pool_cmd_result(enum lcfg_command_type cmd,
3527                                  char *fsname, char *poolname,
3528                                  char *ostname)
3529 {
3530         int cpt = 10;
3531         int rc = 0;
3532
3533         switch (cmd) {
3534         case LCFG_POOL_NEW: {
3535                 do {
3536                         rc = lctl_search_ost(fsname, poolname, NULL, cmd);
3537                         if (rc == -ENODEV)
3538                                 return rc;
3539                         if (rc < 0)
3540                                 sleep(2);
3541                         cpt--;
3542                 } while ((rc < 0) && (cpt > 0));
3543                 if (rc >= 0) {
3544                         fprintf(stderr, "Pool %s.%s created\n",
3545                                 fsname, poolname);
3546                         return 0;
3547                 } else {
3548                         fprintf(stderr, "Warning, pool %s.%s not found\n",
3549                                 fsname, poolname);
3550                         return -ENOENT;
3551                 }
3552         }
3553         case LCFG_POOL_DEL: {
3554                 do {
3555                         rc = lctl_search_ost(fsname, poolname, NULL, cmd);
3556                         if (rc == -ENODEV)
3557                                 return rc;
3558                         if (rc >= 0)
3559                                 sleep(2);
3560                         cpt--;
3561                 } while ((rc >= 0) && (cpt > 0));
3562                 if (rc < 0) {
3563                         fprintf(stderr, "Pool %s.%s destroyed\n",
3564                                 fsname, poolname);
3565                         return 0;
3566                 } else {
3567                         fprintf(stderr, "Warning, pool %s.%s still found\n",
3568                                 fsname, poolname);
3569                         return -EEXIST;
3570                 }
3571         }
3572         case LCFG_POOL_ADD: {
3573                 do {
3574                         rc = lctl_search_ost(fsname, poolname, ostname, cmd);
3575                         if (rc == -ENODEV)
3576                                 return rc;
3577                         if (rc != 1)
3578                                 sleep(2);
3579                         cpt--;
3580                 } while ((rc != 1) && (cpt > 0));
3581                 if (rc == 1) {
3582                         fprintf(stderr, "OST %s added to pool %s.%s\n",
3583                                 ostname, fsname, poolname);
3584                         return 0;
3585                 } else {
3586                         fprintf(stderr, "Warning, OST %s not found in pool %s.%s\n",
3587                                 ostname, fsname, poolname);
3588                         return -ENOENT;
3589                 }
3590         }
3591         case LCFG_POOL_REM: {
3592                 do {
3593                         rc = lctl_search_ost(fsname, poolname, ostname, cmd);
3594                         if (rc == -ENODEV)
3595                                 return rc;
3596                         if (rc == 1)
3597                                 sleep(2);
3598                         cpt--;
3599                 } while ((rc == 1) && (cpt > 0));
3600                 if (rc != 1) {
3601                         fprintf(stderr, "OST %s removed from pool %s.%s\n",
3602                                 ostname, fsname, poolname);
3603                         return 0;
3604                 } else {
3605                         fprintf(stderr, "Warning, OST %s still found in pool %s.%s\n",
3606                                 ostname, fsname, poolname);
3607                         return -EEXIST;
3608                 }
3609         }
3610         default:
3611                 break;
3612         }
3613         return -EINVAL;
3614 }
3615
3616 static int check_and_complete_ostname(char *fsname, char *ostname)
3617 {
3618         char *ptr;
3619         char real_ostname[MAX_OBD_NAME + 1];
3620         char i;
3621
3622         /* if OST name does not start with fsname, we add it */
3623         /* if not check if the fsname is the right one */
3624         ptr = strchr(ostname, '-');
3625         if (ptr == NULL) {
3626                 sprintf(real_ostname, "%s-%s", fsname, ostname);
3627         } else if (strncmp(ostname, fsname, strlen(fsname)) != 0) {
3628                 fprintf(stderr, "%s does not start with fsname %s\n",
3629                         ostname, fsname);
3630                 return -EINVAL;
3631         } else {
3632                 if (strlen(ostname) > sizeof(real_ostname)-1)
3633                         return -E2BIG;
3634                 strncpy(real_ostname, ostname, sizeof(real_ostname));
3635         }
3636         /* real_ostname is fsname-????? */
3637         ptr = real_ostname + strlen(fsname) + 1;
3638         if (strncmp(ptr, "OST", 3) != 0) {
3639                 fprintf(stderr, "%s does not start by %s-OST nor OST\n",
3640                         ostname, fsname);
3641                 return -EINVAL;
3642         }
3643         /* real_ostname is fsname-OST????? */
3644         ptr += 3;
3645         for (i = 0; i < 4; i++) {
3646                 if (!isxdigit(*ptr)) {
3647                         fprintf(stderr,
3648                                 "ost's index in %s is not an hexa number\n",
3649                                 ostname);
3650                         return -EINVAL;
3651                 }
3652                 ptr++;
3653         }
3654         /* real_ostname is fsname-OSTXXXX????? */
3655         /* if OST name does not end with _UUID, we add it */
3656         if (*ptr == '\0') {
3657                 strcat(real_ostname, "_UUID");
3658         } else if (strcmp(ptr, "_UUID") != 0) {
3659                 fprintf(stderr,
3660                         "ostname %s does not end with _UUID\n", ostname);
3661                 return -EINVAL;
3662         }
3663         /* real_ostname is fsname-OSTXXXX_UUID */
3664         strcpy(ostname, real_ostname);
3665         return 0;
3666 }
3667
3668 /* returns 0 or -errno */
3669 static int pool_cmd(enum lcfg_command_type cmd,
3670                     char *cmdname, char *fullpoolname,
3671                     char *fsname, char *poolname, char *ostname)
3672 {
3673         int rc = 0;
3674         struct obd_ioctl_data data;
3675         struct lustre_cfg_bufs bufs;
3676         struct lustre_cfg *lcfg;
3677         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
3678
3679         rc = check_pool_cmd(cmd, fsname, poolname, ostname);
3680         if (rc == -ENODEV)
3681                 fprintf(stderr, "Can't verify pool command since there "
3682                         "is no local MDT or client, proceeding anyhow...\n");
3683         else if (rc)
3684                 return rc;
3685
3686         lustre_cfg_bufs_reset(&bufs, NULL);
3687         lustre_cfg_bufs_set_string(&bufs, 0, cmdname);
3688         lustre_cfg_bufs_set_string(&bufs, 1, fullpoolname);
3689         if (ostname != NULL)
3690                 lustre_cfg_bufs_set_string(&bufs, 2, ostname);
3691
3692
3693         lcfg = malloc(lustre_cfg_len(bufs.lcfg_bufcount, bufs.lcfg_buflen));
3694         if (lcfg == NULL)
3695                 return -ENOMEM;
3696         lustre_cfg_init(lcfg, cmd, &bufs);
3697
3698         memset(&data, 0, sizeof(data));
3699         rc = data.ioc_dev = get_mgs_device();
3700         if (rc < 0)
3701                 goto out;
3702
3703         data.ioc_type = LUSTRE_CFG_TYPE;
3704         data.ioc_plen1 = lustre_cfg_len(lcfg->lcfg_bufcount,
3705                                         lcfg->lcfg_buflens);
3706         data.ioc_pbuf1 = (void *)lcfg;
3707
3708         memset(buf, 0, sizeof(rawbuf));
3709         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3710         if (rc) {
3711                 fprintf(stderr, "error: %s: invalid ioctl\n",
3712                         jt_cmdname(cmdname));
3713                 free(lcfg);
3714                 return rc;
3715         }
3716         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_POOL, buf);
3717 out:
3718         if (rc)
3719                 rc = -errno;
3720         switch (rc) {
3721         case -ENAMETOOLONG:
3722                 fprintf(stderr, "error: %s: either the pool or file "
3723                         "system name is too long (max pool name len "
3724                         "is %d and file system name is %d)\n",
3725                         jt_cmdname(cmdname), LOV_MAXPOOLNAME,
3726                         LUSTRE_MAXFSNAME);
3727                 break;
3728         case -EINVAL:
3729                 fprintf(stderr, "error: %s can contain only "
3730                         "alphanumeric characters, underscores, and "
3731                         "dashes besides the required '.'\n",
3732                         jt_cmdname(cmdname));
3733         default:
3734                 break;
3735         }
3736         free(lcfg);
3737         return rc;
3738 }
3739
3740 /**
3741  * Format and send the ioctl to the MGS.
3742  *
3743  * \param       cmd             IOCTL to send
3744  * \param       ret_data        void pointer to return anything from
3745  *                              ioctl
3746  * \param       num_args        number of arguments to pack into the
3747  *                              ioctl buffer
3748  * \param       argv[]          variable number of string arguments
3749  *
3750  * \retval                      0 on success
3751  */
3752 static int nodemap_cmd(enum lcfg_command_type cmd, void *ret_data,
3753                        unsigned int ret_size, ...)
3754 {
3755         va_list                 ap;
3756         char                    *arg;
3757         int                     i = 0;
3758         struct lustre_cfg_bufs  bufs;
3759         struct obd_ioctl_data   data;
3760         struct lustre_cfg       *lcfg;
3761         char                    rawbuf[MAX_IOC_BUFLEN];
3762         char                    *buf = rawbuf;
3763         int                     rc = 0;
3764
3765         lustre_cfg_bufs_reset(&bufs, NULL);
3766
3767         va_start(ap, ret_size);
3768         arg = va_arg(ap, char *);
3769         while (arg != NULL) {
3770                 lustre_cfg_bufs_set_string(&bufs, i, arg);
3771                 i++;
3772                 arg = va_arg(ap, char *);
3773         }
3774         va_end(ap);
3775
3776         lcfg = malloc(lustre_cfg_len(bufs.lcfg_bufcount, bufs.lcfg_buflen));
3777         if (lcfg == NULL)
3778                 return -ENOMEM;
3779         lustre_cfg_init(lcfg, cmd, &bufs);
3780
3781         memset(&data, 0, sizeof(data));
3782         rc = data.ioc_dev = get_mgs_device();
3783         if (rc < 0)
3784                 goto out;
3785
3786         data.ioc_type = LUSTRE_CFG_TYPE;
3787         data.ioc_plen1 = lustre_cfg_len(lcfg->lcfg_bufcount,
3788                          lcfg->lcfg_buflens);
3789         data.ioc_pbuf1 = (void *)lcfg;
3790
3791         memset(buf, 0, sizeof(rawbuf));
3792         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3793         if (rc != 0) {
3794                 fprintf(stderr, "error: invalid ioctl: %08x errno: %d with "
3795                                "rc=%d\n", cmd, errno, rc);
3796                 goto out;
3797         }
3798
3799         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_NODEMAP, buf);
3800         if (rc != 0) {
3801                 fprintf(stderr, "error: invalid ioctl: %08x errno: %d with "
3802                                "rc=%d\n", cmd, errno, rc);
3803                 goto out;
3804         }
3805
3806         if (ret_data != NULL) {
3807                 rc = llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
3808                 if (rc != 0)
3809                         goto out;
3810
3811                 if (ret_size > data.ioc_plen1)
3812                         ret_size = data.ioc_plen1;
3813
3814                 memcpy(ret_data, data.ioc_pbuf1, ret_size);
3815         }
3816 out:
3817         free(lcfg);
3818
3819         return rc;
3820 }
3821
3822 /**
3823  * activate nodemap functions
3824  *
3825  * \param       argc            number of args
3826  * \param       argv[]          variable string arguments
3827  *
3828  * argv[0]                      1 for activate or 0 for deactivate
3829  *
3830  * \retval                      0 on success
3831  */
3832 int jt_nodemap_activate(int argc, char **argv)
3833 {
3834         int rc;
3835
3836         rc = nodemap_cmd(LCFG_NODEMAP_ACTIVATE, NULL, 0, argv[0], argv[1],
3837                          NULL);
3838
3839         if (rc != 0) {
3840                 errno = -rc;
3841                 perror(argv[0]);
3842         }
3843
3844         return rc;
3845 }
3846
3847 /**
3848  * add a nodemap
3849  *
3850  * \param       argc            number of args
3851  * \param       argv[]          variable string arguments
3852  *
3853  * argv[0]                      nodemap name
3854  *
3855  * \retval                      0 on success
3856  */
3857 int jt_nodemap_add(int argc, char **argv)
3858 {
3859         int rc;
3860
3861         rc = llapi_nodemap_exists(argv[1]);
3862         if (rc == 0) {
3863                 fprintf(stderr, "error: %s existing nodemap name\n", argv[1]);
3864                 return 1;
3865         }
3866
3867         rc = nodemap_cmd(LCFG_NODEMAP_ADD, NULL, 0, argv[0], argv[1], NULL);
3868
3869         if (rc != 0) {
3870                 errno = -rc;
3871                 perror(argv[0]);
3872         }
3873
3874         return rc;
3875 }
3876
3877 /**
3878  * delete a nodemap
3879  *
3880  * \param       argc            number of args
3881  * \param       argv[]          variable string arguments
3882  *
3883  * argv[0]                      nodemap name
3884  *
3885  * \retval                      0 on success
3886  */
3887 int jt_nodemap_del(int argc, char **argv)
3888 {
3889         int rc;
3890
3891         rc = llapi_nodemap_exists(argv[1]);
3892         if (rc != 0) {
3893                 fprintf(stderr, "error: %s not existing nodemap name\n",
3894                         argv[1]);
3895                 return rc;
3896         }
3897         rc = nodemap_cmd(LCFG_NODEMAP_DEL, NULL, 0, argv[0], argv[1], NULL);
3898
3899         if (rc != 0) {
3900                 errno = -rc;
3901                 perror(argv[0]);
3902         }
3903
3904         return rc;
3905 }
3906
3907 /**
3908  * test a nid for nodemap membership
3909  *
3910  * \param       argc            number of args
3911  * \param       argv[]          variable string arguments
3912  *
3913  * argv[0]                      properly formatted nid
3914  *
3915  * \retval                      0 on success
3916  */
3917 int jt_nodemap_test_nid(int argc, char **argv)
3918 {
3919
3920         char    rawbuf[MAX_IOC_BUFLEN];
3921         int     rc;
3922
3923         rc = nodemap_cmd(LCFG_NODEMAP_TEST_NID, &rawbuf, sizeof(rawbuf),
3924                          argv[0], argv[1], NULL);
3925         if (rc == 0)
3926                 printf("%s\n", (char *)rawbuf);
3927
3928         return rc;
3929 }
3930
3931 /**
3932  * test a nodemap id pair for mapping
3933  *
3934  * \param       argc            number of args
3935  * \param       argv[[]         variable string arguments
3936  *
3937  * \retval                      0 on success
3938  *
3939  * The argv array should contain the nodemap name, the id
3940  * to checking the mapping on, and the id type (UID or GID)
3941  *
3942  */
3943 int jt_nodemap_test_id(int argc, char **argv)
3944 {
3945         char    rawbuf[MAX_IOC_BUFLEN];
3946         char    *nidstr = NULL;
3947         char    *idstr = NULL;
3948         char    *typestr = NULL;
3949         int     rc = 0;
3950         int     c;
3951
3952         static struct option long_opts[] = {
3953                 { .val = 'i',   .name = "id",   .has_arg = required_argument },
3954                 { .val = 'n',   .name = "nid",  .has_arg = required_argument },
3955                 { .val = 't',   .name = "idtype",
3956                                                 .has_arg = required_argument },
3957                 { .name = NULL } };
3958
3959         while ((c = getopt_long(argc, argv, "n:t:i:",
3960                                 long_opts, NULL)) != -1) {
3961                 switch (c) {
3962                 case 'n':
3963                         nidstr = optarg;
3964                         break;
3965                 case 't':
3966                         typestr = optarg;
3967                         break;
3968                 case 'i':
3969                         idstr = optarg;
3970                         break;
3971                 }
3972         }
3973
3974         if (nidstr == NULL || typestr == NULL || idstr == NULL) {
3975                 fprintf(stderr, "usage: nodemap_test_id --nid <nid> "
3976                                 "--idtype [uid|gid] --id <id>\n");
3977                 return -1;
3978         }
3979
3980         rc = nodemap_cmd(LCFG_NODEMAP_TEST_ID, &rawbuf, sizeof(rawbuf),
3981                          argv[0], nidstr, typestr, idstr);
3982         if (rc == 0)
3983                 printf("%s\n", (char *)rawbuf);
3984
3985         return rc;
3986 }
3987
3988 /**
3989  * parse nid range
3990  *
3991  * \param       nodemap_range   --range string
3992  * \param       nid_range       nid range string, min_nid:max_nid
3993  *
3994  * \retval                      0 on success
3995  */
3996 static int parse_nid_range(char *nodemap_range, char *nid_range, int range_len)
3997 {
3998         char                    min_nid[LNET_NIDSTR_SIZE + 1];
3999         char                    max_nid[LNET_NIDSTR_SIZE + 1];
4000         struct list_head        nidlist;
4001         int                     rc = 0;
4002
4003         INIT_LIST_HEAD(&nidlist);
4004
4005         if (cfs_parse_nidlist(nodemap_range, strlen(nodemap_range),
4006                               &nidlist) <= 0) {
4007                 fprintf(stderr,
4008                         "error: nodemap_xxx_range: can't parse nid range: %s\n",
4009                         nodemap_range);
4010                 return -1;
4011         }
4012
4013         rc = cfs_nidrange_find_min_max(&nidlist, &min_nid[0], &max_nid[0],
4014                                        LNET_NIDSTR_SIZE);
4015         if (rc < 0) {
4016                 if (rc == -EINVAL)
4017                         fprintf(stderr,
4018                                 "error: nodemap_xxx_range: nid range uses "
4019                                 "currently unsupported features\n");
4020                 else if (rc == -ERANGE)
4021                         fprintf(stderr,
4022                                 "error: nodemap_xxx_range: nodemap ranges must "
4023                                 "be contiguous\n");
4024
4025                 return rc;
4026         }
4027
4028         snprintf(nid_range, range_len, "%s:%s", min_nid, max_nid);
4029
4030         return rc;
4031 }
4032
4033 /**
4034  * add an nid range to a nodemap
4035  *
4036  * \param       argc            number of args
4037  * \param       argv[]          variable string arguments
4038  *
4039  * --name                       nodemap name
4040  * --range                      properly formatted nid range
4041  *
4042  * \retval                      0 on success
4043  */
4044 int jt_nodemap_add_range(int argc, char **argv)
4045 {
4046         char                    *nodemap_name = NULL;
4047         char                    *nodemap_range = NULL;
4048         char                    nid_range[2 * LNET_NIDSTR_SIZE + 2];
4049         int                     rc = 0;
4050         int                     c;
4051
4052         static struct option long_opts[] = {
4053         { .val = 'n',   .name = "name",         .has_arg = required_argument },
4054         { .val = 'r',   .name = "range",        .has_arg = required_argument },
4055         { .name = NULL } };
4056
4057         while ((c = getopt_long(argc, argv, "n:r:",
4058                                 long_opts, NULL)) != -1) {
4059                 switch (c) {
4060                 case 'n':
4061                         nodemap_name = optarg;
4062                         break;
4063                 case 'r':
4064                         nodemap_range = optarg;
4065                         break;
4066                 }
4067         }
4068
4069         if (nodemap_name == NULL || nodemap_range == NULL) {
4070                 fprintf(stderr, "usage: nodemap_add_range --name <name> "
4071                                 "--range <range>\n");
4072                 return -1;
4073         }
4074
4075         rc = parse_nid_range(nodemap_range, nid_range, sizeof(nid_range));
4076         if (rc) {
4077                 errno = -rc;
4078                 return rc;
4079         }
4080         rc = nodemap_cmd(LCFG_NODEMAP_ADD_RANGE, NULL, 0, argv[0],
4081                          nodemap_name, nid_range, NULL);
4082         if (rc != 0) {
4083                 errno = -rc;
4084                 fprintf(stderr, "error: %s: cannot add range '%s' to nodemap "
4085                                 "'%s': rc = %d\n",
4086                         jt_cmdname(argv[0]), nodemap_range, nodemap_name, rc);
4087         }
4088
4089         return rc;
4090 }
4091
4092 /**
4093  * delete an nid range to a nodemap
4094  *
4095  * \param       argc            number of args
4096  * \param       argv[]          variable string arguments
4097  *
4098  * --name                       nodemap name
4099  * --range                      properly formatted nid range
4100  *
4101  * \retval                      0 on success
4102  */
4103 int jt_nodemap_del_range(int argc, char **argv)
4104 {
4105         char                    *nodemap_name = NULL;
4106         char                    *nodemap_range = NULL;
4107         char                    nid_range[2 * LNET_NIDSTR_SIZE + 2];
4108         int                     rc = 0;
4109         int                     c;
4110
4111         static struct option long_opts[] = {
4112         { .val = 'n',   .name = "name",         .has_arg = required_argument },
4113         { .val = 'r',   .name = "range",        .has_arg = required_argument },
4114         { .name = NULL } };
4115
4116         while ((c = getopt_long(argc, argv, "n:r:",
4117                                 long_opts, NULL)) != -1) {
4118                 switch (c) {
4119                 case 'n':
4120                         nodemap_name = optarg;
4121                         break;
4122                 case 'r':
4123                         nodemap_range = optarg;
4124                         break;
4125                 }
4126         }
4127
4128         if (nodemap_name == NULL || nodemap_range == NULL) {
4129                 fprintf(stderr, "usage: nodemap_del_range --name <name> "
4130                                 "--range <range>\n");
4131                 return -1;
4132         }
4133
4134         rc = parse_nid_range(nodemap_range, nid_range, sizeof(nid_range));
4135         if (rc) {
4136                 errno = -rc;
4137                 return rc;
4138         }
4139         rc = nodemap_cmd(LCFG_NODEMAP_DEL_RANGE, NULL, 0, argv[0],
4140                          nodemap_name, nid_range, NULL);
4141         if (rc != 0) {
4142                 errno = -rc;
4143                 fprintf(stderr, "error: %s: cannot delete range '%s' to "
4144                                "nodemap '%s': rc = %d\n",
4145                         jt_cmdname(argv[0]), nodemap_range, nodemap_name, rc);
4146         }
4147
4148         return rc;
4149 }
4150
4151 /**
4152  * set a fileset on a nodemap
4153  *
4154  * \param       argc            number of args
4155  * \param       argv[]          variable string arguments
4156  *
4157  * --name                       nodemap name
4158  * --fileset                    fileset name
4159  *
4160  * \retval                      0 on success
4161  */
4162 int jt_nodemap_set_fileset(int argc, char **argv)
4163 {
4164         char *nodemap_name = NULL;
4165         char *fileset_name = NULL;
4166         int   rc = 0;
4167         int   c;
4168
4169         static struct option long_opts[] = {
4170         { .val = 'f',   .name = "fileset",      .has_arg = required_argument },
4171         { .val = 'n',   .name = "name",         .has_arg = required_argument },
4172         { .name = NULL } };
4173
4174         while ((c = getopt_long(argc, argv, "n:f:",
4175                                 long_opts, NULL)) != -1) {
4176                 switch (c) {
4177                 case 'n':
4178                         nodemap_name = optarg;
4179                         break;
4180                 case 'f':
4181                         fileset_name = optarg;
4182                         break;
4183                 }
4184         }
4185
4186         if (nodemap_name == NULL || fileset_name == NULL) {
4187                 fprintf(stderr, "usage: nodemap_set_fileset --name <name> "
4188                                 "--fileset <fileset>\n");
4189                 return -1;
4190         }
4191
4192         rc = nodemap_cmd(LCFG_NODEMAP_SET_FILESET, NULL, 0, argv[0],
4193                          nodemap_name, fileset_name, NULL);
4194         if (rc != 0) {
4195                 errno = -rc;
4196                 fprintf(stderr, "error: %s: cannot set fileset '%s' on nodemap "
4197                                 "'%s': rc = %d\n",
4198                         jt_cmdname(argv[0]), fileset_name, nodemap_name, rc);
4199         }
4200
4201         return rc;
4202 }
4203
4204 /**
4205  * set SELinux policy info on a nodemap
4206  *
4207  * \param       argc            number of args
4208  * \param       argv[]          variable string arguments
4209  *
4210  * --name                       nodemap name
4211  * --sepol                      SELinux policy info
4212  *
4213  * \retval                      0 on success
4214  */
4215 int jt_nodemap_set_sepol(int argc, char **argv)
4216 {
4217         char *nodemap_name = NULL;
4218         char *sepol = NULL;
4219         int   rc = 0;
4220         int   c;
4221
4222         static struct option long_options[] = {
4223                 {
4224                         .name           = "name",
4225                         .has_arg        = required_argument,
4226                         .val            = 'n',
4227                 },
4228                 {
4229                         .name           = "sepol",
4230                         .has_arg        = required_argument,
4231                         .val            = 's',
4232                 },
4233                 {
4234                         .name = NULL,
4235                 }
4236         };
4237
4238         while ((c = getopt_long(argc, argv, "n:s:",
4239                                 long_options, NULL)) != -1) {
4240                 switch (c) {
4241                 case 'n':
4242                         nodemap_name = optarg;
4243                         break;
4244                 case 's':
4245                         sepol = optarg;
4246                         break;
4247                 }
4248         }
4249
4250         if (nodemap_name == NULL || sepol == NULL) {
4251                 fprintf(stderr, "usage: nodemap_set_sepol --name <name> "
4252                                 "--sepol <sepol>\n");
4253                 return -1;
4254         }
4255
4256         rc = nodemap_cmd(LCFG_NODEMAP_SET_SEPOL, NULL, 0, argv[0],
4257                          nodemap_name, sepol, NULL);
4258         if (rc != 0) {
4259                 errno = -rc;
4260                 fprintf(stderr, "error: %s: cannot set sepol '%s' on nodemap "
4261                                 "'%s': rc = %d\n",
4262                         jt_cmdname(argv[0]), sepol, nodemap_name, rc);
4263         }
4264
4265         return rc;
4266 }
4267
4268 /**
4269  * modify a nodemap's behavior
4270  *
4271  * \param       argc            number of args
4272  * \param       argv[]          variable string arguments
4273  *
4274  * --name                       nodemap name
4275  * --property                   nodemap property to change
4276  *                              admin, trusted, squash_uid, squash_gid)
4277  * --value                      value to set property
4278  *
4279  * \retval                      0 on success
4280  */
4281 int jt_nodemap_modify(int argc, char **argv)
4282 {
4283         int                     c;
4284         int                     rc = 0;
4285         enum lcfg_command_type  cmd = 0;
4286         char                    *nodemap_name = NULL;
4287         char                    *param = NULL;
4288         char                    *value = NULL;
4289
4290         static struct option long_opts[] = {
4291         { .val = 'n',   .name = "name",         .has_arg = required_argument },
4292         { .val = 'p',   .name = "property",     .has_arg = required_argument },
4293         { .val = 'v',   .name = "value",        .has_arg = required_argument },
4294         { .name = NULL } };
4295
4296         while ((c = getopt_long(argc, argv, "n:p:v:",
4297                                 long_opts, NULL)) != -1) {
4298                 switch (c) {
4299                 case 'n':
4300                         nodemap_name = optarg;
4301                         break;
4302                 case 'p':
4303                         param = optarg;
4304                         break;
4305                 case 'v':
4306                         value = optarg;
4307                         break;
4308                 }
4309         }
4310
4311         if (nodemap_name == NULL || param == NULL || value == NULL) {
4312                 fprintf(stderr, "usage: nodemap_modify --name <nodemap_name> "
4313                                 "--property <property_name> --value <value>\n");
4314                 fprintf(stderr, "valid properties: admin trusted map_mode "
4315                                 "squash_uid squash_gid deny_unknown audit_mode\n");
4316                 return -1;
4317         }
4318
4319         if (strcmp("admin", param) == 0) {
4320                 cmd = LCFG_NODEMAP_ADMIN;
4321         } else if (strcmp("trusted", param) == 0) {
4322                 cmd = LCFG_NODEMAP_TRUSTED;
4323         } else if (strcmp("deny_unknown", param) == 0) {
4324                 cmd = LCFG_NODEMAP_DENY_UNKNOWN;
4325         } else if (strcmp("squash_uid", param) == 0) {
4326                 cmd = LCFG_NODEMAP_SQUASH_UID;
4327         } else if (strcmp("squash_gid", param) == 0) {
4328                 cmd = LCFG_NODEMAP_SQUASH_GID;
4329         } else if (strcmp("map_mode", param) == 0) {
4330                 cmd = LCFG_NODEMAP_MAP_MODE;
4331         } else if (strcmp("audit_mode", param) == 0) {
4332                 cmd = LCFG_NODEMAP_AUDIT_MODE;
4333         } else {
4334                 fprintf(stderr, "error: %s: nodemap_modify invalid "
4335                                 "subcommand: %s\n",
4336                         jt_cmdname(argv[0]), param);
4337                 return -1;
4338         }
4339
4340         rc = nodemap_cmd(cmd, NULL, 0, argv[0], nodemap_name, param,
4341                          value, NULL);
4342         if (rc != 0) {
4343                 errno = -rc;
4344                 fprintf(stderr, "error: %s: cannot modify nodemap '%s' "
4345                                "to param '%s': value '%s': rc = %d\n",
4346                         jt_cmdname(argv[0]), nodemap_name, param, value, rc);
4347         }
4348
4349         return rc;
4350 }
4351
4352 int jt_nodemap_add_idmap(int argc, char **argv)
4353 {
4354         int                     c;
4355         enum                    lcfg_command_type cmd = 0;
4356         char                    *nodemap_name = NULL;
4357         char                    *idmap = NULL;
4358         char                    *idtype = NULL;
4359         int                     rc = 0;
4360
4361         static struct option long_opts[] = {
4362         { .val = 'i',   .name = "idtype",       .has_arg = required_argument },
4363         { .val = 'm',   .name = "idmap",        .has_arg = required_argument },
4364         { .val = 'n',   .name = "name",         .has_arg = required_argument },
4365         { .name = NULL } };
4366
4367         while ((c = getopt_long(argc, argv, "n:m:i:",
4368                                 long_opts, NULL)) != -1) {
4369                 switch (c) {
4370                 case 'n':
4371                         nodemap_name = optarg;
4372                         break;
4373                 case 'm':
4374                         idmap = optarg;
4375                         break;
4376                 case 'i':
4377                         idtype = optarg;
4378                         break;
4379                 }
4380         }
4381
4382         if (nodemap_name == NULL || idmap == NULL || idtype == NULL) {
4383                 fprintf(stderr, "usage: %s --name <name> --idtype [uid | gid]"
4384                         " --idmap <client id>:<filesystem id>\n", argv[0]);
4385                 return -1;
4386         }
4387
4388         if (strcmp("uid", idtype) == 0) {
4389                 cmd = LCFG_NODEMAP_ADD_UIDMAP;
4390         } else if (strcmp("gid", idtype) == 0) {
4391                 cmd = LCFG_NODEMAP_ADD_GIDMAP;
4392         } else {
4393                 fprintf(stderr, "usage: %s --name <name> --idtype [uid | gid]"
4394                         " --idmap <client id>:<filesystem id>\n", argv[0]);
4395                 return -1;
4396         }
4397
4398         rc = nodemap_cmd(cmd, NULL, 0, argv[0], nodemap_name, idmap, NULL);
4399         if (rc != 0) {
4400                 errno = -rc;
4401                 fprintf(stderr, "cannot add %smap '%s' to nodemap '%s'"
4402                         ": rc = %d\n", idtype, idmap, nodemap_name, rc);
4403         }
4404
4405         return rc;
4406 }
4407
4408 int jt_nodemap_del_idmap(int argc, char **argv)
4409 {
4410         int                     c;
4411         enum                    lcfg_command_type cmd = 0;
4412         char                    *nodemap_name = NULL;
4413         char                    *idmap = NULL;
4414         char                    *idtype = NULL;
4415         int                     rc = 0;
4416
4417         static struct option long_opts[] = {
4418         { .val = 'i',   .name = "idtype",       .has_arg = required_argument },
4419         { .val = 'm',   .name = "idmap",        .has_arg = required_argument },
4420         { .val = 'n',   .name = "name",         .has_arg = required_argument },
4421         { .name = NULL } };
4422
4423         while ((c = getopt_long(argc, argv, "n:m:i:",
4424                                 long_opts, NULL)) != -1) {
4425                 switch (c) {
4426                 case 'n':
4427                         nodemap_name = optarg;
4428                         break;
4429                 case 'm':
4430                         idmap = optarg;
4431                         break;
4432                 case 'i':
4433                         idtype = optarg;
4434                         break;
4435                 }
4436         }
4437
4438         if (nodemap_name == NULL || idmap == NULL || idtype == NULL) {
4439                 fprintf(stderr, "usage: %s --name <name> --idtype [uid | gid]"
4440                         " --idmap <client id>:<filesystem id>\n", argv[0]);
4441                 return -1;
4442         }
4443
4444         if (strcmp("uid", idtype) == 0)
4445                 cmd = LCFG_NODEMAP_DEL_UIDMAP;
4446         else
4447                 cmd = LCFG_NODEMAP_DEL_GIDMAP;
4448
4449         rc = nodemap_cmd(cmd, NULL, 0, argv[0], nodemap_name, idmap, NULL);
4450         if (rc != 0) {
4451                 errno = -rc;
4452                 fprintf(stderr, "cannot delete %smap '%s' from nodemap '%s'"
4453                         ": rc = %d\n", idtype, idmap, nodemap_name, rc);
4454         }
4455
4456         return rc;
4457 }
4458
4459 /*
4460  * this function tranforms a rule [start-end/step] into an array
4461  * of matching numbers
4462  * supported forms are:
4463  * [start]                : just this number
4464  * [start-end]            : all numbers from start to end
4465  * [start-end/step]       : numbers from start to end with increment of step
4466  * on return, format contains a printf format string which can be used
4467  * to generate all the strings
4468  */
4469 static int get_array_idx(char *rule, char *format, int **array)
4470 {
4471         char *start, *end, *ptr;
4472         unsigned int lo, hi, step;
4473         int array_sz = 0;
4474         int i, array_idx;
4475         int rc;
4476
4477         start = strchr(rule, '[');
4478         end = strchr(rule, ']');
4479         if ((start == NULL) || (end == NULL)) {
4480                 *array = malloc(sizeof(int));
4481                 if (*array == NULL)
4482                         return 0;
4483                 strcpy(format, rule);
4484                 array_sz = 1;
4485                 return array_sz;
4486         }
4487         *start = '\0';
4488         *end = '\0';
4489         end++;
4490         start++;
4491         /* put in format the printf format (the rule without the range) */
4492         sprintf(format, "%s%%.4x%s", rule, end);
4493
4494         array_idx = 0;
4495         array_sz = 0;
4496         *array = NULL;
4497         /* loop on , separator */
4498         do {
4499                 /* extract the 3 fields */
4500                 rc = sscanf(start, "%x-%x/%u", &lo, &hi, &step);
4501                 switch (rc) {
4502                 case 0:
4503                         goto err;
4504                 case 1: {
4505                         void *tmp;
4506
4507                         array_sz++;
4508                         tmp = realloc(*array, array_sz * sizeof(int));
4509                         if (tmp == NULL)
4510                                 goto err;
4511                         *array = tmp;
4512                         (*array)[array_idx] = lo;
4513                         array_idx++;
4514                         break;
4515                 }
4516                 case 2: {
4517                         step = 1;
4518                         /* do not break to share code with case 3: */
4519                 }
4520                 case 3: {
4521                         void *tmp;
4522
4523                         if ((hi < lo) || (step == 0))
4524                                 goto err;
4525                         array_sz += (hi - lo) / step + 1;
4526                         tmp = realloc(*array, array_sz * sizeof(int));
4527                         if (tmp == NULL)
4528                                 goto err;
4529                         *array = tmp;
4530                         for (i = lo; i <= hi; i+=step, array_idx++)
4531                                 (*array)[array_idx] = i;
4532                         break;
4533                 }
4534                 }
4535                 ptr = strchr(start, ',');
4536                 if (ptr != NULL)
4537                         start = ptr + 1;
4538
4539         } while (ptr != NULL);
4540         return array_sz;
4541 err:
4542         if (*array != NULL) {
4543                 free(*array);
4544                 *array = NULL;
4545         }
4546         return 0;
4547 }
4548
4549 static int extract_fsname_poolname(const char *arg, char *fsname,
4550                                    char *poolname)
4551 {
4552         char *ptr;
4553         int rc;
4554
4555         snprintf(fsname, PATH_MAX + 1, "%s", arg);
4556         ptr = strchr(fsname, '.');
4557         if (ptr == NULL) {
4558                 fprintf(stderr, ". is missing in %s\n", fsname);
4559                 rc = -EINVAL;
4560                 goto err;
4561         }
4562
4563         if ((ptr - fsname) == 0) {
4564                 fprintf(stderr, "fsname is empty\n");
4565                 rc = -EINVAL;
4566                 goto err;
4567         }
4568
4569         *ptr = '\0';
4570         ++ptr;
4571
4572         if (strlen(ptr) == 0) {
4573                 fprintf(stderr, "poolname is empty\n");
4574                 rc = -EINVAL;
4575                 goto err;
4576         }
4577
4578         strncpy(poolname, ptr, LOV_MAXPOOLNAME);
4579         poolname[LOV_MAXPOOLNAME] = '\0';
4580
4581         if (strncmp(poolname, "none", LOV_MAXPOOLNAME) == 0) {
4582                 fprintf(stderr, "poolname cannot be 'none'\n");
4583                 return -EINVAL;
4584         }
4585         return 0;
4586
4587 err:
4588         fprintf(stderr, "argument %s must be <fsname>.<poolname>\n", arg);
4589         return rc;
4590 }
4591
4592 int jt_pool_cmd(int argc, char **argv)
4593 {
4594         enum lcfg_command_type cmd;
4595         char fsname[PATH_MAX + 1];
4596         char poolname[LOV_MAXPOOLNAME + 1];
4597         char *ostnames_buf = NULL;
4598         int i, rc;
4599         int *array = NULL, array_sz;
4600         struct {
4601                 int     rc;
4602                 char   *ostname;
4603         } *cmds = NULL;
4604
4605         switch (argc) {
4606         case 0:
4607         case 1: return CMD_HELP;
4608         case 2: {
4609                 if (strcmp("pool_new", argv[0]) == 0)
4610                         cmd = LCFG_POOL_NEW;
4611                 else if (strcmp("pool_destroy", argv[0]) == 0)
4612                         cmd = LCFG_POOL_DEL;
4613                 else if (strcmp("pool_list", argv[0]) == 0)
4614                          return llapi_poollist(argv[1]);
4615                 else return CMD_HELP;
4616
4617                 rc = extract_fsname_poolname(argv[1], fsname, poolname);
4618                 if (rc)
4619                         break;
4620
4621                 rc = pool_cmd(cmd, argv[0], argv[1], fsname, poolname, NULL);
4622                 if (rc)
4623                         break;
4624
4625                 check_pool_cmd_result(cmd, fsname, poolname, NULL);
4626                 break;
4627         }
4628         default: {
4629                 char format[2*MAX_OBD_NAME];
4630
4631                 if (strcmp("pool_remove", argv[0]) == 0) {
4632                         cmd = LCFG_POOL_REM;
4633                 } else if (strcmp("pool_add", argv[0]) == 0) {
4634                         cmd = LCFG_POOL_ADD;
4635                 } else {
4636                         return CMD_HELP;
4637                 }
4638
4639                 rc = extract_fsname_poolname(argv[1], fsname, poolname);
4640                 if (rc)
4641                         break;
4642
4643                 for (i = 2; i < argc; i++) {
4644                         int j;
4645
4646                         array_sz = get_array_idx(argv[i], format, &array);
4647                         if (array_sz == 0)
4648                                 return CMD_HELP;
4649
4650                         cmds = malloc(array_sz * sizeof(cmds[0]));
4651                         if (cmds != NULL) {
4652                                 ostnames_buf = malloc(array_sz *
4653                                                       (MAX_OBD_NAME + 1));
4654                         } else {
4655                                 free(array);
4656                                 rc = -ENOMEM;
4657                                 goto out;
4658                         }
4659
4660                         for (j = 0; j < array_sz; j++) {
4661                                 char ostname[MAX_OBD_NAME + 1];
4662
4663                                 snprintf(ostname, MAX_OBD_NAME, format,
4664                                          array[j]);
4665                                 ostname[MAX_OBD_NAME] = '\0';
4666
4667                                 rc = check_and_complete_ostname(fsname,ostname);
4668                                 if (rc) {
4669                                         free(array);
4670                                         free(cmds);
4671                                         if (ostnames_buf)
4672                                                 free(ostnames_buf);
4673                                         goto out;
4674                                 }
4675                                 if (ostnames_buf != NULL) {
4676                                         cmds[j].ostname =
4677                                           &ostnames_buf[(MAX_OBD_NAME + 1) * j];
4678                                         strcpy(cmds[j].ostname, ostname);
4679                                 } else {
4680                                         cmds[j].ostname = NULL;
4681                                 }
4682                                 cmds[j].rc = pool_cmd(cmd, argv[0], argv[1],
4683                                                       fsname, poolname,
4684                                                       ostname);
4685                                 /* Return an err if any of the add/dels fail */
4686                                 if (!rc)
4687                                         rc = cmds[j].rc;
4688                         }
4689                         for (j = 0; j < array_sz; j++) {
4690                                 if (!cmds[j].rc) {
4691                                         char ostname[MAX_OBD_NAME + 1];
4692
4693                                         if (!cmds[j].ostname) {
4694                                                 snprintf(ostname, MAX_OBD_NAME,
4695                                                          format, array[j]);
4696                                                 ostname[MAX_OBD_NAME] = '\0';
4697                                                 check_and_complete_ostname(
4698                                                         fsname, ostname);
4699                                         } else {
4700                                                 strcpy(ostname,
4701                                                        cmds[j].ostname);
4702                                         }
4703                                         check_pool_cmd_result(cmd, fsname,
4704                                                               poolname,ostname);
4705                                 }
4706                         }
4707                         if (array_sz > 0)
4708                                 free(array);
4709                         if (cmds)
4710                                 free(cmds);
4711                         if (ostnames_buf != NULL)
4712                                 free(ostnames_buf);
4713                 }
4714                 /* fall through */
4715         }
4716         } /* switch */
4717
4718 out:
4719         if (rc != 0) {
4720                 errno = -rc;
4721                 perror(argv[0]);
4722         }
4723
4724         return rc;
4725 }
4726
4727 #ifdef HAVE_SERVER_SUPPORT
4728 static const char *barrier_status2name(enum barrier_status status)
4729 {
4730         switch (status) {
4731         case BS_INIT:
4732                 return "init";
4733         case BS_FREEZING_P1:
4734                 return "freezing_p1";
4735         case BS_FREEZING_P2:
4736                 return "freezing_p2";
4737         case BS_FROZEN:
4738                 return "frozen";
4739         case BS_THAWING:
4740                 return "thawing";
4741         case BS_THAWED:
4742                 return "thawed";
4743         case BS_FAILED:
4744                 return "failed";
4745         case BS_EXPIRED:
4746                 return "expired";
4747         case BS_RESCAN:
4748                 return "rescan";
4749         default:
4750                 return "unknown";
4751         }
4752 }
4753
4754 int jt_barrier_freeze(int argc, char **argv)
4755 {
4756         struct obd_ioctl_data data;
4757         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
4758         struct barrier_ctl bc;
4759         int rc;
4760
4761         if (argc < 2 || argc > 3)
4762                 return CMD_HELP;
4763
4764         memset(&data, 0, sizeof(data));
4765         rc = data.ioc_dev = get_mgs_device();
4766         if (rc < 0)
4767                 return rc;
4768
4769         memset(&bc, 0, sizeof(bc));
4770         bc.bc_version = BARRIER_VERSION_V1;
4771         bc.bc_cmd = BC_FREEZE;
4772         if (argc == 3)
4773                 bc.bc_timeout = atoi(argv[2]);
4774         if (bc.bc_timeout == 0)
4775                 bc.bc_timeout = BARRIER_TIMEOUT_DEFAULT;
4776
4777         if (strlen(argv[1]) > 8) {
4778                 fprintf(stderr, "%s: fsname name %s is too long. "
4779                         "It should not exceed 8.\n", argv[0], argv[1]);
4780                 return -EINVAL;
4781         }
4782
4783         strncpy(bc.bc_name, argv[1], sizeof(bc.bc_name));
4784         data.ioc_inlbuf1 = (char *)&bc;
4785         data.ioc_inllen1 = sizeof(bc);
4786         memset(buf, 0, sizeof(rawbuf));
4787         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
4788         if (rc) {
4789                 fprintf(stderr, "Fail to pack ioctl data: rc = %d.\n", rc);
4790                 return rc;
4791         }
4792
4793         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_BARRIER, buf);
4794         if (rc < 0)
4795                 fprintf(stderr, "Fail to freeze barrier for %s: %s\n",
4796                         argv[1], strerror(errno));
4797
4798         return rc;
4799 }
4800
4801 int jt_barrier_thaw(int argc, char **argv)
4802 {
4803         struct obd_ioctl_data data;
4804         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
4805         struct barrier_ctl bc;
4806         int rc;
4807
4808         if (argc != 2)
4809                 return CMD_HELP;
4810
4811         memset(&data, 0, sizeof(data));
4812         rc = data.ioc_dev = get_mgs_device();
4813         if (rc < 0)
4814                 return rc;
4815
4816         memset(&bc, 0, sizeof(bc));
4817         bc.bc_version = BARRIER_VERSION_V1;
4818         bc.bc_cmd = BC_THAW;
4819
4820         if (strlen(argv[1]) > 8) {
4821                 fprintf(stderr, "fsname name %s is too long. "
4822                         "It should not exceed 8.\n", argv[1]);
4823                 return -EINVAL;
4824         }
4825
4826         strncpy(bc.bc_name, argv[1], sizeof(bc.bc_name));
4827         data.ioc_inlbuf1 = (char *)&bc;
4828         data.ioc_inllen1 = sizeof(bc);
4829         memset(buf, 0, sizeof(rawbuf));
4830         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
4831         if (rc) {
4832                 fprintf(stderr, "Fail to pack ioctl data: rc = %d.\n", rc);
4833                 return rc;
4834         }
4835
4836         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_BARRIER, buf);
4837         if (rc < 0)
4838                 fprintf(stderr, "Fail to thaw barrier for %s: %s\n",
4839                         argv[1], strerror(errno));
4840
4841         return rc;
4842 }
4843
4844 int __jt_barrier_stat(const char *fsname, struct barrier_ctl *bc)
4845 {
4846         struct obd_ioctl_data data;
4847         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
4848         int rc;
4849
4850         memset(&data, 0, sizeof(data));
4851         rc = data.ioc_dev = get_mgs_device();
4852         if (rc < 0)
4853                 return rc;
4854
4855         memset(bc, 0, sizeof(*bc));
4856         bc->bc_version = BARRIER_VERSION_V1;
4857         bc->bc_cmd = BC_STAT;
4858         strncpy(bc->bc_name, fsname, sizeof(bc->bc_name) - 1);
4859         data.ioc_inlbuf1 = (char *)bc;
4860         data.ioc_inllen1 = sizeof(*bc);
4861         memset(buf, 0, sizeof(rawbuf));
4862         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
4863         if (rc) {
4864                 fprintf(stderr, "Fail to pack ioctl data: rc = %d.\n", rc);
4865                 return rc;
4866         }
4867
4868         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_BARRIER, buf);
4869         if (rc < 0)
4870                 fprintf(stderr, "Fail to query barrier for %s: %s\n",
4871                         fsname, strerror(errno));
4872         else
4873                 llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
4874
4875         return rc;
4876 }
4877
4878 int jt_barrier_stat(int argc, char **argv)
4879 {
4880         struct barrier_ctl bc;
4881         static struct option long_opt_barrier_stat[] = {
4882                 {
4883                         .val            = 's',
4884                         .name           = "state",
4885                         .has_arg        = no_argument,
4886                 },
4887                 {       .val            = 't',
4888                         .name           = "timeout",
4889                         .has_arg        = no_argument,
4890                 },
4891                 {
4892                         NULL
4893                 }
4894         };
4895         const char *name;
4896         int index;
4897         int opt;
4898         int rc;
4899         bool state = false;
4900         bool timeout = false;
4901
4902         while ((opt = getopt_long(argc, argv, "st", long_opt_barrier_stat,
4903                                   &index)) != EOF) {
4904                 switch (opt) {
4905                 case 's':
4906                         state = true;
4907                         break;
4908                 case 't':
4909                         timeout = true;
4910                         break;
4911                 default:
4912                         return CMD_HELP;
4913                 }
4914         }
4915
4916         if (optind >= argc)
4917                 return CMD_HELP;
4918
4919         name = argv[optind];
4920         if (strlen(name) > 8) {
4921                 fprintf(stderr, "fsname name %s is too long. "
4922                         "It should not exceed 8.\n", name);
4923                 return -EINVAL;
4924         }
4925
4926         rc = __jt_barrier_stat(name, &bc);
4927         if (!rc) {
4928                 if (state && !timeout)
4929                         printf("%s\n", barrier_status2name(bc.bc_status));
4930                 else if (timeout && !state)
4931                         printf("%d\n",
4932                                (bc.bc_status == BS_FREEZING_P1 ||
4933                                 bc.bc_status == BS_FREEZING_P2 ||
4934                                 bc.bc_status == BS_FROZEN) ?
4935                                bc.bc_timeout : 0);
4936                 else
4937                         printf("state: %s\ntimeout: %d seconds\n",
4938                                barrier_status2name(bc.bc_status),
4939                                (bc.bc_status == BS_FREEZING_P1 ||
4940                                 bc.bc_status == BS_FREEZING_P2 ||
4941                                 bc.bc_status == BS_FROZEN) ?
4942                                bc.bc_timeout : 0);
4943         }
4944
4945         return rc;
4946 }
4947
4948 int jt_barrier_rescan(int argc, char **argv)
4949 {
4950         struct obd_ioctl_data data;
4951         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
4952         struct barrier_ctl bc;
4953         int rc;
4954
4955         if (argc < 2 || argc > 3)
4956                 return CMD_HELP;
4957
4958         memset(&data, 0, sizeof(data));
4959         rc = data.ioc_dev = get_mgs_device();
4960         if (rc < 0)
4961                 return rc;
4962
4963         memset(&bc, 0, sizeof(bc));
4964         bc.bc_version = BARRIER_VERSION_V1;
4965         bc.bc_cmd = BC_RESCAN;
4966         if (argc == 3)
4967                 bc.bc_timeout = atoi(argv[2]);
4968         if (bc.bc_timeout == 0)
4969                 bc.bc_timeout = BARRIER_TIMEOUT_DEFAULT;
4970
4971         if (strlen(argv[1]) > 8) {
4972                 fprintf(stderr, "fsname name %s is too long. "
4973                         "It should not exceed 8.\n", argv[1]);
4974                 return -EINVAL;
4975         }
4976
4977         strncpy(bc.bc_name, argv[1], sizeof(bc.bc_name));
4978         data.ioc_inlbuf1 = (char *)&bc;
4979         data.ioc_inllen1 = sizeof(bc);
4980         memset(buf, 0, sizeof(rawbuf));
4981         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
4982         if (rc) {
4983                 fprintf(stderr, "Fail to pack ioctl data: rc = %d.\n", rc);
4984                 return rc;
4985         }
4986
4987         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_BARRIER, buf);
4988         if (rc < 0) {
4989                 fprintf(stderr, "Fail to rescan barrier bitmap for %s: %s\n",
4990                         argv[1], strerror(errno));
4991         } else {
4992                 llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
4993                 printf("%u of %u MDT(s) in the filesystem %s are inactive\n",
4994                        bc.bc_absence, bc.bc_total, argv[1]);
4995         }
4996
4997         return rc;
4998 }
4999 #endif /* HAVE_SERVER_SUPPORT */
5000
5001 int jt_get_obj_version(int argc, char **argv)
5002 {
5003         struct lu_fid fid;
5004         struct obd_ioctl_data data;
5005         __u64 version, id = ULLONG_MAX, group = ULLONG_MAX;
5006         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf, *fidstr;
5007         int rc, c;
5008
5009         while ((c = getopt(argc, argv, "i:g:")) != -1) {
5010                 switch (c) {
5011                 case 'i':
5012                         id = strtoull(optarg, NULL, 0);
5013                         break;
5014                 case 'g':
5015                         group = strtoull(optarg, NULL, 0);
5016                         break;
5017                 default:
5018                         return CMD_HELP;
5019                 }
5020         }
5021
5022         argc -= optind;
5023         argv += optind;
5024
5025         if (!(id != ULLONG_MAX && group != ULLONG_MAX && argc == 0) &&
5026             !(id == ULLONG_MAX && group == ULLONG_MAX && argc == 1))
5027                 return CMD_HELP;
5028
5029         memset(&data, 0, sizeof data);
5030         data.ioc_dev = cur_device;
5031         if (argc == 1) {
5032                 fidstr = *argv;
5033                 while (*fidstr == '[')
5034                         fidstr++;
5035                 sscanf(fidstr, SFID, RFID(&fid));
5036
5037                 data.ioc_inlbuf1 = (char *) &fid;
5038                 data.ioc_inllen1 = sizeof fid;
5039         } else {
5040                 data.ioc_inlbuf3 = (char *) &id;
5041                 data.ioc_inllen3 = sizeof id;
5042                 data.ioc_inlbuf4 = (char *) &group;
5043                 data.ioc_inllen4 = sizeof group;
5044         }
5045         data.ioc_inlbuf2 = (char *) &version;
5046         data.ioc_inllen2 = sizeof version;
5047
5048         memset(buf, 0, sizeof *buf);
5049         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
5050         if (rc) {
5051                 fprintf(stderr, "error: %s: packing ioctl arguments: %s\n",
5052                         jt_cmdname(argv[0]), strerror(-rc));
5053                 return rc;
5054         }
5055
5056         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_GET_OBJ_VERSION, buf);
5057         if (rc == -1) {
5058                 fprintf(stderr, "error: %s: ioctl: %s\n",
5059                         jt_cmdname(argv[0]), strerror(errno));
5060                 return -errno;
5061         }
5062
5063         llapi_ioctl_unpack(&data, buf, sizeof rawbuf);
5064         printf("%#jx\n", (uintmax_t)version);
5065
5066         return 0;
5067 }
5068
5069 int jt_changelog_register(int argc, char **argv)
5070 {
5071         struct obd_ioctl_data    data = { 0 };
5072         char                     rawbuf[MAX_IOC_BUFLEN] = "";
5073         char                    *buf = rawbuf;
5074         char                    *device = lcfg_get_devname();
5075         bool                     print_name_only = false;
5076         int                      c;
5077         int                      rc;
5078
5079         if (argc > 2)
5080                 return CMD_HELP;
5081
5082         while ((c = getopt(argc, argv, "hn")) >= 0) {
5083                 switch (c) {
5084                 case 'n':
5085                         print_name_only = true;
5086                         break;
5087                 case 'h':
5088                 default:
5089                         return CMD_HELP;
5090                 }
5091         }
5092
5093         if (cur_device < 0 || device == NULL)
5094                 return CMD_HELP;
5095
5096         data.ioc_dev = cur_device;
5097
5098         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
5099         if (rc < 0) {
5100                 fprintf(stderr, "error: %s: cannot pack ioctl: %s\n",
5101                         jt_cmdname(argv[0]), strerror(-rc));
5102                return rc;
5103         }
5104
5105         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_CHANGELOG_REG, buf);
5106         if (rc < 0) {
5107                 rc = -errno;
5108                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
5109                         strerror(-rc));
5110                 return rc;
5111         }
5112
5113         llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
5114
5115         if (data.ioc_u32_1 == 0) {
5116                 fprintf(stderr, "received invalid userid!\n");
5117                 return -EPROTO;
5118         }
5119
5120         if (print_name_only)
5121                 printf("%s%u\n", CHANGELOG_USER_PREFIX, data.ioc_u32_1);
5122         else
5123                 printf("%s: Registered changelog userid '%s%u'\n",
5124                        device, CHANGELOG_USER_PREFIX, data.ioc_u32_1);
5125
5126         return 0;
5127 }
5128
5129 int jt_changelog_deregister(int argc, char **argv)
5130 {
5131         struct obd_ioctl_data    data = { 0 };
5132         char                     rawbuf[MAX_IOC_BUFLEN] = "";
5133         char                    *buf = rawbuf;
5134         char                    *device = lcfg_get_devname();
5135         int                      id;
5136         int                      rc;
5137
5138         if (argc != 2 || cur_device < 0 || device == NULL)
5139                 return CMD_HELP;
5140
5141         rc = sscanf(argv[1], CHANGELOG_USER_PREFIX"%d", &id);
5142         if (rc != 1 || id <= 0) {
5143                 fprintf(stderr,
5144                         "error: %s: expected id of the form %s<num> got '%s'\n",
5145                         jt_cmdname(argv[0]), CHANGELOG_USER_PREFIX, argv[1]);
5146                 return CMD_HELP;
5147         }
5148
5149         data.ioc_dev = cur_device;
5150         data.ioc_u32_1 = id;
5151
5152         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
5153         if (rc < 0) {
5154                 fprintf(stderr, "error: %s: invalid ioctl\n",
5155                         jt_cmdname(argv[0]));
5156                 return rc;
5157         }
5158
5159         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_CHANGELOG_DEREG, buf);
5160         if (rc < 0) {
5161                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
5162                         strerror(rc = errno));
5163                 return rc;
5164         }
5165
5166         llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
5167         printf("%s: Deregistered changelog user '%s%u'\n",
5168                device, CHANGELOG_USER_PREFIX, data.ioc_u32_1);
5169
5170         return 0;
5171 }
5172
5173 int jt_pcc_add(int argc, char **argv)
5174 {
5175         struct option long_opts[] = {
5176                 { .val = 'p', .name = "param", .has_arg = required_argument },
5177                 { .name = NULL } };
5178         const char *mntpath;
5179         const char *pccpath;
5180         char *param = NULL;
5181         char cmd[PATH_MAX];
5182         int rc;
5183
5184         optind = 1;
5185         while ((rc = getopt_long(argc, argv, "p:",
5186                 long_opts, NULL)) != -1) {
5187                 switch (rc) {
5188                 case 'p':
5189                         param = optarg;
5190                         break;
5191                 default:
5192                         return CMD_HELP;
5193                 }
5194         }
5195
5196         if (!param) {
5197                 fprintf(stderr, "%s: must specify the config param for PCC\n",
5198                         jt_cmdname(argv[0]));
5199                 return CMD_HELP;
5200         }
5201
5202         if (optind + 2 != argc) {
5203                 fprintf(stderr,
5204                         "%s: must speficy mount path and PCC path %d:%d\n",
5205                         jt_cmdname(argv[0]), optind, argc);
5206                 return CMD_HELP;
5207         }
5208
5209         mntpath = argv[optind++];
5210         pccpath = argv[optind];
5211
5212         snprintf(cmd, PATH_MAX, "add %s %s", pccpath, param);
5213         rc = llapi_pccdev_set(mntpath, cmd);
5214         if (rc < 0)
5215                 fprintf(stderr, "%s: failed to run '%s' on %s\n",
5216                         jt_cmdname(argv[0]), cmd, mntpath);
5217
5218         return rc;
5219 }
5220
5221 int jt_pcc_del(int argc, char **argv)
5222 {
5223         const char *mntpath;
5224         const char *pccpath;
5225         char cmd[PATH_MAX];
5226         int rc;
5227
5228         optind = 1;
5229         if (argc != 3) {
5230                 fprintf(stderr, "%s: require 3 arguments\n",
5231                         jt_cmdname(argv[0]));
5232                 return CMD_HELP;
5233         }
5234
5235         mntpath = argv[optind++];
5236         pccpath = argv[optind++];
5237
5238         snprintf(cmd, PATH_MAX, "del %s", pccpath);
5239         rc = llapi_pccdev_set(mntpath, cmd);
5240         if (rc < 0)
5241                 fprintf(stderr, "%s: failed to run '%s' on %s\n",
5242                         jt_cmdname(argv[0]), cmd, mntpath);
5243
5244         return rc;
5245 }
5246
5247 int jt_pcc_clear(int argc, char **argv)
5248 {
5249         const char *mntpath;
5250         int rc;
5251
5252         optind = 1;
5253         if (argc != 2) {
5254                 fprintf(stderr, "%s: require 2 arguments\n",
5255                         jt_cmdname(argv[0]));
5256                 return CMD_HELP;
5257         }
5258
5259         mntpath = argv[optind];
5260         rc = llapi_pccdev_set(mntpath, "clear");
5261         if (rc < 0)
5262                 fprintf(stderr, "%s: failed to run 'clear' on %s\n",
5263                         jt_cmdname(argv[0]), mntpath);
5264
5265         return rc;
5266 }
5267
5268 int jt_pcc_list(int argc, char **argv)
5269 {
5270         const char *mntpath;
5271         int rc;
5272
5273         optind = 1;
5274         if (argc != 2) {
5275                 fprintf(stderr, "%s: require 2 arguments\n",
5276                         jt_cmdname(argv[0]));
5277                 return CMD_HELP;
5278         }
5279
5280         mntpath = argv[optind];
5281         rc = llapi_pccdev_get(mntpath);
5282         if (rc < 0)
5283                 fprintf(stderr, "%s: failed to run 'pcc list' on %s\n",
5284                         jt_cmdname(argv[0]), mntpath);
5285
5286         return rc;
5287 }