Whamcloud - gitweb
123a5f99d431bf6dcc8767f5af457c87800b7cbe
[fs/lustre-release.git] / lustre / utils / obd.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2002, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2011, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/utils/obd.c
33  *
34  * Author: Peter J. Braam <braam@clusterfs.com>
35  * Author: Phil Schwan <phil@clusterfs.com>
36  * Author: Andreas Dilger <adilger@clusterfs.com>
37  * Author: Robert Read <rread@clusterfs.com>
38  */
39
40 #include <sys/ioctl.h>
41 #include <sys/socket.h>
42 #include <sys/stat.h>
43 #include <sys/time.h>
44 #include <sys/types.h>
45 #include <sys/un.h>
46 #include <sys/wait.h>
47
48 #include <ctype.h>
49 #include <errno.h>
50 #include <fcntl.h>
51 #include <getopt.h>
52 #include <signal.h>
53 #include <stdarg.h>
54 #include <stdbool.h>
55 #include <stdio.h>
56 #include <stdlib.h>
57 #include <string.h>
58 #include <time.h>
59 #include <unistd.h>
60 #include <limits.h>
61 #include "obdctl.h"
62 #include "lustreapi_internal.h"
63 #include <libcfs/util/list.h>
64 #include <libcfs/util/ioctl.h>
65 #include <libcfs/util/param.h>
66 #include <libcfs/util/parser.h>
67 #include <libcfs/util/string.h>
68
69 #include <linux/lnet/nidstr.h>
70 #include <linux/lnet/lnetctl.h>
71 #include <linux/lustre/lustre_barrier_user.h>
72 #include <linux/lustre/lustre_cfg.h>
73 #include <linux/lustre/lustre_ioctl.h>
74 #include <linux/lustre/lustre_ostid.h>
75 #include <linux/lustre/lustre_param.h>
76 #include <linux/lustre/lustre_ver.h>
77
78 #include <lustre/lustreapi.h>
79
80 #define MAX_STRING_SIZE 128
81
82 #if HAVE_LIBPTHREAD
83 #include <sys/ipc.h>
84 #include <sys/shm.h>
85 #include <pthread.h>
86
87 #define MAX_THREADS 4096
88 #define MAX_BASE_ID 0xffffffff
89 #define NIDSTRING_LENGTH 64
90 struct shared_data {
91         pthread_mutex_t mutex;
92         pthread_cond_t  cond;
93         int       stopping;
94         struct {
95                 __u64 counters[MAX_THREADS];
96                 __u64 offsets[MAX_THREADS];
97                 int   thr_running;
98                 int   start_barrier;
99                 int   stop_barrier;
100                 struct timeval start_time;
101                 struct timeval end_time;
102         } body;
103 };
104
105 static struct shared_data *shared_data;
106 static __u64 counter_snapshot[2][MAX_THREADS];
107 static int prev_valid;
108 static struct timeval prev_time;
109 static int thread;
110 static int nthreads;
111 #else
112 const int thread = 0;
113 const int nthreads = 1;
114 #endif
115
116 static int cur_device = -1;
117
118 int lcfg_ioctl(char *func, int dev_id, struct lustre_cfg *lcfg)
119 {
120         struct obd_ioctl_data data;
121         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
122         int rc;
123
124         memset(&data, 0, sizeof(data));
125         data.ioc_dev = cur_device;
126         data.ioc_type = LUSTRE_CFG_TYPE;
127         data.ioc_plen1 = lustre_cfg_len(lcfg->lcfg_bufcount,
128                                         lcfg->lcfg_buflens);
129         data.ioc_pbuf1 = (void *)lcfg;
130         memset(buf, 0, sizeof(rawbuf));
131         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
132         if (rc) {
133                 fprintf(stderr, "error: %s: invalid ioctl\n", jt_cmdname(func));
134                 return rc;
135         }
136
137         rc =  l_ioctl(dev_id, OBD_IOC_PROCESS_CFG, buf);
138
139         return rc;
140 }
141
142 static int do_device(char *func, char *devname);
143
144 static int get_mgs_device()
145 {
146         char mgs[] = "$MGS";
147         static int mgs_device = -1;
148
149         if (mgs_device == -1) {
150                 int rc;
151                 do_disconnect(NULL, 1);
152                 rc = do_device("mgsioc", mgs);
153                 if (rc) {
154                         fprintf(stderr,
155                                 "This command must be run on the MGS.\n");
156                         errno = ENODEV;
157                         return -1;
158                 }
159                 mgs_device = cur_device;
160         }
161         return mgs_device;
162 }
163
164 /* Returns -1 on error with errno set */
165 int lcfg_mgs_ioctl(char *func, int dev_id, struct lustre_cfg *lcfg)
166 {
167         struct obd_ioctl_data data;
168         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
169         int rc;
170
171         memset(&data, 0, sizeof(data));
172         rc = data.ioc_dev = get_mgs_device();
173         if (rc < 0)
174                 goto out;
175         data.ioc_type = LUSTRE_CFG_TYPE;
176         data.ioc_plen1 = lustre_cfg_len(lcfg->lcfg_bufcount,
177                                         lcfg->lcfg_buflens);
178         data.ioc_pbuf1 = (void *)lcfg;
179         memset(buf, 0, sizeof(rawbuf));
180         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
181         if (rc) {
182                 fprintf(stderr, "error: %s: invalid ioctl\n", jt_cmdname(func));
183                 return rc;
184         }
185
186         rc = l_ioctl(dev_id, OBD_IOC_PARAM, buf);
187 out:
188         if (rc && errno == ENOSYS)
189                 fprintf(stderr, "Make sure cfg_device is set first.\n");
190
191         return rc;
192 }
193
194 char *obdo_print(struct obdo *obd)
195 {
196         char buf[1024];
197
198         snprintf(buf, sizeof(buf), "id: %#jx\ngrp: %#jx\natime: %ju\n"
199                  "mtime: %ju\nctime: %ju\nsize: %ju\nblocks: %ju"
200                  "\nblksize: %u\nmode: %o\nuid: %d\ngid: %d\nflags: %x\n"
201                  "misc: %x\nnlink: %d,\nvalid %#jx\n",
202                  (uintmax_t)ostid_id(&obd->o_oi),
203                  (uintmax_t)ostid_seq(&obd->o_oi),
204                  (uintmax_t)obd->o_atime, (uintmax_t)obd->o_mtime,
205                  (uintmax_t)obd->o_ctime, (uintmax_t)obd->o_size,
206                  (uintmax_t)obd->o_blocks, obd->o_blksize, obd->o_mode,
207                  obd->o_uid, obd->o_gid, obd->o_flags, obd->o_misc,
208                  obd->o_nlink, (uintmax_t)obd->o_valid);
209         return strdup(buf);
210 }
211
212
213 #define BAD_VERBOSE (-999999999)
214
215 #define N2D_OFF 0x100      /* So we can tell between error codes and devices */
216
217 static int do_name2dev(char *func, char *name)
218 {
219         struct obd_ioctl_data data;
220         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
221         int rc;
222
223         memset(&data, 0, sizeof(data));
224         data.ioc_dev = cur_device;
225         data.ioc_inllen1 = strlen(name) + 1;
226         data.ioc_inlbuf1 = name;
227
228         memset(buf, 0, sizeof(rawbuf));
229         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
230         if (rc < 0) {
231                 fprintf(stderr, "error: %s: invalid ioctl\n", jt_cmdname(func));
232                 return -rc;
233         }
234         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_NAME2DEV, buf);
235         if (rc < 0)
236                 return errno;
237         rc = llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
238         if (rc) {
239                 fprintf(stderr, "error: %s: invalid reply\n", jt_cmdname(func));
240                 return rc;
241         }
242
243         return data.ioc_dev + N2D_OFF;
244 }
245
246 /*
247  * resolve a device name to a device number.
248  * supports a number, $name or %uuid.
249  */
250 int parse_devname(char *func, char *name)
251 {
252         int rc;
253         int ret = -1;
254         int try_digit;
255
256         if (!name)
257                 return ret;
258
259         try_digit = isdigit(name[0]);
260
261         if (name[0] == '$' || name[0] == '%')
262                 name++;
263
264         rc = do_name2dev(func, name);
265         if (rc >= N2D_OFF)
266                 return rc - N2D_OFF;
267
268         if (try_digit)
269                 ret = strtoul(name, NULL, 0);
270         else
271                 fprintf(stderr, "No device found for name %s: %s\n",
272                                 name, strerror(rc));
273         return ret;
274 }
275
276 char *jt_cmdname(char *func)
277 {
278         static char buf[512];
279
280         if (thread) {
281                 sprintf(buf, "%s-%d", func, thread);
282                 return buf;
283         }
284
285         return func;
286 }
287
288 #define difftime(a, b)                                  \
289         ((a)->tv_sec - (b)->tv_sec +                    \
290          ((a)->tv_usec - (b)->tv_usec) / 1000000.0)
291
292 static int be_verbose(int verbose, struct timeval *next_time,
293                       __u64 num, __u64 *next_num, int num_total)
294 {
295         struct timeval now;
296
297         if (!verbose)
298                 return 0;
299
300         if (next_time != NULL)
301                 gettimeofday(&now, NULL);
302
303         /* A positive verbosity means to print every X iterations */
304         if (verbose > 0 && (num >= *next_num || num >= num_total)) {
305                 *next_num += verbose;
306                 if (next_time) {
307                         next_time->tv_sec = now.tv_sec - verbose;
308                         next_time->tv_usec = now.tv_usec;
309                 }
310                 return 1;
311         }
312
313         /* A negative verbosity means to print at most each X seconds */
314         if (verbose < 0 && next_time != NULL &&
315             difftime(&now, next_time) >= 0.0){
316                 next_time->tv_sec = now.tv_sec - verbose;
317                 next_time->tv_usec = now.tv_usec;
318                 *next_num = num;
319                 return 1;
320         }
321
322         return 0;
323 }
324
325 static int get_verbose(char *func, const char *arg)
326 {
327         int verbose;
328         char *end;
329
330         if (!arg || arg[0] == 'v')
331                 verbose = 1;
332         else if (arg[0] == 's' || arg[0] == 'q')
333                 verbose = 0;
334         else {
335                 verbose = (int)strtoul(arg, &end, 0);
336                 if (*end) {
337                         fprintf(stderr, "error: %s: bad verbose option '%s'\n",
338                                 jt_cmdname(func), arg);
339                         return BAD_VERBOSE;
340                 }
341         }
342
343         if (verbose < 0)
344                 printf("Print status every %d seconds\n", -verbose);
345         else if (verbose == 1)
346                 printf("Print status every operation\n");
347         else if (verbose > 1)
348                 printf("Print status every %d operations\n", verbose);
349
350         return verbose;
351 }
352
353 int do_disconnect(char *func, int verbose)
354 {
355         lcfg_set_devname(NULL);
356         cur_device = -1;
357         return 0;
358 }
359
360 #ifdef MAX_THREADS
361 static int shmem_setup(void)
362 {
363         pthread_mutexattr_t mattr;
364         pthread_condattr_t  cattr;
365         int                 rc;
366         int                 shmid;
367
368         /* Create new segment */
369         shmid = shmget(IPC_PRIVATE, sizeof(*shared_data), 0600);
370         if (shmid == -1) {
371                 fprintf(stderr, "Can't create shared data: %s\n",
372                         strerror(errno));
373                 return errno;
374         }
375
376         /* Attatch to new segment */
377         shared_data = (struct shared_data *)shmat(shmid, NULL, 0);
378
379         if (shared_data == (struct shared_data *)(-1)) {
380                 fprintf(stderr, "Can't attach shared data: %s\n",
381                         strerror(errno));
382                 shared_data = NULL;
383                 return errno;
384         }
385
386         /* Mark segment as destroyed, so it will disappear when we exit.
387          * Forks will inherit attached segments, so we should be OK.
388          */
389         if (shmctl(shmid, IPC_RMID, NULL) == -1) {
390                 fprintf(stderr, "Can't destroy shared data: %s\n",
391                         strerror(errno));
392                 return errno;
393         }
394
395         pthread_mutexattr_init(&mattr);
396         pthread_condattr_init(&cattr);
397
398         rc = pthread_mutexattr_setpshared(&mattr, PTHREAD_PROCESS_SHARED);
399         if (rc != 0) {
400                 fprintf(stderr, "Can't set shared mutex attr\n");
401                 goto out;
402         }
403
404         rc = pthread_condattr_setpshared(&cattr, PTHREAD_PROCESS_SHARED);
405         if (rc != 0) {
406                 fprintf(stderr, "Can't set shared cond attr\n");
407                 goto out;
408         }
409
410         pthread_mutex_init(&shared_data->mutex, &mattr);
411         pthread_cond_init(&shared_data->cond, &cattr);
412 out:
413         pthread_mutexattr_destroy(&mattr);
414         pthread_condattr_destroy(&cattr);
415
416         return rc;
417 }
418
419 static inline void shmem_lock(void)
420 {
421         pthread_mutex_lock(&shared_data->mutex);
422 }
423
424 static inline void shmem_unlock(void)
425 {
426         pthread_mutex_unlock(&shared_data->mutex);
427 }
428
429 static inline void shmem_wait(void)
430 {
431         pthread_cond_wait(&shared_data->cond, &shared_data->mutex);
432 }
433
434 static inline void shmem_wakeup_all(void)
435 {
436         pthread_cond_broadcast(&shared_data->cond);
437 }
438
439 static inline void shmem_reset(int total_threads)
440 {
441         if (shared_data == NULL)
442                 return;
443
444         memset(&shared_data->body, 0, sizeof(shared_data->body));
445         memset(counter_snapshot, 0, sizeof(counter_snapshot));
446         prev_valid = 0;
447         shared_data->stopping = 0;
448         shared_data->body.start_barrier = total_threads;
449         shared_data->body.stop_barrier = total_threads;
450 }
451
452 static inline void shmem_bump(__u32 counter)
453 {
454         static bool running_not_bumped = true;
455
456         if (shared_data == NULL || thread <= 0 || thread > MAX_THREADS)
457                 return;
458
459         shmem_lock();
460         shared_data->body.counters[thread - 1] += counter;
461         if (running_not_bumped) {
462                 shared_data->body.thr_running++;
463                 running_not_bumped = false;
464         }
465         shmem_unlock();
466 }
467
468 static void shmem_total(int total_threads)
469 {
470         __u64 total = 0;
471         double secs;
472         int i;
473
474         if (shared_data == NULL || total_threads > MAX_THREADS)
475                 return;
476
477         shmem_lock();
478         for (i = 0; i < total_threads; i++)
479                 total += shared_data->body.counters[i];
480
481         secs = difftime(&shared_data->body.end_time,
482                         &shared_data->body.start_time);
483         shmem_unlock();
484
485         printf("Total: total %ju threads %d sec %f %f/second\n",
486                (uintmax_t)total, total_threads, secs, total / secs);
487
488         return;
489 }
490
491 static void shmem_snap(int total_threads, int live_threads)
492 {
493         struct timeval this_time;
494         int non_zero = 0;
495         __u64 total = 0;
496         double secs;
497         int running;
498         int i;
499
500         if (shared_data == NULL || total_threads > MAX_THREADS)
501                 return;
502
503         shmem_lock();
504         memcpy(counter_snapshot[0], shared_data->body.counters,
505                total_threads * sizeof(counter_snapshot[0][0]));
506         running = shared_data->body.thr_running;
507         shmem_unlock();
508
509         gettimeofday(&this_time, NULL);
510
511         for (i = 0; i < total_threads; i++) {
512                 long long this_count =
513                         counter_snapshot[0][i] - counter_snapshot[1][i];
514
515                 if (this_count != 0) {
516                         non_zero++;
517                         total += this_count;
518                 }
519         }
520
521         secs = difftime(&this_time, &prev_time);
522         if (prev_valid && secs > 1.0) {   /* someone screwed with the time? */
523                 printf("%d/%d Total: %f/second\n", non_zero, total_threads,
524                        total / secs);
525
526                 memcpy(counter_snapshot[1], counter_snapshot[0],
527                        total_threads * sizeof(counter_snapshot[0][0]));
528                 prev_time = this_time;
529         }
530         if (!prev_valid && running == total_threads) {
531                 prev_valid = 1;
532                 /* drop counters when all threads were started */
533                 memcpy(counter_snapshot[1], counter_snapshot[0],
534                        total_threads * sizeof(counter_snapshot[0][0]));
535                 prev_time = this_time;
536         }
537 }
538
539 static void shmem_stop(void)
540 {
541         if (shared_data == NULL)
542                 return;
543
544         shared_data->stopping = 1;
545 }
546
547 static void shmem_cleanup(void)
548 {
549         if (shared_data == NULL)
550                 return;
551
552         shmem_stop();
553
554         pthread_mutex_destroy(&shared_data->mutex);
555         pthread_cond_destroy(&shared_data->cond);
556 }
557
558 static int shmem_running(void)
559 {
560         return (shared_data == NULL || !shared_data->stopping);
561 }
562
563 static void shmem_end_time_locked(void)
564 {
565         shared_data->body.stop_barrier--;
566         if (shared_data->body.stop_barrier == 0)
567                 gettimeofday(&shared_data->body.end_time, NULL);
568 }
569
570 static void shmem_start_time_locked(void)
571 {
572         shared_data->body.start_barrier--;
573         if (shared_data->body.start_barrier == 0) {
574                 shmem_wakeup_all();
575                 gettimeofday(&shared_data->body.start_time, NULL);
576         } else {
577                 shmem_wait();
578         }
579 }
580
581 #else
582 static int shmem_setup(void)
583 {
584         return 0;
585 }
586
587 static inline void shmem_reset(int total_threads)
588 {
589 }
590
591 static inline void shmem_bump(__u32 counters)
592 {
593 }
594
595 static void shmem_lock()
596 {
597 }
598
599 static void shmem_unlock()
600 {
601 }
602
603 static void shmem_cleanup(void)
604 {
605 }
606
607 static int shmem_running(void)
608 {
609         return 1;
610 }
611 #endif
612
613 extern command_t cmdlist[];
614
615 static int do_device(char *func, char *devname)
616 {
617         int dev;
618
619         dev = parse_devname(func, devname);
620         if (dev < 0)
621                 return -1;
622
623         lcfg_set_devname(devname);
624         cur_device = dev;
625         return 0;
626 }
627
628 int jt_obd_get_device()
629 {
630         return cur_device;
631 }
632
633 int jt_obd_device(int argc, char **argv)
634 {
635         int rc;
636
637         if (argc > 2)
638                 return CMD_HELP;
639
640         if (argc == 1) {
641                 printf("current device is %d - %s\n",
642                        cur_device, lcfg_get_devname() ? : "not set");
643                 return 0;
644         }
645         rc = do_device("device", argv[1]);
646         return rc;
647 }
648
649 int jt_opt_device(int argc, char **argv)
650 {
651         int ret;
652         int rc;
653
654         if (argc < 3)
655                 return CMD_HELP;
656
657         rc = do_device("device", argv[1]);
658
659         if (!rc)
660                 rc = Parser_execarg(argc - 2, argv + 2, cmdlist);
661
662         ret = do_disconnect(argv[0], 0);
663         if (!rc)
664                 rc = ret;
665
666         return rc;
667 }
668
669 #ifdef MAX_THREADS
670 static void parent_sighandler (int sig)
671 {
672         return;
673 }
674
675 int jt_opt_threads(int argc, char **argv)
676 {
677         static char      cmdstr[129];
678         sigset_t         saveset;
679         sigset_t         sigset;
680         struct sigaction sigact;
681         struct sigaction saveact1;
682         struct sigaction saveact2;
683         unsigned long    threads;
684         __u64            next_thread;
685         int verbose;
686         int rc = 0;
687         int report_count = -1;
688         char *end;
689         int i;
690
691         if (argc < 5)
692                 return CMD_HELP;
693
694         threads = strtoul(argv[1], &end, 0);
695
696         if (*end == '.')
697                 report_count = strtoul(end + 1, &end, 0);
698
699         if (*end || threads > MAX_THREADS) {
700                 fprintf(stderr, "error: %s: invalid thread count '%s'\n",
701                         jt_cmdname(argv[0]), argv[1]);
702                 return CMD_HELP;
703         }
704
705         verbose = get_verbose(argv[0], argv[2]);
706         if (verbose == BAD_VERBOSE)
707                 return CMD_HELP;
708
709         if (verbose != 0) {
710                 snprintf(cmdstr, sizeof(cmdstr), "%s", argv[4]);
711                 for (i = 5; i < argc; i++)
712                         snprintf(cmdstr + strlen(cmdstr),
713                                  sizeof(cmdstr) - strlen(cmdstr),
714                                  " %s", argv[i]);
715
716                 printf("%s: starting %ld threads on device %s running %s\n",
717                        argv[0], threads, argv[3], cmdstr);
718         }
719
720         shmem_reset(threads);
721
722         sigemptyset(&sigset);
723         sigaddset(&sigset, SIGALRM);
724         sigaddset(&sigset, SIGCHLD);
725         sigprocmask(SIG_BLOCK, &sigset, &saveset);
726
727         nthreads = threads;
728
729         for (i = 1, next_thread = verbose; i <= threads; i++) {
730                 rc = fork();
731                 if (rc < 0) {
732                         fprintf(stderr, "error: %s: #%d - %s\n", argv[0], i,
733                                 strerror(rc = errno));
734                         break;
735                 } else if (rc == 0) {
736                         sigprocmask(SIG_SETMASK, &saveset, NULL);
737
738                         thread = i;
739                         argv[2] = "--device";
740                         exit(jt_opt_device(argc - 2, argv + 2));
741                 } else if (be_verbose(verbose, NULL, i, &next_thread, threads))
742                         printf("%s: thread #%d (PID %d) started\n",
743                                argv[0], i, rc);
744                 rc = 0;
745         }
746
747         if (!thread) {          /* parent process */
748                 int live_threads = threads;
749
750                 sigemptyset(&sigset);
751                 sigemptyset(&sigact.sa_mask);
752                 sigact.sa_handler = parent_sighandler;
753                 sigact.sa_flags = 0;
754
755                 sigaction(SIGALRM, &sigact, &saveact1);
756                 sigaction(SIGCHLD, &sigact, &saveact2);
757
758                 while (live_threads > 0) {
759                         int status;
760                         pid_t ret;
761
762                         if (verbose < 0)        /* periodic stats */
763                                 alarm(-verbose);
764
765                         sigsuspend(&sigset);
766                         alarm(0);
767
768                         while (live_threads > 0) {
769                                 ret = waitpid(0, &status, WNOHANG);
770                                 if (ret == 0)
771                                         break;
772
773                                 if (ret < 0) {
774                                         fprintf(stderr, "error: %s: wait - %s\n",
775                                                 argv[0], strerror(errno));
776                                         if (!rc)
777                                                 rc = errno;
778                                         continue;
779                                 } else {
780                                         /*
781                                          * This is a hack.  We _should_ be able
782                                          * to use WIFEXITED(status) to see if
783                                          * there was an error, but it appears
784                                          * to be broken and it always returns 1
785                                          * (OK).  See wait(2).
786                                          */
787                                         int err = WEXITSTATUS(status);
788                                         if (err || WIFSIGNALED(status))
789                                                 fprintf(stderr,
790                                                         "%s: PID %d had rc=%d\n",
791                                                         argv[0], ret, err);
792                                         if (!rc)
793                                                 rc = err;
794
795                                         live_threads--;
796                                 }
797                         }
798
799                         /* Show stats while all threads running */
800                         if (verbose < 0) {
801                                 shmem_snap(threads, live_threads);
802                                 if (report_count > 0 && --report_count == 0)
803                                         shmem_stop();
804                         }
805                 }
806                 sigaction(SIGCHLD, &saveact2, NULL);
807                 sigaction(SIGALRM, &saveact1, NULL);
808         }
809
810         shmem_total(threads);
811         sigprocmask(SIG_SETMASK, &saveset, NULL);
812
813         return rc;
814 }
815 #else
816 int jt_opt_threads(int argc, char **argv)
817 {
818         fprintf(stderr, "%s not-supported in a single-threaded runtime\n",
819                 jt_cmdname(argv[0]));
820         return CMD_HELP;
821 }
822 #endif
823
824 int jt_opt_net(int argc, char **argv)
825 {
826         char *arg2[3];
827         int rc;
828
829         if (argc < 3)
830                 return CMD_HELP;
831
832         arg2[0] = argv[0];
833         arg2[1] = argv[1];
834         arg2[2] = NULL;
835         rc = jt_ptl_network (2, arg2);
836
837         if (!rc)
838                 rc = Parser_execarg(argc - 2, argv + 2, cmdlist);
839
840         return rc;
841 }
842
843 int jt_obd_no_transno(int argc, char **argv)
844 {
845         struct obd_ioctl_data data;
846         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
847         int rc;
848
849         memset(&data, 0, sizeof(data));
850         data.ioc_dev = cur_device;
851
852         if (argc != 1)
853                 return CMD_HELP;
854
855         memset(buf, 0, sizeof(rawbuf));
856         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
857         if (rc) {
858                 fprintf(stderr, "error: %s: invalid ioctl\n",
859                         jt_cmdname(argv[0]));
860                 return rc;
861         }
862         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_NO_TRANSNO, buf);
863         if (rc < 0)
864                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
865                         strerror(rc = errno));
866
867         return rc;
868 }
869
870 int jt_obd_set_readonly(int argc, char **argv)
871 {
872         struct obd_ioctl_data data;
873         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
874         int rc;
875
876         memset(&data, 0, sizeof(data));
877         data.ioc_dev = cur_device;
878
879         if (argc != 1)
880                 return CMD_HELP;
881
882         memset(buf, 0, sizeof(rawbuf));
883         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
884         if (rc) {
885                 fprintf(stderr, "error: %s: invalid ioctl\n",
886                         jt_cmdname(argv[0]));
887                 return rc;
888         }
889         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_SET_READONLY, buf);
890         if (rc < 0)
891                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
892                         strerror(rc = errno));
893
894         return rc;
895 }
896
897 int jt_obd_abort_recovery(int argc, char **argv)
898 {
899         struct obd_ioctl_data data;
900         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
901         int rc;
902
903         memset(&data, 0, sizeof(data));
904         data.ioc_dev = cur_device;
905
906         if (argc != 1)
907                 return CMD_HELP;
908
909         memset(buf, 0, sizeof(rawbuf));
910         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
911         if (rc) {
912                 fprintf(stderr, "error: %s: invalid ioctl\n",
913                         jt_cmdname(argv[0]));
914                 return rc;
915         }
916         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_ABORT_RECOVERY, buf);
917         if (rc < 0)
918                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
919                         strerror(rc = errno));
920
921         return rc;
922 }
923
924 int jt_get_version(int argc, char **argv)
925 {
926         char version[128];
927         int rc;
928
929         if (argc != 1)
930                 return CMD_HELP;
931
932         rc = llapi_get_version_string(version, sizeof(version));
933         if (rc)
934                 printf("Lustre version: %s\n", LUSTRE_VERSION_STRING);
935         else
936                 printf("Lustre version: %s\n", version);
937
938         return 0;
939 }
940
941 static void print_obd_line(char *s)
942 {
943         const char *param = "osc/%s/ost_conn_uuid";
944         char buf[MAX_STRING_SIZE];
945         char obd_name[MAX_OBD_NAME];
946         FILE *fp = NULL;
947         glob_t path;
948         char *ptr;
949 retry:
950         /* obd device type is the first 3 characters of param name */
951         snprintf(buf, sizeof(buf), " %%*d %%*s %.3s %%%zus %%*s %%*d ",
952                  param, sizeof(obd_name) - 1);
953         if (sscanf(s, buf, obd_name) == 0)
954                 goto try_mdc;
955         if (cfs_get_param_paths(&path, param, obd_name) != 0)
956                 goto try_mdc;
957         fp = fopen(path.gl_pathv[0], "r");
958         if (fp == NULL) {
959                 /* need to free path data before retry */
960                 cfs_free_param_data(&path);
961 try_mdc:
962                 if (param[0] == 'o') { /* failed with osc, try mdc */
963                         param = "mdc/%s/mds_conn_uuid";
964                         goto retry;
965                 }
966                 buf[0] = '\0';
967                 goto fail_print;
968         }
969
970         /* should not ignore fgets(3)'s return value */
971         if (!fgets(buf, sizeof(buf), fp)) {
972                 fprintf(stderr, "reading from %s: %s", buf, strerror(errno));
973                 goto fail_close;
974         }
975
976 fail_close:
977         fclose(fp);
978         cfs_free_param_data(&path);
979
980         /* trim trailing newlines */
981         ptr = strrchr(buf, '\n');
982         if (ptr)
983                 *ptr = '\0';
984 fail_print:
985         ptr = strrchr(s, '\n');
986         if (ptr)
987                 *ptr = '\0';
988         printf("%s%s%s\n", s, buf[0] ? " " : "", buf);
989 }
990
991 /* get device list by ioctl */
992 int jt_obd_list_ioctl(int argc, char **argv)
993 {
994         int rc, index;
995         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
996         struct obd_ioctl_data *data = (struct obd_ioctl_data *)buf;
997
998         if (argc > 2)
999                 return CMD_HELP;
1000         /* Just ignore a -t option.  Only supported with /proc. */
1001         else if (argc == 2 && strcmp(argv[1], "-t") != 0)
1002                 return CMD_HELP;
1003
1004         for (index = 0;; index++) {
1005                 memset(buf, 0, sizeof(rawbuf));
1006                 data->ioc_version = OBD_IOCTL_VERSION;
1007                 data->ioc_inllen1 =
1008                         sizeof(rawbuf) - __ALIGN_KERNEL(sizeof(*data), 8);
1009                 data->ioc_inlbuf1 = buf + __ALIGN_KERNEL(sizeof(*data), 8);
1010                 data->ioc_len = obd_ioctl_packlen(data);
1011                 data->ioc_count = index;
1012
1013                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_GETDEVICE, buf);
1014                 if (rc != 0)
1015                         break;
1016                 printf("%s\n", (char *)data->ioc_bulk);
1017         }
1018         if (rc != 0) {
1019                 if (errno == ENOENT)
1020                         /* no device or the last device */
1021                         rc = 0;
1022                 else
1023                         fprintf(stderr,
1024                                 "Error getting device list: %s: check dmesg\n",
1025                                 strerror(errno));
1026         }
1027         return rc;
1028 }
1029
1030 int jt_obd_list(int argc, char **argv)
1031 {
1032         char buf[MAX_STRING_SIZE];
1033         int print_obd = 0;
1034         glob_t path;
1035         FILE *fp;
1036
1037         if (argc > 2)
1038                 return CMD_HELP;
1039
1040         if (argc == 2) {
1041                 if (strcmp(argv[1], "-t") == 0)
1042                         print_obd = 1;
1043                 else
1044                         return CMD_HELP;
1045         }
1046
1047         if (cfs_get_param_paths(&path, "devices") ||
1048             !(fp = fopen(path.gl_pathv[0], "r"))) {
1049                 cfs_free_param_data(&path);
1050
1051                 return jt_obd_list_ioctl(argc, argv);
1052         }
1053
1054         while (fgets(buf, sizeof(buf), fp) != NULL)
1055                 if (print_obd)
1056                         print_obd_line(buf);
1057                 else
1058                         printf("%s", buf);
1059
1060         cfs_free_param_data(&path);
1061         fclose(fp);
1062         return 0;
1063 }
1064
1065 struct jt_fid_space {
1066         __u64   jt_seq;
1067         __u64   jt_id;
1068         int     jt_width;
1069 };
1070
1071 int jt_obd_alloc_fids(struct jt_fid_space *space, struct lu_fid *fid,
1072                       __u64 *count)
1073 {
1074         int rc;
1075
1076         if (space->jt_seq == 0 || space->jt_id == space->jt_width) {
1077                 struct obd_ioctl_data  data;
1078                 char rawbuf[MAX_IOC_BUFLEN];
1079                 char *buf = rawbuf;
1080                 __u64 seqnr;
1081                 int max_count;
1082
1083                 memset(&data, 0, sizeof(data));
1084                 data.ioc_dev = cur_device;
1085
1086                 data.ioc_pbuf1 = (char *)&seqnr;
1087                 data.ioc_plen1 = sizeof(seqnr);
1088
1089                 data.ioc_pbuf2 = (char *)&max_count;
1090                 data.ioc_plen2 = sizeof(max_count);
1091
1092                 memset(buf, 0, sizeof(rawbuf));
1093                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1094                 if (rc) {
1095                         fprintf(stderr, "error: invalid ioctl rc = %d\n", rc);
1096                         return rc;
1097                 }
1098
1099                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_ECHO_ALLOC_SEQ, buf);
1100                 if (rc) {
1101                         fprintf(stderr, "ioctl error: rc = %d\n", rc);
1102                         return rc;
1103                 }
1104
1105                 space->jt_seq = *(__u64 *)data.ioc_pbuf1;
1106                 space->jt_width = *(int *)data.ioc_pbuf2;
1107                 space->jt_id = 1;
1108         }
1109         fid->f_seq = space->jt_seq;
1110         fid->f_oid = space->jt_id;
1111         fid->f_ver = 0;
1112
1113         space->jt_id = space->jt_id + *count;
1114         if (space->jt_id > space->jt_width)
1115                 space->jt_id = space->jt_width;
1116
1117         *count = space->jt_id - fid->f_oid;
1118         return 0;
1119 }
1120
1121 #define MD_STEP_COUNT 1000
1122 int jt_obd_md_common(int argc, char **argv, int cmd)
1123 {
1124         struct obd_ioctl_data  data;
1125         struct timeval         start;
1126         struct timeval         end_time;
1127         char                   rawbuf[MAX_IOC_BUFLEN];
1128         char                  *buf = rawbuf;
1129         int                    mode = 0000644;
1130         int                    create_mode;
1131         int                    rc = 0;
1132         char                  *parent_basedir = NULL;
1133         char                   dirname[4096];
1134         int                    parent_base_id = 0;
1135         int                    parent_count = 1;
1136         __u64                  child_base_id = -1;
1137         int                    stripe_count = 0;
1138         int                    stripe_index = -1;
1139         int                    count = 0;
1140         char                  *end;
1141         __u64                  seconds = 0;
1142         double                 diff;
1143         int                    c;
1144         __u64                  total_count = 0;
1145         char                  *name = NULL;
1146         struct jt_fid_space    fid_space = {0};
1147         int                    version = 0;
1148         struct option long_opts[] = {
1149         { .val = 'b',   .name = "child_base_id",
1150                                                 .has_arg = required_argument },
1151         { .val = 'c',   .name = "stripe_count",
1152                                                 .has_arg = required_argument },
1153         { .val = 'd',   .name = "parent_basedir",
1154                                                 .has_arg = required_argument },
1155         { .val = 'D',   .name = "parent_dircount",
1156                                                 .has_arg = required_argument },
1157         { .val = 'i',   .name = "stripe_index", .has_arg = required_argument },
1158         { .val = 'm',   .name = "mode",         .has_arg = required_argument },
1159         { .val = 'n',   .name = "count",        .has_arg = required_argument },
1160         { .val = 't',   .name = "time",         .has_arg = required_argument },
1161         { .val = 'v',   .name = "version",      .has_arg = no_argument },
1162         { .name = NULL } };
1163
1164         while ((c = getopt_long(argc, argv, "b:c:d:D:m:n:t:v",
1165                                 long_opts, NULL)) >= 0) {
1166                 switch (c) {
1167                 case 'b':
1168                         child_base_id = strtoull(optarg, &end, 0);
1169                         if (*end) {
1170                                 fprintf(stderr, "error: %s: bad child_base_id"
1171                                         " '%s'\n", jt_cmdname(argv[0]), optarg);
1172                                 return CMD_HELP;
1173                         }
1174                         break;
1175                 case 'c':
1176                         stripe_count = strtoul(optarg, &end, 0);
1177                         if (*end) {
1178                                 fprintf(stderr, "error: %s: bad stripe count"
1179                                         " '%s'\n", jt_cmdname(argv[0]), optarg);
1180                                 return CMD_HELP;
1181                         }
1182                         break;
1183                 case 'd':
1184                         parent_basedir = optarg;
1185                         break;
1186                 case 'D':
1187                         parent_count = strtoul(optarg, &end, 0);
1188                         if (*end) {
1189                                 fprintf(stderr, "error: %s: bad parent count"
1190                                         " '%s'\n", jt_cmdname(argv[0]), optarg);
1191                                 return CMD_HELP;
1192                         }
1193                         break;
1194                 case 'i':
1195                         stripe_index = strtoul(optarg, &end, 0);
1196                         if (*end) {
1197                                 fprintf(stderr, "error: %s: bad stripe index"
1198                                         " '%s'\n", jt_cmdname(argv[0]), optarg);
1199                                 return CMD_HELP;
1200                         }
1201                         break;
1202                 case 'm':
1203                         mode = strtoul(optarg, &end, 0);
1204                         if (*end) {
1205                                 fprintf(stderr, "error: %s: bad mode '%s'\n",
1206                                         jt_cmdname(argv[0]), optarg);
1207                                 return CMD_HELP;
1208                         }
1209                         break;
1210                 case 'n':
1211                         total_count = strtoul(optarg, &end, 0);
1212                         if (*end || total_count == 0) {
1213                                 fprintf(stderr, "%s: bad child count '%s'\n",
1214                                         jt_cmdname(argv[0]), optarg);
1215                                 return CMD_HELP;
1216                         }
1217                         break;
1218                 case 't':
1219                         seconds = strtoull(optarg, &end, 0);
1220                         if (*end) {
1221                                 fprintf(stderr, "error: %s: seconds '%s'\n",
1222                                         jt_cmdname(argv[0]), optarg);
1223                                 return CMD_HELP;
1224                         }
1225                         break;
1226                 case 'v':
1227                         version = 1;
1228                         break;
1229                 default:
1230                         fprintf(stderr, "error: %s: option '%s' "
1231                                 "unrecognized\n", argv[0], argv[optind - 1]);
1232                         return CMD_HELP;
1233                 }
1234         }
1235
1236         memset(&data, 0, sizeof(data));
1237         data.ioc_dev = cur_device;
1238         if (child_base_id == -1) {
1239                 if (optind >= argc)
1240                         return CMD_HELP;
1241                 name = argv[optind];
1242                 total_count = 1;
1243         } else {
1244                 if (optind < argc) {
1245                         fprintf(stderr, "child_base_id and name can not"
1246                                         " specified at the same time\n");
1247                         return CMD_HELP;
1248                 }
1249         }
1250
1251         if (stripe_count == 0 && stripe_index != -1) {
1252                 fprintf(stderr, "If stripe_count is 0, stripe_index can not"
1253                                 "be specified\n");
1254                 return CMD_HELP;
1255         }
1256
1257         if (total_count == 0 && seconds == 0) {
1258                 fprintf(stderr, "count or seconds needs to be indicated\n");
1259                 return CMD_HELP;
1260         }
1261
1262         if (parent_count <= 0) {
1263                 fprintf(stderr, "parent count must < 0\n");
1264                 return CMD_HELP;
1265         }
1266
1267 #ifdef MAX_THREADS
1268         if (thread) {
1269                 shmem_lock();
1270                 /* threads interleave */
1271                 if (parent_base_id != -1)
1272                         parent_base_id += (thread - 1) % parent_count;
1273
1274                 if (child_base_id != -1)
1275                         child_base_id +=  (thread - 1) * \
1276                                           (MAX_BASE_ID / nthreads);
1277
1278                 shmem_start_time_locked();
1279                 shmem_unlock();
1280         }
1281 #endif
1282         /* If parent directory is not specified, try to get the directory
1283          * from name */
1284         if (parent_basedir == NULL) {
1285                 char *last_lash;
1286                 if (name == NULL) {
1287                         fprintf(stderr, "parent_basedir or name must be"
1288                                         "indicated!\n");
1289                         return CMD_HELP;
1290                 }
1291                 /*Get directory and name from name*/
1292                 last_lash = strrchr(name, '/');
1293                 if (last_lash == NULL || name[0] != '/') {
1294                         fprintf(stderr, "Can not locate %s\n", name);
1295                         return CMD_HELP;
1296                 }
1297
1298                 if (last_lash == name) {
1299                         sprintf(dirname, "%s", "/");
1300                         name++;
1301                 } else {
1302                         int namelen = (unsigned long)last_lash -
1303                                       (unsigned long)name + 1;
1304                         snprintf(dirname, namelen, "%s", name);
1305                         name = last_lash + 1;
1306                 }
1307
1308                 data.ioc_pbuf1 = dirname;
1309                 data.ioc_plen1 = strlen(dirname);
1310
1311                 data.ioc_pbuf2 = name;
1312                 data.ioc_plen2 = strlen(name);
1313         } else {
1314                 if (name != NULL) {
1315                         data.ioc_pbuf2 = name;
1316                         data.ioc_plen2 = strlen(name);
1317                 }
1318                 if (parent_base_id > 0)
1319                         sprintf(dirname, "%s%d", parent_basedir,
1320                                 parent_base_id);
1321                 else
1322                         sprintf(dirname, "%s", parent_basedir);
1323                 data.ioc_pbuf1 = dirname;
1324                 data.ioc_plen1 = strlen(dirname);
1325         }
1326
1327         if (cmd == ECHO_MD_MKDIR || cmd == ECHO_MD_RMDIR)
1328                 create_mode = S_IFDIR;
1329         else
1330                 create_mode = S_IFREG;
1331
1332         data.ioc_obdo1.o_mode = mode | S_IFDIR;
1333         data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLMODE |
1334                                  OBD_MD_FLFLAGS | OBD_MD_FLGROUP;
1335         data.ioc_command = cmd;
1336
1337         gettimeofday(&start, NULL);
1338         while (shmem_running()) {
1339                 struct lu_fid fid = { 0 };
1340
1341                 if (child_base_id != -1)
1342                         data.ioc_obdo2.o_oi.oi.oi_id = child_base_id;
1343                 data.ioc_obdo2.o_mode = mode | create_mode;
1344                 data.ioc_obdo2.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE |
1345                                          OBD_MD_FLMODE | OBD_MD_FLFLAGS |
1346                                          OBD_MD_FLGROUP;
1347                 data.ioc_obdo2.o_misc = stripe_count;
1348                 data.ioc_obdo2.o_stripe_idx = stripe_index;
1349
1350                 if (total_count > 0) {
1351                         if ((total_count - count) > MD_STEP_COUNT)
1352                                 data.ioc_count = MD_STEP_COUNT;
1353                         else
1354                                 data.ioc_count = total_count - count;
1355                 } else {
1356                         data.ioc_count = MD_STEP_COUNT;
1357                 }
1358
1359                 if (cmd == ECHO_MD_CREATE || cmd == ECHO_MD_MKDIR) {
1360                         /*Allocate fids for the create */
1361                         rc = jt_obd_alloc_fids(&fid_space, &fid,
1362                                                &data.ioc_count);
1363                         if (rc) {
1364                                 fprintf(stderr, "Allocate fids error %d.\n",rc);
1365                                 return rc;
1366                         }
1367                         data.ioc_obdo1.o_oi.oi_fid = fid;
1368                 }
1369
1370                 child_base_id += data.ioc_count;
1371                 count += data.ioc_count;
1372
1373                 memset(buf, 0, sizeof(rawbuf));
1374                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1375                 if (rc) {
1376                         fprintf(stderr, "error: %s: invalid ioctl %d\n",
1377                                 jt_cmdname(argv[0]), rc);
1378                         return rc;
1379                 }
1380
1381                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_ECHO_MD, buf);
1382                 if (rc) {
1383                         fprintf(stderr, "error: %s: %s\n",
1384                                 jt_cmdname(argv[0]), strerror(rc = errno));
1385                         return rc;
1386                 }
1387                 shmem_bump(data.ioc_count);
1388
1389                 gettimeofday(&end_time, NULL);
1390                 diff = difftime(&end_time, &start);
1391                 if (seconds > 0 && (__u64)diff > seconds)
1392                         break;
1393
1394                 if (count >= total_count && total_count > 0)
1395                         break;
1396         }
1397
1398         if (count > 0 && version) {
1399                 gettimeofday(&end_time, NULL);
1400                 diff = difftime(&end_time, &start);
1401                 printf("%s: %d in %.3fs (%.3f /s): %s",
1402                         jt_cmdname(argv[0]), count, diff,
1403                         (double)count/diff, ctime(&end_time.tv_sec));
1404         }
1405
1406 #ifdef MAX_THREADS
1407         if (thread) {
1408                 shmem_lock();
1409                 shmem_end_time_locked();
1410                 shmem_unlock();
1411         }
1412 #endif
1413         return rc;
1414 }
1415
1416 int jt_obd_test_create(int argc, char **argv)
1417 {
1418         return jt_obd_md_common(argc, argv, ECHO_MD_CREATE);
1419 }
1420
1421 int jt_obd_test_mkdir(int argc, char **argv)
1422 {
1423         return jt_obd_md_common(argc, argv, ECHO_MD_MKDIR);
1424 }
1425
1426 int jt_obd_test_destroy(int argc, char **argv)
1427 {
1428         return jt_obd_md_common(argc, argv, ECHO_MD_DESTROY);
1429 }
1430
1431 int jt_obd_test_rmdir(int argc, char **argv)
1432 {
1433         return jt_obd_md_common(argc, argv, ECHO_MD_RMDIR);
1434 }
1435
1436 int jt_obd_test_lookup(int argc, char **argv)
1437 {
1438         return jt_obd_md_common(argc, argv, ECHO_MD_LOOKUP);
1439 }
1440
1441 int jt_obd_test_setxattr(int argc, char **argv)
1442 {
1443         return jt_obd_md_common(argc, argv, ECHO_MD_SETATTR);
1444 }
1445
1446 int jt_obd_test_md_getattr(int argc, char **argv)
1447 {
1448         return jt_obd_md_common(argc, argv, ECHO_MD_GETATTR);
1449 }
1450
1451 int jt_obd_create(int argc, char **argv)
1452 {
1453         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1454         struct obd_ioctl_data data;
1455         struct timeval next_time;
1456         __u64 count = 1, next_count, base_id = 1;
1457         int verbose = 1, mode = 0100644, rc = 0, i;
1458         char *end;
1459
1460         memset(&data, 0, sizeof(data));
1461         data.ioc_dev = cur_device;
1462         if (argc < 2 || argc > 4)
1463                 return CMD_HELP;
1464
1465         count = strtoull(argv[1], &end, 0);
1466         if (*end) {
1467                 fprintf(stderr, "error: %s: invalid iteration count '%s'\n",
1468                         jt_cmdname(argv[0]), argv[1]);
1469                 return CMD_HELP;
1470         }
1471
1472         if (argc > 2) {
1473                 mode = strtoul(argv[2], &end, 0);
1474                 if (*end) {
1475                         fprintf(stderr, "error: %s: invalid mode '%s'\n",
1476                                 jt_cmdname(argv[0]), argv[2]);
1477                         return CMD_HELP;
1478                 }
1479                 if (!(mode & S_IFMT))
1480                         mode |= S_IFREG;
1481         }
1482
1483         if (argc > 3) {
1484                 verbose = get_verbose(argv[0], argv[3]);
1485                 if (verbose == BAD_VERBOSE)
1486                         return CMD_HELP;
1487         }
1488
1489         printf("%s: %jd objects\n", jt_cmdname(argv[0]), (uintmax_t)count);
1490         gettimeofday(&next_time, NULL);
1491         next_time.tv_sec -= verbose;
1492
1493         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1494         for (i = 1, next_count = verbose; i <= count && shmem_running(); i++) {
1495                 /*
1496                  * base_id is 1 so we don't need to worry about it being
1497                  * greater than OBIF_MAX_OID
1498                  */
1499                 data.ioc_obdo1.o_oi.oi_fid.f_oid = base_id;
1500                 data.ioc_obdo1.o_mode = mode;
1501                 data.ioc_obdo1.o_uid = 0;
1502                 data.ioc_obdo1.o_gid = 0;
1503                 data.ioc_obdo1.o_projid = 0;
1504                 data.ioc_obdo1.o_valid = OBD_MD_FLTYPE | OBD_MD_FLMODE |
1505                                          OBD_MD_FLID | OBD_MD_FLUID |
1506                                          OBD_MD_FLGID | OBD_MD_FLGROUP |
1507                                          OBD_MD_FLPROJID;
1508
1509                 memset(buf, 0, sizeof(rawbuf));
1510                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1511                 if (rc) {
1512                         fprintf(stderr, "error: %s: invalid ioctl\n",
1513                                 jt_cmdname(argv[0]));
1514                         return rc;
1515                 }
1516                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_CREATE, buf);
1517                 llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
1518                 shmem_bump(1);
1519                 if (rc < 0) {
1520                         fprintf(stderr, "error: %s: #%d - %s\n",
1521                                 jt_cmdname(argv[0]), i, strerror(rc = errno));
1522                         break;
1523                 }
1524                 if (!(data.ioc_obdo1.o_valid & OBD_MD_FLID)) {
1525                         fprintf(stderr, "error: %s: oid not valid #%d:%#jx\n",
1526                                 jt_cmdname(argv[0]), i,
1527                                 (uintmax_t)data.ioc_obdo1.o_valid);
1528                         rc = EINVAL;
1529                         break;
1530                 }
1531
1532                 if (be_verbose(verbose, &next_time, i, &next_count, count))
1533                         printf("%s: #%d is object id %#jx\n",
1534                                jt_cmdname(argv[0]), i,
1535                                (uintmax_t) ostid_id(&data.ioc_obdo1.o_oi));
1536         }
1537
1538         return rc;
1539 }
1540
1541 int jt_obd_setattr(int argc, char **argv)
1542 {
1543         struct obd_ioctl_data data;
1544         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1545         __u64 objid;
1546         char *end;
1547         int mode;
1548         int rc;
1549
1550         memset(&data, 0, sizeof(data));
1551         data.ioc_dev = cur_device;
1552         if (argc != 2)
1553                 return CMD_HELP;
1554
1555         objid = strtoull(argv[1], &end, 0);
1556         if (*end) {
1557                 fprintf(stderr, "error: %s: objid '%s' is not a number\n",
1558                         jt_cmdname(argv[0]), argv[1]);
1559                 return CMD_HELP;
1560         }
1561
1562         if (objid >= OBIF_MAX_OID) {
1563                 fprintf(stderr, "error: %s: invalid objid '%s'\n",
1564                         jt_cmdname(argv[0]), argv[1]);
1565                 return CMD_HELP;
1566         }
1567
1568         mode = strtoul(argv[2], &end, 0);
1569         if (*end) {
1570                 fprintf(stderr, "error: %s: invalid mode '%s'\n",
1571                         jt_cmdname(argv[0]), argv[2]);
1572                 return CMD_HELP;
1573         }
1574
1575         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1576         data.ioc_obdo1.o_mode = S_IFREG | mode;
1577         data.ioc_obdo1.o_oi.oi_fid.f_oid = objid;
1578         data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLMODE;
1579
1580         memset(buf, 0, sizeof(rawbuf));
1581         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1582         if (rc) {
1583                 fprintf(stderr, "error: %s: invalid ioctl\n",
1584                         jt_cmdname(argv[0]));
1585                 return rc;
1586         }
1587         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_SETATTR, buf);
1588         if (rc < 0)
1589                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
1590                         strerror(rc = errno));
1591
1592         return rc;
1593 }
1594
1595 int jt_obd_test_setattr(int argc, char **argv)
1596 {
1597         struct obd_ioctl_data data;
1598         struct timeval start, next_time;
1599         __u64 i, count, next_count;
1600         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1601         int verbose = 1;
1602         __u64 objid = 3;
1603         char *end;
1604         int rc = 0;
1605
1606         if (argc < 2 || argc > 4)
1607                 return CMD_HELP;
1608
1609         memset(&data, 0, sizeof(data));
1610         data.ioc_dev = cur_device;
1611         count = strtoull(argv[1], &end, 0);
1612         if (*end) {
1613                 fprintf(stderr, "error: %s: invalid iteration count '%s'\n",
1614                         jt_cmdname(argv[0]), argv[1]);
1615                 return CMD_HELP;
1616         }
1617
1618         if (argc >= 3) {
1619                 verbose = get_verbose(argv[0], argv[2]);
1620                 if (verbose == BAD_VERBOSE)
1621                         return CMD_HELP;
1622         }
1623
1624         if (argc >= 4) {
1625                 if (argv[3][0] == 't') {
1626                         objid = strtoull(argv[3] + 1, &end, 0);
1627                         if (thread)
1628                                 objid += thread - 1;
1629                 } else
1630                         objid = strtoull(argv[3], &end, 0);
1631                 if (*end) {
1632                         fprintf(stderr, "error: %s: invalid objid '%s'\n",
1633                                 jt_cmdname(argv[0]), argv[3]);
1634                         return CMD_HELP;
1635                 }
1636         }
1637
1638         gettimeofday(&start, NULL);
1639         next_time.tv_sec = start.tv_sec - verbose;
1640         next_time.tv_usec = start.tv_usec;
1641         if (verbose != 0)
1642                 printf("%s: setting %jd attrs (objid %#jx): %s",
1643                        jt_cmdname(argv[0]), (uintmax_t)count,
1644                        (uintmax_t)objid, ctime(&start.tv_sec));
1645
1646         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1647         for (i = 1, next_count = verbose; i <= count && shmem_running(); i++) {
1648                 if (objid >= OBIF_MAX_OID) {
1649                         fprintf(stderr, "errr: %s: invalid objid '%llu'\n",
1650                                 jt_cmdname(argv[0]), (unsigned long long)objid);
1651                         return -E2BIG;
1652                 }
1653
1654                 data.ioc_obdo1.o_oi.oi_fid.f_oid = objid;
1655                 data.ioc_obdo1.o_mode = S_IFREG;
1656                 data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE |
1657                                          OBD_MD_FLMODE;
1658                 memset(buf, 0, sizeof(rawbuf));
1659                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1660                 if (rc) {
1661                         fprintf(stderr, "error: %s: invalid ioctl\n",
1662                                 jt_cmdname(argv[0]));
1663                         return rc;
1664                 }
1665                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_SETATTR, &data);
1666                 shmem_bump(1);
1667                 if (rc < 0) {
1668                         fprintf(stderr, "error: %s: #%jd - %d:%s\n",
1669                                 jt_cmdname(argv[0]), (uintmax_t)i,
1670                                 errno, strerror(rc = errno));
1671                         break;
1672                 }
1673                 if (be_verbose(verbose, &next_time, i, &next_count, count))
1674                         printf("%s: set attr #%jd\n",
1675                                jt_cmdname(argv[0]), (uintmax_t)i);
1676         }
1677
1678         if (!rc) {
1679                 struct timeval end;
1680                 double diff;
1681
1682                 gettimeofday(&end, NULL);
1683
1684                 diff = difftime(&end, &start);
1685
1686                 --i;
1687                 if (verbose != 0)
1688                         printf("%s: %jd attrs in %.3fs (%.3f attr/s): %s",
1689                                jt_cmdname(argv[0]), (uintmax_t)i, diff,
1690                                i / diff, ctime(&end.tv_sec));
1691         }
1692         return rc;
1693 }
1694
1695 int jt_obd_destroy(int argc, char **argv)
1696 {
1697         struct obd_ioctl_data data;
1698         struct timeval next_time;
1699         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1700         __u64 count = 1, next_count;
1701         int verbose = 1;
1702         __u64 id;
1703         char *end;
1704         int rc = 0, i;
1705
1706         memset(&data, 0, sizeof(data));
1707         data.ioc_dev = cur_device;
1708         if (argc < 2 || argc > 4)
1709                 return CMD_HELP;
1710
1711         errno = 0;
1712         id = strtoull(argv[1], &end, 0);
1713         if (*end || id == 0 || errno != 0) {
1714                 fprintf(stderr, "error: %s: invalid objid '%s'\n",
1715                         jt_cmdname(argv[0]), argv[1]);
1716                 return CMD_HELP;
1717         }
1718         if (argc > 2) {
1719                 count = strtoull(argv[2], &end, 0);
1720                 if (*end) {
1721                         fprintf(stderr,
1722                                 "error: %s: invalid iteration count '%s'\n",
1723                                 jt_cmdname(argv[0]), argv[2]);
1724                         return CMD_HELP;
1725                 }
1726         }
1727
1728         if (argc > 3) {
1729                 verbose = get_verbose(argv[0], argv[3]);
1730                 if (verbose == BAD_VERBOSE)
1731                         return CMD_HELP;
1732         }
1733
1734         printf("%s: %jd objects\n", jt_cmdname(argv[0]), (uintmax_t)count);
1735         gettimeofday(&next_time, NULL);
1736         next_time.tv_sec -= verbose;
1737
1738         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1739         for (i = 1, next_count = verbose; i <= count && shmem_running();
1740              i++, id++) {
1741                 if (id >= OBIF_MAX_OID) {
1742                         fprintf(stderr, "errr: %s: invalid objid '%llu'\n",
1743                                 jt_cmdname(argv[0]), (unsigned long long)id);
1744                         return -E2BIG;
1745                 }
1746
1747                 data.ioc_obdo1.o_oi.oi_fid.f_oid = id;
1748                 data.ioc_obdo1.o_mode = S_IFREG | 0644;
1749                 data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLMODE;
1750
1751                 memset(buf, 0, sizeof(rawbuf));
1752                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1753                 if (rc) {
1754                         fprintf(stderr, "error: %s: invalid ioctl\n",
1755                                 jt_cmdname(argv[0]));
1756                         return rc;
1757                 }
1758                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_DESTROY, buf);
1759                 llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
1760                 shmem_bump(1);
1761                 if (rc < 0) {
1762                         fprintf(stderr, "error: %s: objid %#jx: %s\n",
1763                                 jt_cmdname(argv[0]), (uintmax_t)id,
1764                                 strerror(rc = errno));
1765                         break;
1766                 }
1767
1768                 if (be_verbose(verbose, &next_time, i, &next_count, count))
1769                         printf("%s: #%d is object id %#jx\n",
1770                                jt_cmdname(argv[0]), i, (uintmax_t)id);
1771         }
1772
1773         return rc;
1774 }
1775
1776 int jt_obd_getattr(int argc, char **argv)
1777 {
1778         struct obd_ioctl_data data;
1779         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1780         __u64 objid;
1781         char *end;
1782         int rc;
1783
1784         if (argc != 2)
1785                 return CMD_HELP;
1786
1787         objid = strtoull(argv[1], &end, 0);
1788         if (*end) {
1789                 fprintf(stderr, "error: %s: objid '%s' is not a number\n",
1790                         jt_cmdname(argv[0]), argv[1]);
1791                 return CMD_HELP;
1792         }
1793
1794         if (objid >= OBIF_MAX_OID) {
1795                 fprintf(stderr, "error: %s: invalid objid '%s'\n",
1796                         jt_cmdname(argv[0]), argv[1]);
1797                 return CMD_HELP;
1798         }
1799
1800         memset(&data, 0, sizeof(data));
1801         data.ioc_dev = cur_device;
1802         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1803         data.ioc_obdo1.o_oi.oi_fid.f_oid = objid;
1804         /* to help obd filter */
1805         data.ioc_obdo1.o_mode = 0100644;
1806         data.ioc_obdo1.o_valid = 0xffffffff;
1807         printf("%s: object id %#jx\n", jt_cmdname(argv[0]),
1808                (uintmax_t)ostid_id(&data.ioc_obdo1.o_oi));
1809
1810         memset(buf, 0, sizeof(rawbuf));
1811         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1812         if (rc) {
1813                 fprintf(stderr, "error: %s: invalid ioctl\n",
1814                         jt_cmdname(argv[0]));
1815                 return rc;
1816         }
1817         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_GETATTR, buf);
1818         llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
1819         if (rc) {
1820                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
1821                         strerror(rc = errno));
1822         } else {
1823                 printf("%s: object id %ju, mode %o\n", jt_cmdname(argv[0]),
1824                        (uintmax_t)ostid_id(&data.ioc_obdo1.o_oi),
1825                        data.ioc_obdo1.o_mode);
1826         }
1827         return rc;
1828 }
1829
1830 int jt_obd_test_getattr(int argc, char **argv)
1831 {
1832         struct obd_ioctl_data data;
1833         struct timeval start, next_time;
1834         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1835         __u64 i, count, next_count;
1836         int verbose = 1;
1837         __u64 objid = 3;
1838         char *end;
1839         int rc = 0;
1840
1841         if (argc < 2 || argc > 4)
1842                 return CMD_HELP;
1843
1844         memset(&data, 0, sizeof(data));
1845         data.ioc_dev = cur_device;
1846         count = strtoull(argv[1], &end, 0);
1847         if (*end) {
1848                 fprintf(stderr, "error: %s: invalid iteration count '%s'\n",
1849                         jt_cmdname(argv[0]), argv[1]);
1850                 return CMD_HELP;
1851         }
1852
1853         if (argc >= 3) {
1854                 verbose = get_verbose(argv[0], argv[2]);
1855                 if (verbose == BAD_VERBOSE)
1856                         return CMD_HELP;
1857         }
1858
1859         if (argc >= 4) {
1860                 if (argv[3][0] == 't') {
1861                         objid = strtoull(argv[3] + 1, &end, 0);
1862                         if (thread)
1863                                 objid += thread - 1;
1864                 } else
1865                         objid = strtoull(argv[3], &end, 0);
1866                 if (*end) {
1867                         fprintf(stderr, "error: %s: invalid objid '%s'\n",
1868                                 jt_cmdname(argv[0]), argv[3]);
1869                         return CMD_HELP;
1870                 }
1871         }
1872
1873         gettimeofday(&start, NULL);
1874         next_time.tv_sec = start.tv_sec - verbose;
1875         next_time.tv_usec = start.tv_usec;
1876         if (verbose != 0)
1877                 printf("%s: getting %jd attrs (objid %#jx): %s",
1878                        jt_cmdname(argv[0]), (uintmax_t)count,
1879                        (uintmax_t)objid, ctime(&start.tv_sec));
1880
1881         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
1882         for (i = 1, next_count = verbose; i <= count && shmem_running(); i++) {
1883                 if (objid >= OBIF_MAX_OID) {
1884                         fprintf(stderr, "errr: %s: invalid objid '%llu'\n",
1885                                 jt_cmdname(argv[0]), (unsigned long long)objid);
1886                         return -E2BIG;
1887                 }
1888
1889                 data.ioc_obdo1.o_oi.oi_fid.f_oid = objid;
1890                 data.ioc_obdo1.o_mode = S_IFREG;
1891                 data.ioc_obdo1.o_valid = 0xffffffff;
1892                 memset(buf, 0, sizeof(rawbuf));
1893                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
1894                 if (rc) {
1895                         fprintf(stderr, "error: %s: invalid ioctl\n",
1896                                 jt_cmdname(argv[0]));
1897                         return rc;
1898                 }
1899                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_GETATTR, &data);
1900                 shmem_bump(1);
1901                 if (rc < 0) {
1902                         fprintf(stderr, "error: %s: #%jd - %d:%s\n",
1903                                 jt_cmdname(argv[0]), (uintmax_t)i,
1904                                 errno, strerror(rc = errno));
1905                         break;
1906                 }
1907                 if (be_verbose(verbose, &next_time, i, &next_count, count))
1908                         printf("%s: got attr #%jd\n",
1909                                jt_cmdname(argv[0]), (uintmax_t)i);
1910         }
1911
1912         if (!rc) {
1913                 struct timeval end;
1914                 double diff;
1915
1916                 gettimeofday(&end, NULL);
1917
1918                 diff = difftime(&end, &start);
1919
1920                 --i;
1921                 if (verbose != 0)
1922                         printf("%s: %jd attrs in %.3fs (%.3f attr/s): %s",
1923                                jt_cmdname(argv[0]), (uintmax_t)i, diff,
1924                                i / diff, ctime(&end.tv_sec));
1925         }
1926
1927         return rc;
1928 }
1929
1930 /* test_brw <cnt>                                               count
1931         <r|w[r(repeat)x(noverify)]>                             mode
1932         <q|v|#(print interval)>                                 verbosity
1933         <npages[+offset]>                                       blocksize
1934         <[[<interleave_threads>]t(inc obj by thread#)]obj>      object
1935         [p|g<args>]                                             batch */
1936 int jt_obd_test_brw(int argc, char **argv)
1937 {
1938         struct obd_ioctl_data data;
1939         struct timeval start, next_time;
1940         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
1941         __u64 count, next_count, len, stride, thr_offset = 0, objid = 3;
1942         int write = 0, verbose = 1, cmd, i, rc = 0, pages = 1;
1943         int offset_pages = 0;
1944         long n;
1945         int repeat_offset = 0;
1946         unsigned long long ull;
1947         int  nthr_per_obj = 0;
1948         int  verify = 1;
1949         int  obj_idx = 0;
1950         char *end;
1951
1952         if (argc < 2 || argc > 7) {
1953                 fprintf(stderr, "error: %s: bad number of arguments: %d\n",
1954                         jt_cmdname(argv[0]), argc);
1955                 return CMD_HELP;
1956         }
1957
1958         count = strtoull(argv[1], &end, 0);
1959         if (*end) {
1960                 fprintf(stderr, "error: %s: bad iteration count '%s'\n",
1961                         jt_cmdname(argv[0]), argv[1]);
1962                 return CMD_HELP;
1963         }
1964
1965         if (argc >= 3) {
1966                 if (argv[2][0] == 'w' || argv[2][0] == '1')
1967                         write = 1;
1968                 /* else it's a read */
1969
1970                 if (argv[2][0] != 0)
1971                         for (i = 1; argv[2][i] != 0; i++)
1972                                 switch (argv[2][i]) {
1973                                 case 'r':
1974                                         repeat_offset = 1;
1975                                         break;
1976
1977                                 case 'x':
1978                                         verify = 0;
1979                                         break;
1980
1981                                 default:
1982                                         fprintf (stderr, "Can't parse cmd '%s'\n",
1983                                                  argv[2]);
1984                                         return CMD_HELP;
1985                                 }
1986         }
1987
1988         if (argc >= 4) {
1989                 verbose = get_verbose(argv[0], argv[3]);
1990                 if (verbose == BAD_VERBOSE)
1991                         return CMD_HELP;
1992         }
1993
1994         if (argc >= 5) {
1995                 pages = strtoul(argv[4], &end, 0);
1996
1997                 if (*end == '+')
1998                         offset_pages = strtoul(end + 1, &end, 0);
1999
2000                 if (*end != 0 ||
2001                     offset_pages < 0 || offset_pages >= pages) {
2002                         fprintf(stderr, "error: %s: bad npages[+offset] parameter '%s'\n",
2003                                 jt_cmdname(argv[0]), argv[4]);
2004                         return CMD_HELP;
2005                 }
2006         }
2007
2008         if (argc >= 6) {
2009                 if (thread &&
2010                     (n = strtol(argv[5], &end, 0)) > 0 &&
2011                     *end == 't' &&
2012                     (ull = strtoull(end + 1, &end, 0)) > 0 &&
2013                     *end == 0) {
2014                         nthr_per_obj = n;
2015                         objid = ull;
2016                 } else if (thread &&
2017                            argv[5][0] == 't') {
2018                         nthr_per_obj = 1;
2019                         objid = strtoull(argv[5] + 1, &end, 0);
2020                 } else {
2021                         nthr_per_obj = 0;
2022                         objid = strtoull(argv[5], &end, 0);
2023                 }
2024                 if (*end) {
2025                         fprintf(stderr, "error: %s: bad objid '%s'\n",
2026                                 jt_cmdname(argv[0]), argv[5]);
2027                         return CMD_HELP;
2028                 }
2029         }
2030
2031         memset(&data, 0, sizeof(data));
2032         data.ioc_dev = cur_device;
2033
2034         /* communicate the 'type' of brw test and batching to echo_client.
2035          * don't start.  we'd love to refactor this lctl->echo_client
2036          * interface */
2037         data.ioc_pbuf1 = (void *)1;
2038         data.ioc_plen1 = 1;
2039
2040         if (argc >= 7) {
2041                 switch(argv[6][0]) {
2042                         case 'g': /* plug and unplug */
2043                                 data.ioc_pbuf1 = (void *)2;
2044                                 data.ioc_plen1 = strtoull(argv[6] + 1, &end,
2045                                                           0);
2046                                 break;
2047                         case 'p': /* prep and commit */
2048                                 data.ioc_pbuf1 = (void *)3;
2049                                 data.ioc_plen1 = strtoull(argv[6] + 1, &end,
2050                                                           0);
2051                                 break;
2052                         default:
2053                                 fprintf(stderr, "error: %s: batching '%s' "
2054                                         "needs to specify 'p' or 'g'\n",
2055                                         jt_cmdname(argv[0]), argv[6]);
2056                                 return CMD_HELP;
2057                 }
2058
2059                 if (*end) {
2060                         fprintf(stderr, "error: %s: bad batching '%s'\n",
2061                                 jt_cmdname(argv[0]), argv[6]);
2062                         return CMD_HELP;
2063                 }
2064                 data.ioc_plen1 *= getpagesize();
2065         }
2066
2067         len = pages * getpagesize();
2068         thr_offset = offset_pages * getpagesize();
2069         stride = len;
2070
2071 #ifdef MAX_THREADS
2072         if (thread) {
2073                 shmem_lock ();
2074                 if (nthr_per_obj != 0) {
2075                         /* threads interleave */
2076                         obj_idx = (thread - 1)/nthr_per_obj;
2077                         objid += obj_idx;
2078                         stride *= nthr_per_obj;
2079                         if ((thread - 1) % nthr_per_obj == 0) {
2080                                 shared_data->body.offsets[obj_idx] =
2081                                         stride + thr_offset;
2082                         }
2083                         thr_offset += ((thread - 1) % nthr_per_obj) * len;
2084                 } else {
2085                         /* threads disjoint */
2086                         thr_offset += (thread - 1) * len;
2087                 }
2088
2089                 shmem_start_time_locked();
2090                 shmem_unlock ();
2091         }
2092 #endif
2093
2094         ostid_set_seq_echo(&data.ioc_obdo1.o_oi);
2095         if (objid >= OBIF_MAX_OID) {
2096                 fprintf(stderr, "errr: %s: invalid objid '%llu'\n",
2097                         jt_cmdname(argv[0]), (unsigned long long)objid);
2098                 return -E2BIG;
2099         }
2100
2101         data.ioc_obdo1.o_oi.oi_fid.f_oid = objid;
2102         data.ioc_obdo1.o_mode = S_IFREG;
2103         data.ioc_obdo1.o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLMODE |
2104                                  OBD_MD_FLFLAGS | OBD_MD_FLGROUP;
2105         data.ioc_obdo1.o_flags = (verify ? OBD_FL_DEBUG_CHECK : 0);
2106         data.ioc_count = len;
2107         data.ioc_offset = (repeat_offset ? 0 : thr_offset);
2108
2109         gettimeofday(&start, NULL);
2110         next_time.tv_sec = start.tv_sec - verbose;
2111         next_time.tv_usec = start.tv_usec;
2112
2113         if (verbose != 0)
2114                 printf("%s: %s %jux%d pages (obj %#jx, off %ju): %s",
2115                        jt_cmdname(argv[0]), write ? "writing" : "reading",
2116                        (uintmax_t)count, pages, (uintmax_t) objid,
2117                        (uintmax_t)data.ioc_offset, ctime(&start.tv_sec));
2118
2119         cmd = write ? OBD_IOC_BRW_WRITE : OBD_IOC_BRW_READ;
2120         for (i = 1, next_count = verbose; i <= count && shmem_running(); i++) {
2121                 data.ioc_obdo1.o_valid &= ~(OBD_MD_FLBLOCKS|OBD_MD_FLGRANT);
2122                 memset(buf, 0, sizeof(rawbuf));
2123                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2124                 if (rc) {
2125                         fprintf(stderr, "error: %s: invalid ioctl\n",
2126                                 jt_cmdname(argv[0]));
2127                         return rc;
2128                 }
2129                 rc = l_ioctl(OBD_DEV_ID, cmd, buf);
2130                 shmem_bump(1);
2131                 if (rc) {
2132                         fprintf(stderr, "error: %s: #%d - %s on %s\n",
2133                                 jt_cmdname(argv[0]), i, strerror(rc = errno),
2134                                 write ? "write" : "read");
2135                         break;
2136                 } else if (be_verbose(verbose, &next_time, i,
2137                                       &next_count, count)) {
2138                         shmem_lock ();
2139                         printf("%s: %s number %d @ %jd:%ju for %d\n",
2140                                jt_cmdname(argv[0]), write ? "write" : "read", i,
2141                                (uintmax_t)ostid_id(&data.ioc_obdo1.o_oi),
2142                                (uintmax_t)data.ioc_offset,
2143                                (int)(pages * getpagesize()));
2144                         shmem_unlock ();
2145                 }
2146
2147                 if (!repeat_offset) {
2148 #ifdef MAX_THREADS
2149                         if (stride == len) {
2150                                 data.ioc_offset += stride;
2151                         } else if (i < count) {
2152                                 shmem_lock ();
2153                                 data.ioc_offset =
2154                                         shared_data->body.offsets[obj_idx];
2155                                 shared_data->body.offsets[obj_idx] += len;
2156                                 shmem_unlock ();
2157                         }
2158 #else
2159                         data.ioc_offset += len;
2160                         obj_idx = 0; /* avoids an unused var warning */
2161 #endif
2162                 }
2163         }
2164
2165         if (!rc) {
2166                 struct timeval end;
2167                 double diff;
2168
2169                 gettimeofday(&end, NULL);
2170
2171                 diff = difftime(&end, &start);
2172
2173                 --i;
2174                 if (verbose != 0)
2175                         printf("%s: %s %dx%d pages in %.3fs (%.3f MB/s): %s",
2176                                jt_cmdname(argv[0]), write ? "wrote" : "read",
2177                                i, pages, diff,
2178                                ((double)i * pages * getpagesize()) /
2179                                (diff * 1048576.0),
2180                                ctime(&end.tv_sec));
2181         }
2182
2183 #ifdef MAX_THREADS
2184         if (thread) {
2185                 shmem_lock();
2186                 shmem_end_time_locked();
2187                 shmem_unlock();
2188         }
2189 #endif
2190         return rc;
2191 }
2192
2193 int jt_obd_lov_getconfig(int argc, char **argv)
2194 {
2195         struct obd_ioctl_data data;
2196         struct lov_desc desc;
2197         struct obd_uuid *uuidarray;
2198         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2199         __u32 *obdgens;
2200         char *path;
2201         int rc, fd;
2202
2203         memset(&data, 0, sizeof(data));
2204         data.ioc_dev = cur_device;
2205
2206         if (argc != 2)
2207                 return CMD_HELP;
2208
2209         path = argv[1];
2210         fd = open(path, O_RDONLY);
2211         if (fd < 0) {
2212                 fprintf(stderr, "open \"%s\" failed: %s\n", path,
2213                         strerror(errno));
2214                 return -errno;
2215         }
2216
2217         memset(&desc, 0, sizeof(desc));
2218         obd_str2uuid(&desc.ld_uuid, argv[1]);
2219         desc.ld_tgt_count = ((MAX_IOC_BUFLEN-sizeof(data)-sizeof(desc)) /
2220                              (sizeof(*uuidarray) + sizeof(*obdgens)));
2221
2222 repeat:
2223         uuidarray = calloc(desc.ld_tgt_count, sizeof(*uuidarray));
2224         if (!uuidarray) {
2225                 fprintf(stderr, "error: %s: no memory for %d uuid's\n",
2226                         jt_cmdname(argv[0]), desc.ld_tgt_count);
2227                 rc = -ENOMEM;
2228                 goto out;
2229         }
2230         obdgens = calloc(desc.ld_tgt_count, sizeof(*obdgens));
2231         if (!obdgens) {
2232                 fprintf(stderr, "error: %s: no memory for %d generation #'s\n",
2233                         jt_cmdname(argv[0]), desc.ld_tgt_count);
2234                 rc = -ENOMEM;
2235                 goto out_uuidarray;
2236         }
2237
2238         memset(buf, 0, sizeof(rawbuf));
2239         data.ioc_inllen1 = sizeof(desc);
2240         data.ioc_inlbuf1 = (char *)&desc;
2241         data.ioc_inllen2 = desc.ld_tgt_count * sizeof(*uuidarray);
2242         data.ioc_inlbuf2 = (char *)uuidarray;
2243         data.ioc_inllen3 = desc.ld_tgt_count * sizeof(*obdgens);
2244         data.ioc_inlbuf3 = (char *)obdgens;
2245
2246         if (llapi_ioctl_pack(&data, &buf, sizeof(rawbuf))) {
2247                 fprintf(stderr, "error: %s: invalid ioctl\n",
2248                         jt_cmdname(argv[0]));
2249                 rc = -EINVAL;
2250                 goto out_obdgens;
2251         }
2252         rc = ioctl(fd, OBD_IOC_LOV_GET_CONFIG, buf);
2253         if (rc == -ENOSPC) {
2254                 free(uuidarray);
2255                 free(obdgens);
2256                 goto repeat;
2257         } else if (rc) {
2258                 fprintf(stderr, "error: %s: ioctl error: %s\n",
2259                         jt_cmdname(argv[0]), strerror(rc = errno));
2260         } else {
2261                 struct obd_uuid *uuidp;
2262                 __u32 *genp;
2263                 int i;
2264
2265                 if (llapi_ioctl_unpack(&data, buf, sizeof(rawbuf))) {
2266                         fprintf(stderr, "error: %s: invalid reply\n",
2267                                 jt_cmdname(argv[0]));
2268                         rc = -EINVAL;
2269                         goto out;
2270                 }
2271                 if (desc.ld_default_stripe_count == (__u32)-1)
2272                         printf("default_stripe_count: %d\n", -1);
2273                 else
2274                         printf("default_stripe_count: %u\n",
2275                                desc.ld_default_stripe_count);
2276                 printf("default_stripe_size: %ju\n",
2277                        (uintmax_t)desc.ld_default_stripe_size);
2278                 printf("default_stripe_offset: %jd\n",
2279                        (uintmax_t)desc.ld_default_stripe_offset);
2280                 printf("default_stripe_pattern: %u\n", desc.ld_pattern);
2281                 printf("obd_count: %u\n", desc.ld_tgt_count);
2282                 printf("OBDS:\tobdidx\t\tobdgen\t\t obduuid\n");
2283                 uuidp = uuidarray;
2284                 genp = obdgens;
2285                 for (i = 0; i < desc.ld_tgt_count; i++, uuidp++, genp++)
2286                         printf("\t%6u\t%14u\t\t %s\n", i, *genp, (char *)uuidp);
2287         }
2288 out_obdgens:
2289         free(obdgens);
2290 out_uuidarray:
2291         free(uuidarray);
2292 out:
2293         close(fd);
2294         return rc;
2295 }
2296
2297 static int do_activate(int argc, char **argv, int flag)
2298 {
2299         struct obd_ioctl_data data;
2300         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2301         int rc;
2302
2303         memset(&data, 0, sizeof(data));
2304         data.ioc_dev = cur_device;
2305         if (argc != 1)
2306                 return CMD_HELP;
2307
2308         /* reuse offset for 'active' */
2309         data.ioc_offset = flag;
2310
2311         memset(buf, 0, sizeof(rawbuf));
2312         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2313         if (rc) {
2314                 fprintf(stderr, "error: %s: invalid ioctl\n",
2315                         jt_cmdname(argv[0]));
2316                 return rc;
2317         }
2318         rc = l_ioctl(OBD_DEV_ID, IOC_OSC_SET_ACTIVE, buf);
2319         if (rc)
2320                 fprintf(stderr, "error: %s: failed: %s\n",
2321                         jt_cmdname(argv[0]), strerror(rc = errno));
2322
2323         return rc;
2324 }
2325
2326 /**
2327  * Replace nids for given device.
2328  * lctl replace_nids <devicename> <nid1>[,nid2,nid3]
2329  * Command should be started on MGS server.
2330  * Only MGS server should be started (command execution
2331  * returns error in another cases). Command mount
2332  * -t lustre <MDT partition> -o nosvc <mount point>
2333  * can be used for that.
2334  *
2335  * llogs for MDTs and clients are processed. All
2336  * records copied as is except add_uuid and setup. This records
2337  * are skipped and recorded with new nids and uuid.
2338  *
2339  * \see mgs_replace_nids
2340  * \see mgs_replace_log
2341  * \see mgs_replace_nids_handler
2342  */
2343 int jt_replace_nids(int argc, char **argv)
2344 {
2345         int rc;
2346         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2347         struct obd_ioctl_data data;
2348
2349         memset(&data, 0, sizeof(data));
2350         data.ioc_dev = get_mgs_device();
2351         if (argc != 3)
2352                 return CMD_HELP;
2353
2354         data.ioc_inllen1 = strlen(argv[1]) + 1;
2355         data.ioc_inlbuf1 = argv[1];
2356
2357         data.ioc_inllen2 = strlen(argv[2]) + 1;
2358         data.ioc_inlbuf2 = argv[2];
2359         memset(buf, 0, sizeof(rawbuf));
2360         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2361         if (rc) {
2362                 fprintf(stderr, "error: %s: invalid ioctl\n",
2363                         jt_cmdname(argv[0]));
2364                 return rc;
2365         }
2366
2367         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_REPLACE_NIDS, buf);
2368         if (rc < 0) {
2369                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
2370                         strerror(rc = errno));
2371         }
2372
2373         return rc;
2374 }
2375
2376 /**
2377  * Clear config logs for given device or filesystem.
2378  * lctl clear_conf <devicename|fsname>
2379  * Command has to be run on MGS node having MGS device mounted with -o
2380  * nosvc.
2381  *
2382  * Configuration logs for filesystem or one particular log is
2383  * processed. New log is created, original log is read, its records
2384  * marked SKIP do not get copied to new log. Others are copied as-is.
2385  * Original file is renamed to log.${time}.bak.
2386  *
2387  * \see mgs_clear_configs
2388  * \see mgs_replace_log
2389  * \see mgs_clear_config_handler
2390  **/
2391 int jt_lcfg_clear(int argc, char **argv)
2392 {
2393         int rc;
2394         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2395         struct obd_ioctl_data data;
2396
2397         memset(&data, 0, sizeof(data));
2398         data.ioc_dev = get_mgs_device();
2399         if (argc != 2)
2400                 return CMD_HELP;
2401
2402         data.ioc_inllen1 = strlen(argv[1]) + 1;
2403         data.ioc_inlbuf1 = argv[1];
2404
2405         memset(buf, 0, sizeof(rawbuf));
2406         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2407         if (rc) {
2408                 fprintf(stderr, "error: %s: invalid ioctl\n",
2409                         jt_cmdname(argv[0]));
2410                 return rc;
2411         }
2412
2413         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_CLEAR_CONFIGS, buf);
2414         if (rc < 0) {
2415                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
2416                         strerror(rc = errno));
2417         }
2418
2419         return rc;
2420 }
2421
2422 int jt_obd_deactivate(int argc, char **argv)
2423 {
2424         return do_activate(argc, argv, 0);
2425 }
2426
2427 int jt_obd_activate(int argc, char **argv)
2428 {
2429         return do_activate(argc, argv, 1);
2430 }
2431
2432 int jt_obd_recover(int argc, char **argv)
2433 {
2434         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2435         struct obd_ioctl_data data;
2436         int rc;
2437
2438         memset(&data, 0, sizeof(data));
2439         data.ioc_dev = cur_device;
2440         if (argc > 2)
2441                 return CMD_HELP;
2442
2443         if (argc == 2) {
2444                 data.ioc_inllen1 = strlen(argv[1]) + 1;
2445                 data.ioc_inlbuf1 = argv[1];
2446         }
2447
2448         memset(buf, 0, sizeof(rawbuf));
2449         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2450         if (rc) {
2451                 fprintf(stderr, "error: %s: invalid ioctl\n",
2452                         jt_cmdname(argv[0]));
2453                 return rc;
2454         }
2455         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_CLIENT_RECOVER, buf);
2456         if (rc < 0) {
2457                 fprintf(stderr, "error: %s: %s\n", jt_cmdname(argv[0]),
2458                         strerror(rc = errno));
2459         }
2460
2461         return rc;
2462 }
2463
2464 int jt_obd_mdc_lookup(int argc, char **argv)
2465 {
2466         struct obd_ioctl_data data;
2467         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2468         char *parent, *child;
2469         int rc, fd, verbose = 1;
2470
2471         if (argc < 3 || argc > 4)
2472                 return CMD_HELP;
2473
2474         parent = argv[1];
2475         child = argv[2];
2476         if (argc == 4)
2477                 verbose = get_verbose(argv[0], argv[3]);
2478
2479         memset(&data, 0, sizeof(data));
2480         data.ioc_dev = cur_device;
2481
2482         data.ioc_inllen1 = strlen(child) + 1;
2483         data.ioc_inlbuf1 = child;
2484
2485         memset(buf, 0, sizeof(rawbuf));
2486         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2487         if (rc) {
2488                 fprintf(stderr, "error: %s: invalid ioctl\n",
2489                         jt_cmdname(argv[0]));
2490                 return rc;
2491         }
2492
2493         fd = open(parent, O_RDONLY);
2494         if (fd < 0) {
2495                 fprintf(stderr, "open \"%s\" failed: %s\n", parent,
2496                         strerror(errno));
2497                 return -1;
2498         }
2499
2500         rc = ioctl(fd, IOC_MDC_LOOKUP, buf);
2501         if (rc < 0) {
2502                 fprintf(stderr, "error: %s: ioctl error: %s\n",
2503                         jt_cmdname(argv[0]), strerror(rc = errno));
2504         }
2505         close(fd);
2506
2507         if (verbose) {
2508                 rc = llapi_ioctl_unpack(&data, buf, sizeof(rawbuf));
2509                 if (rc) {
2510                         fprintf(stderr, "error: %s: invalid reply\n",
2511                                 jt_cmdname(argv[0]));
2512                         return rc;
2513                 }
2514                 printf("%s: mode %o uid %d gid %d\n", child,
2515                        data.ioc_obdo1.o_mode, data.ioc_obdo1.o_uid,
2516                        data.ioc_obdo1.o_gid);
2517         }
2518
2519         return rc;
2520 }
2521
2522 int jt_lcfg_fork(int argc, char **argv)
2523 {
2524         struct obd_ioctl_data data;
2525         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2526         int rc;
2527
2528         if (argc != 3)
2529                 return CMD_HELP;
2530
2531         memset(&data, 0, sizeof(data));
2532         data.ioc_dev = get_mgs_device();
2533         data.ioc_inllen1 = strlen(argv[1]) + 1;
2534         data.ioc_inlbuf1 = argv[1];
2535         data.ioc_inllen2 = strlen(argv[2]) + 1;
2536         data.ioc_inlbuf2 = argv[2];
2537
2538         memset(buf, 0, sizeof(rawbuf));
2539         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2540         if (rc) {
2541                 fprintf(stderr, "error: %s: invalid ioctl\n",
2542                         jt_cmdname(argv[0]));
2543                 return rc;
2544         }
2545
2546         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LCFG_FORK, buf);
2547         if (rc < 0)
2548                 fprintf(stderr, "error: %s: OBD_IOC_LCFG_FORK failed: %s\n",
2549                         jt_cmdname(argv[0]), strerror(errno));
2550
2551         return rc;
2552 }
2553
2554 int jt_lcfg_erase(int argc, char **argv)
2555 {
2556         struct obd_ioctl_data data;
2557         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2558         int rc;
2559
2560         if (argc == 3) {
2561                 if (strncmp(argv[2], "-q", strlen("-q")) != 0 &&
2562                     strncmp(argv[2], "--quiet", strlen("--quiet")) != 0)
2563                         return CMD_HELP;
2564         } else if (argc != 2) {
2565                 return CMD_HELP;
2566         }
2567
2568         memset(&data, 0, sizeof(data));
2569         data.ioc_dev = get_mgs_device();
2570         data.ioc_inllen1 = strlen(argv[1]) + 1;
2571         data.ioc_inlbuf1 = argv[1];
2572
2573         memset(buf, 0, sizeof(rawbuf));
2574         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2575         if (rc) {
2576                 fprintf(stderr, "error: %s: invalid ioctl\n",
2577                         jt_cmdname(argv[0]));
2578                 return rc;
2579         }
2580
2581         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LCFG_ERASE, buf);
2582         if (rc < 0)
2583                 fprintf(stderr, "error: %s: OBD_IOC_LCFG_ERASE failed: %s\n",
2584                         jt_cmdname(argv[0]), strerror(errno));
2585
2586         return rc;
2587 }
2588
2589 int jt_llog_catlist(int argc, char **argv)
2590 {
2591         struct obd_ioctl_data data;
2592         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2593         int rc;
2594
2595         if (argc != 1)
2596                 return CMD_HELP;
2597
2598         memset(&data, 0, sizeof(data));
2599         data.ioc_dev = cur_device;
2600         data.ioc_inllen1 = sizeof(rawbuf) - __ALIGN_KERNEL(sizeof(data), 8);
2601         memset(buf, 0, sizeof(rawbuf));
2602         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2603         if (rc) {
2604                 fprintf(stderr, "error: %s: invalid ioctl\n",
2605                         jt_cmdname(argv[0]));
2606                 return rc;
2607         }
2608         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_CATLOGLIST, buf);
2609         if (rc == 0)
2610                 fprintf(stdout, "%s", ((struct obd_ioctl_data *)buf)->ioc_bulk);
2611         else
2612                 fprintf(stderr, "OBD_IOC_CATLOGLIST failed: %s\n",
2613                         strerror(errno));
2614
2615         return rc;
2616 }
2617
2618 int jt_llog_info(int argc, char **argv)
2619 {
2620         const struct option long_opts[] = {
2621         /* Allow optional "--catalog" for compatibility with llog commands. */
2622         { .val = 'c',   .name = "catalog",      .has_arg = required_argument },
2623         { .val = 'h',   .name = "help",         .has_arg = no_argument },
2624         { .name = NULL } };
2625         struct obd_ioctl_data data = { 0 };
2626         char rawbuf[MAX_IOC_BUFLEN] = "", *buf = rawbuf;
2627         char *cmd = argv[0];
2628         char *catalog = NULL;
2629         int rc, c;
2630
2631         while ((c = getopt_long(argc, argv, "c:h", long_opts, NULL)) != -1) {
2632                 switch (c) {
2633                 case 'c':
2634                         catalog = optarg;
2635                         break;
2636                 case 'h':
2637                 default:
2638                         return CMD_HELP;
2639                 }
2640         }
2641         argc -= optind;
2642         argv += optind;
2643         /* support "logname" positional parameter */
2644         if (argc == 1) {
2645                 if (catalog) {
2646                         fprintf(stderr,
2647                                 "%s: catalog is set, unknown argument '%s'\n",
2648                                 cmd, optarg);
2649                         return CMD_HELP;
2650                 }
2651                 catalog = argv[0];
2652         } else if (!catalog || argc > 1) {
2653                 return CMD_HELP;
2654         }
2655
2656         data.ioc_dev = cur_device;
2657         data.ioc_inllen1 = strlen(catalog) + 1;
2658         data.ioc_inlbuf1 = catalog;
2659         data.ioc_inllen2 = sizeof(rawbuf) - __ALIGN_KERNEL(sizeof(data), 8) -
2660                            __ALIGN_KERNEL(data.ioc_inllen1, 8);
2661         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2662         if (rc) {
2663                 fprintf(stderr, "%s: ioctl_pack failed for catalog '%s': %s\n",
2664                         jt_cmdname(cmd), catalog, strerror(-rc));
2665                 return rc;
2666         }
2667
2668         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_INFO, buf);
2669         if (rc == 0)
2670                 fprintf(stdout, "%s", ((struct obd_ioctl_data *)buf)->ioc_bulk);
2671         else
2672                 fprintf(stderr, "%s: OBD_IOC_LLOG_INFO failed: %s\n",
2673                         jt_cmdname(cmd), strerror(errno));
2674
2675         return rc;
2676 }
2677
2678 int jt_llog_print_cb(const char *record, void *private)
2679 {
2680         printf("%s\n", record);
2681
2682         return 0;
2683 }
2684
2685 static int
2686 llog_process_records(int (record_cb)(const char *record, void *private),
2687                      const char *record, void *private, bool reverse)
2688 {
2689         char *ptr = NULL;
2690         char *tmp = NULL;
2691         int rc = 0;
2692
2693         if (!reverse) {
2694                 do {
2695                         ptr = strchr(record, '\n');
2696                         if (ptr)
2697                                 *ptr = '\0';
2698                         rc = record_cb(record, private);
2699                         if (rc)
2700                                 goto out;
2701                         if (ptr)
2702                                 record = ptr + 1;
2703                 } while (ptr && *(ptr + 1));
2704         } else {
2705                 tmp = (char *)record;
2706
2707                 ptr = strrchr(record, '\n');
2708                 if (ptr)
2709                         *ptr = '\0';
2710                 else
2711                         goto out;
2712                 while ((ptr = strrchr(record, '\n'))) {
2713                         tmp = ptr + 1;
2714                         *ptr = '\0';
2715                         rc = record_cb(tmp, private);
2716                         if (rc)
2717                                 goto out;
2718                 };
2719                 rc = record_cb(record, private);
2720                 if (rc)
2721                         goto out;
2722         }
2723 out:
2724         return rc;
2725 }
2726
2727 /**
2728  * Iterate over llog records, typically YAML-formatted configuration logs
2729  *
2730  * \param logname[in]   name of llog file or FID
2731  * \param start[in]     first record to process
2732  * \param end[in]       last record to process (inclusive)
2733  * \param cb[in]        callback for records. Return -ve error, or +ve abort.
2734  * \param private[in,out] private data passed to the \a record_cb function
2735  * \param reverse[in]   print the llog records from the beginning or the end
2736  *
2737  * \retval              0 on success
2738  *                      others handled by the caller
2739  */
2740 int jt_llog_print_iter(char *logname, long start, long end,
2741                        int (record_cb)(const char *record, void *private),
2742                        void *private, bool reverse)
2743 {
2744         struct obd_ioctl_data data = { 0 };
2745         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
2746         char startbuf[16], endbuf[16];
2747         static long inc = sizeof(rawbuf) / 128;
2748         long rec;
2749         int rc = 0;
2750
2751         if (end == -1)
2752                 end = 0x7fffffff;
2753
2754         data.ioc_dev = cur_device;
2755         data.ioc_inlbuf1 = logname;
2756         data.ioc_inllen1 = strlen(logname) + 1;
2757
2758         /*
2759          * Estimate about 128 characters per configuration record.  Not all
2760          * records will be printed in any case, so they should easily fit.  If
2761          * not, the kernel will return -EOVERFLOW and ask for fewer records.
2762          *
2763          * We don't want to request records from the kernel one-at-a-time, as
2764          * it restarts the config llog iteration from the beginning, so we
2765          * fetch multiple records from the kernel per call and split locally.
2766          */
2767         for (rec = start; rec < end; rec += inc) {
2768                 char *record = ((struct obd_ioctl_data *)buf)->ioc_bulk;
2769
2770 retry:
2771                 snprintf(startbuf, sizeof(startbuf), "%lu", rec);
2772                 snprintf(endbuf, sizeof(endbuf), "%lu",
2773                          end < rec + inc - 1 ? end : rec + inc - 1);
2774
2775                 /* start and end record numbers are passed as ASCII digits */
2776                 data.ioc_inlbuf2 = startbuf;
2777                 data.ioc_inllen2 = strlen(startbuf) + 1;
2778                 data.ioc_inlbuf3 = endbuf;
2779                 data.ioc_inllen3 = strlen(endbuf) + 1;
2780
2781                 data.ioc_inllen4 = sizeof(rawbuf) -
2782                         __ALIGN_KERNEL(sizeof(data), 8) -
2783                         __ALIGN_KERNEL(data.ioc_inllen1, 8) -
2784                         __ALIGN_KERNEL(data.ioc_inllen2, 8) -
2785                         __ALIGN_KERNEL(data.ioc_inllen3, 8);
2786                 memset(buf, 0, sizeof(rawbuf));
2787                 rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
2788                 if (rc) {
2789                         fprintf(stderr, "%s: invalid ioctl data\n", logname);
2790                         goto out;
2791                 }
2792
2793                 rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_PRINT, buf);
2794                 if (rc == -EOVERFLOW && inc > 2) {
2795                         inc /= 2;
2796                         goto retry;
2797                 }
2798                 if (rc) {
2799                         fprintf(stderr, "%s: OBD_IOC_LLOG_PRINT failed: %s\n",
2800                                 logname, strerror(errno));
2801                         rc = -errno;
2802                         goto out;
2803                 }
2804
2805                 /* There is no "end of list" marker, record was not modified */
2806                 if (strcmp(record, logname) == 0)
2807                         break;
2808
2809                 rc = llog_process_records(record_cb, record, private, reverse);
2810                 if (rc)
2811                         goto out;
2812         }
2813
2814 out:
2815         return rc;
2816 }
2817
2818 static int llog_parse_catalog_start_end(int *argc, char **argv[],
2819                                         char **catalog, long *start, long *end)
2820 {
2821         const struct option long_opts[] = {
2822         /* the --catalog option is not required, just for consistency */
2823         { .val = 'c',   .name = "catalog",      .has_arg = required_argument },
2824         { .val = 'e',   .name = "end",          .has_arg = required_argument },
2825         { .val = 'h',   .name = "help",         .has_arg = no_argument },
2826         { .val = 's',   .name = "start",        .has_arg = required_argument },
2827         { .name = NULL } };
2828         char *cmd = (*argv)[0];
2829         char *endp;
2830         int c;
2831
2832         if (catalog == NULL || start == NULL || end == NULL)
2833                 return -EINVAL;
2834
2835         /* now process command line arguments*/
2836         while ((c = getopt_long(*argc, *argv, "c:e:hs:",
2837                                 long_opts, NULL)) != -1) {
2838                 switch (c) {
2839                 case 'c':
2840                         *catalog = optarg;
2841                         break;
2842                 case 'e':
2843                         *end = strtol(optarg, &endp, 0);
2844                         if (*endp != '\0') {
2845                                 fprintf(stderr, "%s: bad end value '%s'\n",
2846                                         cmd, optarg);
2847                                 return CMD_HELP;
2848                         }
2849                         break;
2850                 case 's':
2851                         *start = strtol(optarg, &endp, 0);
2852                         if (*endp != '\0') {
2853                                 fprintf(stderr, "%s: bad start value '%s'\n",
2854                                         cmd, optarg);
2855                                 return CMD_HELP;
2856                         }
2857                         break;
2858                 case 'h':
2859                 default:
2860                         return CMD_HELP;
2861                 }
2862         }
2863         *argc -= optind;
2864         *argv += optind;
2865
2866         /* support old optional positional parameters only if they were
2867          * not already specified with named arguments: logname [start [end]]
2868          */
2869         if (*argc >= 1) {
2870                 if (*catalog) {
2871                         fprintf(stderr,
2872                                 "%s: catalog is set, unknown argument '%s'\n",
2873                                 cmd, (*argv)[0]);
2874                         return CMD_HELP;
2875                 }
2876                 *catalog = (*argv)[0];
2877                 (*argc)--;
2878                 (*argv)++;
2879         }
2880
2881         if (*argc >= 1) {
2882                 if (*start != 1) {
2883                         fprintf(stderr,
2884                                 "%s: --start is set, unknown argument '%s'\n",
2885                                 cmd, (*argv)[0]);
2886                         return CMD_HELP;
2887                 }
2888
2889                 *start = strtol((*argv)[0], &endp, 0);
2890                 if (*endp != '\0') {
2891                         fprintf(stderr, "%s: bad start value '%s'\n",
2892                                 cmd, (*argv)[0]);
2893                         return CMD_HELP;
2894                 }
2895                 (*argc)--;
2896                 (*argv)++;
2897         }
2898         if (*argc >= 1) {
2899                 if (*end != -1) {
2900                         fprintf(stderr,
2901                                 "%s: --end is set, unknown argument '%s'\n",
2902                                 cmd, (*argv)[0]);
2903                         return CMD_HELP;
2904                 }
2905
2906                 *end = strtol((*argv)[0], &endp, 0);
2907                 if (*endp != '\0') {
2908                         fprintf(stderr, "%s: bad end value '%s'\n",
2909                                 cmd, (*argv)[0]);
2910                         return CMD_HELP;
2911                 }
2912                 (*argc)--;
2913                 (*argv)++;
2914         }
2915         if (*argc > 1) {
2916                 fprintf(stderr, "%s: unknown argument '%s'\n", cmd, (*argv)[0]);
2917                 return CMD_HELP;
2918         }
2919
2920         if (*end != -1 && *end < *start) {
2921                 fprintf(stderr, "%s: end '%lu' less than than start '%lu'\n",
2922                         cmd, *end, *start);
2923                 return CMD_HELP;
2924         }
2925
2926         return 0;
2927 }
2928
2929 int jt_llog_print(int argc, char **argv)
2930 {
2931         char *catalog = NULL;
2932         long start = 1, end = -1;
2933         int rc;
2934
2935         rc = llog_parse_catalog_start_end(&argc, &argv, &catalog, &start, &end);
2936         if (rc)
2937                 return rc;
2938
2939         rc = jt_llog_print_iter(catalog, start, end, jt_llog_print_cb,
2940                                 NULL, false);
2941
2942         return rc;
2943 }
2944
2945 /* Parse catalog, log ID, and optionally a log index with either optional
2946  * arguments or positional arguments.  Only the initial catalog argument
2947  * may be positional with other optional arguments.
2948  *
2949  * The positional arguments option should eventually be phased out.
2950  */
2951 static int llog_parse_catalog_log_idx(int *argc, char ***argv, const char *opts,
2952                                       int max_args, struct obd_ioctl_data *data)
2953 {
2954         const struct option long_opts[] = {
2955         /* the --catalog option is not required, just for consistency */
2956         { .val = 'c',   .name = "catalog",      .has_arg = required_argument },
2957         { .val = 'h',   .name = "help",         .has_arg = no_argument },
2958         { .val = 'i',   .name = "log_idx",      .has_arg = required_argument },
2959         { .val = 'l',   .name = "log_id",       .has_arg = required_argument },
2960         { .name = NULL } };
2961         int c;
2962
2963         /* sanity check */
2964         if (!data || *argc <= 1)
2965                 return -1;
2966
2967         data->ioc_dev = cur_device;
2968
2969         /* now process command line arguments*/
2970         while ((c = getopt_long(*argc, *argv, opts, long_opts, NULL)) != -1) {
2971                 switch (c) {
2972                 case 'c':
2973                         data->ioc_inllen1 = strlen(optarg) + 1;
2974                         data->ioc_inlbuf1 = optarg;
2975                         break;
2976                 case 'i':
2977                         data->ioc_inllen3 = strlen(optarg) + 1;
2978                         data->ioc_inlbuf3 = optarg;
2979                         break;
2980                 case 'l': /* The log_id option isn't currently needed for
2981                            * cancel as mdt_iocontrol() handles IOC_LLOG_CANCEL,
2982                            * but we may as well keep it for now.
2983                            */
2984                         data->ioc_inllen2 = strlen(optarg) + 1;
2985                         data->ioc_inlbuf2 = optarg;
2986                         break;
2987                 case 'h':
2988                 default:
2989                         return CMD_HELP;
2990                 }
2991         }
2992
2993         *argc -= optind;
2994         *argv += optind;
2995
2996         /* Allow catalog to be specified as first option without --catalog */
2997         if (data->ioc_inlbuf1 == NULL && *argc > 0) {
2998                 data->ioc_inlbuf1 = (*argv)[0];
2999                 data->ioc_inllen1 = strlen((*argv)[0]) + 1;
3000                 (*argc)--;
3001                 (*argv)++;
3002         }
3003
3004         return 0;
3005 }
3006
3007 int jt_llog_cancel(int argc, char **argv)
3008 {
3009         struct obd_ioctl_data data = { 0 };
3010         char rawbuf[MAX_IOC_BUFLEN] = "", *buf = rawbuf;
3011         char *cmd = argv[0];
3012         int rc;
3013
3014         /* Parse catalog file (in inlbuf1) and named parameters */
3015         rc = llog_parse_catalog_log_idx(&argc, &argv, "c:hi:l:", 3, &data);
3016
3017         /* Handle old positional parameters if not using named parameters,
3018          * either "<catalog> <log_idx>" or "<catalog> <log_id> <log_idx>".
3019          * It was "inlbuf3 = log_idx", and "inlbuf2 = log_id" (ignored by
3020          * config log cancel), and shows why I hate positional parameters.
3021          */
3022         if (argc == 1) {
3023                 data.ioc_inllen3 = strlen(argv[0]) + 1;
3024                 data.ioc_inlbuf3 = argv[0];
3025         } else if (argc == 2) {
3026                 data.ioc_inllen2 = strlen(argv[0]) + 1;
3027                 data.ioc_inlbuf2 = argv[0];
3028                 data.ioc_inllen3 = strlen(argv[1]) + 1;
3029                 data.ioc_inlbuf3 = argv[1];
3030         }
3031
3032         if (data.ioc_inlbuf1 == NULL || data.ioc_inlbuf3 == NULL)
3033                 /* missing mandatory parameters */
3034                 return CMD_HELP;
3035
3036         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3037         if (rc) {
3038                 fprintf(stderr, "%s: ioctl_pack for catalog '%s' failed: %s\n",
3039                         jt_cmdname(cmd), data.ioc_inlbuf1, strerror(-rc));
3040                 return rc;
3041         }
3042
3043         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_CANCEL, buf);
3044         if (rc)
3045                 fprintf(stderr, "%s: cancel catalog '%s:%s' failed: %s\n",
3046                         jt_cmdname(cmd), data.ioc_inlbuf1, data.ioc_inlbuf3,
3047                         strerror(errno));
3048
3049         return rc;
3050 }
3051
3052 int jt_llog_check(int argc, char **argv)
3053 {
3054         struct obd_ioctl_data data = { 0 };
3055         char rawbuf[MAX_IOC_BUFLEN] = "", *buf = rawbuf;
3056         char *catalog = NULL;
3057         char startbuf[16], endbuf[16];
3058         long start = 1, end = -1;
3059         char *cmd = argv[0];
3060         int rc;
3061
3062         rc = llog_parse_catalog_start_end(&argc, &argv, &catalog, &start, &end);
3063         if (rc)
3064                 return rc;
3065
3066         if (end == -1)
3067                 end = 0x7fffffff;
3068
3069         data.ioc_dev = cur_device;
3070         data.ioc_inllen1 = strlen(catalog) + 1;
3071         data.ioc_inlbuf1 = catalog;
3072
3073         snprintf(startbuf, sizeof(startbuf), "%lu", start);
3074         snprintf(endbuf, sizeof(endbuf), "%lu", end);
3075         /* start and end record numbers are passed as ASCII digits */
3076         data.ioc_inllen2 = strlen(startbuf) + 1;
3077         data.ioc_inlbuf2 = startbuf;
3078         data.ioc_inllen3 = strlen(endbuf) + 1;
3079         data.ioc_inlbuf3 = endbuf;
3080
3081         data.ioc_inllen4 = sizeof(rawbuf) - __ALIGN_KERNEL(sizeof(data), 8) -
3082                            __ALIGN_KERNEL(data.ioc_inllen1, 8) -
3083                            __ALIGN_KERNEL(data.ioc_inllen2, 8) -
3084                            __ALIGN_KERNEL(data.ioc_inllen3, 8);
3085         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3086         if (rc) {
3087                 fprintf(stderr, "%s: ioctl_pack failed for catalog '%s': %s\n",
3088                         jt_cmdname(cmd), data.ioc_inlbuf1, strerror(-rc));
3089                 return rc;
3090         }
3091
3092         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_CHECK, buf);
3093         if (rc == 0)
3094                 fprintf(stdout, "%s", ((struct obd_ioctl_data *)buf)->ioc_bulk);
3095         else
3096                 fprintf(stderr, "%s: OBD_IOC_LLOG_CHECK failed: %s\n",
3097                         jt_cmdname(cmd), strerror(errno));
3098         return rc;
3099 }
3100
3101 int jt_llog_remove(int argc, char **argv)
3102 {
3103         struct obd_ioctl_data data = { 0 };
3104         char rawbuf[MAX_IOC_BUFLEN] = "", *buf = rawbuf;
3105         char *cmd = argv[0];
3106         int rc;
3107
3108         rc = llog_parse_catalog_log_idx(&argc, &argv, "c:hl:", 2, &data);
3109         if (rc)
3110                 return rc;
3111
3112         if (argc == 1) {
3113                 if (data.ioc_inlbuf2) {
3114                         fprintf(stderr,
3115                                 "%s: --log_id is set, unknown argument '%s'\n",
3116                                 jt_cmdname(cmd), argv[0]);
3117                         return CMD_HELP;
3118                 }
3119
3120                 data.ioc_inllen2 = strlen(argv[0]) + 1;
3121                 data.ioc_inlbuf2 = argv[0];
3122         }
3123         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3124         if (rc) {
3125                 fprintf(stderr, "%s: ioctl_pack for catalog '%s' failed: %s\n",
3126                         jt_cmdname(cmd), data.ioc_inlbuf1, strerror(-rc));
3127                 return rc;
3128         }
3129
3130         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_REMOVE, buf);
3131         if (rc)
3132                 fprintf(stderr, "%s: cancel catalog '%s:%s' failed: %s\n",
3133                         jt_cmdname(cmd), data.ioc_inlbuf1, data.ioc_inlbuf2,
3134                         strerror(-rc));
3135
3136         return rc;
3137 }
3138
3139 static void signal_server(int sig)
3140 {
3141         if (sig == SIGINT) {
3142                 do_disconnect("sigint", 1);
3143                 exit(1);
3144         } else {
3145                 fprintf(stderr, "%s: got signal %d\n", jt_cmdname("sigint"),
3146                         sig);
3147         }
3148 }
3149
3150 int obd_initialize(int argc, char **argv)
3151 {
3152         if (shmem_setup() != 0)
3153                 return -1;
3154
3155         register_ioc_dev(OBD_DEV_ID, OBD_DEV_PATH);
3156
3157         return 0;
3158 }
3159
3160 void obd_finalize(int argc, char **argv)
3161 {
3162         struct sigaction sigact;
3163
3164         /* sigact initialization */
3165         sigact.sa_handler = signal_server;
3166         sigfillset(&sigact.sa_mask);
3167         sigact.sa_flags = SA_RESTART;
3168         /* coverity[uninit_use_in_call] */
3169         sigaction(SIGINT, &sigact, NULL);
3170
3171         shmem_cleanup();
3172         do_disconnect(argv[0], 1);
3173 }
3174
3175 /**
3176  * Get the index of the last llog record
3177  *
3178  * logid:            [0x3:0xa:0x0]:0
3179  * flags:            4 (plain)
3180  * records_count:    57
3181  * last_index:       57
3182  *
3183  * \param logname[in]   pointer to config log name
3184  *
3185  * \retval              > 0 on success
3186  *                      <= 0 on error
3187  */
3188 static long llog_last_index(char *logname)
3189 {
3190         struct obd_ioctl_data data = { 0 };
3191         char rawbuf[MAX_IOC_BUFLEN] = "", *buf = rawbuf;
3192         char *last_index;
3193         long rc;
3194
3195         data.ioc_dev = cur_device;
3196         data.ioc_inllen1 = strlen(logname) + 1;
3197         data.ioc_inlbuf1 = logname;
3198         data.ioc_inllen2 = sizeof(rawbuf) - __ALIGN_KERNEL(sizeof(data), 8) -
3199                            __ALIGN_KERNEL(data.ioc_inllen1, 8);
3200         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3201         if (rc) {
3202                 fprintf(stderr, "%s: ioctl_pack failed for catalog '%s': %s\n",
3203                         __func__, logname, strerror(-rc));
3204                 return rc;
3205         }
3206
3207         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_LLOG_INFO, buf);
3208         if (rc == 0) {
3209                 last_index = strstr(((struct obd_ioctl_data *)buf)->ioc_bulk,
3210                                     "last_index:");
3211                 return strtol(last_index + 11, NULL, 10);
3212         } else {
3213                 rc = -errno;
3214         }
3215
3216         return rc;
3217 }
3218
3219 static char *get_llog_event_name(__u32 cmd)
3220 {
3221         struct lcfg_type_data *data;
3222
3223         data = lcfg_cmd2data(cmd);
3224         if (data)
3225                 return data->ltd_name;
3226         return NULL;
3227 }
3228
3229 static char *get_event_filter(__u32 cmd)
3230 {
3231         char *event_name;
3232         char *filter = NULL;
3233         int len;
3234
3235         event_name = get_llog_event_name(cmd);
3236         if (event_name) {
3237                 /* 9 bytes for "event: , " */
3238                 len = 9 + strlen(event_name);
3239                 filter = malloc(len + 1);
3240                 if (!filter)
3241                         return NULL;
3242                 memset(filter, 0, len + 1);
3243                 snprintf(filter, len, "event: %s, ", event_name);
3244                 return filter;
3245         }
3246
3247         return NULL;
3248 }
3249
3250 /**
3251  * Callback to search ostname in llog
3252  * - { index: 23, event: attach, device: lustre-OST0000-osc, type: osc,
3253  *     UUID: lustre-clilov_UUID }
3254  * - { index: 24, event: setup, device: lustre-OST0000-osc,
3255  *     UUID: lustre-OST0000_UUID, node: 192.168.0.120@tcp }
3256  * - { index: 25, event: add_osc, device: lustre-clilov,
3257  *     ost: lustre-OST0000_UUID, index: 0, gen: 1 }
3258  *
3259  * \param record[in]    pointer to llog record
3260  * \param data[in]      pointer to ostname
3261  *
3262  * \retval              1 if ostname is found
3263  *                      0 if ostname is not found
3264  *                      -ENOENT if ostname is deleted
3265  */
3266 static int llog_search_ost_cb(const char *record, void *data)
3267 {
3268         char *ostname = data;
3269         char ost_filter[MAX_STRING_SIZE] = {'\0'};
3270         char *add_osc, *del_osc, *setup, *cleanup;
3271
3272         add_osc = get_event_filter(LCFG_LOV_ADD_OBD);
3273         del_osc = get_event_filter(LCFG_LOV_DEL_OBD);
3274         setup = get_event_filter(LCFG_SETUP);
3275         cleanup = get_event_filter(LCFG_CLEANUP);
3276         if (!add_osc || !del_osc || !setup || !cleanup)
3277                 return -ENOMEM;
3278
3279         if (ostname && ostname[0])
3280                 snprintf(ost_filter, sizeof(ost_filter), " %s,", ostname);
3281
3282         if (strstr(record, ost_filter)) {
3283                 if (strstr(record, add_osc) || strstr(record, setup))
3284                         return 1;
3285                 if (strstr(record, del_osc) || strstr(record, cleanup))
3286                         return -ENOENT;
3287         }
3288
3289         free(add_osc);
3290         free(del_osc);
3291         free(setup);
3292         free(cleanup);
3293
3294         return 0;
3295 }
3296
3297 /**
3298  * Search ost in llog
3299  *
3300  * \param logname[in]           pointer to config log name
3301  * \param last_index[in]        the index of the last llog record
3302  * \param ostname[in]           pointer to ost name
3303  *
3304  * \retval                      1 if ostname is found
3305  *                              0 if ostname is not found
3306  */
3307 static int llog_search_ost(char *logname, long last_index, char *ostname)
3308 {
3309         long start, end, inc = MAX_IOC_BUFLEN / 128;
3310         int rc = 0;
3311
3312         for (end = last_index; end > 1; end -= inc) {
3313                 start = end - inc > 0 ? end - inc : 1;
3314                 rc = jt_llog_print_iter(logname, start, end, llog_search_ost_cb,
3315                                         ostname, true);
3316                 if (rc)
3317                         break;
3318         }
3319
3320         return (rc == 1 ? 1 : 0);
3321 }
3322
3323 struct llog_pool_data {
3324         char lpd_fsname[LUSTRE_MAXFSNAME + 1];
3325         char lpd_poolname[LOV_MAXPOOLNAME + 1];
3326         char lpd_ostname[MAX_OBD_NAME + 1];
3327         enum lcfg_command_type lpd_cmd_type;
3328         bool lpd_pool_exists;
3329         int lpd_ost_num;
3330 };
3331
3332 /**
3333  * Called for each formatted line in the config log (within range).
3334  *
3335  * - { index: 74, event: new_pool, device: tfs-clilov, fsname: tfs, pool: tmp }
3336  * - { index: 77, event: add_pool, device: tfs-clilov, fsname: tfs, pool: tmp,
3337  *     ost: tfs-OST0000_UUID }
3338  * - { index: 224, event: remove_pool, device: tfs-clilov, fsname: tfs,
3339  *     pool: tmp, ost: tfs-OST0003_UUID }
3340  * - { index: 227, event: del_pool, device: tfs-clilov, fsname: tfs, pool: tmp }
3341  *
3342  * \param record[in]    pointer to llog record
3343  * \param data[in]      pointer to llog_pool_data
3344  *
3345  * \retval              1 if pool or OST is found
3346  *                      0 if pool or OST is not found
3347  *                      -ENOENT if pool or OST is removed
3348  */
3349 static int llog_search_pool_cb(const char *record, void *data)
3350 {
3351         struct llog_pool_data *lpd = data;
3352         char pool_filter[MAX_STRING_SIZE] = "";
3353         char *new_pool, *del_pool, *add_pool, *rem_pool;
3354         char *found = NULL;
3355         int fs_pool_len = 0, rc = 0;
3356
3357         new_pool = get_event_filter(LCFG_POOL_NEW);
3358         del_pool = get_event_filter(LCFG_POOL_DEL);
3359         add_pool = get_event_filter(LCFG_POOL_ADD);
3360         rem_pool = get_event_filter(LCFG_POOL_REM);
3361         if (!new_pool || !del_pool || !add_pool || !rem_pool) {
3362                 rc = -ENOMEM;
3363                 goto out;
3364         }
3365
3366         fs_pool_len = 16 + strlen(lpd->lpd_fsname) + strlen(lpd->lpd_poolname);
3367         snprintf(pool_filter, fs_pool_len + 1, "fsname: %s, pool: %s",
3368                  lpd->lpd_fsname, lpd->lpd_poolname);
3369
3370         /* search poolname */
3371         found = strstr(record, pool_filter);
3372         if (found &&
3373             (found[fs_pool_len] == ' ' || found[fs_pool_len] == ',')) {
3374                 if (strstr(record, new_pool)) {
3375                         lpd->lpd_pool_exists = true;
3376                         rc = 1;
3377                         goto out;
3378                 }
3379                 if (strstr(record, del_pool)) {
3380                         lpd->lpd_pool_exists = false;
3381                         rc = -ENOENT;
3382                         goto out;
3383                 }
3384
3385                 if (lpd->lpd_cmd_type == LCFG_POOL_NEW ||
3386                     lpd->lpd_cmd_type == LCFG_POOL_DEL) {
3387                         if (strstr(record, add_pool))
3388                                 lpd->lpd_ost_num++;
3389                         if (strstr(record, rem_pool))
3390                                 lpd->lpd_ost_num--;
3391                 } else if (lpd->lpd_ostname && lpd->lpd_ostname[0]) {
3392                         if (strstr(record, lpd->lpd_ostname)) {
3393                                 lpd->lpd_pool_exists = true;
3394                                 if (strstr(record, add_pool)) {
3395                                         lpd->lpd_ost_num = 1;
3396                                         rc = 1;
3397                                         goto out;
3398                                 }
3399                                 if (strstr(record, rem_pool)) {
3400                                         lpd->lpd_ost_num = 0;
3401                                         rc = -ENOENT;
3402                                         goto out;
3403                                 }
3404                         }
3405                 }
3406         }
3407 out:
3408         if (new_pool)
3409                 free(new_pool);
3410         if (del_pool)
3411                 free(del_pool);
3412         if (add_pool)
3413                 free(add_pool);
3414         if (rem_pool)
3415                 free(rem_pool);
3416
3417         return rc;
3418 }
3419
3420 /* Search pool and its ost in llog
3421  *
3422  * \param logname[in]           pointer to config log name
3423  * \param last_index[in]        the index of the last llog record
3424  * \param fsname[in]            pointer to filesystem name
3425  * \param poolname[in]          pointer pool name
3426  * \param ostname[in]           pointer to OST name(OSTnnnn-UUID)
3427  * \param cmd[in]               pool command type
3428  *
3429  * \retval                      < 0 on error
3430  *                              0 if pool is empty or OST is not found
3431  *                              1 if pool is not empty or OST is found
3432  */
3433 static int llog_search_pool(char *logname, long last_index, char *fsname,
3434                             char *poolname, char *ostname,
3435                             enum lcfg_command_type cmd)
3436 {
3437         struct llog_pool_data lpd;
3438         long start, end, inc = MAX_IOC_BUFLEN / 128;
3439         int rc = 0;
3440
3441         memset(&lpd, 0, sizeof(lpd));
3442         lpd.lpd_cmd_type = cmd;
3443         lpd.lpd_pool_exists = false;
3444         lpd.lpd_ost_num = 0;
3445         strncpy(lpd.lpd_fsname, fsname, sizeof(lpd.lpd_fsname) - 1);
3446         if (poolname && poolname[0])
3447                 strncpy(lpd.lpd_poolname, poolname,
3448                         sizeof(lpd.lpd_poolname) - 1);
3449         if (ostname && ostname[0])
3450                 strncpy(lpd.lpd_ostname, ostname, sizeof(lpd.lpd_ostname) - 1);
3451
3452         for (end = last_index; end > 1; end -= inc) {
3453                 start = end - inc > 0 ? end - inc : 1;
3454                 rc = jt_llog_print_iter(logname, start, end,
3455                                         llog_search_pool_cb, &lpd, true);
3456                 if (rc) {
3457                         if (rc == 1 && lpd.lpd_pool_exists)
3458                                 rc = lpd.lpd_ost_num ? 1 : 0;
3459                         else if (rc == -ENOENT && lpd.lpd_pool_exists &&
3460                                  !lpd.lpd_ost_num)
3461                                 rc = 0;
3462                         goto out;
3463                 }
3464         }
3465
3466         rc = -ENOENT;
3467 out:
3468         return rc;
3469 }
3470
3471 static bool combined_mgs_mds(char *fsname)
3472 {
3473         glob_t path;
3474         int rc;
3475
3476         rc = cfs_get_param_paths(&path, "mdt/%s-MDT0000", fsname);
3477         if (!rc)
3478                 cfs_free_param_data(&path);
3479
3480         if (get_mgs_device() > 0 && !rc)
3481                 return true;
3482
3483         return false;
3484 }
3485
3486 /*
3487  * if pool is NULL, search ostname in target_obd
3488  * if pool is not NULL:
3489  *  - if pool not found returns errno < 0
3490  *  - if ostname is NULL, returns 1 if pool is not empty and 0 if pool empty
3491  *  - if ostname is not NULL, returns 1 if OST is in pool and 0 if not
3492  */
3493 int lctl_search_ost(char *fsname, char *poolname, char *ostname,
3494                     enum lcfg_command_type cmd)
3495 {
3496         char logname[MAX_OBD_NAME] = {'\0'};
3497         long last_index;
3498
3499         if (fsname && fsname[0] == '\0')
3500                 fsname = NULL;
3501         if (!fsname)
3502                 return -EINVAL;
3503
3504         if (combined_mgs_mds(fsname))
3505                 return llapi_search_ost(fsname, poolname, ostname);
3506
3507         /* fetch the last_index of llog record */
3508         snprintf(logname, sizeof(logname), "%s-client", fsname);
3509         last_index = llog_last_index(logname);
3510         if (last_index < 0)
3511                 return last_index;
3512
3513         /* if pool is NULL, search ostname in target_obd */
3514         if (!poolname && ostname)
3515                 return llog_search_ost(logname, last_index, ostname);
3516
3517         return llog_search_pool(logname, last_index, fsname, poolname,
3518                                 ostname, cmd);
3519 }
3520
3521 static int check_pool_cmd(enum lcfg_command_type cmd,
3522                           char *fsname, char *poolname,
3523                           char *ostname)
3524 {
3525         int rc;
3526
3527         rc = lctl_search_ost(fsname, poolname, ostname, cmd);
3528         if (rc < 0 && (cmd != LCFG_POOL_NEW)) {
3529                 fprintf(stderr, "Pool %s.%s not found\n",
3530                         fsname, poolname);
3531                 return rc;
3532         }
3533
3534         switch (cmd) {
3535         case LCFG_POOL_NEW: {
3536                 if (ostname != NULL)
3537                         return -EINVAL;
3538
3539                 if (rc >= 0) {
3540                         fprintf(stderr, "Pool %s.%s already exists\n",
3541                                 fsname, poolname);
3542                         return -EEXIST;
3543                 }
3544                 return 0;
3545         }
3546         case LCFG_POOL_DEL: {
3547                 if (ostname != NULL)
3548                         return -EINVAL;
3549
3550                 if (rc == 1) {
3551                         fprintf(stderr, "Pool %s.%s not empty, "
3552                                 "please remove all members\n",
3553                                 fsname, poolname);
3554                         return -ENOTEMPTY;
3555                 }
3556                 return 0;
3557         }
3558         case LCFG_POOL_ADD: {
3559                 if (rc == 1) {
3560                         fprintf(stderr, "OST %s is already in pool %s.%s\n",
3561                                 ostname, fsname, poolname);
3562                         return -EEXIST;
3563                 }
3564                 rc = lctl_search_ost(fsname, NULL, ostname, cmd);
3565                 if (rc == 0) {
3566                         fprintf(stderr, "OST %s is not part of the '%s' fs.\n",
3567                                 ostname, fsname);
3568                         return -ENOENT;
3569                 }
3570                 return 0;
3571         }
3572         case LCFG_POOL_REM: {
3573                 if (rc == 0) {
3574                         fprintf(stderr, "OST %s not found in pool %s.%s\n",
3575                                 ostname, fsname, poolname);
3576                         return -ENOENT;
3577                 }
3578                 return 0;
3579         }
3580         default:
3581                 break;
3582         } /* switch */
3583         return -EINVAL;
3584 }
3585
3586 /* This check only verifies that the changes have been "pushed out" to
3587    the client successfully.  This involves waiting for a config update,
3588    and so may fail because of problems in that code or post-command
3589    network loss. So reporting a warning is appropriate, but not a failure.
3590 */
3591 static int check_pool_cmd_result(enum lcfg_command_type cmd,
3592                                  char *fsname, char *poolname,
3593                                  char *ostname)
3594 {
3595         int cpt = 10;
3596         int rc = 0;
3597
3598         switch (cmd) {
3599         case LCFG_POOL_NEW: {
3600                 do {
3601                         rc = lctl_search_ost(fsname, poolname, NULL, cmd);
3602                         if (rc == -ENODEV)
3603                                 return rc;
3604                         if (rc < 0)
3605                                 sleep(2);
3606                         cpt--;
3607                 } while ((rc < 0) && (cpt > 0));
3608                 if (rc >= 0) {
3609                         fprintf(stderr, "Pool %s.%s created\n",
3610                                 fsname, poolname);
3611                         return 0;
3612                 } else {
3613                         fprintf(stderr, "Warning, pool %s.%s not found\n",
3614                                 fsname, poolname);
3615                         return -ENOENT;
3616                 }
3617         }
3618         case LCFG_POOL_DEL: {
3619                 do {
3620                         rc = lctl_search_ost(fsname, poolname, NULL, cmd);
3621                         if (rc == -ENODEV)
3622                                 return rc;
3623                         if (rc >= 0)
3624                                 sleep(2);
3625                         cpt--;
3626                 } while ((rc >= 0) && (cpt > 0));
3627                 if (rc < 0) {
3628                         fprintf(stderr, "Pool %s.%s destroyed\n",
3629                                 fsname, poolname);
3630                         return 0;
3631                 } else {
3632                         fprintf(stderr, "Warning, pool %s.%s still found\n",
3633                                 fsname, poolname);
3634                         return -EEXIST;
3635                 }
3636         }
3637         case LCFG_POOL_ADD: {
3638                 do {
3639                         rc = lctl_search_ost(fsname, poolname, ostname, cmd);
3640                         if (rc == -ENODEV)
3641                                 return rc;
3642                         if (rc != 1)
3643                                 sleep(2);
3644                         cpt--;
3645                 } while ((rc != 1) && (cpt > 0));
3646                 if (rc == 1) {
3647                         fprintf(stderr, "OST %s added to pool %s.%s\n",
3648                                 ostname, fsname, poolname);
3649                         return 0;
3650                 } else {
3651                         fprintf(stderr, "Warning, OST %s not found in pool %s.%s\n",
3652                                 ostname, fsname, poolname);
3653                         return -ENOENT;
3654                 }
3655         }
3656         case LCFG_POOL_REM: {
3657                 do {
3658                         rc = lctl_search_ost(fsname, poolname, ostname, cmd);
3659                         if (rc == -ENODEV)
3660                                 return rc;
3661                         if (rc == 1)
3662                                 sleep(2);
3663                         cpt--;
3664                 } while ((rc == 1) && (cpt > 0));
3665                 if (rc != 1) {
3666                         fprintf(stderr, "OST %s removed from pool %s.%s\n",
3667                                 ostname, fsname, poolname);
3668                         return 0;
3669                 } else {
3670                         fprintf(stderr, "Warning, OST %s still found in pool %s.%s\n",
3671                                 ostname, fsname, poolname);
3672                         return -EEXIST;
3673                 }
3674         }
3675         default:
3676                 break;
3677         }
3678         return -EINVAL;
3679 }
3680
3681 static int check_and_complete_ostname(char *fsname, char *ostname)
3682 {
3683         char *ptr;
3684         char real_ostname[MAX_OBD_NAME + 1];
3685         char i;
3686
3687         /* if OST name does not start with fsname, we add it */
3688         /* if not check if the fsname is the right one */
3689         ptr = strchr(ostname, '-');
3690         if (ptr == NULL) {
3691                 sprintf(real_ostname, "%s-%s", fsname, ostname);
3692         } else if (strncmp(ostname, fsname, strlen(fsname)) != 0) {
3693                 fprintf(stderr, "%s does not start with fsname %s\n",
3694                         ostname, fsname);
3695                 return -EINVAL;
3696         } else {
3697                 if (strlen(ostname) > sizeof(real_ostname)-1)
3698                         return -E2BIG;
3699                 strncpy(real_ostname, ostname, sizeof(real_ostname));
3700         }
3701         /* real_ostname is fsname-????? */
3702         ptr = real_ostname + strlen(fsname) + 1;
3703         if (strncmp(ptr, "OST", 3) != 0) {
3704                 fprintf(stderr, "%s does not start by %s-OST nor OST\n",
3705                         ostname, fsname);
3706                 return -EINVAL;
3707         }
3708         /* real_ostname is fsname-OST????? */
3709         ptr += 3;
3710         for (i = 0; i < 4; i++) {
3711                 if (!isxdigit(*ptr)) {
3712                         fprintf(stderr,
3713                                 "ost's index in %s is not an hexa number\n",
3714                                 ostname);
3715                         return -EINVAL;
3716                 }
3717                 ptr++;
3718         }
3719         /* real_ostname is fsname-OSTXXXX????? */
3720         /* if OST name does not end with _UUID, we add it */
3721         if (*ptr == '\0') {
3722                 strcat(real_ostname, "_UUID");
3723         } else if (strcmp(ptr, "_UUID") != 0) {
3724                 fprintf(stderr,
3725                         "ostname %s does not end with _UUID\n", ostname);
3726                 return -EINVAL;
3727         }
3728         /* real_ostname is fsname-OSTXXXX_UUID */
3729         strcpy(ostname, real_ostname);
3730         return 0;
3731 }
3732
3733 /* returns 0 or -errno */
3734 static int pool_cmd(enum lcfg_command_type cmd,
3735                     char *cmdname, char *fullpoolname,
3736                     char *fsname, char *poolname, char *ostname)
3737 {
3738         int rc = 0;
3739         struct obd_ioctl_data data;
3740         struct lustre_cfg_bufs bufs;
3741         struct lustre_cfg *lcfg;
3742         char rawbuf[MAX_IOC_BUFLEN], *buf = rawbuf;
3743
3744         rc = check_pool_cmd(cmd, fsname, poolname, ostname);
3745         if (rc == -ENODEV)
3746                 fprintf(stderr, "Can't verify pool command since there "
3747                         "is no local MDT or client, proceeding anyhow...\n");
3748         else if (rc)
3749                 return rc;
3750
3751         lustre_cfg_bufs_reset(&bufs, NULL);
3752         lustre_cfg_bufs_set_string(&bufs, 0, cmdname);
3753         lustre_cfg_bufs_set_string(&bufs, 1, fullpoolname);
3754         if (ostname != NULL)
3755                 lustre_cfg_bufs_set_string(&bufs, 2, ostname);
3756
3757
3758         lcfg = malloc(lustre_cfg_len(bufs.lcfg_bufcount, bufs.lcfg_buflen));
3759         if (lcfg == NULL)
3760                 return -ENOMEM;
3761         lustre_cfg_init(lcfg, cmd, &bufs);
3762
3763         memset(&data, 0, sizeof(data));
3764         rc = data.ioc_dev = get_mgs_device();
3765         if (rc < 0)
3766                 goto out;
3767
3768         data.ioc_type = LUSTRE_CFG_TYPE;
3769         data.ioc_plen1 = lustre_cfg_len(lcfg->lcfg_bufcount,
3770                                         lcfg->lcfg_buflens);
3771         data.ioc_pbuf1 = (void *)lcfg;
3772
3773         memset(buf, 0, sizeof(rawbuf));
3774         rc = llapi_ioctl_pack(&data, &buf, sizeof(rawbuf));
3775         if (rc) {
3776                 fprintf(stderr, "error: %s: invalid ioctl\n",
3777                         jt_cmdname(cmdname));
3778                 free(lcfg);
3779                 return rc;
3780         }
3781         rc = l_ioctl(OBD_DEV_ID, OBD_IOC_POOL, buf);
3782 out:
3783         if (rc)
3784                 rc = -errno;
3785         switch (rc) {
3786         case -ENAMETOOLONG:
3787                 fprintf(stderr, "error: %s: either the pool or file "
3788                         "system name is too long (max pool name len "
3789                         "is %d and file system name is %d)\n",
3790                         jt_cmdname(cmdname), LOV_MAXPOOLNAME,
3791                         LUSTRE_MAXFSNAME);
3792                 break;
3793         case -EINVAL:
3794                 fprintf(stderr, "error: %s can contain only "
3795                         "alphanumeric characters, underscores, and "
3796                         "dashes besides the required '.'\n",
3797                         jt_cmdname(cmdname));
3798         default:
3799                 break;
3800         }
3801         free(lcfg);
3802         return rc;
3803 }
3804
3805 /**
3806  * Format and send the ioctl to the MGS.
3807  *
3808  * \param       cmd             IOCTL to send
3809  * \param       ret_data        void pointer to return anything from
3810  *                              ioctl
3811  * \param       num_args        number of arguments to pack into the
3812  *