Whamcloud - gitweb
b=13932
[fs/lustre-release.git] / lustre / tests / test-framework.sh
1 #!/bin/bash
2 # vim:expandtab:shiftwidth=4:softtabstop=4:tabstop=4:
3
4 trap 'print_summary && echo "test-framework exiting on error"' ERR
5 set -e
6 #set -x
7
8
9 export REFORMAT=${REFORMAT:-""}
10 export VERBOSE=false
11 export GMNALNID=${GMNALNID:-/usr/sbin/gmlndnid}
12 export CATASTROPHE=${CATASTROPHE:-/proc/sys/lnet/catastrophe}
13 export GSS=false
14 export GSS_KRB5=false
15 export GSS_PIPEFS=false
16 #export PDSH="pdsh -S -Rssh -w"
17
18 # eg, assert_env LUSTRE MDSNODES OSTNODES CLIENTS
19 assert_env() {
20     local failed=""
21     for name in $@; do
22         if [ -z "${!name}" ]; then
23             echo "$0: $name must be set"
24             failed=1
25         fi
26     done
27     [ $failed ] && exit 1 || true
28 }
29
30 usage() {
31     echo "usage: $0 [-r] [-f cfgfile]"
32     echo "       -r: reformat"
33
34     exit
35 }
36
37 print_summary () {
38     [ -n "$ONLY" ] && echo "WARNING: ONLY is set to ${ONLY}."
39     local form="%-13s %-17s %s\n"
40     printf "$form" "status" "script" "skipped tests E(xcluded) S(low)"
41     echo "------------------------------------------------------------------------------------"
42     for O in $TESTSUITE_LIST; do
43         local skipped=""
44         local slow=""
45         local o=$(echo $O | tr "[:upper:]" "[:lower:]")
46         o=${o//_/-}
47         o=${o//tyn/tyN}
48         local log=${TMP}/${o}.log 
49         [ -f $log ] && skipped=$(grep excluded $log | awk '{ printf " %s", $3 }' | sed 's/test_//g')
50         [ -f $log ] && slow=$(grep SLOW $log | awk '{ printf " %s", $3 }' | sed 's/test_//g')
51         [ "${!O}" = "done" ] && \
52             printf "$form" "Done" "$O" "E=$skipped" && \
53             [ -n "$slow" ] && printf "$form" "-" "-" "S=$slow"
54
55     done
56
57     for O in $TESTSUITE_LIST; do
58         [ "${!O}" = "no" ] && \
59             printf "$form" "Skipped" "$O" ""
60     done
61
62     for O in $TESTSUITE_LIST; do
63         [ "${!O}" = "done" -o "${!O}" = "no" ] || \
64             printf "$form" "UNFINISHED" "$O" ""
65     done
66 }
67
68 init_test_env() {
69     export LUSTRE=`absolute_path $LUSTRE`
70     export TESTSUITE=`basename $0 .sh`
71     export LTESTDIR=${LTESTDIR:-$LUSTRE/../ltest}
72
73     [ -d /r ] && export ROOT=${ROOT:-/r}
74     export TMP=${TMP:-$ROOT/tmp}
75     export TESTSUITELOG=${TMP}/${TESTSUITE}.log
76
77     export PATH=:$PATH:$LUSTRE/utils:$LUSTRE/utils/gss:$LUSTRE/tests
78     export LCTL=${LCTL:-"$LUSTRE/utils/lctl"}
79     export LFS=${LFS:-"$LUSTRE/utils/lfs"}
80     [ ! -f "$LCTL" ] && export LCTL=$(which lctl) 
81     export LFS=${LFS:-"$LUSTRE/utils/lfs"}
82     [ ! -f "$LFS" ] && export LFS=$(which lfs) 
83     export MKFS=${MKFS:-"$LUSTRE/utils/mkfs.lustre"}
84     [ ! -f "$MKFS" ] && export MKFS=$(which mkfs.lustre) 
85     export TUNEFS=${TUNEFS:-"$LUSTRE/utils/tunefs.lustre"}
86     [ ! -f "$TUNEFS" ] && export TUNEFS=$(which tunefs.lustre) 
87     export CHECKSTAT="${CHECKSTAT:-"checkstat -v"} "
88     export FSYTPE=${FSTYPE:-"ldiskfs"}
89     export NAME=${NAME:-local}
90     export LPROC=/proc/fs/lustre
91     export LGSSD=${LGSSD:-"$LUSTRE/utils/gss/lgssd"}
92     export LSVCGSSD=${LSVCGSSD:-"$LUSTRE/utils/gss/lsvcgssd"}
93     export KRB5DIR=${KRB5DIR:-"/usr/kerberos"}
94     export DIR2
95
96     if [ "$ACCEPTOR_PORT" ]; then
97         export PORT_OPT="--port $ACCEPTOR_PORT"
98     fi
99
100     case "x$SEC" in
101         xkrb5*)
102             echo "Using GSS/krb5 ptlrpc security flavor"
103             GSS=true
104             GSS_KRB5=true
105             ;;
106     esac
107
108     # Paths on remote nodes, if different 
109     export RLUSTRE=${RLUSTRE:-$LUSTRE}
110     export RPWD=${RPWD:-$PWD}
111     export I_MOUNTED=${I_MOUNTED:-"no"}
112
113     # command line
114     
115     while getopts "rvf:" opt $*; do 
116         case $opt in
117             f) CONFIG=$OPTARG;;
118             r) REFORMAT=--reformat;;
119             v) VERBOSE=true;;
120             \?) usage;;
121         esac
122     done
123
124     shift $((OPTIND - 1))
125     ONLY=${ONLY:-$*}
126
127     [ "$TESTSUITELOG" ] && rm -f $TESTSUITELOG || true
128
129 }
130
131 load_module() {
132     EXT=".ko"
133     module=$1
134     shift
135     BASE=`basename $module $EXT`
136     lsmod | grep -q ${BASE} || \
137       if [ -f ${LUSTRE}/${module}${EXT} ]; then
138         insmod ${LUSTRE}/${module}${EXT} $@
139     else
140         # must be testing a "make install" or "rpm" installation
141         # note failed to load ptlrpc_gss is considered not fatal
142         if [ "$BASE" == "ptlrpc_gss" ]; then
143             modprobe $BASE $@ 2>/dev/null || echo "gss/krb5 is not supported"
144         else
145             modprobe $BASE $@
146         fi
147     fi
148 }
149
150 load_modules() {
151     if [ -n "$MODPROBE" ]; then
152         # use modprobe
153     return 0
154     fi
155     if [ "$HAVE_MODULES" = true ]; then
156     # we already loaded
157         return 0
158     fi
159     HAVE_MODULES=true
160
161     echo Loading modules from $LUSTRE
162     load_module ../lnet/libcfs/libcfs
163     [ -z "$LNETOPTS" ] && \
164         LNETOPTS=$(awk '/^options lnet/ { print $0}' /etc/modprobe.conf | sed 's/^options lnet //g')
165     echo "lnet options: '$LNETOPTS'"
166     # note that insmod will ignore anything in modprobe.conf
167     load_module ../lnet/lnet/lnet $LNETOPTS
168     LNETLND=${LNETLND:-"socklnd/ksocklnd"}
169     load_module ../lnet/klnds/$LNETLND
170     [ "$FSTYPE" = "ldiskfs" ] && load_module ../ldiskfs/ldiskfs/ldiskfs
171     load_module lvfs/lvfs
172     load_module obdclass/obdclass
173     load_module lvfs/fsfilt_$FSTYPE
174     load_module ptlrpc/ptlrpc
175     load_module ptlrpc/gss/ptlrpc_gss
176     # Now, some modules depend on lquota without USE_QUOTA check,
177     # will fix later. Disable check "$USE_QUOTA" = "yes" temporary.
178     #[ "$USE_QUOTA" = "yes" ] && load_module quota/lquota
179     load_module quota/lquota
180     load_module fid/fid
181     load_module fld/fld
182     load_module lmv/lmv
183     load_module mdc/mdc
184     load_module osc/osc
185     load_module lov/lov
186     load_module mds/mds
187     load_module mdd/mdd
188     load_module mdt/mdt
189     load_module cmm/cmm
190     load_module osd/osd
191     load_module ost/ost
192     load_module obdfilter/obdfilter
193     load_module llite/lustre
194     load_module llite/llite_lloop
195     load_module mgc/mgc
196     load_module mgs/mgs
197     rm -f $TMP/ogdb-`hostname`
198     $LCTL modules > $TMP/ogdb-`hostname`
199     # 'mount' doesn't look in $PATH, just sbin
200     [ -f $LUSTRE/utils/mount.lustre ] && cp $LUSTRE/utils/mount.lustre /sbin/. || true
201 }
202
203 RMMOD=rmmod
204 if [ `uname -r | cut -c 3` -eq 4 ]; then
205     RMMOD="modprobe -r"
206 fi
207
208 wait_for_lnet() {
209     local UNLOADED=0
210     local WAIT=0
211     local MAX=60
212     MODULES=$($LCTL modules | awk '{ print $2 }')
213     while [ -n "$MODULES" ]; do
214     sleep 5
215     $RMMOD $MODULES > /dev/null 2>&1 || true
216     MODULES=$($LCTL modules | awk '{ print $2 }')
217         if [ -z "$MODULES" ]; then
218         return 0
219         else
220             WAIT=$((WAIT + 5))
221             echo "waiting, $((MAX - WAIT)) secs left"
222         fi
223         if [ $WAIT -eq $MAX ]; then
224             echo "LNET modules $MODULES will not unload"
225         lsmod
226             return 3
227         fi
228     done
229 }
230
231 unload_modules() {
232     wait_exit_ST client # bug 12845
233
234     lsmod | grep lnet > /dev/null && $LCTL dl && $LCTL dk $TMP/debug
235     local MODULES=$($LCTL modules | awk '{ print $2 }')
236     $RMMOD $MODULES > /dev/null 2>&1 || true
237      # do it again, in case we tried to unload ksocklnd too early
238     MODULES=$($LCTL modules | awk '{ print $2 }')
239     [ -n "$MODULES" ] && $RMMOD $MODULES > /dev/null 2>&1 || true
240     MODULES=$($LCTL modules | awk '{ print $2 }')
241     if [ -n "$MODULES" ]; then
242     echo "Modules still loaded: "
243     echo $MODULES 
244     if [ -e $LPROC ]; then
245         echo "Lustre still loaded"
246         cat $LPROC/devices || true
247         lsmod
248         return 2
249     else
250         echo "Lustre stopped but LNET is still loaded, waiting..."
251         wait_for_lnet || return 3
252     fi
253     fi
254     HAVE_MODULES=false
255
256     LEAK_LUSTRE=$(dmesg | tail -n 30 | grep "obd mem.*leaked" || true)
257     LEAK_PORTALS=$(dmesg | tail -n 20 | grep "Portals memory leaked" || true)
258     if [ "$LEAK_LUSTRE" -o "$LEAK_PORTALS" ]; then
259         echo "$LEAK_LUSTRE" 1>&2
260         echo "$LEAK_PORTALS" 1>&2
261         mv $TMP/debug $TMP/debug-leak.`date +%s` || true
262         echo "Memory leaks detected"
263         [ -n "$IGNORE_LEAK" ] && echo "ignoring leaks" && return 0
264         return 254
265     fi
266     echo "modules unloaded."
267     return 0
268 }
269
270 check_gss_daemon_facet() {
271     facet=$1
272     dname=$2
273
274     num=`do_facet $facet ps -o cmd -C $dname | grep $dname | wc -l`
275     if [ $num -ne 1 ]; then
276         echo "$num instance of $dname on $facet"
277         return 1
278     fi
279     return 0
280 }
281
282 send_sigint() {
283     local facet=$1
284     shift
285     do_facet $facet "killall -2 $@ 2>/dev/null || true"
286 }
287
288 start_gss_daemons() {
289     # starting on MDT
290     for num in `seq $MDSCOUNT`; do
291         do_facet mds$num "$LSVCGSSD -v"
292         if $GSS_PIPEFS; then
293             do_facet mds$num "$LGSSD -v"
294         fi
295     done
296     # starting on OSTs
297     for num in `seq $OSTCOUNT`; do
298         do_facet ost$num "$LSVCGSSD -v"
299     done
300     # starting on client
301     # FIXME: is "client" the right facet name?
302     if $GSS_PIPEFS; then
303         do_facet client "$LGSSD -v"
304     fi
305
306     # wait daemons entering "stable" status
307     sleep 5
308
309     #
310     # check daemons are running
311     #
312     for num in `seq $MDSCOUNT`; do
313         check_gss_daemon_facet mds$num lsvcgssd
314         if $GSS_PIPEFS; then
315             check_gss_daemon_facet mds$num lgssd
316         fi
317     done
318     for num in `seq $OSTCOUNT`; do
319         check_gss_daemon_facet ost$num lsvcgssd
320     done
321     if $GSS_PIPEFS; then
322         check_gss_daemon_facet client lgssd
323     fi
324 }
325
326 stop_gss_daemons() {
327     for num in `seq $MDSCOUNT`; do
328         send_sigint mds$num lsvcgssd lgssd
329     done
330     for num in `seq $OSTCOUNT`; do
331         send_sigint ost$num lsvcgssd
332     done
333     send_sigint client lgssd
334 }
335
336 init_krb5_env() {
337     if [ ! -z $SEC ]; then
338         MDS_MOUNT_OPTS=$MDS_MOUNT_OPTS,sec=$SEC
339         OST_MOUNT_OPTS=$OST_MOUNT_OPTS,sec=$SEC
340     fi
341
342     if $GSS; then
343         start_gss_daemons
344     fi
345 }
346
347 cleanup_krb5_env() {
348     if $GSS; then
349         stop_gss_daemons
350         # maybe cleanup credential cache?
351     fi
352 }
353
354 mdsdevlabel() {
355     local num=$1
356     local device=`mdsdevname $num`
357     local label=`do_facet mds$num "e2label ${device}" | grep -v "CMD: "`
358     echo -n $label
359 }
360
361 ostdevlabel() {
362     local num=$1
363     local device=`ostdevname $num`
364     local label=`do_facet ost$num "e2label ${device}" | grep -v "CMD: "`
365     echo -n $label
366 }
367
368 # Facet functions
369 # start facet device options 
370 start() {
371     facet=$1
372     shift
373     device=$1
374     shift
375     echo "Starting ${facet}: $@ ${device} ${MOUNT%/*}/${facet}"
376     do_facet ${facet} mkdir -p ${MOUNT%/*}/${facet}
377     do_facet ${facet} mount -t lustre $@ ${device} ${MOUNT%/*}/${facet} 
378     RC=${PIPESTATUS[0]}
379     if [ $RC -ne 0 ]; then
380         echo mount -t lustre $@ ${device} ${MOUNT%/*}/${facet} 
381         echo Start of ${device} on ${facet} failed ${RC}
382     else 
383         do_facet ${facet} "sysctl -w lnet.debug=$PTLDEBUG; \
384         sysctl -w lnet.subsystem_debug=${SUBSYSTEM# }; \
385         sysctl -w lnet.debug_mb=${DEBUG_SIZE}"
386
387         do_facet ${facet} sync
388         label=$(do_facet ${facet} "e2label ${device}")
389         [ -z "$label" ] && echo no label for ${device} && exit 1
390         eval export ${facet}_svc=${label}
391         eval export ${facet}_dev=${device}
392         eval export ${facet}_opt=\"$@\"
393         echo Started ${label}
394     fi
395     return $RC
396 }
397
398 stop() {
399     local running
400     facet=$1
401     shift
402     HOST=`facet_active_host $facet`
403     [ -z $HOST ] && echo stop: no host for $facet && return 0
404
405     running=$(do_facet ${facet} "grep -c ${MOUNT%/*}/${facet}' ' /proc/mounts") || true
406     if [ ${running} -ne 0 ]; then
407         echo "Stopping ${MOUNT%/*}/${facet} (opts:$@)"
408         do_facet ${facet} umount -d $@ ${MOUNT%/*}/${facet}
409     fi
410
411     # umount should block, but we should wait for unrelated obd's
412     # like the MGS or MGC to also stop.
413     wait_exit_ST ${facet}
414 }
415
416 zconf_mount() {
417     local OPTIONS
418     local client=$1
419     local mnt=$2
420     # Only supply -o to mount if we have options
421     if [ -n "$MOUNTOPT" ]; then
422         OPTIONS="-o $MOUNTOPT"
423     fi
424     local device=$MGSNID:/$FSNAME
425     if [ -z "$mnt" -o -z "$FSNAME" ]; then
426         echo Bad zconf mount command: opt=$OPTIONS dev=$device mnt=$mnt
427         exit 1
428     fi
429
430     echo "Starting client: $OPTIONS $device $mnt" 
431     do_node $client mkdir -p $mnt
432     do_node $client mount -t lustre $OPTIONS $device $mnt || return 1
433
434     do_node $client "sysctl -w lnet.debug=$PTLDEBUG;
435         sysctl -w lnet.subsystem_debug=${SUBSYSTEM# };
436         sysctl -w lnet.debug_mb=${DEBUG_SIZE}"
437     [ -d /r ] && $LCTL modules > /r/tmp/ogdb-`hostname`
438     return 0
439 }
440
441 zconf_umount() {
442     client=$1
443     mnt=$2
444     [ "$3" ] && force=-f
445     local running=$(do_node $client "grep -c $mnt' ' /proc/mounts") || true
446     if [ $running -ne 0 ]; then
447         echo "Stopping client $mnt (opts:$force)"
448         do_node $client umount $force $mnt
449     fi
450 }
451
452 shutdown_facet() {
453     facet=$1
454     if [ "$FAILURE_MODE" = HARD ]; then
455         $POWER_DOWN `facet_active_host $facet`
456         sleep 2 
457     elif [ "$FAILURE_MODE" = SOFT ]; then
458         stop $facet
459     fi
460 }
461
462 reboot_facet() {
463     facet=$1
464     if [ "$FAILURE_MODE" = HARD ]; then
465         $POWER_UP `facet_active_host $facet`
466     else
467         sleep 10
468     fi
469 }
470
471 # verify that lustre actually cleaned up properly
472 cleanup_check() {
473     [ -f $CATASTROPHE ] && [ `cat $CATASTROPHE` -ne 0 ] && \
474         error "LBUG/LASSERT detected"
475     BUSY=`dmesg | grep -i destruct || true`
476     if [ "$BUSY" ]; then
477         echo "$BUSY" 1>&2
478         [ -e $TMP/debug ] && mv $TMP/debug $TMP/debug-busy.`date +%s`
479         exit 205
480     fi
481     LEAK_LUSTRE=`dmesg | tail -n 30 | grep "obd mem.*leaked" || true`
482     LEAK_PORTALS=`dmesg | tail -n 20 | grep "Portals memory leaked" || true`
483     if [ "$LEAK_LUSTRE" -o "$LEAK_PORTALS" ]; then
484         echo "$0: $LEAK_LUSTRE" 1>&2
485         echo "$0: $LEAK_PORTALS" 1>&2
486         echo "$0: Memory leak(s) detected..." 1>&2
487         mv $TMP/debug $TMP/debug-leak.`date +%s`
488         exit 204
489     fi
490
491     [ "`lctl dl 2> /dev/null | wc -l`" -gt 0 ] && lctl dl && \
492         echo "$0: lustre didn't clean up..." 1>&2 && return 202 || true
493
494     if [ "`/sbin/lsmod 2>&1 | egrep 'lnet|libcfs'`" ]; then
495         echo "$0: modules still loaded..." 1>&2
496         /sbin/lsmod 1>&2
497         return 203
498     fi
499     return 0
500 }
501
502 wait_delete_completed () {
503     local TOTALPREV=`awk 'BEGIN{total=0}; {total+=$1}; END{print total}' \
504             $LPROC/osc/*/kbytesavail`
505
506     local WAIT=0
507     local MAX_WAIT=20
508     while [ "$WAIT" -ne "$MAX_WAIT" ]; do
509         sleep 1
510         TOTAL=`awk 'BEGIN{total=0}; {total+=$1}; END{print total}' \
511             $LPROC/osc/*/kbytesavail`
512         [ "$TOTAL" -eq "$TOTALPREV" ] && break
513         echo "Waiting delete completed ... prev: $TOTALPREV current: $TOTAL "
514         TOTALPREV=$TOTAL
515         WAIT=$(( WAIT + 1))
516     done
517     echo "Delete completed."
518 }
519
520 wait_for_host() {
521     HOST=$1
522     check_network "$HOST" 900
523     while ! do_node $HOST "ls -d $LUSTRE " > /dev/null; do sleep 5; done
524 }
525
526 wait_for() {
527     facet=$1
528     HOST=`facet_active_host $facet`
529     wait_for_host $HOST
530 }
531
532 wait_mds_recovery_done () {
533     local timeout=`do_facet mds cat /proc/sys/lustre/timeout`
534 #define OBD_RECOVERY_TIMEOUT (obd_timeout * 5 / 2)
535 # as we are in process of changing obd_timeout in different ways
536 # let's set MAX longer than that
537     MAX=$(( timeout * 4 ))
538     WAIT=0
539     while [ $WAIT -lt $MAX ]; do
540         STATUS=`do_facet mds grep status /proc/fs/lustre/mdt/*-MDT*/recovery_status`
541         echo $STATUS | grep COMPLETE && return 0
542         sleep 5
543         WAIT=$((WAIT + 5))
544         echo "Waiting $(($MAX - $WAIT)) secs for MDS recovery done"
545     done
546     echo "MDS recovery not done in $MAX sec"
547     return 1            
548 }
549
550 wait_exit_ST () {
551     local facet=$1
552
553     local WAIT=0
554     local INTERVAL=1
555     # conf-sanity 31 takes a long time cleanup
556     while [ $WAIT -lt 300 ]; do
557         running=$(do_facet ${facet} "[ -e $LPROC ] && grep ST' ' $LPROC/devices") || true
558         [ -z "${running}" ] && return 0
559         echo "waited $WAIT for${running}"
560         [ $INTERVAL -lt 64 ] && INTERVAL=$((INTERVAL + INTERVAL))
561         sleep $INTERVAL
562         WAIT=$((WAIT + INTERVAL))
563     done
564     echo "service didn't stop after $WAIT seconds.  Still running:"
565     echo ${running}
566     return 1
567 }
568
569 client_df() {
570     # not every config has many clients
571     if [ ! -z "$CLIENTS" ]; then
572         $PDSH $CLIENTS "df $MOUNT" > /dev/null
573     fi
574 }
575
576 client_reconnect() {
577     uname -n >> $MOUNT/recon
578     if [ ! -z "$CLIENTS" ]; then
579         $PDSH $CLIENTS "df $MOUNT; uname -n >> $MOUNT/recon" > /dev/null
580     fi
581     echo Connected clients:
582     cat $MOUNT/recon
583     ls -l $MOUNT/recon > /dev/null
584     rm $MOUNT/recon
585 }
586
587 facet_failover() {
588     facet=$1
589     echo "Failing $facet on node `facet_active_host $facet`"
590     shutdown_facet $facet
591     reboot_facet $facet
592     client_df &
593     DFPID=$!
594     echo "df pid is $DFPID"
595     change_active $facet
596     TO=`facet_active_host $facet`
597     echo "Failover $facet to $TO"
598     wait_for $facet
599     local dev=${facet}_dev
600     local opt=${facet}_opt
601     start $facet ${!dev} ${!opt} || error "Restart of $facet failed"
602 }
603
604 obd_name() {
605     local facet=$1
606 }
607
608 replay_barrier() {
609     local facet=$1
610     do_facet $facet sync
611     df $MOUNT
612     local svc=${facet}_svc
613     do_facet $facet $LCTL --device %${!svc} readonly
614     do_facet $facet $LCTL --device %${!svc} notransno
615     do_facet $facet $LCTL mark "$facet REPLAY BARRIER on ${!svc}"
616     $LCTL mark "local REPLAY BARRIER on ${!svc}"
617 }
618
619 replay_barrier_nodf() {
620     local facet=$1    echo running=${running}
621     do_facet $facet sync
622     local svc=${facet}_svc
623     echo Replay barrier on ${!svc}
624     do_facet $facet $LCTL --device %${!svc} readonly
625     do_facet $facet $LCTL --device %${!svc} notransno
626     do_facet $facet $LCTL mark "$facet REPLAY BARRIER on ${!svc}"
627     $LCTL mark "local REPLAY BARRIER on ${!svc}"
628 }
629
630 mds_evict_client() {
631     UUID=`cat /proc/fs/lustre/mdc/${mds1_svc}-mdc-*/uuid`
632     do_facet mds1 "echo $UUID > /proc/fs/lustre/mdt/${mds1_svc}/evict_client"
633 }
634
635 ost_evict_client() {
636     UUID=`grep ${ost1_svc}-osc- $LPROC/devices | egrep -v 'MDT' | awk '{print $5}'`
637     do_facet ost1 "echo $UUID > /proc/fs/lustre/obdfilter/${ost1_svc}/evict_client"
638 }
639
640 fail() {
641     facet_failover $* || error "failover: $?"
642     df $MOUNT || error "post-failover df: $?"
643 }
644
645 fail_abort() {
646     local facet=$1
647     stop $facet
648     change_active $facet
649     local svc=${facet}_svc
650     local dev=${facet}_dev
651     local opt=${facet}_opt
652     start $facet ${!dev} ${!opt}
653     do_facet $facet lctl --device %${!svc} abort_recovery
654     df $MOUNT || echo "first df failed: $?"
655     sleep 1
656     df $MOUNT || error "post-failover df: $?"
657 }
658
659 do_lmc() {
660     echo There is no lmc.  This is mountconf, baby.
661     exit 1
662 }
663
664 h2gm () {
665     if [ "$1" = "client" -o "$1" = "'*'" ]; then echo \'*\'; else
666         ID=`$PDSH $1 $GMNALNID -l | cut -d\  -f2`
667         echo $ID"@gm"
668     fi
669 }
670
671 h2name_or_ip() {
672     if [ "$1" = "client" -o "$1" = "'*'" ]; then echo \'*\'; else
673         echo $1"@$2" 
674     fi
675 }
676
677 h2ptl() {
678    if [ "$1" = "client" -o "$1" = "'*'" ]; then echo \'*\'; else
679        ID=`xtprocadmin -n $1 2>/dev/null | egrep -v 'NID' | awk '{print $1}'`
680        if [ -z "$ID" ]; then
681            echo "Could not get a ptl id for $1..."
682            exit 1
683        fi
684        echo $ID"@ptl"
685    fi
686 }
687 declare -fx h2ptl
688
689 h2tcp() {
690     h2name_or_ip "$1" "tcp"
691 }
692 declare -fx h2tcp
693
694 h2elan() {
695     if [ "$1" = "client" -o "$1" = "'*'" ]; then echo \'*\'; else
696         if type __h2elan >/dev/null 2>&1; then
697             ID=$(__h2elan $1)
698         else
699             ID=`echo $1 | sed 's/[^0-9]*//g'`
700         fi
701         echo $ID"@elan"
702     fi
703 }
704 declare -fx h2elan
705
706 h2openib() {
707     h2name_or_ip "$1" "openib"
708 }
709 declare -fx h2openib
710
711 h2o2ib() {
712     h2name_or_ip "$1" "o2ib"
713 }
714 declare -fx h2o2ib
715
716 facet_host() {
717     local facet=$1
718     varname=${facet}_HOST
719     if [ -z "${!varname}" ]; then
720         if [ "${facet:0:3}" == "ost" ]; then
721             eval ${facet}_HOST=${ost_HOST}
722         fi
723     fi
724     echo -n ${!varname}
725 }
726
727 facet_active() {
728     local facet=$1
729     local activevar=${facet}active
730
731     if [ -f ./${facet}active ] ; then
732         source ./${facet}active
733     fi
734
735     active=${!activevar}
736     if [ -z "$active" ] ; then 
737         echo -n ${facet}
738     else
739         echo -n ${active}
740     fi
741 }
742
743 facet_active_host() {
744     local facet=$1
745     local active=`facet_active $facet`
746     if [ "$facet" == client ]; then
747         hostname
748     else
749         echo `facet_host $active`
750     fi
751 }
752
753 change_active() {
754     local facet=$1
755     failover=${facet}failover 
756     host=`facet_host $failover`
757     [ -z "$host" ] && return
758     curactive=`facet_active $facet`
759     if [ -z "${curactive}" -o "$curactive" == "$failover" ] ; then
760         eval export ${facet}active=$facet
761     else
762         eval export ${facet}active=$failover
763     fi
764     # save the active host for this facet
765     activevar=${facet}active
766     echo "$activevar=${!activevar}" > ./$activevar
767 }
768
769 do_node() {
770     HOST=$1
771     shift
772     local myPDSH=$PDSH
773     if [ "$HOST" = "$(hostname)" ]; then
774         myPDSH="no_dsh"
775     fi
776     if $VERBOSE; then
777         echo "CMD: $HOST $@" >&2
778         $myPDSH $HOST $LCTL mark "$@" > /dev/null 2>&1 || :
779     fi
780     $myPDSH $HOST "(PATH=\$PATH:$RLUSTRE/utils:$RLUSTRE/tests:/sbin:/usr/sbin; cd $RPWD; sh -c \"$@\")" | sed "s/^${HOST}: //"
781     return ${PIPESTATUS[0]}
782 }
783
784 do_facet() {
785     facet=$1
786     shift
787     HOST=`facet_active_host $facet`
788     [ -z $HOST ] && echo No host defined for facet ${facet} && exit 1
789     do_node $HOST $@
790 }
791
792 add() {
793     local facet=$1
794     shift
795     # make sure its not already running
796     stop ${facet} -f
797     rm -f ${facet}active
798     do_facet ${facet} $MKFS $*
799 }
800
801 ostdevname() {
802     num=$1
803     DEVNAME=OSTDEV$num
804     #if $OSTDEVn isn't defined, default is $OSTDEVBASE + num
805     eval DEVPTR=${!DEVNAME:=${OSTDEVBASE}${num}}
806     echo -n $DEVPTR
807 }
808
809 mdsdevname() {
810     num=$1
811     DEVNAME=MDSDEV$num
812     #if $MDSDEVn isn't defined, default is $MDSDEVBASE + num
813     eval DEVPTR=${!DEVNAME:=${MDSDEVBASE}${num}}
814     echo -n $DEVPTR
815 }
816
817 ########
818 ## MountConf setup
819
820 stopall() {
821     # make sure we are using the primary server, so test-framework will
822     # be able to clean up properly.
823     activemds=`facet_active mds1`
824     if [ $activemds != "mds1" ]; then
825         fail mds1
826     fi
827     
828     # assume client mount is local 
829     grep " $MOUNT " /proc/mounts && zconf_umount `hostname` $MOUNT $*
830     grep " $MOUNT2 " /proc/mounts && zconf_umount `hostname` $MOUNT2 $*
831     for num in `seq $MDSCOUNT`; do
832         stop mds$num -f
833     done
834     for num in `seq $OSTCOUNT`; do
835         stop ost$num -f
836     done
837     return 0
838 }
839
840 cleanupall() {
841     stopall $*
842     unload_modules
843     cleanup_krb5_env
844 }
845
846 mdsmkfsopts()
847 {
848     local nr=$1
849     test $nr = 1 && echo -n $MDS_MKFS_OPTS || echo -n $MDSn_MKFS_OPTS
850 }
851
852 formatall() {
853     [ "$FSTYPE" ] && FSTYPE_OPT="--backfstype $FSTYPE"
854
855     stopall
856     # We need ldiskfs here, may as well load them all
857     load_modules
858     [ "$CLIENTONLY" ] && return
859     echo "Formatting mdts, osts"
860     for num in `seq $MDSCOUNT`; do
861         echo "Format mds$num: $(mdsdevname $num)"
862         if $VERBOSE; then
863             add mds$num `mdsmkfsopts $num` $FSTYPE_OPT --reformat `mdsdevname $num` || exit 9
864         else
865             add mds$num `mdsmkfsopts $num` $FSTYPE_OPT --reformat `mdsdevname $num` > /dev/null || exit 9
866         fi
867     done
868
869     for num in `seq $OSTCOUNT`; do
870         echo "Format ost$num: $(ostdevname $num)"
871         if $VERBOSE; then
872             add ost$num $OST_MKFS_OPTS --reformat `ostdevname $num` || exit 10
873         else
874             add ost$num $OST_MKFS_OPTS --reformat `ostdevname $num` > /dev/null || exit 10
875         fi
876     done
877 }
878
879 mount_client() {
880     grep " $1 " /proc/mounts || zconf_mount `hostname` $*
881 }
882
883 setupall() {
884     load_modules
885     init_krb5_env
886     if [ -z "$CLIENTONLY" ]; then
887         echo "Setup mdts, osts"
888         for num in `seq $MDSCOUNT`; do
889             DEVNAME=$(mdsdevname $num)
890             echo $REFORMAT | grep -q "reformat" \
891             || do_facet mds$num "$TUNEFS --writeconf $DEVNAME"
892             start mds$num $DEVNAME $MDS_MOUNT_OPTS
893         done
894         for num in `seq $OSTCOUNT`; do
895             DEVNAME=$(ostdevname $num)
896             start ost$num $DEVNAME $OST_MOUNT_OPTS
897         done
898     fi
899     [ "$DAEMONFILE" ] && $LCTL debug_daemon start $DAEMONFILE $DAEMONSIZE
900     mount_client $MOUNT
901     if [ "$MOUNT_2" ]; then
902         mount_client $MOUNT2
903     fi
904     sleep 5
905 }
906
907 mounted_lustre_filesystems() {
908         awk '($3 ~ "lustre" && $1 ~ ":") { print $2 }' /proc/mounts
909 }
910
911 check_and_setup_lustre() {
912     MOUNTED="`mounted_lustre_filesystems`"
913     if [ -z "$MOUNTED" ]; then
914         [ "$REFORMAT" ] && formatall
915         setupall
916         MOUNTED="`mounted_lustre_filesystems`"
917         [ -z "$MOUNTED" ] && error "NAME=$NAME not mounted"
918         export I_MOUNTED=yes
919     fi
920     if [ "$ONLY" == "setup" ]; then
921         exit 0
922     fi
923 }
924
925 cleanup_and_setup_lustre() {
926     if [ "$ONLY" == "cleanup" -o "`mount | grep $MOUNT`" ]; then
927         sysctl -w lnet.debug=0 || true
928         cleanupall
929         if [ "$ONLY" == "cleanup" ]; then 
930             exit 0
931         fi
932     fi
933     check_and_setup_lustre
934 }
935
936 check_and_cleanup_lustre() {
937     if [ "`mount | grep $MOUNT`" ]; then
938         rm -rf $DIR/[Rdfs][0-9]*
939         rm -f $DIR/${TESTSUITE}/[Rdfs][1-9]*
940     fi
941     if [ "$I_MOUNTED" = "yes" ]; then
942         cleanupall -f || error "cleanup failed"
943     fi
944     unset I_MOUNTED
945 }
946
947 ####### 
948 # General functions
949
950 check_network() {
951     local NETWORK=0
952     local WAIT=0
953     local MAX=$2
954     while [ $NETWORK -eq 0 ]; do
955         ping -c 1 -w 3 $1 > /dev/null
956         if [ $? -eq 0 ]; then
957             NETWORK=1
958         else
959             WAIT=$((WAIT + 5))
960             echo "waiting for $1, $((MAX - WAIT)) secs left"
961             sleep 5
962         fi
963         if [ $WAIT -gt $MAX ]; then
964             echo "Network not available"
965             exit 1
966         fi
967     done
968 }
969 check_port() {
970     while( !($DSH2 $1 "netstat -tna | grep -q $2") ) ; do
971         sleep 9
972     done
973 }
974
975 no_dsh() {
976     shift
977     eval $@
978 }
979
980 comma_list() {
981     # the sed converts spaces to commas, but leaves the last space
982     # alone, so the line doesn't end with a comma.
983     echo "$*" | tr -s " " "\n" | sort -b -u | tr "\n" " " | sed 's/ \([^$]\)/,\1/g'
984 }
985
986 absolute_path() {
987     (cd `dirname $1`; echo $PWD/`basename $1`)
988 }
989
990 ##################################
991 # OBD_FAIL funcs
992
993 drop_request() {
994 # OBD_FAIL_MDS_ALL_REQUEST_NET
995     RC=0
996     do_facet mds sysctl -w lustre.fail_loc=0x123
997     do_facet client "$1" || RC=$?
998     do_facet mds sysctl -w lustre.fail_loc=0
999     return $RC
1000 }
1001
1002 drop_reply() {
1003 # OBD_FAIL_MDS_ALL_REPLY_NET
1004     RC=0
1005     do_facet mds sysctl -w lustre.fail_loc=0x122
1006     do_facet client "$@" || RC=$?
1007     do_facet mds sysctl -w lustre.fail_loc=0
1008     return $RC
1009 }
1010
1011 drop_reint_reply() {
1012 # OBD_FAIL_MDS_REINT_NET_REP
1013     RC=0
1014     do_facet mds sysctl -w lustre.fail_loc=0x119
1015     do_facet client "$@" || RC=$?
1016     do_facet mds sysctl -w lustre.fail_loc=0
1017     return $RC
1018 }
1019
1020 pause_bulk() {
1021 #define OBD_FAIL_OST_BRW_PAUSE_BULK      0x214
1022     RC=0
1023     do_facet ost1 sysctl -w lustre.fail_loc=0x214
1024     do_facet client "$1" || RC=$?
1025     do_facet client "sync"
1026     do_facet ost1 sysctl -w lustre.fail_loc=0
1027     return $RC
1028 }
1029
1030 drop_ldlm_cancel() {
1031 #define OBD_FAIL_LDLM_CANCEL             0x304
1032     RC=0
1033     do_facet client sysctl -w lustre.fail_loc=0x304
1034     do_facet client "$@" || RC=$?
1035     do_facet client sysctl -w lustre.fail_loc=0
1036     return $RC
1037 }
1038
1039 drop_bl_callback() {
1040 #define OBD_FAIL_LDLM_BL_CALLBACK        0x305
1041     RC=0
1042     do_facet client sysctl -w lustre.fail_loc=0x305
1043     do_facet client "$@" || RC=$?
1044     do_facet client sysctl -w lustre.fail_loc=0
1045     return $RC
1046 }
1047
1048 drop_ldlm_reply() {
1049 #define OBD_FAIL_LDLM_REPLY              0x30c
1050     RC=0
1051     do_facet mds sysctl -w lustre.fail_loc=0x30c
1052     do_facet client "$@" || RC=$?
1053     do_facet mds sysctl -w lustre.fail_loc=0
1054     return $RC
1055 }
1056
1057 clear_failloc() {
1058     facet=$1
1059     pause=$2
1060     sleep $pause
1061     echo "clearing fail_loc on $facet"
1062     do_facet $facet "sysctl -w lustre.fail_loc=0"
1063 }
1064
1065 cancel_lru_locks() {
1066     $LCTL mark "cancel_lru_locks $1 start"
1067     for d in `find $LPROC/ldlm/namespaces | egrep -i $1`; do
1068         [ -f $d/lru_size ] && echo clear > $d/lru_size
1069         [ -f $d/lock_unused_count ] && grep [1-9] $d/lock_unused_count /dev/null
1070     done
1071     $LCTL mark "cancel_lru_locks $1 stop"
1072 }
1073
1074
1075 pgcache_empty() {
1076     for a in /proc/fs/lustre/llite/*/dump_page_cache; do
1077         if [ `wc -l $a | awk '{print $1}'` -gt 1 ]; then
1078             echo there is still data in page cache $a ?
1079             cat $a;
1080             return 1;
1081         fi
1082     done
1083     return 0
1084 }
1085
1086 debugsave() {
1087     DEBUGSAVE="$(sysctl -n lnet.debug)"
1088 }
1089
1090 debugrestore() {
1091     [ -n "$DEBUGSAVE" ] && sysctl -w lnet.debug="${DEBUGSAVE}"
1092     DEBUGSAVE=""
1093 }
1094
1095 ##################################
1096 # Test interface 
1097 ##################################
1098
1099 error() {
1100     local FAIL_ON_ERROR=${FAIL_ON_ERROR:-true}
1101     local TYPE=${TYPE:-"FAIL"}
1102     local ERRLOG
1103     sysctl -w lustre.fail_loc=0 2> /dev/null || true
1104     log " ${TESTSUITE} ${TESTNAME}: @@@@@@ ${TYPE}: $@ "
1105     ERRLOG=$TMP/lustre_${TESTSUITE}_${TESTNAME}.$(date +%s)
1106     echo "Dumping lctl log to $ERRLOG"
1107     # We need to dump the logs on all nodes
1108     local NODES=$(nodes_list)
1109     for NODE in $NODES; do
1110         do_node $NODE $LCTL dk $ERRLOG
1111     done
1112     debugrestore
1113     [ "$TESTSUITELOG" ] && echo "$0: ${TYPE}: $TESTNAME $@" >> $TESTSUITELOG
1114     if $FAIL_ON_ERROR; then
1115         exit 1
1116     fi
1117 }
1118
1119 # use only if we are ignoring failures for this test, bugno required.
1120 # (like ALWAYS_EXCEPT, but run the test and ignore the results.)
1121 # e.g. error_ignore 5494 "your message"
1122 error_ignore() {
1123     FAIL_ON_ERROR=false TYPE="IGNORE (bz$1)" error $2
1124 }
1125
1126 skip () {
1127         log " SKIP: ${TESTSUITE} ${TESTNAME} $@"
1128         [ "$TESTSUITELOG" ] && echo "${TESTSUITE}: SKIP: $TESTNAME $@" >> $TESTSUITELOG
1129 }
1130
1131 build_test_filter() {
1132     [ "$ONLY" ] && log "only running test `echo $ONLY`"
1133     for O in $ONLY; do
1134         eval ONLY_${O}=true
1135     done
1136     [ "$EXCEPT$ALWAYS_EXCEPT" ] && \
1137         log "skipping tests: `echo $EXCEPT $ALWAYS_EXCEPT`"
1138     [ "$EXCEPT_SLOW" ] && \
1139         log "skipping tests SLOW=no: `echo $EXCEPT_SLOW`"
1140     for E in $EXCEPT $ALWAYS_EXCEPT; do
1141         eval EXCEPT_${E}=true
1142     done
1143     for E in $EXCEPT_SLOW; do
1144         eval EXCEPT_SLOW_${E}=true
1145     done
1146     for G in $GRANT_CHECK_LIST; do
1147         eval GCHECK_ONLY_${G}=true
1148         done
1149 }
1150
1151 _basetest() {
1152     echo $*
1153 }
1154
1155 basetest() {
1156     IFS=abcdefghijklmnopqrstuvwxyz _basetest $1
1157 }
1158
1159 run_test() {
1160     export base=`basetest $1`
1161     if [ ! -z "$ONLY" ]; then
1162         testname=ONLY_$1
1163         if [ ${!testname}x != x ]; then
1164             run_one $1 "$2"
1165             return $?
1166         fi
1167         testname=ONLY_$base
1168         if [ ${!testname}x != x ]; then
1169             run_one $1 "$2"
1170             return $?
1171         fi
1172         echo -n "."
1173         return 0
1174     fi
1175     testname=EXCEPT_$1
1176     if [ ${!testname}x != x ]; then
1177         TESTNAME=test_$1 skip "skipping excluded test $1"
1178         return 0
1179     fi
1180     testname=EXCEPT_$base
1181     if [ ${!testname}x != x ]; then
1182         TESTNAME=test_$1 skip "skipping excluded test $1 (base $base)"
1183         return 0
1184     fi
1185     testname=EXCEPT_SLOW_$1
1186     if [ ${!testname}x != x ]; then
1187         TESTNAME=test_$1 skip "skipping SLOW test $1"
1188         return 0
1189     fi
1190     testname=EXCEPT_SLOW_$base
1191     if [ ${!testname}x != x ]; then
1192         TESTNAME=test_$1 skip "skipping SLOW test $1 (base $base)"
1193         return 0
1194     fi
1195
1196     run_one $1 "$2"
1197     
1198     return $?
1199 }
1200
1201 EQUALS="======================================================================"
1202 equals_msg() {
1203     msg="$@"
1204
1205     local suffixlen=$((${#EQUALS} - ${#msg}))
1206     [ $suffixlen -lt 5 ] && suffixlen=5
1207     log `echo $(printf '===== %s %.*s\n' "$msg" $suffixlen $EQUALS)`
1208 }
1209
1210 log() {
1211     echo "$*"
1212     lsmod | grep lnet > /dev/null || load_modules
1213
1214     local MSG="$*"
1215     # Get rif of '
1216     MSG=${MSG//\'/\\\'}
1217     MSG=${MSG//\(/\\\(}
1218     MSG=${MSG//\)/\\\)}
1219     MSG=${MSG//\;/\\\;}
1220     MSG=${MSG//\|/\\\|}
1221     local NODES=$(nodes_list)
1222     for NODE in $NODES; do
1223         do_node $NODE $LCTL mark "$MSG" 2> /dev/null || true
1224     done
1225 }
1226
1227 trace() {
1228         log "STARTING: $*"
1229         strace -o $TMP/$1.strace -ttt $*
1230         RC=$?
1231         log "FINISHED: $*: rc $RC"
1232         return 1
1233 }
1234
1235 pass() {
1236     echo PASS $@
1237 }
1238
1239 check_mds() {
1240     FFREE=`cat /proc/fs/lustre/mds/*/filesfree`
1241     FTOTAL=`cat /proc/fs/lustre/mds/*/filestotal`
1242     [ $FFREE -ge $FTOTAL ] && error "files free $FFREE > total $FTOTAL" || true
1243 }
1244
1245 run_one() {
1246     testnum=$1
1247     message=$2
1248     tfile=f${testnum}
1249     export tdir=d${TESTSUITE}/d${base}
1250     local SAVE_UMASK=`umask`
1251     umask 0022
1252     mkdir -p $DIR/$tdir
1253
1254     BEFORE=`date +%s`
1255     log "== test $testnum: $message ============ `date +%H:%M:%S` ($BEFORE)"
1256     #check_mds
1257     export TESTNAME=test_$testnum
1258     test_${testnum} || error "test_$testnum failed with $?"
1259     #check_mds
1260     check_grant ${testnum} || error "check_grant $testnum failed with $?"
1261     [ -f $CATASTROPHE ] && [ `cat $CATASTROPHE` -ne 0 ] && \
1262         error "LBUG/LASSERT detected"
1263     pass "($((`date +%s` - $BEFORE))s)"
1264     rmdir ${DIR}/$tdir >/dev/null 2>&1 || true
1265     unset TESTNAME
1266     unset tdir
1267     umask $SAVE_UMASK
1268     cd $SAVE_PWD
1269     $CLEANUP
1270 }
1271
1272 canonical_path() {
1273     (cd `dirname $1`; echo $PWD/`basename $1`)
1274 }
1275
1276 sync_clients() {
1277     [ -d $DIR1 ] && cd $DIR1 && sync; sleep 1; sync 
1278     [ -d $DIR2 ] && cd $DIR2 && sync; sleep 1; sync 
1279         cd $SAVE_PWD
1280 }
1281
1282 check_grant() {
1283     export base=`basetest $1`
1284     [ "$CHECK_GRANT" == "no" ] && return 0
1285
1286         testname=GCHECK_ONLY_${base}
1287         [ ${!testname}x == x ] && return 0
1288
1289         echo -n "checking grant......"
1290         cd $SAVE_PWD
1291         # write some data to sync client lost_grant
1292         rm -f $DIR1/${tfile}_check_grant_* 2>&1
1293         for i in `seq $OSTCOUNT`; do
1294                 $LFS setstripe $DIR1/${tfile}_check_grant_$i 0 $(($i -1)) 1
1295                 dd if=/dev/zero of=$DIR1/${tfile}_check_grant_$i bs=4k \
1296                                               count=1 > /dev/null 2>&1 
1297         done
1298         # sync all the data and make sure no pending data on server
1299         sync_clients
1300         
1301         #get client grant and server grant 
1302         client_grant=0
1303     for d in ${LPROC}/osc/*/cur_grant_bytes; do 
1304                 client_grant=$((client_grant + `cat $d`))
1305         done
1306         server_grant=0
1307         for d in ${LPROC}/obdfilter/*/tot_granted; do
1308                 server_grant=$((server_grant + `cat $d`))
1309         done
1310
1311         # cleanup the check_grant file
1312         for i in `seq $OSTCOUNT`; do
1313                 rm $DIR1/${tfile}_check_grant_$i
1314         done
1315
1316         #check whether client grant == server grant 
1317         if [ $client_grant != $server_grant ]; then
1318                 echo "failed: client:${client_grant} server: ${server_grant}"
1319                 return 1
1320         else
1321                 echo "pass"
1322         fi
1323 }
1324
1325 ########################
1326 # helper functions
1327
1328 osc_to_ost()
1329 {
1330     osc=$1
1331     ost=`echo $1 | awk -F_ '{print $3}'`
1332     if [ -z $ost ]; then
1333         ost=`echo $1 | sed 's/-osc.*//'`
1334     fi
1335     echo $ost
1336 }
1337
1338 remote_mds ()
1339 {
1340     [ ! -e /proc/fs/lustre/mdt/*MDT* ]
1341 }
1342
1343 remote_ost ()
1344 {
1345     [ $(grep -c obdfilter $LPROC/devices) -eq 0 ]
1346 }
1347
1348 mdts_nodes () {
1349     local MDSNODES=$(facet_host $SINGLEMDS)
1350
1351     # FIXME: Currenly we use only $SINGLEMDS,
1352     # should be fixed when we will start to test cmd.
1353     echo $MDSNODES
1354     return
1355
1356     for num in `seq $MDSCOUNT`; do
1357         local myMDS=$(facet_host mds$num)
1358         [[ ! '\ '"$MDSNODES"'\ ' = *'\ '"$myMDS"'\ '* ]] && MDSNODES="$MDSNODES $myMDS"
1359     done
1360
1361     echo $MDSNODES
1362 }
1363
1364 osts_nodes () {
1365     local OSTNODES=$(facet_host ost1)
1366
1367     for num in `seq $OSTCOUNT`; do
1368         local myOST=$(facet_host ost$num)
1369         [[ ! '\ '"$OSTNODES"'\ ' = *'\ '"$myOST"'\ '* ]] && OSTNODES="$OSTNODES $myOST"
1370     done
1371
1372     echo $OSTNODES
1373 }
1374
1375 nodes_list () {
1376     # FIXME. We need a list of clients
1377     local myNODES=`hostname`
1378
1379     local OSTNODES=$(osts_nodes)
1380     local myOSTNODES=`echo ' '"$OSTNODES"' ' | sed -e s/[\ ]$(hostname)[\ ]/\ /`
1381     [ -n "$myOSTNODES" ] && myNODES="$myNODES $myOSTNODES"
1382
1383     local myNODES=${myNODES% } 
1384     # Add to list only not listed mds nodes
1385     local MDSNODES=$(mdts_nodes)
1386     for myMDS in $MDSNODES; do
1387         [[ ! "'\ '$myNODES'\ '" = *'\ '"$myMDS"'\ '* ]] && myNODES="$myNODES $myMDS"
1388     done
1389
1390     echo $myNODES
1391 }
1392
1393 is_patchless ()
1394 {
1395     grep -q patchless $LPROC/version
1396 }
1397
1398 check_runas_id() {
1399     local myRUNAS_ID=$1
1400     shift
1401     local myRUNAS=$@
1402     mkdir $DIR/d0_runas_test
1403     chmod 0755 $DIR
1404     chown $myRUNAS_ID:$myRUNAS_ID $DIR/d0_runas_test
1405     $myRUNAS touch $DIR/d0_runas_test/f$$ || \
1406         error "unable to write to $DIR/d0_runas_test as UID $myRUNAS_ID. 
1407         Please set RUNAS_ID to some UID which exists on MDS and client or 
1408         add user $myRUNAS_ID:$myRUNAS_ID on these nodes."
1409     rm -rf $DIR/d0_runas_test
1410 }