Whamcloud - gitweb
c322f952762276308ce645650d645643ccdbbc8e
[fs/lustre-release.git] / lustre / tests / sanityN.sh
1 #!/bin/bash
2
3 set -e
4
5 ONLY=${ONLY:-"$*"}
6 # bug number for skipped test: 3192 15528/3811 16929 9977 15528/11549 18080
7 ALWAYS_EXCEPT="                14b  19         22    28   29          35    $SANITYN_EXCEPT"
8 # UPDATE THE COMMENT ABOVE WITH BUG NUMBERS WHEN CHANGING ALWAYS_EXCEPT!
9
10 # bug number for skipped test:                                                    12652 12652
11 grep -q 'Enterprise Server 10' /etc/SuSE-release && ALWAYS_EXCEPT="$ALWAYS_EXCEPT 11    14" || true
12
13 # Tests that fail on uml
14 [ "$UML" = "true" ] && EXCEPT="$EXCEPT 7"
15
16 # Join file feature is not supported currently.
17 # It will be ported soon.
18 EXCEPT="$EXCEPT 22"
19
20 SRCDIR=`dirname $0`
21 PATH=$PWD/$SRCDIR:$SRCDIR:$SRCDIR/../utils:$PATH
22
23 SIZE=${SIZE:-40960}
24 CHECKSTAT=${CHECKSTAT:-"checkstat -v"}
25 GETSTRIPE=${GETSTRIPE:-lfs getstripe}
26 SETSTRIPE=${SETSTRIPE:-lstripe}
27 MCREATE=${MCREATE:-mcreate}
28 OPENFILE=${OPENFILE:-openfile}
29 OPENUNLINK=${OPENUNLINK:-openunlink}
30 TRUNCATE=${TRUNCATE:-truncate}
31 export TMP=${TMP:-/tmp}
32 MOUNT_2=${MOUNT_2:-"yes"}
33 CHECK_GRANT=${CHECK_GRANT:-"yes"}
34 GRANT_CHECK_LIST=${GRANT_CHECK_LIST:-""}
35
36 SAVE_PWD=$PWD
37
38 export NAME=${NAME:-local}
39
40 LUSTRE=${LUSTRE:-`dirname $0`/..}
41 . $LUSTRE/tests/test-framework.sh
42 CLEANUP=${CLEANUP:-:}
43 SETUP=${SETUP:-:}
44 init_test_env $@
45 . ${CONFIG:=$LUSTRE/tests/cfg/$NAME.sh}
46
47 [ "$SLOW" = "no" ] && EXCEPT_SLOW="12 16 33a"
48
49 SANITYLOG=${TESTSUITELOG:-$TMP/$(basename $0 .sh).log}
50 FAIL_ON_ERROR=false
51
52 SETUP=${SETUP:-:}
53 TRACE=${TRACE:-""}
54
55 [ "$SANITYLOG" ] && rm -f $SANITYLOG || true
56
57 check_and_setup_lustre
58
59 LOVNAME=`lctl get_param -n llite.*.lov.common_name | tail -n 1`
60 OSTCOUNT=`lctl get_param -n lov.$LOVNAME.numobd`
61
62 assert_DIR
63 rm -rf $DIR1/[df][0-9]* $DIR1/lnk
64
65 # $RUNAS_ID may get set incorrectly somewhere else
66 [ $UID -eq 0 -a $RUNAS_ID -eq 0 ] && error "\$RUNAS_ID set to 0, but \$UID is also 0!"
67
68 check_runas_id $RUNAS_ID $RUNAS_ID $RUNAS
69
70 build_test_filter
71
72 test_1a() {
73         touch $DIR1/f1
74         [ -f $DIR2/f1 ] || error
75 }
76 run_test 1a "check create on 2 mtpt's =========================="
77
78 test_1b() {
79         chmod 777 $DIR2/f1
80         $CHECKSTAT -t file -p 0777 $DIR1/f1 || error
81         chmod a-x $DIR2/f1
82 }
83 run_test 1b "check attribute updates on 2 mtpt's ==============="
84
85 test_1c() {
86         $CHECKSTAT -t file -p 0666 $DIR1/f1 || error
87 }
88 run_test 1c "check after remount attribute updates on 2 mtpt's ="
89
90 test_1d() {
91         rm $DIR2/f1
92         $CHECKSTAT -a $DIR1/f1 || error
93 }
94 run_test 1d "unlink on one mountpoint removes file on other ===="
95
96 test_2a() {
97         touch $DIR1/f2a
98         ls -l $DIR2/f2a
99         chmod 777 $DIR2/f2a
100         $CHECKSTAT -t file -p 0777 $DIR1/f2a || error
101 }
102 run_test 2a "check cached attribute updates on 2 mtpt's ========"
103
104 test_2b() {
105         touch $DIR1/f2b
106         ls -l $DIR2/f2b
107         chmod 777 $DIR1/f2b
108         $CHECKSTAT -t file -p 0777 $DIR2/f2b || error
109 }
110 run_test 2b "check cached attribute updates on 2 mtpt's ========"
111
112 # NEED TO SAVE ROOT DIR MODE
113 test_2c() {
114         chmod 777 $DIR1
115         $CHECKSTAT -t dir -p 0777 $DIR2 || error
116 }
117 run_test 2c "check cached attribute updates on 2 mtpt's root ==="
118
119 test_2d() {
120         chmod 755 $DIR1
121         $CHECKSTAT -t dir -p 0755 $DIR2 || error
122 }
123 run_test 2d "check cached attribute updates on 2 mtpt's root ==="
124
125 test_2e() {
126         chmod 755 $DIR1
127         ls -l $DIR1
128         ls -l $DIR2
129         chmod 777 $DIR1
130         $RUNAS dd if=/dev/zero of=$DIR2/$tfile count=1 || error
131 }
132 run_test 2e "check chmod on root is propagated to others"
133
134 test_3() {
135         ( cd $DIR1 ; ln -s this/is/good $tfile )
136         [ "this/is/good" = "`perl -e 'print readlink("'$DIR2/$tfile'");'`" ] ||
137                 error "link $DIR2/$tfile not as expected"
138 }
139 run_test 3 "symlink on one mtpt, readlink on another ==========="
140
141 test_4() {
142         multifstat $DIR1/f4 $DIR2/f4
143 }
144 run_test 4 "fstat validation on multiple mount points =========="
145
146 test_5() {
147         mcreate $DIR1/f5
148         truncate $DIR2/f5 100
149         $CHECKSTAT -t file -s 100 $DIR1/f5 || error
150         rm $DIR1/f5
151 }
152 run_test 5 "create a file on one mount, truncate it on the other"
153
154 test_6() {
155         openunlink $DIR1/$tfile $DIR2/$tfile || \
156                 error "openunlink $DIR1/$tfile $DIR2/$tfile"
157 }
158 run_test 6 "remove of open file on other node =================="
159
160 test_7() {
161         local dir=d7
162         opendirunlink $DIR1/$dir $DIR2/$dir || \
163                 error "opendirunlink $DIR1/$dir $DIR2/$dir"
164 }
165 run_test 7 "remove of open directory on other node ============="
166
167 test_8() {
168         opendevunlink $DIR1/$tfile $DIR2/$tfile || \
169                 error "opendevunlink $DIR1/$tfile $DIR2/$tfile"
170 }
171 run_test 8 "remove of open special file on other node =========="
172
173 test_9() {
174         MTPT=1
175         local dir
176         > $DIR2/f9
177         for C in a b c d e f g h i j k l; do
178                 dir=`eval echo \\$DIR$MTPT`
179                 echo -n $C >> $dir/f9
180                 [ "$MTPT" -eq 1 ] && MTPT=2 || MTPT=1
181         done
182         [ "`cat $DIR1/f9`" = "abcdefghijkl" ] || \
183                 error "`od -a $DIR1/f9` != abcdefghijkl"
184 }
185 run_test 9 "append of file with sub-page size on multiple mounts"
186
187 test_10a() {
188         MTPT=1
189         local dir
190         OFFSET=0
191         > $DIR2/f10
192         for C in a b c d e f g h i j k l; do
193                 dir=`eval echo \\$DIR$MTPT`
194                 echo -n $C | dd of=$dir/f10 bs=1 seek=$OFFSET count=1
195                 [ "$MTPT" -eq 1 ] && MTPT=2 || MTPT=1
196                 OFFSET=`expr $OFFSET + 1`
197         done
198         [ "`cat $DIR1/f10`" = "abcdefghijkl" ] || \
199                 error "`od -a $DIR1/f10` != abcdefghijkl"
200 }
201 run_test 10a "write of file with sub-page size on multiple mounts "
202
203 test_10b() {
204         # create a seed file
205         yes "R" | head -c 4000 >$TMP/f10b-seed
206         dd if=$TMP/f10b-seed of=$DIR1/f10b bs=3k count=1 || error "dd $DIR1"
207
208         truncate $DIR1/f10b 4096 || error "truncate 4096"
209
210         dd if=$DIR2/f10b of=$TMP/f10b-lustre bs=4k count=1 || error "dd $DIR2"
211
212         # create a test file locally to compare
213         dd if=$TMP/f10b-seed of=$TMP/f10b bs=3k count=1 || error "dd random"
214         truncate $TMP/f10b 4096 || error "truncate 4096"
215         cmp $TMP/f10b $TMP/f10b-lustre || error "file miscompare"
216         rm $TMP/f10b $TMP/f10b-lustre $TMP/f10b-seed
217 }
218 run_test 10b "write of file with sub-page size on multiple mounts "
219
220 test_11() {
221         mkdir $DIR1/d11
222         multiop_bg_pause $DIR1/d11/f O_c || return 1
223         MULTIPID=$!
224         cp -p /bin/ls $DIR1/d11/f
225         $DIR2/d11/f
226         RC=$?
227         kill -USR1 $MULTIPID
228         wait $MULTIPID || error
229         [ $RC -eq 0 ] && error || true
230 }
231 run_test 11 "execution of file opened for write should return error ===="
232
233 test_12() {
234        DIR=$DIR DIR2=$DIR2 sh lockorder.sh
235 }
236 run_test 12 "test lock ordering (link, stat, unlink) ==========="
237
238 test_13() {     # bug 2451 - directory coherency
239        rm -rf $DIR1/d13
240        mkdir $DIR1/d13 || error
241        cd $DIR1/d13 || error
242        ls
243        ( touch $DIR1/d13/f13 ) # needs to be a separate shell
244        ls
245        rm -f $DIR2/d13/f13 || error
246        ls 2>&1 | grep f13 && error "f13 shouldn't return an error (1)" || true
247        # need to run it twice
248        ( touch $DIR1/d13/f13 ) # needs to be a separate shell
249        ls
250        rm -f $DIR2/d13/f13 || error
251        ls 2>&1 | grep f13 && error "f13 shouldn't return an error (2)" || true
252 }
253 run_test 13 "test directory page revocation ===================="
254
255 test_14() {
256         mkdir -p $DIR1/$tdir
257         cp -p /bin/ls $DIR1/$tdir/$tfile
258         multiop_bg_pause $DIR1/$tdir/$tfile Ow_c || return 1
259         MULTIPID=$!
260
261         $DIR2/$tdir/$tfile && error || true
262         kill -USR1 $MULTIPID
263         wait $MULTIPID || return 2
264 }
265 run_test 14 "execution of file open for write returns -ETXTBSY ="
266
267 test_14a() {
268         mkdir -p $DIR1/d14
269         cp -p `which multiop` $DIR1/d14/multiop || error "cp failed"
270         MULTIOP_PROG=$DIR1/d14/multiop multiop_bg_pause $TMP/test14.junk O_c || return 1
271         MULTIOP_PID=$!
272         multiop $DIR2/d14/multiop Oc && error "expected error, got success"
273         kill -USR1 $MULTIOP_PID || return 2
274         wait $MULTIOP_PID || return 3
275         rm $TMP/test14.junk $DIR1/d14/multiop || error "removing multiop"
276 }
277 run_test 14a "open(RDWR) of executing file returns -ETXTBSY ===="
278
279 test_14b() { # bug 3192, 7040
280         mkdir -p $DIR1/d14
281         cp -p `which multiop` $DIR1/d14/multiop || error "cp failed"
282         MULTIOP_PROG=$DIR1/d14/multiop multiop_bg_pause $TMP/test14.junk O_c || return 1
283         MULTIOP_PID=$!
284         truncate $DIR2/d14/multiop 0 && kill -9 $MULTIOP_PID && \
285                 error "expected truncate error, got success"
286         kill -USR1 $MULTIOP_PID || return 2
287         wait $MULTIOP_PID || return 3
288         cmp `which multiop` $DIR1/d14/multiop || error "binary changed"
289         rm $TMP/test14.junk $DIR1/d14/multiop || error "removing multiop"
290 }
291 run_test 14b "truncate of executing file returns -ETXTBSY ======"
292
293 test_14c() { # bug 3430, 7040
294         mkdir -p $DIR1/d14
295         cp -p `which multiop` $DIR1/d14/multiop || error "cp failed"
296         MULTIOP_PROG=$DIR1/d14/multiop multiop_bg_pause $TMP/test14.junk O_c || return 1
297         MULTIOP_PID=$!
298         cp /etc/hosts $DIR2/d14/multiop && error "expected error, got success"
299         kill -USR1 $MULTIOP_PID || return 2
300         wait $MULTIOP_PID || return 3
301         cmp `which multiop` $DIR1/d14/multiop || error "binary changed"
302         rm $TMP/test14.junk $DIR1/d14/multiop || error "removing multiop"
303 }
304 run_test 14c "open(O_TRUNC) of executing file return -ETXTBSY =="
305
306 test_14d() { # bug 10921
307         mkdir -p $DIR1/d14
308         cp -p `which multiop` $DIR1/d14/multiop || error "cp failed"
309         MULTIOP_PROG=$DIR1/d14/multiop multiop_bg_pause $TMP/test14.junk O_c || return 1
310         MULTIOP_PID=$!
311         log chmod
312         chmod 600 $DIR1/d14/multiop || error "chmod failed"
313         kill -USR1 $MULTIOP_PID || return 2
314         wait $MULTIOP_PID || return 3
315         cmp `which multiop` $DIR1/d14/multiop || error "binary changed"
316         rm $TMP/test14.junk $DIR1/d14/multiop || error "removing multiop"
317 }
318 run_test 14d "chmod of executing file is still possible ========"
319
320 test_15() {     # bug 974 - ENOSPC
321         echo "PATH=$PATH"
322         sh oos2.sh $MOUNT1 $MOUNT2
323         grant_error=`dmesg | grep "> available"`
324         [ -z "$grant_error" ] || error "$grant_error"
325 }
326 run_test 15 "test out-of-space with multiple writers ==========="
327
328 test_16() {
329         rm -f $MOUNT1/fsxfile
330         lfs setstripe $MOUNT1/fsxfile -c -1 # b=10919
331         fsx -c 50 -p 100 -N 2500 -l $((SIZE * 256)) -S 0 $MOUNT1/fsxfile $MOUNT2/fsxfile
332 }
333 run_test 16 "2500 iterations of dual-mount fsx ================="
334
335 test_17() { # bug 3513, 3667
336         remote_ost_nodsh && skip "remote OST with nodsh" && return
337
338         lfs setstripe $DIR1/$tfile -i 0 -c 1
339         cp /etc/termcap $DIR1/$tfile
340         cancel_lru_locks osc > /dev/null
341         #define OBD_FAIL_ONCE|OBD_FAIL_LDLM_CREATE_RESOURCE    0x30a
342         do_facet ost1 lctl set_param fail_loc=0x8000030a
343         ls -ls $DIR1/$tfile | awk '{ print $1,$6 }' > $DIR1/$tfile-1 & \
344         ls -ls $DIR2/$tfile | awk '{ print $1,$6 }' > $DIR2/$tfile-2
345         wait
346         diff -u $DIR1/$tfile-1 $DIR2/$tfile-2 || error "files are different"
347 }
348 run_test 17 "resource creation/LVB creation race ==============="
349
350 test_18() {
351         ./mmap_sanity -d $MOUNT1 -m $MOUNT2
352         sync; sleep 1; sync
353 }
354 run_test 18 "mmap sanity check ================================="
355
356 test_19() { # bug3811
357         [ -d /proc/fs/lustre/obdfilter ] || return 0
358
359         MAX=`lctl get_param -n obdfilter.*.readcache_max_filesize | head -n 1`
360         lctl set_param -n obdfilter.*OST*.readcache_max_filesize=4096
361         dd if=/dev/urandom of=$TMP/f19b bs=512k count=32
362         SUM=`cksum $TMP/f19b | cut -d" " -f 1,2`
363         cp $TMP/f19b $DIR1/f19b
364         for i in `seq 1 20`; do
365                 [ $((i % 5)) -eq 0 ] && log "test_18 loop $i"
366                 cancel_lru_locks osc > /dev/null
367                 cksum $DIR1/f19b | cut -d" " -f 1,2 > $TMP/sum1 & \
368                 cksum $DIR2/f19b | cut -d" " -f 1,2 > $TMP/sum2
369                 wait
370                 [ "`cat $TMP/sum1`" = "$SUM" ] || \
371                         error "$DIR1/f19b `cat $TMP/sum1` != $SUM"
372                 [ "`cat $TMP/sum2`" = "$SUM" ] || \
373                         error "$DIR2/f19b `cat $TMP/sum2` != $SUM"
374         done
375         lctl set_param -n obdfilter.*OST*.readcache_max_filesize=$MAX
376         rm $DIR1/f19b
377 }
378 run_test 19 "test concurrent uncached read races ==============="
379
380 test_20() {
381         mkdir $DIR1/d20
382         cancel_lru_locks osc
383         CNT=$((`lctl get_param -n llite.*.dump_page_cache | wc -l`))
384         multiop $DIR1/f20 Ow8190c
385         multiop $DIR2/f20 Oz8194w8190c
386         multiop $DIR1/f20 Oz0r8190c
387         cancel_lru_locks osc
388         CNTD=$((`lctl get_param -n llite.*.dump_page_cache | wc -l` - $CNT))
389         [ $CNTD -gt 0 ] && \
390             error $CNTD" page left in cache after lock cancel" || true
391 }
392 run_test 20 "test extra readahead page left in cache ===="
393
394 cleanup_21() {
395         trap 0
396         umount $DIR1/d21
397 }
398
399 test_21() { # Bug 5907
400         mkdir $DIR1/d21
401         mount /etc $DIR1/d21 --bind || error "mount failed" # Poor man's mount.
402         trap cleanup_21 EXIT
403         rmdir -v $DIR1/d21 && error "Removed mounted directory"
404         rmdir -v $DIR2/d21 && echo "Removed mounted directory from another mountpoint, needs to be fixed"
405         test -d $DIR1/d21 || error "Mounted directory disappeared"
406         cleanup_21
407         test -d $DIR2/d21 || test -d $DIR1/d21 && error "Removed dir still visible after umount"
408         true
409 }
410 run_test 21 " Try to remove mountpoint on another dir ===="
411
412 JOIN=${JOIN:-"lfs join"}
413
414 test_22() { # Bug 9926
415         mkdir $DIR1/d21
416         dd if=/dev/urandom of=$DIR1/d21/128k bs=1024 count=128
417         cp -p $DIR1/d21/128k $DIR1/d21/f_head
418         for ((i=0;i<10;i++)); do
419                 cp -p $DIR1/d21/128k $DIR1/d21/f_tail
420                 $JOIN $DIR1/d21/f_head $DIR1/d21/f_tail || error "join error"
421                 $CHECKSTAT -a $DIR1/d21/f_tail || error "tail file exist after join"
422         done
423         echo aaaaaaaaaaa >> $DIR1/d21/no_joined
424
425         mv $DIR2/d21/f_head $DIR2/
426         munlink $DIR2/f_head || error "unlink joined file error"
427         cat $DIR2/d21/no_joined || error "cat error"
428         rm -rf $DIR2/d21/no_joined || error "unlink normal file error"
429 }
430 run_test 22 " After joining in one dir,  open/close unlink file in anther dir"
431
432 test_23() { # Bug 5972
433         echo "others should see updated atime while another read" > $DIR1/f23
434         
435         # clear the lock(mode: LCK_PW) gotten from creating operation
436         cancel_lru_locks osc
437         
438         time1=`date +%s`        
439         sleep 2
440         
441         multiop_bg_pause $DIR1/f23 or20_c || return 1
442         MULTIPID=$!
443
444         time2=`stat -c "%X" $DIR2/f23`
445
446         if (( $time2 <= $time1 )); then
447                 kill -USR1 $MULTIPID
448                 error "atime doesn't update among nodes"
449         fi
450
451         kill -USR1 $MULTIPID || return 1
452         rm -f $DIR1/f23 || error "rm -f $DIR1/f23 failed"
453         true
454 }
455 run_test 23 " others should see updated atime while another read===="
456
457 test_24() {
458         touch $DIR1/$tfile
459         lfs df || error "lfs df failed"
460         lfs df -ih || error "lfs df -ih failed"
461         lfs df -h $DIR1 || error "lfs df -h $DIR1 failed"
462         lfs df -i $DIR2 || error "lfs df -i $DIR2 failed"
463         lfs df $DIR1/$tfile || error "lfs df $DIR1/$tfile failed"
464         lfs df -ih $DIR2/$tfile || error "lfs df -ih $DIR2/$tfile failed"
465         
466         OSC=`lctl dl | awk '/-osc-|OSC.*MNT/ {print $4}' | head -n 1`
467 #       OSC=`lctl dl | awk '/-osc-/ {print $4}' | head -n 1`
468         lctl --device %$OSC deactivate
469         lfs df -i || error "lfs df -i with deactivated OSC failed"
470         lctl --device %$OSC recover
471         lfs df || error "lfs df with reactivated OSC failed"
472 }
473 run_test 24 "lfs df [-ih] [path] test ========================="
474
475 test_25() {
476         [ `lctl get_param -n mdc.*-mdc-*.connect_flags | grep -c acl` -lt 2 ] && \
477             skip "must have acl, skipping" && return
478
479         mkdir -p $DIR1/$tdir
480         touch $DIR1/$tdir/f1 || error "touch $DIR1/$tdir/f1"
481         chmod 0755 $DIR1/$tdir/f1 || error "chmod 0755 $DIR1/$tdir/f1"
482
483         $RUNAS $CHECKSTAT $DIR2/$tdir/f1 || error "checkstat $DIR2/$tdir/f1 #1"
484         setfacl -m u:$RUNAS_ID:--- $DIR1/$tdir || error "setfacl $DIR2/$tdir #1"
485         $RUNAS $CHECKSTAT $DIR2/$tdir/f1 && error "checkstat $DIR2/$tdir/f1 #2"
486         setfacl -m u:$RUNAS_ID:r-x $DIR1/$tdir || error "setfacl $DIR2/$tdir #2"
487         $RUNAS $CHECKSTAT $DIR2/$tdir/f1 || error "checkstat $DIR2/$tdir/f1 #3"
488         setfacl -m u:$RUNAS_ID:--- $DIR1/$tdir || error "setfacl $DIR2/$tdir #3"
489         $RUNAS $CHECKSTAT $DIR2/$tdir/f1 && error "checkstat $DIR2/$tdir/f1 #4"
490         setfacl -x u:$RUNAS_ID: $DIR1/$tdir || error "setfacl $DIR2/$tdir #4"
491         $RUNAS $CHECKSTAT $DIR2/$tdir/f1 || error "checkstat $DIR2/$tdir/f1 #5"
492
493         rm -rf $DIR1/$tdir
494 }
495 run_test 25 "change ACL on one mountpoint be seen on another ==="
496
497 test_26a() {
498         utime $DIR1/f26a -s $DIR2/f26a || error
499 }
500 run_test 26a "allow mtime to get older"
501
502 test_26b() {
503         touch $DIR1/$tfile
504         sleep 1
505         echo "aaa" >> $DIR1/$tfile
506         sleep 1
507         chmod a+x $DIR2/$tfile
508         mt1=`stat -c %Y $DIR1/$tfile`
509         mt2=`stat -c %Y $DIR2/$tfile`
510
511         if [ x"$mt1" != x"$mt2" ]; then
512                 error "not equal mtime, client1: "$mt1", client2: "$mt2"."
513         fi
514 }
515 run_test 26b "sync mtime between ost and mds"
516
517 test_27() {
518         cancel_lru_locks osc
519         lctl clear
520         dd if=/dev/zero of=$DIR2/$tfile bs=$((4096+4))k conv=notrunc count=4 seek=3 &
521         DD2_PID=$!
522         usleep 50
523         log "dd 1 started"
524         
525         dd if=/dev/zero of=$DIR1/$tfile bs=$((16384-1024))k conv=notrunc count=1 seek=4 &
526         DD1_PID=$!
527         log "dd 2 started"
528         
529         sleep 1
530         dd if=/dev/zero of=$DIR1/$tfile bs=8k conv=notrunc count=1 seek=0
531         log "dd 3 finished"
532         lctl set_param -n ldlm.dump_namespaces ""
533         wait $DD1_PID $DD2_PID
534         [ $? -ne 0 ] && lctl dk $TMP/debug || true
535 }
536 run_test 27 "align non-overlapping extent locks from request ==="
537
538 test_28() { # bug 9977
539         ECHO_UUID="ECHO_osc1_UUID"
540         tOST=`$LCTL dl | | awk '/-osc-|OSC.*MNT/ { print $4 }' | head -1`
541
542         lfs setstripe $DIR1/$tfile -s 1048576 -i 0 -c 2
543         tOBJID=`lfs getstripe $DIR1/$tfile |grep "^[[:space:]]\+1" |awk '{print $2}'`
544         dd if=/dev/zero of=$DIR1/$tfile bs=1024k count=2
545
546         $LCTL <<-EOF
547                 newdev
548                 attach echo_client ECHO_osc1 $ECHO_UUID
549                 setup $tOST
550         EOF
551
552         tECHOID=`$LCTL dl | grep $ECHO_UUID | awk '{print $1}'`
553         $LCTL --device $tECHOID destroy "${tOBJID}:0"
554
555         $LCTL <<-EOF
556                 cfg_device ECHO_osc1
557                 cleanup
558                 detach
559         EOF
560
561         # reading of 1st stripe should pass
562         dd if=$DIR2/$tfile of=/dev/null bs=1024k count=1 || error
563         # reading of 2nd stripe should fail (this stripe was destroyed)
564         dd if=$DIR2/$tfile of=/dev/null bs=1024k count=1 skip=1 && error
565
566         # now, recreating test file
567         dd if=/dev/zero of=$DIR1/$tfile bs=1024k count=2 || error
568         # reading of 1st stripe should pass
569         dd if=$DIR2/$tfile of=/dev/null bs=1024k count=1 || error
570         # reading of 2nd stripe should pass
571         dd if=$DIR2/$tfile of=/dev/null bs=1024k count=1 skip=1 || error
572 }
573 run_test 28 "read/write/truncate file with lost stripes"
574
575 test_29() { # bug 10999
576         touch $DIR1/$tfile
577         #define OBD_FAIL_LDLM_GLIMPSE  0x30f
578         lctl set_param fail_loc=0x8000030f
579         ls -l $DIR2/$tfile &
580         usleep 500
581         dd if=/dev/zero of=$DIR1/$tfile bs=4k count=1
582         wait
583 }
584 #bug 11549 - permanently turn test off in b1_5
585 run_test 29 "lock put race between glimpse and enqueue ========="
586
587 test_30() { #bug #11110
588     mkdir -p $DIR1/$tdir
589     cp -f /bin/bash $DIR1/$tdir/bash
590     /bin/sh -c 'sleep 1; rm -f $DIR2/$tdir/bash; cp /bin/bash $DIR2/$tdir' &
591     err=$($DIR1/$tdir/bash -c 'sleep 2; openfile -f O_RDONLY /proc/$$/exe >& /dev/null; echo $?')
592     wait
593     [ $err -ne 116 ] && error_ignore 12900 "return code ($err) != -ESTALE" && return
594     true
595 }
596
597 run_test 30 "recreate file race ========="
598
599 test_31a() {
600         mkdir -p $DIR1/$tdir || error "Creating dir $DIR1/$tdir"
601         writes=`LANG=C dd if=/dev/zero of=$DIR/$tdir/$tfile count=1 2>&1 |
602                 awk 'BEGIN { FS="+" } /out/ {print $1}'`
603         #define OBD_FAIL_LDLM_CANCEL_BL_CB_RACE   0x314
604         lctl set_param fail_loc=0x314
605         reads=`LANG=C dd if=$DIR2/$tdir/$tfile of=/dev/null 2>&1 |
606                awk 'BEGIN { FS="+" } /in/ {print $1}'`
607         [ $reads -eq $writes ] || error "read" $reads "blocks, must be" $writes
608 }
609 run_test 31a "voluntary cancel / blocking ast race=============="
610
611 test_31b() {
612         remote_ost || { skip "local OST" && return 0; }
613         remote_ost_nodsh && skip "remote OST w/o dsh" && return 0
614         mkdir -p $DIR1/$tdir || error "Creating dir $DIR1/$tdir"
615         lfs setstripe $DIR/$tdir/$tfile -i 0 -c 1
616         cp /etc/hosts $DIR/$tdir/$tfile
617         #define OBD_FAIL_LDLM_CANCEL_BL_CB_RACE   0x314
618         lctl set_param fail_loc=0x314
619         #define OBD_FAIL_LDLM_OST_FAIL_RACE      0x316
620         do_facet ost1 lctl set_param fail_loc=0x316
621         # Don't crash kernel
622         cat $DIR2/$tdir/$tfile > /dev/null 2>&1
623         lctl set_param fail_loc=0
624         do_facet ost1 lctl set_param fail_loc=0
625 }
626 run_test 31b "voluntary OST cancel / blocking ast race=============="
627
628 # enable/disable lockless truncate feature, depending on the arg 0/1
629 enable_lockless_truncate() {
630         lctl set_param -n osc.*.lockless_truncate $1
631 }
632
633 test_32a() { # bug 11270
634         local p="$TMP/sanityN-$TESTNAME.parameters"
635         save_lustre_params $HOSTNAME osc.*.lockless_truncate > $p
636         cancel_lru_locks osc
637         enable_lockless_truncate 1
638         rm -f $DIR1/$tfile
639         lfs setstripe -c -1 $DIR1/$tfile
640         dd if=/dev/zero of=$DIR1/$tfile count=10 bs=1M > /dev/null 2>&1
641         clear_osc_stats
642
643         log "checking cached lockless truncate"
644         $TRUNCATE $DIR1/$tfile 8000000
645         $CHECKSTAT -s 8000000 $DIR2/$tfile || error "wrong file size"
646         [ $(calc_osc_stats lockless_truncate) -eq 0 ] ||
647                 error "lockless truncate doesn't use cached locks"
648
649         log "checking not cached lockless truncate"
650         $TRUNCATE $DIR2/$tfile 5000000
651         $CHECKSTAT -s 5000000 $DIR1/$tfile || error "wrong file size"
652         [ $(calc_osc_stats lockless_truncate) -ne 0 ] ||
653                 error "not cached trancate isn't lockless"
654
655         log "disabled lockless truncate"
656         enable_lockless_truncate 0
657         clear_osc_stats
658         $TRUNCATE $DIR2/$tfile 3000000
659         $CHECKSTAT -s 3000000 $DIR1/$tfile || error "wrong file size"
660         [ $(calc_osc_stats lockless_truncate) -eq 0 ] ||
661                 error "lockless truncate disabling failed"
662         rm $DIR1/$tfile
663         # restore lockless_truncate default values
664         restore_lustre_params < $p
665         rm -f $p
666 }
667 run_test 32a "lockless truncate"
668
669 test_32b() { # bug 11270
670         remote_ost_nodsh && skip "remote OST with nodsh" && return
671
672         local node
673         local p="$TMP/sanityN-$TESTNAME.parameters"
674         save_lustre_params $HOSTNAME "osc.*.contention_seconds" > $p
675         for node in $(osts_nodes); do
676                 save_lustre_params $node "ldlm.namespaces.filter-*.max_nolock_bytes" >> $p
677                 save_lustre_params $node "ldlm.namespaces.filter-*.contended_locks" >> $p
678                 save_lustre_params $node "ldlm.namespaces.filter-*.contention_seconds" >> $p
679         done
680         clear_osc_stats
681         # agressive lockless i/o settings
682         for node in $(osts_nodes); do
683                 do_node $node 'lctl set_param -n ldlm.namespaces.filter-*.max_nolock_bytes 2000000; lctl set_param -n ldlm.namespaces.filter-*.contended_locks 0; lctl set_param -n ldlm.namespaces.filter-*.contention_seconds 60'
684         done
685         lctl set_param -n osc.*.contention_seconds 60
686         for i in $(seq 5); do
687                 dd if=/dev/zero of=$DIR1/$tfile bs=4k count=1 conv=notrunc > /dev/null 2>&1
688                 dd if=/dev/zero of=$DIR2/$tfile bs=4k count=1 conv=notrunc > /dev/null 2>&1
689         done
690         [ $(calc_osc_stats lockless_write_bytes) -ne 0 ] || error "lockless i/o was not triggered"
691         # disable lockless i/o (it is disabled by default)
692         for node in $(osts_nodes); do
693                 do_node $node 'lctl set_param -n ldlm.namespaces.filter-*.max_nolock_bytes 0; lctl set_param -n ldlm.namespaces.filter-*.contended_locks 32; lctl set_param -n ldlm.namespaces.filter-*.contention_seconds 0'
694         done
695         # set contention_seconds to 0 at client too, otherwise Lustre still
696         # remembers lock contention
697         lctl set_param -n osc.*.contention_seconds 0
698         clear_osc_stats
699         for i in $(seq 1); do
700                 dd if=/dev/zero of=$DIR1/$tfile bs=4k count=1 conv=notrunc > /dev/null 2>&1
701                 dd if=/dev/zero of=$DIR2/$tfile bs=4k count=1 conv=notrunc > /dev/null 2>&1
702         done
703         [ $(calc_osc_stats lockless_write_bytes) -eq 0 ] ||
704                 error "lockless i/o works when disabled"
705         rm -f $DIR1/$tfile
706         restore_lustre_params <$p
707         rm -f $p
708 }
709 run_test 32b "lockless i/o"
710
711 print_jbd_stat () {
712     local dev=$(basename $(do_facet $SINGLEMDS lctl get_param -n osd.*MDT*.mntdev))
713     do_facet $SINGLEMDS cat /proc/fs/jbd/$dev/info | head -1
714 }
715
716 # commit on sharing tests
717 test_33a() {
718     remote_mds_nodsh && skip "remote MDS with nodsh" && return
719
720     [ -n "$CLIENTS" ] || { skip "Need two or more clients" && return 0; }
721     [ $CLIENTCOUNT -ge 2 ] || \
722         { skip "Need two or more clients, have $CLIENTCOUNT" && return 0; }
723
724     zconf_mount_clients $CLIENT1,$CLIENT2 $DIR1
725     zconf_mount_clients $CLIENT1,$CLIENT2 $DIR2
726
727     local nfiles=${TEST33_NFILES:-10000}
728     local param_file=$TMP/$tfile-params
729
730     save_lustre_params $(facet_active_host $SINGLEMDS) "mdt.*.commit_on_sharing" > $param_file
731
732     local COS
733     local jbdold
734     local jbdnew
735     local jbd
736
737     for COS in 0 1; do
738         do_facet $SINGLEMDS lctl set_param mdt.*.commit_on_sharing=$COS
739         avgjbd=0
740         avgtime=0
741         for i in 1 2 3; do
742             do_nodes $CLIENT1,$CLIENT2 "mkdir -p $DIR1/$tdir-\\\$(hostname)-$i"
743
744             jbdold=$(print_jbd_stat)
745             echo "=== START createmany $jbdold"
746             local elapsed=$(do_and_time "do_nodes $CLIENT1,$CLIENT2 createmany -o $DIR1/$tdir-\\\$(hostname)-$i/f- -r $DIR2/$tdir-\\\$(hostname)-$i/f- $nfiles > /dev/null 2>&1")
747             jbdnew=$(print_jbd_stat)
748             jbd=$((`echo $jbdnew | cut -d" " -f1` - `echo $jbdold | cut -d" " -f1`))
749             echo "=== END   createmany $jbdnew :  $jbd transactions  nfiles $nfiles time $elapsed COS=$COS"
750             avgjbd=$(( avgjbd + jbd ))
751             avgtime=$(( avgtime + elapsed ))
752         done
753         eval cos${COS}_jbd=$((avgjbd / 3))
754         eval cos${COS}_time=$((avgtime / 3))
755     done
756
757     echo "COS=0 transactions (avg): $cos0_jbd  time (avg): $cos0_time"
758     echo "COS=1 transactions (avg): $cos1_jbd  time (avg): $cos1_time"
759     [ "$cos0_jbd" != 0 ] && echo "COS=1 vs COS=0 jbd:  $((((cos1_jbd/cos0_jbd - 1)) * 100 )) %"
760     [ "$cos0_time" != 0 ] && echo "COS=1 vs COS=0 time: $((((cos1_time/cos0_time - 1)) * 100 )) %"
761
762     restore_lustre_params < $param_file
763     rm -f $param_file
764     return 0
765 }
766 run_test 33a "commit on sharing, cross crete/delete, 2 clients, benchmark"
767
768 # End commit on sharing tests
769
770 test_34() { #16129
771         local OPER
772         local lock_in
773         local lock_out
774         for OPER in notimeout timeout ; do
775                 rm $DIR1/$tfile 2>/dev/null
776                 lock_in=$(do_nodes $(osts_nodes) "lctl get_param -n ldlm.namespaces.filter-*.lock_timeouts" | calc_sum)
777                 if [ $OPER == "timeout" ] ; then
778                         for j in `seq $OSTCOUNT`; do
779                                 #define OBD_FAIL_PTLRPC_HPREQ_TIMEOUT    0x511
780                                 do_facet ost$j lctl set_param fail_loc=0x511
781                         done
782                         echo lock should expire
783                 else
784                         for j in `seq $OSTCOUNT`; do
785                                 #define OBD_FAIL_PTLRPC_HPREQ_NOTIMEOUT  0x512
786                                 do_facet ost$j lctl set_param fail_loc=0x512
787                         done
788                         echo lock should not expire
789                 fi
790                 echo writing on client1
791                 dd if=/dev/zero of=$DIR1/$tfile count=100 conv=notrunc > /dev/null 2>&1
792                 sync &
793                 echo reading on client2
794                 dd of=/dev/null if=$DIR2/$tfile > /dev/null 2>&1
795                 # wait for a lock timeout
796                 sleep 4
797                 lock_out=$(do_nodes $(osts_nodes) "lctl get_param -n ldlm.namespaces.filter-*.lock_timeouts" | calc_sum)
798                 if [ $OPER == "timeout" ] ; then
799                         if [ $lock_in == $lock_out ]; then
800                                 error "no lock timeout happened"
801                         else
802                                 echo "success"
803                         fi
804                 else
805                         if [ $lock_in != $lock_out ]; then
806                                 error "lock timeout happened"
807                         else
808                                 echo "success"
809                         fi
810                 fi
811         done
812 }
813 run_test 34 "no lock timeout under IO"
814
815 test_35() { # bug 17645
816         local generation=[]
817         local count=0
818         for imp in /proc/fs/lustre/mdc/$FSNAME-MDT*-mdc-*; do
819             g=$(awk '/generation/{print $2}' $imp/import)
820             generation[count]=$g
821             let count=count+1
822         done
823
824         mkdir -p $MOUNT1/$tfile
825         cancel_lru_locks mdc
826
827         # Let's initiate -EINTR situation by setting fail_loc and take
828         # write lock on same file from same client. This will not cause
829         # bl_ast yet as lock is already in local cache.
830 #define OBD_FAIL_LDLM_INTR_CP_AST        0x317
831         do_facet client "lctl set_param fail_loc=0x80000317"
832         local timeout=`do_facet $SINGLEMDS lctl get_param  -n timeout`
833         let timeout=timeout*3
834         local nr=0
835         while test $nr -lt 10; do
836                 log "Race attempt $nr"
837                 local blk1=`lctl get_param -n ldlm.services.ldlm_cbd.stats | awk '/ldlm_bl_callback/ {print $2}'`
838                 test "x$blk1" = "x" && blk1=0
839                 createmany -o $MOUNT2/$tfile/a 4000 &
840                 pid1=$!
841                 sleep 1
842
843                 # Let's make conflict and bl_ast
844                 ls -la $MOUNT1/$tfile > /dev/null &
845                 pid2=$!
846
847                 log "Wait for $pid1 $pid2 for $timeout sec..."
848                 sleep $timeout
849                 kill -9 $pid1 $pid2 > /dev/null 2>&1
850                 wait
851                 local blk2=`lctl get_param -n ldlm.services.ldlm_cbd.stats | awk '/ldlm_bl_callback/ {print $2}'`
852                 test "x$blk2" = "x" && blk2=0
853                 test $blk2 -gt $blk1 && break
854                 rm -fr $MOUNT1/$tfile/*
855                 cancel_lru_locks mdc
856                 let nr=nr+1
857         done
858         do_facet client "lctl set_param fail_loc=0x0"
859         df -h $MOUNT1 $MOUNT2
860         count=0
861         for imp in /proc/fs/lustre/mdc/$FSNAME-MDT*-mdc-*; do
862             g=$(awk '/generation/{print $2}' $imp/import)
863             if ! test "$g" -eq "${generation[count]}"; then
864                 error "Eviction happened on import $(basename $imp)"
865             fi
866             let count=count+1
867         done
868 }
869 run_test 35 "-EINTR cp_ast vs. bl_ast race does not evict client"
870
871 test_36() { #bug 16417
872     local SIZE
873     local SIZE_B
874     local i
875
876     mkdir -p $DIR1/$tdir
877     $LFS setstripe -c -1 $DIR1/$tdir
878     i=0
879     SIZE=50
880     let SIZE_B=SIZE*1024*1024
881
882     while [ $i -le 10 ]; do
883         lctl mark "start test"
884         local before=$($LFS df | awk '{if ($1 ~/^filesystem/) {print $5; exit} }')
885         dd if=/dev/zero of=$DIR1/$tdir/file000 bs=1M count=$SIZE
886         sync
887         sleep 1
888         local after_dd=$($LFS df | awk '{if ($1 ~/^filesystem/) {print $5; exit} }')
889         multiop_bg_pause $DIR2/$tdir/file000 O_r${SIZE_B}c || return 3
890         read_pid=$!
891         rm -f $DIR1/$tdir/file000
892         kill -USR1 $read_pid
893         wait $read_pid
894         sleep 1
895         local after=$($LFS df | awk '{if ($1 ~/^filesystem/) {print $5; exit} }')
896         echo "*** cycle($i) *** before($before):after_dd($after_dd):after($after)"
897         # this free space! not used
898         if [ $after_dd -ge $after ]; then
899             error "space leaked"
900             return 1;
901         fi
902         let i=i+1
903             done
904 }
905 run_test 36 "handle ESTALE/open-unlink corectly"
906
907 log "cleanup: ======================================================"
908
909 check_and_cleanup_lustre
910
911 echo '=========================== finished ==============================='
912 [ -f "$SANITYLOG" ] && cat $SANITYLOG && grep -q FAIL $SANITYLOG && exit 1 || true
913 echo "$0: completed"