Whamcloud - gitweb
983dc8017dfc64b69ecbf6c84154b1fb84e82c3d
[fs/lustre-release.git] / lustre / tests / sanityN.sh
1 #!/bin/bash
2
3 set -e
4
5 ONLY=${ONLY:-"$*"}
6 # bug number for skipped test: 3192 15528/3811 16929 9977 15528/11549
7 ALWAYS_EXCEPT="                14b  19         22    28   29          $SANITYN_EXCEPT"
8 # UPDATE THE COMMENT ABOVE WITH BUG NUMBERS WHEN CHANGING ALWAYS_EXCEPT!
9
10 # bug number for skipped test:                                                    12652 12652
11 grep -q 'Enterprise Server 10' /etc/SuSE-release && ALWAYS_EXCEPT="$ALWAYS_EXCEPT 11    14" || true
12
13 # Tests that fail on uml
14 [ "$UML" = "true" ] && EXCEPT="$EXCEPT 7"
15
16 # Join file feature is not supported currently.
17 # It will be ported soon.
18 EXCEPT="$EXCEPT 22"
19
20 SRCDIR=`dirname $0`
21 PATH=$PWD/$SRCDIR:$SRCDIR:$SRCDIR/../utils:$PATH
22
23 SIZE=${SIZE:-40960}
24 CHECKSTAT=${CHECKSTAT:-"checkstat -v"}
25 CREATETEST=${CREATETEST:-createtest}
26 GETSTRIPE=${GETSTRIPE:-lfs getstripe}
27 SETSTRIPE=${SETSTRIPE:-lstripe}
28 MCREATE=${MCREATE:-mcreate}
29 OPENFILE=${OPENFILE:-openfile}
30 OPENUNLINK=${OPENUNLINK:-openunlink}
31 TOEXCL=${TOEXCL:-toexcl}
32 TRUNCATE=${TRUNCATE:-truncate}
33 export TMP=${TMP:-/tmp}
34 MOUNT_2=${MOUNT_2:-"yes"}
35 CHECK_GRANT=${CHECK_GRANT:-"yes"}
36 GRANT_CHECK_LIST=${GRANT_CHECK_LIST:-""}
37
38 SAVE_PWD=$PWD
39
40 export NAME=${NAME:-local}
41
42 LUSTRE=${LUSTRE:-`dirname $0`/..}
43 . $LUSTRE/tests/test-framework.sh
44 CLEANUP=${CLEANUP:-:}
45 SETUP=${SETUP:-:}
46 init_test_env $@
47 . ${CONFIG:=$LUSTRE/tests/cfg/$NAME.sh}
48
49 [ "$SLOW" = "no" ] && EXCEPT_SLOW="12 16 33a"
50
51 SANITYLOG=${TESTSUITELOG:-$TMP/$(basename $0 .sh).log}
52 FAIL_ON_ERROR=false
53
54 SETUP=${SETUP:-:}
55 TRACE=${TRACE:-""}
56
57 [ "$SANITYLOG" ] && rm -f $SANITYLOG || true
58
59 check_and_setup_lustre
60
61 LOVNAME=`lctl get_param -n llite.*.lov.common_name | tail -n 1`
62 OSTCOUNT=`lctl get_param -n lov.$LOVNAME.numobd`
63
64 assert_DIR
65 rm -rf $DIR1/[df][0-9]* $DIR1/lnk
66
67 # $RUNAS_ID may get set incorrectly somewhere else
68 [ $UID -eq 0 -a $RUNAS_ID -eq 0 ] && error "\$RUNAS_ID set to 0, but \$UID is also 0!"
69
70 check_runas_id $RUNAS_ID $RUNAS_ID $RUNAS
71
72 build_test_filter
73
74 test_1a() {
75         touch $DIR1/f1
76         [ -f $DIR2/f1 ] || error
77 }
78 run_test 1a "check create on 2 mtpt's =========================="
79
80 test_1b() {
81         chmod 777 $DIR2/f1
82         $CHECKSTAT -t file -p 0777 $DIR1/f1 || error
83         chmod a-x $DIR2/f1
84 }
85 run_test 1b "check attribute updates on 2 mtpt's ==============="
86
87 test_1c() {
88         $CHECKSTAT -t file -p 0666 $DIR1/f1 || error
89 }
90 run_test 1c "check after remount attribute updates on 2 mtpt's ="
91
92 test_1d() {
93         rm $DIR2/f1
94         $CHECKSTAT -a $DIR1/f1 || error
95 }
96 run_test 1d "unlink on one mountpoint removes file on other ===="
97
98 test_2a() {
99         touch $DIR1/f2a
100         ls -l $DIR2/f2a
101         chmod 777 $DIR2/f2a
102         $CHECKSTAT -t file -p 0777 $DIR1/f2a || error
103 }
104 run_test 2a "check cached attribute updates on 2 mtpt's ========"
105
106 test_2b() {
107         touch $DIR1/f2b
108         ls -l $DIR2/f2b
109         chmod 777 $DIR1/f2b
110         $CHECKSTAT -t file -p 0777 $DIR2/f2b || error
111 }
112 run_test 2b "check cached attribute updates on 2 mtpt's ========"
113
114 # NEED TO SAVE ROOT DIR MODE
115 test_2c() {
116         chmod 777 $DIR1
117         $CHECKSTAT -t dir -p 0777 $DIR2 || error
118 }
119 run_test 2c "check cached attribute updates on 2 mtpt's root ==="
120
121 test_2d() {
122         chmod 755 $DIR1
123         $CHECKSTAT -t dir -p 0755 $DIR2 || error
124 }
125 run_test 2d "check cached attribute updates on 2 mtpt's root ==="
126
127 test_2e() {
128         chmod 755 $DIR1
129         ls -l $DIR1
130         ls -l $DIR2
131         chmod 777 $DIR1
132         $RUNAS dd if=/dev/zero of=$DIR2/$tfile count=1 || error
133 }
134 run_test 2e "check chmod on root is propagated to others"
135
136 test_3() {
137         ( cd $DIR1 ; ln -s this/is/good $tfile )
138         [ "this/is/good" = "`perl -e 'print readlink("'$DIR2/$tfile'");'`" ] ||
139                 error "link $DIR2/$tfile not as expected"
140 }
141 run_test 3 "symlink on one mtpt, readlink on another ==========="
142
143 test_4() {
144         multifstat $DIR1/f4 $DIR2/f4
145 }
146 run_test 4 "fstat validation on multiple mount points =========="
147
148 test_5() {
149         mcreate $DIR1/f5
150         truncate $DIR2/f5 100
151         $CHECKSTAT -t file -s 100 $DIR1/f5 || error
152         rm $DIR1/f5
153 }
154 run_test 5 "create a file on one mount, truncate it on the other"
155
156 test_6() {
157         openunlink $DIR1/$tfile $DIR2/$tfile || \
158                 error "openunlink $DIR1/$tfile $DIR2/$tfile"
159 }
160 run_test 6 "remove of open file on other node =================="
161
162 test_7() {
163         local dir=d7
164         opendirunlink $DIR1/$dir $DIR2/$dir || \
165                 error "opendirunlink $DIR1/$dir $DIR2/$dir"
166 }
167 run_test 7 "remove of open directory on other node ============="
168
169 test_8() {
170         opendevunlink $DIR1/$tfile $DIR2/$tfile || \
171                 error "opendevunlink $DIR1/$tfile $DIR2/$tfile"
172 }
173 run_test 8 "remove of open special file on other node =========="
174
175 test_9() {
176         MTPT=1
177         local dir
178         > $DIR2/f9
179         for C in a b c d e f g h i j k l; do
180                 dir=`eval echo \\$DIR$MTPT`
181                 echo -n $C >> $dir/f9
182                 [ "$MTPT" -eq 1 ] && MTPT=2 || MTPT=1
183         done
184         [ "`cat $DIR1/f9`" = "abcdefghijkl" ] || \
185                 error "`od -a $DIR1/f9` != abcdefghijkl"
186 }
187 run_test 9 "append of file with sub-page size on multiple mounts"
188
189 test_10a() {
190         MTPT=1
191         local dir
192         OFFSET=0
193         > $DIR2/f10
194         for C in a b c d e f g h i j k l; do
195                 dir=`eval echo \\$DIR$MTPT`
196                 echo -n $C | dd of=$dir/f10 bs=1 seek=$OFFSET count=1
197                 [ "$MTPT" -eq 1 ] && MTPT=2 || MTPT=1
198                 OFFSET=`expr $OFFSET + 1`
199         done
200         [ "`cat $DIR1/f10`" = "abcdefghijkl" ] || \
201                 error "`od -a $DIR1/f10` != abcdefghijkl"
202 }
203 run_test 10a "write of file with sub-page size on multiple mounts "
204
205 test_10b() {
206         # create a seed file
207         yes "R" | head -c 4000 >$TMP/f10b-seed
208         dd if=$TMP/f10b-seed of=$DIR1/f10b bs=3k count=1 || error "dd $DIR1"
209
210         truncate $DIR1/f10b 4096 || error "truncate 4096"
211
212         dd if=$DIR2/f10b of=$TMP/f10b-lustre bs=4k count=1 || error "dd $DIR2"
213
214         # create a test file locally to compare
215         dd if=$TMP/f10b-seed of=$TMP/f10b bs=3k count=1 || error "dd random"
216         truncate $TMP/f10b 4096 || error "truncate 4096"
217         cmp $TMP/f10b $TMP/f10b-lustre || error "file miscompare"
218         rm $TMP/f10b $TMP/f10b-lustre $TMP/f10b-seed
219 }
220 run_test 10b "write of file with sub-page size on multiple mounts "
221
222 test_11() {
223         mkdir $DIR1/d11
224         multiop_bg_pause $DIR1/d11/f O_c || return 1
225         MULTIPID=$!
226         cp -p /bin/ls $DIR1/d11/f
227         $DIR2/d11/f
228         RC=$?
229         kill -USR1 $MULTIPID
230         wait $MULTIPID || error
231         [ $RC -eq 0 ] && error || true
232 }
233 run_test 11 "execution of file opened for write should return error ===="
234
235 test_12() {
236        DIR=$DIR DIR2=$DIR2 sh lockorder.sh
237 }
238 run_test 12 "test lock ordering (link, stat, unlink) ==========="
239
240 test_13() {     # bug 2451 - directory coherency
241        rm -rf $DIR1/d13
242        mkdir $DIR1/d13 || error
243        cd $DIR1/d13 || error
244        ls
245        ( touch $DIR1/d13/f13 ) # needs to be a separate shell
246        ls
247        rm -f $DIR2/d13/f13 || error
248        ls 2>&1 | grep f13 && error "f13 shouldn't return an error (1)" || true
249        # need to run it twice
250        ( touch $DIR1/d13/f13 ) # needs to be a separate shell
251        ls
252        rm -f $DIR2/d13/f13 || error
253        ls 2>&1 | grep f13 && error "f13 shouldn't return an error (2)" || true
254 }
255 run_test 13 "test directory page revocation ===================="
256
257 test_14() {
258         mkdir -p $DIR1/$tdir
259         cp -p /bin/ls $DIR1/$tdir/$tfile
260         multiop_bg_pause $DIR1/$tdir/$tfile Ow_c || return 1
261         MULTIPID=$!
262
263         $DIR2/$tdir/$tfile && error || true
264         kill -USR1 $MULTIPID
265         wait $MULTIPID || return 2
266 }
267 run_test 14 "execution of file open for write returns -ETXTBSY ="
268
269 test_14a() {
270         mkdir -p $DIR1/d14
271         cp -p `which multiop` $DIR1/d14/multiop || error "cp failed"
272         MULTIOP_PROG=$DIR1/d14/multiop multiop_bg_pause $TMP/test14.junk O_c || return 1
273         MULTIOP_PID=$!
274         multiop $DIR2/d14/multiop Oc && error "expected error, got success"
275         kill -USR1 $MULTIOP_PID || return 2
276         wait $MULTIOP_PID || return 3
277         rm $TMP/test14.junk $DIR1/d14/multiop || error "removing multiop"
278 }
279 run_test 14a "open(RDWR) of executing file returns -ETXTBSY ===="
280
281 test_14b() { # bug 3192, 7040
282         mkdir -p $DIR1/d14
283         cp -p `which multiop` $DIR1/d14/multiop || error "cp failed"
284         MULTIOP_PROG=$DIR1/d14/multiop multiop_bg_pause $TMP/test14.junk O_c || return 1
285         MULTIOP_PID=$!
286         truncate $DIR2/d14/multiop 0 && kill -9 $MULTIOP_PID && \
287                 error "expected truncate error, got success"
288         kill -USR1 $MULTIOP_PID || return 2
289         wait $MULTIOP_PID || return 3
290         cmp `which multiop` $DIR1/d14/multiop || error "binary changed"
291         rm $TMP/test14.junk $DIR1/d14/multiop || error "removing multiop"
292 }
293 run_test 14b "truncate of executing file returns -ETXTBSY ======"
294
295 test_14c() { # bug 3430, 7040
296         mkdir -p $DIR1/d14
297         cp -p `which multiop` $DIR1/d14/multiop || error "cp failed"
298         MULTIOP_PROG=$DIR1/d14/multiop multiop_bg_pause $TMP/test14.junk O_c || return 1
299         MULTIOP_PID=$!
300         cp /etc/hosts $DIR2/d14/multiop && error "expected error, got success"
301         kill -USR1 $MULTIOP_PID || return 2
302         wait $MULTIOP_PID || return 3
303         cmp `which multiop` $DIR1/d14/multiop || error "binary changed"
304         rm $TMP/test14.junk $DIR1/d14/multiop || error "removing multiop"
305 }
306 run_test 14c "open(O_TRUNC) of executing file return -ETXTBSY =="
307
308 test_14d() { # bug 10921
309         mkdir -p $DIR1/d14
310         cp -p `which multiop` $DIR1/d14/multiop || error "cp failed"
311         MULTIOP_PROG=$DIR1/d14/multiop multiop_bg_pause $TMP/test14.junk O_c || return 1
312         MULTIOP_PID=$!
313         log chmod
314         chmod 600 $DIR1/d14/multiop || error "chmod failed"
315         kill -USR1 $MULTIOP_PID || return 2
316         wait $MULTIOP_PID || return 3
317         cmp `which multiop` $DIR1/d14/multiop || error "binary changed"
318         rm $TMP/test14.junk $DIR1/d14/multiop || error "removing multiop"
319 }
320 run_test 14d "chmod of executing file is still possible ========"
321
322 test_15() {     # bug 974 - ENOSPC
323         echo "PATH=$PATH"
324         sh oos2.sh $MOUNT1 $MOUNT2
325         grant_error=`dmesg | grep "> available"`
326         [ -z "$grant_error" ] || error "$grant_error"
327 }
328 run_test 15 "test out-of-space with multiple writers ==========="
329
330 test_16() {
331         rm -f $MOUNT1/fsxfile
332         lfs setstripe $MOUNT1/fsxfile -c -1 # b=10919
333         fsx -c 50 -p 100 -N 2500 -l $((SIZE * 256)) -S 0 $MOUNT1/fsxfile $MOUNT2/fsxfile
334 }
335 run_test 16 "2500 iterations of dual-mount fsx ================="
336
337 test_17() { # bug 3513, 3667
338         remote_ost_nodsh && skip "remote OST with nodsh" && return
339
340         lfs setstripe $DIR1/$tfile -i 0 -c 1
341         cp /etc/termcap $DIR1/$tfile
342         cancel_lru_locks osc > /dev/null
343         #define OBD_FAIL_ONCE|OBD_FAIL_LDLM_CREATE_RESOURCE    0x30a
344         do_facet ost1 lctl set_param fail_loc=0x8000030a
345         ls -ls $DIR1/$tfile | awk '{ print $1,$6 }' > $DIR1/$tfile-1 & \
346         ls -ls $DIR2/$tfile | awk '{ print $1,$6 }' > $DIR2/$tfile-2
347         wait
348         diff -u $DIR1/$tfile-1 $DIR2/$tfile-2 || error "files are different"
349 }
350 run_test 17 "resource creation/LVB creation race ==============="
351
352 test_18() {
353         ./mmap_sanity -d $MOUNT1 -m $MOUNT2
354         sync; sleep 1; sync
355 }
356 run_test 18 "mmap sanity check ================================="
357
358 test_19() { # bug3811
359         [ -d /proc/fs/lustre/obdfilter ] || return 0
360
361         MAX=`lctl get_param -n obdfilter.*.readcache_max_filesize | head -n 1`
362         lctl set_param -n obdfilter.*OST*.readcache_max_filesize=4096
363         dd if=/dev/urandom of=$TMP/f19b bs=512k count=32
364         SUM=`cksum $TMP/f19b | cut -d" " -f 1,2`
365         cp $TMP/f19b $DIR1/f19b
366         for i in `seq 1 20`; do
367                 [ $((i % 5)) -eq 0 ] && log "test_18 loop $i"
368                 cancel_lru_locks osc > /dev/null
369                 cksum $DIR1/f19b | cut -d" " -f 1,2 > $TMP/sum1 & \
370                 cksum $DIR2/f19b | cut -d" " -f 1,2 > $TMP/sum2
371                 wait
372                 [ "`cat $TMP/sum1`" = "$SUM" ] || \
373                         error "$DIR1/f19b `cat $TMP/sum1` != $SUM"
374                 [ "`cat $TMP/sum2`" = "$SUM" ] || \
375                         error "$DIR2/f19b `cat $TMP/sum2` != $SUM"
376         done
377         lctl set_param -n obdfilter.*OST*.readcache_max_filesize=$MAX
378         rm $DIR1/f19b
379 }
380 run_test 19 "test concurrent uncached read races ==============="
381
382 test_20() {
383         mkdir $DIR1/d20
384         cancel_lru_locks osc
385         CNT=$((`lctl get_param -n llite.*.dump_page_cache | wc -l`))
386         multiop $DIR1/f20 Ow8190c
387         multiop $DIR2/f20 Oz8194w8190c
388         multiop $DIR1/f20 Oz0r8190c
389         cancel_lru_locks osc
390         CNTD=$((`lctl get_param -n llite.*.dump_page_cache | wc -l` - $CNT))
391         [ $CNTD -gt 0 ] && \
392             error $CNTD" page left in cache after lock cancel" || true
393 }
394 run_test 20 "test extra readahead page left in cache ===="
395
396 cleanup_21() {
397         trap 0
398         umount $DIR1/d21
399 }
400
401 test_21() { # Bug 5907
402         mkdir $DIR1/d21
403         mount /etc $DIR1/d21 --bind || error "mount failed" # Poor man's mount.
404         trap cleanup_21 EXIT
405         rmdir -v $DIR1/d21 && error "Removed mounted directory"
406         rmdir -v $DIR2/d21 && echo "Removed mounted directory from another mountpoint, needs to be fixed"
407         test -d $DIR1/d21 || error "Mounted directory disappeared"
408         cleanup_21
409         test -d $DIR2/d21 || test -d $DIR1/d21 && error "Removed dir still visible after umount"
410         true
411 }
412 run_test 21 " Try to remove mountpoint on another dir ===="
413
414 JOIN=${JOIN:-"lfs join"}
415
416 test_22() { # Bug 9926
417         mkdir $DIR1/d21
418         dd if=/dev/urandom of=$DIR1/d21/128k bs=1024 count=128
419         cp -p $DIR1/d21/128k $DIR1/d21/f_head
420         for ((i=0;i<10;i++)); do
421                 cp -p $DIR1/d21/128k $DIR1/d21/f_tail
422                 $JOIN $DIR1/d21/f_head $DIR1/d21/f_tail || error "join error"
423                 $CHECKSTAT -a $DIR1/d21/f_tail || error "tail file exist after join"
424         done
425         echo aaaaaaaaaaa >> $DIR1/d21/no_joined
426
427         mv $DIR2/d21/f_head $DIR2/
428         munlink $DIR2/f_head || error "unlink joined file error"
429         cat $DIR2/d21/no_joined || error "cat error"
430         rm -rf $DIR2/d21/no_joined || error "unlink normal file error"
431 }
432 run_test 22 " After joining in one dir,  open/close unlink file in anther dir" 
433
434 test_23() { # Bug 5972
435         echo "others should see updated atime while another read" > $DIR1/f23
436         
437         # clear the lock(mode: LCK_PW) gotten from creating operation
438         cancel_lru_locks osc
439         
440         time1=`date +%s`        
441         sleep 2
442         
443         multiop_bg_pause $DIR1/f23 or20_c || return 1
444         MULTIPID=$!
445
446         time2=`stat -c "%X" $DIR2/f23`
447
448         if (( $time2 <= $time1 )); then
449                 kill -USR1 $MULTIPID
450                 error "atime doesn't update among nodes"
451         fi
452
453         kill -USR1 $MULTIPID || return 1
454         rm -f $DIR1/f23 || error "rm -f $DIR1/f23 failed"
455         true
456 }
457 run_test 23 " others should see updated atime while another read===="
458
459 test_24() {
460         touch $DIR1/$tfile
461         lfs df || error "lfs df failed"
462         lfs df -ih || error "lfs df -ih failed"
463         lfs df -h $DIR1 || error "lfs df -h $DIR1 failed"
464         lfs df -i $DIR2 || error "lfs df -i $DIR2 failed"
465         lfs df $DIR1/$tfile || error "lfs df $DIR1/$tfile failed"
466         lfs df -ih $DIR2/$tfile || error "lfs df -ih $DIR2/$tfile failed"
467         
468         OSC=`lctl dl | awk '/-osc-|OSC.*MNT/ {print $4}' | head -n 1`
469 #       OSC=`lctl dl | awk '/-osc-/ {print $4}' | head -n 1`
470         lctl --device %$OSC deactivate
471         lfs df -i || error "lfs df -i with deactivated OSC failed"
472         lctl --device %$OSC recover
473         lfs df || error "lfs df with reactivated OSC failed"
474 }
475 run_test 24 "lfs df [-ih] [path] test ========================="
476
477 test_25() {
478         [ `lctl get_param -n mdc.*-mdc-*.connect_flags | grep -c acl` -lt 2 ] && \
479             skip "must have acl, skipping" && return
480
481         mkdir -p $DIR1/$tdir
482         touch $DIR1/$tdir/f1 || error "touch $DIR1/$tdir/f1"
483         chmod 0755 $DIR1/$tdir/f1 || error "chmod 0755 $DIR1/$tdir/f1"
484
485         $RUNAS $CHECKSTAT $DIR2/$tdir/f1 || error "checkstat $DIR2/$tdir/f1 #1"
486         setfacl -m u:$RUNAS_ID:--- $DIR1/$tdir || error "setfacl $DIR2/$tdir #1"
487         $RUNAS $CHECKSTAT $DIR2/$tdir/f1 && error "checkstat $DIR2/$tdir/f1 #2"
488         setfacl -m u:$RUNAS_ID:r-x $DIR1/$tdir || error "setfacl $DIR2/$tdir #2"
489         $RUNAS $CHECKSTAT $DIR2/$tdir/f1 || error "checkstat $DIR2/$tdir/f1 #3"
490         setfacl -m u:$RUNAS_ID:--- $DIR1/$tdir || error "setfacl $DIR2/$tdir #3"
491         $RUNAS $CHECKSTAT $DIR2/$tdir/f1 && error "checkstat $DIR2/$tdir/f1 #4"
492         setfacl -x u:$RUNAS_ID: $DIR1/$tdir || error "setfacl $DIR2/$tdir #4"
493         $RUNAS $CHECKSTAT $DIR2/$tdir/f1 || error "checkstat $DIR2/$tdir/f1 #5"
494
495         rm -rf $DIR1/$tdir
496 }
497 run_test 25 "change ACL on one mountpoint be seen on another ==="
498
499 test_26a() {
500         utime $DIR1/f26a -s $DIR2/f26a || error
501 }
502 run_test 26a "allow mtime to get older"
503
504 test_26b() {
505         touch $DIR1/$tfile
506         sleep 1
507         echo "aaa" >> $DIR1/$tfile
508         sleep 1
509         chmod a+x $DIR2/$tfile
510         mt1=`stat -c %Y $DIR1/$tfile`
511         mt2=`stat -c %Y $DIR2/$tfile`
512         
513         if [ x"$mt1" != x"$mt2" ]; then 
514                 error "not equal mtime, client1: "$mt1", client2: "$mt2"."
515         fi
516 }
517 run_test 26b "sync mtime between ost and mds"
518
519 test_27() {
520         cancel_lru_locks osc
521         lctl clear
522         dd if=/dev/zero of=$DIR2/$tfile bs=$((4096+4))k conv=notrunc count=4 seek=3 &
523         DD2_PID=$!
524         usleep 50
525         log "dd 1 started"
526         
527         dd if=/dev/zero of=$DIR1/$tfile bs=$((16384-1024))k conv=notrunc count=1 seek=4 &
528         DD1_PID=$!
529         log "dd 2 started"
530         
531         sleep 1
532         dd if=/dev/zero of=$DIR1/$tfile bs=8k conv=notrunc count=1 seek=0
533         log "dd 3 finished"
534         lctl set_param -n ldlm.dump_namespaces ""
535         wait $DD1_PID $DD2_PID
536         [ $? -ne 0 ] && lctl dk $TMP/debug || true
537 }
538 run_test 27 "align non-overlapping extent locks from request ==="
539
540 test_28() { # bug 9977
541         ECHO_UUID="ECHO_osc1_UUID"
542         tOST=`$LCTL dl | | awk '/-osc-|OSC.*MNT/ { print $4 }' | head -1`
543
544         lfs setstripe $DIR1/$tfile -s 1048576 -i 0 -c 2
545         tOBJID=`lfs getstripe $DIR1/$tfile |grep "^[[:space:]]\+1" |awk '{print $2}'`
546         dd if=/dev/zero of=$DIR1/$tfile bs=1024k count=2
547
548         $LCTL <<-EOF
549                 newdev
550                 attach echo_client ECHO_osc1 $ECHO_UUID
551                 setup $tOST
552         EOF
553
554         tECHOID=`$LCTL dl | grep $ECHO_UUID | awk '{print $1}'`
555         $LCTL --device $tECHOID destroy "${tOBJID}:0"
556     
557         $LCTL <<-EOF
558                 cfg_device ECHO_osc1
559                 cleanup
560                 detach
561         EOF
562
563         # reading of 1st stripe should pass
564         dd if=$DIR2/$tfile of=/dev/null bs=1024k count=1 || error
565         # reading of 2nd stripe should fail (this stripe was destroyed)
566         dd if=$DIR2/$tfile of=/dev/null bs=1024k count=1 skip=1 && error
567
568         # now, recreating test file
569         dd if=/dev/zero of=$DIR1/$tfile bs=1024k count=2 || error
570         # reading of 1st stripe should pass
571         dd if=$DIR2/$tfile of=/dev/null bs=1024k count=1 || error
572         # reading of 2nd stripe should pass
573         dd if=$DIR2/$tfile of=/dev/null bs=1024k count=1 skip=1 || error
574 }
575 run_test 28 "read/write/truncate file with lost stripes"
576
577 test_29() { # bug 10999
578         touch $DIR1/$tfile
579         #define OBD_FAIL_LDLM_GLIMPSE  0x30f
580         lctl set_param fail_loc=0x8000030f
581         ls -l $DIR2/$tfile &
582         usleep 500
583         dd if=/dev/zero of=$DIR1/$tfile bs=4k count=1
584         wait
585 }
586 #bug 11549 - permanently turn test off in b1_5
587 run_test 29 "lock put race between glimpse and enqueue ========="
588
589 test_30() { #bug #11110
590     mkdir -p $DIR1/$tdir
591     cp -f /bin/bash $DIR1/$tdir/bash
592     /bin/sh -c 'sleep 1; rm -f $DIR2/$tdir/bash; cp /bin/bash $DIR2/$tdir' &
593     err=$($DIR1/$tdir/bash -c 'sleep 2; openfile -f O_RDONLY /proc/$$/exe >& /dev/null; echo $?')
594     wait
595     [ $err -ne 116 ] && error_ignore 12900 "return code ($err) != -ESTALE" && return
596     true
597 }
598
599 run_test 30 "recreate file race ========="
600
601 test_31a() {
602         mkdir -p $DIR1/$tdir || error "Creating dir $DIR1/$tdir"
603         writes=`LANG=C dd if=/dev/zero of=$DIR/$tdir/$tfile count=1 2>&1 |
604                 awk 'BEGIN { FS="+" } /out/ {print $1}'`
605         #define OBD_FAIL_LDLM_CANCEL_BL_CB_RACE   0x314
606         lctl set_param fail_loc=0x314
607         reads=`LANG=C dd if=$DIR2/$tdir/$tfile of=/dev/null 2>&1 |
608                awk 'BEGIN { FS="+" } /in/ {print $1}'`
609         [ $reads -eq $writes ] || error "read" $reads "blocks, must be" $writes
610 }
611 run_test 31a "voluntary cancel / blocking ast race=============="
612
613 test_31b() {
614         remote_ost || { skip "local OST" && return 0; }
615         remote_ost_nodsh && skip "remote OST w/o dsh" && return 0
616         mkdir -p $DIR1/$tdir || error "Creating dir $DIR1/$tdir"
617         lfs setstripe $DIR/$tdir/$tfile -i 0 -c 1
618         cp /etc/hosts $DIR/$tdir/$tfile
619         #define OBD_FAIL_LDLM_CANCEL_BL_CB_RACE   0x314
620         lctl set_param fail_loc=0x314
621         #define OBD_FAIL_LDLM_OST_FAIL_RACE      0x316
622         do_facet ost1 lctl set_param fail_loc=0x316
623         # Don't crash kernel
624         cat $DIR2/$tdir/$tfile > /dev/null 2>&1
625         lctl set_param fail_loc=0
626         do_facet ost1 lctl set_param fail_loc=0
627 }
628 run_test 31b "voluntary OST cancel / blocking ast race=============="
629
630 # enable/disable lockless truncate feature, depending on the arg 0/1
631 enable_lockless_truncate() {
632         lctl set_param -n osc.*.lockless_truncate $1
633 }
634
635 test_32a() { # bug 11270
636         local p="$TMP/sanityN-$TESTNAME.parameters"
637         save_lustre_params $HOSTNAME osc.*.lockless_truncate > $p
638         cancel_lru_locks osc
639         enable_lockless_truncate 1
640         rm -f $DIR1/$tfile
641         lfs setstripe -c -1 $DIR1/$tfile
642         dd if=/dev/zero of=$DIR1/$tfile count=10 bs=1M > /dev/null 2>&1
643         clear_osc_stats
644
645         log "checking cached lockless truncate"
646         $TRUNCATE $DIR1/$tfile 8000000
647         $CHECKSTAT -s 8000000 $DIR2/$tfile || error "wrong file size"
648         [ $(calc_osc_stats lockless_truncate) -eq 0 ] ||
649                 error "lockless truncate doesn't use cached locks"
650
651         log "checking not cached lockless truncate"
652         $TRUNCATE $DIR2/$tfile 5000000
653         $CHECKSTAT -s 5000000 $DIR1/$tfile || error "wrong file size"
654         [ $(calc_osc_stats lockless_truncate) -ne 0 ] ||
655                 error "not cached trancate isn't lockless"
656
657         log "disabled lockless truncate"
658         enable_lockless_truncate 0
659         clear_osc_stats
660         $TRUNCATE $DIR2/$tfile 3000000
661         $CHECKSTAT -s 3000000 $DIR1/$tfile || error "wrong file size"
662         [ $(calc_osc_stats lockless_truncate) -eq 0 ] ||
663                 error "lockless truncate disabling failed"
664         rm $DIR1/$tfile
665         # restore lockless_truncate default values
666         restore_lustre_params < $p
667         rm -f $p
668 }
669 run_test 32a "lockless truncate"
670
671 test_32b() { # bug 11270
672         remote_ost_nodsh && skip "remote OST with nodsh" && return
673
674         local node
675         local p="$TMP/sanityN-$TESTNAME.parameters"
676         save_lustre_params $HOSTNAME "osc.*.contention_seconds" > $p
677         for node in $(osts_nodes); do
678                 save_lustre_params $node "ldlm.namespaces.filter-*.max_nolock_bytes" >> $p
679                 save_lustre_params $node "ldlm.namespaces.filter-*.contended_locks" >> $p
680                 save_lustre_params $node "ldlm.namespaces.filter-*.contention_seconds" >> $p
681         done
682         clear_osc_stats
683         # agressive lockless i/o settings 
684         for node in $(osts_nodes); do
685                 do_node $node 'lctl set_param -n ldlm.namespaces.filter-*.max_nolock_bytes 2000000; lctl set_param -n ldlm.namespaces.filter-*.contended_locks 0; lctl set_param -n ldlm.namespaces.filter-*.contention_seconds 60'
686         done
687         lctl set_param -n osc.*.contention_seconds 60
688         for i in $(seq 5); do
689                 dd if=/dev/zero of=$DIR1/$tfile bs=4k count=1 conv=notrunc > /dev/null 2>&1
690                 dd if=/dev/zero of=$DIR2/$tfile bs=4k count=1 conv=notrunc > /dev/null 2>&1
691         done
692         [ $(calc_osc_stats lockless_write_bytes) -ne 0 ] || error "lockless i/o was not triggered" 
693         # disable lockless i/o (it is disabled by default)
694         for node in $(osts_nodes); do
695                 do_node $node 'lctl set_param -n ldlm.namespaces.filter-*.max_nolock_bytes 0; lctl set_param -n ldlm.namespaces.filter-*.contended_locks 32; lctl set_param -n ldlm.namespaces.filter-*.contention_seconds 0'
696         done
697         # set contention_seconds to 0 at client too, otherwise Lustre still
698         # remembers lock contention
699         lctl set_param -n osc.*.contention_seconds 0
700         clear_osc_stats
701         for i in $(seq 1); do
702                 dd if=/dev/zero of=$DIR1/$tfile bs=4k count=1 conv=notrunc > /dev/null 2>&1
703                 dd if=/dev/zero of=$DIR2/$tfile bs=4k count=1 conv=notrunc > /dev/null 2>&1
704         done
705         [ $(calc_osc_stats lockless_write_bytes) -eq 0 ] ||
706                 error "lockless i/o works when disabled" 
707         rm -f $DIR1/$tfile
708         restore_lustre_params <$p
709         rm -f $p
710 }
711 run_test 32b "lockless i/o"
712
713 print_jbd_stat () {
714     local dev=$(basename $(do_facet $SINGLEMDS lctl get_param -n osd.*MDT*.mntdev))
715     do_facet $SINGLEMDS cat /proc/fs/jbd/$dev/info | head -1 
716 }
717
718 do_and_time () {
719    local cmd=$1
720
721    local start_ts=`date +%s`
722
723    $cmd
724
725    current_ts=`date +%s`
726    ELAPSED=`expr $current_ts - $start_ts`
727 }
728
729 # commit on sharing tests
730 test_33a() {
731     remote_mds_nodsh && skip "remote MDS with nodsh" && return
732
733     [ -n "$CLIENTS" ] || { skip "Need two or more clients" && return 0; }
734     [ $CLIENTCOUNT -ge 2 ] || \
735         { skip "Need two or more clients, have $CLIENTCOUNT" && return 0; }
736
737     zconf_mount_clients $CLIENT1,$CLIENT2 $DIR1
738     zconf_mount_clients $CLIENT1,$CLIENT2 $DIR2
739
740     local nfiles=${TEST33_NFILES:-10000}
741     local param_file=$TMP/$tfile-params
742
743     save_lustre_params $(facet_active_host $SINGLEMDS) "mdt.*.commit_on_sharing" > $param_file
744
745     local COS
746     local jbdold
747     local jbdnew
748     local jbd
749
750     for COS in 0 1; do
751         do_facet $SINGLEMDS lctl set_param mdt.*.commit_on_sharing=$COS
752         avgjbd=0
753         avgtime=0
754         for i in 1 2 3; do
755
756             do_nodes $CLIENT1,$CLIENT2 "mkdir -p $DIR1/$tdir-\\\$(hostname)-$i"
757
758             jbdold=$(print_jbd_stat) 
759             echo "=== START createmany $jbdold"
760             do_and_time "do_nodes $CLIENT1,$CLIENT2 createmany -o $DIR1/$tdir-\\\$(hostname)-$i/f- -r $DIR2/$tdir-\\\$(hostname)-$i/f- $nfiles"
761             jbdnew=$(print_jbd_stat)
762             jbd=$((`echo $jbdnew | cut -d" " -f1` - `echo $jbdold | cut -d" " -f1`))
763             echo "=== END   createmany $jbdnew :  $jbd transactions  nfiles $nfiles time $ELAPSED COS=$COS" 
764             avgjbd=$(( avgjbd + jbd ))
765             avgtime=$(( avgtime + ELAPSED ))
766         done
767         eval cos${COS}_jbd=$((avgjbd / 3))
768         eval cos${COS}_time=$((avgtime / 3))
769     done
770
771     echo "COS=0 transactions (avg): $cos0_jbd  time (avg): $cos0_time"
772     echo "COS=1 transactions (avg): $cos1_jbd  time (avg): $cos1_time" 
773     [ "$cos0_jbd" != 0 ] && echo "COS=1 vs COS=0 jbd:  $((((cos1_jbd/cos0_jbd - 1)) * 100 )) %"
774     [ "$cos0_time" != 0 ] && echo "COS=1 vs COS=0 time: $((((cos1_time/cos0_time - 1)) * 100 )) %"
775
776     restore_lustre_params < $param_file
777     rm -f $param_file
778     return 0
779 }
780 run_test 33a "commit on sharing, cross crete/delete, 2 clients, benchmark"
781
782 # End commit on sharing tests
783
784 test_34() { #16129
785         local OPER
786         local lock_in
787         local lock_out
788         for OPER in notimeout timeout ; do
789                 rm $DIR1/$tfile 2>/dev/null
790                 lock_in=$(do_nodes $(osts_nodes) "lctl get_param -n ldlm.namespaces.filter-*.lock_timeouts" | calc_sum)
791                 if [ $OPER == "timeout" ] ; then
792                         for j in `seq $OSTCOUNT`; do
793                                 #define OBD_FAIL_PTLRPC_HPREQ_TIMEOUT    0x511
794                                 do_facet ost$j lctl set_param fail_loc=0x511
795                         done
796                         echo lock should expire
797                 else
798                         for j in `seq $OSTCOUNT`; do
799                                 #define OBD_FAIL_PTLRPC_HPREQ_NOTIMEOUT  0x512
800                                 do_facet ost$j lctl set_param fail_loc=0x512
801                         done
802                         echo lock should not expire
803                 fi
804                 echo writing on client1
805                 dd if=/dev/zero of=$DIR1/$tfile count=100 conv=notrunc > /dev/null 2>&1
806                 sync &
807                 # wait for the flush
808                 sleep 1
809                 echo reading on client2
810                 dd of=/dev/null if=$DIR2/$tfile > /dev/null 2>&1
811                 # wait for a lock timeout
812                 sleep 4
813                 lock_out=$(do_nodes $(osts_nodes) "lctl get_param -n ldlm.namespaces.filter-*.lock_timeouts" | calc_sum)
814                 if [ $OPER == "timeout" ] ; then 
815                         if [ $lock_in == $lock_out ]; then
816                                 error "no lock timeout happened"
817                         else
818                                 echo "success"
819                         fi
820                 else
821                         if [ $lock_in != $lock_out ]; then
822                                 error "lock timeout happened"
823                         else
824                                 echo "success"
825                         fi
826                 fi
827         done
828 }
829 run_test 34 "no lock timeout under IO"
830
831 test_35() { # bug 17645
832         local generation=[]
833         local count=0
834         for imp in /proc/fs/lustre/mdc/$FSNAME-MDT*-mdc-*; do
835             g=$(awk '/generation/{print $2}' $imp/import)
836             generation[count]=$g
837             let count=count+1
838         done
839
840         mkdir -p $MOUNT1/$tfile
841         cancel_lru_locks mdc
842
843         # Let's initiate -EINTR situation by setting fail_loc and take
844         # write lock on same file from same client. This will not cause
845         # bl_ast yet as lock is already in local cache.
846 #define OBD_FAIL_LDLM_INTR_CP_AST        0x317
847         do_facet client "lctl set_param fail_loc=0x80000317"
848         local timeout=`do_facet $SINGLEMDS lctl get_param  -n timeout`
849         let timeout=timeout*3
850         local nr=0
851         while test $nr -lt 10; do
852                 log "Race attempt $nr"
853                 local blk1=`lctl get_param -n ldlm.services.ldlm_cbd.stats | awk '/ldlm_bl_callback/ {print $2}'`
854                 test "x$blk1" = "x" && blk1=0
855                 createmany -o $MOUNT2/$tfile/a 4000 &
856                 pid1=$!
857                 sleep 1
858         
859                 # Let's make conflict and bl_ast
860                 ls -la $MOUNT1/$tfile > /dev/null &
861                 pid2=$!
862                 
863                 log "Wait for $pid1 $pid2 for $timeout sec..."
864                 sleep $timeout
865                 kill -9 $pid1 $pid2 > /dev/null 2>&1
866                 wait
867                 local blk2=`lctl get_param -n ldlm.services.ldlm_cbd.stats | awk '/ldlm_bl_callback/ {print $2}'`
868                 test "x$blk2" = "x" && blk2=0
869                 test $blk2 -gt $blk1 && break
870                 rm -fr $MOUNT1/$tfile/*
871                 cancel_lru_locks mdc
872                 let nr=nr+1
873         done
874         do_facet client "lctl set_param fail_loc=0x0"
875         df -h $MOUNT1 $MOUNT2
876         count=0
877         for imp in /proc/fs/lustre/mdc/$FSNAME-MDT*-mdc-*; do
878             g=$(awk '/generation/{print $2}' $imp/import)
879             if ! test "$g" -eq "${generation[count]}"; then
880                 error "Eviction happened on import $(basename $imp)"
881             fi
882             let count=count+1
883         done
884 }
885 run_test 35 "-EINTR cp_ast vs. bl_ast race does not evict client"
886
887 log "cleanup: ======================================================"
888
889 check_and_cleanup_lustre
890
891 echo '=========================== finished ==============================='
892 [ -f "$SANITYLOG" ] && cat $SANITYLOG && grep -q FAIL $SANITYLOG && exit 1 || true
893 echo "$0: completed"