Whamcloud - gitweb
LU-3266 test: regression tests for nrs policies
[fs/lustre-release.git] / lustre / tests / sanityn.sh
index ddfd6ee..6c0cd31 100644 (file)
@@ -3,23 +3,15 @@
 set -e
 
 ONLY=${ONLY:-"$*"}
-# bug number for skipped test: 3192 LU-1205 15528/3811 16929 9977 15528/11549 18080
-ALWAYS_EXCEPT="                14b  18c     19         22    28   29          35    $SANITYN_EXCEPT"
+# bug number for skipped test: 3192 LU-1205 15528/3811 9977 15528/11549 18080
+ALWAYS_EXCEPT="                14b  18c     19         28   29          35    $SANITYN_EXCEPT"
 # UPDATE THE COMMENT ABOVE WITH BUG NUMBERS WHEN CHANGING ALWAYS_EXCEPT!
 
-# bug number for skipped test:        12652 12652
-grep -q 'Enterprise Server 10' /etc/SuSE-release 2> /dev/null &&
-       ALWAYS_EXCEPT="$ALWAYS_EXCEPT 11    14" || true
-
-# It will be ported soon.
-EXCEPT="$EXCEPT 22"
-
-SRCDIR=`dirname $0`
+SRCDIR=$(dirname $0)
 PATH=$PWD/$SRCDIR:$SRCDIR:$SRCDIR/../utils:$PATH
 
 SIZE=${SIZE:-40960}
 CHECKSTAT=${CHECKSTAT:-"checkstat -v"}
-MCREATE=${MCREATE:-mcreate}
 OPENFILE=${OPENFILE:-openfile}
 OPENUNLINK=${OPENUNLINK:-openunlink}
 export MULTIOP=${MULTIOP:-multiop}
@@ -41,8 +33,8 @@ init_test_env $@
 init_logging
 
 if [ $(facet_fstype $SINGLEMDS) = "zfs" ]; then
-# bug number for skipped test:        LU-2840 LU-2189 LU-2776
-       ALWAYS_EXCEPT="$ALWAYS_EXCEPT 21      36      51a"
+# bug number for skipped test:        LU-2189 LU-2776
+       ALWAYS_EXCEPT="$ALWAYS_EXCEPT 36      51a"
 # LU-2829 / LU-2887 - make allowances for ZFS slowness
        TEST33_NFILES=${TEST33_NFILES:-1000}
 fi
@@ -758,14 +750,14 @@ test_32a() { # bug 11270
         log "checking cached lockless truncate"
         $TRUNCATE $DIR1/$tfile 8000000
         $CHECKSTAT -s 8000000 $DIR2/$tfile || error "wrong file size"
-        [ $(calc_osc_stats lockless_truncate) -eq 0 ] ||
-                error "lockless truncate doesn't use cached locks"
+       [ $(calc_osc_stats lockless_truncate) -ne 0 ] ||
+               error "cached truncate isn't lockless"
 
         log "checking not cached lockless truncate"
         $TRUNCATE $DIR2/$tfile 5000000
         $CHECKSTAT -s 5000000 $DIR1/$tfile || error "wrong file size"
-        [ $(calc_osc_stats lockless_truncate) -ne 0 ] ||
-                error "not cached trancate isn't lockless"
+       [ $(calc_osc_stats lockless_truncate) -ne 0 ] ||
+               error "not cached truncate isn't lockless"
 
         log "disabled lockless truncate"
         enable_lockless_truncate 0
@@ -1028,8 +1020,9 @@ run_test 34 "no lock timeout under IO"
 test_35() { # bug 17645
         local generation=[]
         local count=0
-        for imp in /proc/fs/lustre/mdc/$FSNAME-MDT*-mdc-*; do
-            g=$(awk '/generation/{print $2}' $imp/import)
+       gen=$(lctl get_param mdc.$FSNAME-MDT*-mdc-*.import | grep generation |
+               awk '/generation/{print $2}')
+       for g in $gen; do
             generation[count]=$g
             let count=count+1
         done
@@ -1071,10 +1064,20 @@ test_35() { # bug 17645
         do_facet client "lctl set_param fail_loc=0x0"
         df -h $MOUNT1 $MOUNT2
         count=0
-        for imp in /proc/fs/lustre/mdc/$FSNAME-MDT*-mdc-*; do
-            g=$(awk '/generation/{print $2}' $imp/import)
-            if ! test "$g" -eq "${generation[count]}"; then
-                error "Eviction happened on import $(basename $imp)"
+       gen=$(lctl get_param mdc.$FSNAME-MDT*-mdc-*.import | grep generation |
+               awk '/generation/{print $2}')
+       for g in $gen; do
+           if ! test "$g" -eq "${generation[count]}"; then
+               list=$(lctl list_param mdc.$FSNAME-MDT*-mdc-*.import)
+               local c = 0
+               for imp in $list; do
+                       if [ $c = $count ]; then
+                               break
+                       fi
+                       c=c+1
+               done
+               imp=$(echo "$imp" | awk -F"." '{print $2}')
+               error "Eviction happened on import $imp"
             fi
             let count=count+1
         done
@@ -2307,29 +2310,216 @@ test_51b() {
 run_test 51b "layout lock: glimpse should be able to restart if layout changed"
 
 test_51c() {
-       # create an empty file
-       $MCREATE $DIR1/$tfile
+       [ $OSTCOUNT -ge 2 ] || { skip "need at least 2 osts"; return; }
+
+       # set default layout to have 1 stripe
+       mkdir -p $DIR1/$tdir
+       $LFS setstripe -c 1 $DIR1/$tdir
+
+       # create a file with empty layout
+       $MCREATE $DIR1/$tdir/$tfile
 
 #define OBD_FAIL_MDS_LL_BLOCK 0x172
-       $LCTL set_param fail_loc=0x172
+       do_facet $SINGLEMDS $LCTL set_param fail_loc=0x172
 
        # change the layout of testing file
-       echo "Setting layout ..."
-       $LFS setstripe -c $OSTCOUNT $DIR1/$tfile &
+       echo "Setting layout to have $OSTCOUNT stripes ..."
+       $LFS setstripe -c $OSTCOUNT $DIR1/$tdir/$tfile &
        pid=$!
        sleep 1
 
-       # get layout of this file should wait until dd is finished
-       local stripecnt=`$LFS getstripe -c $DIR2/$tfile`
-       [ $stripecnt -eq $OSTCOUNT ] || error "layout wrong"
+       # write something to the file, it should be blocked on fetching layout
+       dd if=/dev/zero of=$DIR2/$tdir/$tfile bs=1k count=1 conv=notrunc
+       local cnt=$($LFS getstripe -c $DIR2/$tdir/$tfile)
+       [ $cnt -eq $OSTCOUNT ] || error "have $cnt stripes, expected $OSTCOUNT"
 
-       rm -f $DIR1/$tfile
+       rm -fr $DIR1/$tdir
 }
 run_test 51c "layout lock: IT_LAYOUT blocked and correct layout can be returned"
 
+test_51d() {
+       dd if=/dev/zero of=/$DIR1/$tfile bs=1M count=1
+       cancel_lru_locks mdc
+
+       # open should grant LAYOUT lock, mmap and read will install pages
+       $MULTIOP $DIR1/$tfile oO_RDWR:SMR_Uc &
+       local PID=$!
+       sleep 1
+
+       # rss before revoking
+       local br=$(grep -A 10 $tfile /proc/$PID/smaps | awk '/^Rss/{print $2}')
+       echo "Before revoking layout lock: $br KB mapped"
+
+       # delete the file will revoke layout lock
+       rm -f $DIR2/$tfile
+
+       # rss after revoking
+       local ar=$(grep -A 10 $tfile /proc/$PID/smaps | awk '/^Rss/{print $2}')
+
+       kill -USR1 $PID
+       wait $PID || error
+
+       [ $ar -eq 0 ] || error "rss before: $br, after $ar, some pages remained"
+}
+run_test 51d "layout lock: losing layout lock should clean up memory map region"
+
+test_54_part1()
+{
+       echo "==> rename vs getattr vs setxattr should not deadlock"
+       mkdir -p $DIR/d1/d2/d3 || error "(1) mkdir failed"
+
+       do_facet mds $LCTL set_param fail_loc=$1
+
+       mv -T $DIR/d1/d2/d3 $DIR/d1/d3 &
+       PID1=$!
+       sleep 1
+
+       stat $DIR/d1/d2 &
+       PID2=$!
+       sleep 1
+
+       setfattr -n user.attr1 -v value1 $DIR2/d1 || error "(2) setfattr failed"
+       wait $PID1 || error "(3) mv failed"
+       wait $PID2 || error "(4) stat failed"
+       echo
+
+       rm -rf $DIR/d1
+}
+
+test_54_part2() {
+       echo "==> rename vs getattr vs open vs getattr should not deadlock"
+       mkdir -p $DIR/d1/d2/d3 || error "(1) mkdir failed"
+
+       do_facet mds $LCTL set_param fail_loc=$1
+
+       mv -T $DIR/d1/d2/d3 $DIR/d1/d3 &
+       PID1=$!
+       sleep 1
+
+       stat $DIR/d1/d2 &
+       PID2=$!
+       sleep 1
+
+       $MULTIOP $DIR2/d1/d2 Oc &
+       PID3=$!
+       sleep 1
+
+       stat $DIR/d1 || error "(2) stat failed"
+
+       wait $PID1 || error "(3) mv failed"
+       wait $PID2 || error "(4) stat failed"
+       wait $PID3 && error "(5) multiop failed"
+       echo
+       rm -rf $DIR/d1
+}
+
+test_54() {
+       local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
+       save_lustre_params client "llite.*.xattr_cache" > $p
+       lctl set_param llite.*.xattr_cache 1 ||
+               { skip "xattr cache is not supported"; return 0; }
+
+#define OBD_FAIL_MDS_RENAME              0x153
+#define OBD_FAIL_MDS_RENAME2             0x154
+       test_54_part1 0x80000153 || error 10
+       test_54_part1 0x80000154 || error 11
+       test_54_part2 0x80000153 || error 12
+       test_54_part2 0x80000154 || error 13
+
+       restore_lustre_params < $p
+       rm -f $p
+}
+run_test 54 "rename locking"
+
+test_55a() {
+       mkdir -p $DIR/d1/d2 $DIR/d3 || error "(1) mkdir failed"
+
+#define OBD_FAIL_MDS_RENAME4              0x156
+       do_facet mds $LCTL set_param fail_loc=0x80000156
+
+       mv -T $DIR/d1/d2 $DIR/d3/d2 &
+       PID1=$!
+       sleep 1
+
+       rm -r $DIR2/d3
+       wait $PID1 && error "(2) mv succeeded"
+
+       rm -rf $DIR/d1
+}
+run_test 55a "rename vs unlink target dir"
+
+test_55b()
+{
+       mkdir -p $DIR/d1/d2 $DIR/d3 || error "(1) mkdir failed"
+
+#define OBD_FAIL_MDS_RENAME4             0x156
+       do_facet mds $LCTL set_param fail_loc=0x80000156
+
+       mv -T $DIR/d1/d2 $DIR/d3/d2 &
+       PID1=$!
+       sleep 1
+
+       rm -r $DIR2/d1
+       wait $PID1 && error "(2) mv succeeded"
+
+       rm -rf $DIR/d3
+}
+run_test 55b "rename vs unlink source dir"
+
+test_55c()
+{
+       mkdir -p $DIR/d1/d2 $DIR/d3 || error "(1) mkdir failed"
+
+#define OBD_FAIL_MDS_RENAME4              0x156
+       do_facet mds $LCTL set_param fail_loc=0x156
+
+       mv -T $DIR/d1/d2 $DIR/d3/d2 &
+       PID1=$!
+       sleep 1
+
+       # while rename is sleeping, open and remove d3
+       $MULTIOP $DIR2/d3 D_c &
+       PID2=$!
+       sleep 1
+       rm -rf $DIR2/d3
+       sleep 5
+
+       # while rename is sleeping 2nd time, close d3
+       kill -USR1 $PID2
+       wait $PID2 || error "(3) multiop failed"
+
+       wait $PID1 && error "(2) mv succeeded"
+
+       rm -rf $DIR/d1
+}
+run_test 55c "rename vs unlink orphan target dir"
+
+test_55d()
+{
+       touch $DIR/f1
+
+#define OBD_FAIL_MDS_RENAME3              0x155
+       do_facet mds $LCTL set_param fail_loc=0x155
+       mv $DIR/f1 $DIR/$tdir &
+       PID1=$!
+       sleep 2
+
+       # while rename is sleeping, create $tdir, but as a directory
+       mkdir -p $DIR2/$tdir || error "(1) mkdir failed"
+
+       # link in reverse locking order
+       ln $DIR2/f1 $DIR2/$tdir/
+
+       wait $PID1 && error "(2) mv succeeded"
+       rm -rf $DIR/f1
+}
+run_test 55d "rename file vs link"
+
 test_60() {
-       [[ $(lustre_version_code $SINGLEMDS) -ge $(version_code 2.3.0) ]] ||
-       { skip "Need MDS version at least 2.3.0"; return; }
+       local MDSVER=$(lustre_build_version $SINGLEMDS)
+       [ $(version_code $MDSVER) -lt $(version_code 2.3.0) ] &&
+               skip "MDS version $MDSVER must be >= 2.3.0" && return 0
+
        # Create a file
        test_mkdir -p $DIR1/$tdir
        file1=$DIR1/$tdir/file
@@ -2549,14 +2739,9 @@ run_test 75 "osc: upcall after unuse lock==================="
 test_76() { #LU-946
        [[ $(lustre_version_code $SINGLEMDS) -lt $(version_code 2.5.53) ]] &&
                skip "Need MDS version at least 2.5.53" && return
-       [ $MDSCOUNT -ge 2 ] && skip "skip now for LU-4573" && return #LU-4573
 
        remote_mds_nodsh && skip "remote MDS with nodsh" && return
        local fcount=2048
-       local fd
-       local cmd
-       local mdt_idx
-       local mds_idx
        declare -a fd_list
        declare -a fid_list
 
@@ -2568,29 +2753,24 @@ test_76() { #LU-946
 
        rm -rf $DIR/$tdir
        test_mkdir -p $DIR/$tdir
-       if [ $MDSCOUNT -gt 1 ]; then
-               mdt_idx=$($LFS getdirstripe -i $DIR/$tdir)
-       else
-               mdt_idx=0
-       fi
-       mds_idx=$((mdt_idx + 1))
-       proc_ofile="mdt.*$mdt_idx.exports.'$nid'.open_files"
 
+       # drop all open locks and close any cached "open" files on the client
        cancel_lru_locks mdc
 
        echo -n "open files "
        ulimit -n 8096
-       for (( i = 0; i < $fcount; i++ )) ; do
+       for ((i = 0; i < $fcount; i++)); do
                touch $DIR/$tdir/f_$i
-               fd=$(free_fd)
-               cmd="exec $fd<$DIR/$tdir/f_$i"
+               local fd=$(free_fd)
+               local cmd="exec $fd<$DIR/$tdir/f_$i"
                eval $cmd
                fd_list[i]=$fd
                echo -n "."
        done
        echo
 
-       fid_list=($(do_facet mds$mds_idx $LCTL get_param -n $proc_ofile))
+       local get_open_fids="$LCTL get_param -n mdt.*.exports.'$nid'.open_files"
+       local fid_list=($(do_nodes $(comma_list $(mdts_nodes)) $get_open_fids))
 
        # Possible errors in openfiles FID list.
        # 1. Missing FIDs. Check 1
@@ -2623,6 +2803,119 @@ test_76() { #LU-946
 }
 run_test 76 "Verify open file for 2048 files"
 
+nrs_write_read() {
+       local n=16
+       local dir=$DIR/$tdir
+
+       mkdir $dir || error "mkdir $dir failed"
+       $LFS setstripe -c $OSTCOUNT $dir || error "setstripe to $dir failed"
+
+       do_nodes $CLIENTS dd if=/dev/zero of="$dir/nrs_r_$HOSTNAME"\
+               bs=1M count=$n > /dev/null 2>&1
+
+       for ((i = 0; i < $n; i++)); do
+               do_nodes $CLIENTS dd if=/dev/zero of="$dir/nrs_w_$HOSTNAME"\
+                       bs=1M seek=$i count=1 > /dev/null 2>&1 &
+               local pids_w[$i]=$!
+       done
+       do_nodes $CLIENTS sync;
+       cancel_lru_locks osc
+
+       for ((i = 0; i < $n; i++)); do
+               do_nodes $CLIENTS dd if="$dir/nrs_w_$HOSTNAME" of=/dev/zero\
+                       bs=1M seek=$i count=1 > /dev/null 2>&1 &
+               local pids_r[$i]=$!
+       done
+       cancel_lru_locks osc
+
+       for ((i = 0; i < $n; i++)); do
+               wait ${pids_w[$i]}
+               wait ${pids_r[$i]}
+       done
+       rm -rf $dir || error "rm -rf $dir failed"
+}
+
+test_77a() { #LU-3266
+       do_facet $SINGLEMDS lctl set_param ost.OSS.*.nrs_policies="fifo"
+       nrs_write_read
+
+       return 0
+}
+run_test 77a "check FIFO NRS policy"
+
+
+test_77b() { #LU-3266
+       do_facet $SINGLEMDS lctl set_param ost.OSS.*.nrs_policies="crrn"
+       do_facet $SINGLEMDS lctl set_param ost.OSS.*.nrs_crrn_quantum=1
+
+       echo "policy: crr-n, crrn_quantum 1"
+       nrs_write_read
+
+       do_facet $SINGLEMDS lctl set_param ost.OSS.*.nrs_crrn_quantum=64
+
+       echo "policy: crr-n, crrn_quantum 64"
+       nrs_write_read
+
+       return 0
+}
+run_test 77b "check CRR-N NRS policy"
+
+orr_trr() {
+       local policy=$1
+
+       for i in $(seq 1 $OSTCOUNT)
+       do
+               do_facet ost"$i" lctl set_param \
+                       ost.OSS.ost_io.nrs_policies=$policy
+               do_facet ost"$i" lctl set_param \
+                       ost.OSS.*.nrs_"$policy"_quantum=1
+               do_facet ost"$i" lctl set_param \
+                       ost.OSS.*.nrs_"$policy"_offset_type="physical"
+               do_facet ost"$i" lctl set_param \
+                       ost.OSS.*.nrs_"$policy"_supported="reads"
+       done
+
+       echo "policy: $policy, ${policy}_quantum 1, ${policy}_offset_type \
+                               physical, ${policy}_supported reads"
+       nrs_write_read
+
+       for i in $(seq 1 $OSTCOUNT)
+       do
+               do_facet ost"$i" lctl set_param \
+                       ost.OSS.*.nrs_${policy}_supported="writes"
+               do_facet ost"$i" lctl set_param \
+                       ost.OSS.*.nrs_${policy}_quantum=64
+       done
+       echo "policy: $policy, ${policy}_quantum 64, \
+               ${policy}_offset_type physical, ${policy}_supported writes"
+       nrs_write_read
+
+       for i in $(seq 1 $OSTCOUNT)
+       do
+               do_facet ost"$i" lctl set_param \
+                       ost.OSS.*.nrs_${policy}_supported="reads_and_writes"
+               do_facet ost"$i" lctl set_param \
+                       ost.OSS.*.nrs_${policy}_offset_type="logical"
+       done
+       echo "policy: $policy, ${policy}_quantum 64, \
+               ${policy}_offset_type logical, ${policy}_supported reads_and_writes"
+       nrs_write_read
+
+       return 0
+}
+
+test_77c() { #LU-3266
+       orr_trr "orr"
+       return 0
+}
+run_test 77c "check ORR NRS policy"
+
+test_77d() { #LU-3266
+       orr_trr "trr"
+       return 0
+}
+run_test 77d "check TRR nrs policy"
+
 test_80() {
        [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
        local MDTIDX=1
@@ -2665,6 +2958,58 @@ test_80() {
 }
 run_test 80 "migrate directory when some children is being opened"
 
+test_81() {
+       [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
+
+       rm -rf $DIR1/$tdir
+
+       mkdir -p $DIR1/$tdir
+
+       $LFS setdirstripe -i0 -c$MDSCOUNT  $DIR1/$tdir/d0
+       $LFS setdirstripe -i0 -c$MDSCOUNT  $DIR1/$tdir/d1
+
+       cd $DIR1/$tdir
+       touch d0/0      || error "create 0 failed"
+       mv d0/0 d1/0    || error "rename d0/0 d1/0 failed"
+       stat d0/0       && error "stat mv filed succeed"
+       mv $DIR2/$tdir/d1/0 $DIR2/$tdir/d0/0 || "rename d1/0 d0/0 failed"
+       stat d0/0       || error "stat failed"
+
+       local t=$(ls -ai $DIR1/$tdir/d0 | sort -u | wc -l)
+
+       if [ $t -ne 3 ]; then
+               ls -ai $DIR1/$tdir/d0
+               error "expect 3 get $t"
+       fi
+
+       return 0
+}
+run_test 81 "rename and stat under striped directory"
+
+test_82() {
+       [[ $(lustre_version_code $SINGLEMDS) -gt $(version_code 2.6.91) ]] ||
+               { skip "Need MDS version at least 2.6.92"; return 0; }
+
+       # Client 1 creates a file.
+       multiop_bg_pause $DIR1/$tfile O_ac || error "multiop_bg_pause 1"
+       pid1=$!
+       # Client 2 opens the file.
+       multiop_bg_pause $DIR2/$tfile o_Ac || error "multiop_bg_pause 2"
+       pid2=$!
+       # Client 1 makes the file an orphan.
+       rm $DIR1/$tfile || error "rm"
+       # Client 2 sets EA "user.multiop".
+       kill -s USR1 $pid2
+       wait $pid2 || error "multiop 2"
+       # Client 1 gets EA "user.multiop".  This used to fail because the EA
+       # cache refill would get "trusted.link" from mdd_xattr_list() but
+       # -ENOENT when trying to get "trusted.link"'s value.  See also sanity
+       # 102q.
+       kill -s USR1 $pid1
+       wait $pid1 || error "multiop 1"
+}
+run_test 82 "fsetxattr and fgetxattr on orphan files"
+
 log "cleanup: ======================================================"
 
 [ "$(mount | grep $MOUNT2)" ] && umount $MOUNT2