Whamcloud - gitweb
LU-15910 tests: skip sanity/413g for SSK
[fs/lustre-release.git] / lustre / tests / sanity.sh
index 1ece84e..4f5ff0f 100755 (executable)
@@ -28,7 +28,6 @@ ACCEPTOR_PORT=${ACCEPTOR_PORT:-988}
 DEF_STRIPE_COUNT=-1
 CHECK_GRANT=${CHECK_GRANT:-"yes"}
 GRANT_CHECK_LIST=${GRANT_CHECK_LIST:-""}
-export PARALLEL=${PARALLEL:-"no"}
 
 TRACE=${TRACE:-""}
 LUSTRE=${LUSTRE:-$(dirname $0)/..}
@@ -47,12 +46,12 @@ always_except LU-8411  407
 
 if $SHARED_KEY; then
        always_except LU-14181 64e 64f
+       always_except LU-15910 413g
 fi
 
 # skip the grant tests for ARM until they are fixed
 if [[ $(uname -m) = aarch64 ]]; then
        always_except LU-11671 45
-       always_except LU-14067 400a 400b
 fi
 
 # skip nfs tests on kernels >= 4.12.0 until they are fixed
@@ -8967,6 +8966,9 @@ test_64g() {
 run_test 64g "grant shrink on MDT"
 
 test_64h() {
+       (( $OST1_VERSION >= $(version_code 2.14.56) )) ||
+               skip "need OST at least 2.14.56 to avoid grant shrink on read"
+
        local instance=$($LFS getname -i $DIR)
        local osc_tgt="$FSNAME-OST0000-osc-$instance"
        local num_exps=$(do_facet ost1 \
@@ -9021,8 +9023,8 @@ test_64h() {
 run_test 64h "grant shrink on read"
 
 test_64i() {
-       (( $OST1_VERSION >= $(version_code 2.14.55) )) ||
-               skip "need OST at least 2.14.55 to avoid grant shrink on replay"
+       (( $OST1_VERSION >= $(version_code 2.14.56) )) ||
+               skip "need OST at least 2.14.56 to avoid grant shrink on replay"
 
        [ $PARALLEL == "yes" ] && skip "skip parallel run"
        remote_ost_nodsh && skip "remote OSTs with nodsh"
@@ -11653,7 +11655,7 @@ test_104c() {
 
        echo "Before recordsize change"
        lfs_df=($($LFS df -h | grep "filesystem_summary:"))
-       df=($(df -h | grep "/mnt/lustre"$))
+       df=($(df -h | grep "$MOUNT"$))
 
        # For checking.
        echo "lfs output : ${lfs_df[*]}"
@@ -11685,7 +11687,7 @@ test_104c() {
 
        echo "After recordsize change"
        lfs_df_after=($($LFS df -h | grep "filesystem_summary:"))
-       df_after=($(df -h | grep "/mnt/lustre"$))
+       df_after=($(df -h | grep "$MOUNT"$))
 
        # For checking.
        echo "lfs output : ${lfs_df_after[*]}"
@@ -11946,29 +11948,6 @@ test_115() {
 }
 run_test 115 "verify dynamic thread creation===================="
 
-free_min_max () {
-       wait_delete_completed
-       AVAIL=($(lctl get_param -n osc.*[oO][sS][cC]-[^M]*.kbytesavail))
-       echo "OST kbytes available: ${AVAIL[*]}"
-       MAXV=${AVAIL[0]}
-       MAXI=0
-       MINV=${AVAIL[0]}
-       MINI=0
-       for ((i = 0; i < ${#AVAIL[@]}; i++)); do
-               #echo OST $i: ${AVAIL[i]}kb
-               if [[ ${AVAIL[i]} -gt $MAXV ]]; then
-                       MAXV=${AVAIL[i]}
-                       MAXI=$i
-               fi
-               if [[ ${AVAIL[i]} -lt $MINV ]]; then
-                       MINV=${AVAIL[i]}
-                       MINI=$i
-               fi
-       done
-       echo "Min free space: OST $MINI: $MINV"
-       echo "Max free space: OST $MAXI: $MAXV"
-}
-
 test_116a() { # was previously test_116()
        [ $PARALLEL == "yes" ] && skip "skip parallel run"
        [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
@@ -12896,6 +12875,7 @@ test_123a_base() { # was test 123, statahead(bug 11401)
                log "testing UP system. Performance may be lower than expected."
                SLOWOK=1
        fi
+       running_in_vm && SLOWOK=1
 
        rm -rf $DIR/$tdir
        test_mkdir $DIR/$tdir
@@ -17773,33 +17753,7 @@ obdecho_test() {
 }
 
 test_180a() {
-       [ $PARALLEL == "yes" ] && skip "skip parallel run"
-
-       if ! [ -d /sys/fs/lustre/echo_client ] &&
-          ! module_loaded obdecho; then
-               load_module obdecho/obdecho &&
-                       stack_trap "rmmod obdecho" EXIT ||
-                       error "unable to load obdecho on client"
-       fi
-
-       local osc=$($LCTL dl | grep -v mdt | awk '$3 == "osc" {print $4; exit}')
-       local host=$($LCTL get_param -n osc.$osc.import |
-                    awk '/current_connection:/ { print $2 }' )
-       local target=$($LCTL get_param -n osc.$osc.import |
-                      awk '/target:/ { print $2 }' )
-       target=${target%_UUID}
-
-       if [ -n "$target" ]; then
-               setup_obdecho_osc $host $target &&
-                       stack_trap "cleanup_obdecho_osc $target" EXIT ||
-                       { error "obdecho setup failed with $?"; return; }
-
-               obdecho_test ${target}_osc client ||
-                       error "obdecho_test failed on ${target}_osc"
-       else
-               $LCTL get_param osc.$osc.import
-               error "there is no osc.$osc.import target"
-       fi
+       skip "obdecho on osc is no longer supported"
 }
 run_test 180a "test obdecho on osc"
 
@@ -17867,7 +17821,7 @@ test_181() { # bug 22177
 }
 run_test 181 "Test open-unlinked dir ========================"
 
-test_182() {
+test_182a() {
        local fcount=1000
        local tcount=10
 
@@ -17893,7 +17847,75 @@ test_182() {
 
        rm -rf $DIR/$tdir
 }
-run_test 182 "Test parallel modify metadata operations ================"
+run_test 182a "Test parallel modify metadata operations from mdc"
+
+test_182b() {
+       [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
+       [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
+       local dcount=1000
+       local tcount=10
+       local stime
+       local etime
+       local delta
+
+       do_facet mds1 $LCTL list_param \
+               osp.$FSNAME-MDT*-osp-MDT*.rpc_stats ||
+               skip "MDS lacks parallel RPC handling"
+
+       $LFS mkdir -i 0 $DIR/$tdir || error "creating dir $DIR/$tdir"
+
+       rpc_count=$(do_facet mds1 $LCTL get_param -n \
+                   osp.$FSNAME-MDT0001-osp-MDT0000.max_mod_rpcs_in_flight)
+
+       stime=$(date +%s)
+       createmany -i 0 -d $DIR/$tdir/t- $tcount
+
+       for (( i = 0; i < $tcount; i++ )) ; do
+               createmany -i 0 -d $DIR/$tdir/t-$i/d- 0 $dcount &
+       done
+       wait
+       etime=$(date +%s)
+       delta=$((etime - stime))
+       echo "Time for file creation $delta sec for $rpc_count parallel RPCs"
+
+       stime=$(date +%s)
+       for (( i = 0; i < $tcount; i++ )) ; do
+               unlinkmany -d $DIR/$tdir/$i/d- $dcount &
+       done
+       wait
+       etime=$(date +%s)
+       delta=$((etime - stime))
+       echo "Time for file removal $delta sec for $rpc_count parallel RPCs"
+
+       rm -rf $DIR/$tdir
+
+       $LFS mkdir -i 0 $DIR/$tdir || error "creating dir $DIR/$tdir"
+
+       do_facet mds1 $LCTL set_param osp.$FSNAME-MDT0001-osp-MDT0000.max_mod_rpcs_in_flight=1
+
+       stime=$(date +%s)
+       createmany -i 0 -d $DIR/$tdir/t- $tcount
+
+       for (( i = 0; i < $tcount; i++ )) ; do
+               createmany -i 0 -d $DIR/$tdir/t-$i/d- 0 $dcount &
+       done
+       wait
+       etime=$(date +%s)
+       delta=$((etime - stime))
+       echo "Time for file creation $delta sec for 1 RPC sent at a time"
+
+       stime=$(date +%s)
+       for (( i = 0; i < $tcount; i++ )) ; do
+               unlinkmany -d $DIR/$tdir/t-$i/d- $dcount &
+       done
+       wait
+       etime=$(date +%s)
+       delta=$((etime - stime))
+       echo "Time for file removal $delta sec for 1 RPC sent at a time"
+
+       do_facet mds1 $LCTL set_param osp.$FSNAME-MDT0001-osp-MDT0000.max_mod_rpcs_in_flight=$rpc_count
+}
+run_test 182b "Test parallel modify metadata operations from osp"
 
 test_183() { # LU-2275
        [ $PARALLEL == "yes" ] && skip "skip parallel run"
@@ -20909,7 +20931,7 @@ test_244b()
 }
 run_test 244b "multi-threaded write with group lock"
 
-test_245() {
+test_245a() {
        local flagname="multi_mod_rpcs"
        local connect_data_name="max_mod_rpcs"
        local out
@@ -20932,7 +20954,35 @@ test_245() {
        echo "$out" | grep -qw $connect_data_name ||
                error "import should have connect data $connect_data_name"
 }
-run_test 245 "check mdc connection flag/data: multiple modify RPCs"
+run_test 245a "check mdc connection flag/data: multiple modify RPCs"
+
+test_245b() {
+       local flagname="multi_mod_rpcs"
+       local connect_data_name="max_mod_rpcs"
+       local out
+
+       remote_mds_nodsh && skip "remote MDS with nodsh"
+       [[ $MDSCOUNT -ge 2 ]] || skip "needs >= 2 MDTs"
+
+       # check if multiple modify RPCs flag is set
+       out=$(do_facet mds1 \
+             $LCTL get_param osp.$FSNAME-MDT0001-osp-MDT0000.import |
+             grep "connect_flags:")
+       echo "$out"
+
+       [[ "$out" =~ $flagname ]] || skip "connect flag $flagname is not set"
+
+       # check if multiple modify RPCs data is set
+       out=$(do_facet mds1 \
+             $LCTL get_param osp.$FSNAME-MDT0001-osp-MDT0000.import)
+
+       [[ "$out" =~ $connect_data_name ]] ||
+               {
+                       echo "$out"
+                       error "missing connect data $connect_data_name"
+               }
+}
+run_test 245b "check osp connection flag/data: multiple modify RPCs"
 
 cleanup_247() {
        local submount=$1
@@ -24300,25 +24350,37 @@ run_test 398a "direct IO should cancel lock otherwise lockless"
 
 test_398b() { # LU-4198
        which fio || skip_env "no fio installed"
-       $LFS setstripe -c -1 $DIR/$tfile
+       $LFS setstripe -c -1 -S 1M $DIR/$tfile
 
-       local size=12
+       local size=48
        dd if=/dev/zero of=$DIR/$tfile bs=1M count=$size
 
        local njobs=4
-       echo "mix direct rw ${size}M to OST0 by fio with $njobs jobs..."
-       fio --name=rand-rw --rw=randrw --bs=$PAGE_SIZE --direct=1 \
-               --numjobs=$njobs --fallocate=none \
-               --iodepth=16 --allow_file_create=0 --size=$((size/njobs))M \
-               --filename=$DIR/$tfile &
-       bg_pid=$!
-
-       echo "mix buffer rw ${size}M to OST0 by fio with $njobs jobs..."
-       fio --name=rand-rw --rw=randrw --bs=$PAGE_SIZE \
-               --numjobs=$njobs --fallocate=none \
-               --iodepth=16 --allow_file_create=0 --size=$((size/njobs))M \
-               --filename=$DIR/$tfile || true
-       wait $bg_pid
+       # Single page, multiple pages, stripe size, 4*stripe size
+       for bsize in $(( $PAGE_SIZE )) $(( 4*$PAGE_SIZE )) 1048576 4194304; do
+               echo "mix direct rw ${bsize} by fio with $njobs jobs..."
+               fio --name=rand-rw --rw=randrw --bs=$bsize --direct=1 \
+                       --numjobs=$njobs --fallocate=none \
+                       --iodepth=16 --allow_file_create=0 --size=$((size/njobs))M \
+                       --filename=$DIR/$tfile &
+               bg_pid=$!
+
+               echo "mix buffer rw ${bsize} by fio with $njobs jobs..."
+               fio --name=rand-rw --rw=randrw --bs=$bsize \
+                       --numjobs=$njobs --fallocate=none \
+                       --iodepth=16 --allow_file_create=0 --size=$((size/njobs))M \
+                       --filename=$DIR/$tfile || true
+               wait $bg_pid
+       done
+
+       evict=$(do_facet client $LCTL get_param \
+               osc.$FSNAME-OST*-osc-*/state |
+           awk -F"[ [,]" '/EVICTED ]$/ { if (t<$5) {t=$5;} } END { print t }')
+
+       [ -z "$evict" ] || [[ $evict -le $before ]] ||
+               (do_facet client $LCTL get_param \
+                       osc.$FSNAME-OST*-osc-*/state;
+                   error "eviction happened: $evict before:$before")
 
        rm -f $DIR/$tfile
 }
@@ -25768,26 +25830,15 @@ test_413e() {
 }
 run_test 413e "check default max-inherit value"
 
-test_413f() {
-       (( MDSCOUNT >= 2 )) || skip "We need at least 2 MDTs for this test"
-
-       (( MDS1_VERSION >= $(version_code 2.14.55) )) ||
-               skip "Need server version at least 2.14.55"
-
-       getfattr -d -m trusted.dmv --absolute-names $DIR > $TMP/dmv.ea ||
-               error "dump $DIR default LMV failed"
-       stack_trap "setfattr --restore=$TMP/dmv.ea"
-
-       $LFS setdirstripe -D -i -1 -c 1 -X 3 --max-inherit-rr 3 $DIR ||
-               error "set $DIR default LMV failed"
-
+test_fs_dmv_inherit()
+{
        local testdir=$DIR/$tdir
 
        local count
        local inherit
        local inherit_rr
 
-       for i in $(seq 3); do
+       for i in 1 2 3; do
                mkdir $testdir || error "mkdir $testdir failed"
                count=$($LFS getdirstripe -D -c $testdir)
                (( count == 1 )) ||
@@ -25806,8 +25857,57 @@ test_413f() {
        (( count == 0 )) ||
                error "$testdir default LMV count not zero: $count"
 }
+
+test_413f() {
+       (( MDSCOUNT >= 2 )) || skip "We need at least 2 MDTs for this test"
+
+       (( MDS1_VERSION >= $(version_code 2.14.55) )) ||
+               skip "Need server version at least 2.14.55"
+
+       getfattr -d -m trusted.dmv --absolute-names $DIR > $TMP/dmv.ea ||
+               error "dump $DIR default LMV failed"
+       stack_trap "setfattr --restore=$TMP/dmv.ea"
+
+       $LFS setdirstripe -D -i -1 -c 1 -X 3 --max-inherit-rr 3 $DIR ||
+               error "set $DIR default LMV failed"
+
+       test_fs_dmv_inherit
+}
 run_test 413f "lfs getdirstripe -D list ROOT default LMV if it's not set on dir"
 
+test_413g() {
+       (( MDSCOUNT >= 2 )) || skip "We need at least 2 MDTs for this test"
+
+       mkdir -p $DIR/$tdir/l2/l3/l4 || error "mkdir $tdir/l1/l2/l3 failed"
+       getfattr -d -m trusted.dmv --absolute-names $DIR > $TMP/dmv.ea ||
+               error "dump $DIR default LMV failed"
+       stack_trap "setfattr --restore=$TMP/dmv.ea"
+
+       $LFS setdirstripe -D -i -1 -c 1 -X 3 --max-inherit-rr 3 $DIR ||
+               error "set $DIR default LMV failed"
+
+       FILESET="$FILESET/$tdir/l2/l3/l4" mount_client $MOUNT2 ||
+               error "mount $MOUNT2 failed"
+       stack_trap "umount_client $MOUNT2"
+
+       local saved_DIR=$DIR
+
+       export DIR=$MOUNT2
+
+       stack_trap "export DIR=$saved_DIR"
+
+       # first check filesystem-wide default LMV inheritance
+       test_fs_dmv_inherit || error "incorrect fs default LMV inheritance"
+
+       # then check subdirs are spread to all MDTs
+       createmany -d $DIR/s $((MDSCOUNT * 100)) || error "createmany failed"
+
+       local count=$($LFS getstripe -m $DIR/s* | sort -u | wc -l)
+
+       (( $count == $MDSCOUNT )) || error "dirs are spread to $count MDTs"
+}
+run_test 413g "enforce ROOT default LMV on subdir mount"
+
 test_413z() {
        local pids=""
        local subdir
@@ -26786,6 +26886,45 @@ test_432() {
 }
 run_test 432 "mv dir from outside Lustre"
 
+test_433() {
+       [ $PARALLEL == "yes" ] && skip "skip parallel run"
+
+       [[ -n "$($LCTL list_param llite.*.inode_cache 2>/dev/null)" ]] ||
+               skip "inode cache not supported"
+
+       $LCTL set_param llite.*.inode_cache=0
+       stack_trap "$LCTL set_param llite.*.inode_cache=1"
+
+       local count=256
+       local before
+       local after
+
+       cancel_lru_locks mdc
+       test_mkdir $DIR/$tdir || error "mkdir $tdir"
+       createmany -m $DIR/$tdir/f $count
+       createmany -d $DIR/$tdir/d $count
+       ls -l $DIR/$tdir > /dev/null
+       stack_trap "rm -rf $DIR/$tdir"
+
+       before=$(num_objects)
+       cancel_lru_locks mdc
+       after=$(num_objects)
+
+       # sometimes even @before is less than 2 * count
+       while (( before - after < count )); do
+               sleep 1
+               after=$(num_objects)
+               wait=$((wait + 1))
+               (( wait % 5 == 0 )) && echo "wait $wait seconds objects: $after"
+               if (( wait > 60 )); then
+                       error "inode slab grew from $before to $after"
+               fi
+       done
+
+       echo "lustre_inode_cache $before objs before lock cancel, $after after"
+}
+run_test 433 "ldlm lock cancel releases dentries and inodes"
+
 prep_801() {
        [[ $MDS1_VERSION -lt $(version_code 2.9.55) ]] ||
        [[ $OST1_VERSION -lt $(version_code 2.9.55) ]] &&