Whamcloud - gitweb
LU-6529 ldlm: cancel aged locks for LRUR
[fs/lustre-release.git] / lustre / tests / sanity.sh
index 0bbfe69..e7747e5 100644 (file)
@@ -61,8 +61,8 @@ init_logging
 [ "$SLOW" = "no" ] && EXCEPT_SLOW="24o 24D 27m 64b 68 71 77f 78 115 124b 230d"
 
 if [ $(facet_fstype $SINGLEMDS) = "zfs" ]; then
-       # bug number for skipped test: LU-4536 LU-5242   LU-1957 LU-2805
-       ALWAYS_EXCEPT="$ALWAYS_EXCEPT  65ic     78 79 80 180     184c"
+       # bug number for skipped test: LU-4536 LU-1957 LU-2805
+       ALWAYS_EXCEPT="$ALWAYS_EXCEPT  65ic    180     184c"
        [ "$SLOW" = "no" ] && EXCEPT_SLOW="$EXCEPT_SLOW 51b 51ba"
 fi
 
@@ -80,17 +80,6 @@ setup() {
        echo "done"
 }
 
-check_kernel_version() {
-       WANT_VER=$1
-       GOT_VER=$(lctl get_param -n version | awk '/kernel:/ {print $2}')
-       case $GOT_VER in
-       patchless|patchless_client) return 0;;
-       *) [ $GOT_VER -ge $WANT_VER ] && return 0 ;;
-       esac
-       log "test needs at least kernel version $WANT_VER, running $GOT_VER"
-       return 1
-}
-
 check_swap_layouts_support()
 {
        $LCTL get_param -n llite.*.sbi_flags | grep -q layout ||
@@ -98,11 +87,6 @@ check_swap_layouts_support()
        return 1
 }
 
-if [ "$ONLY" == "cleanup" ]; then
-       sh llmountcleanup.sh
-       exit 0
-fi
-
 check_and_setup_lustre
 
 DIR=${DIR:-$MOUNT}
@@ -955,7 +939,6 @@ test_24n() {
 run_test 24n "Statting the old file after renaming (Posix rename 2)"
 
 test_24o() {
-       check_kernel_version 37 || return 0
        test_mkdir -p $DIR/d24o
        rename_many -s random -v -n 10 $DIR/d24o
 }
@@ -2181,7 +2164,6 @@ test_31d() {
 run_test 31d "remove of open directory ========================="
 
 test_31e() { # bug 2904
-       check_kernel_version 34 || return 0
        openfilleddirunlink $DIR/d31e || error
 }
 run_test 31e "remove of open non-empty directory ==============="
@@ -3876,19 +3858,14 @@ test_48a() { # bug 2399
        [ $(lustre_version_code $SINGLEMDS) -lt $(version_code 2.3.63) ] &&
                skip "MDS prior to 2.3.63 handle ZFS dir .. incorrectly" &&
                return
-       check_kernel_version 34 || return 0
-       test_mkdir -p $DIR/$tdir
+       test_mkdir $DIR/$tdir
        cd $DIR/$tdir
-       mv $DIR/$tdir $DIR/d48.new || error "move directory failed"
+       mv $DIR/$tdir $DIR/$tdir.new || error "move directory failed"
        test_mkdir $DIR/$tdir || error "recreate directory failed"
        touch foo || error "'touch foo' failed after recreating cwd"
-       test_mkdir $DIR/$tdir/bar ||
-                    error "'mkdir foo' failed after recreating cwd"
-       if check_kernel_version 44; then
-               touch .foo || error "'touch .foo' failed after recreating cwd"
-               test_mkdir $DIR/$tdir/.bar ||
-                             error "'mkdir .foo' failed after recreating cwd"
-       fi
+       test_mkdir bar || error "'mkdir foo' failed after recreating cwd"
+       touch .foo || error "'touch .foo' failed after recreating cwd"
+       test_mkdir .bar || error "'mkdir .foo' failed after recreating cwd"
        ls . > /dev/null || error "'ls .' failed after recreating cwd"
        ls .. > /dev/null || error "'ls ..' failed after removing cwd"
        cd . || error "'cd .' failed after recreating cwd"
@@ -3900,23 +3877,18 @@ test_48a() { # bug 2399
 run_test 48a "Access renamed working dir (should return errors)="
 
 test_48b() { # bug 2399
-       check_kernel_version 34 || return 0
        rm -rf $DIR/$tdir
-       test_mkdir -p $DIR/$tdir
+       test_mkdir $DIR/$tdir
        cd $DIR/$tdir
        rmdir $DIR/$tdir || error "remove cwd $DIR/$tdir failed"
        touch foo && error "'touch foo' worked after removing cwd"
-       test_mkdir $DIR/$tdir/foo &&
-                    error "'mkdir foo' worked after removing cwd"
-       if check_kernel_version 44; then
-               touch .foo && error "'touch .foo' worked after removing cwd"
-               test_mkdir $DIR/$tdir/.foo &&
-                             error "'mkdir .foo' worked after removing cwd"
-       fi
+       test_mkdir foo && error "'mkdir foo' worked after removing cwd"
+       touch .foo && error "'touch .foo' worked after removing cwd"
+       test_mkdir .foo && error "'mkdir .foo' worked after removing cwd"
        ls . > /dev/null && error "'ls .' worked after removing cwd"
        ls .. > /dev/null || error "'ls ..' failed after removing cwd"
        is_patchless || ( cd . && error "'cd .' worked after removing cwd" )
-       test_mkdir $DIR/$tdir/. && error "'mkdir .' worked after removing cwd"
+       test_mkdir . && error "'mkdir .' worked after removing cwd"
        rmdir . && error "'rmdir .' worked after removing cwd"
        ln -s . foo && error "'ln -s .' worked after removing cwd"
        cd .. || echo "'cd ..' failed after removing cwd `pwd`"  #bug 3517
@@ -3924,7 +3896,6 @@ test_48b() { # bug 2399
 run_test 48b "Access removed working dir (should return errors)="
 
 test_48c() { # bug 2350
-       check_kernel_version 36 || return 0
        #lctl set_param debug=-1
        #set -vx
        rm -rf $DIR/$tdir
@@ -3933,10 +3904,8 @@ test_48c() { # bug 2350
        $TRACE rmdir $DIR/$tdir/dir || error "remove cwd $DIR/$tdir/dir failed"
        $TRACE touch foo && error "touch foo worked after removing cwd"
        $TRACE test_mkdir foo && error "'mkdir foo' worked after removing cwd"
-       if check_kernel_version 44; then
-               touch .foo && error "touch .foo worked after removing cwd"
-               test_mkdir .foo && error "mkdir .foo worked after removing cwd"
-       fi
+       touch .foo && error "touch .foo worked after removing cwd"
+       test_mkdir .foo && error "mkdir .foo worked after removing cwd"
        $TRACE ls . && error "'ls .' worked after removing cwd"
        $TRACE ls .. || error "'ls ..' failed after removing cwd"
        is_patchless || ( $TRACE cd . &&
@@ -3949,7 +3918,6 @@ test_48c() { # bug 2350
 run_test 48c "Access removed working subdir (should return errors)"
 
 test_48d() { # bug 2350
-       check_kernel_version 36 || return 0
        #lctl set_param debug=-1
        #set -vx
        rm -rf $DIR/$tdir
@@ -3959,11 +3927,8 @@ test_48d() { # bug 2350
        $TRACE rmdir $DIR/$tdir || error "remove parent $DIR/$tdir failed"
        $TRACE touch foo && error "'touch foo' worked after removing parent"
        $TRACE test_mkdir foo && error "mkdir foo worked after removing parent"
-       if check_kernel_version 44; then
-               touch .foo && error "'touch .foo' worked after removing parent"
-               test_mkdir .foo &&
-                             error "mkdir .foo worked after removing parent"
-       fi
+       touch .foo && error "'touch .foo' worked after removing parent"
+       test_mkdir .foo && error "mkdir .foo worked after removing parent"
        $TRACE ls . && error "'ls .' worked after removing parent"
        $TRACE ls .. && error "'ls ..' worked after removing parent"
        is_patchless || ( $TRACE cd . &&
@@ -3977,7 +3942,6 @@ test_48d() { # bug 2350
 run_test 48d "Access removed parent subdir (should return errors)"
 
 test_48e() { # bug 4134
-       check_kernel_version 41 || return 0
        #lctl set_param debug=-1
        #set -vx
        rm -rf $DIR/$tdir
@@ -4367,7 +4331,6 @@ test_54d() {
 run_test 54d "fifo device works in lustre ======================"
 
 test_54e() {
-       check_kernel_version 46 || return 0
        f="$DIR/f54e"
        string="aaaaaa"
        cp -aL /dev/console $f
@@ -5265,6 +5228,8 @@ test_63b() {
        dd if=/dev/zero of=$DIR/$tfile bs=4k count=1
        rm $DIR/$tfile
 
+       sync    # sync lest earlier test intercept the fail_loc
+
        #define OBD_FAIL_OSC_BRW_PREP_REQ        0x406
        lctl set_param fail_loc=0x80000406
        $MULTIOP $DIR/$tfile Owy && \
@@ -8430,6 +8395,38 @@ test_124b() {
 }
 run_test 124b "lru resize (performance test) ======================="
 
+test_124c() {
+       [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
+       [ -z "$($LCTL get_param -n mdc.*.connect_flags | grep lru_resize)" ] &&
+               skip "no lru resize on server" && return 0
+
+       # cache ununsed locks on client
+       local nr=100
+       cancel_lru_locks mdc
+       test_mkdir -p $DIR/$tdir || error "failed to create $DIR/$tdir"
+       createmany -o $DIR/$tdir/f $nr ||
+               error "failed to create $nr files in $DIR/$tdir"
+       ls -l $DIR/$tdir > /dev/null
+
+       local nsdir="ldlm.namespaces.*-MDT0000-mdc-*"
+       local unused=$($LCTL get_param -n $nsdir.lock_unused_count)
+       local max_age=$($LCTL get_param -n $nsdir.lru_max_age)
+       local recalc_p=$($LCTL get_param -n $nsdir.pool.recalc_period)
+       echo "unused=$unused, max_age=$max_age, recalc_p=$recalc_p"
+
+       # set lru_max_age to 1 sec
+       $LCTL set_param $nsdir.lru_max_age=1000 # jiffies
+       echo "sleep $((recalc_p * 2)) seconds..."
+       sleep $((recalc_p * 2))
+
+       local remaining=$($LCTL get_param -n $nsdir.lock_unused_count)
+       # restore lru_max_age
+       $LCTL set_param -n $nsdir.lru_max_age $max_age
+       [ $remaining -eq 0 ] || error "$remaining locks are not canceled"
+       unlinkmany $DIR/$tdir/f $nr
+}
+run_test 124c "LRUR cancel very aged locks"
+
 test_125() { # 13358
        [ -z "$(lctl get_param -n llite.*.client_type | grep local)" ] && skip "must run as local client" && return
        [ -z "$(lctl get_param -n mdc.*-mdc-*.connect_flags | grep acl)" ] && skip "must have acl enabled" && return
@@ -12039,6 +12036,39 @@ test_224b() { # LU-1039, MRP-303
 }
 run_test 224b "Don't panic on bulk IO failure"
 
+test_224c() { # LU-6441
+       [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
+       local pages_per_rpc=$($LCTL get_param \
+                               osc.*.max_pages_per_rpc)
+       local at_max=$($LCTL get_param -n at_max)
+       local timeout=$($LCTL get_param -n timeout)
+       local test_at="$LCTL get_param -n at_max"
+       local param_at="$FSNAME.sys.at_max"
+       local test_timeout="$LCTL get_param -n timeout"
+       local param_timeout="$FSNAME.sys.timeout"
+
+       $LCTL set_param -n osc.*.max_pages_per_rpc=1024
+
+       set_conf_param_and_check client "$test_at" "$param_at" 0 ||
+               error "conf_param at_max=0 failed"
+       set_conf_param_and_check client "$test_timeout" "$param_timeout" 5 ||
+               error "conf_param timeout=5 failed"
+
+       #define OBD_FAIL_PTLRPC_CLIENT_BULK_CB3   0x520
+       $LCTL set_param fail_loc=0x520
+       dd if=/dev/zero of=$DIR/$tfile bs=8MB count=1
+       sync
+       $LCTL set_param fail_loc=0
+
+       set_conf_param_and_check client "$test_at" "$param_at" $at_max ||
+               error "conf_param at_max=$at_max failed"
+       set_conf_param_and_check client "$test_timeout" "$param_timeout" \
+               $timeout || error "conf_param timeout=$timeout failed"
+
+       $LCTL set_param -n $pages_per_rpc
+}
+run_test 224c "Don't hang if one of md lost during large bulk RPC"
+
 MDSSURVEY=${MDSSURVEY:-$(which mds-survey 2>/dev/null || true)}
 test_225a () {
        [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
@@ -12930,6 +12960,23 @@ test_250() {
 }
 run_test 250 "Write above 16T limit"
 
+test_251() {
+       $SETSTRIPE -c -1 -S 1048576 $DIR/$tfile
+
+       #define OBD_FAIL_LLITE_LOST_LAYOUT 0x1407
+       #Skip once - writing the first stripe will succeed
+       $LCTL set_param fail_loc=0xa0001407 fail_val=1
+       $MULTIOP $DIR/$tfile o:O_RDWR:w2097152c 2>&1 | grep -q "short write" &&
+               error "short write happened"
+
+       $LCTL set_param fail_loc=0xa0001407 fail_val=1
+       $MULTIOP $DIR/$tfile or2097152c 2>&1 | grep -q "short read" &&
+               error "short read happened"
+
+       rm -f $DIR/$tfile
+}
+run_test 251 "Handling short read and write correctly"
+
 cleanup_test_300() {
        trap 0
        umask $SAVE_UMASK