Whamcloud - gitweb
LU-13449 tgt: fix recovery timer comparisons
[fs/lustre-release.git] / lustre / tests / recovery-small.sh
index 389d530..6ce8a57 100755 (executable)
@@ -15,12 +15,6 @@ if $SHARED_KEY; then
        # UPDATE THE COMMENT ABOVE WITH BUG NUMBERS WHEN CHANGING ALWAYS_EXCEPT!
 fi
 
-selinux_status=$(getenforce)
-if [ "$selinux_status" != "Disabled" ]; then
-       # bug number for skipped test:   LU-12928
-       $SHARED_KEY && ALWAYS_EXCEPT+=" 136"
-fi
-
 build_test_filter
 
 require_dsh_mds || exit 0
@@ -1235,7 +1229,7 @@ test_51() {
         for i in $SEQ
         do
                #echo failover in $i sec
-               log "test_$testnum: failover in $i sec"
+               log "$TESTNAME: failover in $i sec"
                sleep $i
                facet_failover $SINGLEMDS
         done
@@ -2268,13 +2262,15 @@ test_110k() {
 
 #define OBD_FAIL_FLD_QUERY_REQ 0x1103
        do_facet mds2 lctl set_param fail_loc=0x1103
-       start mds2 $(mdsdevname 2) -o abort_recovery ||
+       local OPTS="$MDS_MOUNT_OPTS -o abort_recovery"
+       start mds2 $(mdsdevname 2) $OPTS ||
                error "start MDS with abort_recovery should succeed"
        do_facet mds2 lctl set_param fail_loc=0
 
        # cleanup
        stop mds2 || error "cleanup: stop mds2 failed"
-       start mds2 $(mdsdevname 2) || error "cleanup: start mds2 failed"
+       start mds2 $(mdsdevname 2) $MDS_MOUNT_OPTS ||
+               error "cleanup: start mds2 failed"
        zconf_mount $(hostname) $MOUNT || error "cleanup: mount failed"
        client_up || error "post-failover df failed"
 }
@@ -2289,10 +2285,10 @@ test_111 ()
 #define OBD_FAIL_MDS_CHANGELOG_INIT 0x151
        do_facet $SINGLEMDS lctl set_param fail_loc=0x151
        stop $SINGLEMDS || error "stop MDS failed"
-       start $SINGLEMDS $(mdsdevname ${SINGLEMDS//mds/}) &&
+       start $SINGLEMDS $(mdsdevname ${SINGLEMDS//mds/}) $MDS_MOUNT_OPTS &&
                error "start MDS should fail"
        do_facet $SINGLEMDS lctl set_param fail_loc=0
-       start $SINGLEMDS $(mdsdevname ${SINGLEMDS//mds/}) ||
+       start $SINGLEMDS $(mdsdevname ${SINGLEMDS//mds/}) $MDS_MOUNT_OPTS ||
                error "start MDS failed"
 }
 run_test 111 "mdd setup fail should not cause umount oops"
@@ -2904,6 +2900,142 @@ test_138() {
 }
 run_test 138 "Umount MDT during recovery"
 
+test_139() {
+       [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return 0
+       [ $MDS1_VERSION -lt $(version_code 2.13.50) ] &&
+               skip "Need MDS version at least 2.13.50"
+
+       mdt_dev=$(mdsdevname 1)
+
+       stop $SINGLEMDS || error "stop $SINGLEMDS failed"
+
+#define OBD_FAIL_OSP_INVALID_LOGID             0x2106
+       do_facet $SINGLEMDS $LCTL set_param fail_val=0x68 fail_loc=0x80002106
+       start $SINGLEMDS $mdt_dev $MDS_MOUNT_OPTS || error "Fail to start MDT"
+}
+run_test 139 "corrupted catid won't cause crash"
+
+test_140a() {
+       [ $MDS1_VERSION -lt $(version_code 2.12.58) ] &&
+               skip "Need MDS version at least 2.13.50"
+
+       [ "$SHARED_KEY" = true ] &&
+               skip "server local client incompatible with SSK keys installed"
+
+       slr=$(do_facet mds1 \
+               $LCTL get_param -n mdt.$FSNAME-MDT0000.local_recovery)
+       stack_trap "do_facet mds1 $LCTL set_param \
+               mdt.*.local_recovery=$slr" EXIT
+
+       # disable recovery for local clients
+       # so local clients should be marked with no_recovery flag
+       do_facet mds1 $LCTL set_param mdt.*.local_recovery=0
+       mount_mds_client
+
+       local cnt
+       cnt=$(do_facet mds1 $LCTL get_param "mdt.*.exports.*.export" |
+               grep export_flags.*no_recovery | wc -l)
+       echo "$cnt clients with recovery disabled"
+       umount_mds_client
+       [ $cnt -eq 0 ] && error "no clients with recovery disabled"
+
+       # enable recovery for local clients
+       # so no local clients should be marked with no_recovery flag
+       do_facet mds1 $LCTL set_param mdt.*.local_recovery=1
+       mount_mds_client
+
+       cnt=$(do_facet mds1 $LCTL get_param "mdt.*.exports.*.export" |
+               grep export_flags.*no_recovery | wc -l)
+       echo "$cnt clients with recovery disabled"
+       umount_mds_client
+       [ $cnt -eq 0 ] || error "$cnt clients with recovery disabled"
+}
+run_test 140a "local mount is flagged properly"
+
+test_140b() {
+       [ $MDS1_VERSION -lt $(version_code 2.12.58) ] &&
+               skip "Need MDS version at least 2.13.50"
+
+       [ "$SHARED_KEY" = true ] &&
+               skip "server local client incompatible with SSK keys installed"
+
+       slr=$(do_facet mds1 \
+               $LCTL get_param -n mdt.$FSNAME-MDT0000.local_recovery)
+       stack_trap "do_facet mds1 $LCTL set_param \
+               mdt.*.local_recovery=$slr" EXIT
+
+       # disable recovery for local clients
+       do_facet mds1 $LCTL set_param mdt.*.local_recovery=0
+
+       mount_mds_client
+       replay_barrier mds1
+       umount_mds_client
+       fail mds1
+       local recovery=$(do_facet mds1 dmesg |
+                        awk -F: '/Recovery over after/ { print $4 }' |
+                        cut -d, -f1 | tail -1)
+       (( $recovery < $TIMEOUT*2 )) ||
+               error "recovery took too long $recovery > $((TIMEOUT * 2))"
+}
+run_test 140b "local mount is excluded from recovery"
+
+test_141() {
+       local oldc
+       local newc
+
+       [ $PARALLEL == "yes" ] && skip "skip parallel run"
+       combined_mgs_mds || skip "needs combined MGS/MDT"
+       ( local_mode || from_build_tree ) &&
+               skip "cannot run in local mode or from build tree"
+
+       # some get_param have a bug to handle dot in param name
+       do_rpc_nodes $(facet_active_host $SINGLEMDS) cancel_lru_locks MGC
+       oldc=$(do_facet $SINGLEMDS $LCTL get_param -n \
+               'ldlm.namespaces.MGC*.lock_count')
+       fail $SINGLEMDS
+       do_rpc_nodes $(facet_active_host $SINGLEMDS) cancel_lru_locks MGC
+       newc=$(do_facet $SINGLEMDS $LCTL get_param -n \
+               'ldlm.namespaces.MGC*.lock_count')
+
+       [ $oldc -eq $newc ] || error "mgc lost locks ($oldc != $newc)"
+       return 0
+}
+run_test 141 "do not lose locks on MGS restart"
+
+test_142() {
+       [ $MDS1_VERSION -lt $(version_code 2.11.56) ] &&
+               skip "Need MDS version at least 2.11.56"
+
+       #define OBD_FAIL_MDS_ORPHAN_DELETE      0x165
+       do_facet mds1 $LCTL set_param fail_loc=0x165
+       $MULTIOP $DIR/$tfile Ouc || error "multiop failed"
+
+       stop mds1
+       start mds1 $(mdsdevname 1) $MDS_MOUNT_OPTS
+
+       wait_update_facet mds1 "pgrep orph_.*-MDD | wc -l" "0" ||
+               error "MDD orphan cleanup thread not quit"
+}
+run_test 142 "orphan name stub can be cleaned up in startup"
+
+test_143() {
+       [ $(lustre_version_code $SINGLEMDS) -lt $(version_code 2.13.00) ] &&
+               skip "Need MDS version at least 2.13.00"
+       [ $PARALLEL == "yes" ] && skip "skip parallel run"
+
+       local mntpt=$(facet_mntpt $SINGLEMDS)
+       stop mds1
+       mount_fstype $SINGLEMDS || error "mount as fstype $SINGLEMDS failed"
+       do_facet $SINGLEMDS touch $mntpt/PENDING/$tfile
+       unmount_fstype $SINGLEMDS
+       start mds1 $(mdsdevname 1) $MDS_MOUNT_OPTS || error "mds1 start fail"
+
+       wait_recovery_complete $SINGLEMDS || error "MDS recovery not done"
+       wait_update_facet mds1 "pgrep orph_.*-MDD | wc -l" "0" ||
+               error "MDD orphan cleanup thread not quit"
+}
+run_test 143 "orphan cleanup thread shouldn't be blocked even delete failed"
+
 complete $SECONDS
 check_and_cleanup_lustre
 exit_status