Whamcloud - gitweb
LU-4713 tests: fix fhandle syscall test progarm
[fs/lustre-release.git] / lustre / tests / sanityn.sh
index 07a4fb8..2f5ab1b 100644 (file)
@@ -40,9 +40,12 @@ init_test_env $@
 . ${CONFIG:=$LUSTRE/tests/cfg/$NAME.sh}
 init_logging
 
-[ $(facet_fstype $SINGLEMDS) = "zfs" ] &&
+if [ $(facet_fstype $SINGLEMDS) = "zfs" ]; then
 # bug number for skipped test:        LU-2840 LU-2189 LU-2776
        ALWAYS_EXCEPT="$ALWAYS_EXCEPT 21      36      51a"
+# LU-2829 / LU-2887 - make allowances for ZFS slowness
+       TEST33_NFILES=${TEST33_NFILES:-1000}
+fi
 
 [ "$SLOW" = "no" ] && EXCEPT_SLOW="33a"
 
@@ -355,6 +358,16 @@ test_14d() { # bug 10921
 }
 run_test 14d "chmod of executing file is still possible ========"
 
+test_14e() { # LU-4398
+       test_mkdir -p $DIR1/$tdir
+       rm -f $DIR1/$tdir/echo
+       cp /bin/echo $DIR1/$tdir/echo
+       $DIR1/$tdir/echo Hi
+       $DIR1/$tdir/echo Hi
+       echo Bye > $DIR2/$tdir/echo
+}
+run_test 14e "conflicting locks are flushed on open"
+
 test_15() {    # bug 974 - ENOSPC
        echo "PATH=$PATH"
        sh oos2.sh $MOUNT1 $MOUNT2
@@ -489,28 +502,28 @@ test_21() { # Bug 5907
 run_test 21 " Try to remove mountpoint on another dir ===="
 
 test_23() { # Bug 5972
-       echo "others should see updated atime while another read" > $DIR1/f23
-       
+       local at_diff=$(do_facet $SINGLEMDS \
+               $LCTL get_param -n mdd.*MDT0000*.atime_diff | head -n1)
+       echo "atime should be updated while another read" > $DIR1/$tfile
+
        # clear the lock(mode: LCK_PW) gotten from creating operation
        cancel_lru_locks osc
-       
-       time1=`date +%s`        
-       #MAX_ATIME_DIFF 60, we update atime only if older than 60 seconds
-       sleep 61
-       
-       multiop_bg_pause $DIR1/f23 or20_c || return 1
+       time1=$(date +%s)
+       echo "now is $time1"
+       sleep $((at_diff + 1))
+
+       echo "starting reads"
+       multiop_bg_pause $DIR1/$tfile or20_c || return 1
         # with SOM and opencache enabled, we need to close a file and cancel
         # open lock to get atime propogated to MDS
-        kill -USR1 $!
+        kill -USR1 $! || return 2
         cancel_lru_locks mdc
 
-       time2=`stat -c "%X" $DIR2/f23`
-
-       if (( $time2 <= $time1 )); then
-               error "atime doesn't update among nodes"
-       fi
+       time2=$(stat -c "%X" $DIR/$tfile)
+       echo "new atime is $time2"
 
-       rm -f $DIR1/f23 || error "rm -f $DIR1/f23 failed"
+       [ $time2 -gt $time1 ] || error "atime was not updated"
+       rm -f $DIR1/$tfile || error "rm -f $DIR1/$tfile failed"
        true
 }
 run_test 23 " others should see updated atime while another read===="
@@ -523,7 +536,7 @@ test_24a() {
        lfs df -i $DIR2 || error "lfs df -i $DIR2 failed"
        lfs df $DIR1/$tfile || error "lfs df $DIR1/$tfile failed"
        lfs df -ih $DIR2/$tfile || error "lfs df -ih $DIR2/$tfile failed"
-       
+
        OSC=`lctl dl | awk '/-osc-|OSC.*MNT/ {print $4}' | head -n 1`
 #      OSC=`lctl dl | awk '/-osc-/ {print $4}' | head -n 1`
        lctl --device %$OSC deactivate
@@ -624,11 +637,11 @@ test_27() {
        DD2_PID=$!
        usleep 50
        log "dd 1 started"
-       
+
        dd if=/dev/zero of=$DIR1/$tfile bs=$((16384-1024))k conv=notrunc count=1 seek=4 &
        DD1_PID=$!
        log "dd 2 started"
-       
+
        sleep 1
        dd if=/dev/zero of=$DIR1/$tfile bs=8k conv=notrunc count=1 seek=0
        log "dd 3 finished"
@@ -640,7 +653,7 @@ run_test 27 "align non-overlapping extent locks from request ==="
 
 test_28() { # bug 9977
        ECHO_UUID="ECHO_osc1_UUID"
-       tOST=`$LCTL dl | | awk '/-osc-|OSC.*MNT/ { print $4 }' | head -1`
+       tOST=$($LCTL dl | awk '/-osc-|OSC.*MNT/ { print $4 }' | head -n1)
 
        $LFS setstripe $DIR1/$tfile -S 1048576 -i 0 -c 2
        tOBJID=`$LFS getstripe $DIR1/$tfile | awk '$1 == 1 {print $2}'`
@@ -742,8 +755,8 @@ enable_lockless_truncate() {
 }
 
 test_32a() { # bug 11270
-        local p="$TMP/sanityN-$TESTNAME.parameters"
-        save_lustre_params $HOSTNAME osc.*.lockless_truncate > $p
+       local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
+       save_lustre_params client "osc.*.lockless_truncate" > $p
         cancel_lru_locks osc
         enable_lockless_truncate 1
         rm -f $DIR1/$tfile
@@ -781,15 +794,19 @@ run_test 32a "lockless truncate"
 test_32b() { # bug 11270
         remote_ost_nodsh && skip "remote OST with nodsh" && return
 
-        local node
-        local p="$TMP/sanityN-$TESTNAME.parameters"
-        save_lustre_params $HOSTNAME "osc.*.contention_seconds" > $p
-        for node in $(osts_nodes); do
-                save_lustre_params $node "ldlm.namespaces.filter-*.max_nolock_bytes" >> $p
-                save_lustre_params $node "ldlm.namespaces.filter-*.contended_locks" >> $p
-                save_lustre_params $node "ldlm.namespaces.filter-*.contention_seconds" >> $p
-        done
-        clear_osc_stats
+       local node
+       local facets=$(get_facets OST)
+       local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
+
+       save_lustre_params client "osc.*.contention_seconds" > $p
+       save_lustre_params $facets \
+               "ldlm.namespaces.filter-*.max_nolock_bytes" >> $p
+       save_lustre_params $facets \
+               "ldlm.namespaces.filter-*.contended_locks" >> $p
+       save_lustre_params $facets \
+               "ldlm.namespaces.filter-*.contention_seconds" >> $p
+       clear_osc_stats
+
         # agressive lockless i/o settings
         for node in $(osts_nodes); do
                 do_node $node 'lctl set_param -n ldlm.namespaces.filter-*.max_nolock_bytes 2000000; lctl set_param -n ldlm.namespaces.filter-*.contended_locks 0; lctl set_param -n ldlm.namespaces.filter-*.contention_seconds 60'
@@ -831,8 +848,8 @@ print_jbd_stat () {
         varsvc=${mds}_svc
         dev=$(basename $(do_facet $mds "lctl get_param -n osd*.${!varsvc}.mntdev|\
                xargs readlink -f" ))
-        val=$(do_facet $mds "cat /proc/fs/jbd*/${dev}{,:*,-*}/info 2>/dev/null|\
-               head -1")
+       val=$(do_facet $mds "cat /proc/fs/jbd*/${dev}{,:*,-*}/info 2>/dev/null |
+               head -n1")
         val=${val%% *};
         stat=$(( stat + val))
     done
@@ -851,7 +868,8 @@ test_33a() {
     local param_file=$TMP/$tfile-params
     local fstype=$(facet_fstype $SINGLEMDS)
 
-    save_lustre_params $(comma_list $(mdts_nodes)) "mdt.*.commit_on_sharing" > $param_file
+       save_lustre_params $(get_facets MDS) \
+               "mdt.*.commit_on_sharing" > $param_file
 
     local COS
     local jbdold="N/A"
@@ -902,8 +920,9 @@ test_33b() {
        local nfiles=${TEST33_NFILES:-10000}
        local param_file=$TMP/$tfile-params
 
-       save_lustre_params $(comma_list $(mdts_nodes)) \
-                               "mdt.*.commit_on_sharing" > $param_file
+       save_lustre_params $(get_facets MDS) \
+               "mdt.*.commit_on_sharing" > $param_file
+
        local COS
        local jbdold
        local jbdnew
@@ -1255,11 +1274,6 @@ test_40a() {
        rmdir $DIR2/$tfile-3
        check_pdo_conflict $PID1 || error "unlink is blocked"
 
-       if [ $MDSCOUNT -ge 2 ]; then
-               $LFS mkdir -i 1 $DIR2/$tfile-6
-               check_pdo_conflict $PID1 || error "remote mkdir is blocked"
-       fi
-
        # all operations above shouldn't wait the first one
        check_pdo_conflict $PID1 || error "parallel operation is blocked"
        wait $PID1
@@ -1290,11 +1304,6 @@ test_40b() {
        check_pdo_conflict $PID1 || error "unlink is blocked"
        # all operations above shouldn't wait the first one
 
-       if [ $MDSCOUNT -ge 2 ]; then
-               $LFS mkdir -i 1 $DIR2/$tfile-6
-               check_pdo_conflict $PID1 || error "remote mkdir is blocked"
-       fi
-
         check_pdo_conflict $PID1 || error "parallel operation is blocked"
        wait $PID1
        rm -r $DIR1/*
@@ -1324,11 +1333,6 @@ test_40c() {
        rmdir $DIR2/$tfile-3
        check_pdo_conflict $PID1 || error "unlink is blocked"
 
-       if [ $MDSCOUNT -ge 2 ]; then
-               $LFS mkdir -i 1 $DIR2/$tfile-6
-               check_pdo_conflict $PID1 || error "remote mkdir is blocked"
-       fi
-
         # all operations above shouldn't wait the first one
        check_pdo_conflict $PID1 || error "parallel operation is blocked"
        wait $PID1
@@ -1359,11 +1363,6 @@ test_40d() {
        rmdir $DIR2/$tfile-3
        check_pdo_conflict $PID1 || error "unlink is blocked"
 
-       if [ $MDSCOUNT -ge 2 ]; then
-               $LFS mkdir -i 1 $DIR2/$tfile-6
-               check_pdo_conflict $PID1 || error "remote mkdir is blocked"
-       fi
-
        # all operations above shouldn't wait the first one
        check_pdo_conflict $PID1 || error "parallel operation is blocked"
        wait $PID1
@@ -1391,11 +1390,6 @@ test_40e() {
        rmdir $DIR2/$tfile-3
        check_pdo_conflict $PID1 || error "unlink is blocked"
 
-       if [ $MDSCOUNT -ge 2 ]; then
-               $LFS mkdir -i 1 $DIR2/$tfile-6
-               check_pdo_conflict $PID1 || error "remote mkdir is blocked"
-       fi
-
        # all operations above shouldn't wait the first one
        check_pdo_conflict $PID1 || error "parallel operation is blocked"
        wait $PID1
@@ -2295,6 +2289,9 @@ test_51a() {
 run_test 51a "layout lock: refresh layout should work"
 
 test_51b() {
+       [[ $(lustre_version_code $SINGLEMDS) -ge $(version_code 2.3.59) ]] ||
+               { skip "Need MDS version at least 2.3.59"; return 0; }
+
        local tmpfile=`mktemp`
 
        # create an empty file
@@ -2320,26 +2317,162 @@ test_51b() {
 run_test 51b "layout lock: glimpse should be able to restart if layout changed"
 
 test_51c() {
-       # create an empty file
-       $MCREATE $DIR1/$tfile
+       [ $OSTCOUNT -ge 2 ] || { skip "need at least 2 osts"; return; }
+
+       # set default layout to have 1 stripe
+       mkdir -p $DIR1/$tdir
+       $LFS setstripe -c 1 $DIR1/$tdir
+
+       # create a file with empty layout
+       $MCREATE $DIR1/$tdir/$tfile
 
 #define OBD_FAIL_MDS_LL_BLOCK 0x172
-       $LCTL set_param fail_loc=0x172
+       do_facet $SINGLEMDS $LCTL set_param fail_loc=0x172
 
        # change the layout of testing file
-       echo "Setting layout ..."
-       $LFS setstripe -c $OSTCOUNT $DIR1/$tfile &
+       echo "Setting layout to have $OSTCOUNT stripes ..."
+       $LFS setstripe -c $OSTCOUNT $DIR1/$tdir/$tfile &
        pid=$!
        sleep 1
 
-       # get layout of this file should wait until dd is finished
-       local stripecnt=`$LFS getstripe -c $DIR2/$tfile`
-       [ $stripecnt -eq $OSTCOUNT ] || error "layout wrong"
+       # write something to the file, it should be blocked on fetching layout
+       dd if=/dev/zero of=$DIR2/$tdir/$tfile bs=1k count=1 conv=notrunc
+       local cnt=$($LFS getstripe -c $DIR2/$tdir/$tfile)
+       [ $cnt -eq $OSTCOUNT ] || error "have $cnt stripes, expected $OSTCOUNT"
 
-       rm -f $DIR1/$tfile
+       rm -fr $DIR1/$tdir
 }
 run_test 51c "layout lock: IT_LAYOUT blocked and correct layout can be returned"
 
+test_51d() {
+       dd if=/dev/zero of=/$DIR1/$tfile bs=1M count=1
+       cancel_lru_locks mdc
+
+       # open should grant LAYOUT lock, mmap and read will install pages
+       $MULTIOP $DIR1/$tfile oO_RDWR:SMR_Uc &
+       local PID=$!
+       sleep 1
+
+       # rss before revoking
+       local br=$(grep -A 10 $tfile /proc/$PID/smaps | awk '/^Rss/{print $2}')
+       echo "Before revoking layout lock: $br KB mapped"
+
+       # delete the file will revoke layout lock
+       rm -f $DIR2/$tfile
+
+       # rss after revoking
+       local ar=$(grep -A 10 $tfile /proc/$PID/smaps | awk '/^Rss/{print $2}')
+
+       kill -USR1 $PID
+       wait $PID || error
+
+       [ $ar -eq 0 ] || error "rss before: $br, after $ar, some pages remained"
+}
+run_test 51d "layout lock: losing layout lock should clean up memory map region"
+
+test_54_part1()
+{
+       echo "==> rename vs getattr vs setxattr should not deadlock"
+       mkdir -p $DIR/d1/d2/d3 || error "(1) mkdir failed"
+
+       do_facet mds $LCTL set_param fail_loc=$1
+
+       mv -T $DIR/d1/d2/d3 $DIR/d1/d3 &
+       PID1=$!
+       sleep 1
+
+       stat $DIR/d1/d2 &
+       PID2=$!
+       sleep 1
+
+       setfattr -n user.attr1 -v value1 $DIR2/d1 || error "(2) setfattr failed"
+       wait $PID1 || error "(3) mv failed"
+       wait $PID2 || error "(4) stat failed"
+       echo
+
+       rm -rf $DIR/d1
+}
+
+test_54_part2() {
+       echo "==> rename vs getattr vs open vs getattr should not deadlock"
+       mkdir -p $DIR/d1/d2/d3 || error "(1) mkdir failed"
+
+       do_facet mds $LCTL set_param fail_loc=$1
+
+       mv -T $DIR/d1/d2/d3 $DIR/d1/d3 &
+       PID1=$!
+       sleep 1
+
+       stat $DIR/d1/d2 &
+       PID2=$!
+       sleep 1
+
+       $MULTIOP $DIR2/d1/d2 Oc &
+       PID3=$!
+       sleep 1
+
+       stat $DIR/d1 || error "(2) stat failed"
+
+       wait $PID1 || error "(3) mv failed"
+       wait $PID2 || error "(4) stat failed"
+       wait $PID3 && error "(5) multiop failed"
+       echo
+       rm -rf $DIR/d1
+}
+
+test_54() {
+       local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
+       save_lustre_params client "llite.*.xattr_cache" > $p
+       lctl set_param llite.*.xattr_cache 1 ||
+               { skip "xattr cache is not supported"; return 0; }
+
+#define OBD_FAIL_MDS_RENAME              0x153
+#define OBD_FAIL_MDS_RENAME2             0x154
+       test_54_part1 0x80000153 || error 10
+       test_54_part1 0x80000154 || error 11
+       test_54_part2 0x80000153 || error 12
+       test_54_part2 0x80000154 || error 13
+
+       restore_lustre_params < $p
+       rm -f $p
+}
+run_test 54 "rename locking"
+
+test_55a() {
+       mkdir -p $DIR/d1/d2 $DIR/d3 || error "(1) mkdir failed"
+
+#define OBD_FAIL_MDS_RENAME              0x153
+       do_facet mds $LCTL set_param fail_loc=0x80000153
+
+       mv -T $DIR/d1/d2 $DIR/d3/d2 &
+       PID1=$!
+       sleep 1
+
+       rm -r $DIR2/d3
+       wait $PID1 && error "(2) mv succeeded"
+
+       rm -rf $DIR/d1
+}
+run_test 55a "rename vs unlink target dir"
+
+test_55b()
+{
+       mkdir -p $DIR/d1/d2 $DIR/d3 || error "(1) mkdir failed"
+
+#define OBD_FAIL_MDS_RENAME              0x155
+       do_facet mds $LCTL set_param fail_loc=0x80000155
+
+       mv -T $DIR/d1/d2 $DIR/d3/d2 &
+       PID1=$!
+       sleep 1
+
+       rm -r $DIR2/d1
+       wait $PID1 && error "(2) mv succeeded"
+
+       rm -rf $DIR/d1
+}
+run_test 55b "rename vs unlink source dir"
+
 test_60() {
        [[ $(lustre_version_code $SINGLEMDS) -ge $(version_code 2.3.0) ]] ||
        { skip "Need MDS version at least 2.3.0"; return; }
@@ -2426,10 +2559,263 @@ test_70b() { # LU-2781
 }
 run_test 70b "remove files after calling rm_entry"
 
+test_71() {
+       local server_version=$(lustre_version_code $SINGLEMDS)
+
+       [[ $server_version -lt $(version_code 2.1.6) ]] &&
+               skip "Need MDS version at least 2.1.6" && return
+
+       # Patch not applied to 2.2 and 2.3 branches
+       [[ $server_version -ge $(version_code 2.2.0) ]] &&
+       [[ $server_version -lt $(version_code 2.4.0) ]] &&
+               skip "Need MDS version at least 2.4.0" && return
+
+       checkfiemap --test ||
+               { skip "checkfiemap not runnable: $?" && return; }
+       # write data this way: hole - data - hole - data
+       dd if=/dev/urandom of=$DIR1/$tfile bs=40K seek=1 count=1
+       [ "$(facet_fstype ost$(($($GETSTRIPE -i $DIR1/$tfile) + 1)))" = \
+               "zfs" ] &&
+               skip "ORI-366/LU-1941: FIEMAP unimplemented on ZFS" && return 0
+       dd if=/dev/urandom of=$DIR1/$tfile bs=40K seek=3 count=1
+       GET_STAT="lctl get_param -n ldlm.services.ldlm_cbd.stats"
+       stat $DIR2/$tfile
+       local can1=$($GET_STAT | awk '/ldlm_bl_callback/ {print $2}')
+       echo $can1
+       checkfiemap $DIR2/$tfile 81920 ||
+               error "data is not flushed from client"
+       local can2=$($GET_STAT | awk '/ldlm_bl_callback/ {print $2}')
+       echo $can2
+
+       # common case of "create file, copy file" on a single node
+       # should not flush data from ost
+       dd if=/dev/urandom of=$DIR1/$tfile bs=40K seek=1 count=1
+       dd if=/dev/urandom of=$DIR1/$tfile bs=40K seek=3 count=1
+       stat $DIR1/$tfile
+       local can3=$($GET_STAT | awk '/ldlm_bl_callback/ {print $2}')
+       echo $can3
+       checkfiemap $DIR1/$tfile 81920 ||
+       error 4
+       local can4=$($GET_STAT | awk '/ldlm_bl_callback/ {print $2}')
+       echo $can2
+       [ $can3 -eq $can4 ] || error $((can2-can1)) "cancel RPC occured."
+}
+run_test 71 "correct file map just after write operation is finished"
+
+test_72() {
+       local p="$TMP/sanityN-$TESTNAME.parameters"
+       local tlink1
+       local tlink2
+       save_lustre_params client "llite.*.xattr_cache" > $p
+       lctl set_param llite.*.xattr_cache 1 ||
+               { skip "xattr cache is not supported"; return 0; }
+
+       touch $DIR1/$tfile
+       setfattr -n user.attr1 -v value1 $DIR1/$tfile ||
+               error "setfattr1 failed"
+       getfattr -n user.attr1 $DIR2/$tfile | grep value1 ||
+               error "getfattr1 failed"
+       setfattr -n user.attr1 -v value2 $DIR2/$tfile ||
+               error "setfattr2 failed"
+       getfattr -n user.attr1 $DIR1/$tfile | grep value2 ||
+               error "getfattr2 failed"
+
+       # check that trusted.link is consistent
+       tlink1=$(getfattr -n trusted.link $DIR1/$tfile | md5sum)
+       ln $DIR2/$tfile $DIR2/$tfile-2 || error "failed to link"
+       tlink2=$(getfattr -n trusted.link $DIR1/$tfile | md5sum)
+       echo "$tlink1 $tlink2"
+       [ "$tlink1" = "$tlink2" ] && error "trusted.link should have changed!"
+
+       rm -f $DIR2/$tfile
+
+       restore_lustre_params < $p
+       rm -f $p
+}
+run_test 72 "getxattr/setxattr cache should be consistent between nodes"
+
+test_73() {
+       local p="$TMP/sanityN-$TESTNAME.parameters"
+       save_lustre_params client "llite.*.xattr_cache" > $p
+       lctl set_param llite.*.xattr_cache 1 ||
+               { skip "xattr cache is not supported"; return 0; }
+
+       touch $DIR1/$tfile
+       setfattr -n user.attr1 -v value1 $DIR1/$tfile ||
+               error "setfattr1 failed"
+       getfattr -n user.attr1 $DIR2/$tfile || error "getfattr1 failed"
+       getfattr -n user.attr1 $DIR1/$tfile || error "getfattr2 failed"
+       clear_llite_stats
+       # PR lock should be cached by now on both clients
+       getfattr -n user.attr1 $DIR1/$tfile || error "getfattr3 failed"
+       # 2 hits for getfattr(0)+getfattr(size)
+       [ $(calc_llite_stats getxattr_hits) -eq 2 ] || error "not cached in $DIR1"
+       getfattr -n user.attr1 $DIR2/$tfile || error "getfattr4 failed"
+       # 4 hits for more getfattr(0)+getfattr(size)
+       [ $(calc_llite_stats getxattr_hits) -eq 4 ] || error "not cached in $DIR2"
+       rm -f $DIR2/$tfile
+
+       restore_lustre_params < $p
+       rm -f $p
+}
+run_test 73 "getxattr should not cause xattr lock cancellation"
+
+test_74() {
+       [ $(lustre_version_code $SINGLEMDS) -lt $(version_code 2.4.93) ] &&
+               skip "Need MDS version at least 2.4.93" && return
+
+       dd if=/dev/zero of=$DIR1/$tfile-1 bs=1K count=1
+       dd if=/dev/zero of=$DIR1/$tfile-2 bs=1K count=1
+       flocks_test 4 $DIR1/$tfile-1 $DIR2/$tfile-2
+}
+run_test 74 "flock deadlock: different mounts =============="
+
+# LU-3889
+test_75() {
+       $LFS setstripe -c 2 -S 1m -i 0 $DIR1/$tfile
+       dd if=/dev/zero of=$DIR1/$tfile bs=1M count=2
+       cancel_lru_locks osc
+
+       dd of=$DIR1/$tfile if=/dev/zero bs=1M count=1 seek=1 conv=notrunc
+       sync
+
+       # define OBD_FAIL_LDLM_ENQUEUE_HANG 0x31d
+       $LCTL set_param fail_loc=0x31d
+       stat -c %s $DIR1/$tfile &
+       local pid=$!
+       sleep 1
+       kill -9 $pid
+
+       # For bad lock error handler we should ASSERT and got kernel panic here
+       sleep 4
+       $LCTL set_param fail_loc=0
+}
+run_test 75 "osc: upcall after unuse lock==================="
+
+test_76() { #LU-946
+       [[ $(lustre_version_code $SINGLEMDS) -lt $(version_code 2.5.53) ]] &&
+               skip "Need MDS version at least 2.5.53" && return
+       [ $MDSCOUNT -ge 2 ] && skip "skip now for LU-4573" && return #LU-4573
+
+       remote_mds_nodsh && skip "remote MDS with nodsh" && return
+       local fcount=2048
+       local fd
+       local cmd
+       local mdt_idx
+       local mds_idx
+       declare -a fd_list
+       declare -a fid_list
+
+       if remote_mds; then
+               nid=$($LCTL list_nids | sed  "s/\./\\\./g")
+       else
+               nid="0@lo"
+       fi
+
+       rm -rf $DIR/$tdir
+       test_mkdir -p $DIR/$tdir
+       if [ $MDSCOUNT -gt 1 ]; then
+               mdt_idx=$($LFS getdirstripe -i $DIR/$tdir)
+       else
+               mdt_idx=0
+       fi
+       mds_idx=$((mdt_idx + 1))
+       proc_ofile="mdt.*$mdt_idx.exports.'$nid'.open_files"
+
+       cancel_lru_locks mdc
+
+       echo -n "open files "
+       ulimit -n 8096
+       for (( i = 0; i < $fcount; i++ )) ; do
+               touch $DIR/$tdir/f_$i
+               fd=$(free_fd)
+               cmd="exec $fd<$DIR/$tdir/f_$i"
+               eval $cmd
+               fd_list[i]=$fd
+               echo -n "."
+       done
+       echo
+
+       fid_list=($(do_facet mds$mds_idx $LCTL get_param -n $proc_ofile))
+
+       # Possible errors in openfiles FID list.
+       # 1. Missing FIDs. Check 1
+       # 2. Extra FIDs. Check 1
+       # 3. Duplicated FID. Check 2
+       # 4. Invalid FIDs. Check 2
+       # 5. Valid FID, points to some other file. Check 3
+
+       # Check 1
+       [ ${#fid_list[@]} -ne $fcount ] &&
+               error "${#fid_list[@]} != $fcount open files"
+
+       for (( i = 0; i < $fcount; i++ )) ; do
+               cmd="exec ${fd_list[i]}</dev/null"
+               eval $cmd
+               filename=$($LFS fid2path $DIR2 ${fid_list[i]})
+
+               # Check 2
+               rm --interactive=no $filename
+               [ $? -ne 0 ] &&
+                       error "Nonexisting fid ${fid_list[i]} listed."
+       done
+
+       # Check 3
+       ls_op=$(ls $DIR2/$tdir | wc -l)
+       [ $ls_op -ne 0 ] &&
+               error "Some openfiles are missing in lproc output"
+
+       rm -rf $DIR/$tdir
+}
+run_test 76 "Verify open file for 2048 files"
+
+test_80() {
+       [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
+       local MDTIDX=1
+       local mdt_index
+       local i
+       local file
+       local pid
+
+       mkdir -p $DIR1/$tdir/dir
+       createmany -o $DIR1/$tdir/dir/f 10 ||
+               error "create files under remote dir failed $i"
+
+       cp /etc/passwd $DIR1/$tdir/$tfile
+
+       #migrate open file should fails
+       multiop_bg_pause $DIR2/$tdir/$tfile O_c || error "open $file failed"
+       pid=$!
+       # give multiop a chance to open
+       sleep 1
+
+       $LFS mv -M $MDTIDX $DIR1/$tdir &&
+               error "migrate open files should failed with open files"
+
+       kill -USR1 $pid
+
+       $LFS mv -M $MDTIDX $DIR1/$tdir ||
+                       error "migrate remote dir error"
+
+       echo "Finish migration, then checking.."
+       for file in $(find $DIR1/$tdir); do
+               mdt_index=$($LFS getstripe -M $file)
+               [ $mdt_index == $MDTIDX ] ||
+                       error "$file is not on MDT${MDTIDX}"
+       done
+
+       diff /etc/passwd $DIR1/$tdir/$tfile ||
+               error "file different after migration"
+
+       rm -rf $DIR1/$tdir || error "rm dir failed after migration"
+}
+run_test 80 "migrate directory when some children is being opened"
+
 log "cleanup: ======================================================"
 
 [ "$(mount | grep $MOUNT2)" ] && umount $MOUNT2
 
 complete $SECONDS
+rm -f $SAMPLE_FILE
 check_and_cleanup_lustre
 exit_status