Whamcloud - gitweb
LU-8895 target: limit grant allocation
[fs/lustre-release.git] / lustre / tests / sanity.sh
index da0a365..8cdf3fe 100755 (executable)
@@ -5791,6 +5791,92 @@ test_64c() {
 }
 run_test 64c "verify grant shrink"
 
+# this does exactly what osc_request.c:osc_announce_cached() does in
+# order to calculate max amount of grants to ask from server
+want_grant() {
+       local tgt=$1
+
+       local page_size=$(get_page_size client)
+
+       local nrpages=$($LCTL get_param -n osc.${tgt}.max_pages_per_rpc)
+       local rpc_in_flight=$($LCTL get_param -n osc.${tgt}.max_rpcs_in_flight)
+
+       ((rpc_in_flight ++));
+       nrpages=$((nrpages * rpc_in_flight))
+
+       local dirty_max_pages=$($LCTL get_param -n osc.${tgt}.max_dirty_mb)
+
+       dirty_max_pages=$((dirty_max_pages * 1024 * 1024 / page_size))
+
+       [[ $dirty_max_pages -gt $nrpages ]] && nrpages=$dirty_max_pages
+       local undirty=$((nrpages * page_size))
+
+       local max_extent_pages
+       max_extent_pages=$($LCTL get_param osc.${tgt}.import |
+           grep grant_max_extent_size | awk '{print $2}')
+       max_extent_pages=$((max_extent_pages / page_size))
+       local nrextents=$(((nrpages + max_extent_pages - 1) / max_extent_pages))
+       local grant_extent_tax
+       grant_extent_tax=$($LCTL get_param osc.${tgt}.import |
+           grep grant_extent_tax | awk '{print $2}')
+
+       undirty=$((undirty + nrextents * grant_extent_tax))
+
+       echo $undirty
+}
+
+# this is size of unit for grant allocation. It should be equal to
+# what tgt_grant.c:tgt_grant_chunk() calculates
+grant_chunk() {
+       local tgt=$1
+       local max_brw_size
+       local grant_extent_tax
+
+       max_brw_size=$($LCTL get_param osc.${tgt}.import |
+           grep max_brw_size | awk '{print $2}')
+
+       grant_extent_tax=$($LCTL get_param osc.${tgt}.import |
+           grep grant_extent_tax | awk '{print $2}')
+
+       echo $(((max_brw_size + grant_extent_tax) * 2))
+}
+
+test_64d() {
+       [ $(lustre_version_code ost1) -lt $(version_code 2.10.56) ] &&
+               skip "OST < 2.10.55 doesn't limit grants enough" && return 0
+
+       local tgt=$($LCTL dl | grep "0000-osc-[^mM]" | awk '{print $4}')
+
+       [[ $($LCTL get_param osc.${tgt}.import |
+                   grep "connect_flags:.*grant_param") ]] || \
+                       { skip "no grant_param connect flag"; return; }
+
+       local olddebug=$($LCTL get_param -n debug 2> /dev/null)
+
+       $LCTL set_param debug="$OLDDEBUG" 2> /dev/null || true
+
+       local max_cur_granted=$(($(want_grant $tgt) + $(grant_chunk $tgt)))
+
+       $SETSTRIPE $DIR/$tfile -i 0 -c 1
+       dd if=/dev/zero of=$DIR/$tfile bs=1M count=1000 &
+       ddpid=$!
+
+       while true
+       do
+               local cur_grant=$($LCTL get_param -n osc.${tgt}.cur_grant_bytes)
+               if [[ $cur_grant -gt $max_cur_granted ]]
+               then
+                       kill $ddpid
+                       error "cur_grant $cur_grant > $max_cur_granted"
+               fi
+               kill -0 $ddpid
+               [[ $? -ne 0 ]] && break;
+               sleep 2
+       done
+       $LCTL set_param debug="$olddebug" 2> /dev/null || true
+}
+run_test 64d "check grant limit exceed"
+
 # bug 1414 - set/get directories' stripe info
 test_65a() {
        [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
@@ -9415,7 +9501,7 @@ test_130a() {
                skip "ORI-366/LU-1941: FIEMAP unimplemented on ZFS" && return
        [ $RC != 0 ] && error "filefrag $fm_file failed"
 
-       filefrag_op=$(filefrag -ve $fm_file |
+       filefrag_op=$(filefrag -ve -k $fm_file |
                        sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
        lun=$($GETSTRIPE -i $fm_file)
 
@@ -9465,7 +9551,7 @@ test_130b() {
                error "dd failed on $fm_file"
 
        filefrag -ves $fm_file || error "filefrag $fm_file failed"
-       filefrag_op=$(filefrag -ve $fm_file |
+       filefrag_op=$(filefrag -ve -k $fm_file |
                        sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
 
        last_lun=$(echo $filefrag_op | cut -d: -f5 |
@@ -9524,7 +9610,7 @@ test_130c() {
                        error "dd failed on $fm_file"
 
        filefrag -ves $fm_file || error "filefrag $fm_file failed"
-       filefrag_op=$(filefrag -ve $fm_file |
+       filefrag_op=$(filefrag -ve -k $fm_file |
                sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
 
        last_lun=$(echo $filefrag_op | cut -d: -f5 |
@@ -9592,7 +9678,7 @@ test_130d() {
                error "dd failed on $fm_file"
 
        filefrag -ves $fm_file || error "filefrag $fm_file failed"
-       filefrag_op=$(filefrag -ve $fm_file |
+       filefrag_op=$(filefrag -ve -k $fm_file |
                        sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
 
        last_lun=$(echo $filefrag_op | cut -d: -f5 |
@@ -9654,7 +9740,7 @@ test_130e() {
        done
 
        filefrag -ves $fm_file || error "filefrag $fm_file failed"
-       filefrag_op=$(filefrag -ve $fm_file |
+       filefrag_op=$(filefrag -ve -k $fm_file |
                        sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
 
        last_lun=$(echo $filefrag_op | cut -d: -f5 |
@@ -10096,6 +10182,7 @@ test_133g() {
        echo "proc_dirs='$proc_dirs'"
        [ -n "$proc_dirs" ] || error "no proc_dirs on $HOSTNAME"
        find $proc_dirs \
+               -ignore_readdir_race \
                -type f \
                -not -name force_lbug \
                -not -name changelog_mask \
@@ -10111,6 +10198,7 @@ test_133g() {
                echo "${facet}_proc_dirs='$facet_proc_dirs'"
                [ -z "$facet_proc_dirs" ] && error "no proc_dirs on $facet"
                do_facet $facet find $facet_proc_dirs \
+                       -ignore_readdir_race \
                        -type f \
                        -not -name force_lbug \
                        -not -name changelog_mask \
@@ -14200,19 +14288,44 @@ test_231b() {
 }
 run_test 231b "must not assert on fully utilized OST request buffer"
 
-test_232() {
+test_232a() {
        mkdir -p $DIR/$tdir
+       $LFS setstripe -c1 -i0 $DIR/$tdir/$tfile
+
        #define OBD_FAIL_LDLM_OST_LVB            0x31c
-       $LCTL set_param fail_loc=0x31c
+       do_facet ost1 $LCTL set_param fail_loc=0x31c
 
        # ignore dd failure
        dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=1 || true
 
-       $LCTL set_param fail_loc=0
+       do_facet ost1 $LCTL set_param fail_loc=0
+       umount_client $MOUNT || error "umount failed"
+       mount_client $MOUNT || error "mount failed"
+       stop ost1 || error "cannot stop ost1"
+       start ost1 $(ostdevname 1) $OST_MOUNT_OPTS || error "cannot start ost1"
+}
+run_test 232a "failed lock should not block umount"
+
+test_232b() {
+       mkdir -p $DIR/$tdir
+       $LFS setstripe -c1 -i0 $DIR/$tdir/$tfile
+       dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=1
+       sync
+       cancel_lru_locks osc
+
+       #define OBD_FAIL_LDLM_OST_LVB            0x31c
+       do_facet ost1 $LCTL set_param fail_loc=0x31c
+
+       # ignore failure
+       $LFS data_version $DIR/$tdir/$tfile || true
+
+       do_facet ost1 $LCTL set_param fail_loc=0
        umount_client $MOUNT || error "umount failed"
        mount_client $MOUNT || error "mount failed"
+       stop ost1 || error "cannot stop ost1"
+       start ost1 $(ostdevname 1) $OST_MOUNT_OPTS || error "cannot start ost1"
 }
-run_test 232 "failed lock should not block umount"
+run_test 232b "failed data version lock should not block umount"
 
 test_233a() {
        [ $(lustre_version_code $SINGLEMDS) -ge $(version_code 2.3.64) ] ||
@@ -17604,6 +17717,90 @@ test_803() {
 }
 run_test 803 "verify agent object for remote object"
 
+test_804() {
+       [[ $MDSCOUNT -lt 2 ]] && skip "needs >= 2 MDTs" && return
+       [ $(lustre_version_code $SINGLEMDS) -lt $(version_code 2.10.54) ] &&
+               skip "MDS needs to be newer than 2.10.54" && return
+
+       [ "$(facet_fstype $SINGLEMDS)" != "ldiskfs" ] &&
+               skip "ldiskfs only test" && return 0
+
+       mkdir -p $DIR/$tdir
+       $LFS mkdir -c 1 -i 1 $DIR/$tdir/dir0 ||
+               error "Fail to create $DIR/$tdir/dir0"
+
+       local fid=$($LFS path2fid $DIR/$tdir/dir0)
+       local dev=$(mdsdevname 2)
+
+       do_facet mds2 "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
+               grep ${fid} || error "NOT found agent entry for dir0"
+
+       $LFS mkdir -c $MDSCOUNT -i 0 $DIR/$tdir/dir1 ||
+               error "Fail to create $DIR/$tdir/dir1"
+
+       touch $DIR/$tdir/dir1/foo0 ||
+               error "Fail to create $DIR/$tdir/dir1/foo0"
+       fid=$($LFS path2fid $DIR/$tdir/dir1/foo0)
+       local rc=0
+
+       for idx in $(seq $MDSCOUNT); do
+               dev=$(mdsdevname $idx)
+               do_facet mds${idx} \
+                       "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
+                       grep ${fid} && rc=$idx
+       done
+
+       mv $DIR/$tdir/dir1/foo0 $DIR/$tdir/dir1/foo1 ||
+               error "Fail to rename foo0 to foo1"
+       if [ $rc -eq 0 ]; then
+               for idx in $(seq $MDSCOUNT); do
+                       dev=$(mdsdevname $idx)
+                       do_facet mds${idx} \
+                       "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
+                       grep ${fid} && rc=$idx
+               done
+       fi
+
+       mv $DIR/$tdir/dir1/foo1 $DIR/$tdir/dir1/foo2 ||
+               error "Fail to rename foo1 to foo2"
+       if [ $rc -eq 0 ]; then
+               for idx in $(seq $MDSCOUNT); do
+                       dev=$(mdsdevname $idx)
+                       do_facet mds${idx} \
+                       "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
+                       grep ${fid} && rc=$idx
+               done
+       fi
+
+       [ $rc -ne 0 ] || error "NOT found agent entry for foo"
+
+       ln $DIR/$tdir/dir1/foo2 $DIR/$tdir/dir0/guard ||
+               error "Fail to link to $DIR/$tdir/dir1/foo2"
+       mv $DIR/$tdir/dir1/foo2 $DIR/$tdir/dir1/foo0 ||
+               error "Fail to rename foo2 to foo0"
+       unlink $DIR/$tdir/dir1/foo0 ||
+               error "Fail to unlink $DIR/$tdir/dir1/foo0"
+       rm -rf $DIR/$tdir/dir0 ||
+               error "Fail to rm $DIR/$tdir/dir0"
+
+       for idx in $(seq $MDSCOUNT); do
+               dev=$(mdsdevname $idx)
+               rc=0
+
+               stop mds${idx}
+               run_e2fsck $(facet_active_host mds$idx) $dev -n ||
+                       rc=$?
+               start mds${idx} $dev $MDS_MOUNT_OPTS ||
+                       error "mount mds$idx failed"
+               df $MOUNT > /dev/null 2>&1
+
+               # e2fsck should not return error
+               [ $rc -eq 0 ] ||
+                       error "e2fsck detected error on MDT${idx}: rc=$rc"
+       done
+}
+run_test 804 "verify agent entry for remote entry"
+
 #
 # tests that do cleanup/setup should be run at the end
 #