Whamcloud - gitweb
LU-14579 flr: mirror unlink and split race
[fs/lustre-release.git] / lustre / tests / sanity-flr.sh
index 9c7329a..671be84 100644 (file)
@@ -378,7 +378,6 @@ test_0b() {
        verify_comp_attr stripe-size $tf ${ids[1]} 4194304
        verify_comp_attr stripe-count $tf ${ids[1]} 2
        verify_comp_attr stripe-index $tf ${ids[1]} 2
-       verify_comp_attr pool $tf ${ids[1]} flash
 
        # verify component ${ids[2]}
        verify_comp_attr stripe-size $tf ${ids[2]} 16777216
@@ -450,7 +449,6 @@ test_0c() {
                verify_comp_attr_with_default stripe-size $tf ${ids[$i]}
                verify_comp_attr stripe-count $tf ${ids[$i]} 2
                verify_comp_attr stripe-index $tf ${ids[$i]} 1
-               verify_comp_attr pool $tf ${ids[$i]} flash
                verify_comp_extent $tf ${ids[$i]} 0 4194304
        done
 
@@ -566,13 +564,11 @@ test_0e() {
        verify_comp_attr stripe-size $tf ${ids[0]} 33554432
        verify_comp_attr stripe-count $tf ${ids[0]} 3
        verify_comp_attr stripe-index $tf ${ids[0]} 1
-       verify_comp_attr pool $tf ${ids[0]} ssd
 
        # verify component ${ids[1]}
        verify_comp_attr stripe-size $tf ${ids[1]} 4194304
        verify_comp_attr stripe-count $tf ${ids[1]} 2
        verify_comp_attr stripe-index $tf ${ids[1]} 2
-       verify_comp_attr pool $tf ${ids[1]} flash
 
        # verify component ${ids[2]}
        verify_comp_attr stripe-size $tf ${ids[2]} 16777216
@@ -644,7 +640,6 @@ test_0f() {
                verify_comp_attr_with_default stripe-size $tf ${ids[$i]}
                verify_comp_attr stripe-count $tf ${ids[$i]} 2
                verify_comp_attr stripe-index $tf ${ids[$i]} 1
-               verify_comp_attr pool $tf ${ids[$i]} flash
                verify_comp_extent $tf ${ids[$i]} 0 4194304
        done
 
@@ -1899,7 +1894,7 @@ write_file_43() {
        [ $flags = wp ] || error "file mirror state $flags != wp"
 }
 
-test_43() {
+test_43a() {
        [ $OSTCOUNT -lt 3 ] && skip "needs >= 3 OSTs" && return
 
        local tf=$DIR/$tfile
@@ -1946,7 +1941,28 @@ test_43() {
        verify_comp_attr lcme_flags $tf 0x20002 init,stale
        verify_comp_attr lcme_flags $tf 0x30003 init,stale
 }
-run_test 43 "mirror pick on write"
+run_test 43a "mirror pick on write"
+
+test_43b() {
+       local tf=$DIR/$tdir/$tfile
+
+       test_mkdir $DIR/$tdir
+       rm -f $tf
+
+       # create 3 mirrors FLR file, the first 2 mirrors are preferred
+       $LFS setstripe -N -Eeof --flags=prefer -N -Eeof --flags=prefer \
+               -N -Eeof $tf || error "create 3 mirrors file $tf failed"
+       verify_flr_state $tf "ro"
+
+       echo " ** write to $tf"
+       dd if=/dev/zero of=$tf bs=1M count=1 || error "write $tf failed"
+       verify_flr_state $tf "wp"
+
+       echo " ** resync $tf"
+       $LFS mirror resync $tf || error "resync $tf failed"
+       verify_flr_state $tf "ro"
+}
+run_test 43b "allow writing to multiple preferred mirror file"
 
 test_44() {
        [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
@@ -2344,7 +2360,7 @@ test_49a() {
 }
 run_test 49a "FIEMAP upon FLR file"
 
-test_50() {    # EX-2179
+test_50A() {   # EX-2179
        mkdir -p $DIR/$tdir
 
        local file=$DIR/$tdir/$tfile
@@ -2370,7 +2386,245 @@ test_50() {     # EX-2179
 
        $LFS getstripe -v $file || error "getstripe $file failed"
 }
-run_test 50 "mirror split update layout generation"
+run_test 50A "mirror split update layout generation"
+
+test_50a() {
+       $LCTL get_param osc.*.import | grep -q 'connect_flags:.*seek' ||
+               skip "OST does not support SEEK_HOLE"
+
+       local file=$DIR/$tdir/$tfile
+       local offset
+       local sum1
+       local sum2
+       local blocks
+
+       mkdir -p $DIR/$tdir
+
+       echo " ** create striped file $file"
+       $LFS setstripe -E 1M -c1 -S 1M -E eof -c2 -S1M $file ||
+               error "cannot create file with PFL layout"
+       echo " ** write 1st data chunk at 1M boundary"
+       dd if=/dev/urandom of=$file bs=1k count=20 seek=1021 ||
+               error "cannot write data at 1M boundary"
+       echo " ** write 2nd data chunk at 2M boundary"
+       dd if=/dev/urandom of=$file bs=1k count=20 seek=2041 ||
+               error "cannot write data at 2M boundary"
+       echo " ** create hole at the file end"
+       $TRUNCATE $file 3700000 || error "truncate fails"
+
+       echo " ** verify sparseness"
+       offset=$(lseek_test -d 1000 $file)
+       echo "    first data offset: $offset"
+       [[ $offset == 1000 ]] &&
+               error "src: data is not expected at offset $offset"
+       offset=$(lseek_test -l 3500000 $file)
+       echo "    hole at the end: $offset"
+       [[ $offset == 3500000 ]] ||
+               error "src: hole is expected at offset $offset"
+
+       echo " ** extend the file with new mirror"
+       # migrate_copy_data() is used
+       $LFS mirror extend -N -E 2M -S 1M -E 1G -S 2M -E eof $file ||
+               error "cannot create mirror"
+       $LFS getstripe $file | grep lcme_flags | grep stale > /dev/null &&
+               error "$file still has stale component"
+
+       # check migrate_data_copy() was correct
+       sum_1=$($LFS mirror read -N 1 $file | md5sum)
+       sum_2=$($LFS mirror read -N 2 $file | md5sum)
+       [[ $sum_1 == $sum_2 ]] ||
+               error "data mismatch: \'$sum_1\' vs. \'$sum_2\'"
+
+       # stale first mirror
+       $LFS setstripe --comp-set -I0x10001 --comp-flags=stale $file
+       $LFS setstripe --comp-set -I0x10002 --comp-flags=stale $file
+
+       echo " ** verify mirror #2 sparseness"
+       offset=$(lseek_test -d 1000 $file)
+       echo "    first data offset: $offset"
+       [[ $offset == 1000 ]] &&
+               error "dst: data is not expected at offset $offset"
+       offset=$(lseek_test -l 3500000 $file)
+       echo "    hole at the end: $offset"
+       [[ $offset == 3500000 ]] ||
+               error "dst: hole is expected at offset $offset"
+
+       echo " ** copy mirror #2 to mirror #1"
+       $LFS mirror copy -i 2 -o 1 $file || error "mirror copy fails"
+       $LFS getstripe $file | grep lcme_flags | grep stale > /dev/null &&
+               error "$file still has stale component"
+
+       # check llapi_mirror_copy_many correctness
+       sum_1=$($LFS mirror read -N 1 $file | md5sum)
+       sum_2=$($LFS mirror read -N 2 $file | md5sum)
+       [[ $sum_1 == $sum_2 ]] ||
+               error "data mismatch: \'$sum_1\' vs. \'$sum_2\'"
+
+       # stale 1st component of mirror #2 before lseek call
+       $LFS setstripe --comp-set -I0x20001 --comp-flags=stale $file
+
+       echo " ** verify mirror #1 sparseness again"
+       offset=$(lseek_test -d 1000 $file)
+       echo "    first data offset: $offset"
+       [[ $offset == 1000 ]] &&
+               error "dst: data is not expected at offset $offset"
+       offset=$(lseek_test -l 3500000 $file)
+       echo "    hole at the end: $offset"
+       [[ $offset == 3500000 ]] ||
+               error "dst: hole is expected at offset $offset"
+
+       cancel_lru_locks osc
+
+       blocks=$(stat -c%b $file)
+       echo " ** final consumed blocks: $blocks"
+       # for 3.5Mb file consumes ~6000 blocks, use 1000 to check
+       # that file is still sparse
+       (( blocks < 1000 )) ||
+               error "Mirrored file consumes $blocks blocks"
+
+       rm $file
+}
+run_test 50a "mirror extend/copy preserves sparseness"
+
+test_50b() {
+       $LCTL get_param osc.*.import | grep -q 'connect_flags:.*seek' ||
+               skip "OST does not support SEEK_HOLE"
+
+       local file=$DIR/$tdir/$tfile
+       local offset
+       local sum1
+       local sum2
+       local blocks
+
+       mkdir -p $DIR/$tdir
+
+       echo " ** create mirrored file $file"
+       $LFS mirror create -N -E1M -c1 -S1M -E eof \
+               -N -E2M -S1M -E eof -S2M $file ||
+               error "cannot create mirrored file"
+       echo " ** write data chunk at 1M boundary"
+       dd if=/dev/urandom of=$file bs=1k count=20 seek=1021 ||
+               error "cannot write data at 1M boundary"
+       echo " ** create hole at the file end"
+       $TRUNCATE $file 3700000 || error "truncate fails"
+
+       echo " ** verify sparseness"
+       offset=$(lseek_test -d 1000 $file)
+       echo "    first data offset: $offset"
+       [[ $offset == 1000 ]] &&
+               error "src: data is not expected at offset $offset"
+       offset=$(lseek_test -l 3500000 $file)
+       echo "    hole at the end: $offset"
+       [[ $offset == 3500000 ]] ||
+               error "src: hole is expected at 3500000"
+
+       echo " ** resync mirror #2 to mirror #1"
+       $LFS mirror resync $file
+
+       # check llapi_mirror_copy_many correctness
+       sum_1=$($LFS mirror read -N 1 $file | md5sum)
+       sum_2=$($LFS mirror read -N 2 $file | md5sum)
+       [[ $sum_1 == $sum_2 ]] ||
+               error "data mismatch: \'$sum_1\' vs. \'$sum_2\'"
+
+       cancel_lru_locks osc
+
+       blocks=$(stat -c%b $file)
+       echo " ** consumed blocks: $blocks"
+       # without full punch() support the first component can be not sparse
+       # but the last one should be, so file should use far fewer blocks
+       (( blocks < 5000 )) ||
+               error "Mirrored file consumes $blocks blocks"
+
+       # stale first component in mirror #1
+       $LFS setstripe --comp-set -I0x10001 --comp-flags=stale,nosync $file
+       echo " ** truncate file down"
+       $TRUNCATE $file 0
+       echo " ** write data chunk at 2M boundary"
+       dd if=/dev/urandom of=$file bs=1k count=20 seek=2041 conv=notrunc ||
+               error "cannot write data at 2M boundary"
+       echo " ** resync mirror #2 to mirror #1 with nosync 1st component"
+       $LFS mirror resync $file || error "mirror rsync fails"
+       # first component is still stale
+       $LFS getstripe $file | grep 'lcme_flags:.*stale' > /dev/null ||
+               error "$file still has no stale component"
+       echo " ** resync mirror #2 to mirror #1 again"
+       $LFS setstripe --comp-set -I0x10001 --comp-flags=stale,^nosync $file
+       $LFS mirror resync $file || error "mirror rsync fails"
+       $LFS getstripe $file | grep 'lcme_flags:.*stale' > /dev/null &&
+               error "$file still has stale component"
+
+       # check llapi_mirror_copy_many correctness
+       sum_1=$($LFS mirror read -N 1 $file | md5sum)
+       sum_2=$($LFS mirror read -N 2 $file | md5sum)
+       [[ $sum_1 == $sum_2 ]] ||
+               error "data mismatch: \'$sum_1\' vs. \'$sum_2\'"
+
+       cancel_lru_locks osc
+
+       blocks=$(stat -c%b $file)
+       echo " ** final consumed blocks: $blocks"
+       # while the first component can lose sparseness, the last one should
+       # not, so whole file should still use far fewer blocks in total
+       (( blocks < 3000 )) ||
+               error "Mirrored file consumes $blocks blocks"
+       rm $file
+}
+run_test 50b "mirror rsync handles sparseness"
+
+test_60a() {
+       $LCTL get_param osc.*.import | grep -q 'connect_flags:.*seek' ||
+               skip "OST does not support SEEK_HOLE"
+
+       local file=$DIR/$tdir/$tfile
+       local old_size=2147483648 # 2GiB
+       local new_size
+
+       mkdir -p $DIR/$tdir
+       dd if=/dev/urandom of=$file bs=4096 count=1 seek=$((134217728 / 4096))
+       $TRUNCATE $file $old_size
+
+       $LFS mirror extend -N -c 1 $file
+       dd if=/dev/urandom of=$file bs=4096 count=1 seek=$((134217728 / 4096)) conv=notrunc
+       $LFS mirror resync $file
+
+       new_size=$(stat --format='%s' $file)
+       if ((new_size != old_size)); then
+               error "new_size ($new_size) is not equal to old_size ($old_size)"
+       fi
+
+       rm $file
+}
+run_test 60a "mirror extend sets correct size on sparse file"
+
+test_70() {
+       local tf=$DIR/$tdir/$tfile
+
+       test_mkdir $DIR/$tdir
+
+       while true; do
+               rm -f $tf
+               $LFS mirror create -N -E 1M -c -1 -E eof -N $tf
+               echo xxxx > $tf
+       done &
+       c_pid=$!
+       echo "mirror create pid $c_pid"
+
+       while true; do
+               $LFS mirror split -d --mirror-id=1 $tf &> /dev/null
+       done &
+       s_pid=$!
+       echo "mirror split pid $s_pid"
+
+       echo "mirror create and split race for 60 seconds, should not crash"
+       sleep 60
+       kill -9 $c_pid &> /dev/null
+       kill -9 $s_pid &> /dev/null
+
+       rm -f $tf
+       true
+}
+run_test 70 "mirror create and split race"
 
 ctrl_file=$(mktemp /tmp/CTRL.XXXXXX)
 lock_file=$(mktemp /var/lock/FLR.XXXXXX)
@@ -3069,6 +3323,47 @@ function test_206() {
 }
 run_test 206 "lfs setstripe -pool .. --comp-flags=.. "
 
+test_207() {
+       local file=$DIR/$tfile
+       local tmpfile=$DIR/$tfile-tt
+
+       [ $MDS1_VERSION -lt $(version_code 2.14.50) ] &&
+               skip "Need MDS version at least 2.14.50"
+
+       stack_trap "rm -f $tmpfile $file"
+
+       # generate data for verification
+       dd if=/dev/urandom of=$tmpfile bs=1M count=1 ||
+               error "can't generate file with random data"
+
+       # create a mirrored file with one stale replica
+       $LFS mirror create -N -S 4M -c 2 -N -S 1M -c -1 $file ||
+               error "create mirrored file $file failed"
+       get_mirror_ids $file
+       echo "mirror IDs: ${mirror_array[@]}"
+
+       dd if=$tmpfile of=$file bs=1M || error "can't copy"
+       get_mirror_ids $file
+       echo "mirror IDs: ${mirror_array[@]}"
+
+       drop_client_cache
+       cmp $tmpfile $file || error "files don't match"
+       get_mirror_ids $file
+       echo "mirror IDs: ${mirror_array[@]}"
+
+       # mirror creation should work fine
+       $LFS mirror extend -N -S 8M -c -1 $file ||
+               error "mirror extend $file failed"
+
+       get_mirror_ids $file
+       echo "mirror IDs: ${mirror_array[@]}"
+
+       drop_client_cache
+       $LFS mirror verify -v $file || error "verification failed"
+       cmp $tmpfile $file || error "files don't match"
+}
+run_test 207 "create another replica with existing out-of-sync one"
+
 complete $SECONDS
 check_and_cleanup_lustre
 exit_status