Whamcloud - gitweb
LU-17030 llite: allow setting max_cached_mb to a %
[fs/lustre-release.git] / lustre / tests / sanity.sh
1 #!/bin/bash
2 #
3 # Run select tests by setting ONLY, or as arguments to the script.
4 # Skip specific tests by setting EXCEPT.
5 #
6 # e.g. ONLY="22 23" or ONLY="`seq 32 39`" or EXCEPT="31"
7 set -e
8
9 ONLY=${ONLY:-"$*"}
10
11 # Check Grants after these tests
12 GRANT_CHECK_LIST="$GRANT_CHECK_LIST 42a 42b 42c 42d 42e 63a 63b 64a 64b 64c 64d"
13
14 OSC=${OSC:-"osc"}
15
16 CC=${CC:-cc}
17 CREATETEST=${CREATETEST:-createtest}
18 LVERIFY=${LVERIFY:-ll_dirstripe_verify}
19 OPENFILE=${OPENFILE:-openfile}
20 OPENUNLINK=${OPENUNLINK:-openunlink}
21 READS=${READS:-"reads"}
22 MUNLINK=${MUNLINK:-munlink}
23 SOCKETSERVER=${SOCKETSERVER:-socketserver}
24 SOCKETCLIENT=${SOCKETCLIENT:-socketclient}
25 MEMHOG=${MEMHOG:-memhog}
26 DIRECTIO=${DIRECTIO:-directio}
27 ACCEPTOR_PORT=${ACCEPTOR_PORT:-988}
28 DEF_STRIPE_COUNT=-1
29 CHECK_GRANT=${CHECK_GRANT:-"yes"}
30 GRANT_CHECK_LIST=${GRANT_CHECK_LIST:-""}
31
32 TRACE=${TRACE:-""}
33 LUSTRE=${LUSTRE:-$(dirname $0)/..}
34 LUSTRE_TESTS_API_DIR=${LUSTRE_TESTS_API_DIR:-${LUSTRE}/tests/clientapi}
35 . $LUSTRE/tests/test-framework.sh
36 init_test_env "$@"
37
38 init_logging
39
40 ALWAYS_EXCEPT="$SANITY_EXCEPT "
41 always_except LU-9693  42a 42c
42 always_except LU-6493  42b
43 always_except LU-16515 118c 118d
44 always_except LU-8411  407
45
46 if $SHARED_KEY; then
47         always_except LU-14181 64e 64f
48 fi
49
50 # skip the grant tests for ARM until they are fixed
51 if [[ $(uname -m) = aarch64 ]]; then
52         always_except LU-11671 45
53 fi
54
55 # skip nfs tests on kernels >= 4.12.0 until they are fixed
56 if [ $LINUX_VERSION_CODE -ge $(version_code 4.12.0) ]; then
57         always_except LU-12661 817
58 fi
59 # skip cgroup tests on RHEL8.1 kernels until they are fixed
60 if (( $LINUX_VERSION_CODE >= $(version_code 4.18.0) &&
61       $LINUX_VERSION_CODE <  $(version_code 5.4.0) )); then
62         always_except LU-13063 411
63 fi
64
65 #                                  5              12     8   12  15   (min)"
66 [[ "$SLOW" = "no" ]] && EXCEPT_SLOW="27m 60i 64b 68 71 135 136 230d 300o"
67
68 if [[ "$mds1_FSTYPE" == "zfs" ]]; then
69         #                                               13    (min)"
70         [[ "$SLOW" == "no" ]] && EXCEPT_SLOW="$EXCEPT_SLOW 51b"
71 fi
72
73 if [[ "$ost1_FSTYPE" = "zfs" ]]; then
74         always_except LU-1941 130b 130c 130d 130e 130f 130g
75         always_except LU-9054 312
76 fi
77
78 proc_regexp="/{proc,sys}/{fs,sys,kernel/debug}/{lustre,lnet}/"
79
80 # Get the SLES distro version
81 #
82 # Returns a version string that should only be used in comparing
83 # strings returned by version_code()
84 sles_version_code()
85 {
86         local version=$(grep VERSION_ID /etc/os-release | cut -d'"' -f2)
87
88         # All SuSE Linux versions have one decimal. version_code expects two
89         local sles_version=$version.0
90         version_code $sles_version
91 }
92
93 # Check if we are running on Ubuntu or SLES so we can make decisions on
94 # what tests to run
95 if [ -r /etc/SuSE-release ] || [ -r /etc/SUSE-brand ]; then
96         sles_version=$(sles_version_code)
97         [ $sles_version -lt $(version_code 11.4.0) ] &&
98                 always_except LU-4341 170
99
100         [ $sles_version -lt $(version_code 12.0.0) ] &&
101                 always_except LU-3703 234
102 elif [ -r /etc/os-release ]; then
103         if grep -qi ubuntu /etc/os-release; then
104                 ubuntu_version=$(version_code $(sed -n -e 's/"//g' \
105                                                 -e 's/^VERSION=//p' \
106                                                 /etc/os-release |
107                                                 awk '{ print $1 }'))
108
109                 if [[ $ubuntu_version -gt $(version_code 16.0.0) ]]; then
110                         always_except LU-10366 410
111                 fi
112         fi
113 fi
114
115 build_test_filter
116 FAIL_ON_ERROR=false
117
118 cleanup() {
119         echo -n "cln.."
120         pgrep ll_sa > /dev/null && { echo "There are ll_sa thread not exit!"; exit 20; }
121         cleanupall ${FORCE} $* || { echo "FAILed to clean up"; exit 20; }
122 }
123 setup() {
124         echo -n "mnt.."
125         load_modules
126         setupall || exit 10
127         echo "done"
128 }
129
130 check_swap_layouts_support()
131 {
132         $LCTL get_param -n llite.*.sbi_flags | grep -q layout ||
133                 skip "Does not support layout lock."
134 }
135
136 check_swap_layout_no_dom()
137 {
138         local FOLDER=$1
139         local SUPP=$(lfs getstripe $FOLDER | grep "pattern:       mdt" | wc -l)
140         [ $SUPP -eq 0 ] || skip "layout swap does not support DOM files so far"
141 }
142
143 check_and_setup_lustre
144 DIR=${DIR:-$MOUNT}
145 assert_DIR
146
147 MAXFREE=${MAXFREE:-$((300000 * $OSTCOUNT))}
148
149 [ -f $DIR/d52a/foo ] && chattr -a $DIR/d52a/foo
150 [ -f $DIR/d52b/foo ] && chattr -i $DIR/d52b/foo
151 rm -rf $DIR/[Rdfs][0-9]*
152
153 # $RUNAS_ID may get set incorrectly somewhere else
154 [ $UID -eq 0 -a $RUNAS_ID -eq 0 ] &&
155         error "\$RUNAS_ID set to 0, but \$UID is also 0!"
156
157 check_runas_id $RUNAS_ID $RUNAS_GID $RUNAS
158
159 if [ "${ONLY}" = "MOUNT" ] ; then
160         echo "Lustre is up, please go on"
161         exit
162 fi
163
164 echo "preparing for tests involving mounts"
165 EXT2_DEV=${EXT2_DEV:-$TMP/SANITY.LOOP}
166 touch $EXT2_DEV
167 mke2fs -j -F $EXT2_DEV 8000 > /dev/null
168 echo # add a newline after mke2fs.
169
170 umask 077
171
172 OLDDEBUG=$(lctl get_param -n debug 2> /dev/null)
173
174 # ensure all internal functions know we want full debug
175 export PTLDEBUG=all
176 lctl set_param debug=$PTLDEBUG 2> /dev/null || true
177
178 test_0a() {
179         touch $DIR/$tfile
180         $CHECKSTAT -t file $DIR/$tfile || error "$tfile is not a file"
181         rm $DIR/$tfile
182         $CHECKSTAT -a $DIR/$tfile || error "$tfile was not removed"
183 }
184 run_test 0a "touch; rm ====================="
185
186 test_0b() {
187         chmod 0755 $DIR || error "chmod 0755 $DIR failed"
188         $CHECKSTAT -p 0755 $DIR || error "$DIR permission is not 0755"
189 }
190 run_test 0b "chmod 0755 $DIR ============================="
191
192 test_0c() {
193         $LCTL get_param mdc.*.import | grep "state: FULL" ||
194                 error "import not FULL"
195         $LCTL get_param mdc.*.import | grep "target: $FSNAME-MDT" ||
196                 error "bad target"
197 }
198 run_test 0c "check import proc"
199
200 test_0d() { # LU-3397
201         [ $MGS_VERSION -lt $(version_code 2.10.57) ] &&
202                 skip "proc exports not supported before 2.10.57"
203
204         local mgs_exp="mgs.MGS.exports"
205         local client_uuid=$($LCTL get_param -n mgc.*.uuid)
206         local exp_client_nid
207         local exp_client_version
208         local exp_val
209         local imp_val
210         local temp_imp=$DIR/$tfile.import
211         local temp_exp=$DIR/$tfile.export
212
213         # save mgc import file to $temp_imp
214         $LCTL get_param mgc.*.import | tee $temp_imp
215         # Check if client uuid is found in MGS export
216         for exp_client_nid in $(do_facet mgs $LCTL get_param -N $mgs_exp.*); do
217                 [ $(do_facet mgs $LCTL get_param -n $exp_client_nid.uuid) == \
218                         $client_uuid ] &&
219                         break;
220         done
221         # save mgs export file to $temp_exp
222         do_facet mgs $LCTL get_param $exp_client_nid.export | tee $temp_exp
223
224         # Compare the value of field "connect_flags"
225         imp_val=$(grep "connect_flags" $temp_imp)
226         exp_val=$(grep "connect_flags" $temp_exp)
227         [ "$exp_val" == "$imp_val" ] ||
228                 error "export flags '$exp_val' != import flags '$imp_val'"
229
230         # Compare client versions.  Only compare top-3 fields for compatibility
231         exp_client_version=$(awk '/target_version:/ { print $2 }' $temp_exp)
232         exp_val=$(version_code $(cut -d. -f1,2,3 <<<$exp_client_version))
233         imp_val=$(version_code $(lustre_build_version client | cut -d. -f1,2,3))
234         [ "$exp_val" == "$imp_val" ] ||
235                 error "exp version '$exp_client_version'($exp_val) != " \
236                         "'$(lustre_build_version client)'($imp_val)"
237 }
238 run_test 0d "check export proc ============================="
239
240 test_0e() { # LU-13417
241         (( $MDSCOUNT > 1 )) ||
242                 skip "We need at least 2 MDTs for this test"
243
244         (( $MDS1_VERSION >= $(version_code 2.14.51) )) ||
245                 skip "Need server version at least 2.14.51"
246
247         local default_lmv_count=$($LFS getdirstripe -D -c $MOUNT)
248         local default_lmv_index=$($LFS getdirstripe -D -i $MOUNT)
249
250         [ $default_lmv_count -eq 1 ] ||
251                 error "$MOUNT default stripe count $default_lmv_count"
252
253         [ $default_lmv_index -eq -1 ] ||
254                 error "$MOUNT default stripe index $default_lmv_index"
255
256         mkdir $MOUNT/$tdir.1 || error "mkdir $MOUNT/$tdir.1 failed"
257         mkdir $MOUNT/$tdir.2 || error "mkdir $MOUNT/$tdir.2 failed"
258
259         local mdt_index1=$($LFS getdirstripe -i $MOUNT/$tdir.1)
260         local mdt_index2=$($LFS getdirstripe -i $MOUNT/$tdir.2)
261
262         [ $mdt_index1 -eq $mdt_index2 ] &&
263                 error "directories are on the same MDT $mdt_index1=$mdt_index2"
264
265         rmdir $MOUNT/$tdir.1 $MOUNT/$tdir.2
266 }
267 run_test 0e "Enable DNE MDT balancing for mkdir in the ROOT"
268
269 test_1() {
270         test_mkdir $DIR/$tdir
271         test_mkdir $DIR/$tdir/d2
272         mkdir $DIR/$tdir/d2 && error "we expect EEXIST, but not returned"
273         $CHECKSTAT -t dir $DIR/$tdir/d2 || error "$tdir/d2 is not a dir"
274         rmdir $DIR/$tdir/d2
275         rmdir $DIR/$tdir
276         $CHECKSTAT -a $DIR/$tdir || error "$tdir was not removed"
277 }
278 run_test 1 "mkdir; remkdir; rmdir"
279
280 test_2() {
281         test_mkdir $DIR/$tdir
282         touch $DIR/$tdir/$tfile || error "touch $tdir/$tfile failed"
283         $CHECKSTAT -t file $DIR/$tdir/$tfile || error "$tdir/$tfile not a file"
284         rm -r $DIR/$tdir
285         $CHECKSTAT -a $DIR/$tdir/$tfile || error "$tdir/$file is not removed"
286 }
287 run_test 2 "mkdir; touch; rmdir; check file"
288
289 test_3() {
290         test_mkdir $DIR/$tdir
291         $CHECKSTAT -t dir $DIR/$tdir || error "$tdir is not a directory"
292         touch $DIR/$tdir/$tfile
293         $CHECKSTAT -t file $DIR/$tdir/$tfile || error "$tdir/$tfile not a file"
294         rm -r $DIR/$tdir
295         $CHECKSTAT -a $DIR/$tdir || error "$tdir is not removed"
296 }
297 run_test 3 "mkdir; touch; rmdir; check dir"
298
299 # LU-4471 - failed rmdir on remote directories still removes directory on MDT0
300 test_4() {
301         test_mkdir -i 1 $DIR/$tdir
302
303         touch $DIR/$tdir/$tfile ||
304                 error "Create file under remote directory failed"
305
306         rmdir $DIR/$tdir &&
307                 error "Expect error removing in-use dir $DIR/$tdir"
308
309         test -d $DIR/$tdir || error "Remote directory disappeared"
310
311         rm -rf $DIR/$tdir || error "remove remote dir error"
312 }
313 run_test 4 "mkdir; touch dir/file; rmdir; checkdir (expect error)"
314
315 test_5() {
316         test_mkdir $DIR/$tdir
317         test_mkdir $DIR/$tdir/d2
318         chmod 0707 $DIR/$tdir/d2 || error "chmod 0707 $tdir/d2 failed"
319         $CHECKSTAT -t dir -p 0707 $DIR/$tdir/d2 || error "$tdir/d2 not mode 707"
320         $CHECKSTAT -t dir $DIR/$tdir/d2 || error "$tdir/d2 is not a directory"
321 }
322 run_test 5 "mkdir .../d5 .../d5/d2; chmod .../d5/d2"
323
324 test_6a() {
325         touch $DIR/$tfile || error "touch $DIR/$tfile failed"
326         chmod 0666 $DIR/$tfile || error "chmod 0666 $tfile failed"
327         $CHECKSTAT -t file -p 0666 -u \#$UID $DIR/$tfile ||
328                 error "$tfile does not have perm 0666 or UID $UID"
329         $RUNAS chmod 0444 $DIR/$tfile && error "chmod $tfile worked on UID $UID"
330         $CHECKSTAT -t file -p 0666 -u \#$UID $DIR/$tfile ||
331                 error "$tfile should be 0666 and owned by UID $UID"
332 }
333 run_test 6a "touch f6a; chmod f6a; $RUNAS chmod f6a (should return error) =="
334
335 test_6c() {
336         [ $RUNAS_ID -eq $UID ] && skip_env "RUNAS_ID = UID = $UID"
337
338         touch $DIR/$tfile
339         chown $RUNAS_ID $DIR/$tfile || error "chown $RUNAS_ID $file failed"
340         $CHECKSTAT -t file -u \#$RUNAS_ID $DIR/$tfile ||
341                 error "$tfile should be owned by UID $RUNAS_ID"
342         $RUNAS chown $UID $DIR/$tfile && error "chown $UID $file succeeded"
343         $CHECKSTAT -t file -u \#$RUNAS_ID $DIR/$tfile ||
344                 error "$tfile should be owned by UID $RUNAS_ID"
345 }
346 run_test 6c "touch f6c; chown f6c; $RUNAS chown f6c (should return error) =="
347
348 test_6e() {
349         [ $RUNAS_ID -eq $UID ] && skip_env "RUNAS_ID = UID = $UID"
350
351         touch $DIR/$tfile
352         chgrp $RUNAS_ID $DIR/$tfile || error "chgrp $RUNAS_ID $file failed"
353         $CHECKSTAT -t file -u \#$UID -g \#$RUNAS_ID $DIR/$tfile ||
354                 error "$tfile should be owned by GID $UID"
355         $RUNAS chgrp $UID $DIR/$tfile && error "chgrp $UID $file succeeded"
356         $CHECKSTAT -t file -u \#$UID -g \#$RUNAS_ID $DIR/$tfile ||
357                 error "$tfile should be owned by UID $UID and GID $RUNAS_ID"
358 }
359 run_test 6e "touch+chgrp $tfile; $RUNAS chgrp $tfile (should return error)"
360
361 test_6g() {
362         [ $RUNAS_ID -eq $UID ] && skip_env "RUNAS_ID = UID = $UID"
363
364         test_mkdir $DIR/$tdir
365         chmod 777 $DIR/$tdir || error "chmod 0777 $tdir failed"
366         $RUNAS mkdir $DIR/$tdir/d || error "mkdir $tdir/d failed"
367         chmod g+s $DIR/$tdir/d || error "chmod g+s $tdir/d failed"
368         test_mkdir $DIR/$tdir/d/subdir
369         $CHECKSTAT -g \#$RUNAS_GID $DIR/$tdir/d/subdir ||
370                 error "$tdir/d/subdir should be GID $RUNAS_GID"
371         if [[ $MDSCOUNT -gt 1 ]]; then
372                 # check remote dir sgid inherite
373                 $LFS mkdir -i 0 $DIR/$tdir.local ||
374                         error "mkdir $tdir.local failed"
375                 chmod g+s $DIR/$tdir.local ||
376                         error "chmod $tdir.local failed"
377                 chgrp $RUNAS_GID $DIR/$tdir.local ||
378                         error "chgrp $tdir.local failed"
379                 $LFS mkdir -i 1 $DIR/$tdir.local/$tdir.remote ||
380                         error "mkdir $tdir.remote failed"
381                 $CHECKSTAT -g \#$RUNAS_GID $DIR/$tdir.local/$tdir.remote ||
382                         error "$tdir.remote should be owned by $UID.$RUNAS_ID"
383                 $CHECKSTAT -p 02755 $DIR/$tdir.local/$tdir.remote ||
384                         error "$tdir.remote should be mode 02755"
385         fi
386 }
387 run_test 6g "verify new dir in sgid dir inherits group"
388
389 test_6h() { # bug 7331
390         [ $RUNAS_ID -eq $UID ] && skip_env "RUNAS_ID = UID = $UID"
391
392         touch $DIR/$tfile || error "touch failed"
393         chown $RUNAS_ID:$RUNAS_GID $DIR/$tfile || error "initial chown failed"
394         $RUNAS -G$RUNAS_GID chown $RUNAS_ID:0 $DIR/$tfile &&
395                 error "chown $RUNAS_ID:0 $tfile worked as GID $RUNAS_GID"
396         $CHECKSTAT -t file -u \#$RUNAS_ID -g \#$RUNAS_GID $DIR/$tfile ||
397                 error "$tdir/$tfile should be UID $RUNAS_UID GID $RUNAS_GID"
398 }
399 run_test 6h "$RUNAS chown RUNAS_ID.0 .../$tfile (should return error)"
400
401 test_7a() {
402         test_mkdir $DIR/$tdir
403         $MCREATE $DIR/$tdir/$tfile
404         chmod 0666 $DIR/$tdir/$tfile
405         $CHECKSTAT -t file -p 0666 $DIR/$tdir/$tfile ||
406                 error "$tdir/$tfile should be mode 0666"
407 }
408 run_test 7a "mkdir .../d7; mcreate .../d7/f; chmod .../d7/f ===="
409
410 test_7b() {
411         if [ ! -d $DIR/$tdir ]; then
412                 test_mkdir $DIR/$tdir
413         fi
414         $MCREATE $DIR/$tdir/$tfile
415         echo -n foo > $DIR/$tdir/$tfile
416         [ "$(cat $DIR/$tdir/$tfile)" = "foo" ] || error "$tdir/$tfile not 'foo'"
417         $CHECKSTAT -t file -s 3 $DIR/$tdir/$tfile || error "$tfile size not 3"
418 }
419 run_test 7b "mkdir .../d7; mcreate d7/f2; echo foo > d7/f2 ====="
420
421 test_8() {
422         test_mkdir $DIR/$tdir
423         touch $DIR/$tdir/$tfile
424         chmod 0666 $DIR/$tdir/$tfile
425         $CHECKSTAT -t file -p 0666 $DIR/$tdir/$tfile ||
426                 error "$tfile mode not 0666"
427 }
428 run_test 8 "mkdir .../d8; touch .../d8/f; chmod .../d8/f ======="
429
430 test_9() {
431         test_mkdir $DIR/$tdir
432         test_mkdir $DIR/$tdir/d2
433         test_mkdir $DIR/$tdir/d2/d3
434         $CHECKSTAT -t dir $DIR/$tdir/d2/d3 || error "$tdir/d2/d3 not a dir"
435 }
436 run_test 9 "mkdir .../d9 .../d9/d2 .../d9/d2/d3 ================"
437
438 test_10() {
439         test_mkdir $DIR/$tdir
440         test_mkdir $DIR/$tdir/d2
441         touch $DIR/$tdir/d2/$tfile
442         $CHECKSTAT -t file $DIR/$tdir/d2/$tfile ||
443                 error "$tdir/d2/$tfile not a file"
444 }
445 run_test 10 "mkdir .../d10 .../d10/d2; touch .../d10/d2/f ======"
446
447 test_11() {
448         test_mkdir $DIR/$tdir
449         test_mkdir $DIR/$tdir/d2
450         chmod 0666 $DIR/$tdir/d2
451         chmod 0705 $DIR/$tdir/d2
452         $CHECKSTAT -t dir -p 0705 $DIR/$tdir/d2 ||
453                 error "$tdir/d2 mode not 0705"
454 }
455 run_test 11 "mkdir .../d11 d11/d2; chmod .../d11/d2 ============"
456
457 test_12() {
458         test_mkdir $DIR/$tdir
459         touch $DIR/$tdir/$tfile
460         chmod 0666 $DIR/$tdir/$tfile
461         chmod 0654 $DIR/$tdir/$tfile
462         $CHECKSTAT -t file -p 0654 $DIR/$tdir/$tfile ||
463                 error "$tdir/d2 mode not 0654"
464 }
465 run_test 12 "touch .../d12/f; chmod .../d12/f .../d12/f ========"
466
467 test_13() {
468         test_mkdir $DIR/$tdir
469         dd if=/dev/zero of=$DIR/$tdir/$tfile count=10
470         >  $DIR/$tdir/$tfile
471         $CHECKSTAT -t file -s 0 $DIR/$tdir/$tfile ||
472                 error "$tdir/$tfile size not 0 after truncate"
473 }
474 run_test 13 "creat .../d13/f; dd .../d13/f; > .../d13/f ========"
475
476 test_14() {
477         test_mkdir $DIR/$tdir
478         touch $DIR/$tdir/$tfile
479         rm $DIR/$tdir/$tfile
480         $CHECKSTAT -a $DIR/$tdir/$tfile || error "$tdir/$tfile not removed"
481 }
482 run_test 14 "touch .../d14/f; rm .../d14/f; rm .../d14/f ======="
483
484 test_15() {
485         test_mkdir $DIR/$tdir
486         touch $DIR/$tdir/$tfile
487         mv $DIR/$tdir/$tfile $DIR/$tdir/${tfile}_2
488         $CHECKSTAT -t file $DIR/$tdir/${tfile}_2 ||
489                 error "$tdir/${tfile_2} not a file after rename"
490         rm $DIR/$tdir/${tfile}_2 || error "unlink failed after rename"
491 }
492 run_test 15 "touch .../d15/f; mv .../d15/f .../d15/f2 =========="
493
494 test_16() {
495         test_mkdir $DIR/$tdir
496         touch $DIR/$tdir/$tfile
497         rm -rf $DIR/$tdir/$tfile
498         $CHECKSTAT -a $DIR/$tdir/$tfile || error "$tdir/$tfile not removed"
499 }
500 run_test 16 "touch .../d16/f; rm -rf .../d16/f"
501
502 test_17a() {
503         test_mkdir $DIR/$tdir
504         touch $DIR/$tdir/$tfile
505         ln -s $DIR/$tdir/$tfile $DIR/$tdir/l-exist
506         ls -l $DIR/$tdir
507         $CHECKSTAT -l $DIR/$tdir/$tfile $DIR/$tdir/l-exist ||
508                 error "$tdir/l-exist not a symlink"
509         $CHECKSTAT -f -t f $DIR/$tdir/l-exist ||
510                 error "$tdir/l-exist not referencing a file"
511         rm -f $DIR/$tdir/l-exist
512         $CHECKSTAT -a $DIR/$tdir/l-exist || error "$tdir/l-exist not removed"
513 }
514 run_test 17a "symlinks: create, remove (real)"
515
516 test_17b() {
517         test_mkdir $DIR/$tdir
518         ln -s no-such-file $DIR/$tdir/l-dangle
519         ls -l $DIR/$tdir
520         $CHECKSTAT -l no-such-file $DIR/$tdir/l-dangle ||
521                 error "$tdir/l-dangle not referencing no-such-file"
522         $CHECKSTAT -fa $DIR/$tdir/l-dangle ||
523                 error "$tdir/l-dangle not referencing non-existent file"
524         rm -f $DIR/$tdir/l-dangle
525         $CHECKSTAT -a $DIR/$tdir/l-dangle || error "$tdir/l-dangle not removed"
526 }
527 run_test 17b "symlinks: create, remove (dangling)"
528
529 test_17c() { # bug 3440 - don't save failed open RPC for replay
530         test_mkdir $DIR/$tdir
531         ln -s foo $DIR/$tdir/$tfile
532         cat $DIR/$tdir/$tfile && error "opened non-existent symlink" || true
533 }
534 run_test 17c "symlinks: open dangling (should return error)"
535
536 test_17d() {
537         test_mkdir $DIR/$tdir
538         ln -s foo $DIR/$tdir/$tfile
539         touch $DIR/$tdir/$tfile || error "creating to new symlink"
540 }
541 run_test 17d "symlinks: create dangling"
542
543 test_17e() {
544         test_mkdir $DIR/$tdir
545         local foo=$DIR/$tdir/$tfile
546         ln -s $foo $foo || error "create symlink failed"
547         ls -l $foo || error "ls -l failed"
548         ls $foo && error "ls not failed" || true
549 }
550 run_test 17e "symlinks: create recursive symlink (should return error)"
551
552 test_17f() {
553         test_mkdir $DIR/$tdir
554         ln -s 1234567890/2234567890/3234567890/4234567890 $DIR/$tdir/111
555         ln -s 1234567890/2234567890/3234567890/4234567890/5234567890/6234567890 $DIR/$tdir/222
556         ln -s 1234567890/2234567890/3234567890/4234567890/5234567890/6234567890/7234567890/8234567890 $DIR/$tdir/333
557         ln -s 1234567890/2234567890/3234567890/4234567890/5234567890/6234567890/7234567890/8234567890/9234567890/a234567890/b234567890 $DIR/$tdir/444
558         ln -s 1234567890/2234567890/3234567890/4234567890/5234567890/6234567890/7234567890/8234567890/9234567890/a234567890/b234567890/c234567890/d234567890/f234567890 $DIR/$tdir/555
559         ln -s 1234567890/2234567890/3234567890/4234567890/5234567890/6234567890/7234567890/8234567890/9234567890/a234567890/b234567890/c234567890/d234567890/f234567890/aaaaaaaaaa/bbbbbbbbbb/cccccccccc/dddddddddd/eeeeeeeeee/ffffffffff/ $DIR/$tdir/666
560         ls -l  $DIR/$tdir
561 }
562 run_test 17f "symlinks: long and very long symlink name"
563
564 # str_repeat(S, N) generate a string that is string S repeated N times
565 str_repeat() {
566         local s=$1
567         local n=$2
568         local ret=''
569         while [ $((n -= 1)) -ge 0 ]; do
570                 ret=$ret$s
571         done
572         echo $ret
573 }
574
575 # Long symlinks and LU-2241
576 test_17g() {
577         test_mkdir $DIR/$tdir
578         local TESTS="59 60 61 4094 4095"
579
580         # Fix for inode size boundary in 2.1.4
581         [ $MDS1_VERSION -lt $(version_code 2.1.4) ] &&
582                 TESTS="4094 4095"
583
584         # Patch not applied to 2.2 or 2.3 branches
585         [ $MDS1_VERSION -ge $(version_code 2.2.0) ] &&
586         [ $MDS1_VERSION -le $(version_code 2.3.55) ] &&
587                 TESTS="4094 4095"
588
589         for i in $TESTS; do
590                 local SYMNAME=$(str_repeat 'x' $i)
591                 ln -s $SYMNAME $DIR/$tdir/f$i || error "failed $i-char symlink"
592                 readlink $DIR/$tdir/f$i || error "failed $i-char readlink"
593         done
594 }
595 run_test 17g "symlinks: really long symlink name and inode boundaries"
596
597 test_17h() { #bug 17378
598         [ $PARALLEL == "yes" ] && skip "skip parallel run"
599         remote_mds_nodsh && skip "remote MDS with nodsh"
600
601         local mdt_idx
602
603         test_mkdir $DIR/$tdir
604         mdt_idx=$($LFS getdirstripe -i $DIR/$tdir)
605         $LFS setstripe -c -1 $DIR/$tdir
606         #define OBD_FAIL_MDS_LOV_PREP_CREATE 0x141
607         do_facet mds$((mdt_idx + 1)) lctl set_param fail_loc=0x80000141
608         touch $DIR/$tdir/$tfile || true
609 }
610 run_test 17h "create objects: lov_free_memmd() doesn't lbug"
611
612 test_17i() { #bug 20018
613         [ $PARALLEL == "yes" ] && skip "skip parallel run"
614         remote_mds_nodsh && skip "remote MDS with nodsh"
615
616         local foo=$DIR/$tdir/$tfile
617         local mdt_idx
618
619         test_mkdir -c1 $DIR/$tdir
620         mdt_idx=$($LFS getdirstripe -i $DIR/$tdir)
621         ln -s $foo $foo || error "create symlink failed"
622 #define OBD_FAIL_MDS_READLINK_EPROTO     0x143
623         do_facet mds$((mdt_idx + 1)) lctl set_param fail_loc=0x80000143
624         ls -l $foo && error "error not detected"
625         return 0
626 }
627 run_test 17i "don't panic on short symlink (should return error)"
628
629 test_17k() { #bug 22301
630         [ $PARALLEL == "yes" ] && skip "skip parallel run"
631         [[ -z "$(which rsync 2>/dev/null)" ]] &&
632                 skip "no rsync command"
633         rsync --help | grep -q xattr ||
634                 skip_env "$(rsync --version | head -n1) does not support xattrs"
635         test_mkdir $DIR/$tdir
636         test_mkdir $DIR/$tdir.new
637         touch $DIR/$tdir/$tfile
638         ln -s $DIR/$tdir/$tfile $DIR/$tdir/$tfile.lnk
639         rsync -av -X $DIR/$tdir/ $DIR/$tdir.new ||
640                 error "rsync failed with xattrs enabled"
641 }
642 run_test 17k "symlinks: rsync with xattrs enabled"
643
644 test_17l() { # LU-279
645         [[ -z "$(which getfattr 2>/dev/null)" ]] &&
646                 skip "no getfattr command"
647
648         test_mkdir $DIR/$tdir
649         touch $DIR/$tdir/$tfile
650         ln -s $DIR/$tdir/$tfile $DIR/$tdir/$tfile.lnk
651         for path in "$DIR/$tdir" "$DIR/$tdir/$tfile" "$DIR/$tdir/$tfile.lnk"; do
652                 # -h to not follow symlinks. -m '' to list all the xattrs.
653                 # grep to remove first line: '# file: $path'.
654                 for xattr in `getfattr -hm '' $path 2>/dev/null | grep -v '^#'`;
655                 do
656                         lgetxattr_size_check $path $xattr ||
657                                 error "lgetxattr_size_check $path $xattr failed"
658                 done
659         done
660 }
661 run_test 17l "Ensure lgetxattr's returned xattr size is consistent"
662
663 # LU-1540
664 test_17m() {
665         [ $PARALLEL == "yes" ] && skip "skip parallel run"
666         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
667         remote_mds_nodsh && skip "remote MDS with nodsh"
668         [ $MDS1_VERSION -ge $(version_code 2.2.0) ] &&
669         [ $MDS1_VERSION -le $(version_code 2.2.93) ] &&
670                 skip "MDS 2.2.0-2.2.93 do not NUL-terminate symlinks"
671
672         local short_sym="0123456789"
673         local wdir=$DIR/$tdir
674         local i
675
676         test_mkdir $wdir
677         long_sym=$short_sym
678         # create a long symlink file
679         for ((i = 0; i < 4; ++i)); do
680                 long_sym=${long_sym}${long_sym}
681         done
682
683         echo "create 512 short and long symlink files under $wdir"
684         for ((i = 0; i < 256; ++i)); do
685                 ln -sf ${long_sym}"a5a5" $wdir/long-$i
686                 ln -sf ${short_sym}"a5a5" $wdir/short-$i
687         done
688
689         echo "erase them"
690         rm -f $wdir/*
691         sync
692         wait_delete_completed
693
694         echo "recreate the 512 symlink files with a shorter string"
695         for ((i = 0; i < 512; ++i)); do
696                 # rewrite the symlink file with a shorter string
697                 ln -sf ${long_sym} $wdir/long-$i || error "long_sym failed"
698                 ln -sf ${short_sym} $wdir/short-$i || error "short_sym failed"
699         done
700
701         local mds_index=$(($($LFS getstripe -m $wdir) + 1))
702
703         echo "stop and checking mds${mds_index}:"
704         # e2fsck should not return error
705         stop mds${mds_index}
706         local devname=$(mdsdevname $mds_index)
707         run_e2fsck $(facet_active_host mds${mds_index}) $devname -n
708         rc=$?
709
710         start mds${mds_index} $devname $MDS_MOUNT_OPTS ||
711                 error "start mds${mds_index} failed"
712         df $MOUNT > /dev/null 2>&1
713         [ $rc -eq 0 ] ||
714                 error "e2fsck detected error for short/long symlink: rc=$rc"
715         rm -f $wdir/*
716 }
717 run_test 17m "run e2fsck against MDT which contains short/long symlink"
718
719 check_fs_consistency_17n() {
720         local mdt_index
721         local rc=0
722
723         # create/unlink in 17n only change 2 MDTs(MDT1/MDT2),
724         # so it only check MDT1/MDT2 instead of all of MDTs.
725         for mdt_index in 1 2; do
726                 # e2fsck should not return error
727                 stop mds${mdt_index}
728                 local devname=$(mdsdevname $mdt_index)
729                 run_e2fsck $(facet_active_host mds$mdt_index) $devname -n ||
730                         rc=$((rc + $?))
731
732                 start mds${mdt_index} $devname $MDS_MOUNT_OPTS ||
733                         error "mount mds$mdt_index failed"
734                 df $MOUNT > /dev/null 2>&1
735         done
736         return $rc
737 }
738
739 test_17n() {
740         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
741         [ $PARALLEL == "yes" ] && skip "skip parallel run"
742         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
743         remote_mds_nodsh && skip "remote MDS with nodsh"
744         [ $MDS1_VERSION -ge $(version_code 2.2.0) ] &&
745         [ $MDS1_VERSION -le $(version_code 2.2.93) ] &&
746                 skip "MDS 2.2.0-2.2.93 do not NUL-terminate symlinks"
747
748         local i
749
750         test_mkdir $DIR/$tdir
751         for ((i=0; i<10; i++)); do
752                 $LFS mkdir -i1 -c2 $DIR/$tdir/remote_dir_${i} ||
753                         error "create remote dir error $i"
754                 createmany -o $DIR/$tdir/remote_dir_${i}/f 10 ||
755                         error "create files under remote dir failed $i"
756         done
757
758         check_fs_consistency_17n ||
759                 error "e2fsck report error after create files under remote dir"
760
761         for ((i = 0; i < 10; i++)); do
762                 rm -rf $DIR/$tdir/remote_dir_${i} ||
763                         error "destroy remote dir error $i"
764         done
765
766         check_fs_consistency_17n ||
767                 error "e2fsck report error after unlink files under remote dir"
768
769         [ $MDS1_VERSION -lt $(version_code 2.4.50) ] &&
770                 skip "lustre < 2.4.50 does not support migrate mv"
771
772         for ((i = 0; i < 10; i++)); do
773                 mkdir -p $DIR/$tdir/remote_dir_${i}
774                 createmany -o $DIR/$tdir/remote_dir_${i}/f 10 ||
775                         error "create files under remote dir failed $i"
776                 $LFS migrate --mdt-index 1 $DIR/$tdir/remote_dir_${i} ||
777                         error "migrate remote dir error $i"
778         done
779         check_fs_consistency_17n || error "e2fsck report error after migration"
780
781         for ((i = 0; i < 10; i++)); do
782                 rm -rf $DIR/$tdir/remote_dir_${i} ||
783                         error "destroy remote dir error $i"
784         done
785
786         check_fs_consistency_17n || error "e2fsck report error after unlink"
787 }
788 run_test 17n "run e2fsck against master/slave MDT which contains remote dir"
789
790 test_17o() {
791         remote_mds_nodsh && skip "remote MDS with nodsh"
792         [ $MDS1_VERSION -lt $(version_code 2.3.64) ] &&
793                 skip "Need MDS version at least 2.3.64"
794
795         local wdir=$DIR/${tdir}o
796         local mdt_index
797         local rc=0
798
799         test_mkdir $wdir
800         touch $wdir/$tfile
801         mdt_index=$($LFS getstripe -m $wdir/$tfile)
802         mdt_index=$((mdt_index + 1))
803
804         cancel_lru_locks mdc
805         #fail mds will wait the failover finish then set
806         #following fail_loc to avoid interfer the recovery process.
807         fail mds${mdt_index}
808
809         #define OBD_FAIL_OSD_LMA_INCOMPAT 0x194
810         do_facet mds${mdt_index} lctl set_param fail_loc=0x194
811         ls -l $wdir/$tfile && rc=1
812         do_facet mds${mdt_index} lctl set_param fail_loc=0
813         [[ $rc -eq 0 ]] || error "stat file should fail"
814 }
815 run_test 17o "stat file with incompat LMA feature"
816
817 test_18() {
818         touch $DIR/$tfile || error "Failed to touch $DIR/$tfile: $?"
819         ls $DIR || error "Failed to ls $DIR: $?"
820 }
821 run_test 18 "touch .../f ; ls ... =============================="
822
823 test_19a() {
824         touch $DIR/$tfile
825         ls -l $DIR
826         rm $DIR/$tfile
827         $CHECKSTAT -a $DIR/$tfile || error "$tfile was not removed"
828 }
829 run_test 19a "touch .../f19 ; ls -l ... ; rm .../f19 ==========="
830
831 test_19b() {
832         ls -l $DIR/$tfile && error "ls -l $tfile failed"|| true
833 }
834 run_test 19b "ls -l .../f19 (should return error) =============="
835
836 test_19c() {
837         [ $RUNAS_ID -eq $UID ] &&
838                 skip_env "RUNAS_ID = UID = $UID -- skipping"
839
840         $RUNAS touch $DIR/$tfile && error "create non-root file failed" || true
841 }
842 run_test 19c "$RUNAS touch .../f19 (should return error) =="
843
844 test_19d() {
845         cat $DIR/f19 && error || true
846 }
847 run_test 19d "cat .../f19 (should return error) =============="
848
849 test_20() {
850         touch $DIR/$tfile
851         rm $DIR/$tfile
852         touch $DIR/$tfile
853         rm $DIR/$tfile
854         touch $DIR/$tfile
855         rm $DIR/$tfile
856         $CHECKSTAT -a $DIR/$tfile || error "$tfile was not removed"
857 }
858 run_test 20 "touch .../f ; ls -l ..."
859
860 test_21() {
861         test_mkdir $DIR/$tdir
862         [ -f $DIR/$tdir/dangle ] && rm -f $DIR/$tdir/dangle
863         ln -s dangle $DIR/$tdir/link
864         echo foo >> $DIR/$tdir/link
865         cat $DIR/$tdir/dangle
866         $CHECKSTAT -t link $DIR/$tdir/link || error "$tdir/link not a link"
867         $CHECKSTAT -f -t file $DIR/$tdir/link ||
868                 error "$tdir/link not linked to a file"
869 }
870 run_test 21 "write to dangling link"
871
872 test_22() {
873         local wdir=$DIR/$tdir
874         test_mkdir $wdir
875         chown $RUNAS_ID:$RUNAS_GID $wdir
876         (cd $wdir || error "cd $wdir failed";
877                 $RUNAS tar cf - /etc/hosts /etc/sysconfig/network |
878                 $RUNAS tar xf -)
879         ls -lR $wdir/etc || error "ls -lR $wdir/etc failed"
880         $CHECKSTAT -t dir $wdir/etc || error "checkstat -t dir failed"
881         $CHECKSTAT -u \#$RUNAS_ID -g \#$RUNAS_GID $wdir/etc ||
882                 error "checkstat -u failed"
883 }
884 run_test 22 "unpack tar archive as non-root user"
885
886 # was test_23
887 test_23a() {
888         test_mkdir $DIR/$tdir
889         local file=$DIR/$tdir/$tfile
890
891         openfile -f O_CREAT:O_EXCL $file || error "$file create failed"
892         openfile -f O_CREAT:O_EXCL $file &&
893                 error "$file recreate succeeded" || true
894 }
895 run_test 23a "O_CREAT|O_EXCL in subdir"
896
897 test_23b() { # bug 18988
898         test_mkdir $DIR/$tdir
899         local file=$DIR/$tdir/$tfile
900
901         rm -f $file
902         echo foo > $file || error "write filed"
903         echo bar >> $file || error "append filed"
904         $CHECKSTAT -s 8 $file || error "wrong size"
905         rm $file
906 }
907 run_test 23b "O_APPEND check"
908
909 # LU-9409, size with O_APPEND and tiny writes
910 test_23c() {
911         local file=$DIR/$tfile
912
913         # single dd
914         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=8 count=800
915         $CHECKSTAT -s 6400 $file || error "wrong size, expected 6400"
916         rm -f $file
917
918         # racing tiny writes
919         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=8 count=800 &
920         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=8 count=800 &
921         wait
922         $CHECKSTAT -s 12800 $file || error "wrong size, expected 12800"
923         rm -f $file
924
925         #racing tiny & normal writes
926         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=4096 count=4 &
927         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=8 count=100 &
928         wait
929         $CHECKSTAT -s 17184 $file || error "wrong size, expected 17184"
930         rm -f $file
931
932         #racing tiny & normal writes 2, ugly numbers
933         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=4099 count=11 &
934         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=17 count=173 &
935         wait
936         $CHECKSTAT -s 48030 $file || error "wrong size, expected 48030"
937         rm -f $file
938 }
939 run_test 23c "O_APPEND size checks for tiny writes"
940
941 # LU-11069 file offset is correct after appending writes
942 test_23d() {
943         local file=$DIR/$tfile
944         local offset
945
946         echo CentaurHauls > $file
947         offset=$($MULTIOP $file oO_WRONLY:O_APPEND:w13Zp)
948         if ((offset != 26)); then
949                 error "wrong offset, expected 26, got '$offset'"
950         fi
951 }
952 run_test 23d "file offset is correct after appending writes"
953
954 # rename sanity
955 test_24a() {
956         echo '-- same directory rename'
957         test_mkdir $DIR/$tdir
958         touch $DIR/$tdir/$tfile.1
959         mv $DIR/$tdir/$tfile.1 $DIR/$tdir/$tfile.2
960         $CHECKSTAT -t file $DIR/$tdir/$tfile.2 || error "$tfile.2 not a file"
961 }
962 run_test 24a "rename file to non-existent target"
963
964 test_24b() {
965         test_mkdir $DIR/$tdir
966         touch $DIR/$tdir/$tfile.{1,2}
967         mv $DIR/$tdir/$tfile.1 $DIR/$tdir/$tfile.2
968         $CHECKSTAT -a $DIR/$tdir/$tfile.1 || error "$tfile.1 exists"
969         $CHECKSTAT -t file $DIR/$tdir/$tfile.2 || error "$tfile.2 not a file"
970 }
971 run_test 24b "rename file to existing target"
972
973 test_24c() {
974         test_mkdir $DIR/$tdir
975         test_mkdir $DIR/$tdir/d$testnum.1
976         mv $DIR/$tdir/d$testnum.1 $DIR/$tdir/d$testnum.2
977         $CHECKSTAT -a $DIR/$tdir/d$testnum.1 || error "d$testnum.1 exists"
978         $CHECKSTAT -t dir $DIR/$tdir/d$testnum.2 || error "d$testnum.2 not dir"
979 }
980 run_test 24c "rename directory to non-existent target"
981
982 test_24d() {
983         test_mkdir -c1 $DIR/$tdir
984         test_mkdir -c1 $DIR/$tdir/d$testnum.1
985         test_mkdir -c1 $DIR/$tdir/d$testnum.2
986         mrename $DIR/$tdir/d$testnum.1 $DIR/$tdir/d$testnum.2
987         $CHECKSTAT -a $DIR/$tdir/d$testnum.1 || error "d$testnum.1 exists"
988         $CHECKSTAT -t dir $DIR/$tdir/d$testnum.2 || error "d$testnum.2 not dir"
989 }
990 run_test 24d "rename directory to existing target"
991
992 test_24e() {
993         echo '-- cross directory renames --'
994         test_mkdir $DIR/R5a
995         test_mkdir $DIR/R5b
996         touch $DIR/R5a/f
997         mv $DIR/R5a/f $DIR/R5b/g
998         $CHECKSTAT -a $DIR/R5a/f || error "$DIR/R5a/f exists"
999         $CHECKSTAT -t file $DIR/R5b/g || error "$DIR/R5b/g not file type"
1000 }
1001 run_test 24e "touch .../R5a/f; rename .../R5a/f .../R5b/g ======"
1002
1003 test_24f() {
1004         test_mkdir $DIR/R6a
1005         test_mkdir $DIR/R6b
1006         touch $DIR/R6a/f $DIR/R6b/g
1007         mv $DIR/R6a/f $DIR/R6b/g
1008         $CHECKSTAT -a $DIR/R6a/f || error "$DIR/R6a/f exists"
1009         $CHECKSTAT -t file $DIR/R6b/g || error "$DIR/R6b/g not file type"
1010 }
1011 run_test 24f "touch .../R6a/f R6b/g; mv .../R6a/f .../R6b/g ===="
1012
1013 test_24g() {
1014         test_mkdir $DIR/R7a
1015         test_mkdir $DIR/R7b
1016         test_mkdir $DIR/R7a/d
1017         mv $DIR/R7a/d $DIR/R7b/e
1018         $CHECKSTAT -a $DIR/R7a/d || error "$DIR/R7a/d exists"
1019         $CHECKSTAT -t dir $DIR/R7b/e || error "$DIR/R7b/e not dir type"
1020 }
1021 run_test 24g "mkdir .../R7{a,b}/d; mv .../R7a/d .../R7b/e ======"
1022
1023 test_24h() {
1024         test_mkdir -c1 $DIR/R8a
1025         test_mkdir -c1 $DIR/R8b
1026         test_mkdir -c1 $DIR/R8a/d
1027         test_mkdir -c1 $DIR/R8b/e
1028         mrename $DIR/R8a/d $DIR/R8b/e
1029         $CHECKSTAT -a $DIR/R8a/d || error "$DIR/R8a/d exists"
1030         $CHECKSTAT -t dir $DIR/R8b/e || error "$DIR/R8b/e not dir type"
1031 }
1032 run_test 24h "mkdir .../R8{a,b}/{d,e}; rename .../R8a/d .../R8b/e"
1033
1034 test_24i() {
1035         echo "-- rename error cases"
1036         test_mkdir $DIR/R9
1037         test_mkdir $DIR/R9/a
1038         touch $DIR/R9/f
1039         mrename $DIR/R9/f $DIR/R9/a
1040         $CHECKSTAT -t file $DIR/R9/f || error "$DIR/R9/f not file type"
1041         $CHECKSTAT -t dir  $DIR/R9/a || error "$DIR/R9/a not dir type"
1042         $CHECKSTAT -a $DIR/R9/a/f || error "$DIR/R9/a/f exists"
1043 }
1044 run_test 24i "rename file to dir error: touch f ; mkdir a ; rename f a"
1045
1046 test_24j() {
1047         test_mkdir $DIR/R10
1048         mrename $DIR/R10/f $DIR/R10/g
1049         $CHECKSTAT -t dir $DIR/R10 || error "$DIR/R10 not dir type"
1050         $CHECKSTAT -a $DIR/R10/f || error "$DIR/R10/f exists"
1051         $CHECKSTAT -a $DIR/R10/g || error "$DIR/R10/g exists"
1052 }
1053 run_test 24j "source does not exist ============================"
1054
1055 test_24k() {
1056         test_mkdir $DIR/R11a
1057         test_mkdir $DIR/R11a/d
1058         touch $DIR/R11a/f
1059         mv $DIR/R11a/f $DIR/R11a/d
1060         $CHECKSTAT -a $DIR/R11a/f || error "$DIR/R11a/f exists"
1061         $CHECKSTAT -t file $DIR/R11a/d/f || error "$DIR/R11a/d/f not file type"
1062 }
1063 run_test 24k "touch .../R11a/f; mv .../R11a/f .../R11a/d ======="
1064
1065 # bug 2429 - rename foo foo foo creates invalid file
1066 test_24l() {
1067         f="$DIR/f24l"
1068         $MULTIOP $f OcNs || error "rename of ${f} to itself failed"
1069 }
1070 run_test 24l "Renaming a file to itself ========================"
1071
1072 test_24m() {
1073         f="$DIR/f24m"
1074         $MULTIOP $f OcLN ${f}2 ${f}2 || error "link ${f}2 ${f}2 failed"
1075         # on ext3 this does not remove either the source or target files
1076         # though the "expected" operation would be to remove the source
1077         $CHECKSTAT -t file ${f} || error "${f} missing"
1078         $CHECKSTAT -t file ${f}2 || error "${f}2 missing"
1079 }
1080 run_test 24m "Renaming a file to a hard link to itself ========="
1081
1082 test_24n() {
1083     f="$DIR/f24n"
1084     # this stats the old file after it was renamed, so it should fail
1085     touch ${f}
1086     $CHECKSTAT ${f} || error "${f} missing"
1087     mv ${f} ${f}.rename
1088     $CHECKSTAT ${f}.rename || error "${f}.rename missing"
1089     $CHECKSTAT -a ${f} || error "${f} exists"
1090 }
1091 run_test 24n "Statting the old file after renaming (Posix rename 2)"
1092
1093 test_24o() {
1094         test_mkdir $DIR/$tdir
1095         rename_many -s random -v -n 10 $DIR/$tdir
1096 }
1097 run_test 24o "rename of files during htree split"
1098
1099 test_24p() {
1100         test_mkdir $DIR/R12a
1101         test_mkdir $DIR/R12b
1102         DIRINO=`ls -lid $DIR/R12a | awk '{ print $1 }'`
1103         mrename $DIR/R12a $DIR/R12b
1104         $CHECKSTAT -a $DIR/R12a || error "$DIR/R12a exists"
1105         $CHECKSTAT -t dir $DIR/R12b || error "$DIR/R12b not dir type"
1106         DIRINO2=`ls -lid $DIR/R12b | awk '{ print $1 }'`
1107         [ "$DIRINO" = "$DIRINO2" ] || error "R12a $DIRINO != R12b $DIRINO2"
1108 }
1109 run_test 24p "mkdir .../R12{a,b}; rename .../R12a .../R12b"
1110
1111 cleanup_multiop_pause() {
1112         trap 0
1113         kill -USR1 $MULTIPID
1114 }
1115
1116 test_24q() {
1117         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1118
1119         test_mkdir $DIR/R13a
1120         test_mkdir $DIR/R13b
1121         local DIRINO=$(ls -lid $DIR/R13a | awk '{ print $1 }')
1122         multiop_bg_pause $DIR/R13b D_c || error "multiop failed to start"
1123         MULTIPID=$!
1124
1125         trap cleanup_multiop_pause EXIT
1126         mrename $DIR/R13a $DIR/R13b
1127         $CHECKSTAT -a $DIR/R13a || error "R13a still exists"
1128         $CHECKSTAT -t dir $DIR/R13b || error "R13b does not exist"
1129         local DIRINO2=$(ls -lid $DIR/R13b | awk '{ print $1 }')
1130         [ "$DIRINO" = "$DIRINO2" ] || error "R13a $DIRINO != R13b $DIRINO2"
1131         cleanup_multiop_pause
1132         wait $MULTIPID || error "multiop close failed"
1133 }
1134 run_test 24q "mkdir .../R13{a,b}; open R13b rename R13a R13b ==="
1135
1136 test_24r() { #bug 3789
1137         test_mkdir $DIR/R14a
1138         test_mkdir $DIR/R14a/b
1139         mrename $DIR/R14a $DIR/R14a/b && error "rename to subdir worked!"
1140         $CHECKSTAT -t dir $DIR/R14a || error "$DIR/R14a missing"
1141         $CHECKSTAT -t dir $DIR/R14a/b || error "$DIR/R14a/b missing"
1142 }
1143 run_test 24r "mkdir .../R14a/b; rename .../R14a .../R14a/b ====="
1144
1145 test_24s() {
1146         test_mkdir $DIR/R15a
1147         test_mkdir $DIR/R15a/b
1148         test_mkdir $DIR/R15a/b/c
1149         mrename $DIR/R15a $DIR/R15a/b/c && error "rename to sub-subdir worked!"
1150         $CHECKSTAT -t dir $DIR/R15a || error "$DIR/R15a missing"
1151         $CHECKSTAT -t dir $DIR/R15a/b/c || error "$DIR/R15a/b/c missing"
1152 }
1153 run_test 24s "mkdir .../R15a/b/c; rename .../R15a .../R15a/b/c ="
1154
1155 test_24t() {
1156         test_mkdir $DIR/R16a
1157         test_mkdir $DIR/R16a/b
1158         test_mkdir $DIR/R16a/b/c
1159         mrename $DIR/R16a/b/c $DIR/R16a && error "rename to sub-subdir worked!"
1160         $CHECKSTAT -t dir $DIR/R16a || error "$DIR/R16a missing"
1161         $CHECKSTAT -t dir $DIR/R16a/b/c || error "$DIR/R16a/b/c missing"
1162 }
1163 run_test 24t "mkdir .../R16a/b/c; rename .../R16a/b/c .../R16a ="
1164
1165 test_24u() { # bug12192
1166         $MULTIOP $DIR/$tfile C2w$((2048 * 1024))c || error "multiop failed"
1167         $CHECKSTAT -s $((2048 * 1024)) $DIR/$tfile || error "wrong file size"
1168 }
1169 run_test 24u "create stripe file"
1170
1171 simple_cleanup_common() {
1172         local createmany=$1
1173         local rc=0
1174
1175         [[ -z "$DIR" || -z "$tdir" || ! -d "$DIR/$tdir" ]] && return 0
1176
1177         local start=$SECONDS
1178
1179         [[ -n "$createmany" ]] && unlinkmany $DIR/$tdir/$tfile $createmany
1180         rm -rf $DIR/$tdir || error "cleanup $DIR/$tdir failed"
1181         rc=$?
1182         wait_delete_completed
1183         echo "cleanup time $((SECONDS - start))"
1184         return $rc
1185 }
1186
1187 max_pages_per_rpc() {
1188         local mdtname="$(printf "MDT%04x" ${1:-0})"
1189         $LCTL get_param -n mdc.*$mdtname*.max_pages_per_rpc
1190 }
1191
1192 test_24v() {
1193         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1194
1195         local nrfiles=${COUNT:-100000}
1196         local fname="$DIR/$tdir/$tfile"
1197
1198         # Performance issue on ZFS see LU-4072 (c.f. LU-2887)
1199         [ "$mds1_FSTYPE" = "zfs" ] && nrfiles=${COUNT:-10000}
1200
1201         test_mkdir "$(dirname $fname)"
1202         # assume MDT0000 has the fewest inodes
1203         local stripes=$($LFS getdirstripe -c $(dirname $fname))
1204         local free_inodes=$(($(mdt_free_inodes 0) * ${stripes/#0/1}))
1205         [[ $free_inodes -lt $nrfiles ]] && nrfiles=$free_inodes
1206
1207         stack_trap "simple_cleanup_common $nrfiles"
1208
1209         createmany -m "$fname" $nrfiles
1210
1211         cancel_lru_locks mdc
1212         lctl set_param mdc.*.stats clear
1213
1214         # was previously test_24D: LU-6101
1215         # readdir() returns correct number of entries after cursor reload
1216         local num_ls=$(ls $DIR/$tdir | wc -l)
1217         local num_uniq=$(ls $DIR/$tdir | sort -u | wc -l)
1218         local num_all=$(ls -a $DIR/$tdir | wc -l)
1219         if [ $num_ls -ne $nrfiles ] || [ $num_uniq -ne $nrfiles ] ||
1220                 [ $num_all -ne $((nrfiles + 2)) ]; then
1221                         error "Expected $nrfiles files, got $num_ls " \
1222                                 "($num_uniq unique $num_all .&..)"
1223         fi
1224         # LU-5 large readdir
1225         # dirent_size = 32 bytes for sizeof(struct lu_dirent) +
1226         #               N bytes for name (len($nrfiles) rounded to 8 bytes) +
1227         #               8 bytes for luda_type (4 bytes rounded to 8 bytes)
1228         # take into account of overhead in lu_dirpage header and end mark in
1229         # each page, plus one in rpc_num calculation.
1230         local dirent_size=$((32 + (${#tfile} | 7) + 1 + 8))
1231         local page_entries=$(((PAGE_SIZE - 24) / dirent_size))
1232         local mdt_idx=$($LFS getdirstripe -i $(dirname $fname))
1233         local rpc_pages=$(max_pages_per_rpc $mdt_idx)
1234         local rpc_max=$((nrfiles / (page_entries * rpc_pages) + stripes))
1235         local mds_readpage=$(calc_stats mdc.*.stats mds_readpage)
1236         echo "readpages: $mds_readpage rpc_max: $rpc_max-2/+1"
1237         (( $mds_readpage >= $rpc_max - 2 && $mds_readpage <= $rpc_max + 1)) ||
1238                 error "large readdir doesn't take effect: " \
1239                       "$mds_readpage should be about $rpc_max"
1240 }
1241 run_test 24v "list large directory (test hash collision, b=17560)"
1242
1243 test_24w() { # bug21506
1244         SZ1=234852
1245         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 seek=4096 || return 1
1246         dd if=/dev/zero bs=$SZ1 count=1 >> $DIR/$tfile || return 2
1247         dd if=$DIR/$tfile of=$DIR/${tfile}_left bs=1M skip=4097 || return 3
1248         SZ2=`ls -l $DIR/${tfile}_left | awk '{print $5}'`
1249         [[ "$SZ1" -eq "$SZ2" ]] ||
1250                 error "Error reading at the end of the file $tfile"
1251 }
1252 run_test 24w "Reading a file larger than 4Gb"
1253
1254 test_24x() {
1255         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
1256         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1257         [[ $MDS1_VERSION -lt $(version_code 2.7.56) ]] &&
1258                 skip "Need MDS version at least 2.7.56"
1259
1260         local MDTIDX=1
1261         local remote_dir=$DIR/$tdir/remote_dir
1262
1263         test_mkdir $DIR/$tdir
1264         $LFS mkdir -i $MDTIDX $remote_dir ||
1265                 error "create remote directory failed"
1266
1267         test_mkdir $DIR/$tdir/src_dir
1268         touch $DIR/$tdir/src_file
1269         test_mkdir $remote_dir/tgt_dir
1270         touch $remote_dir/tgt_file
1271
1272         mrename $DIR/$tdir/src_dir $remote_dir/tgt_dir ||
1273                 error "rename dir cross MDT failed!"
1274
1275         mrename $DIR/$tdir/src_file $remote_dir/tgt_file ||
1276                 error "rename file cross MDT failed!"
1277
1278         touch $DIR/$tdir/ln_file
1279         ln $DIR/$tdir/ln_file $remote_dir/ln_name ||
1280                 error "ln file cross MDT failed"
1281
1282         rm -rf $DIR/$tdir || error "Can not delete directories"
1283 }
1284 run_test 24x "cross MDT rename/link"
1285
1286 test_24y() {
1287         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
1288         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1289
1290         local remote_dir=$DIR/$tdir/remote_dir
1291         local mdtidx=1
1292
1293         test_mkdir $DIR/$tdir
1294         $LFS mkdir -i $mdtidx $remote_dir ||
1295                 error "create remote directory failed"
1296
1297         test_mkdir $remote_dir/src_dir
1298         touch $remote_dir/src_file
1299         test_mkdir $remote_dir/tgt_dir
1300         touch $remote_dir/tgt_file
1301
1302         mrename $remote_dir/src_dir $remote_dir/tgt_dir ||
1303                 error "rename subdir in the same remote dir failed!"
1304
1305         mrename $remote_dir/src_file $remote_dir/tgt_file ||
1306                 error "rename files in the same remote dir failed!"
1307
1308         ln $remote_dir/tgt_file $remote_dir/tgt_file1 ||
1309                 error "link files in the same remote dir failed!"
1310
1311         rm -rf $DIR/$tdir || error "Can not delete directories"
1312 }
1313 run_test 24y "rename/link on the same dir should succeed"
1314
1315 test_24z() {
1316         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
1317         [[ $MDS1_VERSION -lt $(version_code 2.12.51) ]] &&
1318                 skip "Need MDS version at least 2.12.51"
1319
1320         local index
1321
1322         for index in 0 1; do
1323                 $LFS mkdir -i $index $DIR/$tdir.$index || error "mkdir failed"
1324                 touch $DIR/$tdir.0/$tfile.$index || error "touch failed"
1325         done
1326
1327         mv $DIR/$tdir.0/$tfile.0 $DIR/$tdir.1 || error "mv $tfile.0 failed"
1328
1329         index=$($LFS getstripe -m $DIR/$tdir.1/$tfile.0)
1330         [ $index -eq 0 ] || error "$tfile.0 is on MDT$index"
1331
1332         local mdts=$(comma_list $(mdts_nodes))
1333
1334         do_nodes $mdts $LCTL set_param mdt.*.enable_remote_rename=0
1335         stack_trap "do_nodes $mdts $LCTL \
1336                 set_param mdt.*.enable_remote_rename=1" EXIT
1337
1338         mv $DIR/$tdir.0/$tfile.1 $DIR/$tdir.1 || error "mv $tfile.1 failed"
1339
1340         index=$($LFS getstripe -m $DIR/$tdir.1/$tfile.1)
1341         [ $index -eq 1 ] || error "$tfile.1 is on MDT$index"
1342 }
1343 run_test 24z "cross-MDT rename is done as cp"
1344
1345 test_24A() { # LU-3182
1346         local NFILES=5000
1347
1348         test_mkdir $DIR/$tdir
1349         stack_trap "simple_cleanup_common $NFILES"
1350         createmany -m $DIR/$tdir/$tfile $NFILES
1351         local t=$(ls $DIR/$tdir | wc -l)
1352         local u=$(ls $DIR/$tdir | sort -u | wc -l)
1353         local v=$(ls -ai $DIR/$tdir | sort -u | wc -l)
1354
1355         (( $t == $NFILES && $u == $NFILES && $v == NFILES + 2 )) ||
1356                 error "Expected $NFILES files, got $t ($u unique $v .&..)"
1357 }
1358 run_test 24A "readdir() returns correct number of entries."
1359
1360 test_24B() { # LU-4805
1361         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
1362
1363         local count
1364
1365         test_mkdir $DIR/$tdir
1366         $LFS setdirstripe -i0 -c$MDSCOUNT $DIR/$tdir/striped_dir/ ||
1367                 error "create striped dir failed"
1368
1369         count=$(ls -ai $DIR/$tdir/striped_dir | wc -l)
1370         [ $count -eq 2 ] || error "Expected 2, got $count"
1371
1372         touch $DIR/$tdir/striped_dir/a
1373
1374         count=$(ls -ai $DIR/$tdir/striped_dir | wc -l)
1375         [ $count -eq 3 ] || error "Expected 3, got $count"
1376
1377         touch $DIR/$tdir/striped_dir/.f
1378
1379         count=$(ls -ai $DIR/$tdir/striped_dir | wc -l)
1380         [ $count -eq 4 ] || error "Expected 4, got $count"
1381
1382         rm -rf $DIR/$tdir || error "Can not delete directories"
1383 }
1384 run_test 24B "readdir for striped dir return correct number of entries"
1385
1386 test_24C() {
1387         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
1388
1389         mkdir $DIR/$tdir
1390         mkdir $DIR/$tdir/d0
1391         mkdir $DIR/$tdir/d1
1392
1393         $LFS setdirstripe -i0 -c$MDSCOUNT $DIR/$tdir/d0/striped_dir ||
1394                 error "create striped dir failed"
1395
1396         cd $DIR/$tdir/d0/striped_dir
1397
1398         local d0_ino=$(ls -i -l -a $DIR/$tdir | grep "d0" | awk '{print $1}')
1399         local d1_ino=$(ls -i -l -a $DIR/$tdir | grep "d1" | awk '{print $1}')
1400         local parent_ino=$(ls -i -l -a | grep "\.\." | awk '{print $1}')
1401
1402         [ "$d0_ino" = "$parent_ino" ] ||
1403                 error ".. wrong, expect $d0_ino, get $parent_ino"
1404
1405         mv $DIR/$tdir/d0/striped_dir $DIR/$tdir/d1/ ||
1406                 error "mv striped dir failed"
1407
1408         parent_ino=$(ls -i -l -a | grep "\.\." | awk '{print $1}')
1409
1410         [ "$d1_ino" = "$parent_ino" ] ||
1411                 error ".. wrong after mv, expect $d1_ino, get $parent_ino"
1412 }
1413 run_test 24C "check .. in striped dir"
1414
1415 test_24E() {
1416         [[ $MDSCOUNT -lt 4 ]] && skip_env "needs >= 4 MDTs"
1417         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1418
1419         mkdir -p $DIR/$tdir
1420         mkdir $DIR/$tdir/src_dir
1421         $LFS mkdir -i 1 $DIR/$tdir/src_dir/src_child ||
1422                 error "create remote source failed"
1423
1424         touch $DIR/$tdir/src_dir/src_child/a
1425
1426         $LFS mkdir -i 2 $DIR/$tdir/tgt_dir ||
1427                 error "create remote target dir failed"
1428
1429         $LFS mkdir -i 3 $DIR/$tdir/tgt_dir/tgt_child ||
1430                 error "create remote target child failed"
1431
1432         mrename $DIR/$tdir/src_dir/src_child $DIR/$tdir/tgt_dir/tgt_child ||
1433                 error "rename dir cross MDT failed!"
1434
1435         find $DIR/$tdir
1436
1437         $CHECKSTAT -t dir $DIR/$tdir/src_dir/src_child &&
1438                 error "src_child still exists after rename"
1439
1440         $CHECKSTAT -t file $DIR/$tdir/tgt_dir/tgt_child/a ||
1441                 error "missing file(a) after rename"
1442
1443         rm -rf $DIR/$tdir || error "Can not delete directories"
1444 }
1445 run_test 24E "cross MDT rename/link"
1446
1447 test_24F () {
1448         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return 0
1449
1450         local repeats=1000
1451         [ "$SLOW" = "no" ] && repeats=100
1452
1453         mkdir -p $DIR/$tdir
1454
1455         echo "$repeats repeats"
1456         for ((i = 0; i < repeats; i++)); do
1457                 $LFS mkdir -i0 -c2 $DIR/$tdir/test || error "mkdir fails"
1458                 touch $DIR/$tdir/test/a || error "touch fails"
1459                 mkdir $DIR/$tdir/test/b || error "mkdir fails"
1460                 rm -rf $DIR/$tdir/test || error "rmdir fails"
1461         done
1462
1463         true
1464 }
1465 run_test 24F "hash order vs readdir (LU-11330)"
1466
1467 test_24G () {
1468         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
1469
1470         local ino1
1471         local ino2
1472
1473         $LFS mkdir -i 0 $DIR/$tdir-0 || error "mkdir $tdir-0"
1474         $LFS mkdir -i 1 $DIR/$tdir-1 || error "mkdir $tdir-1"
1475         touch $DIR/$tdir-0/f1 || error "touch f1"
1476         ln -s $DIR/$tdir-0/f1 $DIR/$tdir-0/s1 || error "ln s1"
1477         ino1=$(stat -c%i $DIR/$tdir-0/s1)
1478         mv $DIR/$tdir-0/s1 $DIR/$tdir-1 || error "mv s1"
1479         ino2=$(stat -c%i $DIR/$tdir-1/s1)
1480         [ $ino1 -ne $ino2 ] || error "s1 should be migrated"
1481 }
1482 run_test 24G "migrate symlink in rename"
1483
1484 test_24H() {
1485         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
1486         [[ $(hostname) != $(facet_active_host mds2) ]] ||
1487                 skip "MDT1 should be on another node"
1488
1489         test_mkdir -i 1 -c 1 $DIR/$tdir
1490 #define OBD_FAIL_FLD_QUERY_REQ           0x1103
1491         do_facet mds2 $LCTL set_param fail_loc=0x80001103
1492         touch $DIR/$tdir/$tfile || error "touch failed"
1493 }
1494 run_test 24H "repeat FLD_QUERY rpc"
1495
1496 test_25a() {
1497         echo '== symlink sanity ============================================='
1498
1499         test_mkdir $DIR/d25
1500         ln -s d25 $DIR/s25
1501         touch $DIR/s25/foo ||
1502                 error "File creation in symlinked directory failed"
1503 }
1504 run_test 25a "create file in symlinked directory ==============="
1505
1506 test_25b() {
1507         [ ! -d $DIR/d25 ] && test_25a
1508         $CHECKSTAT -t file $DIR/s25/foo || error "$DIR/s25/foo not file type"
1509 }
1510 run_test 25b "lookup file in symlinked directory ==============="
1511
1512 test_26a() {
1513         test_mkdir $DIR/d26
1514         test_mkdir $DIR/d26/d26-2
1515         ln -s d26/d26-2 $DIR/s26
1516         touch $DIR/s26/foo || error "File creation failed"
1517 }
1518 run_test 26a "multiple component symlink ======================="
1519
1520 test_26b() {
1521         test_mkdir -p $DIR/$tdir/d26-2
1522         ln -s $tdir/d26-2/foo $DIR/s26-2
1523         touch $DIR/s26-2 || error "File creation failed"
1524 }
1525 run_test 26b "multiple component symlink at end of lookup ======"
1526
1527 test_26c() {
1528         test_mkdir $DIR/d26.2
1529         touch $DIR/d26.2/foo
1530         ln -s d26.2 $DIR/s26.2-1
1531         ln -s s26.2-1 $DIR/s26.2-2
1532         ln -s s26.2-2 $DIR/s26.2-3
1533         chmod 0666 $DIR/s26.2-3/foo
1534 }
1535 run_test 26c "chain of symlinks"
1536
1537 # recursive symlinks (bug 439)
1538 test_26d() {
1539         ln -s d26-3/foo $DIR/d26-3
1540 }
1541 run_test 26d "create multiple component recursive symlink"
1542
1543 test_26e() {
1544         [ ! -h $DIR/d26-3 ] && test_26d
1545         rm $DIR/d26-3
1546 }
1547 run_test 26e "unlink multiple component recursive symlink"
1548
1549 # recursive symlinks (bug 7022)
1550 test_26f() {
1551         test_mkdir $DIR/$tdir
1552         test_mkdir $DIR/$tdir/$tfile
1553         cd $DIR/$tdir/$tfile           || error "cd $DIR/$tdir/$tfile failed"
1554         test_mkdir -p lndir/bar1
1555         test_mkdir $DIR/$tdir/$tfile/$tfile
1556         cd $tfile                || error "cd $tfile failed"
1557         ln -s .. dotdot          || error "ln dotdot failed"
1558         ln -s dotdot/lndir lndir || error "ln lndir failed"
1559         cd $DIR/$tdir                 || error "cd $DIR/$tdir failed"
1560         output=`ls $tfile/$tfile/lndir/bar1`
1561         [ "$output" = bar1 ] && error "unexpected output"
1562         rm -r $tfile             || error "rm $tfile failed"
1563         $CHECKSTAT -a $DIR/$tfile || error "$tfile not gone"
1564 }
1565 run_test 26f "rm -r of a directory which has recursive symlink"
1566
1567 test_27a() {
1568         test_mkdir $DIR/$tdir
1569         $LFS getstripe $DIR/$tdir
1570         $LFS setstripe -c 1 $DIR/$tdir/$tfile || error "setstripe failed"
1571         $CHECKSTAT -t file $DIR/$tdir/$tfile || error "checkstat failed"
1572         cp /etc/hosts $DIR/$tdir/$tfile || error "Can't copy to one stripe file"
1573 }
1574 run_test 27a "one stripe file"
1575
1576 test_27b() {
1577         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1578
1579         test_mkdir $DIR/$tdir
1580         $LFS setstripe -c 2 $DIR/$tdir/$tfile || error "setstripe failed"
1581         $LFS getstripe -c $DIR/$tdir/$tfile
1582         [ $($LFS getstripe -c $DIR/$tdir/$tfile) -eq 2 ] ||
1583                 error "two-stripe file doesn't have two stripes"
1584
1585         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=4k count=4 || error "dd failed"
1586 }
1587 run_test 27b "create and write to two stripe file"
1588
1589 # 27c family tests specific striping, setstripe -o
1590 test_27ca() {
1591         [[ $OSTCOUNT -lt 2 ]] && skip_env "skipping 2-stripe test"
1592         test_mkdir -p $DIR/$tdir
1593         local osts="1"
1594
1595         $LFS setstripe -o $osts $DIR/$tdir/$tfile  || error "setstripe failed"
1596         $LFS getstripe -i $DIR/$tdir/$tfile
1597         [ $($LFS getstripe -i $DIR/$tdir/$tfile ) -eq $osts ] ||
1598                 error "stripe not on specified OST"
1599
1600         dd if=/dev/zero of=$DIR/$tdir/$tfile  bs=1M count=4 || error "dd failed"
1601 }
1602 run_test 27ca "one stripe on specified OST"
1603
1604 test_27cb() {
1605         [[ $OSTCOUNT -lt 2 ]] && skip_env "skipping 2-stripe test"
1606         test_mkdir -p $DIR/$tdir
1607         local osts="1,0"
1608         $LFS setstripe -o $osts $DIR/$tdir/$tfile || error "setstripe failed"
1609         local getstripe=$($LFS getstripe $DIR/$tdir/$tfile)
1610         echo "$getstripe"
1611
1612         # Strip getstripe output to a space separated list of OSTs
1613         local getstripe_osts=$(echo "$getstripe" | sed -e '1,/obdidx/d' |\
1614                 awk '{print $1}' | tr '\n' ' ' | sed -e 's/[[:space:]]*$//')
1615         [ "$getstripe_osts" = "${osts//,/ }" ] ||
1616                 error "stripes not on specified OSTs"
1617
1618         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 || error "dd failed"
1619 }
1620 run_test 27cb "two stripes on specified OSTs"
1621
1622 test_27cc() {
1623         [[ $OSTCOUNT -lt 2 ]] && skip_env "skipping 2-stripe test"
1624         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
1625                 skip "server does not support overstriping"
1626
1627         test_mkdir -p $DIR/$tdir
1628         local osts="0,0"
1629         $LFS setstripe -o $osts $DIR/$tdir/$tfile || error "setstripe failed"
1630         local getstripe=$($LFS getstripe $DIR/$tdir/$tfile)
1631         echo "$getstripe"
1632
1633         # Strip getstripe output to a space separated list of OSTs
1634         local getstripe_osts=$(echo "$getstripe" | sed -e '1,/obdidx/d' |\
1635                 awk '{print $1}' | tr '\n' ' ' | sed -e 's/[[:space:]]*$//')
1636         [ "$getstripe_osts" = "${osts//,/ }" ] ||
1637                 error "stripes not on specified OSTs"
1638
1639         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 || error "dd failed"
1640 }
1641 run_test 27cc "two stripes on the same OST"
1642
1643 test_27cd() {
1644         [[ $OSTCOUNT -lt 2 ]] && skip_env "skipping 2-stripe test"
1645         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
1646                 skip "server does not support overstriping"
1647         test_mkdir -p $DIR/$tdir
1648         local osts="0,1,1,0"
1649         $LFS setstripe -o $osts $DIR/$tdir/$tfile || error "setstripe failed"
1650         local getstripe=$($LFS getstripe $DIR/$tdir/$tfile)
1651         echo "$getstripe"
1652
1653         # Strip getstripe output to a space separated list of OSTs
1654         local getstripe_osts=$(echo "$getstripe" | sed -e '1,/obdidx/d' |\
1655                 awk '{print $1}' | tr '\n' ' ' | sed -e 's/[[:space:]]*$//')
1656         [ "$getstripe_osts" = "${osts//,/ }" ] ||
1657                 error "stripes not on specified OSTs"
1658
1659         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 || error "dd failed"
1660 }
1661 run_test 27cd "four stripes on two OSTs"
1662
1663 test_27ce() {
1664         [[ $OSTCOUNT -ge $(($LOV_MAX_STRIPE_COUNT / 2)) ]] &&
1665                 skip_env "too many osts, skipping"
1666         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
1667                 skip "server does not support overstriping"
1668         # We do one more stripe than we have OSTs
1669         [ $OSTCOUNT -lt 159 ] || large_xattr_enabled ||
1670                 skip_env "ea_inode feature disabled"
1671
1672         test_mkdir -p $DIR/$tdir
1673         local osts=""
1674         for i in $(seq 0 $OSTCOUNT);
1675         do
1676                 osts=$osts"0"
1677                 if [ $i -ne $OSTCOUNT ]; then
1678                         osts=$osts","
1679                 fi
1680         done
1681         $LFS setstripe -o $osts $DIR/$tdir/$tfile || error "setstripe failed"
1682         local getstripe=$($LFS getstripe $DIR/$tdir/$tfile)
1683         echo "$getstripe"
1684
1685         # Strip getstripe output to a space separated list of OSTs
1686         local getstripe_osts=$(echo "$getstripe" | sed -e '1,/obdidx/d' |\
1687                 awk '{print $1}' | tr '\n' ' ' | sed -e 's/[[:space:]]*$//')
1688         [ "$getstripe_osts" = "${osts//,/ }" ] ||
1689                 error "stripes not on specified OSTs"
1690
1691         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 || error "dd failed"
1692 }
1693 run_test 27ce "more stripes than OSTs with -o"
1694
1695 test_27cf() {
1696         local osp_proc="osp.$FSNAME-OST0000-osc-MDT000*.active"
1697         local pid=0
1698
1699         test_mkdir -p $DIR/$tdir || error "failed to mkdir $DIR/$tdir"
1700         do_facet $SINGLEMDS "$LCTL set_param -n $osp_proc=0"
1701         stack_trap "do_facet $SINGLEMDS $LCTL set_param -n $osp_proc=1" EXIT
1702         wait_update_facet $SINGLEMDS "$LCTL get_param -n $osp_proc | grep 1" ||
1703                 error "failed to set $osp_proc=0"
1704
1705         $LFS setstripe -o 0 $DIR/$tdir/$tfile &
1706         pid=$!
1707         sleep 1
1708         do_facet $SINGLEMDS "$LCTL set_param -n $osp_proc=1"
1709         wait_update_facet $SINGLEMDS "$LCTL get_param -n $osp_proc | grep 0" ||
1710                 error "failed to set $osp_proc=1"
1711         wait $pid
1712         [[ $pid -ne 0 ]] ||
1713                 error "should return error due to $osp_proc=0"
1714 }
1715 run_test 27cf "'setstripe -o' on inactive OSTs should return error"
1716
1717 test_27cg() {
1718         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
1719                 skip "server does not support overstriping"
1720         [[ $mds1_FSTYPE != "ldiskfs" ]] && skip_env "ldiskfs only test"
1721         large_xattr_enabled || skip_env "ea_inode feature disabled"
1722
1723         local osts="0"
1724
1725         for ((i=1;i<1000;i++)); do
1726                 osts+=",$((i % OSTCOUNT))"
1727         done
1728
1729         local mdts=$(comma_list $(mdts_nodes))
1730         local before=$(do_nodes $mdts \
1731                 "$LCTL get_param -n osd-ldiskfs.*MDT*.stats" |
1732                 awk '/many credits/{print $3}' |
1733                 calc_sum)
1734
1735         $LFS setstripe -o $osts $DIR/$tfile || error "setstripe failed"
1736         $LFS getstripe $DIR/$tfile | grep stripe
1737
1738         rm -f $DIR/$tfile || error "can't unlink"
1739
1740         after=$(do_nodes $mdts \
1741                 "$LCTL get_param -n osd-ldiskfs.*MDT*.stats" |
1742                 awk '/many credits/{print $3}' |
1743                 calc_sum)
1744
1745         (( before == after )) ||
1746                 error "too many credits happened: $after > $before"
1747 }
1748 run_test 27cg "1000 shouldn't cause too many credits"
1749
1750 test_27d() {
1751         test_mkdir $DIR/$tdir
1752         $LFS setstripe -c 0 -i -1 -S 0 $DIR/$tdir/$tfile ||
1753                 error "setstripe failed"
1754         $CHECKSTAT -t file $DIR/$tdir/$tfile || error "checkstat failed"
1755         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=4k count=4 || error "dd failed"
1756 }
1757 run_test 27d "create file with default settings"
1758
1759 test_27e() {
1760         # LU-5839 adds check for existed layout before setting it
1761         [[ $MDS1_VERSION -lt $(version_code 2.7.56) ]] &&
1762                 skip "Need MDS version at least 2.7.56"
1763
1764         test_mkdir $DIR/$tdir
1765         $LFS setstripe -c 2 $DIR/$tdir/$tfile || error "setstripe failed"
1766         $LFS setstripe -c 2 $DIR/$tdir/$tfile && error "setstripe worked twice"
1767         $CHECKSTAT -t file $DIR/$tdir/$tfile || error "checkstat failed"
1768 }
1769 run_test 27e "setstripe existing file (should return error)"
1770
1771 test_27f() {
1772         test_mkdir $DIR/$tdir
1773         $LFS setstripe -S 100 -i 0 -c 1 $DIR/$tdir/$tfile &&
1774                 error "$LFS setstripe $DIR/$tdir/$tfile failed"
1775         $CHECKSTAT -t file $DIR/$tdir/$tfile &&
1776                 error "$CHECKSTAT -t file $DIR/$tdir/$tfile should fail"
1777         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=4k count=4 || error "dd failed"
1778         $LFS getstripe $DIR/$tdir/$tfile || error "$LFS getstripe failed"
1779 }
1780 run_test 27f "setstripe with bad stripe size (should return error)"
1781
1782 test_27g() {
1783         test_mkdir $DIR/$tdir
1784         $MCREATE $DIR/$tdir/$tfile || error "mcreate failed"
1785         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "no stripe info" ||
1786                 error "$DIR/$tdir/$tfile has object"
1787 }
1788 run_test 27g "$LFS getstripe with no objects"
1789
1790 test_27ga() {
1791         test_mkdir $DIR/$tdir
1792         touch $DIR/$tdir/$tfile || error "touch failed"
1793         ln -s bogus $DIR/$tdir/$tfile.2 || error "ln failed"
1794         $LFS getstripe -m $DIR/$tdir/$tfile $DIR/$tdir/$tfile.2
1795         local rc=$?
1796         (( rc == 2 )) || error "getstripe did not return ENOENT"
1797 }
1798 run_test 27ga "$LFS getstripe with missing file (should return error)"
1799
1800 test_27i() {
1801         test_mkdir $DIR/$tdir
1802         touch $DIR/$tdir/$tfile || error "touch failed"
1803         [[ $($LFS getstripe -c $DIR/$tdir/$tfile) -gt 0 ]] ||
1804                 error "missing objects"
1805 }
1806 run_test 27i "$LFS getstripe with some objects"
1807
1808 test_27j() {
1809         test_mkdir $DIR/$tdir
1810         $LFS setstripe -i $OSTCOUNT $DIR/$tdir/$tfile &&
1811                 error "setstripe failed" || true
1812 }
1813 run_test 27j "setstripe with bad stripe offset (should return error)"
1814
1815 test_27k() { # bug 2844
1816         test_mkdir $DIR/$tdir
1817         local file=$DIR/$tdir/$tfile
1818         local ll_max_blksize=$((4 * 1024 * 1024))
1819         $LFS setstripe -S 67108864 $file || error "setstripe failed"
1820         local blksize=$(stat $file | awk '/IO Block:/ { print $7 }')
1821         [ $blksize -le $ll_max_blksize ] || error "1:$blksize > $ll_max_blksize"
1822         dd if=/dev/zero of=$file bs=4k count=1
1823         blksize=$(stat $file | awk '/IO Block:/ { print $7 }')
1824         [ $blksize -le $ll_max_blksize ] || error "2:$blksize > $ll_max_blksize"
1825 }
1826 run_test 27k "limit i_blksize for broken user apps"
1827
1828 test_27l() {
1829         mcreate $DIR/$tfile || error "creating file"
1830         $RUNAS $LFS setstripe -c 1 $DIR/$tfile &&
1831                 error "setstripe should have failed" || true
1832 }
1833 run_test 27l "check setstripe permissions (should return error)"
1834
1835 test_27m() {
1836         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1837
1838         [ -n "$RCLIENTS" -o -n "$MOUNT_2" ] &&
1839                 skip_env "multiple clients -- skipping"
1840
1841         ORIGFREE=$($LCTL get_param -n lov.$FSNAME-clilov-*.kbytesavail |
1842                    head -n1)
1843         if [[ $ORIGFREE -gt $MAXFREE ]]; then
1844                 skip "$ORIGFREE > $MAXFREE skipping out-of-space test on OST0"
1845         fi
1846         stack_trap simple_cleanup_common
1847         test_mkdir $DIR/$tdir
1848         $LFS setstripe -i 0 -c 1 $DIR/$tdir/$tfile.1
1849         dd if=/dev/zero of=$DIR/$tdir/$tfile.1 bs=1024 count=$MAXFREE &&
1850                 error "dd should fill OST0"
1851         i=2
1852         while $LFS setstripe -i 0 -c 1 $DIR/$tdir/$tfile.$i; do
1853                 i=$((i + 1))
1854                 [ $i -gt 256 ] && break
1855         done
1856         i=$((i + 1))
1857         touch $DIR/$tdir/$tfile.$i
1858         [ $($LFS getstripe $DIR/$tdir/$tfile.$i | grep -A 10 obdidx |
1859             awk '{print $1}'| grep -w "0") ] &&
1860                 error "OST0 was full but new created file still use it"
1861         i=$((i + 1))
1862         touch $DIR/$tdir/$tfile.$i
1863         [ $($LFS getstripe $DIR/$tdir/$tfile.$i | grep -A 10 obdidx |
1864             awk '{print $1}'| grep -w "0") ] &&
1865                 error "OST0 was full but new created file still use it" || true
1866 }
1867 run_test 27m "create file while OST0 was full"
1868
1869 # OSCs keep a NOSPC flag that will be reset after ~5s (qos_maxage)
1870 # if the OST isn't full anymore.
1871 reset_enospc() {
1872         local ostidx=${1:-""}
1873         local delay
1874         local ready
1875         local get_prealloc
1876
1877         local list=$(comma_list $(osts_nodes))
1878         [ "$ostidx" ] && list=$(facet_host ost$((ostidx + 1)))
1879
1880         do_nodes $list lctl set_param fail_loc=0
1881         wait_delete_completed   # initiate all OST_DESTROYs from MDS to OST
1882         delay=$(do_facet $SINGLEMDS lctl get_param -n lov.*.qos_maxage |
1883                 awk '{print $1 * 2;exit;}')
1884         get_prealloc="$LCTL get_param -n osc.*MDT*.prealloc_status |
1885                         grep -v \"^0$\""
1886         wait_update_facet $SINGLEMDS "$get_prealloc" "" $delay
1887 }
1888
1889 test_27n() {
1890         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1891         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1892         remote_mds_nodsh && skip "remote MDS with nodsh"
1893         remote_ost_nodsh && skip "remote OST with nodsh"
1894
1895         reset_enospc
1896         rm -f $DIR/$tdir/$tfile
1897         exhaust_precreations 0 0x80000215
1898         $LFS setstripe -c -1 $DIR/$tdir || error "setstripe failed"
1899         touch $DIR/$tdir/$tfile || error "touch failed"
1900         $LFS getstripe $DIR/$tdir/$tfile
1901         reset_enospc
1902 }
1903 run_test 27n "create file with some full OSTs"
1904
1905 test_27o() {
1906         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1907         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1908         remote_mds_nodsh && skip "remote MDS with nodsh"
1909         remote_ost_nodsh && skip "remote OST with nodsh"
1910
1911         reset_enospc
1912         rm -f $DIR/$tdir/$tfile
1913         exhaust_all_precreations 0x215
1914
1915         touch $DIR/$tdir/$tfile && error "able to create $DIR/$tdir/$tfile"
1916
1917         reset_enospc
1918         rm -rf $DIR/$tdir/*
1919 }
1920 run_test 27o "create file with all full OSTs (should error)"
1921
1922 function create_and_checktime() {
1923         local fname=$1
1924         local loops=$2
1925         local i
1926
1927         for ((i=0; i < $loops; i++)); do
1928                 local start=$SECONDS
1929                 multiop $fname-$i Oc
1930                 ((SECONDS-start < TIMEOUT)) ||
1931                         error "creation took " $((SECONDS-$start)) && return 1
1932         done
1933 }
1934
1935 test_27oo() {
1936         local mdts=$(comma_list $(mdts_nodes))
1937
1938         [ $MDS1_VERSION -lt $(version_code 2.13.57) ] &&
1939                 skip "Need MDS version at least 2.13.57"
1940
1941         local f0=$DIR/${tfile}-0
1942         local f1=$DIR/${tfile}-1
1943
1944         wait_delete_completed
1945
1946         # refill precreated objects
1947         $LFS setstripe -i0 -c1 $f0
1948
1949         saved=$(do_facet mds1 $LCTL get_param -n lov.*0000*.qos_threshold_rr)
1950         # force QoS allocation policy
1951         do_nodes $mdts $LCTL set_param lov.*.qos_threshold_rr=0%
1952         stack_trap "do_nodes $mdts $LCTL set_param \
1953                 lov.*.qos_threshold_rr=$saved" EXIT
1954         sleep_maxage
1955
1956         # one OST is unavailable, but still have few objects preallocated
1957         stop ost1
1958         stack_trap "start ost1 $(ostdevname 1) $OST_MOUNT_OPTS; \
1959                 rm -rf $f1 $DIR/$tdir*" EXIT
1960
1961         for ((i=0; i < 7; i++)); do
1962                 mkdir $DIR/$tdir$i || error "can't create dir"
1963                 $LFS setstripe -c$((OSTCOUNT-1)) $DIR/$tdir$i ||
1964                         error "can't set striping"
1965         done
1966         for ((i=0; i < 7; i++)); do
1967                 create_and_checktime $DIR/$tdir$i/$tfile 100 &
1968         done
1969         wait
1970 }
1971 run_test 27oo "don't let few threads to reserve too many objects"
1972
1973 test_27p() {
1974         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1975         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1976         remote_mds_nodsh && skip "remote MDS with nodsh"
1977         remote_ost_nodsh && skip "remote OST with nodsh"
1978
1979         reset_enospc
1980         rm -f $DIR/$tdir/$tfile
1981         test_mkdir $DIR/$tdir
1982
1983         $MCREATE $DIR/$tdir/$tfile || error "mcreate failed"
1984         $TRUNCATE $DIR/$tdir/$tfile 80000000 || error "truncate failed"
1985         $CHECKSTAT -s 80000000 $DIR/$tdir/$tfile || error "checkstat failed"
1986
1987         exhaust_precreations 0 0x80000215
1988         echo foo >> $DIR/$tdir/$tfile || error "append failed"
1989         $CHECKSTAT -s 80000004 $DIR/$tdir/$tfile || error "checkstat failed"
1990         $LFS getstripe $DIR/$tdir/$tfile
1991
1992         reset_enospc
1993 }
1994 run_test 27p "append to a truncated file with some full OSTs"
1995
1996 test_27q() {
1997         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1998         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1999         remote_mds_nodsh && skip "remote MDS with nodsh"
2000         remote_ost_nodsh && skip "remote OST with nodsh"
2001
2002         reset_enospc
2003         rm -f $DIR/$tdir/$tfile
2004
2005         mkdir_on_mdt0 $DIR/$tdir
2006         $MCREATE $DIR/$tdir/$tfile || error "mcreate $DIR/$tdir/$tfile failed"
2007         $TRUNCATE $DIR/$tdir/$tfile 80000000 ||
2008                 error "truncate $DIR/$tdir/$tfile failed"
2009         $CHECKSTAT -s 80000000 $DIR/$tdir/$tfile || error "checkstat failed"
2010
2011         exhaust_all_precreations 0x215
2012
2013         echo foo >> $DIR/$tdir/$tfile && error "append succeeded"
2014         $CHECKSTAT -s 80000000 $DIR/$tdir/$tfile || error "checkstat 2 failed"
2015
2016         reset_enospc
2017 }
2018 run_test 27q "append to truncated file with all OSTs full (should error)"
2019
2020 test_27r() {
2021         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2022         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2023         remote_mds_nodsh && skip "remote MDS with nodsh"
2024         remote_ost_nodsh && skip "remote OST with nodsh"
2025
2026         reset_enospc
2027         rm -f $DIR/$tdir/$tfile
2028         exhaust_precreations 0 0x80000215
2029
2030         $LFS setstripe -i 0 -c 2 $DIR/$tdir/$tfile || error "setstripe failed"
2031
2032         reset_enospc
2033 }
2034 run_test 27r "stripe file with some full OSTs (shouldn't LBUG) ="
2035
2036 test_27s() { # bug 10725
2037         test_mkdir $DIR/$tdir
2038         local stripe_size=$((4096 * 1024 * 1024))       # 2^32
2039         local stripe_count=0
2040         [ $OSTCOUNT -eq 1 ] || stripe_count=2
2041         $LFS setstripe -S $stripe_size -c $stripe_count $DIR/$tdir &&
2042                 error "stripe width >= 2^32 succeeded" || true
2043
2044 }
2045 run_test 27s "lsm_xfersize overflow (should error) (bug 10725)"
2046
2047 test_27t() { # bug 10864
2048         WDIR=$(pwd)
2049         WLFS=$(which lfs)
2050         cd $DIR
2051         touch $tfile
2052         $WLFS getstripe $tfile
2053         cd $WDIR
2054 }
2055 run_test 27t "check that utils parse path correctly"
2056
2057 test_27u() { # bug 4900
2058         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2059         remote_mds_nodsh && skip "remote MDS with nodsh"
2060
2061         local index
2062         local list=$(comma_list $(mdts_nodes))
2063
2064 #define OBD_FAIL_MDS_OSC_PRECREATE      0x139
2065         do_nodes $list $LCTL set_param fail_loc=0x139
2066         test_mkdir -p $DIR/$tdir
2067         stack_trap "simple_cleanup_common 1000"
2068         createmany -o $DIR/$tdir/$tfile 1000
2069         do_nodes $list $LCTL set_param fail_loc=0
2070
2071         TLOG=$TMP/$tfile.getstripe
2072         $LFS getstripe $DIR/$tdir > $TLOG
2073         OBJS=$(awk -vobj=0 '($1 == 0) { obj += 1 } END { print obj; }' $TLOG)
2074         [[ $OBJS -gt 0 ]] &&
2075                 error "$OBJS objects created on OST-0. See $TLOG" ||
2076                 rm -f $TLOG
2077 }
2078 run_test 27u "skip object creation on OSC w/o objects"
2079
2080 test_27v() { # bug 4900
2081         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2082         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2083         remote_mds_nodsh && skip "remote MDS with nodsh"
2084         remote_ost_nodsh && skip "remote OST with nodsh"
2085
2086         exhaust_all_precreations 0x215
2087         reset_enospc
2088
2089         $LFS setstripe -c 1 $DIR/$tdir         # 1 stripe / file
2090
2091         touch $DIR/$tdir/$tfile
2092         #define OBD_FAIL_TGT_DELAY_PRECREATE     0x705
2093         # all except ost1
2094         for (( i=1; i < OSTCOUNT; i++ )); do
2095                 do_facet ost$i lctl set_param fail_loc=0x705
2096         done
2097         local START=`date +%s`
2098         createmany -o $DIR/$tdir/$tfile 32
2099
2100         local FINISH=`date +%s`
2101         local TIMEOUT=`lctl get_param -n timeout`
2102         local PROCESS=$((FINISH - START))
2103         [ $PROCESS -ge $((TIMEOUT / 2)) ] && \
2104                error "$FINISH - $START >= $TIMEOUT / 2"
2105         sleep $((TIMEOUT / 2 - PROCESS))
2106         reset_enospc
2107 }
2108 run_test 27v "skip object creation on slow OST"
2109
2110 test_27w() { # bug 10997
2111         test_mkdir $DIR/$tdir
2112         $LFS setstripe -S 65536 $DIR/$tdir/f0 || error "setstripe failed"
2113         [ $($LFS getstripe -S $DIR/$tdir/f0) -ne 65536 ] &&
2114                 error "stripe size $size != 65536" || true
2115         [ $($LFS getstripe -d $DIR/$tdir | grep -c "stripe_count") -eq 0 ] &&
2116                 error "$LFS getstripe -d $DIR/$tdir no 'stripe_count'" || true
2117 }
2118 run_test 27w "check $LFS setstripe -S and getstrip -d options"
2119
2120 test_27wa() {
2121         [[ $OSTCOUNT -lt 2 ]] &&
2122                 skip_env "skipping multiple stripe count/offset test"
2123
2124         test_mkdir $DIR/$tdir
2125         for i in $(seq 1 $OSTCOUNT); do
2126                 offset=$((i - 1))
2127                 $LFS setstripe -c $i -i $offset $DIR/$tdir/f$i ||
2128                         error "setstripe -c $i -i $offset failed"
2129                 count=$($LFS getstripe -c $DIR/$tdir/f$i)
2130                 index=$($LFS getstripe -i $DIR/$tdir/f$i)
2131                 [ $count -ne $i ] && error "stripe count $count != $i" || true
2132                 [ $index -ne $offset ] &&
2133                         error "stripe offset $index != $offset" || true
2134         done
2135 }
2136 run_test 27wa "check $LFS setstripe -c -i options"
2137
2138 test_27x() {
2139         remote_ost_nodsh && skip "remote OST with nodsh"
2140         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2141         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2142
2143         OFFSET=$(($OSTCOUNT - 1))
2144         OSTIDX=0
2145         local OST=$(ostname_from_index $OSTIDX)
2146
2147         test_mkdir $DIR/$tdir
2148         $LFS setstripe -c 1 $DIR/$tdir  # 1 stripe per file
2149         do_facet ost$((OSTIDX + 1)) lctl set_param -n obdfilter.$OST.degraded 1
2150         sleep_maxage
2151         createmany -o $DIR/$tdir/$tfile $OSTCOUNT
2152         for i in $(seq 0 $OFFSET); do
2153                 [ $($LFS getstripe $DIR/$tdir/$tfile$i | grep -A 10 obdidx |
2154                         awk '{print $1}' | grep -w "$OSTIDX") ] &&
2155                 error "OST0 was degraded but new created file still use it"
2156         done
2157         do_facet ost$((OSTIDX + 1)) lctl set_param -n obdfilter.$OST.degraded 0
2158 }
2159 run_test 27x "create files while OST0 is degraded"
2160
2161 test_27y() {
2162         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2163         remote_mds_nodsh && skip "remote MDS with nodsh"
2164         remote_ost_nodsh && skip "remote OST with nodsh"
2165         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2166
2167         local mdtosc=$(get_mdtosc_proc_path $SINGLEMDS $FSNAME-OST0000)
2168         local last_id=$(do_facet $SINGLEMDS lctl get_param -n \
2169                 osp.$mdtosc.prealloc_last_id)
2170         local next_id=$(do_facet $SINGLEMDS lctl get_param -n \
2171                 osp.$mdtosc.prealloc_next_id)
2172         local fcount=$((last_id - next_id))
2173         [[ $fcount -eq 0 ]] && skip "not enough space on OST0"
2174         [[ $fcount -gt $OSTCOUNT ]] && fcount=$OSTCOUNT
2175
2176         local MDS_OSCS=$(do_facet $SINGLEMDS lctl dl |
2177                          awk '/[oO][sS][cC].*md[ts]/ { print $4 }')
2178         local OST_DEACTIVE_IDX=-1
2179         local OSC
2180         local OSTIDX
2181         local OST
2182
2183         for OSC in $MDS_OSCS; do
2184                 OST=$(osc_to_ost $OSC)
2185                 OSTIDX=$(index_from_ostuuid $OST)
2186                 if [ $OST_DEACTIVE_IDX == -1 ]; then
2187                         OST_DEACTIVE_IDX=$OSTIDX
2188                 fi
2189                 if [ $OSTIDX != $OST_DEACTIVE_IDX ]; then
2190                         echo $OSC "is Deactivated:"
2191                         do_facet $SINGLEMDS lctl --device  %$OSC deactivate
2192                 fi
2193         done
2194
2195         OSTIDX=$(index_from_ostuuid $OST)
2196         test_mkdir $DIR/$tdir
2197         $LFS setstripe -c 1 $DIR/$tdir      # 1 stripe / file
2198
2199         for OSC in $MDS_OSCS; do
2200                 OST=$(osc_to_ost $OSC)
2201                 OSTIDX=$(index_from_ostuuid $OST)
2202                 if [ $OSTIDX == $OST_DEACTIVE_IDX ]; then
2203                         echo $OST "is degraded:"
2204                         do_facet ost$((OSTIDX+1)) lctl set_param -n \
2205                                                 obdfilter.$OST.degraded=1
2206                 fi
2207         done
2208
2209         sleep_maxage
2210         createmany -o $DIR/$tdir/$tfile $fcount
2211
2212         for OSC in $MDS_OSCS; do
2213                 OST=$(osc_to_ost $OSC)
2214                 OSTIDX=$(index_from_ostuuid $OST)
2215                 if [ $OSTIDX == $OST_DEACTIVE_IDX ]; then
2216                         echo $OST "is recovered from degraded:"
2217                         do_facet ost$((OSTIDX+1)) lctl set_param -n \
2218                                                 obdfilter.$OST.degraded=0
2219                 else
2220                         do_facet $SINGLEMDS lctl --device %$OSC activate
2221                 fi
2222         done
2223
2224         # all osp devices get activated, hence -1 stripe count restored
2225         local stripe_count=0
2226
2227         # sleep 2*lod_qos_maxage seconds waiting for lod qos to notice osp
2228         # devices get activated.
2229         sleep_maxage
2230         $LFS setstripe -c -1 $DIR/$tfile
2231         stripe_count=$($LFS getstripe -c $DIR/$tfile)
2232         rm -f $DIR/$tfile
2233         [ $stripe_count -ne $OSTCOUNT ] &&
2234                 error "Of $OSTCOUNT OSTs, only $stripe_count is available"
2235         return 0
2236 }
2237 run_test 27y "create files while OST0 is degraded and the rest inactive"
2238
2239 check_seq_oid()
2240 {
2241         log "check file $1"
2242
2243         lmm_count=$($LFS getstripe -c $1)
2244         lmm_seq=$($LFS getstripe -v $1 | awk '/lmm_seq/ { print $2 }')
2245         lmm_oid=$($LFS getstripe -v $1 | awk '/lmm_object_id/ { print $2 }')
2246
2247         local old_ifs="$IFS"
2248         IFS=$'[:]'
2249         fid=($($LFS path2fid $1))
2250         IFS="$old_ifs"
2251
2252         log "FID seq ${fid[1]}, oid ${fid[2]} ver ${fid[3]}"
2253         log "LOV seq $lmm_seq, oid $lmm_oid, count: $lmm_count"
2254
2255         # compare lmm_seq and lu_fid->f_seq
2256         [ $lmm_seq = ${fid[1]} ] || { error "SEQ mismatch"; return 1; }
2257         # compare lmm_object_id and lu_fid->oid
2258         [ $lmm_oid = ${fid[2]} ] || { error "OID mismatch"; return 2; }
2259
2260         # check the trusted.fid attribute of the OST objects of the file
2261         local have_obdidx=false
2262         local stripe_nr=0
2263         $LFS getstripe $1 | while read obdidx oid hex seq; do
2264                 # skip lines up to and including "obdidx"
2265                 [ -z "$obdidx" ] && break
2266                 [ "$obdidx" = "obdidx" ] && have_obdidx=true && continue
2267                 $have_obdidx || continue
2268
2269                 local ost=$((obdidx + 1))
2270                 local dev=$(ostdevname $ost)
2271                 local oid_hex
2272
2273                 log "want: stripe:$stripe_nr ost:$obdidx oid:$oid/$hex seq:$seq"
2274
2275                 seq=$(echo $seq | sed -e "s/^0x//g")
2276                 if [ $seq == 0 ] || [ $(facet_fstype ost$ost) == zfs ]; then
2277                         oid_hex=$(echo $oid)
2278                 else
2279                         oid_hex=$(echo $hex | sed -e "s/^0x//g")
2280                 fi
2281                 local obj_file="O/$seq/d$((oid %32))/$oid_hex"
2282
2283                 local ff=""
2284                 #
2285                 # Don't unmount/remount the OSTs if we don't need to do that.
2286                 # LU-2577 changes filter_fid to be smaller, so debugfs needs
2287                 # update too, until that use mount/ll_decode_filter_fid/mount.
2288                 # Re-enable when debugfs will understand new filter_fid.
2289                 #
2290                 if [ $(facet_fstype ost$ost) == ldiskfs ]; then
2291                         ff=$(do_facet ost$ost "$DEBUGFS -c -R 'stat $obj_file' \
2292                                 $dev 2>/dev/null" | grep "parent=")
2293                 fi
2294                 if [ -z "$ff" ]; then
2295                         stop ost$ost
2296                         mount_fstype ost$ost
2297                         ff=$(do_facet ost$ost $LL_DECODE_FILTER_FID \
2298                                 $(facet_mntpt ost$ost)/$obj_file)
2299                         unmount_fstype ost$ost
2300                         start ost$ost $dev $OST_MOUNT_OPTS
2301                         clients_up
2302                 fi
2303
2304                 [ -z "$ff" ] && error "$obj_file: no filter_fid info"
2305
2306                 echo "$ff" | sed -e 's#.*objid=#got: objid=#'
2307
2308                 # /mnt/O/0/d23/23: objid=23 seq=0 parent=[0x200000400:0x1e:0x1]
2309                 # fid: objid=23 seq=0 parent=[0x200000400:0x1e:0x0] stripe=1
2310                 #
2311                 # fid: parent=[0x200000400:0x1e:0x0] stripe=1 stripe_count=2 \
2312                 #       stripe_size=1048576 component_id=1 component_start=0 \
2313                 #       component_end=33554432
2314                 local ff_parent=$(sed -e 's/.*parent=.//' <<<$ff)
2315                 local ff_pseq=$(cut -d: -f1 <<<$ff_parent)
2316                 local ff_poid=$(cut -d: -f2 <<<$ff_parent)
2317                 local ff_pstripe
2318                 if grep -q 'stripe=' <<<$ff; then
2319                         ff_pstripe=$(sed -e 's/.*stripe=//' -e 's/ .*//' <<<$ff)
2320                 else
2321                         # $LL_DECODE_FILTER_FID does not print "stripe="; look
2322                         # into f_ver in this case.  See comment on ff_parent.
2323                         ff_pstripe=$(cut -d: -f3 <<<$ff_parent | sed -e 's/]//')
2324                 fi
2325
2326                 # compare lmm_seq and filter_fid->ff_parent.f_seq
2327                 [ $ff_pseq = $lmm_seq ] ||
2328                         error "FF parent SEQ $ff_pseq != $lmm_seq"
2329                 # compare lmm_object_id and filter_fid->ff_parent.f_oid
2330                 [ $ff_poid = $lmm_oid ] ||
2331                         error "FF parent OID $ff_poid != $lmm_oid"
2332                 (($ff_pstripe == $stripe_nr)) ||
2333                         error "FF stripe $ff_pstripe != $stripe_nr"
2334
2335                 stripe_nr=$((stripe_nr + 1))
2336                 [ $CLIENT_VERSION -lt $(version_code 2.9.55) ] &&
2337                         continue
2338                 if grep -q 'stripe_count=' <<<$ff; then
2339                         local ff_scnt=$(sed -e 's/.*stripe_count=//' \
2340                                             -e 's/ .*//' <<<$ff)
2341                         [ $lmm_count = $ff_scnt ] ||
2342                                 error "FF stripe count $lmm_count != $ff_scnt"
2343                 fi
2344         done
2345 }
2346
2347 test_27z() {
2348         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2349         remote_ost_nodsh && skip "remote OST with nodsh"
2350
2351         test_mkdir $DIR/$tdir
2352         $LFS setstripe -c 1 -i 0 -S 64k $DIR/$tdir/$tfile-1 ||
2353                 { error "setstripe -c -1 failed"; return 1; }
2354         # We need to send a write to every object to get parent FID info set.
2355         # This _should_ also work for setattr, but does not currently.
2356         # touch $DIR/$tdir/$tfile-1 ||
2357         dd if=/dev/zero of=$DIR/$tdir/$tfile-1 bs=1M count=1 ||
2358                 { error "dd $tfile-1 failed"; return 2; }
2359         $LFS setstripe -c -1 -i $((OSTCOUNT - 1)) -S 1M $DIR/$tdir/$tfile-2 ||
2360                 { error "setstripe -c -1 failed"; return 3; }
2361         dd if=/dev/zero of=$DIR/$tdir/$tfile-2 bs=1M count=$OSTCOUNT ||
2362                 { error "dd $tfile-2 failed"; return 4; }
2363
2364         # make sure write RPCs have been sent to OSTs
2365         sync; sleep 5; sync
2366
2367         check_seq_oid $DIR/$tdir/$tfile-1 || return 5
2368         check_seq_oid $DIR/$tdir/$tfile-2 || return 6
2369 }
2370 run_test 27z "check SEQ/OID on the MDT and OST filesystems"
2371
2372 test_27A() { # b=19102
2373         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2374
2375         save_layout_restore_at_exit $MOUNT
2376         $LFS setstripe -c 0 -i -1 -S 0 $MOUNT
2377         wait_update $HOSTNAME "$LFS getstripe -c $MOUNT | sed 's/  *//g'" "1" 20 ||
2378                 error "stripe count $($LFS getstripe -c $MOUNT) != 1"
2379         local default_size=$($LFS getstripe -S $MOUNT)
2380         local default_offset=$($LFS getstripe -i $MOUNT)
2381         local dsize=$(do_facet $SINGLEMDS \
2382                 "$LCTL get_param -n lod.$(facet_svc $SINGLEMDS)*.stripesize")
2383         [ $default_size -eq $dsize ] ||
2384                 error "stripe size $default_size != $dsize"
2385         [ $default_offset -eq -1 ] ||
2386                 error "stripe offset $default_offset != -1"
2387 }
2388 run_test 27A "check filesystem-wide default LOV EA values"
2389
2390 test_27B() { # LU-2523
2391         test_mkdir $DIR/$tdir
2392         rm -f $DIR/$tdir/f0 $DIR/$tdir/f1
2393         touch $DIR/$tdir/f0
2394         # open f1 with O_LOV_DELAY_CREATE
2395         # rename f0 onto f1
2396         # call setstripe ioctl on open file descriptor for f1
2397         # close
2398         multiop $DIR/$tdir/f1 oO_RDWR:O_CREAT:O_LOV_DELAY_CREATE:nB1c \
2399                 $DIR/$tdir/f0
2400
2401         rm -f $DIR/$tdir/f1
2402         # open f1 with O_LOV_DELAY_CREATE
2403         # unlink f1
2404         # call setstripe ioctl on open file descriptor for f1
2405         # close
2406         multiop $DIR/$tdir/f1 oO_RDWR:O_CREAT:O_LOV_DELAY_CREATE:uB1c
2407
2408         # Allow multiop to fail in imitation of NFS's busted semantics.
2409         true
2410 }
2411 run_test 27B "call setstripe on open unlinked file/rename victim"
2412
2413 # 27C family tests full striping and overstriping
2414 test_27Ca() { #LU-2871
2415         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2416
2417         declare -a ost_idx
2418         local index
2419         local found
2420         local i
2421         local j
2422
2423         test_mkdir $DIR/$tdir
2424         cd $DIR/$tdir
2425         for i in $(seq 0 $((OSTCOUNT - 1))); do
2426                 # set stripe across all OSTs starting from OST$i
2427                 $LFS setstripe -i $i -c -1 $tfile$i
2428                 # get striping information
2429                 ost_idx=($($LFS getstripe $tfile$i |
2430                          tail -n $((OSTCOUNT + 1)) | awk '{print $1}'))
2431                 echo "OST Index: ${ost_idx[*]}"
2432
2433                 # check the layout
2434                 [ ${#ost_idx[@]} -eq $OSTCOUNT ] ||
2435                         error "${#ost_idx[@]} != $OSTCOUNT"
2436
2437                 for index in $(seq 0 $((OSTCOUNT - 1))); do
2438                         found=0
2439                         for j in "${ost_idx[@]}"; do
2440                                 if [ $index -eq $j ]; then
2441                                         found=1
2442                                         break
2443                                 fi
2444                         done
2445                         [ $found = 1 ] ||
2446                                 error "Can not find $index in ${ost_idx[*]}"
2447                 done
2448         done
2449 }
2450 run_test 27Ca "check full striping across all OSTs"
2451
2452 test_27Cb() {
2453         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
2454                 skip "server does not support overstriping"
2455         [[ $OSTCOUNT -ge $(($LOV_MAX_STRIPE_COUNT / 2)) ]] &&
2456                 skip_env "too many osts, skipping"
2457
2458         test_mkdir -p $DIR/$tdir
2459         local setcount=$(($OSTCOUNT * 2))
2460         [ $setcount -lt 160 ] || large_xattr_enabled ||
2461                 skip_env "ea_inode feature disabled"
2462
2463         $LFS setstripe -C $setcount $DIR/$tdir/$tfile ||
2464                 error "setstripe failed"
2465
2466         local count=$($LFS getstripe -c $DIR/$tdir/$tfile)
2467         [ $count -eq $setcount ] ||
2468                 error "stripe count $count, should be $setcount"
2469
2470         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "overstriped" ||
2471                 error "overstriped should be set in pattern"
2472
2473         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 conv=notrunc ||
2474                 error "dd failed"
2475 }
2476 run_test 27Cb "more stripes than OSTs with -C"
2477
2478 test_27Cc() {
2479         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
2480                 skip "server does not support overstriping"
2481         [[ $OSTCOUNT -lt 2 ]] && skip_env "need > 1 OST"
2482
2483         test_mkdir -p $DIR/$tdir
2484         local setcount=$(($OSTCOUNT - 1))
2485
2486         [ $setcount -lt 160 ] || large_xattr_enabled ||
2487                 skip_env "ea_inode feature disabled"
2488
2489         $LFS setstripe -C $setcount $DIR/$tdir/$tfile ||
2490                 error "setstripe failed"
2491
2492         local count=$($LFS getstripe -c $DIR/$tdir/$tfile)
2493         [ $count -eq $setcount ] ||
2494                 error "stripe count $count, should be $setcount"
2495
2496         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "overstriped" &&
2497                 error "overstriped should not be set in pattern"
2498
2499         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 conv=notrunc ||
2500                 error "dd failed"
2501 }
2502 run_test 27Cc "fewer stripes than OSTs does not set overstriping"
2503
2504 test_27Cd() {
2505         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
2506                 skip "server does not support overstriping"
2507         [[ $OSTCOUNT -lt 2 ]] && skip_env "need > 1 OST"
2508         large_xattr_enabled || skip_env "ea_inode feature disabled"
2509
2510         force_new_seq_all
2511
2512         test_mkdir -p $DIR/$tdir
2513         local setcount=$LOV_MAX_STRIPE_COUNT
2514
2515         $LFS setstripe -C $setcount $DIR/$tdir/$tfile ||
2516                 error "setstripe failed"
2517
2518         local count=$($LFS getstripe -c $DIR/$tdir/$tfile)
2519         [ $count -eq $setcount ] ||
2520                 error "stripe count $count, should be $setcount"
2521
2522         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "overstriped" ||
2523                 error "overstriped should be set in pattern"
2524
2525         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 conv=notrunc ||
2526                 error "dd failed"
2527
2528         rm -f $DIR/$tdir/$tfile || error "Delete $tfile failed"
2529 }
2530 run_test 27Cd "test maximum stripe count"
2531
2532 test_27Ce() {
2533         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
2534                 skip "server does not support overstriping"
2535         test_mkdir -p $DIR/$tdir
2536
2537         pool_add $TESTNAME || error "Pool creation failed"
2538         pool_add_targets $TESTNAME 0 || error "pool_add_targets failed"
2539
2540         local setcount=8
2541
2542         $LFS setstripe  -C $setcount -p "$TESTNAME" $DIR/$tdir/$tfile ||
2543                 error "setstripe failed"
2544
2545         local count=$($LFS getstripe -c $DIR/$tdir/$tfile)
2546         [ $count -eq $setcount ] ||
2547                 error "stripe count $count, should be $setcount"
2548
2549         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "overstriped" ||
2550                 error "overstriped should be set in pattern"
2551
2552         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 conv=notrunc ||
2553                 error "dd failed"
2554
2555         rm -f $DIR/$tdir/$tfile || error "Delete $tfile failed"
2556 }
2557 run_test 27Ce "test pool with overstriping"
2558
2559 test_27Cf() {
2560         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
2561                 skip "server does not support overstriping"
2562         [[ $OSTCOUNT -ge $(($LOV_MAX_STRIPE_COUNT / 2)) ]] &&
2563                 skip_env "too many osts, skipping"
2564
2565         test_mkdir -p $DIR/$tdir
2566
2567         local setcount=$(($OSTCOUNT * 2))
2568         [ $setcount -lt 160 ] || large_xattr_enabled ||
2569                 skip_env "ea_inode feature disabled"
2570
2571         $LFS setstripe  -C $setcount $DIR/$tdir/ ||
2572                 error "setstripe failed"
2573
2574         echo 1 > $DIR/$tdir/$tfile
2575
2576         local count=$($LFS getstripe -c $DIR/$tdir/$tfile)
2577         [ $count -eq $setcount ] ||
2578                 error "stripe count $count, should be $setcount"
2579
2580         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "overstriped" ||
2581                 error "overstriped should be set in pattern"
2582
2583         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 conv=notrunc ||
2584                 error "dd failed"
2585
2586         rm -f $DIR/$tdir/$tfile || error "Delete $tfile failed"
2587 }
2588 run_test 27Cf "test default inheritance with overstriping"
2589
2590 test_27Cg() {
2591         (( MDS1_VERSION >= $(version_code v2_15_55-80-gd96b98ee6b) )) ||
2592                 skip "need MDS version at least v2_15_55-80-gd96b98ee6b for fix"
2593
2594         $LFS setstripe -o 0,$OSTCOUNT $DIR/$tfile
2595         (( $? != 0 )) || error "must be an error for not existent OST#"
2596 }
2597 run_test 27Cg "test setstripe with wrong OST idx"
2598
2599 test_27D() {
2600         [ $OSTCOUNT -lt 2 ] && skip_env "needs >= 2 OSTs"
2601         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
2602         remote_mds_nodsh && skip "remote MDS with nodsh"
2603
2604         local POOL=${POOL:-testpool}
2605         local first_ost=0
2606         local last_ost=$(($OSTCOUNT - 1))
2607         local ost_step=1
2608         local ost_list=$(seq $first_ost $ost_step $last_ost)
2609         local ost_range="$first_ost $last_ost $ost_step"
2610
2611         test_mkdir $DIR/$tdir
2612         pool_add $POOL || error "pool_add failed"
2613         pool_add_targets $POOL $ost_range || error "pool_add_targets failed"
2614
2615         local skip27D
2616         [ $MDS1_VERSION -lt $(version_code 2.8.55) ] &&
2617                 skip27D+="-s 29"
2618         [ $MDS1_VERSION -lt $(version_code 2.9.55) ] ||
2619                 [ $CLIENT_VERSION -lt $(version_code 2.9.55) ] &&
2620                         skip27D+=" -s 30,31"
2621         [[ ! $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ||
2622           $OSTCOUNT -ge $(($LOV_MAX_STRIPE_COUNT / 2)) ]] &&
2623                 skip27D+=" -s 32,33"
2624         [[ $MDS_VERSION -lt $(version_code $SEL_VER) ]] &&
2625                 skip27D+=" -s 34"
2626         llapi_layout_test -d$DIR/$tdir -p$POOL -o$OSTCOUNT $skip27D ||
2627                 error "llapi_layout_test failed"
2628
2629         destroy_test_pools || error "destroy test pools failed"
2630 }
2631 run_test 27D "validate llapi_layout API"
2632
2633 # Verify that default_easize is increased from its initial value after
2634 # accessing a widely striped file.
2635 test_27E() {
2636         [ $OSTCOUNT -lt 2 ] && skip_env "needs >= 2 OSTs"
2637         [ $CLIENT_VERSION -lt $(version_code 2.5.57) ] &&
2638                 skip "client does not have LU-3338 fix"
2639
2640         # 72 bytes is the minimum space required to store striping
2641         # information for a file striped across one OST:
2642         # (sizeof(struct lov_user_md_v3) +
2643         #  sizeof(struct lov_user_ost_data_v1))
2644         local min_easize=72
2645         $LCTL set_param -n llite.*.default_easize $min_easize ||
2646                 error "lctl set_param failed"
2647         local easize=$($LCTL get_param -n llite.*.default_easize)
2648
2649         [ $easize -eq $min_easize ] ||
2650                 error "failed to set default_easize"
2651
2652         $LFS setstripe -c $OSTCOUNT $DIR/$tfile ||
2653                 error "setstripe failed"
2654         # In order to ensure stat() call actually talks to MDS we need to
2655         # do something drastic to this file to shake off all lock, e.g.
2656         # rename it (kills lookup lock forcing cache cleaning)
2657         mv $DIR/$tfile $DIR/${tfile}-1
2658         ls -l $DIR/${tfile}-1
2659         rm $DIR/${tfile}-1
2660
2661         easize=$($LCTL get_param -n llite.*.default_easize)
2662
2663         [ $easize -gt $min_easize ] ||
2664                 error "default_easize not updated"
2665 }
2666 run_test 27E "check that default extended attribute size properly increases"
2667
2668 test_27F() { # LU-5346/LU-7975
2669         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2670         [[ $OSTCOUNT -lt 2 ]] && skip "needs >= 2 OSTs"
2671         [[ $MDS1_VERSION -lt $(version_code 2.8.51) ]] &&
2672                 skip "Need MDS version at least 2.8.51"
2673         remote_ost_nodsh && skip "remote OST with nodsh"
2674
2675         test_mkdir $DIR/$tdir
2676         rm -f $DIR/$tdir/f0
2677         $LFS setstripe -c 2 $DIR/$tdir
2678
2679         # stop all OSTs to reproduce situation for LU-7975 ticket
2680         for num in $(seq $OSTCOUNT); do
2681                 stop ost$num
2682         done
2683
2684         # open/create f0 with O_LOV_DELAY_CREATE
2685         # truncate f0 to a non-0 size
2686         # close
2687         multiop $DIR/$tdir/f0 oO_RDWR:O_CREAT:O_LOV_DELAY_CREATE:T1050000c
2688
2689         $CHECKSTAT -s 1050000 $DIR/$tdir/f0 || error "checkstat failed"
2690         # open/write it again to force delayed layout creation
2691         cat /etc/hosts > $DIR/$tdir/f0 &
2692         catpid=$!
2693
2694         # restart OSTs
2695         for num in $(seq $OSTCOUNT); do
2696                 start ost$num $(ostdevname $num) $OST_MOUNT_OPTS ||
2697                         error "ost$num failed to start"
2698         done
2699
2700         wait $catpid || error "cat failed"
2701
2702         cmp /etc/hosts $DIR/$tdir/f0 || error "cmp failed"
2703         [[ $($LFS getstripe -c $DIR/$tdir/f0) == 2 ]] ||
2704                 error "wrong stripecount"
2705
2706 }
2707 run_test 27F "Client resend delayed layout creation with non-zero size"
2708
2709 test_27G() { #LU-10629
2710         [ $MDS1_VERSION -lt $(version_code 2.11.51) ] &&
2711                 skip "Need MDS version at least 2.11.51"
2712         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
2713         remote_mds_nodsh && skip "remote MDS with nodsh"
2714         local POOL=${POOL:-testpool}
2715         local ostrange="0 0 1"
2716
2717         test_mkdir $DIR/$tdir
2718         touch $DIR/$tdir/$tfile.nopool
2719         pool_add $POOL || error "pool_add failed"
2720         pool_add_targets $POOL $ostrange || error "pool_add_targets failed"
2721         $LFS setstripe -p $POOL $DIR/$tdir
2722
2723         local pool=$($LFS getstripe -p $DIR/$tdir)
2724
2725         [ "$pool" = "$POOL" ] || error "Striping failed got '$pool' not '$POOL'"
2726         touch $DIR/$tdir/$tfile.default
2727         $LFS setstripe -E 1M --pool $POOL -c 1 -E eof -c 1 $DIR/$tdir/$tfile.pfl
2728         $LFS find $DIR/$tdir -type f --pool $POOL
2729         local found=$($LFS find $DIR/$tdir -type f --pool $POOL | wc -l)
2730         [[ "$found" == "2" ]] ||
2731                 error "found $found != 2 files in '$DIR/$tdir' in '$POOL'"
2732
2733         $LFS setstripe -d $DIR/$tdir
2734
2735         pool=$($LFS getstripe -p -d $DIR/$tdir)
2736
2737         [[ "$pool" != "$POOL" ]] || error "$DIR/$tdir is still '$pool'"
2738 }
2739 run_test 27G "Clear OST pool from stripe"
2740
2741 test_27H() {
2742         [[ $MDS1_VERSION -le $(version_code 2.11.54) ]] &&
2743                 skip "Need MDS version newer than 2.11.54"
2744         [[ $OSTCOUNT -lt 3 ]] && skip_env "needs >= 3 OSTs"
2745         test_mkdir $DIR/$tdir
2746         $LFS setstripe -o 0 -o 2 $DIR/$tdir || error "setstripe failed"
2747         touch $DIR/$tdir/$tfile
2748         $LFS getstripe -c $DIR/$tdir/$tfile
2749         [ $($LFS getstripe -c $DIR/$tdir/$tfile) -eq 2 ] ||
2750                 error "two-stripe file doesn't have two stripes"
2751
2752         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=4k count=4 || error "dd failed"
2753         $LFS getstripe -y $DIR/$tdir/$tfile
2754         (( $($LFS getstripe -y $DIR/$tdir/$tfile |
2755              egrep -c "l_ost_idx: [02]$") == "2" )) ||
2756                 error "expected l_ost_idx: [02]$ not matched"
2757
2758         # make sure ost list has been cleared
2759         local stripesize=$($LFS getstripe -S $DIR/$tdir)
2760         $LFS setstripe -S $((stripesize * 4)) -i 1 \
2761                 -c $((OSTCOUNT - 1)) $DIR/$tdir || error "setstripe"
2762         touch $DIR/$tdir/f3
2763         $LVERIFY $DIR/$tdir $DIR/$tdir/f3 || error "lverify failed"
2764 }
2765 run_test 27H "Set specific OSTs stripe"
2766
2767 test_27I() {
2768         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2769         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2770         [[ $MDS1_VERSION -gt $(version_code 2.12.52) ]] ||
2771                 skip "Need MDS version newer than 2.12.52"
2772         local pool=$TESTNAME
2773         local ostrange="1 1 1"
2774
2775         save_layout_restore_at_exit $MOUNT
2776         $LFS setstripe -c 2 -i 0 $MOUNT
2777         pool_add $pool || error "pool_add failed"
2778         pool_add_targets $pool $ostrange ||
2779                 error "pool_add_targets failed"
2780         test_mkdir $DIR/$tdir
2781         $LFS setstripe -p $pool $DIR/$tdir
2782         $MULTIOP $DIR/$tdir/$tfile Oc || error "multiop failed"
2783         $LFS getstripe $DIR/$tdir/$tfile
2784 }
2785 run_test 27I "check that root dir striping does not break parent dir one"
2786
2787 test_27J() {
2788         (( $MDS1_VERSION > $(version_code 2.12.51) )) ||
2789                 skip "Need MDS version newer than 2.12.51"
2790
2791         # skip basic ops on file with foreign LOV tests on 5.12-6.2 kernels
2792         # until the filemap_read() issue is fixed by v6.2-rc4-61-g5956592ce337
2793         (( $LINUX_VERSION_CODE < $(version_code 5.12.0) ||
2794            $LINUX_VERSION_CODE >= $(version_code 6.2.0) )) ||
2795                 skip "Need kernel < 5.12.0 or >= 6.2.0 for filemap_read() fix"
2796
2797         test_mkdir $DIR/$tdir
2798         local uuid1=$(cat /proc/sys/kernel/random/uuid)
2799         local uuid2=$(cat /proc/sys/kernel/random/uuid)
2800
2801         # create foreign file (raw way)
2802         ! $LFS setstripe --flags 0xda08 $DIR/$tdir/$tfile ||
2803                 error "creating $tfile w/ hex flags w/o --foreign should fail"
2804
2805         ! $LFS setstripe --foreign --flags foo \
2806                 --xattr ${uuid1}@${uuid2} $DIR/$tdir/$tfile ||
2807                         error "creating $tfile with '--flags foo' should fail"
2808
2809         ! $LFS setstripe --foreign --flags 0xffffffff \
2810                 --xattr ${uuid1}@${uuid2} $DIR/$tdir/$tfile ||
2811                         error "creating $tfile w/ 0xffffffff flags should fail"
2812
2813         create_foreign_file -f $DIR/$tdir/$tfile -x "${uuid1}@${uuid2}" \
2814                 -t 1 -F 0xda08 || error "create_foreign_file failed"
2815
2816         # verify foreign file (raw way)
2817         parse_foreign_file -f $DIR/$tdir/$tfile |
2818                 grep "lov_foreign_magic: 0x0BD70BD0" ||
2819                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign magic"
2820         parse_foreign_file -f $DIR/$tdir/$tfile | grep "lov_xattr_size: 89" ||
2821                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign size"
2822         parse_foreign_file -f $DIR/$tdir/$tfile |
2823                 grep "lov_foreign_size: 73" ||
2824                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign size"
2825         parse_foreign_file -f $DIR/$tdir/$tfile |
2826                 grep "lov_foreign_type: 1" ||
2827                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign type"
2828         parse_foreign_file -f $DIR/$tdir/$tfile |
2829                 grep "lov_foreign_flags: 0x0000DA08" ||
2830                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign flags"
2831         local lov=$(parse_foreign_file -f $DIR/$tdir/$tfile |
2832                 grep "lov_foreign_value: 0x" |
2833                 sed -e 's/lov_foreign_value: 0x//')
2834         local lov2=$(echo -n "${uuid1}@${uuid2}" | od -A n -t x1 -w160)
2835         [[ $lov = ${lov2// /} ]] ||
2836                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign value"
2837
2838         # create foreign file (lfs + API)
2839         $LFS setstripe --foreign=none --flags 0xda08 \
2840                 -x "${uuid1}@${uuid2}" $DIR/$tdir/${tfile}2 ||
2841                 error "$DIR/$tdir/${tfile}2: create failed"
2842
2843         $LFS getstripe -v $DIR/$tdir/${tfile}2 |
2844                 grep "lfm_magic:.*0x0BD70BD0" ||
2845                 error "$DIR/$tdir/${tfile}2: invalid LOV EA foreign magic"
2846         # lfm_length is LOV EA size - sizeof(lfm_magic) - sizeof(lfm_length)
2847         $LFS getstripe -v $DIR/$tdir/${tfile}2 | grep "lfm_length:.*73" ||
2848                 error "$DIR/$tdir/${tfile}2: invalid LOV EA foreign size"
2849         $LFS getstripe -v $DIR/$tdir/${tfile}2 | grep "lfm_type:.*none" ||
2850                 error "$DIR/$tdir/${tfile}2: invalid LOV EA foreign type"
2851         $LFS getstripe -v $DIR/$tdir/${tfile}2 |
2852                 grep "lfm_flags:.*0x0000DA08" ||
2853                 error "$DIR/$tdir/${tfile}2: invalid LOV EA foreign flags"
2854         $LFS getstripe $DIR/$tdir/${tfile}2 |
2855                 grep "lfm_value:.*${uuid1}@${uuid2}" ||
2856                 error "$DIR/$tdir/${tfile}2: invalid LOV EA foreign value"
2857
2858         # modify striping should fail
2859         $LFS setstripe -c 2 $DIR/$tdir/$tfile &&
2860                 error "$DIR/$tdir/$tfile: setstripe should fail"
2861         $LFS setstripe -c 2 $DIR/$tdir/${tfile}2 &&
2862                 error "$DIR/$tdir/${tfile}2: setstripe should fail"
2863
2864         # R/W should fail
2865         cat $DIR/$tdir/$tfile && error "$DIR/$tdir/$tfile: read should fail"
2866         cat $DIR/$tdir/${tfile}2 &&
2867                 error "$DIR/$tdir/${tfile}2: read should fail"
2868         cat /etc/passwd > $DIR/$tdir/$tfile &&
2869                 error "$DIR/$tdir/$tfile: write should fail"
2870         cat /etc/passwd > $DIR/$tdir/${tfile}2 &&
2871                 error "$DIR/$tdir/${tfile}2: write should fail"
2872
2873         # chmod should work
2874         chmod 222 $DIR/$tdir/$tfile ||
2875                 error "$DIR/$tdir/$tfile: chmod failed"
2876         chmod 222 $DIR/$tdir/${tfile}2 ||
2877                 error "$DIR/$tdir/${tfile}2: chmod failed"
2878
2879         # chown should work
2880         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/$tfile ||
2881                 error "$DIR/$tdir/$tfile: chown failed"
2882         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/${tfile}2 ||
2883                 error "$DIR/$tdir/${tfile}2: chown failed"
2884
2885         # rename should work
2886         mv $DIR/$tdir/$tfile $DIR/$tdir/${tfile}.new ||
2887                 error "$DIR/$tdir/$tfile: rename of foreign file has failed"
2888         mv $DIR/$tdir/${tfile}2 $DIR/$tdir/${tfile}2.new ||
2889                 error "$DIR/$tdir/${tfile}2: rename of foreign file has failed"
2890
2891         #remove foreign file
2892         rm $DIR/$tdir/${tfile}.new ||
2893                 error "$DIR/$tdir/${tfile}.new: remove of foreign file has failed"
2894         rm $DIR/$tdir/${tfile}2.new ||
2895                 error "$DIR/$tdir/${tfile}2.new: remove of foreign file has failed"
2896 }
2897 run_test 27J "basic ops on file with foreign LOV"
2898
2899 test_27K() {
2900         [[ $MDS1_VERSION -le $(version_code 2.12.49) ]] &&
2901                 skip "Need MDS version newer than 2.12.49"
2902
2903         test_mkdir $DIR/$tdir
2904         local uuid1=$(cat /proc/sys/kernel/random/uuid)
2905         local uuid2=$(cat /proc/sys/kernel/random/uuid)
2906
2907         # create foreign dir (raw way)
2908         ! $LFS setdirstripe --flags 0xda08 $DIR/$tdir/$tdir ||
2909                 error "creating $tdir w/ hex flags w/o --foreign should fail"
2910
2911         ! $LFS setdirstripe --foreign --flags foo \
2912                 --xattr ${uuid1}@${uuid2} $DIR/$tdir/$tdir ||
2913                         error "creating $tdir with '--flags foo' should fail"
2914
2915         ! $LFS setdirstripe --foreign --flags 0xffffffff \
2916                 --xattr ${uuid1}@${uuid2} $DIR/$tdir/$tdir ||
2917                         error "creating $tdir w/ 0xffffffff flags should fail"
2918
2919         create_foreign_dir -d $DIR/$tdir/$tdir -x "${uuid1}@${uuid2}" -t 1 ||
2920                 error "create_foreign_dir FAILED"
2921
2922         # verify foreign dir (raw way)
2923         parse_foreign_dir -d $DIR/$tdir/$tdir |
2924                 grep "lmv_foreign_magic:.*0xcd50cd0" ||
2925                 error "$DIR/$tdir/$tfile: invalid LMV EA magic"
2926         parse_foreign_dir -d $DIR/$tdir/$tdir | grep "lmv_xattr_size:.*89$" ||
2927                 error "$DIR/$tdir/$tdir: invalid LMV EA size"
2928         parse_foreign_dir -d $DIR/$tdir/$tdir | grep "lmv_foreign_type: 1$" ||
2929                 error "$DIR/$tdir/$tdir: invalid LMV EA type"
2930         parse_foreign_dir -d $DIR/$tdir/$tdir |
2931                 grep "lmv_foreign_flags: 55813$" ||
2932                 error "$DIR/$tdir/$tdir: invalid LMV EA flags"
2933         local lmv=$(parse_foreign_dir -d $DIR/$tdir/$tdir |
2934                 grep "lmv_foreign_value: 0x" |
2935                 sed 's/lmv_foreign_value: 0x//')
2936         local lmv2=$(echo -n "${uuid1}@${uuid2}" | od -A n -t x1 -w160 |
2937                 sed 's/ //g')
2938         [[ $lmv == $lmv2 ]] || error "$DIR/$tdir/$tdir: invalid LMV EA value"
2939
2940         # create foreign dir (lfs + API)
2941         $LFS mkdir --foreign=none --xattr="${uuid1}@${uuid2}" --flags=0xda05 \
2942                 $DIR/$tdir/${tdir}2 ||
2943                 error "$DIR/$tdir/${tdir}2: create failed"
2944
2945         $LFS getdirstripe -v $DIR/$tdir/${tdir}2
2946
2947         $LFS getdirstripe -v $DIR/$tdir/${tdir}2 |
2948                 grep "lfm_magic:.*0x0CD50CD0" ||
2949                 error "$DIR/$tdir/${tdir}2: invalid LMV EA magic"
2950         # lfm_length is LMV EA size - sizeof(lfm_magic) - sizeof(lfm_length)
2951         # - sizeof(lfm_type) - sizeof(lfm_flags)
2952         $LFS getdirstripe -v $DIR/$tdir/${tdir}2 | grep "lfm_length:.*73" ||
2953                 error "$DIR/$tdir/${tdir}2: invalid LMV EA size"
2954         $LFS getdirstripe -v $DIR/$tdir/${tdir}2 | grep "lfm_type:.*none" ||
2955                 error "$DIR/$tdir/${tdir}2: invalid LMV EA type"
2956         $LFS getdirstripe -v $DIR/$tdir/${tdir}2 |
2957                 grep "lfm_flags:.*0x0000DA05" ||
2958                 error "$DIR/$tdir/${tdir}2: invalid LMV EA flags"
2959         $LFS getdirstripe $DIR/$tdir/${tdir}2 |
2960                 grep "lfm_value.*${uuid1}@${uuid2}" ||
2961                 error "$DIR/$tdir/${tdir}2: invalid LMV EA value"
2962
2963         # file create in dir should fail
2964         touch $DIR/$tdir/$tdir/$tfile && error "$DIR/$tdir: file create should fail"
2965         touch $DIR/$tdir/${tdir}2/$tfile &&
2966                 error "$DIR/${tdir}2: file create should fail"
2967
2968         # chmod should work
2969         chmod 777 $DIR/$tdir/$tdir ||
2970                 error "$DIR/$tdir: chmod failed"
2971         chmod 777 $DIR/$tdir/${tdir}2 ||
2972                 error "$DIR/${tdir}2: chmod failed"
2973
2974         # chown should work
2975         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/$tdir ||
2976                 error "$DIR/$tdir: chown failed"
2977         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/${tdir}2 ||
2978                 error "$DIR/${tdir}2: chown failed"
2979
2980         # rename should work
2981         mv $DIR/$tdir/$tdir $DIR/$tdir/${tdir}.new ||
2982                 error "$DIR/$tdir/$tdir: rename of foreign dir has failed"
2983         mv $DIR/$tdir/${tdir}2 $DIR/$tdir/${tdir}2.new ||
2984                 error "$DIR/$tdir/${tdir}2: rename of foreign dir has failed"
2985
2986         #remove foreign dir
2987         rmdir $DIR/$tdir/${tdir}.new ||
2988                 error "$DIR/$tdir/${tdir}.new: remove of foreign dir has failed"
2989         rmdir $DIR/$tdir/${tdir}2.new ||
2990                 error "$DIR/$tdir/${tdir}2.new: remove of foreign dir has failed"
2991 }
2992 run_test 27K "basic ops on dir with foreign LMV"
2993
2994 test_27L() {
2995         remote_mds_nodsh && skip "remote MDS with nodsh"
2996
2997         local POOL=${POOL:-$TESTNAME}
2998
2999         pool_add $POOL || error "pool_add failed"
3000
3001         lfs pool_list $MOUNT | grep -Fx "${FSNAME}.${POOL}" ||
3002                  error "pool_list does not contain ${FSNAME}.${POOL}:" \
3003                        "$(lfs pool_list $MOUNT | grep -F "${POOL}")"
3004 }
3005 run_test 27L "lfs pool_list gives correct pool name"
3006
3007 test_27M() {
3008         (( $MDS1_VERSION >= $(version_code 2.12.57) )) ||
3009                 skip "Need MDS version >= than 2.12.57"
3010         remote_mds_nodsh && skip "remote MDS with nodsh"
3011         (( $OSTCOUNT > 1 )) || skip "need > 1 OST"
3012
3013         # Set default striping on directory
3014         local setcount=4
3015         local stripe_opt
3016         local mdts=$(comma_list $(mdts_nodes))
3017
3018         # if we run against a 2.12 server which lacks overstring support
3019         # then the connect_flag will not report overstriping, even if client
3020         # is 2.14+
3021         if [[ $($LCTL get_param mdc.*.connect_flags) =~ overstriping ]]; then
3022                 stripe_opt="-C $setcount"
3023         elif (( $OSTCOUNT >= $setcount )); then
3024                 stripe_opt="-c $setcount"
3025         else
3026                 skip "server does not support overstriping"
3027         fi
3028
3029         test_mkdir $DIR/$tdir
3030
3031         # Validate existing append_* params and ensure restore
3032         local pool=$(do_facet mds1 $LCTL get_param -n mdd.$FSNAME-MDT0000.append_pool)
3033         [[ "$pool" == "" ]] || error "expected append_pool == '', got '$pool'"
3034         stack_trap "do_nodes $mdts $LCTL set_param mdd.*.append_pool=none"
3035
3036         local orig_count=$(do_facet mds1 $LCTL get_param -n mdd.$FSNAME-MDT0000.append_stripe_count)
3037         ((orig_count == 1)) || error "expected append_stripe_count == 1, got $orig_count"
3038         stack_trap "do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=1"
3039
3040         $LFS setstripe $stripe_opt $DIR/$tdir
3041
3042         echo 1 > $DIR/$tdir/${tfile}.1
3043         local count=$($LFS getstripe -c $DIR/$tdir/${tfile}.1)
3044         (( $count == $setcount )) ||
3045                 error "(1) stripe count $count, should be $setcount"
3046
3047         local appendcount=$orig_count
3048         echo 1 >> $DIR/$tdir/${tfile}.2_append
3049         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.2_append)
3050         (( $count == $appendcount )) ||
3051                 error "(2)stripe count $count, should be $appendcount for append"
3052
3053         # Disable O_APPEND striping, verify it works
3054         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=0
3055
3056         # Should now get the default striping, which is 4
3057         setcount=4
3058         echo 1 >> $DIR/$tdir/${tfile}.3_append
3059         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.3_append)
3060         (( $count == $setcount )) ||
3061                 error "(3) stripe count $count, should be $setcount"
3062
3063         # Try changing the stripe count for append files
3064         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=2
3065
3066         # Append striping is now 2 (directory default is still 4)
3067         appendcount=2
3068         echo 1 >> $DIR/$tdir/${tfile}.4_append
3069         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.4_append)
3070         (( $count == $appendcount )) ||
3071                 error "(4) stripe count $count, should be $appendcount for append"
3072
3073         # Test append stripe count of -1
3074         # Exercise LU-16872 patch with specific striping, only if MDS has fix
3075         (( $MDS1_VERSION > $(version_code 2.15.56.46) )) &&
3076                 $LFS setstripe -o 0,$((OSTCOUNT - 1)) $DIR/$tdir &&
3077                 touch $DIR/$tdir/$tfile.specific.{1..128}
3078         stack_trap "rm -f $DIR/$tdir/$tfile.*"
3079
3080         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=-1
3081         appendcount=$OSTCOUNT
3082         echo 1 >> $DIR/$tdir/${tfile}.5
3083         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.5)
3084         (( $count == $appendcount )) ||
3085                 error "(5) stripe count $count, should be $appendcount for append"
3086
3087         # Set append striping back to default of 1
3088         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=1
3089
3090         # Try a new default striping, PFL + DOM
3091         $LFS setstripe -L mdt -E 1M -E -1 -c 2 $DIR/$tdir
3092
3093         # Create normal DOM file, DOM returns stripe count == 0
3094         setcount=0
3095         touch $DIR/$tdir/${tfile}.6
3096         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.6)
3097         (( $count == $setcount )) ||
3098                 error "(6) stripe count $count, should be $setcount"
3099
3100         # Show
3101         appendcount=1
3102         echo 1 >> $DIR/$tdir/${tfile}.7_append
3103         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.7_append)
3104         (( $count == $appendcount )) ||
3105                 error "(7) stripe count $count, should be $appendcount for append"
3106
3107         # Clean up DOM layout
3108         $LFS setstripe -d $DIR/$tdir
3109
3110         save_layout_restore_at_exit $MOUNT
3111         # Now test that append striping works when layout is from root
3112         $LFS setstripe -c 2 $MOUNT
3113         # Make a special directory for this
3114         mkdir $DIR/${tdir}/${tdir}.2
3115
3116         # Verify for normal file
3117         setcount=2
3118         echo 1 > $DIR/${tdir}/${tdir}.2/${tfile}.8
3119         count=$($LFS getstripe -c $DIR/$tdir/${tdir}.2/${tfile}.8)
3120         (( $count == $setcount )) ||
3121                 error "(8) stripe count $count, should be $setcount"
3122
3123         appendcount=1
3124         echo 1 >> $DIR/${tdir}/${tdir}.2/${tfile}.9_append
3125         count=$($LFS getstripe -c $DIR/${tdir}/${tdir}.2/${tfile}.9_append)
3126         (( $count == $appendcount )) ||
3127                 error "(9) stripe count $count, should be $appendcount for append"
3128
3129         # Now test O_APPEND striping with pools
3130         pool_add $TESTNAME || error "pool creation failed"
3131         pool_add_targets $TESTNAME 0 1 || error "Pool add targets failed"
3132         do_nodes $mdts $LCTL set_param mdd.*.append_pool="$TESTNAME"
3133
3134         echo 1 >> $DIR/$tdir/${tfile}.10_append
3135
3136         pool=$($LFS getstripe -p $DIR/$tdir/${tfile}.10_append)
3137         [[ "$pool" == "$TESTNAME" ]] || error "(10) incorrect pool: $pool"
3138
3139         # Check that count is still correct
3140         appendcount=1
3141         echo 1 >> $DIR/$tdir/${tfile}.11_append
3142         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.11_append)
3143         (( $count == $appendcount )) ||
3144                 error "(11) stripe count $count, should be $appendcount for append"
3145
3146         # Disable O_APPEND stripe count, verify pool works separately
3147         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=0
3148
3149         echo 1 >> $DIR/$tdir/${tfile}.12_append
3150
3151         pool=$($LFS getstripe -p $DIR/$tdir/${tfile}.12_append)
3152         [[ "$pool" == "$TESTNAME" ]] || error "(12) incorrect pool: $pool"
3153
3154         # Remove pool setting, verify it's not applied
3155         do_nodes $mdts $LCTL set_param mdd.*.append_pool='none'
3156
3157         echo 1 >> $DIR/$tdir/${tfile}.13_append
3158
3159         pool=$($LFS getstripe -p $DIR/$tdir/${tfile}.13_append)
3160         [[ -z "$pool" ]] || error "(13) pool found: $pool"
3161 }
3162 run_test 27M "test O_APPEND striping"
3163
3164 test_27N() {
3165         combined_mgs_mds && skip "needs separate MGS/MDT"
3166
3167         pool_add $TESTNAME || error "pool_add failed"
3168         do_facet mgs "$LCTL pool_list $FSNAME" |
3169                 grep -Fx "${FSNAME}.${TESTNAME}" ||
3170                 error "lctl pool_list on MGS failed"
3171 }
3172 run_test 27N "lctl pool_list on separate MGS gives correct pool name"
3173
3174 clean_foreign_symlink() {
3175         trap 0
3176         lctl set_param llite/$FSNAME-*/foreign_symlink_enable=0
3177         for i in $DIR/$tdir/* ; do
3178                 $LFS unlink_foreign $i || true
3179         done
3180 }
3181
3182 test_27O() {
3183         [[ $(lustre_version_code $SINGLEMDS) -le $(version_code 2.12.51) ]] &&
3184                 skip "Need MDS version newer than 2.12.51"
3185
3186         test_mkdir $DIR/$tdir
3187         local uuid1=$(cat /proc/sys/kernel/random/uuid)
3188         local uuid2=$(cat /proc/sys/kernel/random/uuid)
3189
3190         trap clean_foreign_symlink EXIT
3191
3192         # enable foreign_symlink behaviour
3193         $LCTL set_param llite/$FSNAME-*/foreign_symlink_enable=1
3194
3195         # foreign symlink LOV format is a partial path by default
3196
3197         # create foreign file (lfs + API)
3198         $LFS setstripe --foreign=symlink --flags 0xda05 \
3199                 -x "${uuid1}/${uuid2}" --mode 0600 $DIR/$tdir/${tfile} ||
3200                 error "$DIR/$tdir/${tfile}: create failed"
3201
3202         $LFS getstripe -v $DIR/$tdir/${tfile} |
3203                 grep "lfm_magic:.*0x0BD70BD0" ||
3204                 error "$DIR/$tdir/${tfile}: invalid LOV EA foreign magic"
3205         $LFS getstripe -v $DIR/$tdir/${tfile} | grep "lfm_type:.*symlink" ||
3206                 error "$DIR/$tdir/${tfile}: invalid LOV EA foreign type"
3207         $LFS getstripe -v $DIR/$tdir/${tfile} |
3208                 grep "lfm_flags:.*0x0000DA05" ||
3209                 error "$DIR/$tdir/${tfile}: invalid LOV EA foreign flags"
3210         $LFS getstripe $DIR/$tdir/${tfile} |
3211                 grep "lfm_value:.*${uuid1}/${uuid2}" ||
3212                 error "$DIR/$tdir/${tfile}: invalid LOV EA foreign value"
3213
3214         # modify striping should fail
3215         $LFS setstripe -c 2 $DIR/$tdir/$tfile &&
3216                 error "$DIR/$tdir/$tfile: setstripe should fail"
3217
3218         # R/W should fail ("/{foreign_symlink_prefix}/${uuid1}/" missing)
3219         cat $DIR/$tdir/$tfile && error "$DIR/$tdir/$tfile: read should fail"
3220         cat /etc/passwd > $DIR/$tdir/$tfile &&
3221                 error "$DIR/$tdir/$tfile: write should fail"
3222
3223         # rename should succeed
3224         mv $DIR/$tdir/$tfile $DIR/$tdir/${tfile}.new ||
3225                 error "$DIR/$tdir/$tfile: rename has failed"
3226
3227         #remove foreign_symlink file should fail
3228         rm $DIR/$tdir/${tfile}.new &&
3229                 error "$DIR/$tdir/${tfile}.new: remove of foreign_symlink file should fail"
3230
3231         #test fake symlink
3232         mkdir /tmp/${uuid1} ||
3233                 error "/tmp/${uuid1}: mkdir has failed"
3234         echo FOOFOO > /tmp/${uuid1}/${uuid2} ||
3235                 error "/tmp/${uuid1}/${uuid2}: echo has failed"
3236         $LCTL set_param llite/$FSNAME-*/foreign_symlink_prefix=/tmp/
3237         $CHECKSTAT -t link -l /tmp/${uuid1}/${uuid2} $DIR/$tdir/${tfile}.new ||
3238                 error "$DIR/$tdir/${tfile}.new: not seen as a symlink"
3239         #read should succeed now
3240         cat $DIR/$tdir/${tfile}.new | grep FOOFOO ||
3241                 error "$DIR/$tdir/${tfile}.new: symlink resolution has failed"
3242         #write should succeed now
3243         cat /etc/passwd > $DIR/$tdir/${tfile}.new ||
3244                 error "$DIR/$tdir/${tfile}.new: write should succeed"
3245         diff /etc/passwd $DIR/$tdir/${tfile}.new ||
3246                 error "$DIR/$tdir/${tfile}.new: diff has failed"
3247         diff /etc/passwd /tmp/${uuid1}/${uuid2} ||
3248                 error "/tmp/${uuid1}/${uuid2}: diff has failed"
3249
3250         #check that getstripe still works
3251         $LFS getstripe $DIR/$tdir/${tfile}.new ||
3252                 error "$DIR/$tdir/${tfile}.new: getstripe should still work with foreign_symlink enabled"
3253
3254         # chmod should still succeed
3255         chmod 644 $DIR/$tdir/${tfile}.new ||
3256                 error "$DIR/$tdir/${tfile}.new: chmod has failed"
3257
3258         # chown should still succeed
3259         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/${tfile}.new ||
3260                 error "$DIR/$tdir/${tfile}.new: chown has failed"
3261
3262         # rename should still succeed
3263         mv $DIR/$tdir/${tfile}.new $DIR/$tdir/${tfile} ||
3264                 error "$DIR/$tdir/${tfile}.new: rename has failed"
3265
3266         #remove foreign_symlink file should still fail
3267         rm $DIR/$tdir/${tfile} &&
3268                 error "$DIR/$tdir/${tfile}: remove of foreign_symlink file should fail"
3269
3270         #use special ioctl() to unlink foreign_symlink file
3271         $LFS unlink_foreign $DIR/$tdir/${tfile} ||
3272                 error "$DIR/$tdir/$tfile: unlink/ioctl failed"
3273
3274 }
3275 run_test 27O "basic ops on foreign file of symlink type"
3276
3277 test_27P() {
3278         [[ $(lustre_version_code $SINGLEMDS) -le $(version_code 2.12.49) ]] &&
3279                 skip "Need MDS version newer than 2.12.49"
3280
3281         test_mkdir $DIR/$tdir
3282         local uuid1=$(cat /proc/sys/kernel/random/uuid)
3283         local uuid2=$(cat /proc/sys/kernel/random/uuid)
3284
3285         trap clean_foreign_symlink EXIT
3286
3287         # enable foreign_symlink behaviour
3288         $LCTL set_param llite/$FSNAME-*/foreign_symlink_enable=1
3289
3290         # foreign symlink LMV format is a partial path by default
3291
3292         # create foreign dir (lfs + API)
3293         $LFS mkdir --foreign=symlink --xattr="${uuid1}/${uuid2}" \
3294                 --flags=0xda05 --mode 0750 $DIR/$tdir/${tdir} ||
3295                 error "$DIR/$tdir/${tdir}: create failed"
3296
3297         $LFS getdirstripe -v $DIR/$tdir/${tdir}
3298
3299         $LFS getdirstripe -v $DIR/$tdir/${tdir} |
3300                 grep "lfm_magic:.*0x0CD50CD0" ||
3301                 error "$DIR/$tdir/${tdir}: invalid LMV EA magic"
3302         $LFS getdirstripe -v $DIR/$tdir/${tdir} | grep "lfm_type:.*symlink" ||
3303                 error "$DIR/$tdir/${tdir}: invalid LMV EA type"
3304         $LFS getdirstripe -v $DIR/$tdir/${tdir} |
3305                 grep "lfm_flags:.*0x0000DA05" ||
3306                 error "$DIR/$tdir/${tdir}: invalid LMV EA flags"
3307         $LFS getdirstripe $DIR/$tdir/${tdir} |
3308                 grep "lfm_value.*${uuid1}/${uuid2}" ||
3309                 error "$DIR/$tdir/${tdir}: invalid LMV EA value"
3310
3311         # file create in dir should fail
3312         # ("/{foreign_symlink_prefix}/${uuid1}/${uuid2}/" missing)
3313         touch $DIR/$tdir/$tdir/$tfile && error "$DIR/$tdir: file create should fail"
3314
3315         # rename should succeed
3316         mv $DIR/$tdir/$tdir $DIR/$tdir/${tdir}.new ||
3317                 error "$DIR/$tdir/$tdir: rename of foreign_symlink dir has failed"
3318
3319         #remove foreign_symlink dir should fail
3320         rmdir $DIR/$tdir/${tdir}.new &&
3321                 error "$DIR/$tdir/${tdir}.new: remove of foreign_symlink dir should fail"
3322
3323         #test fake symlink
3324         mkdir -p /tmp/${uuid1}/${uuid2} ||
3325                 error "/tmp/${uuid1}/${uuid2}: mkdir has failed"
3326         echo FOOFOO > /tmp/${uuid1}/${uuid2}/foo ||
3327                 error "/tmp/${uuid1}/${uuid2}/foo: echo has failed"
3328         $LCTL set_param llite/$FSNAME-*/foreign_symlink_prefix=/tmp/
3329         $CHECKSTAT -t link -l /tmp/${uuid1}/${uuid2} $DIR/$tdir/${tdir}.new ||
3330                 error "$DIR/$tdir/${tdir}.new: not seen as a symlink"
3331         cat $DIR/$tdir/${tdir}.new/foo | grep FOOFOO ||
3332                 error "$DIR/$tdir/${tdir}.new: symlink resolution has failed"
3333
3334         #check that getstripe fails now that foreign_symlink enabled
3335         $LFS getdirstripe $DIR/$tdir/${tdir}.new ||
3336                 error "$DIR/$tdir/${tdir}.new: getdirstripe should still work with foreign_symlink enabled"
3337
3338         # file create in dir should work now
3339         cp /etc/passwd $DIR/$tdir/${tdir}.new/$tfile ||
3340                 error "$DIR/$tdir/${tdir}.new/$tfile: file create should fail"
3341         diff /etc/passwd $DIR/$tdir/${tdir}.new/$tfile ||
3342                 error "$DIR/$tdir/${tdir}.new/$tfile: diff has failed"
3343         diff /etc/passwd /tmp/${uuid1}/${uuid2}/$tfile ||
3344                 error "/tmp/${uuid1}/${uuid2}/$tfile: diff has failed"
3345
3346         # chmod should still succeed
3347         chmod 755 $DIR/$tdir/${tdir}.new ||
3348                 error "$DIR/$tdir/${tdir}.new: chmod has failed"
3349
3350         # chown should still succeed
3351         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/${tdir}.new ||
3352                 error "$DIR/$tdir/${tdir}.new: chown has failed"
3353
3354         # rename should still succeed
3355         mv $DIR/$tdir/${tdir}.new $DIR/$tdir/${tdir} ||
3356                 error "$DIR/$tdir/${tdir}.new: rename of foreign_symlink dir has failed"
3357
3358         #remove foreign_symlink dir should still fail
3359         rmdir $DIR/$tdir/${tdir} &&
3360                 error "$DIR/$tdir/${tdir}: remove of foreign_symlink dir should fail"
3361
3362         #use special ioctl() to unlink foreign_symlink file
3363         $LFS unlink_foreign $DIR/$tdir/${tdir} ||
3364                 error "$DIR/$tdir/$tdir: unlink/ioctl failed"
3365
3366         #created file should still exist
3367         [[ -f /tmp/${uuid1}/${uuid2}/$tfile ]] ||
3368                 error "/tmp/${uuid1}/${uuid2}/$tfile has been removed"
3369         diff /etc/passwd /tmp/${uuid1}/${uuid2}/$tfile ||
3370                 error "/tmp/${uuid1}/${uuid2}/$tfile: diff has failed"
3371 }
3372 run_test 27P "basic ops on foreign dir of foreign_symlink type"
3373
3374 test_27Q() {
3375         rm -f $TMP/$tfile $TMP/$tfile.loop $TMP/$tfile.none $TMP/$tfile.broken
3376         stack_trap "rm -f $TMP/$tfile*"
3377
3378         test_mkdir $DIR/$tdir-1
3379         test_mkdir $DIR/$tdir-2
3380
3381         echo 'It is what it is' > $DIR/$tdir-1/$tfile
3382         lov_getstripe_old $DIR/$tdir-1/$tfile || error "$DIR/$tdir-1/$tfile: rc = $?"
3383
3384         ln -s $DIR/$tdir-1/$tfile $DIR/$tdir-2/$tfile
3385         lov_getstripe_old $DIR/$tdir-2/$tfile || error "$DIR/$tdir-2/$tfile: rc = $?"
3386
3387         ln -s $DIR/$tdir-1/$tfile $TMP/$tfile
3388         lov_getstripe_old $TMP/$tfile || error "$TMP/$tfile: rc = $?"
3389
3390         # Create some bad symlinks and ensure that we don't loop
3391         # forever or something. These should return ELOOP (40) and
3392         # ENOENT (2) but I don't want to test for that because there's
3393         # always some weirdo architecture that needs to ruin
3394         # everything by defining these error numbers differently.
3395
3396         ln -s $TMP/$tfile.loop $TMP/$tfile.loop
3397         lov_getstripe_old $TMP/$tfile.loop && error "$TMP/$tfile.loop: rc = $?"
3398
3399         ln -s $TMP/$tfile.none $TMP/$tfile.broken
3400         lov_getstripe_old $TMP/$tfile.broken && error "$TMP/$tfile.broken: rc = $?"
3401
3402         return 0
3403 }
3404 run_test 27Q "llapi_file_get_stripe() works on symlinks"
3405
3406 test_27R() {
3407         (( $MDS1_VERSION >= $(version_code 2.14.55) )) ||
3408                 skip "need MDS 2.14.55 or later"
3409         (( $OSTCOUNT >= 2 )) || skip_env "needs at least 2 OSTs"
3410
3411         local testdir="$DIR/$tdir"
3412         test_mkdir -p $testdir
3413         stack_trap "rm -rf $testdir"
3414         $LFS setstripe -c -1 $testdir || error "setstripe failed"
3415
3416         local f1="$testdir/f1"
3417         touch $f1 || error "failed to touch $f1"
3418         local count=$($LFS getstripe -c $f1)
3419         (( $count == $OSTCOUNT )) || error "wrong stripe count"
3420
3421         do_facet $SINGLEMDS $LCTL set_param lod.*.max_stripecount=-1
3422         (( $? == 34 )) || error "setting max_stripecount to -1 should fail and return ERANGE"
3423
3424         local maxcount=$(($OSTCOUNT - 1))
3425         local mdts=$(comma_list $(mdts_nodes))
3426         do_nodes $mdts $LCTL set_param lod.*.max_stripecount=$maxcount
3427         stack_trap "do_nodes $mdts $LCTL set_param lod.*.max_stripecount=0"
3428
3429         local f2="$testdir/f2"
3430         touch $f2 || error "failed to touch $f2"
3431         local count=$($LFS getstripe -c $f2)
3432         (( $count == $maxcount )) || error "wrong stripe count"
3433 }
3434 run_test 27R "test max_stripecount limitation when stripe count is set to -1"
3435
3436 test_27T() {
3437         [ $(facet_host client) == $(facet_host ost1) ] &&
3438                 skip "need ost1 and client on different nodes"
3439
3440 #define OBD_FAIL_OSC_NO_GRANT            0x411
3441         $LCTL set_param fail_loc=0x20000411 fail_val=1
3442 #define OBD_FAIL_OST_ENOSPC              0x215
3443         do_facet ost1 "$LCTL set_param fail_loc=0x80000215"
3444         $LFS setstripe -i 0 -c 1 $DIR/$tfile
3445         $MULTIOP $DIR/$tfile oO_WRONLY:P$((4 * 1024 * 1024 + 10 * 4096))c ||
3446                 error "multiop failed"
3447 }
3448 run_test 27T "no eio on close on partial write due to enosp"
3449
3450 test_27U() {
3451         local dir=$DIR/$tdir
3452         local file=$dir/$tfile
3453         local append_pool=${TESTNAME}-append
3454         local normal_pool=${TESTNAME}-normal
3455         local pool
3456         local stripe_count
3457         local stripe_count2
3458         local mdts=$(comma_list $(mdts_nodes))
3459
3460         (( $MDS1_VERSION >= $(version_code 2.15.51) )) ||
3461                 skip "Need MDS version at least 2.15.51 for append pool feature"
3462
3463         # Validate existing append_* params and ensure restore
3464         pool=$(do_facet mds1 $LCTL get_param -n mdd.$FSNAME-MDT0000.append_pool)
3465         [[ "$pool" == "" ]] || error "expected append_pool == '', got '$pool'"
3466         stack_trap "do_nodes $mdts $LCTL set_param mdd.*.append_pool=none"
3467
3468         stripe_count=$(do_facet mds1 $LCTL get_param -n mdd.$FSNAME-MDT0000.append_stripe_count)
3469         ((stripe_count == 1)) || error "expected append_stripe_count != 0, got $stripe_count"
3470         stack_trap "do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=$stripe_count"
3471
3472         pool_add $append_pool || error "pool creation failed"
3473         pool_add_targets $append_pool 0 1 || error "Pool add targets failed"
3474
3475         pool_add $normal_pool || error "pool creation failed"
3476         pool_add_targets $normal_pool 0 1 || error "Pool add targets failed"
3477
3478         test_mkdir $dir
3479         $LFS setstripe -E 1M -c 1 -p $normal_pool -E 2M -c 2 -p $normal_pool -E eof -c -1 $dir
3480
3481         echo XXX >> $file.1
3482         $LFS getstripe $file.1
3483
3484         pool=$($LFS getstripe -p $file.1)
3485         [[ "$pool" == "$normal_pool" ]] || error "got pool '$pool', expected '$normal_pool'"
3486
3487         stripe_count2=$($LFS getstripe -c $file.1)
3488         ((stripe_count2 == stripe_count)) ||
3489                 error "got stripe_count '$stripe_count2', expected '$stripe_count'"
3490
3491         do_nodes $mdts $LCTL set_param mdd.*.append_pool=$append_pool
3492
3493         echo XXX >> $file.2
3494         $LFS getstripe $file.2
3495
3496         pool=$($LFS getstripe -p $file.2)
3497         [[ "$pool" == "$append_pool" ]] || error "got pool '$pool', expected '$append_pool'"
3498
3499         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=2
3500
3501         echo XXX >> $file.3
3502         $LFS getstripe $file.3
3503
3504         stripe_count2=$($LFS getstripe -c $file.3)
3505         ((stripe_count2 == 2)) || error "got stripe_count '$stripe_count2', expected 2"
3506 }
3507 run_test 27U "append pool and stripe count work with composite default layout"
3508
3509 # createtest also checks that device nodes are created and
3510 # then visible correctly (#2091)
3511 test_28() { # bug 2091
3512         test_mkdir $DIR/d28
3513         $CREATETEST $DIR/d28/ct || error "createtest failed"
3514 }
3515 run_test 28 "create/mknod/mkdir with bad file types ============"
3516
3517 test_29() {
3518         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3519
3520         [ $MDS1_VERSION -ge $(version_code 2.14.51) ] && {
3521                 disable_opencache
3522                 stack_trap "restore_opencache"
3523         }
3524
3525         sync; sleep 1; sync # flush out any dirty pages from previous tests
3526         cancel_lru_locks
3527         test_mkdir $DIR/d29
3528         touch $DIR/d29/foo
3529         log 'first d29'
3530         ls -l $DIR/d29
3531
3532         declare -i LOCKCOUNTORIG=0
3533         for lock_count in $(lctl get_param -n ldlm.namespaces.*mdc*.lock_count); do
3534                 let LOCKCOUNTORIG=$LOCKCOUNTORIG+$lock_count
3535         done
3536         [ $LOCKCOUNTORIG -eq 0 ] && error "No mdc lock count" && return 1
3537
3538         declare -i LOCKUNUSEDCOUNTORIG=0
3539         for unused_count in $(lctl get_param -n ldlm.namespaces.*mdc*.lock_unused_count); do
3540                 let LOCKUNUSEDCOUNTORIG=$LOCKUNUSEDCOUNTORIG+$unused_count
3541         done
3542
3543         log 'second d29'
3544         ls -l $DIR/d29
3545         log 'done'
3546
3547         declare -i LOCKCOUNTCURRENT=0
3548         for lock_count in $(lctl get_param -n ldlm.namespaces.*mdc*.lock_count); do
3549                 let LOCKCOUNTCURRENT=$LOCKCOUNTCURRENT+$lock_count
3550         done
3551
3552         declare -i LOCKUNUSEDCOUNTCURRENT=0
3553         for unused_count in $(lctl get_param -n ldlm.namespaces.*mdc*.lock_unused_count); do
3554                 let LOCKUNUSEDCOUNTCURRENT=$LOCKUNUSEDCOUNTCURRENT+$unused_count
3555         done
3556
3557         if [[ $LOCKCOUNTCURRENT -gt $LOCKCOUNTORIG ]]; then
3558                 $LCTL set_param -n ldlm.dump_namespaces ""
3559                 error "CURRENT: $LOCKCOUNTCURRENT > $LOCKCOUNTORIG"
3560                 $LCTL dk | sort -k4 -t: > $TMP/test_29.dk
3561                 log "dumped log to $TMP/test_29.dk (bug 5793)"
3562                 return 2
3563         fi
3564         if [[ $LOCKUNUSEDCOUNTCURRENT -gt $LOCKUNUSEDCOUNTORIG ]]; then
3565                 error "UNUSED: $LOCKUNUSEDCOUNTCURRENT > $LOCKUNUSEDCOUNTORIG"
3566                 $LCTL dk | sort -k4 -t: > $TMP/test_29.dk
3567                 log "dumped log to $TMP/test_29.dk (bug 5793)"
3568                 return 3
3569         fi
3570 }
3571 run_test 29 "IT_GETATTR regression  ============================"
3572
3573 test_30a() { # was test_30
3574         cp $(which ls) $DIR || cp /bin/ls $DIR
3575         $DIR/ls / || error "Can't execute binary from lustre"
3576         rm $DIR/ls
3577 }
3578 run_test 30a "execute binary from Lustre (execve) =============="
3579
3580 test_30b() {
3581         cp `which ls` $DIR || cp /bin/ls $DIR
3582         chmod go+rx $DIR/ls
3583         $RUNAS $DIR/ls / || error "Can't execute binary from lustre as non-root"
3584         rm $DIR/ls
3585 }
3586 run_test 30b "execute binary from Lustre as non-root ==========="
3587
3588 test_30c() { # b=22376
3589         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3590
3591         cp $(which ls) $DIR || cp /bin/ls $DIR
3592         chmod a-rw $DIR/ls
3593         cancel_lru_locks mdc
3594         cancel_lru_locks osc
3595         $RUNAS $DIR/ls / || error "Can't execute binary from lustre"
3596         rm -f $DIR/ls
3597 }
3598 run_test 30c "execute binary from Lustre without read perms ===="
3599
3600 test_30d() {
3601         cp $(which dd) $DIR || error "failed to copy dd to $DIR/dd"
3602
3603         for i in {1..10}; do
3604                 $DIR/dd bs=1M count=128 if=/dev/zero of=$DIR/$tfile &
3605                 local PID=$!
3606                 sleep 1
3607                 $LCTL set_param ldlm.namespaces.*MDT*.lru_size=clear
3608                 wait $PID || error "executing dd from Lustre failed"
3609                 rm -f $DIR/$tfile
3610         done
3611
3612         rm -f $DIR/dd
3613 }
3614 run_test 30d "execute binary from Lustre while clear locks"
3615
3616 test_31a() {
3617         $OPENUNLINK $DIR/f31 $DIR/f31 || error "openunlink failed"
3618         $CHECKSTAT -a $DIR/f31 || error "$DIR/f31 exists"
3619 }
3620 run_test 31a "open-unlink file =================================="
3621
3622 test_31b() {
3623         touch $DIR/f31 || error "touch $DIR/f31 failed"
3624         ln $DIR/f31 $DIR/f31b || error "ln failed"
3625         $MULTIOP $DIR/f31b Ouc || error "multiop failed"
3626         $CHECKSTAT -t file $DIR/f31 || error "$DIR/f31 not file type"
3627 }
3628 run_test 31b "unlink file with multiple links while open ======="
3629
3630 test_31c() {
3631         touch $DIR/f31 || error "touch $DIR/f31 failed"
3632         ln $DIR/f31 $DIR/f31c || error "ln failed"
3633         multiop_bg_pause $DIR/f31 O_uc ||
3634                 error "multiop_bg_pause for $DIR/f31 failed"
3635         MULTIPID=$!
3636         $MULTIOP $DIR/f31c Ouc
3637         kill -USR1 $MULTIPID
3638         wait $MULTIPID
3639 }
3640 run_test 31c "open-unlink file with multiple links ============="
3641
3642 test_31d() {
3643         opendirunlink $DIR/d31d $DIR/d31d || error "opendirunlink failed"
3644         $CHECKSTAT -a $DIR/d31d || error "$DIR/d31d exists"
3645 }
3646 run_test 31d "remove of open directory ========================="
3647
3648 test_31e() { # bug 2904
3649         openfilleddirunlink $DIR/d31e || error "openfilleddirunlink failed"
3650 }
3651 run_test 31e "remove of open non-empty directory ==============="
3652
3653 test_31f() { # bug 4554
3654         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3655
3656         set -vx
3657         test_mkdir $DIR/d31f
3658         $LFS setstripe -S 1048576 -c 1 $DIR/d31f
3659         cp /etc/hosts $DIR/d31f
3660         ls -l $DIR/d31f
3661         $LFS getstripe $DIR/d31f/hosts
3662         multiop_bg_pause $DIR/d31f D_c || return 1
3663         MULTIPID=$!
3664
3665         rm -rv $DIR/d31f || error "first of $DIR/d31f"
3666         test_mkdir $DIR/d31f
3667         $LFS setstripe -S 1048576 -c 1 $DIR/d31f
3668         cp /etc/hosts $DIR/d31f
3669         ls -l $DIR/d31f
3670         $LFS getstripe $DIR/d31f/hosts
3671         multiop_bg_pause $DIR/d31f D_c || return 1
3672         MULTIPID2=$!
3673
3674         kill -USR1 $MULTIPID || error "first opendir $MULTIPID not running"
3675         wait $MULTIPID || error "first opendir $MULTIPID failed"
3676
3677         sleep 6
3678
3679         kill -USR1 $MULTIPID2 || error "second opendir $MULTIPID not running"
3680         wait $MULTIPID2 || error "second opendir $MULTIPID2 failed"
3681         set +vx
3682 }
3683 run_test 31f "remove of open directory with open-unlink file ==="
3684
3685 test_31g() {
3686         echo "-- cross directory link --"
3687         test_mkdir -c1 $DIR/${tdir}ga
3688         test_mkdir -c1 $DIR/${tdir}gb
3689         touch $DIR/${tdir}ga/f
3690         ln $DIR/${tdir}ga/f $DIR/${tdir}gb/g
3691         $CHECKSTAT -t file $DIR/${tdir}ga/f || error "source"
3692         [ `stat -c%h $DIR/${tdir}ga/f` == '2' ] || error "source nlink"
3693         $CHECKSTAT -t file $DIR/${tdir}gb/g || error "target"
3694         [ `stat -c%h $DIR/${tdir}gb/g` == '2' ] || error "target nlink"
3695 }
3696 run_test 31g "cross directory link==============="
3697
3698 test_31h() {
3699         echo "-- cross directory link --"
3700         test_mkdir -c1 $DIR/${tdir}
3701         test_mkdir -c1 $DIR/${tdir}/dir
3702         touch $DIR/${tdir}/f
3703         ln $DIR/${tdir}/f $DIR/${tdir}/dir/g
3704         $CHECKSTAT -t file $DIR/${tdir}/f || error "source"
3705         [ `stat -c%h $DIR/${tdir}/f` == '2' ] || error "source nlink"
3706         $CHECKSTAT -t file $DIR/${tdir}/dir/g || error "target"
3707         [ `stat -c%h $DIR/${tdir}/dir/g` == '2' ] || error "target nlink"
3708 }
3709 run_test 31h "cross directory link under child==============="
3710
3711 test_31i() {
3712         echo "-- cross directory link --"
3713         test_mkdir -c1 $DIR/$tdir
3714         test_mkdir -c1 $DIR/$tdir/dir
3715         touch $DIR/$tdir/dir/f
3716         ln $DIR/$tdir/dir/f $DIR/$tdir/g
3717         $CHECKSTAT -t file $DIR/$tdir/dir/f || error "source"
3718         [ `stat -c%h $DIR/$tdir/dir/f` == '2' ] || error "source nlink"
3719         $CHECKSTAT -t file $DIR/$tdir/g || error "target"
3720         [ `stat -c%h $DIR/$tdir/g` == '2' ] || error "target nlink"
3721 }
3722 run_test 31i "cross directory link under parent==============="
3723
3724 test_31j() {
3725         test_mkdir -c1 -p $DIR/$tdir
3726         test_mkdir -c1 -p $DIR/$tdir/dir1
3727         ln $DIR/$tdir/dir1 $DIR/$tdir/dir2 && error "ln for dir"
3728         link $DIR/$tdir/dir1 $DIR/$tdir/dir3 && error "link for dir"
3729         mlink $DIR/$tdir/dir1 $DIR/$tdir/dir4 && error "mlink for dir"
3730         mlink $DIR/$tdir/dir1 $DIR/$tdir/dir1 && error "mlink to the same dir"
3731         return 0
3732 }
3733 run_test 31j "link for directory==============="
3734
3735 test_31k() {
3736         test_mkdir -c1 -p $DIR/$tdir
3737         touch $DIR/$tdir/s
3738         touch $DIR/$tdir/exist
3739         mlink $DIR/$tdir/s $DIR/$tdir/t || error "mlink"
3740         mlink $DIR/$tdir/s $DIR/$tdir/exist && error "mlink to exist file"
3741         mlink $DIR/$tdir/s $DIR/$tdir/s && error "mlink to the same file"
3742         mlink $DIR/$tdir/s $DIR/$tdir && error "mlink to parent dir"
3743         mlink $DIR/$tdir $DIR/$tdir/s && error "mlink parent dir to target"
3744         mlink $DIR/$tdir/not-exist $DIR/$tdir/foo && error "mlink non-existing to new"
3745         mlink $DIR/$tdir/not-exist $DIR/$tdir/s && error "mlink non-existing to exist"
3746         return 0
3747 }
3748 run_test 31k "link to file: the same, non-existing, dir==============="
3749
3750 test_31l() {
3751         local ln_ver=$(ln --version | awk '/coreutils/ { print $4 }')
3752
3753         (( $(version_code $ln_ver) < $(version_code 8.31) )) ||
3754         (( $(version_code $(uname -r)) >= $(version_code 5.18) )) ||
3755                 skip "need coreutils < 8.31 or kernel >= 5.18 for ln"
3756
3757         touch $DIR/$tfile || error "create failed"
3758         mkdir $DIR/$tdir || error "mkdir failed"
3759         ln $DIR/$tfile $DIR/$tdir/ || error "ln to '$tdir/' failed"
3760 }
3761 run_test 31l "link to file: target dir has trailing slash"
3762
3763 test_31m() {
3764         mkdir $DIR/d31m
3765         touch $DIR/d31m/s
3766         mkdir $DIR/d31m2
3767         touch $DIR/d31m2/exist
3768         mlink $DIR/d31m/s $DIR/d31m2/t || error "mlink"
3769         mlink $DIR/d31m/s $DIR/d31m2/exist && error "mlink to exist file"
3770         mlink $DIR/d31m/s $DIR/d31m2 && error "mlink to parent dir"
3771         mlink $DIR/d31m2 $DIR/d31m/s && error "mlink parent dir to target"
3772         mlink $DIR/d31m/not-exist $DIR/d31m2/foo && error "mlink non-existing to new"
3773         mlink $DIR/d31m/not-exist $DIR/d31m2/s && error "mlink non-existing to exist"
3774         return 0
3775 }
3776 run_test 31m "link to file: the same, non-existing, dir==============="
3777
3778 test_31n() {
3779         touch $DIR/$tfile || error "cannot create '$DIR/$tfile'"
3780         nlink=$(stat --format=%h $DIR/$tfile)
3781         [ ${nlink:--1} -eq 1 ] || error "nlink is $nlink, expected 1"
3782         local fd=$(free_fd)
3783         local cmd="exec $fd<$DIR/$tfile"
3784         eval $cmd
3785         cmd="exec $fd<&-"
3786         trap "eval $cmd" EXIT
3787         nlink=$(stat --dereference --format=%h /proc/self/fd/$fd)
3788         [ ${nlink:--1} -eq 1 ] || error "nlink is $nlink, expected 1"
3789         rm $DIR/$tfile || error "cannot remove '$DIR/$tfile'"
3790         nlink=$(stat --dereference --format=%h /proc/self/fd/$fd)
3791         [ ${nlink:--1} -eq 0 ] || error "nlink is $nlink, expected 0"
3792         eval $cmd
3793 }
3794 run_test 31n "check link count of unlinked file"
3795
3796 link_one() {
3797         local tempfile=$(mktemp $1_XXXXXX)
3798         mlink $tempfile $1 2> /dev/null &&
3799                 echo "$BASHPID: link $tempfile to $1 succeeded"
3800         munlink $tempfile
3801 }
3802
3803 test_31o() { # LU-2901
3804         test_mkdir $DIR/$tdir
3805         for LOOP in $(seq 100); do
3806                 rm -f $DIR/$tdir/$tfile*
3807                 for THREAD in $(seq 8); do
3808                         link_one $DIR/$tdir/$tfile.$LOOP &
3809                 done
3810                 wait
3811                 local LINKS=$(ls -1 $DIR/$tdir | grep -c $tfile.$LOOP)
3812                 [[ $LINKS -gt 1 ]] && ls $DIR/$tdir &&
3813                         error "$LINKS duplicate links to $tfile.$LOOP" &&
3814                         break || true
3815         done
3816 }
3817 run_test 31o "duplicate hard links with same filename"
3818
3819 test_31p() {
3820         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
3821
3822         test_mkdir $DIR/$tdir
3823         $LFS setdirstripe -i0 -c2 $DIR/$tdir/striped_dir
3824         $LFS setdirstripe -D -c2 -H all_char $DIR/$tdir/striped_dir
3825
3826         opendirunlink $DIR/$tdir/striped_dir/test1 ||
3827                 error "open unlink test1 failed"
3828         opendirunlink $DIR/$tdir/striped_dir/test2 ||
3829                 error "open unlink test2 failed"
3830
3831         $CHECKSTAT -a $DIR/$tdir/striped_dir/test1 ||
3832                 error "test1 still exists"
3833         $CHECKSTAT -a $DIR/$tdir/striped_dir/test2 ||
3834                 error "test2 still exists"
3835 }
3836 run_test 31p "remove of open striped directory"
3837
3838 test_31q() {
3839         [ $MDSCOUNT -lt 3 ] && skip_env "needs >= 3 MDTs"
3840
3841         $LFS mkdir -i 3,1 $DIR/$tdir || error "mkdir failed"
3842         index=$($LFS getdirstripe -i $DIR/$tdir)
3843         [ $index -eq 3 ] || error "first stripe index $index != 3"
3844         index=$($LFS getdirstripe $DIR/$tdir | tail -1 | awk '{print $1}')
3845         [ $index -eq 1 ] || error "second stripe index $index != 1"
3846
3847         # when "-c <stripe_count>" is set, the number of MDTs specified after
3848         # "-i" should equal to the stripe count
3849         $LFS mkdir -i 3,1 -c 3 $DIR/$tdir.2 && error "mkdir should fail" || true
3850 }
3851 run_test 31q "create striped directory on specific MDTs"
3852
3853 #LU-14949
3854 test_31r() {
3855         touch $DIR/$tfile.target
3856         touch $DIR/$tfile.source
3857
3858         #OBD_FAIL_LLITE_OPEN_DELAY 0x1419
3859         $LCTL set_param fail_loc=0x1419 fail_val=3
3860         cat $DIR/$tfile.target &
3861         CATPID=$!
3862
3863         # Guarantee open is waiting before we get here
3864         sleep 1
3865         mv $DIR/$tfile.source $DIR/$tfile.target
3866
3867         wait $CATPID
3868         RC=$?
3869         if [[ $RC -ne 0 ]]; then
3870                 error "open with cat failed, rc=$RC"
3871         fi
3872 }
3873 run_test 31r "open-rename(replace) race"
3874
3875 cleanup_test32_mount() {
3876         local rc=0
3877         trap 0
3878         local loopdev=$(losetup -a | grep $EXT2_DEV | sed -ne 's/:.*$//p')
3879         $UMOUNT $DIR/$tdir/ext2-mountpoint || rc=$?
3880         losetup -d $loopdev || true
3881         rm -rf $DIR/$tdir
3882         return $rc
3883 }
3884
3885 test_32a() {
3886         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3887
3888         echo "== more mountpoints and symlinks ================="
3889         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
3890         trap cleanup_test32_mount EXIT
3891         test_mkdir -p $DIR/$tdir/ext2-mountpoint
3892         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
3893                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
3894         $CHECKSTAT -t dir $DIR/$tdir/ext2-mountpoint/.. ||
3895                 error "$DIR/$tdir/ext2-mountpoint/.. not dir type"
3896         cleanup_test32_mount
3897 }
3898 run_test 32a "stat d32a/ext2-mountpoint/.. ====================="
3899
3900 test_32b() {
3901         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3902
3903         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
3904         trap cleanup_test32_mount EXIT
3905         test_mkdir -p $DIR/$tdir/ext2-mountpoint
3906         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
3907                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
3908         ls -al $DIR/$tdir/ext2-mountpoint/.. ||
3909                 error "Can't list $DIR/$tdir/ext2-mountpoint/.."
3910         cleanup_test32_mount
3911 }
3912 run_test 32b "open d32b/ext2-mountpoint/.. ====================="
3913
3914 test_32c() {
3915         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3916
3917         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
3918         trap cleanup_test32_mount EXIT
3919         test_mkdir -p $DIR/$tdir/ext2-mountpoint
3920         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
3921                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
3922         test_mkdir -p $DIR/$tdir/d2/test_dir
3923         $CHECKSTAT -t dir $DIR/$tdir/ext2-mountpoint/../d2/test_dir ||
3924                 error "$DIR/$tdir/ext2-mountpoint/../d2/test_dir not dir type"
3925         cleanup_test32_mount
3926 }
3927 run_test 32c "stat d32c/ext2-mountpoint/../d2/test_dir ========="
3928
3929 test_32d() {
3930         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3931
3932         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
3933         trap cleanup_test32_mount EXIT
3934         test_mkdir -p $DIR/$tdir/ext2-mountpoint
3935         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
3936                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
3937         test_mkdir -p $DIR/$tdir/d2/test_dir
3938         ls -al $DIR/$tdir/ext2-mountpoint/../d2/test_dir ||
3939                 error "Can't list $DIR/$tdir/ext2-mountpoint/../d2/test_dir"
3940         cleanup_test32_mount
3941 }
3942 run_test 32d "open d32d/ext2-mountpoint/../d2/test_dir"
3943
3944 test_32e() {
3945         rm -fr $DIR/$tdir
3946         test_mkdir -p $DIR/$tdir/tmp
3947         local tmp_dir=$DIR/$tdir/tmp
3948         ln -s $DIR/$tdir $tmp_dir/symlink11
3949         ln -s $tmp_dir/symlink11 $tmp_dir/../symlink01
3950         $CHECKSTAT -t link $DIR/$tdir/tmp/symlink11 || error "symlink11 bad"
3951         $CHECKSTAT -t link $DIR/$tdir/symlink01 || error "symlink01 bad"
3952 }
3953 run_test 32e "stat d32e/symlink->tmp/symlink->lustre-subdir"
3954
3955 test_32f() {
3956         rm -fr $DIR/$tdir
3957         test_mkdir -p $DIR/$tdir/tmp
3958         local tmp_dir=$DIR/$tdir/tmp
3959         ln -s $DIR/$tdir $tmp_dir/symlink11
3960         ln -s $tmp_dir/symlink11 $tmp_dir/../symlink01
3961         ls $DIR/$tdir/tmp/symlink11  || error "symlink11 bad"
3962         ls $DIR/$tdir/symlink01 || error "symlink01 bad"
3963 }
3964 run_test 32f "open d32f/symlink->tmp/symlink->lustre-subdir"
3965
3966 test_32g() {
3967         local tmp_dir=$DIR/$tdir/tmp
3968         test_mkdir -p $tmp_dir
3969         test_mkdir $DIR/${tdir}2
3970         ln -s $DIR/${tdir}2 $tmp_dir/symlink12
3971         ln -s $tmp_dir/symlink12 $tmp_dir/../symlink02
3972         $CHECKSTAT -t link $tmp_dir/symlink12 || error "symlink12 not a link"
3973         $CHECKSTAT -t link $DIR/$tdir/symlink02 || error "symlink02 not a link"
3974         $CHECKSTAT -t dir -f $tmp_dir/symlink12 || error "symlink12 not a dir"
3975         $CHECKSTAT -t dir -f $DIR/$tdir/symlink02 || error "symlink12 not a dir"
3976 }
3977 run_test 32g "stat d32g/symlink->tmp/symlink->lustre-subdir/${tdir}2"
3978
3979 test_32h() {
3980         rm -fr $DIR/$tdir $DIR/${tdir}2
3981         tmp_dir=$DIR/$tdir/tmp
3982         test_mkdir -p $tmp_dir
3983         test_mkdir $DIR/${tdir}2
3984         ln -s $DIR/${tdir}2 $tmp_dir/symlink12
3985         ln -s $tmp_dir/symlink12 $tmp_dir/../symlink02
3986         ls $tmp_dir/symlink12 || error "listing symlink12"
3987         ls $DIR/$tdir/symlink02  || error "listing symlink02"
3988 }
3989 run_test 32h "open d32h/symlink->tmp/symlink->lustre-subdir/${tdir}2"
3990
3991 test_32i() {
3992         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3993
3994         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
3995         trap cleanup_test32_mount EXIT
3996         test_mkdir -p $DIR/$tdir/ext2-mountpoint
3997         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
3998                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
3999         touch $DIR/$tdir/test_file
4000         $CHECKSTAT -t file $DIR/$tdir/ext2-mountpoint/../test_file ||
4001                 error "$DIR/$tdir/ext2-mountpoint/../test_file not file type"
4002         cleanup_test32_mount
4003 }
4004 run_test 32i "stat d32i/ext2-mountpoint/../test_file ==========="
4005
4006 test_32j() {
4007         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4008
4009         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
4010         trap cleanup_test32_mount EXIT
4011         test_mkdir -p $DIR/$tdir/ext2-mountpoint
4012         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
4013                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
4014         touch $DIR/$tdir/test_file
4015         cat $DIR/$tdir/ext2-mountpoint/../test_file ||
4016                 error "Can't open $DIR/$tdir/ext2-mountpoint/../test_file"
4017         cleanup_test32_mount
4018 }
4019 run_test 32j "open d32j/ext2-mountpoint/../test_file ==========="
4020
4021 test_32k() {
4022         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4023
4024         rm -fr $DIR/$tdir
4025         trap cleanup_test32_mount EXIT
4026         test_mkdir -p $DIR/$tdir/ext2-mountpoint
4027         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
4028                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
4029         test_mkdir -p $DIR/$tdir/d2
4030         touch $DIR/$tdir/d2/test_file || error "touch failed"
4031         $CHECKSTAT -t file $DIR/$tdir/ext2-mountpoint/../d2/test_file ||
4032                 error "$DIR/$tdir/ext2-mountpoint/../d2/test_file not file type"
4033         cleanup_test32_mount
4034 }
4035 run_test 32k "stat d32k/ext2-mountpoint/../d2/test_file ========"
4036
4037 test_32l() {
4038         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4039
4040         rm -fr $DIR/$tdir
4041         trap cleanup_test32_mount EXIT
4042         test_mkdir -p $DIR/$tdir/ext2-mountpoint
4043         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
4044                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
4045         test_mkdir -p $DIR/$tdir/d2
4046         touch $DIR/$tdir/d2/test_file || error "touch failed"
4047         cat  $DIR/$tdir/ext2-mountpoint/../d2/test_file ||
4048                 error "Can't open $DIR/$tdir/ext2-mountpoint/../d2/test_file"
4049         cleanup_test32_mount
4050 }
4051 run_test 32l "open d32l/ext2-mountpoint/../d2/test_file ========"
4052
4053 test_32m() {
4054         rm -fr $DIR/d32m
4055         test_mkdir -p $DIR/d32m/tmp
4056         TMP_DIR=$DIR/d32m/tmp
4057         ln -s $DIR $TMP_DIR/symlink11
4058         ln -s $TMP_DIR/symlink11 $TMP_DIR/../symlink01
4059         $CHECKSTAT -t link $DIR/d32m/tmp/symlink11 ||
4060                 error "symlink11 not a link"
4061         $CHECKSTAT -t link $DIR/d32m/symlink01 ||
4062                 error "symlink01 not a link"
4063 }
4064 run_test 32m "stat d32m/symlink->tmp/symlink->lustre-root ======"
4065
4066 test_32n() {
4067         rm -fr $DIR/d32n
4068         test_mkdir -p $DIR/d32n/tmp
4069         TMP_DIR=$DIR/d32n/tmp
4070         ln -s $DIR $TMP_DIR/symlink11
4071         ln -s $TMP_DIR/symlink11 $TMP_DIR/../symlink01
4072         ls -l $DIR/d32n/tmp/symlink11  || error "listing symlink11"
4073         ls -l $DIR/d32n/symlink01 || error "listing symlink01"
4074 }
4075 run_test 32n "open d32n/symlink->tmp/symlink->lustre-root ======"
4076
4077 test_32o() {
4078         touch $DIR/$tfile
4079         test_mkdir -p $DIR/d32o/tmp
4080         TMP_DIR=$DIR/d32o/tmp
4081         ln -s $DIR/$tfile $TMP_DIR/symlink12
4082         ln -s $TMP_DIR/symlink12 $TMP_DIR/../symlink02
4083         $CHECKSTAT -t link $DIR/d32o/tmp/symlink12 ||
4084                 error "symlink12 not a link"
4085         $CHECKSTAT -t link $DIR/d32o/symlink02 || error "symlink02 not a link"
4086         $CHECKSTAT -t file -f $DIR/d32o/tmp/symlink12 ||
4087                 error "$DIR/d32o/tmp/symlink12 not file type"
4088         $CHECKSTAT -t file -f $DIR/d32o/symlink02 ||
4089                 error "$DIR/d32o/symlink02 not file type"
4090 }
4091 run_test 32o "stat d32o/symlink->tmp/symlink->lustre-root/$tfile"
4092
4093 test_32p() {
4094         log 32p_1
4095         rm -fr $DIR/d32p
4096         log 32p_2
4097         rm -f $DIR/$tfile
4098         log 32p_3
4099         touch $DIR/$tfile
4100         log 32p_4
4101         test_mkdir -p $DIR/d32p/tmp
4102         log 32p_5
4103         TMP_DIR=$DIR/d32p/tmp
4104         log 32p_6
4105         ln -s $DIR/$tfile $TMP_DIR/symlink12
4106         log 32p_7
4107         ln -s $TMP_DIR/symlink12 $TMP_DIR/../symlink02
4108         log 32p_8
4109         cat $DIR/d32p/tmp/symlink12 ||
4110                 error "Can't open $DIR/d32p/tmp/symlink12"
4111         log 32p_9
4112         cat $DIR/d32p/symlink02 || error "Can't open $DIR/d32p/symlink02"
4113         log 32p_10
4114 }
4115 run_test 32p "open d32p/symlink->tmp/symlink->lustre-root/$tfile"
4116
4117 test_32q() {
4118         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4119
4120         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
4121         trap cleanup_test32_mount EXIT
4122         test_mkdir -p $DIR/$tdir/ext2-mountpoint
4123         touch $DIR/$tdir/ext2-mountpoint/under_the_mount || error "touch failed"
4124         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
4125                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
4126         ls $DIR/$tdir/ext2-mountpoint | grep "\<under_the_mount\>" && error
4127         cleanup_test32_mount
4128 }
4129 run_test 32q "stat follows mountpoints in Lustre (should return error)"
4130
4131 test_32r() {
4132         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4133
4134         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
4135         trap cleanup_test32_mount EXIT
4136         test_mkdir -p $DIR/$tdir/ext2-mountpoint
4137         touch $DIR/$tdir/ext2-mountpoint/under_the_mount || error "touch failed"
4138         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
4139                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
4140         ls $DIR/$tdir/ext2-mountpoint | grep -q under_the_mount && error || true
4141         cleanup_test32_mount
4142 }
4143 run_test 32r "opendir follows mountpoints in Lustre (should return error)"
4144
4145 test_33aa() {
4146         rm -f $DIR/$tfile
4147         touch $DIR/$tfile
4148         chmod 444 $DIR/$tfile
4149         chown $RUNAS_ID $DIR/$tfile
4150         log 33_1
4151         $RUNAS $OPENFILE -f O_RDWR $DIR/$tfile && error || true
4152         log 33_2
4153 }
4154 run_test 33aa "write file with mode 444 (should return error)"
4155
4156 test_33a() {
4157         rm -fr $DIR/$tdir
4158         test_mkdir $DIR/$tdir
4159         chown $RUNAS_ID $DIR/$tdir
4160         $RUNAS $OPENFILE -f O_RDWR:O_CREAT -m 0444 $DIR/$tdir/$tfile ||
4161                 error "$RUNAS create $tdir/$tfile failed"
4162         $RUNAS $OPENFILE -f O_RDWR:O_CREAT -m 0444 $DIR/$tdir/$tfile &&
4163                 error "open RDWR" || true
4164 }
4165 run_test 33a "test open file(mode=0444) with O_RDWR (should return error)"
4166
4167 test_33b() {
4168         rm -fr $DIR/$tdir
4169         test_mkdir $DIR/$tdir
4170         chown $RUNAS_ID $DIR/$tdir
4171         $RUNAS $OPENFILE -f 1286739555 $DIR/$tdir/$tfile || true
4172 }
4173 run_test 33b "test open file with malformed flags (No panic)"
4174
4175 test_33c() {
4176         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4177         remote_ost_nodsh && skip "remote OST with nodsh"
4178
4179         local ostnum
4180         local ostname
4181         local write_bytes
4182         local all_zeros
4183
4184         all_zeros=true
4185         test_mkdir $DIR/$tdir
4186         # Read: 0, Write: 4, create/destroy: 2/0, stat: 1, punch: 0
4187
4188         sync
4189         for ostnum in $(seq $OSTCOUNT); do
4190                 # test-framework's OST numbering is one-based, while Lustre's
4191                 # is zero-based
4192                 ostname=$(printf "$FSNAME-OST%.4x" $((ostnum - 1)))
4193                 # check if at least some write_bytes stats are counted
4194                 write_bytes=$(do_facet ost$ostnum lctl get_param -n \
4195                               obdfilter.$ostname.stats |
4196                               awk '/^write_bytes/ {print $7}' )
4197                 echo "baseline_write_bytes@ost$ostnum/$ostname=$write_bytes"
4198                 if (( ${write_bytes:-0} > 0 )); then
4199                         all_zeros=false
4200                         break
4201                 fi
4202         done
4203
4204         $all_zeros || return 0
4205
4206         # Write four bytes
4207         echo foo > $DIR/$tdir/bar
4208         # Really write them
4209         sync
4210
4211         # Total up write_bytes after writing.  We'd better find non-zeros.
4212         for ostnum in $(seq $OSTCOUNT); do
4213                 ostname=$(printf "$FSNAME-OST%.4x" $((ostnum - 1)))
4214                 write_bytes=$(do_facet ost$ostnum lctl get_param -n \
4215                               obdfilter/$ostname/stats |
4216                               awk '/^write_bytes/ {print $7}' )
4217                 echo "write_bytes@ost$ostnum/$ostname=$write_bytes"
4218                 if (( ${write_bytes:-0} > 0 )); then
4219                         all_zeros=false
4220                         break
4221                 fi
4222         done
4223
4224         if $all_zeros; then
4225                 for ostnum in $(seq $OSTCOUNT); do
4226                         ostname=$(printf "$FSNAME-OST%.4x" $((ostnum - 1)))
4227                         echo "Check write_bytes is in obdfilter.*.stats:"
4228                         do_facet ost$ostnum lctl get_param -n \
4229                                 obdfilter.$ostname.stats
4230                 done
4231                 error "OST not keeping write_bytes stats (b=22312)"
4232         fi
4233 }
4234 run_test 33c "test write_bytes stats"
4235
4236 test_33d() {
4237         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
4238         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4239
4240         local MDTIDX=1
4241         local remote_dir=$DIR/$tdir/remote_dir
4242
4243         test_mkdir $DIR/$tdir
4244         $LFS mkdir -i $MDTIDX $remote_dir ||
4245                 error "create remote directory failed"
4246
4247         touch $remote_dir/$tfile
4248         chmod 444 $remote_dir/$tfile
4249         chown $RUNAS_ID $remote_dir/$tfile
4250
4251         $RUNAS $OPENFILE -f O_RDWR $DIR/$tfile && error || true
4252
4253         chown $RUNAS_ID $remote_dir
4254         $RUNAS $OPENFILE -f O_RDWR:O_CREAT -m 0444 $remote_dir/f33 ||
4255                                         error "create" || true
4256         $RUNAS $OPENFILE -f O_RDWR:O_CREAT -m 0444 $remote_dir/f33 &&
4257                                     error "open RDWR" || true
4258         $RUNAS $OPENFILE -f 1286739555 $remote_dir/f33 || true
4259 }
4260 run_test 33d "openfile with 444 modes and malformed flags under remote dir"
4261
4262 test_33e() {
4263         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
4264
4265         mkdir $DIR/$tdir
4266
4267         $LFS setdirstripe -i0 -c2 $DIR/$tdir/striped_dir
4268         $LFS setdirstripe -i1 -c2 $DIR/$tdir/striped_dir1
4269         mkdir $DIR/$tdir/local_dir
4270
4271         local s0_mode=$(stat -c%f $DIR/$tdir/striped_dir)
4272         local s1_mode=$(stat -c%f $DIR/$tdir/striped_dir1)
4273         local l_mode=$(stat -c%f $DIR/$tdir/local_dir)
4274
4275         [ "$l_mode" = "$s0_mode" -a "$l_mode" = "$s1_mode" ] ||
4276                 error "mkdir $l_mode striped0 $s0_mode striped1 $s1_mode"
4277
4278         rmdir $DIR/$tdir/* || error "rmdir failed"
4279
4280         umask 777
4281         $LFS setdirstripe -i0 -c2 $DIR/$tdir/striped_dir
4282         $LFS setdirstripe -i1 -c2 $DIR/$tdir/striped_dir1
4283         mkdir $DIR/$tdir/local_dir
4284
4285         s0_mode=$(stat -c%f $DIR/$tdir/striped_dir)
4286         s1_mode=$(stat -c%f $DIR/$tdir/striped_dir1)
4287         l_mode=$(stat -c%f $DIR/$tdir/local_dir)
4288
4289         [ "$l_mode" = "$s0_mode" -a "$l_mode" = "$s1_mode" ] ||
4290                 error "mkdir $l_mode striped0 $s0_mode striped1 $s1_mode 777"
4291
4292         rmdir $DIR/$tdir/* || error "rmdir(umask 777) failed"
4293
4294         umask 000
4295         $LFS setdirstripe -i0 -c2 $DIR/$tdir/striped_dir
4296         $LFS setdirstripe -i1 -c2 $DIR/$tdir/striped_dir1
4297         mkdir $DIR/$tdir/local_dir
4298
4299         s0_mode=$(stat -c%f $DIR/$tdir/striped_dir)
4300         s1_mode=$(stat -c%f $DIR/$tdir/striped_dir1)
4301         l_mode=$(stat -c%f $DIR/$tdir/local_dir)
4302
4303         [ "$l_mode" = "$s0_mode" -a "$l_mode" = "$s1_mode" ] ||
4304                 error "mkdir $l_mode striped0 $s0_mode striped1 $s1_mode 0"
4305 }
4306 run_test 33e "mkdir and striped directory should have same mode"
4307
4308 cleanup_33f() {
4309         trap 0
4310         do_facet $SINGLEMDS $LCTL set_param mdt.*.enable_remote_dir_gid=0
4311 }
4312
4313 test_33f() {
4314         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
4315         remote_mds_nodsh && skip "remote MDS with nodsh"
4316
4317         mkdir $DIR/$tdir
4318         chmod go+rwx $DIR/$tdir
4319         do_facet $SINGLEMDS $LCTL set_param mdt.*.enable_remote_dir_gid=-1
4320         trap cleanup_33f EXIT
4321
4322         $RUNAS lfs mkdir -i 0 -c$MDSCOUNT $DIR/$tdir/striped_dir ||
4323                 error "cannot create striped directory"
4324
4325         $RUNAS touch $DIR/$tdir/striped_dir/{0..16} ||
4326                 error "cannot create files in striped directory"
4327
4328         $RUNAS rm $DIR/$tdir/striped_dir/{0..16} ||
4329                 error "cannot remove files in striped directory"
4330
4331         $RUNAS rmdir $DIR/$tdir/striped_dir ||
4332                 error "cannot remove striped directory"
4333
4334         cleanup_33f
4335 }
4336 run_test 33f "nonroot user can create, access, and remove a striped directory"
4337
4338 test_33g() {
4339         mkdir -p $DIR/$tdir/dir2
4340
4341         local err=$($RUNAS mkdir $DIR/$tdir/dir2 2>&1)
4342         echo $err
4343         [[ $err =~ "exists" ]] || error "Not exists error"
4344 }
4345 run_test 33g "nonroot user create already existing root created file"
4346
4347 sub_33h() {
4348         local hash_type=$1
4349         local count=250
4350
4351         test_mkdir -c $MDSCOUNT -H $hash_type $DIR/$tdir ||
4352                 error "lfs mkdir -H $hash_type $tdir failed"
4353         touch $DIR/$tdir/$tfile || error "touch $tfile failed"
4354
4355         local index=$($LFS getstripe -m $DIR/$tdir/$tfile)
4356         local index2
4357         local fname
4358
4359         for fname in $DIR/$tdir/$tfile.bak \
4360                      $DIR/$tdir/$tfile.SAV \
4361                      $DIR/$tdir/$tfile.orig \
4362                      $DIR/$tdir/$tfile~; do
4363                 touch $fname || error "touch $fname failed"
4364                 index2=$($LFS getstripe -m $fname)
4365                 (( $index == $index2 )) ||
4366                         error "$fname MDT index mismatch $index != $index2"
4367         done
4368
4369         local failed=0
4370         local patterns=(".$tfile.XXXXXX" "$tfile.XXXXXXXX")
4371         local pattern
4372
4373         for pattern in ${patterns[*]}; do
4374                 echo "pattern $pattern"
4375                 fname=$DIR/$tdir/$pattern
4376                 for (( i = 0; i < $count; i++ )); do
4377                         fname=$(mktemp $DIR/$tdir/$pattern) ||
4378                                 error "mktemp $DIR/$tdir/$pattern failed"
4379                         index2=$($LFS getstripe -m $fname)
4380                         (( $index == $index2 )) && continue
4381
4382                         failed=$((failed + 1))
4383                         echo "$fname MDT index mismatch $index != $index2"
4384                 done
4385         done
4386
4387         echo "$failed/$count MDT index mismatches, expect ~2-4"
4388         (( failed < 10 )) || error "MDT index mismatch $failed/$count times"
4389
4390         local same=0
4391         local expect
4392
4393         # verify that "crush" is still broken with all files on same MDT,
4394         # crush2 should have about 1/MDSCOUNT files on each MDT, with margin
4395         [[ "$hash_type" == "crush" ]] && expect=$count ||
4396                 expect=$((count / MDSCOUNT))
4397
4398         # crush2 doesn't put all-numeric suffixes on the same MDT,
4399         # filename like $tfile.12345678 should *not* be considered temp
4400         for pattern in ${patterns[*]}; do
4401                 local base=${pattern%%X*}
4402                 local suff=${pattern#$base}
4403
4404                 echo "pattern $pattern"
4405                 for (( i = 0; i < $count; i++ )); do
4406                         fname=$DIR/$tdir/$base$((${suff//X/1} + i))
4407                         touch $fname || error "touch $fname failed"
4408                         index2=$($LFS getstripe -m $fname)
4409                         (( $index != $index2 )) && continue
4410
4411                         same=$((same + 1))
4412                 done
4413         done
4414
4415         # the number of "bad" hashes is random, as it depends on the random
4416         # filenames generated by "mktemp".  Allow some margin in the results.
4417         echo "$((same/${#patterns[*]}))/$count matches, expect ~$expect for $1"
4418         (( same / ${#patterns[*]} <= expect * 9 / 7 &&
4419            same / ${#patterns[*]} > expect * 5 / 7 )) ||
4420                 error "MDT index match $((same / ${#patterns[*]}))/$count times"
4421         same=0
4422
4423         # crush2 doesn't put suffixes with special characters on the same MDT
4424         # filename like $tfile.txt.1234 should *not* be considered temp
4425         for pattern in ${patterns[*]}; do
4426                 local base=${pattern%%X*}
4427                 local suff=${pattern#$base}
4428
4429                 pattern=$base...${suff/XXX}
4430                 echo "pattern=$pattern"
4431                 for (( i = 0; i < $count; i++ )); do
4432                         fname=$(mktemp $DIR/$tdir/$pattern) ||
4433                                 error "touch $fname failed"
4434                         index2=$($LFS getstripe -m $fname)
4435                         (( $index != $index2 )) && continue
4436
4437                         same=$((same + 1))
4438                 done
4439         done
4440
4441         # the number of "bad" hashes is random, as it depends on the random
4442         # filenames generated by "mktemp".  Allow some margin in the results.
4443         echo "$((same/${#patterns[*]}))/$count matches, expect ~$expect for $1"
4444         (( same / ${#patterns[*]} <= expect * 9 / 7 &&
4445            same / ${#patterns[*]} > expect * 5 / 7 )) ||
4446                 error "MDT index match $((same / ${#patterns[*]}))/$count times"
4447 }
4448
4449 test_33h() {
4450         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
4451         (( $MDS1_VERSION >= $(version_code 2.13.50) )) ||
4452                 skip "Need MDS version at least 2.13.50"
4453
4454         sub_33h crush
4455 }
4456 run_test 33h "temp file is located on the same MDT as target (crush)"
4457
4458 test_33hh() {
4459         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
4460         echo "MDS1_VERSION=$MDS1_VERSION version_code=$(version_code 2.15.0)"
4461         (( $MDS1_VERSION > $(version_code 2.15.0) )) ||
4462                 skip "Need MDS version at least 2.15.0 for crush2"
4463
4464         sub_33h crush2
4465 }
4466 run_test 33hh "temp file is located on the same MDT as target (crush2)"
4467
4468 test_33i()
4469 {
4470         (( MDSCOUNT < 2 )) && skip "needs >= 2 MDTs"
4471
4472         local FNAME=$(str_repeat 'f' 250)
4473
4474         test_mkdir -i 0 -c $MDSCOUNT $DIR/$tdir || error "mkdir $tdir failed"
4475         createmany -o $DIR/$tdir/$FNAME 1000 || error "createmany failed"
4476
4477         local count
4478         local total
4479
4480         count=$($LFS getstripe -m $DIR/$tdir/* | grep -cw 1)
4481
4482         local MDC=$(lctl dl | awk '/MDT0001-mdc-[^M]/ { print $4 }')
4483
4484         lctl --device %$MDC deactivate
4485         stack_trap "lctl --device %$MDC activate"
4486         ls $DIR/$tdir > /dev/null && error "ls should return an error"
4487         total=$(\ls -l $DIR/$tdir | wc -l)
4488         # "ls -l" will list total in the first line
4489         total=$((total - 1))
4490         (( total + count == 1000 )) ||
4491                 error "ls list $total files, $count files on MDT1"
4492 }
4493 run_test 33i "striped directory can be accessed when one MDT is down"
4494
4495 test_33j() {
4496         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
4497
4498         mkdir -p $DIR/$tdir/
4499
4500         $LFS setdirstripe -D -i0,1 $DIR/$tdir/striped_dir_a &&
4501                 error "setdirstripe -D -i0,1 incorrectly succeeded"
4502
4503         $LFS setdirstripe -D -i0,1 -c1 $DIR/$tdir/striped_dir_b &&
4504                 error "setdirstripe -D -i0,1 -c1 incorrectly succeeded"
4505
4506         $LFS setdirstripe -D -i0,1 -c3 $DIR/$tdir/striped_dir_c &&
4507                 error "setdirstripe -D -i0,1 -c3 incorrectly succeeded"
4508
4509         $LFS setdirstripe -i0,1 $DIR/$tdir/striped_dir_e ||
4510                 error "-D was not specified, but still failed"
4511 }
4512 run_test 33j "lfs setdirstripe -D -i x,y,x should fail"
4513
4514 TEST_34_SIZE=${TEST_34_SIZE:-2000000000000}
4515 test_34a() {
4516         rm -f $DIR/f34
4517         $MCREATE $DIR/f34 || error "mcreate failed"
4518         $LFS getstripe $DIR/f34 2>&1 | grep -q "no stripe info" ||
4519                 error "getstripe failed"
4520         $TRUNCATE $DIR/f34 $TEST_34_SIZE || error "truncate failed"
4521         $LFS getstripe $DIR/f34 2>&1 | grep -q "no stripe info" ||
4522                 error "getstripe failed"
4523         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4524                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4525 }
4526 run_test 34a "truncate file that has not been opened ==========="
4527
4528 test_34b() {
4529         [ ! -f $DIR/f34 ] && test_34a
4530         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4531                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4532         $OPENFILE -f O_RDONLY $DIR/f34
4533         $LFS getstripe $DIR/f34 2>&1 | grep -q "no stripe info" ||
4534                 error "getstripe failed"
4535         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4536                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4537 }
4538 run_test 34b "O_RDONLY opening file doesn't create objects ====="
4539
4540 test_34c() {
4541         [ ! -f $DIR/f34 ] && test_34a
4542         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4543                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4544         $OPENFILE -f O_RDWR $DIR/f34
4545         $LFS getstripe $DIR/f34 2>&1 | grep -q "no stripe info" &&
4546                 error "$LFS getstripe failed"
4547         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4548                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4549 }
4550 run_test 34c "O_RDWR opening file-with-size works =============="
4551
4552 test_34d() {
4553         [ ! -f $DIR/f34 ] && test_34a
4554         dd if=/dev/zero of=$DIR/f34 conv=notrunc bs=4k count=1 ||
4555                 error "dd failed"
4556         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4557                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4558         rm $DIR/f34
4559 }
4560 run_test 34d "write to sparse file ============================="
4561
4562 test_34e() {
4563         rm -f $DIR/f34e
4564         $MCREATE $DIR/f34e || error "mcreate failed"
4565         $TRUNCATE $DIR/f34e 1000 || error "truncate failed"
4566         $CHECKSTAT -s 1000 $DIR/f34e ||
4567                 error "Size of $DIR/f34e not equal to 1000 bytes"
4568         $OPENFILE -f O_RDWR $DIR/f34e
4569         $CHECKSTAT -s 1000 $DIR/f34e ||
4570                 error "Size of $DIR/f34e not equal to 1000 bytes"
4571 }
4572 run_test 34e "create objects, some with size and some without =="
4573
4574 test_34f() { # bug 6242, 6243
4575         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4576
4577         SIZE34F=48000
4578         rm -f $DIR/f34f
4579         $MCREATE $DIR/f34f || error "mcreate failed"
4580         $TRUNCATE $DIR/f34f $SIZE34F || error "truncating $DIR/f3f to $SIZE34F"
4581         dd if=$DIR/f34f of=$TMP/f34f
4582         $CHECKSTAT -s $SIZE34F $TMP/f34f || error "$TMP/f34f not $SIZE34F bytes"
4583         dd if=/dev/zero of=$TMP/f34fzero bs=$SIZE34F count=1
4584         cmp $DIR/f34f $TMP/f34fzero || error "$DIR/f34f not all zero"
4585         cmp $TMP/f34f $TMP/f34fzero || error "$TMP/f34f not all zero"
4586         rm $TMP/f34f $TMP/f34fzero $DIR/f34f
4587 }
4588 run_test 34f "read from a file with no objects until EOF ======="
4589
4590 test_34g() {
4591         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4592
4593         dd if=/dev/zero of=$DIR/$tfile bs=1 count=100 seek=$TEST_34_SIZE ||
4594                 error "dd failed"
4595         $TRUNCATE $DIR/$tfile $((TEST_34_SIZE / 2))|| error "truncate failed"
4596         $CHECKSTAT -s $((TEST_34_SIZE / 2)) $DIR/$tfile ||
4597                 error "Size of $DIR/$tfile not equal to $((TEST_34_SIZE / 2))"
4598         cancel_lru_locks osc
4599         $CHECKSTAT -s $((TEST_34_SIZE / 2)) $DIR/$tfile ||
4600                 error "wrong size after lock cancel"
4601
4602         $TRUNCATE $DIR/$tfile $TEST_34_SIZE || error "truncate failed"
4603         $CHECKSTAT -s $TEST_34_SIZE $DIR/$tfile ||
4604                 error "expanding truncate failed"
4605         cancel_lru_locks osc
4606         $CHECKSTAT -s $TEST_34_SIZE $DIR/$tfile ||
4607                 error "wrong expanded size after lock cancel"
4608 }
4609 run_test 34g "truncate long file ==============================="
4610
4611 test_34h() {
4612         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4613
4614         local gid=10
4615         local sz=1000
4616
4617         dd if=/dev/zero of=$DIR/$tfile bs=1M count=10 || error "dd failed"
4618         sync # Flush the cache so that multiop below does not block on cache
4619              # flush when getting the group lock
4620         $MULTIOP $DIR/$tfile OG${gid}T${sz}g${gid}c &
4621         MULTIPID=$!
4622
4623         # Since just timed wait is not good enough, let's do a sync write
4624         # that way we are sure enough time for a roundtrip + processing
4625         # passed + 2 seconds of extra margin.
4626         dd if=/dev/zero of=$DIR/${tfile}-1 bs=$PAGE_SIZE oflag=direct count=1
4627         rm $DIR/${tfile}-1
4628         sleep 2
4629
4630         if [[ `ps h -o comm -p $MULTIPID` == "multiop" ]]; then
4631                 error "Multiop blocked on ftruncate, pid=$MULTIPID"
4632                 kill -9 $MULTIPID
4633         fi
4634         wait $MULTIPID
4635         local nsz=`stat -c %s $DIR/$tfile`
4636         [[ $nsz == $sz ]] || error "New size wrong $nsz != $sz"
4637 }
4638 run_test 34h "ftruncate file under grouplock should not block"
4639
4640 test_35a() {
4641         cp /bin/sh $DIR/f35a
4642         chmod 444 $DIR/f35a
4643         chown $RUNAS_ID $DIR/f35a
4644         $RUNAS $DIR/f35a && error || true
4645         rm $DIR/f35a
4646 }
4647 run_test 35a "exec file with mode 444 (should return and not leak)"
4648
4649 test_36a() {
4650         rm -f $DIR/f36
4651         utime $DIR/f36 || error "utime failed for MDS"
4652 }
4653 run_test 36a "MDS utime check (mknod, utime)"
4654
4655 test_36b() {
4656         echo "" > $DIR/f36
4657         utime $DIR/f36 || error "utime failed for OST"
4658 }
4659 run_test 36b "OST utime check (open, utime)"
4660
4661 test_36c() {
4662         rm -f $DIR/d36/f36
4663         test_mkdir $DIR/d36
4664         chown $RUNAS_ID $DIR/d36
4665         $RUNAS utime $DIR/d36/f36 || error "utime failed for MDS as non-root"
4666 }
4667 run_test 36c "non-root MDS utime check (mknod, utime)"
4668
4669 test_36d() {
4670         [ ! -d $DIR/d36 ] && test_36c
4671         echo "" > $DIR/d36/f36
4672         $RUNAS utime $DIR/d36/f36 || error "utime failed for OST as non-root"
4673 }
4674 run_test 36d "non-root OST utime check (open, utime)"
4675
4676 test_36e() {
4677         [ $RUNAS_ID -eq $UID ] && skip_env "RUNAS_ID = UID = $UID -- skipping"
4678
4679         test_mkdir $DIR/$tdir
4680         touch $DIR/$tdir/$tfile
4681         $RUNAS utime $DIR/$tdir/$tfile &&
4682                 error "utime worked, expected failure" || true
4683 }
4684 run_test 36e "utime on non-owned file (should return error)"
4685
4686 subr_36fh() {
4687         local fl="$1"
4688         local LANG_SAVE=$LANG
4689         local LC_LANG_SAVE=$LC_LANG
4690         export LANG=C LC_LANG=C # for date language
4691
4692         DATESTR="Dec 20  2000"
4693         test_mkdir $DIR/$tdir
4694         lctl set_param fail_loc=$fl
4695         date; date +%s
4696         cp /etc/hosts $DIR/$tdir/$tfile
4697         sync & # write RPC generated with "current" inode timestamp, but delayed
4698         sleep 1
4699         touch --date="$DATESTR" $DIR/$tdir/$tfile # setattr timestamp in past
4700         LS_BEFORE="`ls -l $DIR/$tdir/$tfile`" # old timestamp from client cache
4701         cancel_lru_locks $OSC
4702         LS_AFTER="`ls -l $DIR/$tdir/$tfile`"  # timestamp from OST object
4703         date; date +%s
4704         [ "$LS_BEFORE" != "$LS_AFTER" ] && \
4705                 echo "BEFORE: $LS_BEFORE" && \
4706                 echo "AFTER : $LS_AFTER" && \
4707                 echo "WANT  : $DATESTR" && \
4708                 error "$DIR/$tdir/$tfile timestamps changed" || true
4709
4710         export LANG=$LANG_SAVE LC_LANG=$LC_LANG_SAVE
4711 }
4712
4713 test_36f() {
4714         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4715
4716         #define OBD_FAIL_OST_BRW_PAUSE_BULK 0x214
4717         subr_36fh "0x80000214"
4718 }
4719 run_test 36f "utime on file racing with OST BRW write =========="
4720
4721 test_36g() {
4722         remote_ost_nodsh && skip "remote OST with nodsh"
4723         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4724         [ $MDS1_VERSION -lt $(version_code 2.12.51) ] &&
4725                 skip "Need MDS version at least 2.12.51"
4726
4727         local fmd_max_age
4728         local fmd
4729         local facet="ost1"
4730         local tgt="obdfilter"
4731
4732         [[ $OSC == "mdc" ]] && tgt="mdt" && facet="mds1"
4733
4734         test_mkdir $DIR/$tdir
4735         fmd_max_age=$(do_facet $facet \
4736                 "lctl get_param -n $tgt.*.tgt_fmd_seconds 2> /dev/null | \
4737                 head -n 1")
4738
4739         echo "FMD max age: ${fmd_max_age}s"
4740         touch $DIR/$tdir/$tfile
4741         fmd=$(do_facet $facet "lctl get_param -n $tgt.*.exports.*.fmd_count" |
4742                 gawk '{cnt=cnt+$1}  END{print cnt}')
4743         echo "FMD before: $fmd"
4744         [[ $fmd == 0 ]] &&
4745                 error "FMD wasn't create by touch"
4746         sleep $((fmd_max_age + 12))
4747         fmd=$(do_facet $facet "lctl get_param -n $tgt.*.exports.*.fmd_count" |
4748                 gawk '{cnt=cnt+$1}  END{print cnt}')
4749         echo "FMD after: $fmd"
4750         [[ $fmd == 0 ]] ||
4751                 error "FMD wasn't expired by ping"
4752 }
4753 run_test 36g "FMD cache expiry ====================="
4754
4755 test_36h() {
4756         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4757
4758         #define OBD_FAIL_OST_BRW_PAUSE_BULK2 0x227
4759         subr_36fh "0x80000227"
4760 }
4761 run_test 36h "utime on file racing with OST BRW write =========="
4762
4763 test_36i() {
4764         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
4765
4766         test_mkdir $DIR/$tdir
4767         $LFS setdirstripe -i0 -c$MDSCOUNT $DIR/$tdir/striped_dir
4768
4769         local mtime=$(stat -c%Y $DIR/$tdir/striped_dir)
4770         local new_mtime=$((mtime + 200))
4771
4772         #change Modify time of striped dir
4773         touch -m -d @$new_mtime $DIR/$tdir/striped_dir ||
4774                         error "change mtime failed"
4775
4776         local got=$(stat -c%Y $DIR/$tdir/striped_dir)
4777
4778         [ "$new_mtime" = "$got" ] || error "expect $new_mtime got $got"
4779 }
4780 run_test 36i "change mtime on striped directory"
4781
4782 # test_37 - duplicate with tests 32q 32r
4783
4784 test_38() {
4785         local file=$DIR/$tfile
4786         touch $file
4787         openfile -f O_DIRECTORY $file
4788         local RC=$?
4789         local ENOTDIR=20
4790         [ $RC -eq 0 ] && error "opened file $file with O_DIRECTORY" || true
4791         [ $RC -eq $ENOTDIR ] || error "error $RC should be ENOTDIR ($ENOTDIR)"
4792 }
4793 run_test 38 "open a regular file with O_DIRECTORY should return -ENOTDIR ==="
4794
4795 test_39a() { # was test_39
4796         touch $DIR/$tfile
4797         touch $DIR/${tfile}2
4798 #       ls -l  $DIR/$tfile $DIR/${tfile}2
4799 #       ls -lu  $DIR/$tfile $DIR/${tfile}2
4800 #       ls -lc  $DIR/$tfile $DIR/${tfile}2
4801         sleep 2
4802         $OPENFILE -f O_CREAT:O_TRUNC:O_WRONLY $DIR/${tfile}2
4803         if [ ! $DIR/${tfile}2 -nt $DIR/$tfile ]; then
4804                 echo "mtime"
4805                 ls -l --full-time $DIR/$tfile $DIR/${tfile}2
4806                 echo "atime"
4807                 ls -lu --full-time $DIR/$tfile $DIR/${tfile}2
4808                 echo "ctime"
4809                 ls -lc --full-time $DIR/$tfile $DIR/${tfile}2
4810                 error "O_TRUNC didn't change timestamps"
4811         fi
4812 }
4813 run_test 39a "mtime changed on create"
4814
4815 test_39b() {
4816         test_mkdir -c1 $DIR/$tdir
4817         cp -p /etc/passwd $DIR/$tdir/fopen
4818         cp -p /etc/passwd $DIR/$tdir/flink
4819         cp -p /etc/passwd $DIR/$tdir/funlink
4820         cp -p /etc/passwd $DIR/$tdir/frename
4821         ln $DIR/$tdir/funlink $DIR/$tdir/funlink2
4822
4823         sleep 1
4824         echo "aaaaaa" >> $DIR/$tdir/fopen
4825         echo "aaaaaa" >> $DIR/$tdir/flink
4826         echo "aaaaaa" >> $DIR/$tdir/funlink
4827         echo "aaaaaa" >> $DIR/$tdir/frename
4828
4829         local open_new=`stat -c %Y $DIR/$tdir/fopen`
4830         local link_new=`stat -c %Y $DIR/$tdir/flink`
4831         local unlink_new=`stat -c %Y $DIR/$tdir/funlink`
4832         local rename_new=`stat -c %Y $DIR/$tdir/frename`
4833
4834         cat $DIR/$tdir/fopen > /dev/null
4835         ln $DIR/$tdir/flink $DIR/$tdir/flink2
4836         rm -f $DIR/$tdir/funlink2
4837         mv -f $DIR/$tdir/frename $DIR/$tdir/frename2
4838
4839         for (( i=0; i < 2; i++ )) ; do
4840                 local open_new2=`stat -c %Y $DIR/$tdir/fopen`
4841                 local link_new2=`stat -c %Y $DIR/$tdir/flink`
4842                 local unlink_new2=`stat -c %Y $DIR/$tdir/funlink`
4843                 local rename_new2=`stat -c %Y $DIR/$tdir/frename2`
4844
4845                 [ $open_new2 -eq $open_new ] || error "open file reverses mtime"
4846                 [ $link_new2 -eq $link_new ] || error "link file reverses mtime"
4847                 [ $unlink_new2 -eq $unlink_new ] || error "unlink file reverses mtime"
4848                 [ $rename_new2 -eq $rename_new ] || error "rename file reverses mtime"
4849
4850                 cancel_lru_locks $OSC
4851                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4852         done
4853 }
4854 run_test 39b "mtime change on open, link, unlink, rename  ======"
4855
4856 # this should be set to past
4857 TEST_39_MTIME=`date -d "1 year ago" +%s`
4858
4859 # bug 11063
4860 test_39c() {
4861         touch $DIR1/$tfile
4862         sleep 2
4863         local mtime0=`stat -c %Y $DIR1/$tfile`
4864
4865         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
4866         local mtime1=`stat -c %Y $DIR1/$tfile`
4867         [ "$mtime1" = $TEST_39_MTIME ] || \
4868                 error "mtime is not set to past: $mtime1, should be $TEST_39_MTIME"
4869
4870         local d1=`date +%s`
4871         echo hello >> $DIR1/$tfile
4872         local d2=`date +%s`
4873         local mtime2=`stat -c %Y $DIR1/$tfile`
4874         [ "$mtime2" -ge "$d1" ] && [ "$mtime2" -le "$d2" ] || \
4875                 error "mtime is not updated on write: $d1 <= $mtime2 <= $d2"
4876
4877         mv $DIR1/$tfile $DIR1/$tfile-1
4878
4879         for (( i=0; i < 2; i++ )) ; do
4880                 local mtime3=`stat -c %Y $DIR1/$tfile-1`
4881                 [ "$mtime2" = "$mtime3" ] || \
4882                         error "mtime ($mtime2) changed (to $mtime3) on rename"
4883
4884                 cancel_lru_locks $OSC
4885                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4886         done
4887 }
4888 run_test 39c "mtime change on rename ==========================="
4889
4890 # bug 21114
4891 test_39d() {
4892         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4893
4894         touch $DIR1/$tfile
4895         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
4896
4897         for (( i=0; i < 2; i++ )) ; do
4898                 local mtime=`stat -c %Y $DIR1/$tfile`
4899                 [ $mtime = $TEST_39_MTIME ] || \
4900                         error "mtime($mtime) is not set to $TEST_39_MTIME"
4901
4902                 cancel_lru_locks $OSC
4903                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4904         done
4905 }
4906 run_test 39d "create, utime, stat =============================="
4907
4908 # bug 21114
4909 test_39e() {
4910         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4911
4912         touch $DIR1/$tfile
4913         local mtime1=`stat -c %Y $DIR1/$tfile`
4914
4915         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
4916
4917         for (( i=0; i < 2; i++ )) ; do
4918                 local mtime2=`stat -c %Y $DIR1/$tfile`
4919                 [ $mtime2 = $TEST_39_MTIME ] || \
4920                         error "mtime($mtime2) is not set to $TEST_39_MTIME"
4921
4922                 cancel_lru_locks $OSC
4923                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4924         done
4925 }
4926 run_test 39e "create, stat, utime, stat ========================"
4927
4928 # bug 21114
4929 test_39f() {
4930         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4931
4932         touch $DIR1/$tfile
4933         mtime1=`stat -c %Y $DIR1/$tfile`
4934
4935         sleep 2
4936         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
4937
4938         for (( i=0; i < 2; i++ )) ; do
4939                 local mtime2=`stat -c %Y $DIR1/$tfile`
4940                 [ $mtime2 = $TEST_39_MTIME ] || \
4941                         error "mtime($mtime2) is not set to $TEST_39_MTIME"
4942
4943                 cancel_lru_locks $OSC
4944                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4945         done
4946 }
4947 run_test 39f "create, stat, sleep, utime, stat ================="
4948
4949 # bug 11063
4950 test_39g() {
4951         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4952
4953         echo hello >> $DIR1/$tfile
4954         local mtime1=`stat -c %Y $DIR1/$tfile`
4955
4956         sleep 2
4957         chmod o+r $DIR1/$tfile
4958
4959         for (( i=0; i < 2; i++ )) ; do
4960                 local mtime2=`stat -c %Y $DIR1/$tfile`
4961                 [ "$mtime1" = "$mtime2" ] || \
4962                         error "lost mtime: $mtime2, should be $mtime1"
4963
4964                 cancel_lru_locks $OSC
4965                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4966         done
4967 }
4968 run_test 39g "write, chmod, stat ==============================="
4969
4970 # bug 11063
4971 test_39h() {
4972         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4973
4974         touch $DIR1/$tfile
4975         sleep 1
4976
4977         local d1=`date`
4978         echo hello >> $DIR1/$tfile
4979         local mtime1=`stat -c %Y $DIR1/$tfile`
4980
4981         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
4982         local d2=`date`
4983         if [ "$d1" != "$d2" ]; then
4984                 echo "write and touch not within one second"
4985         else
4986                 for (( i=0; i < 2; i++ )) ; do
4987                         local mtime2=`stat -c %Y $DIR1/$tfile`
4988                         [ "$mtime2" = $TEST_39_MTIME ] || \
4989                                 error "lost mtime: $mtime2, should be $TEST_39_MTIME"
4990
4991                         cancel_lru_locks $OSC
4992                         if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4993                 done
4994         fi
4995 }
4996 run_test 39h "write, utime within one second, stat ============="
4997
4998 test_39i() {
4999         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5000
5001         touch $DIR1/$tfile
5002         sleep 1
5003
5004         echo hello >> $DIR1/$tfile
5005         local mtime1=`stat -c %Y $DIR1/$tfile`
5006
5007         mv $DIR1/$tfile $DIR1/$tfile-1
5008
5009         for (( i=0; i < 2; i++ )) ; do
5010                 local mtime2=`stat -c %Y $DIR1/$tfile-1`
5011
5012                 [ "$mtime1" = "$mtime2" ] || \
5013                         error "lost mtime: $mtime2, should be $mtime1"
5014
5015                 cancel_lru_locks $OSC
5016                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
5017         done
5018 }
5019 run_test 39i "write, rename, stat =============================="
5020
5021 test_39j() {
5022         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5023
5024         start_full_debug_logging
5025         touch $DIR1/$tfile
5026         sleep 1
5027
5028         #define OBD_FAIL_OSC_DELAY_SETTIME       0x412
5029         lctl set_param fail_loc=0x80000412
5030         multiop_bg_pause $DIR1/$tfile oO_RDWR:w2097152_c ||
5031                 error "multiop failed"
5032         local multipid=$!
5033         local mtime1=`stat -c %Y $DIR1/$tfile`
5034
5035         mv $DIR1/$tfile $DIR1/$tfile-1
5036
5037         kill -USR1 $multipid
5038         wait $multipid || error "multiop close failed"
5039
5040         for (( i=0; i < 2; i++ )) ; do
5041                 local mtime2=`stat -c %Y $DIR1/$tfile-1`
5042                 [ "$mtime1" = "$mtime2" ] ||
5043                         error "mtime is lost on close: $mtime2, " \
5044                               "should be $mtime1"
5045
5046                 cancel_lru_locks
5047                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
5048         done
5049         lctl set_param fail_loc=0
5050         stop_full_debug_logging
5051 }
5052 run_test 39j "write, rename, close, stat ======================="
5053
5054 test_39k() {
5055         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5056
5057         touch $DIR1/$tfile
5058         sleep 1
5059
5060         multiop_bg_pause $DIR1/$tfile oO_RDWR:w2097152_c || error "multiop failed"
5061         local multipid=$!
5062         local mtime1=`stat -c %Y $DIR1/$tfile`
5063
5064         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
5065
5066         kill -USR1 $multipid
5067         wait $multipid || error "multiop close failed"
5068
5069         for (( i=0; i < 2; i++ )) ; do
5070                 local mtime2=`stat -c %Y $DIR1/$tfile`
5071
5072                 [ "$mtime2" = $TEST_39_MTIME ] || \
5073                         error "mtime is lost on close: $mtime2, should be $TEST_39_MTIME"
5074
5075                 cancel_lru_locks
5076                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
5077         done
5078 }
5079 run_test 39k "write, utime, close, stat ========================"
5080
5081 # this should be set to future
5082 TEST_39_ATIME=`date -d "1 year" +%s`
5083
5084 test_39l() {
5085         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5086         remote_mds_nodsh && skip "remote MDS with nodsh"
5087
5088         local atime_diff=$(do_facet $SINGLEMDS \
5089                                 lctl get_param -n mdd.*MDT0000*.atime_diff)
5090         rm -rf $DIR/$tdir
5091         mkdir_on_mdt0 $DIR/$tdir
5092
5093         # test setting directory atime to future
5094         touch -a -d @$TEST_39_ATIME $DIR/$tdir
5095         local atime=$(stat -c %X $DIR/$tdir)
5096         [ "$atime" = $TEST_39_ATIME ] ||
5097                 error "atime is not set to future: $atime, $TEST_39_ATIME"
5098
5099         # test setting directory atime from future to now
5100         local now=$(date +%s)
5101         touch -a -d @$now $DIR/$tdir
5102
5103         atime=$(stat -c %X $DIR/$tdir)
5104         [ "$atime" -eq "$now"  ] ||
5105                 error "atime is not updated from future: $atime, $now"
5106
5107         do_facet $SINGLEMDS lctl set_param -n mdd.*MDT0000*.atime_diff=2
5108         sleep 3
5109
5110         # test setting directory atime when now > dir atime + atime_diff
5111         local d1=$(date +%s)
5112         ls $DIR/$tdir
5113         local d2=$(date +%s)
5114         cancel_lru_locks mdc
5115         atime=$(stat -c %X $DIR/$tdir)
5116         [ "$atime" -ge "$d1" -a "$atime" -le "$d2" ] ||
5117                 error "atime is not updated  : $atime, should be $d2"
5118
5119         do_facet $SINGLEMDS lctl set_param -n mdd.*MDT0000*.atime_diff=60
5120         sleep 3
5121
5122         # test not setting directory atime when now < dir atime + atime_diff
5123         ls $DIR/$tdir
5124         cancel_lru_locks mdc
5125         atime=$(stat -c %X $DIR/$tdir)
5126         [ "$atime" -ge "$d1" -a "$atime" -le "$d2" ] ||
5127                 error "atime is updated to $atime, should remain $d1<atime<$d2"
5128
5129         do_facet $SINGLEMDS \
5130                 lctl set_param -n mdd.*MDT0000*.atime_diff=$atime_diff
5131 }
5132 run_test 39l "directory atime update ==========================="
5133
5134 test_39m() {
5135         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5136
5137         touch $DIR1/$tfile
5138         sleep 2
5139         local far_past_mtime=$(date -d "May 29 1953" +%s)
5140         local far_past_atime=$(date -d "Dec 17 1903" +%s)
5141
5142         touch -m -d @$far_past_mtime $DIR1/$tfile
5143         touch -a -d @$far_past_atime $DIR1/$tfile
5144
5145         for (( i=0; i < 2; i++ )) ; do
5146                 local timestamps=$(stat -c "%X %Y" $DIR1/$tfile)
5147                 [ "$timestamps" = "$far_past_atime $far_past_mtime" ] || \
5148                         error "atime or mtime set incorrectly"
5149
5150                 cancel_lru_locks $OSC
5151                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
5152         done
5153 }
5154 run_test 39m "test atime and mtime before 1970"
5155
5156 test_39n() { # LU-3832
5157         remote_mds_nodsh && skip "remote MDS with nodsh"
5158
5159         local atime_diff=$(do_facet $SINGLEMDS \
5160                 lctl get_param -n mdd.*MDT0000*.atime_diff)
5161         local atime0
5162         local atime1
5163         local atime2
5164
5165         do_facet $SINGLEMDS lctl set_param -n mdd.*MDT0000*.atime_diff=1
5166
5167         rm -rf $DIR/$tfile
5168         dd if=/dev/zero of=$DIR/$tfile bs=4096 count=1 status=noxfer
5169         atime0=$(stat -c %X $DIR/$tfile)
5170
5171         sleep 5
5172         $MULTIOP $DIR/$tfile oO_RDONLY:O_NOATIME:r4096c
5173         atime1=$(stat -c %X $DIR/$tfile)
5174
5175         sleep 5
5176         cancel_lru_locks mdc
5177         cancel_lru_locks osc
5178         $MULTIOP $DIR/$tfile oO_RDONLY:O_NOATIME:r4096c
5179         atime2=$(stat -c %X $DIR/$tfile)
5180
5181         do_facet $SINGLEMDS \
5182                 lctl set_param -n mdd.*MDT0000*.atime_diff=$atime_diff
5183
5184         [ "$atime0" -eq "$atime1" ] || error "atime0 $atime0 != atime1 $atime1"
5185         [ "$atime1" -eq "$atime2" ] || error "atime0 $atime0 != atime1 $atime1"
5186 }
5187 run_test 39n "check that O_NOATIME is honored"
5188
5189 test_39o() {
5190         TESTDIR=$DIR/$tdir/$tfile
5191         [ -e $TESTDIR ] && rm -rf $TESTDIR
5192         mkdir -p $TESTDIR
5193         cd $TESTDIR
5194         links1=2
5195         ls
5196         mkdir a b
5197         ls
5198         links2=$(stat -c %h .)
5199         [ $(($links1 + 2)) != $links2 ] &&
5200                 error "wrong links count $(($links1 + 2)) != $links2"
5201         rmdir b
5202         links3=$(stat -c %h .)
5203         [ $(($links1 + 1)) != $links3 ] &&
5204                 error "wrong links count $links1 != $links3"
5205         return 0
5206 }
5207 run_test 39o "directory cached attributes updated after create"
5208
5209 test_39p() {
5210         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
5211
5212         local MDTIDX=1
5213         TESTDIR=$DIR/$tdir/$tdir
5214         [ -e $TESTDIR ] && rm -rf $TESTDIR
5215         test_mkdir -p $TESTDIR
5216         cd $TESTDIR
5217         links1=2
5218         ls
5219         test_mkdir -i $MDTIDX $TESTDIR/remote_dir1
5220         test_mkdir -i $MDTIDX $TESTDIR/remote_dir2
5221         ls
5222         links2=$(stat -c %h .)
5223         [ $(($links1 + 2)) != $links2 ] &&
5224                 error "wrong links count $(($links1 + 2)) != $links2"
5225         rmdir remote_dir2
5226         links3=$(stat -c %h .)
5227         [ $(($links1 + 1)) != $links3 ] &&
5228                 error "wrong links count $links1 != $links3"
5229         return 0
5230 }
5231 run_test 39p "remote directory cached attributes updated after create ========"
5232
5233 test_39r() {
5234         [ $OST1_VERSION -ge $(version_code 2.13.52) ] ||
5235                 skip "no atime update on old OST"
5236         if [ "$ost1_FSTYPE" != ldiskfs ]; then
5237                 skip_env "ldiskfs only test"
5238         fi
5239
5240         local saved_adiff
5241         saved_adiff=$(do_facet ost1 \
5242                 lctl get_param -n obdfilter.*OST0000.atime_diff)
5243         stack_trap "do_facet ost1 \
5244                 lctl set_param obdfilter.*.atime_diff=$saved_adiff"
5245
5246         do_facet ost1 "lctl set_param obdfilter.*.atime_diff=5"
5247
5248         $LFS setstripe -i 0 $DIR/$tfile
5249         dd if=/dev/zero of=$DIR/$tfile bs=4k count=1 ||
5250                 error "can't write initial file"
5251         cancel_lru_locks osc
5252
5253         # exceed atime_diff and access file
5254         sleep 10
5255         dd if=$DIR/$tfile of=/dev/null bs=4k count=1 ||
5256                 error "can't udpate atime"
5257
5258         local atime_cli=$(stat -c %X $DIR/$tfile)
5259         echo "client atime: $atime_cli"
5260         # allow atime update to be written to device
5261         do_facet ost1 "$LCTL set_param -n osd*.*OST*.force_sync 1"
5262         sleep 5
5263
5264         local ostdev=$(ostdevname 1)
5265         local fid=($($LFS getstripe $DIR/$tfile | grep 0x))
5266         local seq=${fid[3]#0x}
5267         local oid=${fid[1]}
5268         local oid_hex
5269
5270         if [ $seq == 0 ]; then
5271                 oid_hex=${fid[1]}
5272         else
5273                 oid_hex=${fid[2]#0x}
5274         fi
5275         local objpath="O/$seq/d$(($oid % 32))/$oid_hex"
5276         local cmd="debugfs -c -R \\\"stat $objpath\\\" $ostdev"
5277
5278         echo "OST atime: $(do_facet ost1 "$cmd" |& grep atime)"
5279         local atime_ost=$(do_facet ost1 "$cmd" |&
5280                           awk -F'[: ]' '/atime:/ { print $4 }')
5281         (( atime_cli == atime_ost )) ||
5282                 error "atime on client $atime_cli != ost $atime_ost"
5283 }
5284 run_test 39r "lazy atime update on OST"
5285
5286 test_39q() { # LU-8041
5287         local testdir=$DIR/$tdir
5288         mkdir -p $testdir
5289         multiop_bg_pause $testdir D_c || error "multiop failed"
5290         local multipid=$!
5291         cancel_lru_locks mdc
5292         kill -USR1 $multipid
5293         local atime=$(stat -c %X $testdir)
5294         [ "$atime" -ne 0 ] || error "atime is zero"
5295 }
5296 run_test 39q "close won't zero out atime"
5297
5298 test_39s() {
5299         local atime0
5300         local atime1
5301         local atime2
5302         local atime3
5303         local atime4
5304
5305         umount_client $MOUNT
5306         mount_client $MOUNT relatime
5307
5308         dd if=/dev/zero of=$DIR/$tfile bs=4096 count=1 status=noxfer conv=fsync
5309         atime0=$(stat -c %X $DIR/$tfile)
5310
5311         # First read updates atime
5312         sleep 1
5313         cat $DIR/$tfile >/dev/null
5314         atime1=$(stat -c %X $DIR/$tfile) # (atime = atime0 + 1)
5315
5316         # Next reads do not update atime
5317         sleep 1
5318         cat $DIR/$tfile >/dev/null
5319         atime2=$(stat -c %X $DIR/$tfile) # (atime = atime0 + 1)
5320
5321         # If mtime is greater than atime, atime is updated
5322         sleep 1
5323         touch -m $DIR/$tfile # (mtime = now)
5324         sleep 1
5325         cat $DIR/$tfile >/dev/null # (atime is updated because atime < mtime)
5326         atime3=$(stat -c %X $DIR/$tfile) # (atime = mtime = atime0 + 3)
5327
5328         # Next reads do not update atime
5329         sleep 1
5330         cat $DIR/$tfile >/dev/null
5331         atime4=$(stat -c %X $DIR/$tfile)
5332
5333         # Remount the client to clear 'relatime' option
5334         remount_client $MOUNT
5335
5336         (( atime0 < atime1 )) ||
5337                 error "atime $atime0 should be smaller than $atime1"
5338         (( atime1 == atime2 )) ||
5339                 error "atime $atime1 was updated to $atime2"
5340         (( atime1 < atime3 )) || error "atime1 $atime1 != atime3 $atime3"
5341         (( atime3 == atime4 )) || error "atime3 $atime3 != atime4 $atime4"
5342 }
5343 run_test 39s "relatime is supported"
5344
5345 test_40() {
5346         dd if=/dev/zero of=$DIR/$tfile bs=4096 count=1
5347         $RUNAS $OPENFILE -f O_WRONLY:O_TRUNC $DIR/$tfile &&
5348                 error "openfile O_WRONLY:O_TRUNC $tfile failed"
5349         $CHECKSTAT -t file -s 4096 $DIR/$tfile ||
5350                 error "$tfile is not 4096 bytes in size"
5351 }
5352 run_test 40 "failed open(O_TRUNC) doesn't truncate ============="
5353
5354 test_41() {
5355         # bug 1553
5356         small_write $DIR/f41 18
5357 }
5358 run_test 41 "test small file write + fstat ====================="
5359
5360 count_ost_writes() {
5361         lctl get_param -n ${OSC}.*.stats |
5362                 awk -vwrites=0 '/ost_write/ { writes += $2 } \
5363                         END { printf("%0.0f", writes) }'
5364 }
5365
5366 # decent default
5367 WRITEBACK_SAVE=500
5368 DIRTY_RATIO_SAVE=40
5369 MAX_DIRTY_RATIO=50
5370 BG_DIRTY_RATIO_SAVE=10
5371 MAX_BG_DIRTY_RATIO=25
5372
5373 start_writeback() {
5374         trap 0
5375         # in 2.6, restore /proc/sys/vm/dirty_writeback_centisecs,
5376         # dirty_ratio, dirty_background_ratio
5377         if [ -f /proc/sys/vm/dirty_writeback_centisecs ]; then
5378                 sysctl -w vm.dirty_writeback_centisecs=$WRITEBACK_SAVE
5379                 sysctl -w vm.dirty_background_ratio=$BG_DIRTY_RATIO_SAVE
5380                 sysctl -w vm.dirty_ratio=$DIRTY_RATIO_SAVE
5381         else
5382                 # if file not here, we are a 2.4 kernel
5383                 kill -CONT `pidof kupdated`
5384         fi
5385 }
5386
5387 stop_writeback() {
5388         # setup the trap first, so someone cannot exit the test at the
5389         # exact wrong time and mess up a machine
5390         trap start_writeback EXIT
5391         # in 2.6, save and 0 /proc/sys/vm/dirty_writeback_centisecs
5392         if [ -f /proc/sys/vm/dirty_writeback_centisecs ]; then
5393                 WRITEBACK_SAVE=`sysctl -n vm.dirty_writeback_centisecs`
5394                 sysctl -w vm.dirty_writeback_centisecs=0
5395                 sysctl -w vm.dirty_writeback_centisecs=0
5396                 # save and increase /proc/sys/vm/dirty_ratio
5397                 DIRTY_RATIO_SAVE=`sysctl -n vm.dirty_ratio`
5398                 sysctl -w vm.dirty_ratio=$MAX_DIRTY_RATIO
5399                 # save and increase /proc/sys/vm/dirty_background_ratio
5400                 BG_DIRTY_RATIO_SAVE=`sysctl -n vm.dirty_background_ratio`
5401                 sysctl -w vm.dirty_background_ratio=$MAX_BG_DIRTY_RATIO
5402         else
5403                 # if file not here, we are a 2.4 kernel
5404                 kill -STOP `pidof kupdated`
5405         fi
5406 }
5407
5408 # ensure that all stripes have some grant before we test client-side cache
5409 setup_test42() {
5410         for i in `seq -f $DIR/f42-%g 1 $OSTCOUNT`; do
5411                 dd if=/dev/zero of=$i bs=4k count=1
5412                 rm $i
5413         done
5414 }
5415
5416 # Tests 42* verify that our behaviour is correct WRT caching, file closure,
5417 # file truncation, and file removal.
5418 test_42a() {
5419         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5420
5421         setup_test42
5422         cancel_lru_locks $OSC
5423         stop_writeback
5424         sync; sleep 1; sync # just to be safe
5425         BEFOREWRITES=`count_ost_writes`
5426         lctl get_param -n osc.*[oO][sS][cC][_-]*.cur_grant_bytes | grep "[0-9]"
5427         dd if=/dev/zero of=$DIR/f42a bs=1024 count=100
5428         AFTERWRITES=`count_ost_writes`
5429         [ $BEFOREWRITES -eq $AFTERWRITES ] || \
5430                 error "$BEFOREWRITES < $AFTERWRITES"
5431         start_writeback
5432 }
5433 run_test 42a "ensure that we don't flush on close"
5434
5435 test_42b() {
5436         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5437
5438         setup_test42
5439         cancel_lru_locks $OSC
5440         stop_writeback
5441         sync
5442         dd if=/dev/zero of=$DIR/f42b bs=1024 count=100
5443         BEFOREWRITES=$(count_ost_writes)
5444         $MUNLINK $DIR/f42b || error "$MUNLINK $DIR/f42b: $?"
5445         AFTERWRITES=$(count_ost_writes)
5446         if [[ $BEFOREWRITES -lt $AFTERWRITES ]]; then
5447                 error "$BEFOREWRITES < $AFTERWRITES on unlink"
5448         fi
5449         BEFOREWRITES=$(count_ost_writes)
5450         sync || error "sync: $?"
5451         AFTERWRITES=$(count_ost_writes)
5452         if [[ $BEFOREWRITES -lt $AFTERWRITES ]]; then
5453                 error "$BEFOREWRITES < $AFTERWRITES on sync"
5454         fi
5455         dmesg | grep 'error from obd_brw_async' && error 'error writing back'
5456         start_writeback
5457         return 0
5458 }
5459 run_test 42b "test destroy of file with cached dirty data ======"
5460
5461 # if these tests just want to test the effect of truncation,
5462 # they have to be very careful.  consider:
5463 # - the first open gets a {0,EOF}PR lock
5464 # - the first write conflicts and gets a {0, count-1}PW
5465 # - the rest of the writes are under {count,EOF}PW
5466 # - the open for truncate tries to match a {0,EOF}PR
5467 #   for the filesize and cancels the PWs.
5468 # any number of fixes (don't get {0,EOF} on open, match
5469 # composite locks, do smarter file size management) fix
5470 # this, but for now we want these tests to verify that
5471 # the cancellation with truncate intent works, so we
5472 # start the file with a full-file pw lock to match against
5473 # until the truncate.
5474 trunc_test() {
5475         test=$1
5476         file=$DIR/$test
5477         offset=$2
5478         cancel_lru_locks $OSC
5479         stop_writeback
5480         # prime the file with 0,EOF PW to match
5481         touch $file
5482         $TRUNCATE $file 0
5483         sync; sync
5484         # now the real test..
5485         dd if=/dev/zero of=$file bs=1024 count=100
5486         BEFOREWRITES=`count_ost_writes`
5487         $TRUNCATE $file $offset
5488         cancel_lru_locks $OSC
5489         AFTERWRITES=`count_ost_writes`
5490         start_writeback
5491 }
5492
5493 test_42c() {
5494         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5495
5496         trunc_test 42c 1024
5497         [ $BEFOREWRITES -eq $AFTERWRITES ] &&
5498                 error "beforewrites $BEFOREWRITES == afterwrites $AFTERWRITES on truncate"
5499         rm $file
5500 }
5501 run_test 42c "test partial truncate of file with cached dirty data"
5502
5503 test_42d() {
5504         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5505
5506         local olddebug="$($LCTL get_param -n debug 2> /dev/null)"
5507         stack_trap "$LCTL set_param -n debug='$olddebug'" EXIT
5508         $LCTL set_param debug=+cache
5509
5510         trunc_test 42d 0
5511         [ $BEFOREWRITES -eq $AFTERWRITES ] ||
5512                 error "beforewrites $BEFOREWRITES != afterwrites $AFTERWRITES on truncate"
5513         rm $file
5514 }
5515 run_test 42d "test complete truncate of file with cached dirty data"
5516
5517 test_42e() { # bug22074
5518         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5519
5520         local TDIR=$DIR/${tdir}e
5521         local pages=16 # hardcoded 16 pages, don't change it.
5522         local files=$((OSTCOUNT * 500)) # hopefully 500 files on each OST
5523         local proc_osc0="osc.${FSNAME}-OST0000-osc-[^MDT]*"
5524         local max_dirty_mb
5525         local warmup_files
5526
5527         test_mkdir $DIR/${tdir}e
5528         $LFS setstripe -c 1 $TDIR
5529         createmany -o $TDIR/f $files
5530
5531         max_dirty_mb=$($LCTL get_param -n $proc_osc0/max_dirty_mb)
5532
5533         # we assume that with $OSTCOUNT files, at least one of them will
5534         # be allocated on OST0.
5535         warmup_files=$((OSTCOUNT * max_dirty_mb))
5536         createmany -o $TDIR/w $warmup_files
5537
5538         # write a large amount of data into one file and sync, to get good
5539         # avail_grant number from OST.
5540         for ((i=0; i<$warmup_files; i++)); do
5541                 idx=$($LFS getstripe -i $TDIR/w$i)
5542                 [ $idx -ne 0 ] && continue
5543                 dd if=/dev/zero of=$TDIR/w$i bs="$max_dirty_mb"M count=1
5544                 break
5545         done
5546         [[ $i -gt $warmup_files ]] && error "OST0 is still cold"
5547         sync
5548         $LCTL get_param $proc_osc0/cur_dirty_bytes
5549         $LCTL get_param $proc_osc0/cur_grant_bytes
5550
5551         # create as much dirty pages as we can while not to trigger the actual
5552         # RPCs directly. but depends on the env, VFS may trigger flush during this
5553         # period, hopefully we are good.
5554         for ((i=0; i<$warmup_files; i++)); do
5555                 idx=$($LFS getstripe -i $TDIR/w$i)
5556                 [ $idx -ne 0 ] && continue
5557                 dd if=/dev/zero of=$TDIR/w$i bs=1M count=1 2>/dev/null
5558         done
5559         $LCTL get_param $proc_osc0/cur_dirty_bytes
5560         $LCTL get_param $proc_osc0/cur_grant_bytes
5561
5562         # perform the real test
5563         $LCTL set_param $proc_osc0/rpc_stats 0
5564         for ((;i<$files; i++)); do
5565                 [ $($LFS getstripe -i $TDIR/f$i) -eq 0 ] || continue
5566                 dd if=/dev/zero of=$TDIR/f$i bs=$PAGE_SIZE count=$pages 2>/dev/null
5567         done
5568         sync
5569         $LCTL get_param $proc_osc0/rpc_stats
5570
5571         local percent=0
5572         local have_ppr=false
5573         $LCTL get_param $proc_osc0/rpc_stats |
5574                 while read PPR RRPC RPCT RCUM BAR WRPC WPCT WCUM; do
5575                         # skip lines until we are at the RPC histogram data
5576                         [ "$PPR" == "pages" ] && have_ppr=true && continue
5577                         $have_ppr || continue
5578
5579                         # we only want the percent stat for < 16 pages
5580                         [[ $(echo $PPR | tr -d ':') -ge $pages ]] && break
5581
5582                         percent=$((percent + WPCT))
5583                         if [[ $percent -gt 15 ]]; then
5584                                 error "less than 16-pages write RPCs" \
5585                                       "$percent% > 15%"
5586                                 break
5587                         fi
5588                 done
5589         rm -rf $TDIR
5590 }
5591 run_test 42e "verify sub-RPC writes are not done synchronously"
5592
5593 test_43A() { # was test_43
5594         test_mkdir $DIR/$tdir
5595         cp -p /bin/ls $DIR/$tdir/$tfile
5596         $MULTIOP $DIR/$tdir/$tfile Ow_c &
5597         pid=$!
5598         # give multiop a chance to open
5599         sleep 1
5600
5601         $DIR/$tdir/$tfile && error "execute $DIR/$tdir/$tfile succeeded" || true
5602         kill -USR1 $pid
5603         # Wait for multiop to exit
5604         wait $pid
5605 }
5606 run_test 43A "execution of file opened for write should return -ETXTBSY"
5607
5608 test_43a() {
5609         test_mkdir $DIR/$tdir
5610         cp -p $(which sleep) $DIR/$tdir/sleep || error "can't copy"
5611         $DIR/$tdir/sleep 60 &
5612         SLEEP_PID=$!
5613         # Make sure exec of $tdir/sleep wins race with truncate
5614         sleep 1
5615         $MULTIOP $DIR/$tdir/sleep Oc && error "expected error, got success"
5616         kill $SLEEP_PID
5617 }
5618 run_test 43a "open(RDWR) of file being executed should return -ETXTBSY"
5619
5620 test_43b() {
5621         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5622
5623         test_mkdir $DIR/$tdir
5624         cp -p $(which sleep) $DIR/$tdir/sleep || error "can't copy"
5625         $DIR/$tdir/sleep 60 &
5626         SLEEP_PID=$!
5627         # Make sure exec of $tdir/sleep wins race with truncate
5628         sleep 1
5629         $TRUNCATE $DIR/$tdir/sleep 0 && error "expected error, got success"
5630         kill $SLEEP_PID
5631 }
5632 run_test 43b "truncate of file being executed should return -ETXTBSY"
5633
5634 test_43c() {
5635         local testdir="$DIR/$tdir"
5636         test_mkdir $testdir
5637         cp $SHELL $testdir/
5638         ( cd $(dirname $SHELL) && md5sum $(basename $SHELL) ) |
5639                 ( cd $testdir && md5sum -c )
5640 }
5641 run_test 43c "md5sum of copy into lustre"
5642
5643 test_44A() { # was test_44
5644         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
5645
5646         dd if=/dev/zero of=$DIR/f1 bs=4k count=1 seek=1023
5647         dd if=$DIR/f1 bs=4k count=1 > /dev/null
5648 }
5649 run_test 44A "zero length read from a sparse stripe"
5650
5651 test_44a() {
5652         local nstripe=$($LFS getstripe -c -d $DIR)
5653         [ -z "$nstripe" ] && skip "can't get stripe info"
5654         [[ $nstripe -gt $OSTCOUNT ]] &&
5655                 skip "Wrong default stripe_count: $nstripe OSTCOUNT: $OSTCOUNT"
5656
5657         local stride=$($LFS getstripe -S -d $DIR)
5658         if [[ $nstripe -eq 0 || $nstripe -eq -1 ]]; then
5659                 nstripe=$($LFS df $DIR | grep OST: | wc -l)
5660         fi
5661
5662         OFFSETS="0 $((stride/2)) $((stride-1))"
5663         for offset in $OFFSETS; do
5664                 for i in $(seq 0 $((nstripe-1))); do
5665                         local GLOBALOFFSETS=""
5666                         # size in Bytes
5667                         local size=$((((i + 2 * $nstripe )*$stride + $offset)))
5668                         local myfn=$DIR/d44a-$size
5669                         echo "--------writing $myfn at $size"
5670                         ll_sparseness_write $myfn $size ||
5671                                 error "ll_sparseness_write"
5672                         GLOBALOFFSETS="$GLOBALOFFSETS $size"
5673                         ll_sparseness_verify $myfn $GLOBALOFFSETS ||
5674                                 error "ll_sparseness_verify $GLOBALOFFSETS"
5675
5676                         for j in $(seq 0 $((nstripe-1))); do
5677                                 # size in Bytes
5678                                 size=$((((j + $nstripe )*$stride + $offset)))
5679                                 ll_sparseness_write $myfn $size ||
5680                                         error "ll_sparseness_write"
5681                                 GLOBALOFFSETS="$GLOBALOFFSETS $size"
5682                         done
5683                         ll_sparseness_verify $myfn $GLOBALOFFSETS ||
5684                                 error "ll_sparseness_verify $GLOBALOFFSETS"
5685                         rm -f $myfn
5686                 done
5687         done
5688 }
5689 run_test 44a "test sparse pwrite ==============================="
5690
5691 dirty_osc_total() {
5692         tot=0
5693         for d in `lctl get_param -n ${OSC}.*.cur_dirty_bytes`; do
5694                 tot=$(($tot + $d))
5695         done
5696         echo $tot
5697 }
5698 do_dirty_record() {
5699         before=`dirty_osc_total`
5700         echo executing "\"$*\""
5701         eval $*
5702         after=`dirty_osc_total`
5703         echo before $before, after $after
5704 }
5705 test_45() {
5706         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5707
5708         f="$DIR/f45"
5709         # Obtain grants from OST if it supports it
5710         echo blah > ${f}_grant
5711         stop_writeback
5712         sync
5713         do_dirty_record "echo blah > $f"
5714         [[ $before -eq $after ]] && error "write wasn't cached"
5715         do_dirty_record "> $f"
5716         [[ $before -gt $after ]] || error "truncate didn't lower dirty count"
5717         do_dirty_record "echo blah > $f"
5718         [[ $before -eq $after ]] && error "write wasn't cached"
5719         do_dirty_record "sync"
5720         [[ $before -gt $after ]] || error "writeback didn't lower dirty count"
5721         do_dirty_record "echo blah > $f"
5722         [[ $before -eq $after ]] && error "write wasn't cached"
5723         do_dirty_record "cancel_lru_locks osc"
5724         [[ $before -gt $after ]] ||
5725                 error "lock cancellation didn't lower dirty count"
5726         start_writeback
5727 }
5728 run_test 45 "osc io page accounting ============================"
5729
5730 # in a 2 stripe file (lov.sh), page 1023 maps to page 511 in its object.  this
5731 # test tickles a bug where re-dirtying a page was failing to be mapped to the
5732 # objects offset and an assert hit when an rpc was built with 1023's mapped
5733 # offset 511 and 511's raw 511 offset. it also found general redirtying bugs.
5734 test_46() {
5735         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5736
5737         f="$DIR/f46"
5738         stop_writeback
5739         sync
5740         dd if=/dev/zero of=$f bs=$PAGE_SIZE seek=511 count=1
5741         sync
5742         dd conv=notrunc if=/dev/zero of=$f bs=$PAGE_SIZE seek=1023 count=1
5743         dd conv=notrunc if=/dev/zero of=$f bs=$PAGE_SIZE seek=511 count=1
5744         sync
5745         start_writeback
5746 }
5747 run_test 46 "dirtying a previously written page ================"
5748
5749 # test_47 is removed "Device nodes check" is moved to test_28
5750
5751 test_48a() { # bug 2399
5752         [ "$mds1_FSTYPE" = "zfs" ] &&
5753         [ $MDS1_VERSION -lt $(version_code 2.3.63) ] &&
5754                 skip "MDS prior to 2.3.63 handle ZFS dir .. incorrectly"
5755
5756         test_mkdir $DIR/$tdir
5757         cd $DIR/$tdir
5758         mv $DIR/$tdir $DIR/$tdir.new || error "move directory failed"
5759         test_mkdir $DIR/$tdir
5760         touch foo || error "'touch foo' failed after recreating cwd"
5761         test_mkdir bar
5762         touch .foo || error "'touch .foo' failed after recreating cwd"
5763         test_mkdir .bar
5764         ls . > /dev/null || error "'ls .' failed after recreating cwd"
5765         ls .. > /dev/null || error "'ls ..' failed after removing cwd"
5766         cd . || error "'cd .' failed after recreating cwd"
5767         mkdir . && error "'mkdir .' worked after recreating cwd"
5768         rmdir . && error "'rmdir .' worked after recreating cwd"
5769         ln -s . baz || error "'ln -s .' failed after recreating cwd"
5770         cd .. || error "'cd ..' failed after recreating cwd"
5771 }
5772 run_test 48a "Access renamed working dir (should return errors)="
5773
5774 test_48b() { # bug 2399
5775         rm -rf $DIR/$tdir
5776         test_mkdir $DIR/$tdir
5777         cd $DIR/$tdir
5778         rmdir $DIR/$tdir || error "remove cwd $DIR/$tdir failed"
5779         touch foo && error "'touch foo' worked after removing cwd"
5780         mkdir foo && error "'mkdir foo' worked after removing cwd"
5781         touch .foo && error "'touch .foo' worked after removing cwd"
5782         mkdir .foo && error "'mkdir .foo' worked after removing cwd"
5783         ls . > /dev/null && error "'ls .' worked after removing cwd"
5784         ls .. > /dev/null || error "'ls ..' failed after removing cwd"
5785         mkdir . && error "'mkdir .' worked after removing cwd"
5786         rmdir . && error "'rmdir .' worked after removing cwd"
5787         ln -s . foo && error "'ln -s .' worked after removing cwd"
5788         cd .. || echo "'cd ..' failed after removing cwd `pwd`"  #bug 3517
5789 }
5790 run_test 48b "Access removed working dir (should return errors)="
5791
5792 test_48c() { # bug 2350
5793         #lctl set_param debug=-1
5794         #set -vx
5795         rm -rf $DIR/$tdir
5796         test_mkdir -p $DIR/$tdir/dir
5797         cd $DIR/$tdir/dir
5798         $TRACE rmdir $DIR/$tdir/dir || error "remove cwd $DIR/$tdir/dir failed"
5799         $TRACE touch foo && error "touch foo worked after removing cwd"
5800         $TRACE mkdir foo && error "'mkdir foo' worked after removing cwd"
5801         touch .foo && error "touch .foo worked after removing cwd"
5802         mkdir .foo && error "mkdir .foo worked after removing cwd"
5803         $TRACE ls . && error "'ls .' worked after removing cwd"
5804         $TRACE ls .. || error "'ls ..' failed after removing cwd"
5805         $TRACE mkdir . && error "'mkdir .' worked after removing cwd"
5806         $TRACE rmdir . && error "'rmdir .' worked after removing cwd"
5807         $TRACE ln -s . foo && error "'ln -s .' worked after removing cwd"
5808         $TRACE cd .. || echo "'cd ..' failed after removing cwd `pwd`" #bug 3415
5809 }
5810 run_test 48c "Access removed working subdir (should return errors)"
5811
5812 test_48d() { # bug 2350
5813         #lctl set_param debug=-1
5814         #set -vx
5815         rm -rf $DIR/$tdir
5816         test_mkdir -p $DIR/$tdir/dir
5817         cd $DIR/$tdir/dir
5818         $TRACE rmdir $DIR/$tdir/dir || error "remove cwd $DIR/$tdir/dir failed"
5819         $TRACE rmdir $DIR/$tdir || error "remove parent $DIR/$tdir failed"
5820         $TRACE touch foo && error "'touch foo' worked after removing parent"
5821         $TRACE mkdir foo && error "mkdir foo worked after removing parent"
5822         touch .foo && error "'touch .foo' worked after removing parent"
5823         mkdir .foo && error "mkdir .foo worked after removing parent"
5824         $TRACE ls . && error "'ls .' worked after removing parent"
5825         $TRACE ls .. && error "'ls ..' worked after removing parent"
5826         $TRACE mkdir . && error "'mkdir .' worked after removing parent"
5827         $TRACE rmdir . && error "'rmdir .' worked after removing parent"
5828         $TRACE ln -s . foo && error "'ln -s .' worked after removing parent"
5829         true
5830 }
5831 run_test 48d "Access removed parent subdir (should return errors)"
5832
5833 test_48e() { # bug 4134
5834         #lctl set_param debug=-1
5835         #set -vx
5836         rm -rf $DIR/$tdir
5837         test_mkdir -p $DIR/$tdir/dir
5838         cd $DIR/$tdir/dir
5839         $TRACE rmdir $DIR/$tdir/dir || error "remove cwd $DIR/$tdir/dir failed"
5840         $TRACE rmdir $DIR/$tdir || error "remove parent $DIR/$tdir failed"
5841         $TRACE touch $DIR/$tdir || error "'touch $DIR/$tdir' failed"
5842         $TRACE chmod +x $DIR/$tdir || error "'chmod +x $DIR/$tdir' failed"
5843         # On a buggy kernel addition of "touch foo" after cd .. will
5844         # produce kernel oops in lookup_hash_it
5845         touch ../foo && error "'cd ..' worked after recreate parent"
5846         cd $DIR
5847         $TRACE rm $DIR/$tdir || error "rm '$DIR/$tdir' failed"
5848 }
5849 run_test 48e "Access to recreated parent subdir (should return errors)"
5850
5851 test_48f() {
5852         [[ $MDS1_VERSION -ge $(version_code 2.13.55) ]] ||
5853                 skip "need MDS >= 2.13.55"
5854         [[ $MDSCOUNT -ge 2 ]] || skip "needs >= 2 MDTs"
5855         [[ "$(facet_host mds1)" != "$(facet_host mds2)" ]] ||
5856                 skip "needs different host for mdt1 mdt2"
5857         [[ $(facet_fstype mds1) == ldiskfs ]] || skip "ldiskfs only"
5858
5859         $LFS mkdir -i0 $DIR/$tdir
5860         $LFS mkdir -i 1 $DIR/$tdir/sub1 $DIR/$tdir/sub2 $DIR/$tdir/sub3
5861
5862         for d in sub1 sub2 sub3; do
5863                 #define OBD_FAIL_OSD_REF_DEL    0x19c
5864                 do_facet mds1 $LCTL set_param fail_loc=0x8000019c
5865                 rm -rf $DIR/$tdir/$d && error "rm $d should fail"
5866         done
5867
5868         rm -d --interactive=never $DIR/$tdir || error "rm $tdir fail"
5869 }
5870 run_test 48f "non-zero nlink dir unlink won't LBUG()"
5871
5872 test_49() { # LU-1030
5873         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5874         remote_ost_nodsh && skip "remote OST with nodsh"
5875
5876         # get ost1 size - $FSNAME-OST0000
5877         ost1_size=$(do_facet ost1 $LFS df | grep ${ost1_svc} |
5878                 awk '{ print $4 }')
5879         # write 800M at maximum
5880         [[ $ost1_size -lt 2 ]] && ost1_size=2
5881         [[ $ost1_size -gt 819200 ]] && ost1_size=819200
5882
5883         $LFS setstripe -c 1 -i 0 $DIR/$tfile
5884         dd if=/dev/zero of=$DIR/$tfile bs=4k count=$((ost1_size >> 2)) &
5885         local dd_pid=$!
5886
5887         # change max_pages_per_rpc while writing the file
5888         local osc1_mppc=osc.$(get_osc_import_name client ost1).max_pages_per_rpc
5889         local orig_mppc=$($LCTL get_param -n $osc1_mppc)
5890         # loop until dd process exits
5891         while ps ax -opid | grep -wq $dd_pid; do
5892                 $LCTL set_param $osc1_mppc=$((RANDOM % 256 + 1))
5893                 sleep $((RANDOM % 5 + 1))
5894         done
5895         # restore original max_pages_per_rpc
5896         $LCTL set_param $osc1_mppc=$orig_mppc
5897         rm $DIR/$tfile || error "rm $DIR/$tfile failed"
5898 }
5899 run_test 49 "Change max_pages_per_rpc won't break osc extent"
5900
5901 test_50() {
5902         # bug 1485
5903         test_mkdir $DIR/$tdir
5904         cd $DIR/$tdir
5905         ls /proc/$$/cwd || error "ls /proc/$$/cwd failed"
5906 }
5907 run_test 50 "special situations: /proc symlinks  ==============="
5908
5909 test_51a() {    # was test_51
5910         # bug 1516 - create an empty entry right after ".." then split dir
5911         test_mkdir -c1 $DIR/$tdir
5912         touch $DIR/$tdir/foo
5913         $MCREATE $DIR/$tdir/bar
5914         rm $DIR/$tdir/foo
5915         createmany -m $DIR/$tdir/longfile 201
5916         FNUM=202
5917         while [[ $(ls -sd $DIR/$tdir | awk '{ print $1 }') -eq 4 ]]; do
5918                 $MCREATE $DIR/$tdir/longfile$FNUM
5919                 FNUM=$(($FNUM + 1))
5920                 echo -n "+"
5921         done
5922         echo
5923         ls -l $DIR/$tdir > /dev/null || error "ls -l $DIR/$tdir failed"
5924 }
5925 run_test 51a "special situations: split htree with empty entry =="
5926
5927 cleanup_print_lfs_df () {
5928         trap 0
5929         $LFS df
5930         $LFS df -i
5931 }
5932
5933 test_51b() {
5934         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5935
5936         local dir=$DIR/$tdir
5937         local nrdirs=$((65536 + 100))
5938
5939         # cleanup the directory
5940         rm -fr $dir
5941
5942         mkdir_on_mdt -i $((RANDOM % MDSCOUNT)) $dir
5943
5944         $LFS df
5945         $LFS df -i
5946         local mdtidx=$(printf "%04x" $($LFS getstripe -m $dir))
5947         local numfree=$(lctl get_param -n mdc.$FSNAME-MDT$mdtidx*.filesfree)
5948         [[ $numfree -lt $nrdirs ]] &&
5949                 skip "not enough free inodes ($numfree) on MDT$mdtidx"
5950
5951         # need to check free space for the directories as well
5952         local blkfree=$(lctl get_param -n mdc.$FSNAME-MDT$mdtidx*.kbytesavail)
5953         numfree=$(( blkfree / $(fs_inode_ksize) ))
5954         [[ $numfree -lt $nrdirs ]] && skip "not enough blocks ($numfree)"
5955
5956         trap cleanup_print_lfs_df EXIT
5957
5958         # create files
5959         createmany -d $dir/d $nrdirs || {
5960                 unlinkmany $dir/d $nrdirs
5961                 error "failed to create $nrdirs subdirs in MDT$mdtidx:$dir"
5962         }
5963
5964         # really created :
5965         nrdirs=$(ls -U $dir | wc -l)
5966
5967         # unlink all but 100 subdirectories, then check it still works
5968         local left=100
5969         local delete=$((nrdirs - left))
5970
5971         $LFS df
5972         $LFS df -i
5973
5974         # for ldiskfs the nlink count should be 1, but this is OSD specific
5975         # and so this is listed for informational purposes only
5976         echo "nlink before: $(stat -c %h $dir), created before: $nrdirs"
5977         unlinkmany -d $dir/d $delete ||
5978                 error "unlink of first $delete subdirs failed"
5979
5980         echo "nlink between: $(stat -c %h $dir)"
5981         local found=$(ls -U $dir | wc -l)
5982         [ $found -ne $left ] &&
5983                 error "can't find subdirs: found only $found, expected $left"
5984
5985         unlinkmany -d $dir/d $delete $left ||
5986                 error "unlink of second $left subdirs failed"
5987         # regardless of whether the backing filesystem tracks nlink accurately
5988         # or not, the nlink count shouldn't be more than "." and ".." here
5989         local after=$(stat -c %h $dir)
5990         [[ $after -gt 2 ]] && error "nlink after: $after > 2" ||
5991                 echo "nlink after: $after"
5992
5993         cleanup_print_lfs_df
5994 }
5995 run_test 51b "exceed 64k subdirectory nlink limit on create, verify unlink"
5996
5997 test_51d_sub() {
5998         local stripecount=$1
5999         local nfiles=$2
6000
6001         log "create files with stripecount=$stripecount"
6002         $LFS setstripe -C $stripecount $DIR/$tdir
6003         createmany -o $DIR/$tdir/t- $nfiles
6004         $LFS getstripe $DIR/$tdir > $TMP/$tfile
6005         for ((n = 0; n < $OSTCOUNT; n++)); do
6006                 objs[$n]=$(awk -vobjs=0 '($1 == '$n') { objs += 1 } \
6007                            END { printf("%0.0f", objs) }' $TMP/$tfile)
6008                 objs0[$n]=$(grep -A 1 idx $TMP/$tfile | awk -vobjs=0 \
6009                             '($1 == '$n') { objs += 1 } \
6010                             END { printf("%0.0f", objs) }')
6011                 log "OST$n has ${objs[$n]} objects, ${objs0[$n]} are index 0"
6012         done
6013         unlinkmany $DIR/$tdir/t- $nfiles
6014         rm  -f $TMP/$tfile
6015
6016         local nlast
6017         local min=4
6018         local max=6 # allow variance of (1 - $min/$max) = 33% by default
6019
6020         # For some combinations of stripecount and OSTCOUNT current code
6021         # is not ideal, and allocates 50% fewer *first* objects to some OSTs
6022         # than others. Rather than skipping this test entirely, check that
6023         # and keep testing to ensure imbalance does not get worse. LU-15282
6024         (( (OSTCOUNT == 6 && stripecount == 4) ||
6025            (OSTCOUNT == 10 && (stripecount == 4 || stripecount == 8)) ||
6026            (OSTCOUNT == 12 && (stripecount == 8 || stripecount == 9)))) && max=9
6027         for ((nlast=0, n = 1; n < $OSTCOUNT; nlast=n,n++)); do
6028                 (( ${objs[$n]} > ${objs[$nlast]} * 4 / 5 )) ||
6029                         { $LFS df && $LFS df -i &&
6030                         error "stripecount=$stripecount: " \
6031                               "OST $n has fewer objects vs. OST $nlast " \
6032                               "(${objs[$n]} < ${objs[$nlast]} x 4/5)"; }
6033                 (( ${objs[$n]} < ${objs[$nlast]} * 5 / 4 )) ||
6034                         { $LFS df && $LFS df -i &&
6035                         error "stripecount=$stripecount: " \
6036                               "OST $n has more objects vs. OST $nlast " \
6037                               "(${objs[$n]} > ${objs[$nlast]} x 5/4)"; }
6038
6039                 (( ${objs0[$n]} > ${objs0[$nlast]} * $min / $max )) ||
6040                         { $LFS df && $LFS df -i &&
6041                         error "stripecount=$stripecount: " \
6042                               "OST $n has fewer #0 objects vs. OST $nlast " \
6043                               "(${objs0[$n]} < ${objs0[$nlast]} x $min/$max)"; }
6044                 (( ${objs0[$n]} < ${objs0[$nlast]} * $max / $min )) ||
6045                         { $LFS df && $LFS df -i &&
6046                         error "stripecount=$stripecount: " \
6047                               "OST $n has more #0 objects vs. OST $nlast " \
6048                               "(${objs0[$n]} > ${objs0[$nlast]} x $max/$min)"; }
6049         done
6050 }
6051
6052 test_51d() {
6053         [ $PARALLEL == "yes" ] && skip "skip parallel run"
6054         [[ $OSTCOUNT -lt 3 ]] && skip_env "needs >= 3 OSTs"
6055
6056         local stripecount
6057         local per_ost=100
6058         local nfiles=$((per_ost * OSTCOUNT))
6059         local mdts=$(comma_list $(mdts_nodes))
6060         local param="osp.*.create_count"
6061         local qos_old=$(do_facet mds1 \
6062                 "$LCTL get_param -n lod.$FSNAME-*.qos_threshold_rr" | head -n 1)
6063
6064         do_nodes $mdts \
6065                 "$LCTL set_param lod.$FSNAME-*.qos_threshold_rr=100"
6066         stack_trap "do_nodes $mdts \
6067                 '$LCTL set_param lod.$FSNAME-*.qos_threshold_rr=${qos_old%%%}'"
6068
6069         test_mkdir $DIR/$tdir
6070         local dirstripes=$(lfs getdirstripe -c $DIR/$tdir)
6071         (( dirstripes > 0 )) || dirstripes=1
6072
6073         # Ensure enough OST objects precreated for tests to pass without
6074         # running out of objects.  This is an LOV r-r OST algorithm test,
6075         # not an OST object precreation test.
6076         local old=$(do_facet mds1 "$LCTL get_param -n $param" | head -n 1)
6077         (( old >= nfiles )) ||
6078         {
6079                 local create_count=$((nfiles * OSTCOUNT / dirstripes))
6080
6081                 do_nodes $mdts "$LCTL set_param $param=$create_count"
6082                 stack_trap "do_nodes $mdts $LCTL set_param $param=$old"
6083
6084                 # trigger precreation from all MDTs for all OSTs
6085                 for ((i = 0; i < $MDSCOUNT * 2; i++ )); do
6086                         $LFS setstripe -c -1 $DIR/$tdir/wide.$i
6087                 done
6088         }
6089
6090         for ((stripecount = 3; stripecount <= $OSTCOUNT; stripecount++)); do
6091                 sleep 8  # allow object precreation to catch up
6092                 test_51d_sub $stripecount $nfiles
6093         done
6094 }
6095 run_test 51d "check LOV round-robin OST object distribution"
6096
6097 test_51e() {
6098         if [ "$mds1_FSTYPE" != ldiskfs ]; then
6099                 skip_env "ldiskfs only test"
6100         fi
6101
6102         test_mkdir -c1 $DIR/$tdir
6103         test_mkdir -c1 $DIR/$tdir/d0
6104
6105         touch $DIR/$tdir/d0/foo
6106         createmany -l $DIR/$tdir/d0/foo $DIR/$tdir/d0/f- 65001 &&
6107                 error "file exceed 65000 nlink limit!"
6108         unlinkmany $DIR/$tdir/d0/f- 65001
6109         return 0
6110 }
6111 run_test 51e "check file nlink limit"
6112
6113 test_51f() {
6114         test_mkdir $DIR/$tdir
6115
6116         local max=100000
6117         local ulimit_old=$(ulimit -n)
6118         local spare=20 # number of spare fd's for scripts/libraries, etc.
6119         local mdt=$($LFS getstripe -m $DIR/$tdir)
6120         local numfree=$($LFS df -i $DIR/$tdir | awk '/MDT:'$mdt'/ { print $4 }')
6121
6122         echo "MDT$mdt numfree=$numfree, max=$max"
6123         [[ $numfree -gt $max ]] && numfree=$max || numfree=$((numfree * 7 / 8))
6124         if [ $((numfree + spare)) -gt $ulimit_old ]; then
6125                 while ! ulimit -n $((numfree + spare)); do
6126                         numfree=$((numfree * 3 / 4))
6127                 done
6128                 echo "changed ulimit from $ulimit_old to $((numfree + spare))"
6129         else
6130                 echo "left ulimit at $ulimit_old"
6131         fi
6132
6133         createmany -o -k -t 120 $DIR/$tdir/f $numfree || {
6134                 unlinkmany $DIR/$tdir/f $numfree
6135                 error "create+open $numfree files in $DIR/$tdir failed"
6136         }
6137         ulimit -n $ulimit_old
6138
6139         # if createmany exits at 120s there will be fewer than $numfree files
6140         unlinkmany $DIR/$tdir/f $numfree || true
6141 }
6142 run_test 51f "check many open files limit"
6143
6144 test_52a() {
6145         [ -f $DIR/$tdir/foo ] && chattr -a $DIR/$tdir/foo
6146         test_mkdir $DIR/$tdir
6147         touch $DIR/$tdir/foo
6148         chattr +a $DIR/$tdir/foo || error "chattr +a failed"
6149         echo bar >> $DIR/$tdir/foo || error "append bar failed"
6150         cp /etc/hosts $DIR/$tdir/foo && error "cp worked"
6151         rm -f $DIR/$tdir/foo 2>/dev/null && error "rm worked"
6152         link $DIR/$tdir/foo $DIR/$tdir/foo_link 2>/dev/null &&
6153                                         error "link worked"
6154         echo foo >> $DIR/$tdir/foo || error "append foo failed"
6155         mrename $DIR/$tdir/foo $DIR/$tdir/foo_ren && error "rename worked"
6156         lsattr $DIR/$tdir/foo | egrep -q "^-+a[-e]+ $DIR/$tdir/foo" ||
6157                                                      error "lsattr"
6158         chattr -a $DIR/$tdir/foo || error "chattr -a failed"
6159         cp -r $DIR/$tdir $TMP/
6160         rm -fr $DIR/$tdir $TMP/$tdir || error "cleanup rm failed"
6161 }
6162 run_test 52a "append-only flag test (should return errors)"
6163
6164 test_52b() {
6165         [ -f $DIR/$tdir/foo ] && chattr -i $DIR/$tdir/foo
6166         test_mkdir $DIR/$tdir
6167         touch $DIR/$tdir/foo
6168         chattr +i $DIR/$tdir/foo || error "chattr +i failed"
6169         cat test > $DIR/$tdir/foo && error "cat test worked"
6170         cp /etc/hosts $DIR/$tdir/foo && error "cp worked"
6171         rm -f $DIR/$tdir/foo 2>/dev/null && error "rm worked"
6172         link $DIR/$tdir/foo $DIR/$tdir/foo_link 2>/dev/null &&
6173                                         error "link worked"
6174         echo foo >> $DIR/$tdir/foo && error "echo worked"
6175         mrename $DIR/$tdir/foo $DIR/$tdir/foo_ren && error "rename worked"
6176         [ -f $DIR/$tdir/foo ] || error "$tdir/foo is not a file"
6177         [ -f $DIR/$tdir/foo_ren ] && error "$tdir/foo_ren is not a file"
6178         lsattr $DIR/$tdir/foo | egrep -q "^-+i[-e]+ $DIR/$tdir/foo" ||
6179                                                         error "lsattr"
6180         chattr -i $DIR/$tdir/foo || error "chattr failed"
6181
6182         rm -fr $DIR/$tdir || error "unable to remove $DIR/$tdir"
6183 }
6184 run_test 52b "immutable flag test (should return errors) ======="
6185
6186 test_53() {
6187         [ $PARALLEL == "yes" ] && skip "skip parallel run"
6188         remote_mds_nodsh && skip "remote MDS with nodsh"
6189         remote_ost_nodsh && skip "remote OST with nodsh"
6190
6191         local param
6192         local param_seq
6193         local ostname
6194         local mds_last
6195         local mds_last_seq
6196         local ost_last
6197         local ost_last_seq
6198         local ost_last_id
6199         local ostnum
6200         local node
6201         local found=false
6202         local support_last_seq=true
6203
6204         [[ $MDS1_VERSION -ge $(version_code 2.3.60) ]] ||
6205                 support_last_seq=false
6206
6207         # only test MDT0000
6208         local mdtosc=$(get_mdtosc_proc_path $SINGLEMDS)
6209         local value
6210         for value in $(do_facet $SINGLEMDS \
6211                        $LCTL get_param osp.$mdtosc.prealloc_last_id) ; do
6212                 param=$(echo ${value[0]} | cut -d "=" -f1)
6213                 ostname=$(echo $param | cut -d "." -f2 | cut -d - -f 1-2)
6214
6215                 if $support_last_seq; then
6216                         param_seq=$(echo $param |
6217                                 sed -e s/prealloc_last_id/prealloc_last_seq/g)
6218                         mds_last_seq=$(do_facet $SINGLEMDS \
6219                                        $LCTL get_param -n $param_seq)
6220                 fi
6221                 mds_last=$(do_facet $SINGLEMDS $LCTL get_param -n $param)
6222
6223                 ostnum=$(index_from_ostuuid ${ostname}_UUID)
6224                 node=$(facet_active_host ost$((ostnum+1)))
6225                 param="obdfilter.$ostname.last_id"
6226                 for ost_last in $(do_node $node $LCTL get_param -n $param) ; do
6227                         echo "$ostname.last_id=$ost_last; MDS.last_id=$mds_last"
6228                         ost_last_id=$ost_last
6229
6230                         if $support_last_seq; then
6231                                 ost_last_id=$(echo $ost_last |
6232                                               awk -F':' '{print $2}' |
6233                                               sed -e "s/^0x//g")
6234                                 ost_last_seq=$(echo $ost_last |
6235                                                awk -F':' '{print $1}')
6236                                 [[ $ost_last_seq = $mds_last_seq ]] || continue
6237                         fi
6238
6239                         if [[ $ost_last_id != $mds_last ]]; then
6240                                 error "$ost_last_id != $mds_last"
6241                         else
6242                                 found=true
6243                                 break
6244                         fi
6245                 done
6246         done
6247         $found || error "can not match last_seq/last_id for $mdtosc"
6248         return 0
6249 }
6250 run_test 53 "verify that MDS and OSTs agree on pre-creation ===="
6251
6252 test_54a() {
6253         LANG=C perl -MSocket -e ';' || skip "no Socket perl module installed"
6254
6255         LANG=C $SOCKETSERVER $DIR/socket ||
6256                 error "$SOCKETSERVER $DIR/socket failed: $?"
6257         LANG=C $SOCKETCLIENT $DIR/socket ||
6258                 error "$SOCKETCLIENT $DIR/socket failed: $?"
6259         $MUNLINK $DIR/socket || error "$MUNLINK $DIR/socket failed: $?"
6260 }
6261 run_test 54a "unix domain socket test =========================="
6262
6263 test_54b() {
6264         f="$DIR/f54b"
6265         mknod $f c 1 3
6266         chmod 0666 $f
6267         dd if=/dev/zero of=$f bs=$PAGE_SIZE count=1
6268 }
6269 run_test 54b "char device works in lustre ======================"
6270
6271 find_loop_dev() {
6272         [ -b /dev/loop/0 ] && LOOPBASE=/dev/loop/
6273         [ -b /dev/loop0 ] && LOOPBASE=/dev/loop
6274         [ -z "$LOOPBASE" ] && echo "/dev/loop/0 and /dev/loop0 gone?" && return
6275
6276         for i in $(seq 3 7); do
6277                 losetup $LOOPBASE$i > /dev/null 2>&1 && continue
6278                 LOOPDEV=$LOOPBASE$i
6279                 LOOPNUM=$i
6280                 break
6281         done
6282 }
6283
6284 cleanup_54c() {
6285         local rc=0
6286         loopdev="$DIR/loop54c"
6287
6288         trap 0
6289         $UMOUNT $DIR/$tdir || rc=$?
6290         losetup -d $loopdev || true
6291         losetup -d $LOOPDEV || true
6292         rm -rf $loopdev $DIR/$tfile $DIR/$tdir
6293         return $rc
6294 }
6295
6296 test_54c() {
6297         [ $PARALLEL == "yes" ] && skip "skip parallel run"
6298
6299         loopdev="$DIR/loop54c"
6300
6301         find_loop_dev
6302         [ -z "$LOOPNUM" ] && skip_env "couldn't find empty loop device"
6303         trap cleanup_54c EXIT
6304         mknod $loopdev b 7 $LOOPNUM
6305         echo "make a loop file system with $DIR/$tfile on $loopdev ($LOOPNUM)."
6306         dd if=/dev/zero of=$DIR/$tfile bs=$PAGE_SIZE seek=1024 count=1 > /dev/null
6307         losetup $loopdev $DIR/$tfile ||
6308                 error "can't set up $loopdev for $DIR/$tfile"
6309         mkfs.ext2 $loopdev || error "mke2fs on $loopdev"
6310         test_mkdir $DIR/$tdir
6311         mount -t ext2 $loopdev $DIR/$tdir ||
6312                 error "error mounting $loopdev on $DIR/$tdir"
6313         dd if=/dev/zero of=$DIR/$tdir/tmp bs=$PAGE_SIZE count=30 ||
6314                 error "dd write"
6315         df $DIR/$tdir
6316         dd if=$DIR/$tdir/tmp of=/dev/zero bs=$PAGE_SIZE count=30 ||
6317                 error "dd read"
6318         cleanup_54c
6319 }
6320 run_test 54c "block device works in lustre ====================="
6321
6322 test_54d() {
6323         local pipe="$DIR/$tfile.pipe"
6324         local string="aaaaaa"
6325
6326         mknod $pipe p
6327         echo -n "$string" > $pipe &
6328         local result=$(cat $pipe)
6329         [[ "$result" == "$string" ]] || error "$result != $string"
6330 }
6331 run_test 54d "fifo device works in lustre ======================"
6332
6333 test_54e() {
6334         f="$DIR/f54e"
6335         string="aaaaaa"
6336         cp -aL /dev/console $f
6337         echo $string > $f || error "echo $string to $f failed"
6338 }
6339 run_test 54e "console/tty device works in lustre ======================"
6340
6341 test_56a() {
6342         local numfiles=3
6343         local numdirs=2
6344         local dir=$DIR/$tdir
6345
6346         rm -rf $dir
6347         test_mkdir -p $dir/dir
6348         for i in $(seq $numfiles); do
6349                 touch $dir/file$i
6350                 touch $dir/dir/file$i
6351         done
6352
6353         local numcomp=$($LFS getstripe --component-count $dir)
6354
6355         [[ $numcomp == 0 ]] && numcomp=1
6356
6357         # test lfs getstripe with --recursive
6358         local filenum=$($LFS getstripe -r $dir | egrep -c "obdidx|l_ost_idx")
6359
6360         [[ $filenum -eq $((numfiles * 2)) ]] ||
6361                 error "$LFS getstripe -r: found $filenum != $((numfiles * 2))"
6362         filenum=$($LFS getstripe $dir | egrep -c "obdidx|l_ost_idx")
6363         [[ $filenum -eq $numfiles ]] ||
6364                 error "$LFS getstripe $dir: found $filenum, not $numfiles"
6365         echo "$LFS getstripe showed obdidx or l_ost_idx"
6366
6367         # test lfs getstripe with file instead of dir
6368         filenum=$($LFS getstripe $dir/file1 | egrep -c "obdidx|l_ost_idx")
6369         [[ $filenum -eq 1 ]] ||
6370                 error "$LFS getstripe $dir/file1: found $filenum, not 1"
6371         echo "$LFS getstripe file1 passed"
6372
6373         #test lfs getstripe with --verbose
6374         filenum=$($LFS getstripe --verbose $dir | grep -c lmm_magic)
6375         [[ $filenum -eq $((numfiles * numcomp)) ]] ||
6376                 error "$LFS getstripe --verbose $dir: "\
6377                       "got $filenum want $((numfiles * numcomp)) lmm_magic"
6378         [[ $($LFS getstripe $dir | grep -c lmm_magic) -eq 0 ]] ||
6379                 error "$LFS getstripe $dir: showed lmm_magic"
6380
6381         #test lfs getstripe with -v prints lmm_fid
6382         filenum=$($LFS getstripe -v $dir | grep -c lmm_fid)
6383         local countfids=$((numdirs + numfiles * numcomp))
6384         [[ $filenum -eq $countfids ]] ||
6385                 error "$LFS getstripe -v $dir: "\
6386                       "got $filenum want $countfids lmm_fid"
6387         [[ $($LFS getstripe $dir | grep -c lmm_fid) -eq 0 ]] ||
6388                 error "$LFS getstripe $dir: showed lmm_fid by default"
6389         echo "$LFS getstripe --verbose passed"
6390
6391         #check for FID information
6392         local fid1=$($LFS getstripe --fid $dir/file1)
6393         local fid2=$($LFS getstripe --verbose $dir/file1 |
6394                      awk '/lmm_fid: / { print $2; exit; }')
6395         local fid3=$($LFS path2fid $dir/file1)
6396
6397         [ "$fid1" != "$fid2" ] &&
6398                 error "getstripe --fid '$fid1' != getstripe --verbose '$fid2'"
6399         [ "$fid1" != "$fid3" ] &&
6400                 error "getstripe --fid '$fid1' != lfs path2fid '$fid3'"
6401         echo "$LFS getstripe --fid passed"
6402
6403         #test lfs getstripe with --obd
6404         $LFS getstripe --obd wrong_uuid $dir 2>&1 | grep -q "unknown obduuid" ||
6405                 error "$LFS getstripe --obd wrong_uuid: should return error"
6406
6407         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
6408
6409         local ostidx=1
6410         local obduuid=$(ostuuid_from_index $ostidx)
6411         local found=$($LFS getstripe -r --obd $obduuid $dir |
6412                 grep 'lmm_stripe_offset:' | grep -c " $ostidx\$")
6413
6414         filenum=$($LFS getstripe -ir $dir | grep -c "^$ostidx\$")
6415         [[ $($LFS getstripe -id $dir) -ne $ostidx ]] ||
6416                 ((filenum--))
6417         [[ $($LFS getstripe -id $dir/dir) -ne $ostidx ]] ||
6418                 ((filenum--))
6419
6420         [[ $found -eq $filenum ]] ||
6421                 error "$LFS getstripe --obd: found $found expect $filenum"
6422         [[ $($LFS getstripe -r -v --obd $obduuid $dir |
6423                 sed '/^[         ]*'${ostidx}'[  ]/d' |
6424                 sed -n '/^[      ]*[0-9][0-9]*[  ]/p' | wc -l) -eq 0 ]] ||
6425                 error "$LFS getstripe --obd: should not show file on other obd"
6426         echo "$LFS getstripe --obd passed"
6427 }
6428 run_test 56a "check $LFS getstripe"
6429
6430 test_56b() {
6431         local dir=$DIR/$tdir
6432         local numdirs=3
6433
6434         test_mkdir $dir
6435         for i in $(seq $numdirs); do
6436                 test_mkdir $dir/dir$i
6437         done
6438
6439         # test lfs getdirstripe default mode is non-recursion, which is
6440         # different from lfs getstripe
6441         local dircnt=$($LFS getdirstripe $dir | grep -c lmv_stripe_count)
6442
6443         [[ $dircnt -eq 1 ]] ||
6444                 error "$LFS getdirstripe: found $dircnt, not 1"
6445         dircnt=$($LFS getdirstripe --recursive $dir |
6446                 grep -c lmv_stripe_count)
6447         [[ $dircnt -eq $((numdirs + 1)) ]] ||
6448                 error "$LFS getdirstripe -r: $dircnt, != $((numdirs + 1))"
6449 }
6450 run_test 56b "check $LFS getdirstripe"
6451
6452 test_56bb() {
6453         verify_yaml_available || skip_env "YAML verification not installed"
6454         local output_file=$DIR/$tfile.out
6455
6456         $LFS getdirstripe -v -D -y $DIR 1> $output_file
6457
6458         cat $output_file
6459         cat $output_file | verify_yaml || error "layout is not valid YAML"
6460 }
6461 run_test 56bb "check $LFS getdirstripe layout is YAML"
6462
6463 test_56c() {
6464         remote_ost_nodsh && skip "remote OST with nodsh"
6465
6466         local ost_idx=0
6467         local ost_name=$(ostname_from_index $ost_idx)
6468         local old_status=$(ost_dev_status $ost_idx)
6469         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
6470
6471         [[ -z "$old_status" ]] ||
6472                 skip_env "OST $ost_name is in $old_status status"
6473
6474         do_facet ost1 $LCTL set_param -n obdfilter.$ost_name.degraded=1
6475         [[ $OST1_VERSION -lt $(version_code 2.12.55) ]] || do_facet ost1 \
6476                 $LCTL set_param -n obdfilter.$ost_name.no_precreate=1
6477         if [[ $OST1_VERSION -ge $(version_code 2.12.57) ]]; then
6478                 save_lustre_params ost1 osd-*.$ost_name.nonrotational > $p
6479                 do_facet ost1 $LCTL set_param -n osd-*.$ost_name.nonrotational=1
6480         fi
6481
6482         [[ $($LFS df -v $MOUNT |& grep -c "inactive device") -eq 0 ]] ||
6483                 error "$LFS df -v showing inactive devices"
6484         sleep_maxage
6485
6486         local new_status=$(ost_dev_status $ost_idx $MOUNT -v)
6487
6488         [[ "$new_status" =~ "D" ]] ||
6489                 error "$ost_name status is '$new_status', missing 'D'"
6490         if [[ $OST1_VERSION -ge $(version_code 2.12.55) ]]; then
6491                 [[ "$new_status" =~ "N" ]] ||
6492                         error "$ost_name status is '$new_status', missing 'N'"
6493         fi
6494         if [[ $OST1_VERSION -ge $(version_code 2.12.57) ]]; then
6495                 [[ "$new_status" =~ "f" ]] ||
6496                         error "$ost_name status is '$new_status', missing 'f'"
6497         fi
6498
6499         do_facet ost1 $LCTL set_param -n obdfilter.$ost_name.degraded=0
6500         [[ $OST1_VERSION -lt $(version_code 2.12.55) ]] || do_facet ost1 \
6501                 $LCTL set_param -n obdfilter.$ost_name.no_precreate=0
6502         [[ -z "$p" ]] && restore_lustre_params < $p || true
6503         sleep_maxage
6504
6505         new_status=$(ost_dev_status $ost_idx)
6506         [[ ! "$new_status" =~ "D" && ! "$new_status" =~ "N" ]] ||
6507                 error "$ost_name status is '$new_status', has 'D' and/or 'N'"
6508         # can't check 'f' as devices may actually be on flash
6509 }
6510 run_test 56c "check 'lfs df' showing device status"
6511
6512 test_56d() {
6513         local mdts=$($LFS df -v $MOUNT | grep -c MDT)
6514         local osts=$($LFS df -v $MOUNT | grep -c OST)
6515
6516         $LFS df $MOUNT
6517
6518         (( mdts == MDSCOUNT )) ||
6519                 error "lfs df -v showed $mdts MDTs, not $MDSCOUNT"
6520         (( osts == OSTCOUNT )) ||
6521                 error "lfs df -v showed $osts OSTs, not $OSTCOUNT"
6522 }
6523 run_test 56d "'lfs df -v' prints only configured devices"
6524
6525 test_56e() {
6526         err_enoent=2 # No such file or directory
6527         err_eopnotsupp=95 # Operation not supported
6528
6529         enoent_mnt=/pmt1 # Invalid dentry. Path not present
6530         notsup_mnt=/tmp  # Valid dentry, but Not a lustreFS
6531
6532         # Check for handling of path not exists
6533         output=$($LFS df $enoent_mnt 2>&1)
6534         ret=$?
6535
6536         fs=$(echo $output | awk -F: '{print $2}' | awk '{print $3}' | tr -d \')
6537         [[ $fs = $enoent_mnt && $ret -eq $err_enoent ]] ||
6538                 error "expect failure $err_enoent, not $ret"
6539
6540         # Check for handling of non-Lustre FS
6541         output=$($LFS df $notsup_mnt)
6542         ret=$?
6543
6544         fs=$(echo $output | awk '{print $1}' | awk -F: '{print $2}')
6545         [[ $fs = $notsup_mnt && $ret -eq $err_eopnotsupp ]] ||
6546                 error "expect success $err_eopnotsupp, not $ret"
6547
6548         # Check for multiple LustreFS argument
6549         output=$($LFS df $MOUNT $MOUNT $MOUNT | grep -c "filesystem_summary:")
6550         ret=$?
6551
6552         [[ $output -eq 3 && $ret -eq 0 ]] ||
6553                 error "expect success 3, not $output, rc = $ret"
6554
6555         # Check for correct non-Lustre FS handling among multiple
6556         # LustreFS argument
6557         output=$($LFS df $MOUNT $notsup_mnt $MOUNT |
6558                 grep -c "filesystem_summary:"; exit ${PIPESTATUS[0]})
6559         ret=$?
6560
6561         [[ $output -eq 2 && $ret -eq $err_eopnotsupp ]] ||
6562                 error "expect success 2, not $output, rc = $ret"
6563 }
6564 run_test 56e "'lfs df' Handle non LustreFS & multiple LustreFS"
6565
6566 NUMFILES=3
6567 NUMDIRS=3
6568 setup_56() {
6569         local local_tdir="$1"
6570         local local_numfiles="$2"
6571         local local_numdirs="$3"
6572         local dir_params="$4"
6573         local dir_stripe_params="$5"
6574
6575         if [ ! -d "$local_tdir" ] ; then
6576                 test_mkdir -p $dir_stripe_params $local_tdir
6577                 [ "$dir_params" ] && $LFS setstripe $dir_params $local_tdir
6578                 for i in $(seq $local_numfiles) ; do
6579                         touch $local_tdir/file$i
6580                 done
6581                 for i in $(seq $local_numdirs) ; do
6582                         test_mkdir $dir_stripe_params $local_tdir/dir$i
6583                         for j in $(seq $local_numfiles) ; do
6584                                 touch $local_tdir/dir$i/file$j
6585                         done
6586                 done
6587         fi
6588 }
6589
6590 setup_56_special() {
6591         local local_tdir=$1
6592         local local_numfiles=$2
6593         local local_numdirs=$3
6594
6595         setup_56 $local_tdir $local_numfiles $local_numdirs
6596
6597         if [ ! -e "$local_tdir/loop${local_numfiles}b" ] ; then
6598                 for i in $(seq $local_numfiles) ; do
6599                         mknod $local_tdir/loop${i}b b 7 $i
6600                         mknod $local_tdir/null${i}c c 1 3
6601                         ln -s $local_tdir/file1 $local_tdir/link${i}
6602                 done
6603                 for i in $(seq $local_numdirs) ; do
6604                         mknod $local_tdir/dir$i/loop${i}b b 7 $i
6605                         mknod $local_tdir/dir$i/null${i}c c 1 3
6606                         ln -s $local_tdir/dir$i/file1 $local_tdir/dir$i/link${i}
6607                 done
6608         fi
6609 }
6610
6611 test_56g() {
6612         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6613         local expected=$(($NUMDIRS + 2))
6614
6615         setup_56 $dir $NUMFILES $NUMDIRS
6616
6617         # test lfs find with -name
6618         for i in $(seq $NUMFILES) ; do
6619                 local nums=$($LFS find -name "*$i" $dir | wc -l)
6620
6621                 [ $nums -eq $expected ] ||
6622                         error "lfs find -name '*$i' $dir wrong: "\
6623                               "found $nums, expected $expected"
6624         done
6625 }
6626 run_test 56g "check lfs find -name"
6627
6628 test_56h() {
6629         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6630         local expected=$(((NUMDIRS + 1) * (NUMFILES - 1) + NUMFILES))
6631
6632         setup_56 $dir $NUMFILES $NUMDIRS
6633
6634         # test lfs find with ! -name
6635         for i in $(seq $NUMFILES) ; do
6636                 local nums=$($LFS find ! -name "*$i" $dir | wc -l)
6637
6638                 [ $nums -eq $expected ] ||
6639                         error "lfs find ! -name '*$i' $dir wrong: "\
6640                               "found $nums, expected $expected"
6641         done
6642 }
6643 run_test 56h "check lfs find ! -name"
6644
6645 test_56i() {
6646         local dir=$DIR/$tdir
6647
6648         test_mkdir $dir
6649
6650         local cmd="$LFS find -ost $(ostuuid_from_index 0 $dir) $dir"
6651         local out=$($cmd)
6652
6653         [ -z "$out" ] || error "'$cmd' returned directory '$out'"
6654 }
6655 run_test 56i "check 'lfs find -ost UUID' skips directories"
6656
6657 test_56j() {
6658         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6659
6660         setup_56_special $dir $NUMFILES $NUMDIRS
6661
6662         local expected=$((NUMDIRS + 1))
6663         local cmd="$LFS find -type d $dir"
6664         local nums=$($cmd | wc -l)
6665
6666         [ $nums -eq $expected ] ||
6667                 error "'$cmd' wrong: found $nums, expected $expected"
6668 }
6669 run_test 56j "check lfs find -type d"
6670
6671 test_56k() {
6672         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6673
6674         setup_56_special $dir $NUMFILES $NUMDIRS
6675
6676         local expected=$(((NUMDIRS + 1) * NUMFILES))
6677         local cmd="$LFS find -type f $dir"
6678         local nums=$($cmd | wc -l)
6679
6680         [ $nums -eq $expected ] ||
6681                 error "'$cmd' wrong: found $nums, expected $expected"
6682 }
6683 run_test 56k "check lfs find -type f"
6684
6685 test_56l() {
6686         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6687
6688         setup_56_special $dir $NUMFILES $NUMDIRS
6689
6690         local expected=$((NUMDIRS + NUMFILES))
6691         local cmd="$LFS find -type b $dir"
6692         local nums=$($cmd | wc -l)
6693
6694         [ $nums -eq $expected ] ||
6695                 error "'$cmd' wrong: found $nums, expected $expected"
6696 }
6697 run_test 56l "check lfs find -type b"
6698
6699 test_56m() {
6700         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6701
6702         setup_56_special $dir $NUMFILES $NUMDIRS
6703
6704         local expected=$((NUMDIRS + NUMFILES))
6705         local cmd="$LFS find -type c $dir"
6706         local nums=$($cmd | wc -l)
6707         [ $nums -eq $expected ] ||
6708                 error "'$cmd' wrong: found $nums, expected $expected"
6709 }
6710 run_test 56m "check lfs find -type c"
6711
6712 test_56n() {
6713         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6714         setup_56_special $dir $NUMFILES $NUMDIRS
6715
6716         local expected=$((NUMDIRS + NUMFILES))
6717         local cmd="$LFS find -type l $dir"
6718         local nums=$($cmd | wc -l)
6719
6720         [ $nums -eq $expected ] ||
6721                 error "'$cmd' wrong: found $nums, expected $expected"
6722 }
6723 run_test 56n "check lfs find -type l"
6724
6725 test_56o() {
6726         local dir=$DIR/$tdir
6727
6728         setup_56 $dir $NUMFILES $NUMDIRS
6729         utime $dir/file1 > /dev/null || error "utime (1)"
6730         utime $dir/file2 > /dev/null || error "utime (2)"
6731         utime $dir/dir1 > /dev/null || error "utime (3)"
6732         utime $dir/dir2 > /dev/null || error "utime (4)"
6733         utime $dir/dir1/file1 > /dev/null || error "utime (5)"
6734         dd if=/dev/zero count=1 >> $dir/dir1/file1 && sync
6735
6736         local expected=4
6737         local nums=$($LFS find -mtime +0 $dir | wc -l)
6738
6739         [ $nums -eq $expected ] ||
6740                 error "lfs find -mtime +0 $dir: found $nums expect $expected"
6741
6742         expected=12
6743         cmd="$LFS find -mtime 0 $dir"
6744         nums=$($cmd | wc -l)
6745         [ $nums -eq $expected ] ||
6746                 error "'$cmd' wrong: found $nums, expected $expected"
6747 }
6748 run_test 56o "check lfs find -mtime for old files"
6749
6750 test_56ob() {
6751         local dir=$DIR/$tdir
6752         local expected=1
6753         local count=0
6754
6755         # just to make sure there is something that won't be found
6756         test_mkdir $dir
6757         touch $dir/$tfile.now
6758
6759         for age in year week day hour min; do
6760                 count=$((count + 1))
6761
6762                 touch $dir/$tfile-a.$age $dir/$tfile-m.$age
6763                 touch --date="$count $age ago" -a $dir/$tfile-a.$age
6764                 touch --date="$count $age ago" -m $dir/$tfile-m.$age
6765
6766                 local cmd="$LFS find $dir -mtime $count${age:0:1}"
6767                 local nums=$($cmd | wc -l)
6768                 [ $nums -eq $expected ] ||
6769                         error "'$cmd' wrong: found $nums, expected $expected"
6770
6771                 cmd="$LFS find $dir -atime $count${age:0:1}"
6772                 nums=$($cmd | wc -l)
6773                 [ $nums -eq $expected ] ||
6774                         error "'$cmd' wrong: found $nums, expected $expected"
6775         done
6776
6777         sleep 2
6778         cmd="$LFS find $dir -ctime +1s -type f"
6779         nums=$($cmd | wc -l)
6780         (( $nums == $count * 2 + 1)) ||
6781                 error "'$cmd' wrong: found $nums, expected $((count * 2 + 1))"
6782 }
6783 run_test 56ob "check lfs find -atime -mtime -ctime with units"
6784
6785 test_newerXY_base() {
6786         local x=$1
6787         local y=$2
6788         local dir=$DIR/$tdir
6789         local ref
6790         local negref
6791
6792         if [ $y == "t" ]; then
6793                 if [ $x == "b" ]; then
6794                         ref=\"$(do_facet mds1 date +"%Y-%m-%d\ %H:%M:%S")\"
6795                 else
6796                         ref=\"$(date +"%Y-%m-%d %H:%M:%S")\"
6797                 fi
6798         else
6799                 ref=$DIR/$tfile.newer.$x$y
6800                 touch $ref || error "touch $ref failed"
6801         fi
6802
6803         echo "before = $ref"
6804         sleep 2
6805         setup_56 $dir $NUMFILES $NUMDIRS "-i0 -c1" "-i0 -c1"
6806         sleep 2
6807         if [ $y == "t" ]; then
6808                 if [ $x == "b" ]; then
6809                         negref=\"$(do_facet mds1 date +"%Y-%m-%d\ %H:%M:%S")\"
6810                 else
6811                         negref=\"$(date +"%Y-%m-%d %H:%M:%S")\"
6812                 fi
6813         else
6814                 negref=$DIR/$tfile.negnewer.$x$y
6815                 touch $negref || error "touch $negref failed"
6816         fi
6817
6818         echo "after = $negref"
6819         local cmd="$LFS find $dir -newer$x$y $ref"
6820         local nums=$(eval $cmd | wc -l)
6821         local expected=$(((NUMFILES + 2) * NUMDIRS + 1))
6822
6823         [ $nums -eq $expected ] || { ls -lauR --full-time $dir ;
6824                 error "'$cmd' wrong: found $nums newer, expected $expected"  ; }
6825
6826         cmd="$LFS find $dir ! -newer$x$y $negref"
6827         nums=$(eval $cmd | wc -l)
6828         [ $nums -eq $expected ] || { ls -lauR --full-time $dir ;
6829                 error "'$cmd' wrong: found $nums older, expected $expected"  ; }
6830
6831         cmd="$LFS find $dir -newer$x$y $ref ! -newer$x$y $negref"
6832         nums=$(eval $cmd | wc -l)
6833         [ $nums -eq $expected ] || { ls -lauR --full-time $dir ;
6834                 error "'$cmd' wrong: found $nums between, expected $expected"; }
6835
6836         rm -rf $DIR/*
6837 }
6838
6839 test_56oc() {
6840         test_newerXY_base "a" "a"
6841         test_newerXY_base "a" "m"
6842         test_newerXY_base "a" "c"
6843         test_newerXY_base "m" "a"
6844         test_newerXY_base "m" "m"
6845         test_newerXY_base "m" "c"
6846         test_newerXY_base "c" "a"
6847         test_newerXY_base "c" "m"
6848         test_newerXY_base "c" "c"
6849
6850         test_newerXY_base "a" "t"
6851         test_newerXY_base "m" "t"
6852         test_newerXY_base "c" "t"
6853
6854         (( $MDS1_VERSION >= $(version_code v2_13_53-145-g186b97e68a) &&
6855            $CLIENT_VERSION >= $(version_code v2_13_53-145-g186b97e68a) )) ||
6856                 { echo "btime needs v2_13_53-145-g186b97e68a"; return 0; }
6857
6858         test_newerXY_base "b" "b"
6859         test_newerXY_base "b" "t"
6860 }
6861 run_test 56oc "check lfs find -newerXY work"
6862
6863 test_56od() {
6864         (( $MDS1_VERSION >= $(version_code v2_13_53-145-g186b97e68a) )) ||
6865                 skip "btime unsupported on MDS < v2_13_53-145-g186b97e68a"
6866
6867         (( $CLIENT_VERSION >= $(version_code v2_13_53-145-g186b97e68a) )) ||
6868                 skip "btime unsupported on clients < v2_13_53-145-g186b97e68a"
6869
6870         local dir=$DIR/$tdir
6871         local ref=$DIR/$tfile.ref
6872         local negref=$DIR/$tfile.negref
6873
6874         mkdir $dir || error "mkdir $dir failed"
6875         touch $dir/$tfile.n1 || error "touch $dir/$tfile.n1 failed"
6876         touch $dir/$tfile.n2 || error "touch $dir/$tfile.n2 failed"
6877         mkdir $dir/$tdir.n1 || error "mkdir $dir/$tdir.n1 failed"
6878         mkdir $dir/$tdir.n2 || error "mkdir $dir/$tdir.n2 failed"
6879         touch $ref || error "touch $ref failed"
6880         # sleep 3 seconds at least
6881         sleep 3
6882
6883         local before=$(do_facet mds1 date +%s)
6884         local skew=$(($(date +%s) - before + 1))
6885
6886         if (( skew < 0 && skew > -5 )); then
6887                 sleep $((0 - skew + 1))
6888                 skew=0
6889         fi
6890
6891         # Set the dir stripe params to limit files all on MDT0,
6892         # otherwise we need to calc the max clock skew between
6893         # the client and MDTs.
6894         setup_56 $dir/d.btime $NUMFILES $NUMDIRS "-i0 -c1" "-i0 -c1"
6895         sleep 2
6896         touch $negref || error "touch $negref failed"
6897
6898         local cmd="$LFS find $dir -newerbb $ref ! -newerbb $negref -type f"
6899         local nums=$($cmd | wc -l)
6900         local expected=$(((NUMFILES + 1) * NUMDIRS))
6901
6902         [ $nums -eq $expected ] ||
6903                 error "'$cmd' wrong: found $nums, expected $expected"
6904
6905         cmd="$LFS find $dir -newerbb $ref ! -newerbb $negref -type d"
6906         nums=$($cmd | wc -l)
6907         expected=$((NUMFILES + 1))
6908         [ $nums -eq $expected ] ||
6909                 error "'$cmd' wrong: found $nums, expected $expected"
6910
6911         [ $skew -lt 0 ] && return
6912
6913         local after=$(do_facet mds1 date +%s)
6914         local age=$((after - before + 1 + skew))
6915
6916         cmd="$LFS find $dir -btime -${age}s -type f"
6917         nums=$($cmd | wc -l)
6918         expected=$(((NUMFILES + 1) * NUMDIRS))
6919
6920         echo "Clock skew between client and server: $skew, age:$age"
6921         [ $nums -eq $expected ] ||
6922                 error "'$cmd' wrong: found $nums, expected $expected"
6923
6924         expected=$(($NUMDIRS + 1))
6925         cmd="$LFS find $dir -btime -${age}s -type d"
6926         nums=$($cmd | wc -l)
6927         [ $nums -eq $expected ] ||
6928                 error "'$cmd' wrong: found $nums, expected $expected"
6929         rm -f $ref $negref || error "Failed to remove $ref $negref"
6930 }
6931 run_test 56od "check lfs find -btime with units"
6932
6933 test_56p() {
6934         [ $RUNAS_ID -eq $UID ] &&
6935                 skip_env "RUNAS_ID = UID = $UID -- skipping"
6936
6937         local dir=$DIR/$tdir
6938
6939         setup_56 $dir $NUMFILES $NUMDIRS
6940         chown $RUNAS_ID $dir/file* || error "chown $DIR/${tdir}g/file$i failed"
6941
6942         local expected=$NUMFILES
6943         local cmd="$LFS find -uid $RUNAS_ID $dir"
6944         local nums=$($cmd | wc -l)
6945
6946         [ $nums -eq $expected ] ||
6947                 error "'$cmd' wrong: found $nums, expected $expected"
6948
6949         expected=$(((NUMFILES + 1) * NUMDIRS + 1))
6950         cmd="$LFS find ! -uid $RUNAS_ID $dir"
6951         nums=$($cmd | wc -l)
6952         [ $nums -eq $expected ] ||
6953                 error "'$cmd' wrong: found $nums, expected $expected"
6954 }
6955 run_test 56p "check lfs find -uid and ! -uid"
6956
6957 test_56q() {
6958         [ $RUNAS_ID -eq $UID ] &&
6959                 skip_env "RUNAS_ID = UID = $UID -- skipping"
6960
6961         local dir=$DIR/$tdir
6962
6963         setup_56 $dir $NUMFILES $NUMDIRS
6964         chgrp $RUNAS_GID $dir/file* || error "chown $dir/file$i failed"
6965
6966         local expected=$NUMFILES
6967         local cmd="$LFS find -gid $RUNAS_GID $dir"
6968         local nums=$($cmd | wc -l)
6969
6970         [ $nums -eq $expected ] ||
6971                 error "'$cmd' wrong: found $nums, expected $expected"
6972
6973         expected=$(( ($NUMFILES+1) * $NUMDIRS + 1))
6974         cmd="$LFS find ! -gid $RUNAS_GID $dir"
6975         nums=$($cmd | wc -l)
6976         [ $nums -eq $expected ] ||
6977                 error "'$cmd' wrong: found $nums, expected $expected"
6978 }
6979 run_test 56q "check lfs find -gid and ! -gid"
6980
6981 test_56r() {
6982         local dir=$DIR/$tdir
6983
6984         setup_56 $dir $NUMFILES $NUMDIRS
6985
6986         local expected=12
6987         local cmd="$LFS find -size 0 -type f -lazy $dir"
6988         local nums=$($cmd | wc -l)
6989
6990         [ $nums -eq $expected ] ||
6991                 error "'$cmd' wrong: found $nums, expected $expected"
6992         cmd="$LFS find -size 0 -type f $dir"
6993         nums=$($cmd | wc -l)
6994         [ $nums -eq $expected ] ||
6995                 error "'$cmd' wrong: found $nums, expected $expected"
6996
6997         expected=0
6998         cmd="$LFS find ! -size 0 -type f -lazy $dir"
6999         nums=$($cmd | wc -l)
7000         [ $nums -eq $expected ] ||
7001                 error "'$cmd' wrong: found $nums, expected $expected"
7002         cmd="$LFS find ! -size 0 -type f $dir"
7003         nums=$($cmd | wc -l)
7004         [ $nums -eq $expected ] ||
7005                 error "'$cmd' wrong: found $nums, expected $expected"
7006
7007         echo "test" > $dir/$tfile
7008         echo "test2" > $dir/$tfile.2 && sync
7009         expected=1
7010         cmd="$LFS find -size 5 -type f -lazy $dir"
7011         nums=$($cmd | wc -l)
7012         [ $nums -eq $expected ] ||
7013                 error "'$cmd' wrong: found $nums, expected $expected"
7014         cmd="$LFS find -size 5 -type f $dir"
7015         nums=$($cmd | wc -l)
7016         [ $nums -eq $expected ] ||
7017                 error "'$cmd' wrong: found $nums, expected $expected"
7018
7019         expected=1
7020         cmd="$LFS find -size +5 -type f -lazy $dir"
7021         nums=$($cmd | wc -l)
7022         [ $nums -eq $expected ] ||
7023                 error "'$cmd' wrong: found $nums, expected $expected"
7024         cmd="$LFS find -size +5 -type f $dir"
7025         nums=$($cmd | wc -l)
7026         [ $nums -eq $expected ] ||
7027                 error "'$cmd' wrong: found $nums, expected $expected"
7028
7029         expected=2
7030         cmd="$LFS find -size +0 -type f -lazy $dir"
7031         nums=$($cmd | wc -l)
7032         [ $nums -eq $expected ] ||
7033                 error "'$cmd' wrong: found $nums, expected $expected"
7034         cmd="$LFS find -size +0 -type f $dir"
7035         nums=$($cmd | wc -l)
7036         [ $nums -eq $expected ] ||
7037                 error "'$cmd' wrong: found $nums, expected $expected"
7038
7039         expected=2
7040         cmd="$LFS find ! -size -5 -type f -lazy $dir"
7041         nums=$($cmd | wc -l)
7042         [ $nums -eq $expected ] ||
7043                 error "'$cmd' wrong: found $nums, expected $expected"
7044         cmd="$LFS find ! -size -5 -type f $dir"
7045         nums=$($cmd | wc -l)
7046         [ $nums -eq $expected ] ||
7047                 error "'$cmd' wrong: found $nums, expected $expected"
7048
7049         expected=12
7050         cmd="$LFS find -size -5 -type f -lazy $dir"
7051         nums=$($cmd | wc -l)
7052         [ $nums -eq $expected ] ||
7053                 error "'$cmd' wrong: found $nums, expected $expected"
7054         cmd="$LFS find -size -5 -type f $dir"
7055         nums=$($cmd | wc -l)
7056         [ $nums -eq $expected ] ||
7057                 error "'$cmd' wrong: found $nums, expected $expected"
7058 }
7059 run_test 56r "check lfs find -size works"
7060
7061 test_56ra_sub() {
7062         local expected=$1
7063         local glimpses=$2
7064         local cmd="$3"
7065
7066         cancel_lru_locks $OSC
7067
7068         local rpcs_before=$(calc_stats $OSC.*$OSC*.stats ldlm_glimpse_enqueue)
7069         local nums=$($cmd | wc -l)
7070
7071         [ $nums -eq $expected ] ||
7072                 error "'$cmd' wrong: found $nums, expected $expected"
7073
7074         local rpcs_after=$(calc_stats $OSC.*$OSC*.stats ldlm_glimpse_enqueue)
7075
7076         if (( rpcs_before + glimpses != rpcs_after )); then
7077                 echo "Before: $rpcs_before After: $rpcs_after $NUMFILES"
7078                 $LCTL get_param osc.*.stats | grep ldlm_glimpse_enqueue
7079
7080                 if [[ $glimpses == 0 ]]; then
7081                         error "'$cmd' should not send glimpse RPCs to OST"
7082                 else
7083                         error "'$cmd' should send $glimpses glimpse RPCs to OST"
7084                 fi
7085         fi
7086 }
7087
7088 test_56ra() {
7089         [[ $MDS1_VERSION -gt $(version_code 2.12.58) ]] ||
7090                 skip "MDS < 2.12.58 doesn't return LSOM data"
7091         local dir=$DIR/$tdir
7092         local old_agl=$($LCTL get_param -n llite.*.statahead_agl)
7093
7094         [[ $OSC == "mdc" ]] && skip "statahead not needed for DoM files"
7095
7096         # statahead_agl may cause extra glimpse which confuses results. LU-13017
7097         $LCTL set_param -n llite.*.statahead_agl=0
7098         stack_trap "$LCTL set_param -n llite.*.statahead_agl=$old_agl"
7099
7100         setup_56 $dir $NUMFILES $NUMDIRS "-c 1"
7101         # open and close all files to ensure LSOM is updated
7102         cancel_lru_locks $OSC
7103         find $dir -type f | xargs cat > /dev/null
7104
7105         #   expect_found  glimpse_rpcs  command_to_run
7106         test_56ra_sub 12  0 "$LFS find -size 0 -type f -lazy $dir"
7107         test_56ra_sub 12 12 "$LFS find -size 0 -type f $dir"
7108         test_56ra_sub  0  0 "$LFS find ! -size 0 -type f -lazy $dir"
7109         test_56ra_sub  0 12 "$LFS find ! -size 0 -type f $dir"
7110
7111         echo "test" > $dir/$tfile
7112         echo "test2" > $dir/$tfile.2 && sync
7113         cancel_lru_locks $OSC
7114         cat $dir/$tfile $dir/$tfile.2 > /dev/null
7115
7116         test_56ra_sub  1  0 "$LFS find -size 5 -type f -lazy $dir"
7117         test_56ra_sub  1 14 "$LFS find -size 5 -type f $dir"
7118         test_56ra_sub  1  0 "$LFS find -size +5 -type f -lazy $dir"
7119         test_56ra_sub  1 14 "$LFS find -size +5 -type f $dir"
7120
7121         test_56ra_sub  2  0 "$LFS find -size +0 -type f -lazy $dir"
7122         test_56ra_sub  2 14 "$LFS find -size +0 -type f $dir"
7123         test_56ra_sub  2  0 "$LFS find ! -size -5 -type f -lazy $dir"
7124         test_56ra_sub  2 14 "$LFS find ! -size -5 -type f $dir"
7125         test_56ra_sub 12  0 "$LFS find -size -5 -type f -lazy $dir"
7126         test_56ra_sub 12 14 "$LFS find -size -5 -type f $dir"
7127 }
7128 run_test 56ra "check lfs find -size -lazy works for data on OSTs"
7129
7130 test_56rb() {
7131         local dir=$DIR/$tdir
7132         local tmp=$TMP/$tfile.log
7133         local mdt_idx;
7134
7135         test_mkdir -p $dir || error "failed to mkdir $dir"
7136         $LFS setstripe -c 1 -i 0 $dir/$tfile ||
7137                 error "failed to setstripe $dir/$tfile"
7138         mdt_idx=$($LFS getdirstripe -i $dir)
7139         dd if=/dev/zero of=$dir/$tfile bs=1M count=1
7140
7141         stack_trap "rm -f $tmp" EXIT
7142         $LFS find --size +100K --ost 0 $dir |& tee $tmp
7143         ! grep -q obd_uuid $tmp ||
7144                 error "failed to find --size +100K --ost 0 $dir"
7145         $LFS find --size +100K --mdt $mdt_idx $dir |& tee $tmp
7146         ! grep -q obd_uuid $tmp ||
7147                 error "failed to find --size +100K --mdt $mdt_idx $dir"
7148 }
7149 run_test 56rb "check lfs find --size --ost/--mdt works"
7150
7151 test_56rc() {
7152         (( MDSCOUNT >= 2 )) || skip "needs at least 2 MDTs"
7153         local dir=$DIR/$tdir
7154         local found
7155
7156         test_mkdir -c 2 -H all_char $dir || error "failed to mkdir $dir"
7157         $LFS mkdir -c 2 --mdt-hash all_char $dir/$tdir-all{1..10}
7158         (( $MDSCOUNT > 2 )) &&
7159                 $LFS mkdir -c 3 --mdt-hash fnv_1a_64 $dir/$tdir-fnv{1..10}
7160         mkdir $dir/$tdir-{1..10}
7161         touch $dir/$tfile-{1..10}
7162
7163         found=$($LFS find $dir --mdt-count 2 | wc -l)
7164         expect=11
7165         (( $found == $expect )) || error "found $found 2-stripe, expect $expect"
7166
7167         found=$($LFS find $dir -T +1 | wc -l)
7168         (( $MDSCOUNT > 2 )) && expect=$((expect + 10))
7169         (( $found == $expect )) || error "found $found 2+stripe, expect $expect"
7170
7171         found=$($LFS find $dir --mdt-hash all_char | wc -l)
7172         expect=11
7173         (( $found == $expect )) || error "found $found all_char, expect $expect"
7174
7175         found=$($LFS find $dir --mdt-hash fnv_1a_64 | wc -l)
7176         (( $MDSCOUNT > 2 )) && expect=10 || expect=0
7177         (( $found == $expect )) || error "found $found all_char, expect $expect"
7178 }
7179 run_test 56rc "check lfs find --mdt-count/--mdt-hash works"
7180
7181 test_56rd() {
7182         local dir=$DIR/$tdir
7183
7184         test_mkdir $dir
7185         rm -f $dir/*
7186
7187         mkfifo $dir/fifo || error "failed to create fifo file"
7188         $LFS find $dir -t p --printf "%p %y %LP\n" ||
7189                 error "should not fail even cannot get projid from pipe file"
7190         found=$($LFS find $dir -t p --printf "%y")
7191         [[ "p" == $found ]] || error "found $found, expect p"
7192
7193         mknod $dir/chardev c 1 5 ||
7194                 error "failed to create character device file"
7195         $LFS find $dir -t c --printf "%p %y %LP\n" ||
7196                 error "should not fail even cannot get projid from chardev file"
7197         found=$($LFS find $dir -t c --printf "%y")
7198         [[ "c" == $found ]] || error "found $found, expect c"
7199
7200         found=$($LFS find $dir ! -type d --printf "%p %y %LP\n" | wc -l)
7201         (( found == 2 )) || error "unable to list all files"
7202 }
7203 run_test 56rd "check lfs find --printf special files"
7204
7205 test_56s() { # LU-611 #LU-9369
7206         [[ $OSTCOUNT -lt 2 ]] && skip_env "need at least 2 OSTs"
7207
7208         local dir=$DIR/$tdir
7209         local onestripe=$(((NUMDIRS + 1) * NUMFILES))
7210
7211         setup_56 $dir $NUMFILES $NUMDIRS "-c 1"
7212         for i in $(seq $NUMDIRS); do
7213                 $LFS setstripe -c $((OSTCOUNT + 1)) $dir/dir$i/$tfile
7214         done
7215
7216         local expected=$NUMDIRS
7217         local cmd="$LFS find -c $OSTCOUNT $dir"
7218         local nums=$($cmd | wc -l)
7219
7220         [ $nums -eq $expected ] || {
7221                 $LFS getstripe -R $dir
7222                 error "'$cmd' wrong: found $nums, expected $expected"
7223         }
7224
7225         expected=$((NUMDIRS + onestripe))
7226         cmd="$LFS find -stripe-count +0 -type f $dir"
7227         nums=$($cmd | wc -l)
7228         [ $nums -eq $expected ] || {
7229                 $LFS getstripe -R $dir
7230                 error "'$cmd' wrong: found $nums, expected $expected"
7231         }
7232
7233         expected=$onestripe
7234         cmd="$LFS find -stripe-count 1 -type f $dir"
7235         nums=$($cmd | wc -l)
7236         [ $nums -eq $expected ] || {
7237                 $LFS getstripe -R $dir
7238                 error "'$cmd' wrong: found $nums, expected $expected"
7239         }
7240
7241         cmd="$LFS find -stripe-count -2 -type f $dir"
7242         nums=$($cmd | wc -l)
7243         [ $nums -eq $expected ] || {
7244                 $LFS getstripe -R $dir
7245                 error "'$cmd' wrong: found $nums, expected $expected"
7246         }
7247
7248         expected=0
7249         cmd="$LFS find -stripe-count $((OSTCOUNT + 1)) -type f $dir"
7250         nums=$($cmd | wc -l)
7251         [ $nums -eq $expected ] || {
7252                 $LFS getstripe -R $dir
7253                 error "'$cmd' wrong: found $nums, expected $expected"
7254         }
7255 }
7256 run_test 56s "check lfs find -stripe-count works"
7257
7258 test_56t() { # LU-611 #LU-9369
7259         local dir=$DIR/$tdir
7260
7261         setup_56 $dir 0 $NUMDIRS
7262         for i in $(seq $NUMDIRS); do
7263                 $LFS setstripe -S 8M $dir/dir$i/$tfile
7264         done
7265
7266         local expected=$NUMDIRS
7267         local cmd="$LFS find -S 8M $dir"
7268         local nums=$($cmd | wc -l)
7269
7270         [ $nums -eq $expected ] || {
7271                 $LFS getstripe -R $dir
7272                 error "'$cmd' wrong: found $nums, expected $expected"
7273         }
7274         rm -rf $dir
7275
7276         setup_56 $dir $NUMFILES $NUMDIRS "--stripe-size 512k"
7277
7278         $LFS setstripe -S 256k $dir/$tfile.{0,1,2,3}
7279
7280         expected=$(((NUMDIRS + 1) * NUMFILES))
7281         cmd="$LFS find -stripe-size 512k -type f $dir"
7282         nums=$($cmd | wc -l)
7283         [ $nums -eq $expected ] ||
7284                 error "'$cmd' wrong: found $nums, expected $expected"
7285
7286         cmd="$LFS find -stripe-size +320k -type f $dir"
7287         nums=$($cmd | wc -l)
7288         [ $nums -eq $expected ] ||
7289                 error "'$cmd' wrong: found $nums, expected $expected"
7290
7291         expected=$(((NUMDIRS + 1) * NUMFILES + 4))
7292         cmd="$LFS find -stripe-size +200k -type f $dir"
7293         nums=$($cmd | wc -l)
7294         [ $nums -eq $expected ] ||
7295                 error "'$cmd' wrong: found $nums, expected $expected"
7296
7297         cmd="$LFS find -stripe-size -640k -type f $dir"
7298         nums=$($cmd | wc -l)
7299         [ $nums -eq $expected ] ||
7300                 error "'$cmd' wrong: found $nums, expected $expected"
7301
7302         expected=4
7303         cmd="$LFS find -stripe-size 256k -type f $dir"
7304         nums=$($cmd | wc -l)
7305         [ $nums -eq $expected ] ||
7306                 error "'$cmd' wrong: found $nums, expected $expected"
7307
7308         cmd="$LFS find -stripe-size -320k -type f $dir"
7309         nums=$($cmd | wc -l)
7310         [ $nums -eq $expected ] ||
7311                 error "'$cmd' wrong: found $nums, expected $expected"
7312
7313         expected=0
7314         cmd="$LFS find -stripe-size 1024k -type f $dir"
7315         nums=$($cmd | wc -l)
7316         [ $nums -eq $expected ] ||
7317                 error "'$cmd' wrong: found $nums, expected $expected"
7318 }
7319 run_test 56t "check lfs find -stripe-size works"
7320
7321 test_56u() { # LU-611
7322         local dir=$DIR/$tdir
7323
7324         setup_56 $dir $NUMFILES $NUMDIRS "-i 0 -c 1"
7325
7326         if [[ $OSTCOUNT -gt 1 ]]; then
7327                 $LFS setstripe -i 1 -c 1 $dir/$tfile.{0,1,2,3}
7328                 onestripe=4
7329         else
7330                 onestripe=0
7331         fi
7332
7333         local expected=$(((NUMDIRS + 1) * NUMFILES))
7334         local cmd="$LFS find -stripe-index 0 -type f $dir"
7335         local nums=$($cmd | wc -l)
7336
7337         [ $nums -eq $expected ] ||
7338                 error "'$cmd' wrong: found $nums, expected $expected"
7339
7340         expected=$onestripe
7341         cmd="$LFS find -stripe-index 1 -type f $dir"
7342         nums=$($cmd | wc -l)
7343         [ $nums -eq $expected ] ||
7344                 error "'$cmd' wrong: found $nums, expected $expected"
7345
7346         cmd="$LFS find ! -stripe-index 0 -type f $dir"
7347         nums=$($cmd | wc -l)
7348         [ $nums -eq $expected ] ||
7349                 error "'$cmd' wrong: found $nums, expected $expected"
7350
7351         expected=0
7352         # This should produce an error and not return any files
7353         cmd="$LFS find -stripe-index $OSTCOUNT -type f $dir"
7354         nums=$($cmd 2>/dev/null | wc -l)
7355         [ $nums -eq $expected ] ||
7356                 error "'$cmd' wrong: found $nums, expected $expected"
7357
7358         if [[ $OSTCOUNT -gt 1 ]]; then
7359                 expected=$(((NUMDIRS + 1) * NUMFILES + onestripe))
7360                 cmd="$LFS find -stripe-index 0,1 -type f $dir"
7361                 nums=$($cmd | wc -l)
7362                 [ $nums -eq $expected ] ||
7363                         error "'$cmd' wrong: found $nums, expected $expected"
7364         fi
7365 }
7366 run_test 56u "check lfs find -stripe-index works"
7367
7368 test_56v() {
7369         local mdt_idx=0
7370         local dir=$DIR/$tdir
7371
7372         setup_56 $dir $NUMFILES $NUMDIRS
7373
7374         UUID=$(mdtuuid_from_index $mdt_idx $dir)
7375         [ -z "$UUID" ] && error "mdtuuid_from_index cannot find MDT $mdt_idx"
7376
7377         for file in $($LFS find -m $UUID $dir); do
7378                 file_midx=$($LFS getstripe -m $file)
7379                 [ $file_midx -eq $mdt_idx ] ||
7380                         error "lfs find -m $UUID != getstripe -m $file_midx"
7381         done
7382 }
7383 run_test 56v "check 'lfs find -m match with lfs getstripe -m'"
7384
7385 test_56wa() {
7386         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
7387         [ $PARALLEL == "yes" ] && skip "skip parallel run"
7388
7389         local dir=$DIR/$tdir
7390
7391         setup_56 $dir $NUMFILES $NUMDIRS "-c $OSTCOUNT" "-c1"
7392         stack_trap "rm -rf $dir"
7393
7394         local stripe_size=$($LFS getstripe -S -d $dir) ||
7395                 error "$LFS getstripe -S -d $dir failed"
7396         stripe_size=${stripe_size%% *}
7397
7398         local file_size=$((stripe_size * OSTCOUNT))
7399         local file_num=$((NUMDIRS * NUMFILES + NUMFILES))
7400         local required_space=$((file_num * file_size))
7401         local free_space=$($LCTL get_param -n lov.$FSNAME-clilov-*.kbytesavail |
7402                            head -n1)
7403         (( free_space >= required_space / 1024 )) ||
7404                 skip_env "need $required_space, have $free_space kbytes"
7405
7406         local dd_bs=65536
7407         local dd_count=$((file_size / dd_bs))
7408
7409         # write data into the files
7410         local i
7411         local j
7412         local file
7413
7414         for ((i = 1; i <= NUMFILES; i++ )); do
7415                 file=$dir/file$i
7416                 yes | dd bs=$dd_bs count=$dd_count of=$file &>/dev/null ||
7417                         error "write data into $file failed"
7418         done
7419         for ((i = 1; i <= NUMDIRS; i++ )); do
7420                 for ((j = 1; j <= NUMFILES; j++ )); do
7421                         file=$dir/dir$i/file$j
7422                         yes|dd bs=$dd_bs count=$dd_count of=$file &>/dev/null ||
7423                                 error "write data into $file failed"
7424                 done
7425         done
7426
7427         # $LFS_MIGRATE will fail if hard link migration is unsupported
7428         if (( MDS1_VERSION > $(version_code 2.5.55) )); then
7429                 createmany -l$dir/dir1/file1 $dir/dir1/link 200 ||
7430                         error "creating links to $dir/dir1/file1 failed"
7431         fi
7432
7433         local expected=-1
7434
7435         (( OSTCOUNT <= 1 )) || expected=$((OSTCOUNT - 1))
7436
7437         # lfs_migrate file
7438         local cmd="$LFS_MIGRATE -y -c $expected $dir/file1"
7439
7440         echo "$cmd"
7441         eval $cmd || error "$cmd failed"
7442
7443         check_stripe_count $dir/file1 $expected
7444
7445         if (( $MDS1_VERSION >= $(version_code 2.6.90) )); then
7446                 # lfs_migrate file onto OST 0 if it is on OST 1, or onto
7447                 # OST 1 if it is on OST 0. This file is small enough to
7448                 # be on only one stripe.
7449                 file=$dir/migr_1_ost
7450                 dd bs=$dd_bs count=1 if=/dev/urandom of=$file >/dev/null 2>&1 ||
7451                         error "write data into $file failed"
7452                 local obdidx=$($LFS getstripe -i $file)
7453                 local oldmd5=$(md5sum $file)
7454                 local newobdidx=0
7455
7456                 (( obdidx != 0 )) || newobdidx=1
7457                 cmd="$LFS migrate -i $newobdidx $file"
7458                 echo $cmd
7459                 eval $cmd || error "$cmd failed"
7460
7461                 local realobdix=$($LFS getstripe -i $file)
7462                 local newmd5=$(md5sum $file)
7463
7464                 (( $newobdidx == $realobdix )) ||
7465                         error "new OST is different (was=$obdidx, wanted=$newobdidx, got=$realobdix)"
7466                 [[ "$oldmd5" == "$newmd5" ]] ||
7467                         error "md5sum differ: $oldmd5, $newmd5"
7468         fi
7469
7470         # lfs_migrate dir
7471         cmd="$LFS_MIGRATE -y -c $expected $dir/dir1"
7472         echo "$cmd"
7473         eval $cmd || error "$cmd failed"
7474
7475         for (( j = 1; j <= NUMFILES; j++ )); do
7476                 check_stripe_count $dir/dir1/file$j $expected
7477         done
7478
7479         # lfs_migrate works with lfs find
7480         cmd="$LFS find -stripe_count $OSTCOUNT -type f $dir |
7481              $LFS_MIGRATE -y -c $expected"
7482         echo "$cmd"
7483         eval $cmd || error "$cmd failed"
7484
7485         for (( i = 2; i <= NUMFILES; i++ )); do
7486                 check_stripe_count $dir/file$i $expected
7487         done
7488         for (( i = 2; i <= NUMDIRS; i++ )); do
7489                 for (( j = 1; j <= NUMFILES; j++ )); do
7490                         check_stripe_count $dir/dir$i/file$j $expected
7491                 done
7492         done
7493 }
7494 run_test 56wa "check lfs_migrate -c stripe_count works"
7495
7496 test_56wb() {
7497         local file1=$DIR/$tdir/file1
7498         local create_pool=false
7499         local initial_pool=$($LFS getstripe -p $DIR)
7500         local pool_list=()
7501         local pool=""
7502
7503         echo -n "Creating test dir..."
7504         test_mkdir $DIR/$tdir &> /dev/null || error "cannot create dir"
7505         echo "done."
7506
7507         echo -n "Creating test file..."
7508         touch $file1 || error "cannot create file"
7509         echo "done."
7510
7511         echo -n "Detecting existing pools..."
7512         pool_list=($($LFS pool_list $FSNAME | grep "$FSNAME\." | cut -d. -f2))
7513
7514         if [ ${#pool_list[@]} -gt 0 ]; then
7515                 echo "${pool_list[@]}"
7516                 for thispool in "${pool_list[@]}"; do
7517                         if [[ -z "$initial_pool" ||
7518                               "$initial_pool" != "$thispool" ]]; then
7519                                 pool="$thispool"
7520                                 echo "Using existing pool '$pool'"
7521                                 break
7522                         fi
7523                 done
7524         else
7525                 echo "none detected."
7526         fi
7527         if [ -z "$pool" ]; then
7528                 pool=${POOL:-testpool}
7529                 [ "$initial_pool" = "$pool" ] && pool="testpool2"
7530                 echo -n "Creating pool '$pool'..."
7531                 create_pool=true
7532                 pool_add $pool &> /dev/null ||
7533                         error "pool_add failed"
7534                 echo "done."
7535
7536                 echo -n "Adding target to pool..."
7537                 pool_add_targets $pool 0 0 1 &> /dev/null ||
7538                         error "pool_add_targets failed"
7539                 echo "done."
7540         fi
7541
7542         echo -n "Setting pool using -p option..."
7543         $LFS_MIGRATE -y -q --no-rsync -p $pool $file1 &> /dev/null ||
7544                 error "migrate failed rc = $?"
7545         echo "done."
7546
7547         echo -n "Verifying test file is in pool after migrating..."
7548         [ "$($LFS getstripe -p $file1)" = $pool ] ||
7549                 error "file was not migrated to pool $pool"
7550         echo "done."
7551
7552         echo -n "Removing test file from pool '$pool'..."
7553         # "lfs migrate $file" won't remove the file from the pool
7554         # until some striping information is changed.
7555         $LFS migrate -c 1 $file1 &> /dev/null ||
7556                 error "cannot remove from pool"
7557         [ "$($LFS getstripe -p $file1)" ] &&
7558                 error "pool still set"
7559         echo "done."
7560
7561         echo -n "Setting pool using --pool option..."
7562         $LFS_MIGRATE -y -q --no-rsync --pool $pool $file1 &> /dev/null ||
7563                 error "migrate failed rc = $?"
7564         echo "done."
7565
7566         # Clean up
7567         rm -f $file1
7568         if $create_pool; then
7569                 destroy_test_pools 2> /dev/null ||
7570                         error "destroy test pools failed"
7571         fi
7572 }
7573 run_test 56wb "check lfs_migrate pool support"
7574
7575 test_56wc() {
7576         local file1="$DIR/$tdir/$tfile"
7577         local md5
7578         local parent_ssize
7579         local parent_scount
7580         local cur_ssize
7581         local cur_scount
7582         local orig_ssize
7583         local new_scount
7584         local cur_comp
7585
7586         echo -n "Creating test dir..."
7587         test_mkdir $DIR/$tdir &> /dev/null || error "cannot create dir"
7588         $LFS setstripe -S 1M -c 1 "$DIR/$tdir" &> /dev/null ||
7589                 error "cannot set stripe by '-S 1M -c 1'"
7590         echo "done"
7591
7592         echo -n "Setting initial stripe for test file..."
7593         $LFS setstripe -S 512K -c 1 "$file1" &> /dev/null ||
7594                 error "cannot set stripe"
7595         cur_ssize=$($LFS getstripe -S "$file1")
7596         (( cur_ssize == 524288 )) || error "setstripe -S $cur_ssize != 524288"
7597         echo "done."
7598
7599         dd if=/dev/urandom of=$file1 bs=1M count=12 || error "dd $file1 failed"
7600         stack_trap "rm -f $file1"
7601         md5="$(md5sum $file1)"
7602
7603         # File currently set to -S 512K -c 1
7604
7605         # Ensure -c and -S options are rejected when -R is set
7606         echo -n "Verifying incompatible options are detected..."
7607         $LFS_MIGRATE -R -c 1 "$file1" &&
7608                 error "incompatible -R and -c options not detected"
7609         $LFS_MIGRATE -R -S 1M "$file1" &&
7610                 error "incompatible -R and -S options not detected"
7611         $LFS_MIGRATE -R -p pool "$file1" &&
7612                 error "incompatible -R and -p options not detected"
7613         $LFS_MIGRATE -R -E eof -c 1 "$file1" &&
7614                 error "incompatible -R and -E options not detected"
7615         $LFS_MIGRATE -R -A "$file1" &&
7616                 error "incompatible -R and -A options not detected"
7617         $LFS_MIGRATE -A -c 1 "$file1" &&
7618                 error "incompatible -A and -c options not detected"
7619         $LFS_MIGRATE -A -S 1M "$file1" &&
7620                 error "incompatible -A and -S options not detected"
7621         $LFS_MIGRATE -A -p pool "$file1" &&
7622                 error "incompatible -A and -p options not detected"
7623         $LFS_MIGRATE -A -E eof -c 1 "$file1" &&
7624                 error "incompatible -A and -E options not detected"
7625         echo "done."
7626
7627         # Ensure unrecognized options are passed through to 'lfs migrate'
7628         echo -n "Verifying -S option is passed through to lfs migrate..."
7629         $LFS_MIGRATE -y -S 1M "$file1" || error "migration failed"
7630         cur_ssize=$($LFS getstripe -S "$file1")
7631         (( cur_ssize == 1048576 )) || error "migrate -S $cur_ssize != 1048576"
7632         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (1)"
7633         echo "done."
7634
7635         # File currently set to -S 1M -c 1
7636
7637         # Ensure long options are supported
7638         echo -n "Verifying long options supported..."
7639         $LFS_MIGRATE --non-block "$file1" ||
7640                 error "long option without argument not supported"
7641         $LFS_MIGRATE --stripe-size 512K "$file1" ||
7642                 error "long option with argument not supported"
7643         cur_ssize=$($LFS getstripe -S "$file1")
7644         (( cur_ssize == 524288 )) ||
7645                 error "migrate --stripe-size $cur_ssize != 524288"
7646         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (2)"
7647         echo "done."
7648
7649         # File currently set to -S 512K -c 1
7650
7651         if (( OSTCOUNT > 1 )); then
7652                 echo -n "Verifying explicit stripe count can be set..."
7653                 $LFS_MIGRATE -c 2 "$file1" || error "migrate failed"
7654                 cur_scount=$($LFS getstripe -c "$file1")
7655                 (( cur_scount == 2 )) || error "migrate -c $cur_scount != 2"
7656                 [[ "$(md5sum $file1)" == "$md5" ]] ||
7657                         error "file data has changed (3)"
7658                 echo "done."
7659         fi
7660
7661         # File currently set to -S 512K -c 1 or -S 512K -c 2
7662
7663         # Ensure parent striping is used if -R is set, and no stripe
7664         # count or size is specified
7665         echo -n "Setting stripe for parent directory..."
7666         $LFS setstripe -S 2M -c 1 "$DIR/$tdir" &> /dev/null ||
7667                 error "cannot set stripe '-S 2M -c 1'"
7668         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (4)"
7669         echo "done."
7670
7671         echo -n "Verifying restripe option uses parent stripe settings..."
7672         parent_ssize=$($LFS getstripe -S $DIR/$tdir 2>/dev/null)
7673         parent_scount=$($LFS getstripe -c $DIR/$tdir 2>/dev/null)
7674         $LFS_MIGRATE -R "$file1" || error "migrate failed"
7675         cur_ssize=$($LFS getstripe -S "$file1")
7676         (( cur_ssize == parent_ssize )) ||
7677                 error "migrate -R stripe_size $cur_ssize != $parent_ssize"
7678         cur_scount=$($LFS getstripe -c "$file1")
7679         (( cur_scount == parent_scount )) ||
7680                 error "migrate -R stripe_count $cur_scount != $parent_scount"
7681         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (5)"
7682         echo "done."
7683
7684         # File currently set to -S 1M -c 1
7685
7686         # Ensure striping is preserved if -R is not set, and no stripe
7687         # count or size is specified
7688         echo -n "Verifying striping size preserved when not specified..."
7689         orig_ssize=$($LFS getstripe -S "$file1" 2>/dev/null)
7690         $LFS setstripe -S 2M -c 1 "$DIR/$tdir" &> /dev/null ||
7691                 error "cannot set stripe on parent directory"
7692         $LFS_MIGRATE "$file1" || error "migrate failed"
7693         cur_ssize=$($LFS getstripe -S "$file1")
7694         (( cur_ssize == orig_ssize )) ||
7695                 error "migrate by default $cur_ssize != $orig_ssize"
7696         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (6)"
7697         echo "done."
7698
7699         # Ensure file name properly detected when final option has no argument
7700         echo -n "Verifying file name properly detected..."
7701         $LFS_MIGRATE "$file1" ||
7702                 error "file name interpreted as option argument"
7703         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (7)"
7704         echo "done."
7705
7706         # Ensure PFL arguments are passed through properly
7707         echo -n "Verifying PFL options passed through..."
7708         new_scount=$(((OSTCOUNT + 1) / 2))
7709         $LFS_MIGRATE -E 1M -c 1 -E 16M -c $new_scount -E eof -c -1 "$file1" ||
7710                 error "migrate PFL arguments failed"
7711         cur_comp=$($LFS getstripe --comp-count $file1)
7712         (( cur_comp == 3 )) || error "component count '$cur_comp' != 3"
7713         cur_scount=$($LFS getstripe --stripe-count $file1)
7714         (( cur_scount == new_scount)) ||
7715                 error "PFL stripe count $cur_scount != $new_scount"
7716         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (8)"
7717         echo "done."
7718 }
7719 run_test 56wc "check unrecognized options for lfs_migrate are passed through"
7720
7721 test_56wd() {
7722         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
7723
7724         local file1=$DIR/$tdir/$tfile
7725
7726         echo -n "Creating test dir..."
7727         test_mkdir $DIR/$tdir || error "cannot create dir"
7728         echo "done."
7729
7730         echo -n "Creating test file..."
7731         echo "$tfile" > $file1
7732         echo "done."
7733
7734         # Ensure 'lfs migrate' will fail by using a non-existent option,
7735         # and make sure rsync is not called to recover
7736         echo -n "Make sure --no-rsync option works..."
7737         $LFS_MIGRATE -y --no-rsync --invalid-opt $file1 2>&1 |
7738                 grep -q 'refusing to fall back to rsync' ||
7739                 error "rsync was called with --no-rsync set"
7740         echo "done."
7741
7742         # Ensure rsync is called without trying 'lfs migrate' first
7743         echo -n "Make sure --rsync option works..."
7744         $LFS_MIGRATE -y --rsync --invalid-opt $file1 2>&1 |
7745                 grep -q 'falling back to rsync' &&
7746                 error "lfs migrate was called with --rsync set"
7747         echo "done."
7748 }
7749 run_test 56wd "check lfs_migrate --rsync and --no-rsync work"
7750
7751 test_56we() {
7752         local td=$DIR/$tdir
7753         local tf=$td/$tfile
7754
7755         test_mkdir $td || error "cannot create $td"
7756         touch $tf || error "cannot touch $tf"
7757
7758         echo -n "Make sure --non-direct|-D works..."
7759         $LFS_MIGRATE -y --non-direct -v $tf 2>&1 |
7760                 grep -q "lfs migrate --non-direct" ||
7761                 error "--non-direct option cannot work correctly"
7762         $LFS_MIGRATE -y -D -v $tf 2>&1 |
7763                 grep -q "lfs migrate -D" ||
7764                 error "-D option cannot work correctly"
7765         echo "done."
7766 }
7767 run_test 56we "check lfs_migrate --non-direct|-D support"
7768
7769 test_56x() {
7770         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
7771         check_swap_layouts_support
7772
7773         local dir=$DIR/$tdir
7774         local ref1=/etc/passwd
7775         local file1=$dir/file1
7776
7777         test_mkdir $dir || error "creating dir $dir"
7778         $LFS setstripe -c 2 $file1
7779         cp $ref1 $file1
7780         $LFS migrate -c 1 $file1 || error "migrate failed rc = $?"
7781         stripe=$($LFS getstripe -c $file1)
7782         [[ $stripe == 1 ]] || error "stripe of $file1 is $stripe != 1"
7783         cmp $file1 $ref1 || error "content mismatch $file1 differs from $ref1"
7784
7785         # clean up
7786         rm -f $file1
7787 }
7788 run_test 56x "lfs migration support"
7789
7790 test_56xa() {
7791         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
7792         check_swap_layouts_support
7793
7794         local dir=$DIR/$tdir/$testnum
7795
7796         test_mkdir -p $dir
7797
7798         local ref1=/etc/passwd
7799         local file1=$dir/file1
7800
7801         $LFS setstripe -c 2 $file1
7802         cp $ref1 $file1
7803         $LFS migrate --block -c 1 $file1 || error "migrate failed rc = $?"
7804
7805         local stripe=$($LFS getstripe -c $file1)
7806
7807         [[ $stripe == 1 ]] || error "stripe of $file1 is $stripe != 1"
7808         cmp $file1 $ref1 || error "content mismatch $file1 differs from $ref1"
7809
7810         # clean up
7811         rm -f $file1
7812 }
7813 run_test 56xa "lfs migration --block support"
7814
7815 check_migrate_links() {
7816         [[ "$1" == "--rsync" ]] && local opts="--rsync -y" && shift
7817         local dir="$1"
7818         local file1="$dir/file1"
7819         local begin="$2"
7820         local count="$3"
7821         local runas="$4"
7822         local total_count=$(($begin + $count - 1))
7823         local symlink_count=10
7824         local uniq_count=10
7825
7826         if [ ! -f "$file1" ]; then
7827                 echo -n "creating initial file..."
7828                 $LFS setstripe -c 1 -S "512k" "$file1" ||
7829                         error "cannot setstripe initial file"
7830                 echo "done"
7831
7832                 echo -n "creating symlinks..."
7833                 for s in $(seq 1 $symlink_count); do
7834                         ln -s "$file1" "$dir/slink$s" ||
7835                                 error "cannot create symlinks"
7836                 done
7837                 echo "done"
7838
7839                 echo -n "creating nonlinked files..."
7840                 createmany -o "$dir/uniq" 1 10 &> /dev/null ||
7841                         error "cannot create nonlinked files"
7842                 echo "done"
7843         fi
7844
7845         # create hard links
7846         if [ ! -f "$dir/file$total_count" ]; then
7847                 echo -n "creating hard links $begin:$total_count..."
7848                 createmany -l"$file1" "$dir/file" "$begin" "$count" &>  \
7849                         /dev/null || error "cannot create hard links"
7850                 echo "done"
7851         fi
7852
7853         echo -n "checking number of hard links listed in xattrs..."
7854         local fid=$($LFS getstripe -F "$file1")
7855         local paths=($($LFS fid2path "$MOUNT" "$fid" 2> /dev/null))
7856
7857         echo "${#paths[*]}"
7858         if [ ${#paths[*]} -lt $total_count -a "$begin" -eq 2  ]; then
7859                         skip "hard link list has unexpected size, skipping test"
7860         fi
7861         if [ ${#paths[*]} -ge $total_count -a "$begin" -ne 2  ]; then
7862                         error "link names should exceed xattrs size"
7863         fi
7864
7865         echo -n "migrating files..."
7866         local migrate_out=$($runas $LFS_MIGRATE $opts -S '1m' $dir)
7867         local rc=$?
7868         [ $rc -eq 0 ] || error "migrate failed rc = $rc"
7869         echo "done"
7870
7871         # make sure all links have been properly migrated
7872         echo -n "verifying files..."
7873         fid=$($LFS getstripe -F "$file1") ||
7874                 error "cannot get fid for file $file1"
7875         for i in $(seq 2 $total_count); do
7876                 local fid2=$($LFS getstripe -F $dir/file$i)
7877
7878                 [ "$fid2" == "$fid" ] ||
7879                         error "migrated hard link has mismatched FID"
7880         done
7881
7882         # make sure hard links were properly detected, and migration was
7883         # performed only once for the entire link set; nonlinked files should
7884         # also be migrated
7885         local actual=$(grep -c 'done' <<< "$migrate_out")
7886         local expected=$(($uniq_count + 1))
7887
7888         [ "$actual" -eq  "$expected" ] ||
7889                 error "hard links individually migrated ($actual != $expected)"
7890
7891         # make sure the correct number of hard links are present
7892         local hardlinks=$(stat -c '%h' "$file1")
7893
7894         [ $hardlinks -eq $total_count ] ||
7895                 error "num hard links $hardlinks != $total_count"
7896         echo "done"
7897
7898         return 0
7899 }
7900
7901 test_56xb() {
7902         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
7903                 skip "Need MDS version at least 2.10.55"
7904
7905         local dir="$DIR/$tdir"
7906
7907         test_mkdir "$dir" || error "cannot create dir $dir"
7908
7909         echo "testing lfs migrate mode when all links fit within xattrs"
7910         check_migrate_links "$dir" 2 99
7911
7912         echo "testing rsync mode when all links fit within xattrs"
7913         check_migrate_links --rsync "$dir" 2 99
7914
7915         echo "testing lfs migrate mode when all links do not fit within xattrs"
7916         check_migrate_links "$dir" 101 100
7917
7918         echo "testing rsync mode when all links do not fit within xattrs"
7919         check_migrate_links --rsync "$dir" 101 100
7920
7921         chown -R $RUNAS_ID $dir
7922         echo "testing non-root lfs migrate mode when not all links are in xattr"
7923         check_migrate_links "$dir" 101 100 "$RUNAS"
7924
7925         # clean up
7926         rm -rf $dir
7927 }
7928 run_test 56xb "lfs migration hard link support"
7929
7930 test_56xc() {
7931         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
7932
7933         local dir="$DIR/$tdir"
7934
7935         test_mkdir "$dir" || error "cannot create dir $dir"
7936
7937         # Test 1: ensure file < 1 GB is always migrated with 1 stripe
7938         echo -n "Setting initial stripe for 20MB test file..."
7939         $LFS setstripe -c 2 -i 0 "$dir/20mb" ||
7940                 error "cannot setstripe 20MB file"
7941         echo "done"
7942         echo -n "Sizing 20MB test file..."
7943         $TRUNCATE "$dir/20mb" 20971520 || error "cannot create 20MB test file"
7944         echo "done"
7945         echo -n "Verifying small file autostripe count is 1..."
7946         $LFS_MIGRATE -y -A -C 1 "$dir/20mb" ||
7947                 error "cannot migrate 20MB file"
7948         local stripe_count=$($LFS getstripe -c "$dir/20mb") ||
7949                 error "cannot get stripe for $dir/20mb"
7950         [ $stripe_count -eq 1 ] ||
7951                 error "unexpected stripe count $stripe_count for 20MB file"
7952         rm -f "$dir/20mb"
7953         echo "done"
7954
7955         # Test 2: File is small enough to fit within the available space on
7956         # sqrt(size_in_gb) + 1 OSTs but is larger than 1GB.  The file must
7957         # have at least an additional 1KB for each desired stripe for test 3
7958         echo -n "Setting stripe for 1GB test file..."
7959         $LFS setstripe -c 1 -i 0 "$dir/1gb" || error "cannot setstripe 1GB file"
7960         echo "done"
7961         echo -n "Sizing 1GB test file..."
7962         # File size is 1GB + 3KB
7963         $TRUNCATE "$dir/1gb" 1073744896 || error "cannot create 1GB test file"
7964         echo "done"
7965
7966         # need at least 512MB per OST for 1GB file to fit in 2 stripes
7967         local avail=$($LCTL get_param -n llite.$FSNAME*.kbytesavail)
7968         if (( avail > 524288 * OSTCOUNT )); then
7969                 echo -n "Migrating 1GB file..."
7970                 $LFS_MIGRATE -y -A -C 1 "$dir/1gb" ||
7971                         error "cannot migrate 1GB file"
7972                 echo "done"
7973                 echo -n "Verifying autostripe count is sqrt(n) + 1..."
7974                 stripe_count=$($LFS getstripe -c "$dir/1gb") ||
7975                         error "cannot getstripe for 1GB file"
7976                 [ $stripe_count -eq 2 ] ||
7977                         error "unexpected stripe count $stripe_count != 2"
7978                 echo "done"
7979         fi
7980
7981         # Test 3: File is too large to fit within the available space on
7982         # sqrt(n) + 1 OSTs.  Simulate limited available space with -X
7983         if [ $OSTCOUNT -ge 3 ]; then
7984                 # The required available space is calculated as
7985                 # file size (1GB + 3KB) / OST count (3).
7986                 local kb_per_ost=349526
7987
7988                 echo -n "Migrating 1GB file with limit..."
7989                 $LFS_MIGRATE -y -A -C 1 -X $kb_per_ost "$dir/1gb" ||
7990                         error "cannot migrate 1GB file with limit"
7991                 echo "done"
7992
7993                 stripe_count=$($LFS getstripe -c "$dir/1gb")
7994                 echo -n "Verifying 1GB autostripe count with limited space..."
7995                 [ "$stripe_count" -a $stripe_count -ge 3 ] ||
7996                         error "unexpected stripe count $stripe_count (min 3)"
7997                 echo "done"
7998         fi
7999
8000         # clean up
8001         rm -rf $dir
8002 }
8003 run_test 56xc "lfs migration autostripe"
8004
8005 test_56xd() {
8006         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
8007
8008         local dir=$DIR/$tdir
8009         local f_mgrt=$dir/$tfile.mgrt
8010         local f_yaml=$dir/$tfile.yaml
8011         local f_copy=$dir/$tfile.copy
8012         local layout_yaml="-E 1M -S 512K -c 1 -E -1 -S 1M -c 2 -i 0"
8013         local layout_copy="-c 2 -S 2M -i 1"
8014         local yamlfile=$dir/yamlfile
8015         local layout_before;
8016         local layout_after;
8017
8018         test_mkdir "$dir" || error "cannot create dir $dir"
8019         stack_trap "rm -rf $dir"
8020         $LFS setstripe $layout_yaml $f_yaml ||
8021                 error "cannot setstripe $f_yaml with layout $layout_yaml"
8022         $LFS getstripe --yaml $f_yaml > $yamlfile
8023         $LFS setstripe $layout_copy $f_copy ||
8024                 error "cannot setstripe $f_copy with layout $layout_copy"
8025         touch $f_mgrt
8026         dd if=/dev/zero of=$f_mgrt bs=1M count=4
8027
8028         # 1. test option --yaml
8029         $LFS_MIGRATE -y --yaml $yamlfile $f_mgrt ||
8030                 error "cannot migrate $f_mgrt with --yaml $yamlfile"
8031         layout_before=$(get_layout_param $f_yaml)
8032         layout_after=$(get_layout_param $f_mgrt)
8033         [ "$layout_after" == "$layout_before" ] ||
8034                 error "lfs_migrate --yaml: $layout_after != $layout_before"
8035
8036         # 2. test option --copy
8037         $LFS_MIGRATE -y --copy $f_copy $f_mgrt ||
8038                 error "cannot migrate $f_mgrt with --copy $f_copy"
8039         layout_before=$(SKIP_INDEX=yes get_layout_param $f_copy)
8040         layout_after=$(SKIP_INDEX=yes get_layout_param $f_mgrt)
8041         [ "$layout_after" == "$layout_before" ] ||
8042                 error "lfs_migrate --copy: $layout_after != $layout_before"
8043 }
8044 run_test 56xd "check lfs_migrate --yaml and --copy support"
8045
8046 test_56xe() {
8047         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
8048
8049         local dir=$DIR/$tdir
8050         local f_comp=$dir/$tfile
8051         local layout="-E 1M -S 512K -c 1 -E -1 -S 1M -c 2 -i 0"
8052         local layout_before=""
8053         local layout_after=""
8054
8055         test_mkdir "$dir" || error "cannot create dir $dir"
8056         stack_trap "rm -rf $dir"
8057         $LFS setstripe $layout $f_comp ||
8058                 error "cannot setstripe $f_comp with layout $layout"
8059         layout_before=$(SKIP_INDEX=yes get_layout_param $f_comp)
8060         dd if=/dev/zero of=$f_comp bs=1M count=4
8061
8062         # 1. migrate a comp layout file by lfs_migrate
8063         $LFS_MIGRATE -y $f_comp || error "cannot migrate $f_comp by lfs_migrate"
8064         layout_after=$(SKIP_INDEX=yes get_layout_param $f_comp)
8065         [ "$layout_before" == "$layout_after" ] ||
8066                 error "lfs_migrate: $layout_before != $layout_after"
8067
8068         # 2. migrate a comp layout file by lfs migrate
8069         $LFS migrate $f_comp || error "cannot migrate $f_comp by lfs migrate"
8070         layout_after=$(SKIP_INDEX=yes get_layout_param $f_comp)
8071         [ "$layout_before" == "$layout_after" ] ||
8072                 error "lfs migrate: $layout_before != $layout_after"
8073 }
8074 run_test 56xe "migrate a composite layout file"
8075
8076 test_56xf() {
8077         [[ $OSTCOUNT -ge 2 ]] || skip_env "needs >= 2 OSTs"
8078
8079         [[ $MDS1_VERSION -ge $(version_code 2.13.53) ]] ||
8080                 skip "Need server version at least 2.13.53"
8081
8082         local dir=$DIR/$tdir
8083         local f_comp=$dir/$tfile
8084         local layout="-E 1M -c1 -E -1 -c2"
8085         local fid_before=""
8086         local fid_after=""
8087
8088         test_mkdir "$dir" || error "cannot create dir $dir"
8089         stack_trap "rm -rf $dir"
8090         $LFS setstripe $layout $f_comp ||
8091                 error "cannot setstripe $f_comp with layout $layout"
8092         fid_before=$($LFS getstripe --fid $f_comp)
8093         dd if=/dev/zero of=$f_comp bs=1M count=4
8094
8095         # 1. migrate a comp layout file to a comp layout
8096         $LFS migrate $f_comp || error "cannot migrate $f_comp by lfs migrate"
8097         fid_after=$($LFS getstripe --fid $f_comp)
8098         [ "$fid_before" == "$fid_after" ] ||
8099                 error "comp-to-comp migrate: $fid_before != $fid_after"
8100
8101         # 2. migrate a comp layout file to a plain layout
8102         $LFS migrate -c2 $f_comp ||
8103                 error "cannot migrate $f_comp by lfs migrate"
8104         fid_after=$($LFS getstripe --fid $f_comp)
8105         [ "$fid_before" == "$fid_after" ] ||
8106                 error "comp-to-plain migrate: $fid_before != $fid_after"
8107
8108         # 3. migrate a plain layout file to a comp layout
8109         $LFS migrate $layout $f_comp ||
8110                 error "cannot migrate $f_comp by lfs migrate"
8111         fid_after=$($LFS getstripe --fid $f_comp)
8112         [ "$fid_before" == "$fid_after" ] ||
8113                 error "plain-to-comp migrate: $fid_before != $fid_after"
8114 }
8115 run_test 56xf "FID is not lost during migration of a composite layout file"
8116
8117 check_file_ost_range() {
8118         local file="$1"
8119         shift
8120         local range="$*"
8121         local -a file_range
8122         local idx
8123
8124         file_range=($($LFS getstripe -y "$file" |
8125                 awk '/l_ost_idx:/ { print $NF }'))
8126
8127         if [[ "${#file_range[@]}" = 0 ]]; then
8128                 echo "No osts found for $file"
8129                 return 1
8130         fi
8131
8132         for idx in "${file_range[@]}"; do
8133                 [[ " $range " =~ " $idx " ]] ||
8134                         return 1
8135         done
8136
8137         return 0
8138 }
8139
8140 sub_test_56xg() {
8141         local stripe_opt="$1"
8142         local pool="$2"
8143         shift 2
8144         local pool_ostidx="$(seq $* | tr '\n' ' ')"
8145
8146         $LFS migrate $stripe_opt -p $pool $DIR/$tfile ||
8147                 error "Fail to migrate $tfile on $pool"
8148         [[ "$($LFS getstripe -p $DIR/$tfile)" = "$pool" ]] ||
8149                 error "$tfile is not in pool $pool"
8150         check_file_ost_range "$DIR/$tfile" $pool_ostidx ||
8151                 error "$tfile osts mismatch with pool $pool (osts $pool_ostidx)"
8152 }
8153
8154 test_56xg() {
8155         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
8156         [[ $OSTCOUNT -ge 2 ]] || skip "needs >= 2 OSTs"
8157         [[ $MDS1_VERSION -gt $(version_code 2.14.52) ]] ||
8158                 skip "Need MDS version newer than 2.14.52"
8159
8160         local -a pool_names=("${TESTNAME}_0" "${TESTNAME}_1" "${TESTNAME}_2")
8161         local -a pool_ranges=("0 0" "1 1" "0 1")
8162
8163         # init pools
8164         for i in "${!pool_names[@]}"; do
8165                 pool_add ${pool_names[$i]} ||
8166                         error "pool_add failed (pool: ${pool_names[$i]})"
8167                 pool_add_targets ${pool_names[$i]} ${pool_ranges[$i]} ||
8168                         error "pool_add_targets failed (pool: ${pool_names[$i]})"
8169         done
8170
8171         # init the file to migrate
8172         $LFS setstripe -c1 -i1 $DIR/$tfile ||
8173                 error "Unable to create $tfile on OST1"
8174         stack_trap "rm -f $DIR/$tfile"
8175         dd if=/dev/urandom of=$DIR/$tfile bs=1M count=4 status=none ||
8176                 error "Unable to write on $tfile"
8177
8178         echo "1. migrate $tfile on pool ${pool_names[0]}"
8179         sub_test_56xg "-c-1" "${pool_names[0]}" ${pool_ranges[0]}
8180
8181         echo "2. migrate $tfile on pool ${pool_names[2]}"
8182         sub_test_56xg "-c-1 -S2M" "${pool_names[2]}" ${pool_ranges[2]}
8183
8184         echo "3. migrate $tfile on pool ${pool_names[1]}"
8185         sub_test_56xg "-n -c-1" "${pool_names[1]}" ${pool_ranges[1]}
8186
8187         echo "4. migrate $tfile on pool ${pool_names[2]} with default stripe parameters"
8188         sub_test_56xg "" "${pool_names[2]}" ${pool_ranges[2]}
8189         echo
8190
8191         # Clean pools
8192         destroy_test_pools ||
8193                 error "pool_destroy failed"
8194 }
8195 run_test 56xg "lfs migrate pool support"
8196
8197 test_56xh() {
8198         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
8199
8200         local size_mb=25
8201         local file1=$DIR/$tfile
8202         local tmp1=$TMP/$tfile.tmp
8203
8204         $LFS setstripe -c 2 $file1
8205
8206         stack_trap "rm -f $file1 $tmp1"
8207         dd if=/dev/urandom of=$tmp1 bs=1M count=$size_mb ||
8208                         error "error creating $tmp1"
8209         ls -lsh $tmp1
8210         cp $tmp1 $file1
8211
8212         local start=$SECONDS
8213
8214         $LFS migrate --stats --stats-interval=1 -W 1M -c 1 $file1 ||
8215                 error "migrate failed rc = $?"
8216
8217         local elapsed=$((SECONDS - start))
8218
8219         # with 1MB/s, elapsed should equal size_mb
8220         (( elapsed >= size_mb * 95 / 100 )) ||
8221                 error "'lfs migrate -W' too fast ($elapsed < 0.95 * $size_mb)?"
8222
8223         (( elapsed <= size_mb * 120 / 100 )) ||
8224                 error_not_in_vm "'lfs migrate -W' slow ($elapsed > 1.2 * $size_mb)"
8225
8226         (( elapsed <= size_mb * 350 / 100 )) ||
8227                 error "'lfs migrate -W' too slow in VM ($elapsed > 3.5 * $size_mb)"
8228
8229         stripe=$($LFS getstripe -c $file1)
8230         (( $stripe == 1 )) || error "stripe of $file1 is $stripe != 1"
8231         cmp $file1 $tmp1 || error "content mismatch $file1 differs from $tmp1"
8232
8233         # Clean up file (since it is multiple MB)
8234         rm -f $file1 $tmp1
8235 }
8236 run_test 56xh "lfs migrate bandwidth limitation support"
8237
8238 test_56xi() {
8239         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
8240         verify_yaml_available || skip_env "YAML verification not installed"
8241
8242         local size_mb=5
8243         local file1=$DIR/$tfile.1
8244         local file2=$DIR/$tfile.2
8245         local file3=$DIR/$tfile.3
8246         local output_file=$DIR/$tfile.out
8247         local tmp1=$TMP/$tfile.tmp
8248
8249         $LFS setstripe -c 2 $file1
8250         $LFS setstripe -c 2 $file2
8251         $LFS setstripe -c 2 $file3
8252
8253         stack_trap "rm -f $file1 $file2 $file3 $tmp1 $output_file"
8254         dd if=/dev/urandom of=$tmp1 bs=1M count=$size_mb ||
8255                         error "error creating $tmp1"
8256         ls -lsh $tmp1
8257         cp $tmp1 $file1
8258         cp $tmp1 $file2
8259         cp $tmp1 $file3
8260
8261         $LFS migrate --stats --stats-interval=1 \
8262                 -c 1 $file1 $file2 $file3 1> $output_file ||
8263                 error "migrate failed rc = $?"
8264
8265         cat $output_file
8266         cat $output_file | verify_yaml || error "rename_stats is not valid YAML"
8267
8268         # Clean up file (since it is multiple MB)
8269         rm -f $file1 $file2 $file3 $tmp1 $output_file
8270 }
8271 run_test 56xi "lfs migrate stats support"
8272
8273 test_56xj() { # LU-16571 "lfs migrate -b" can cause thread starvation on OSS
8274         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
8275
8276         local file=$DIR/$tfile
8277         local linkdir=$DIR/$tdir
8278
8279         test_mkdir $linkdir || error "fail to create $linkdir"
8280         $LFS setstripe -i 0 -c 1 -S1M $file
8281         stack_trap "rm -rf $file $linkdir"
8282         dd if=/dev/urandom of=$file bs=1M count=10 ||
8283                 error "fail to create $file"
8284
8285         # Create file links
8286         local cpts
8287         local threads_max
8288         local nlinks
8289
8290         thread_max=$(do_facet ost1 "$LCTL get_param -n ost.OSS.ost.threads_max")
8291         cpts=$(do_facet ost1 "$LCTL get_param -n cpu_partition_table | wc -l")
8292         (( nlinks = thread_max * 3 / 2 / cpts))
8293
8294         echo "create $nlinks hard links of $file"
8295         createmany -l $file $linkdir/link $nlinks
8296
8297         # Parallel migrates (should not block)
8298         local i
8299         for ((i = 0; i < nlinks; i++)); do
8300                 echo $linkdir/link$i
8301         done | xargs -n1 -P $nlinks $LFS migrate -c2
8302
8303         local stripe_count
8304         stripe_count=$($LFS getstripe -c $file) ||
8305                 error "fail to get stripe count on $file"
8306
8307         ((stripe_count == 2)) ||
8308                 error "fail to migrate $file (stripe_count = $stripe_count)"
8309 }
8310 run_test 56xj "lfs migrate -b should not cause starvation of threads on OSS"
8311
8312 test_56xk() {
8313         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
8314
8315         local size_mb=5
8316         local file1=$DIR/$tfile
8317
8318         stack_trap "rm -f $file1"
8319         $LFS setstripe -c 1 $file1
8320         dd if=/dev/zero of=$file1 bs=1M count=$size_mb ||
8321                 error "error creating $file1"
8322         $LFS mirror extend -N $file1 || error "can't mirror"
8323         dd if=/dev/zero of=$file1 bs=4k count=1 conv=notrunc ||
8324                 error "can't dd"
8325         $LFS getstripe $file1 | grep stale ||
8326                 error "one component must be stale"
8327
8328         local start=$SECONDS
8329         $LFS mirror resync --stats --stats-interval=1 -W 1M $file1 ||
8330                 error "migrate failed rc = $?"
8331         local elapsed=$((SECONDS - start))
8332         $LFS getstripe $file1 | grep stale &&
8333                 error "all components must be sync"
8334
8335         # with 1MB/s, elapsed should equal size_mb
8336         (( elapsed >= size_mb * 95 / 100 )) ||
8337                 error "'lfs mirror resync -W' too fast ($elapsed < 0.95 * $size_mb)?"
8338
8339         (( elapsed <= size_mb * 120 / 100 )) ||
8340                 error_not_in_vm "'lfs mirror resync -W' slow ($elapsed > 1.2 * $size_mb)"
8341
8342         (( elapsed <= size_mb * 350 / 100 )) ||
8343                 error "'lfs mirror resync -W' too slow in VM ($elapsed > 3.5 * $size_mb)"
8344 }
8345 run_test 56xk "lfs mirror resync bandwidth limitation support"
8346
8347 test_56xl() {
8348         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
8349         verify_yaml_available || skip_env "YAML verification not installed"
8350
8351         local size_mb=5
8352         local file1=$DIR/$tfile.1
8353         local output_file=$DIR/$tfile.out
8354
8355         stack_trap "rm -f $file1"
8356         $LFS setstripe -c 1 $file1
8357         dd if=/dev/zero of=$file1 bs=1M count=$size_mb ||
8358                 error "error creating $file1"
8359         $LFS mirror extend -N $file1 || error "can't mirror"
8360         dd if=/dev/zero of=$file1 bs=4k count=1 conv=notrunc ||
8361                 error "can't dd"
8362         $LFS getstripe $file1 | grep stale ||
8363                 error "one component must be stale"
8364         $LFS getstripe $file1
8365
8366         $LFS mirror resync --stats --stats-interval=1 $file1 >$output_file ||
8367                 error "resync failed rc = $?"
8368         $LFS getstripe $file1 | grep stale &&
8369                 error "all components must be sync"
8370
8371         cat $output_file
8372         cat $output_file | verify_yaml || error "stats is not valid YAML"
8373 }
8374 run_test 56xl "lfs mirror resync stats support"
8375
8376 test_56y() {
8377         [ $MDS1_VERSION -lt $(version_code 2.4.53) ] &&
8378                 skip "No HSM $(lustre_build_version $SINGLEMDS) MDS < 2.4.53"
8379
8380         local res=""
8381         local dir=$DIR/$tdir
8382         local f1=$dir/file1
8383         local f2=$dir/file2
8384
8385         test_mkdir -p $dir || error "creating dir $dir"
8386         touch $f1 || error "creating std file $f1"
8387         $MULTIOP $f2 H2c || error "creating released file $f2"
8388
8389         # a directory can be raid0, so ask only for files
8390         res=$($LFS find $dir -L raid0 -type f | wc -l)
8391         [[ $res == 2 ]] || error "search raid0: found $res files != 2"
8392
8393         res=$($LFS find $dir \! -L raid0 -type f | wc -l)
8394         [[ $res == 0 ]] || error "search !raid0: found $res files != 0"
8395
8396         # only files can be released, so no need to force file search
8397         res=$($LFS find $dir -L released)
8398         [[ $res == $f2 ]] || error "search released: found $res != $f2"
8399
8400         res=$($LFS find $dir -type f \! -L released)
8401         [[ $res == $f1 ]] || error "search !released: found $res != $f1"
8402 }
8403 run_test 56y "lfs find -L raid0|released"
8404
8405 test_56z() { # LU-4824
8406         # This checks to make sure 'lfs find' continues after errors
8407         # There are two classes of errors that should be caught:
8408         # - If multiple paths are provided, all should be searched even if one
8409         #   errors out
8410         # - If errors are encountered during the search, it should not terminate
8411         #   early
8412         local dir=$DIR/$tdir
8413         local i
8414
8415         test_mkdir $dir
8416         for i in d{0..9}; do
8417                 test_mkdir $dir/$i
8418                 touch $dir/$i/$tfile
8419         done
8420         $LFS find $DIR/non_existent_dir $dir &&
8421                 error "$LFS find did not return an error"
8422         # Make a directory unsearchable. This should NOT be the last entry in
8423         # directory order.  Arbitrarily pick the 6th entry
8424         chmod 700 $($LFS find $dir -type d | sed '6!d')
8425
8426         $RUNAS $LFS find $DIR/non_existent $dir
8427         local count=$($RUNAS $LFS find $DIR/non_existent $dir | wc -l)
8428
8429         # The user should be able to see 10 directories and 9 files
8430         (( count == 19 )) ||
8431                 error "$LFS find found $count != 19 entries after error"
8432 }
8433 run_test 56z "lfs find should continue after an error"
8434
8435 test_56aa() { # LU-5937
8436         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
8437
8438         local dir=$DIR/$tdir
8439
8440         mkdir $dir
8441         $LFS setdirstripe -c$MDSCOUNT $dir/striped_dir
8442
8443         createmany -o $dir/striped_dir/${tfile}- 1024
8444         local dirs=$($LFS find --size +8k $dir/)
8445
8446         [ -n "$dirs" ] || error "lfs find --size wrong under striped dir"
8447 }
8448 run_test 56aa "lfs find --size under striped dir"
8449
8450 test_56ab() { # LU-10705
8451         test_mkdir $DIR/$tdir
8452         dd if=/dev/zero of=$DIR/$tdir/$tfile.1 bs=8k count=1 seek=2k
8453         dd if=/dev/zero of=$DIR/$tdir/$tfile.2 bs=4k count=1 seek=4k
8454         dd if=/dev/zero of=$DIR/$tdir/$tfile.3 bs=1M count=2 seek=16
8455         # Flush writes to ensure valid blocks.  Need to be more thorough for
8456         # ZFS, since blocks are not allocated/returned to client immediately.
8457         sync_all_data
8458         wait_zfs_commit ost1 2
8459         cancel_lru_locks osc
8460         ls -ls $DIR/$tdir
8461
8462         local files=$($LFS find --size +16M $DIR/$tdir | wc -l)
8463
8464         [[ $files == 3 ]] || error ">16M size files $files isn't 3 as expected"
8465
8466         files=$($LFS find --blocks +1M $DIR/$tdir | wc -l)
8467         [[ $files == 1 ]] || error ">1M blocks files $files isn't 1 as expected"
8468
8469         rm -f $DIR/$tdir/$tfile.[123]
8470 }
8471 run_test 56ab "lfs find --blocks"
8472
8473 # LU-11188
8474 test_56aca() {
8475         local dir="$DIR/$tdir"
8476         local perms=(001 002 003 004 005 006 007
8477                      010 020 030 040 050 060 070
8478                      100 200 300 400 500 600 700
8479                      111 222 333 444 555 666 777)
8480         local perm_minus=(8 8 4 8 4 4 2
8481                           8 8 4 8 4 4 2
8482                           8 8 4 8 4 4 2
8483                           4 4 2 4 2 2 1)
8484         local perm_slash=(8  8 12  8 12 12 14
8485                           8  8 12  8 12 12 14
8486                           8  8 12  8 12 12 14
8487                          16 16 24 16 24 24 28)
8488
8489         test_mkdir "$dir"
8490         for perm in ${perms[*]}; do
8491                 touch "$dir/$tfile.$perm"
8492                 chmod $perm "$dir/$tfile.$perm"
8493         done
8494
8495         for ((i = 0; i < ${#perms[*]}; i++)); do
8496                 local num=$($LFS find $dir -perm ${perms[i]} | wc -l)
8497                 (( $num == 1 )) ||
8498                         error "lfs find -perm ${perms[i]}:"\
8499                               "$num != 1"
8500
8501                 num=$($LFS find $dir -perm -${perms[i]} -type f| wc -l)
8502                 (( $num == ${perm_minus[i]} )) ||
8503                         error "lfs find -perm -${perms[i]}:"\
8504                               "$num != ${perm_minus[i]}"
8505
8506                 num=$($LFS find $dir -perm /${perms[i]} -type f| wc -l)
8507                 (( $num == ${perm_slash[i]} )) ||
8508                         error "lfs find -perm /${perms[i]}:"\
8509                               "$num != ${perm_slash[i]}"
8510         done
8511 }
8512 run_test 56aca "check lfs find -perm with octal representation"
8513
8514 test_56acb() {
8515         local dir=$DIR/$tdir
8516         # p is the permission of write and execute for user, group and other
8517         # without the umask. It is used to test +wx.
8518         local p=$(printf "%o" "$((0333 & ~$(umask)))")
8519         local perms=(1000 000 2000 4000 $p 644 111 110 100 004)
8520         local symbolic=(+t  a+t u+t g+t o+t
8521                         g+s u+s o+s +s o+sr
8522                         o=r,ug+o,u+w
8523                         u+ g+ o+ a+ ugo+
8524                         u- g- o- a- ugo-
8525                         u= g= o= a= ugo=
8526                         o=r,ug+o,u+w u=r,a+u,u+w
8527                         g=r,ugo=g,u+w u+x,+X +X
8528                         u+x,u+X u+X u+x,g+X o+r,+X
8529                         u+x,go+X +wx +rwx)
8530
8531         test_mkdir $dir
8532         for perm in ${perms[*]}; do
8533                 touch "$dir/$tfile.$perm"
8534                 chmod $perm "$dir/$tfile.$perm"
8535         done
8536
8537         for (( i = 0; i < ${#symbolic[*]}; i++ )); do
8538                 local num=$($LFS find $dir -perm ${symbolic[i]} | wc -l)
8539
8540                 (( $num == 1 )) ||
8541                         error "lfs find $dir -perm ${symbolic[i]}: $num != 1"
8542         done
8543 }
8544 run_test 56acb "check lfs find -perm with symbolic representation"
8545
8546 test_56acc() {
8547         local dir=$DIR/$tdir
8548         local tests="17777 787 789 abcd
8549                 ug=uu ug=a ug=gu uo=ou urw
8550                 u+xg+x a=r,u+x,"
8551
8552         test_mkdir $dir
8553         for err in $tests; do
8554                 if $LFS find $dir -perm $err 2>/dev/null; then
8555                         error "lfs find -perm $err: parsing should have failed"
8556                 fi
8557         done
8558 }
8559 run_test 56acc "check parsing error for lfs find -perm"
8560
8561 test_56ba() {
8562         [ $MDS1_VERSION -lt $(version_code 2.10.50) ] &&
8563                 skip "Need MDS version at least 2.10.50"
8564
8565         # Create composite files with one component
8566         local dir=$DIR/$tdir
8567
8568         setup_56 $dir/1Mfiles 5 1 "-S 1M --component-end 1M"
8569         # Create composite files with three components
8570         setup_56 $dir/2Mfiles 5 2 "-E 2M -S 1M -E 4M -E 6M"
8571         # LU-16904 Create plain layout files
8572         lfs setstripe -c 1 $dir/$tfile-{1..10}
8573
8574         local nfiles=$($LFS find --component-end 1M --type f $dir | wc -l)
8575
8576         [[ $nfiles == 10 ]] ||
8577                 error "lfs find -E 1M found $nfiles != 10 files"
8578
8579         nfiles=$($LFS find ! -E 1M --type f $dir | wc -l)
8580         [[ $nfiles == 25 ]] ||
8581                 error "lfs find ! -E 1M found $nfiles != 25 files"
8582
8583         # All files have a component that starts at 0
8584         nfiles=$($LFS find --component-start 0 --type f $dir | wc -l)
8585         [[ $nfiles == 35 ]] ||
8586                 error "lfs find --component-start 0 - $nfiles != 35 files"
8587
8588         nfiles=$($LFS find --component-start 2M --type f $dir | wc -l)
8589         [[ $nfiles == 15 ]] ||
8590                 error "lfs find --component-start 2M - $nfiles != 15 files"
8591
8592         # All files created here have a componenet that does not starts at 2M
8593         nfiles=$($LFS find ! --component-start 2M --type f $dir | wc -l)
8594         [[ $nfiles == 35 ]] ||
8595                 error "lfs find ! --component-start 2M - $nfiles != 35 files"
8596
8597         # Find files with a specified number of components
8598         local nfiles=$($LFS find --component-count 3 --type f $dir | wc -l)
8599         [[ $nfiles == 15 ]] ||
8600                 error "lfs find --component-count 3 - $nfiles != 15 files"
8601
8602         # Remember non-composite files have a component count of zero
8603         local nfiles=$($LFS find --component-count 0 --type f $dir | wc -l)
8604         [[ $nfiles == 10 ]] ||
8605                 error "lfs find --component-count 0 - $nfiles != 10 files"
8606
8607         nfiles=$($LFS find ! --component-count 3 --type f $dir | wc -l)
8608         [[ $nfiles == 20 ]] ||
8609                 error "lfs find ! --component-count 3 - $nfiles != 20 files"
8610
8611         # All files have a flag called "init"
8612         local nfiles=$($LFS find --component-flags init --type f $dir | wc -l)
8613         [[ $nfiles == 35 ]] ||
8614                 error "lfs find --component-flags init - $nfiles != 35 files"
8615
8616         # Multi-component files will have a component not initialized
8617         local nfiles=$($LFS find ! --component-flags init --type f $dir | wc -l)
8618         [[ $nfiles == 15 ]] ||
8619                 error "lfs find !--component-flags init - $nfiles != 15 files"
8620
8621         rm -rf $dir
8622
8623 }
8624 run_test 56ba "test lfs find --component-end, -start, -count, and -flags"
8625
8626 test_56ca() {
8627         [[ $MDS1_VERSION -ge $(version_code 2.10.57) ]] ||
8628                 skip "Need MDS version at least 2.10.57"
8629
8630         local td=$DIR/$tdir
8631         local tf=$td/$tfile
8632         local dir
8633         local nfiles
8634         local cmd
8635         local i
8636         local j
8637
8638         # create mirrored directories and mirrored files
8639         mkdir $td || error "mkdir $td failed"
8640         $LFS mirror create -N3 $td || error "create mirrored dir $td failed"
8641         createmany -o $tf- 10 || error "create $tf- failed"
8642
8643         for i in $(seq 2); do
8644                 dir=$td/dir$i
8645                 mkdir $dir || error "mkdir $dir failed"
8646                 $LFS mirror create -N$((3 + i)) $dir ||
8647                         error "create mirrored dir $dir failed"
8648                 createmany -o $dir/$tfile- 10 ||
8649                         error "create $dir/$tfile- failed"
8650         done
8651
8652         # change the states of some mirrored files
8653         echo foo > $tf-6
8654         for i in $(seq 2); do
8655                 dir=$td/dir$i
8656                 for j in $(seq 4 9); do
8657                         echo foo > $dir/$tfile-$j
8658                 done
8659         done
8660
8661         # find mirrored files with specific mirror count
8662         cmd="$LFS find --mirror-count 3 --type f $td"
8663         nfiles=$($cmd | wc -l)
8664         [[ $nfiles = 10 ]] || error "$cmd: $nfiles != 10 files"
8665
8666         cmd="$LFS find ! --mirror-count 3 --type f $td"
8667         nfiles=$($cmd | wc -l)
8668         [[ $nfiles = 20 ]] || error "$cmd: $nfiles != 20 files"
8669
8670         cmd="$LFS find --mirror-count +2 --type f $td"
8671         nfiles=$($cmd | wc -l)
8672         [[ $nfiles = 30 ]] || error "$cmd: $nfiles != 30 files"
8673
8674         cmd="$LFS find --mirror-count -6 --type f $td"
8675         nfiles=$($cmd | wc -l)
8676         [[ $nfiles = 30 ]] || error "$cmd: $nfiles != 30 files"
8677
8678         # find mirrored files with specific file state
8679         cmd="$LFS find --maxdepth 1 --mirror-state=^ro --type f $td"
8680         [[ $($cmd) = $tf-6 ]] || error "$cmd: didn't return $tf-6"
8681
8682         cmd="$LFS find --mirror-state=ro --type f $td"
8683         nfiles=$($cmd | wc -l)
8684         [[ $nfiles = 17 ]] || error "$cmd: $nfiles != 17 files"
8685
8686         cmd="$LFS find ! --mirror-state=ro --type f $td"
8687         nfiles=$($cmd | wc -l)
8688         [[ $nfiles = 13 ]] || error "$cmd: $nfiles != 13 files"
8689
8690         cmd="$LFS find --mirror-state=wp --type f $td"
8691         nfiles=$($cmd | wc -l)
8692         [[ $nfiles = 13 ]] || error "$cmd: $nfiles != 13 files"
8693
8694         cmd="$LFS find ! --mirror-state=sp --type f $td"
8695         nfiles=$($cmd | wc -l)
8696         [[ $nfiles = 30 ]] || error "$cmd: $nfiles != 30 files"
8697 }
8698 run_test 56ca "check lfs find --mirror-count|-N and --mirror-state"
8699
8700 test_56da() { # LU-14179
8701         local path=$DIR/$tdir
8702
8703         test_mkdir $path
8704         cd $path
8705
8706         local longdir=$(str_repeat 'a' 255)
8707
8708         for i in {1..15}; do
8709                 path=$path/$longdir
8710                 test_mkdir $longdir
8711                 cd $longdir
8712         done
8713
8714         local len=${#path}
8715         local lastdir=$(str_repeat 'a' $((4096 - 1 - $len - 1)))
8716
8717         test_mkdir $lastdir
8718         cd $lastdir
8719         # PATH_MAX-1
8720         (( ${#PWD} == 4095 )) || error "bad PWD length ${#PWD}, expect 4095"
8721
8722         # NAME_MAX
8723         touch $(str_repeat 'f' 255)
8724
8725         $LFS find $DIR/$tdir --type d |& grep "lfs find: error" &&
8726                 error "lfs find reported an error"
8727
8728         rm -rf $DIR/$tdir
8729 }
8730 run_test 56da "test lfs find with long paths"
8731
8732 test_56ea() { #LU-10378
8733         local path=$DIR/$tdir
8734         local pool=$TESTNAME
8735
8736         # Create ost pool
8737         pool_add $pool || error "pool_add $pool failed"
8738         pool_add_targets $pool 0 $((OSTCOUNT - 1)) 1 ||
8739                 error "adding targets to $pool failed"
8740
8741         # Set default pool on directory before creating file
8742         mkdir $path || error "mkdir $path failed"
8743         $LFS setstripe -p $pool $path ||
8744                 error "set OST pool on $pool failed"
8745         touch $path/$tfile || error "touch $path/$tfile failed"
8746
8747         # Compare basic file attributes from -printf and stat
8748         local attr_printf=$($LFS find $path/$tfile -printf "%A@ %T@ %C@ %U %G %n")
8749         local attr_stat=$(stat -c "%X %Y %Z %u %g %h" $path/$tfile)
8750
8751         [[ "${attr_printf}" == "${attr_stat}" ]] ||
8752                 error "Attrs from lfs find and stat don't match"
8753
8754         # Compare Lustre attributes from lfs find and lfs getstripe
8755         local lattr_printf=$($LFS find $path/$tfile -printf "%Lc %LS %Li %Lp")
8756         local str_cnt=$($LFS getstripe --stripe-count $path/$tfile)
8757         local str_size=$($LFS getstripe --stripe-size $path/$tfile)
8758         local str_idx=$($LFS getstripe --stripe-index $path/$tfile)
8759         local fpool=$($LFS getstripe --pool $path/$tfile)
8760         local lattr_getstr="${str_cnt} ${str_size} ${str_idx} ${fpool}"
8761
8762         [[ "${lattr_printf}" == "${lattr_getstr}" ]] ||
8763                 error "Attrs from lfs find and lfs getstripe don't match"
8764
8765         # Verify behavior for unknown escape/format sequences
8766         local esc_printf=$($LFS find $path/$tfile -printf '\\ %% \Q %Q')
8767
8768         [[ "${esc_printf}" == '\ % \Q %Q' ]] ||
8769                 error "Escape/format codes don't match"
8770 }
8771 run_test 56ea "test lfs find -printf option"
8772
8773 test_56eb() {
8774         local dir=$DIR/$tdir
8775         local subdir_1=$dir/subdir_1
8776
8777         test_mkdir -p $subdir_1
8778         ln -s subdir_1 $dir/link_1
8779
8780         $LFS getstripe $dir | grep "^$dir/link_1$" -A1 ||
8781                 error "symlink is not followed"
8782
8783         $LFS getstripe --no-follow $dir |
8784                 grep "^$dir/link_1 has no stripe info$" ||
8785                 error "symlink should not have stripe info"
8786
8787         touch $dir/testfile
8788         ln -s testfile $dir/file_link_2
8789
8790         $LFS getstripe $dir | grep "^$dir/file_link_2$" -A1 ||
8791                 error "symlink is not followed"
8792
8793         $LFS getstripe --no-follow $dir |
8794                 grep "^$dir/file_link_2 has no stripe info$" ||
8795                 error "symlink should not have stripe info"
8796 }
8797 run_test 56eb "check lfs getstripe on symlink"
8798
8799 test_56ec() {
8800         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
8801         local dir=$DIR/$tdir
8802         local srcfile=$dir/srcfile
8803         local srcyaml=$dir/srcyaml
8804         local destfile=$dir/destfile
8805
8806         test_mkdir -p $dir
8807
8808         $LFS setstripe -i 1 $srcfile
8809         $LFS getstripe --hex-idx --yaml $srcfile > $srcyaml
8810         # if the setstripe yaml parsing fails for any reason, the command can
8811         # randomly assign the correct OST index, leading to an erroneous
8812         # success. but the chance of false success is low enough that a
8813         # regression should still be quickly caught.
8814         $LFS setstripe --yaml=$srcyaml $destfile
8815
8816         local srcindex=$($LFS getstripe -i $srcfile)
8817         local destindex=$($LFS getstripe -i $destfile)
8818
8819         if [[ ! $srcindex -eq $destindex ]]; then
8820                 error "setstripe did not set OST index correctly"
8821         fi
8822 }
8823 run_test 56ec "check lfs getstripe,setstripe --hex --yaml"
8824
8825 test_56eda() {
8826         local dir=$DIR/$tdir
8827         local subdir=$dir/subdir
8828         local file1=$dir/$tfile
8829         local file2=$dir/$tfile\2
8830         local link=$dir/$tfile-link
8831         local nfiles
8832
8833         test_mkdir -p $dir
8834         $LFS setdirstripe -c1 $subdir
8835         touch $file1
8836         touch $file2
8837         ln $file2 $link
8838
8839         nfiles=$($LFS find --links 1 $dir | wc -l)
8840         (( $nfiles == 1 )) ||
8841                 error "lfs find --links expected 1 file, got $nfiles"
8842
8843         nfiles=$($LFS find --type f --links 2 $dir | wc -l)
8844         (( $nfiles == 2 )) ||
8845                 error "lfs find --links expected 2 files, got $nfiles"
8846
8847         nfiles=$($LFS find --type d --links 2 $dir | wc -l)
8848         (( $nfiles == 1 )) ||
8849                 error "lfs find --links expected 1 directory, got $nfiles"
8850 }
8851 run_test 56eda "check lfs find --links"
8852
8853 test_56edb() {
8854         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
8855
8856         local dir=$DIR/$tdir
8857         local stripedir=$dir/stripedir
8858         local nfiles
8859
8860         test_mkdir -p $dir
8861
8862         $LFS setdirstripe -c2 $stripedir
8863
8864         $LFS getdirstripe $stripedir
8865
8866         nfiles=$($LFS find --type d --links 2 $stripedir | wc -l)
8867         (( $nfiles == 1 )) ||
8868                 error "lfs find --links expected 1 directory, got $nfiles"
8869 }
8870 run_test 56edb "check lfs find --links for directory striped on multiple MDTs"
8871
8872 test_56ef() {
8873         local dir=$DIR/$tdir
8874         local dir1=$dir/d1
8875         local dir2=$dir/d2
8876         local nfiles
8877
8878         test_mkdir -p $dir
8879
8880         mkdir $dir1
8881         mkdir $dir2
8882
8883         touch $dir1/f
8884         touch $dir2/f
8885
8886         nfiles=$($LFS find $dir1 $dir2 ! -type d | wc -l)
8887         (( $nfiles == 2 )) ||
8888                 error "(1) lfs find expected 2 files, got $nfiles"
8889
8890         nfiles=$($LFS find $dir1 $dir2 -type f | wc -l)
8891         (( $nfiles == 2 )) ||
8892                 error "(2) lfs find expected 2 files, got $nfiles"
8893
8894         nfiles=$($LFS find -type f $dir1 $dir2 | wc -l)
8895         (( $nfiles == 2 )) ||
8896                 error "(3) lfs find expected 2 files, got $nfiles"
8897 }
8898 run_test 56ef "lfs find with multiple paths"
8899
8900 test_57a() {
8901         [ $PARALLEL == "yes" ] && skip "skip parallel run"
8902         # note test will not do anything if MDS is not local
8903         if [ "$mds1_FSTYPE" != ldiskfs ]; then
8904                 skip_env "ldiskfs only test"
8905         fi
8906         remote_mds_nodsh && skip "remote MDS with nodsh"
8907
8908         local MNTDEV="osd*.*MDT*.mntdev"
8909         DEV=$(do_facet $SINGLEMDS lctl get_param -n $MNTDEV)
8910         [ -z "$DEV" ] && error "can't access $MNTDEV"
8911         for DEV in $(do_facet $SINGLEMDS lctl get_param -n $MNTDEV); do
8912                 do_facet $SINGLEMDS $DUMPE2FS -h $DEV > $TMP/t57a.dump ||
8913                         error "can't access $DEV"
8914                 DEVISIZE=$(awk '/Inode size:/ { print $3 }' $TMP/t57a.dump)
8915                 [[ $DEVISIZE -gt 128 ]] || error "inode size $DEVISIZE"
8916                 rm $TMP/t57a.dump
8917         done
8918 }
8919 run_test 57a "verify MDS filesystem created with large inodes =="
8920
8921 test_57b() {
8922         [ $PARALLEL == "yes" ] && skip "skip parallel run"
8923         if [ "$mds1_FSTYPE" != ldiskfs ]; then
8924                 skip_env "ldiskfs only test"
8925         fi
8926         remote_mds_nodsh && skip "remote MDS with nodsh"
8927
8928         local dir=$DIR/$tdir
8929         local filecount=100
8930         local file1=$dir/f1
8931         local fileN=$dir/f$filecount
8932
8933         rm -rf $dir || error "removing $dir"
8934         test_mkdir -c1 $dir
8935         local mdtidx=$($LFS getstripe -m $dir)
8936         local mdtname=MDT$(printf %04x $mdtidx)
8937         local facet=mds$((mdtidx + 1))
8938
8939         echo "mcreating $filecount files"
8940         createmany -m $dir/f 1 $filecount || error "creating files in $dir"
8941
8942         # verify that files do not have EAs yet
8943         $LFS getstripe $file1 2>&1 | grep -q "no stripe" ||
8944                 error "$file1 has an EA"
8945         $LFS getstripe $fileN 2>&1 | grep -q "no stripe" ||
8946                 error "$fileN has an EA"
8947
8948         sync
8949         sleep 1
8950         df $dir  #make sure we get new statfs data
8951         local mdsfree=$(do_facet $facet \
8952                         lctl get_param -n osd*.*$mdtname.kbytesfree)
8953         local mdcfree=$(lctl get_param -n mdc.*$mdtname-mdc-*.kbytesfree)
8954         local file
8955
8956         echo "opening files to create objects/EAs"
8957         for file in $(seq -f $dir/f%g 1 $filecount); do
8958                 $OPENFILE -f O_RDWR $file > /dev/null 2>&1 ||
8959                         error "opening $file"
8960         done
8961
8962         # verify that files have EAs now
8963         $LFS getstripe -y $file1 | grep -q "l_ost_idx" ||
8964                 error "$file1 missing EA"
8965         $LFS getstripe -y $fileN | grep -q "l_ost_idx" ||
8966                 error "$fileN missing EA"
8967
8968         sleep 1  #make sure we get new statfs data
8969         df $dir
8970         local mdsfree2=$(do_facet $facet \
8971                          lctl get_param -n osd*.*$mdtname.kbytesfree)
8972         local mdcfree2=$(lctl get_param -n mdc.*$mdtname-mdc-*.kbytesfree)
8973
8974         if [[ $mdcfree2 -lt $((mdcfree - 16)) ]]; then
8975                 if [ "$mdsfree" != "$mdsfree2" ]; then
8976                         error "MDC before $mdcfree != after $mdcfree2"
8977                 else
8978                         echo "MDC before $mdcfree != after $mdcfree2"
8979                         echo "unable to confirm if MDS has large inodes"
8980                 fi
8981         fi
8982         rm -rf $dir
8983 }
8984 run_test 57b "default LOV EAs are stored inside large inodes ==="
8985
8986 test_58() {
8987         [ $PARALLEL == "yes" ] && skip "skip parallel run"
8988         [ -z "$(which wiretest 2>/dev/null)" ] &&
8989                         skip_env "could not find wiretest"
8990
8991         wiretest
8992 }
8993 run_test 58 "verify cross-platform wire constants =============="
8994
8995 test_59() {
8996         [ $PARALLEL == "yes" ] && skip "skip parallel run"
8997
8998         echo "touch 130 files"
8999         createmany -o $DIR/f59- 130
9000         echo "rm 130 files"
9001         unlinkmany $DIR/f59- 130
9002         sync
9003         # wait for commitment of removal
9004         wait_delete_completed
9005 }
9006 run_test 59 "verify cancellation of llog records async ========="
9007
9008 TEST60_HEAD="test_60 run $RANDOM"
9009 test_60a() {
9010         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9011         remote_mgs_nodsh && skip "remote MGS with nodsh"
9012         do_facet mgs "! which run-llog.sh &> /dev/null" &&
9013                 do_facet mgs "! ls run-llog.sh &> /dev/null" &&
9014                         skip_env "missing subtest run-llog.sh"
9015
9016         log "$TEST60_HEAD - from kernel mode"
9017         do_facet mgs "$LCTL dk > /dev/null"
9018         do_facet mgs "bash run-llog.sh" || error "run-llog.sh failed"
9019         do_facet mgs $LCTL dk > $TMP/$tfile
9020
9021         # LU-6388: test llog_reader
9022         local llog_reader=$(do_facet mgs "which llog_reader 2> /dev/null")
9023         llog_reader=${llog_reader:-$LUSTRE/utils/llog_reader}
9024         [ -z $(do_facet mgs ls -d $llog_reader 2> /dev/null) ] &&
9025                         skip_env "missing llog_reader"
9026         local fstype=$(facet_fstype mgs)
9027         [ $fstype != ldiskfs -a $fstype != zfs ] &&
9028                 skip_env "Only for ldiskfs or zfs type mgs"
9029
9030         local mntpt=$(facet_mntpt mgs)
9031         local mgsdev=$(mgsdevname 1)
9032         local fid_list
9033         local fid
9034         local rec_list
9035         local rec
9036         local rec_type
9037         local obj_file
9038         local path
9039         local seq
9040         local oid
9041         local pass=true
9042
9043         #get fid and record list
9044         fid_list=($(awk '/9_sub.*record/ { print $NF }' $TMP/$tfile |
9045                 tail -n 4))
9046         rec_list=($(awk '/9_sub.*record/ { print $((NF-3)) }' $TMP/$tfile |
9047                 tail -n 4))
9048         #remount mgs as ldiskfs or zfs type
9049         stop mgs || error "stop mgs failed"
9050         mount_fstype mgs || error "remount mgs failed"
9051         for ((i = 0; i < ${#fid_list[@]}; i++)); do
9052                 fid=${fid_list[i]}
9053                 rec=${rec_list[i]}
9054                 seq=$(echo $fid | awk -F ':' '{ print $1 }' | sed -e "s/^0x//g")
9055                 oid=$(echo $fid | awk -F ':' '{ print $2 }' | sed -e "s/^0x//g")
9056                 oid=$((16#$oid))
9057
9058                 case $fstype in
9059                         ldiskfs )
9060                                 obj_file=$mntpt/O/$seq/d$((oid%32))/$oid ;;
9061                         zfs )
9062                                 obj_file=$mntpt/oi.$(($((16#$seq))&127))/$fid ;;
9063                 esac
9064                 echo "obj_file is $obj_file"
9065                 do_facet mgs $llog_reader $obj_file
9066
9067                 rec_type=$(do_facet mgs $llog_reader $obj_file | grep "type=" |
9068                         awk '{ print $3 }' | sed -e "s/^type=//g")
9069                 if [ $rec_type != $rec ]; then
9070                         echo "FAILED test_60a wrong record type $rec_type," \
9071                               "should be $rec"
9072                         pass=false
9073                         break
9074                 fi
9075
9076                 #check obj path if record type is LLOG_LOGID_MAGIC
9077                 if [ "$rec" == "1064553b" ]; then
9078                         path=$(do_facet mgs $llog_reader $obj_file |
9079                                 grep "path=" | awk '{ print $NF }' |
9080                                 sed -e "s/^path=//g")
9081                         if [ $obj_file != $mntpt/$path ]; then
9082                                 echo "FAILED test_60a wrong obj path" \
9083                                       "$montpt/$path, should be $obj_file"
9084                                 pass=false
9085                                 break
9086                         fi
9087                 fi
9088         done
9089         rm -f $TMP/$tfile
9090         #restart mgs before "error", otherwise it will block the next test
9091         stop mgs || error "stop mgs failed"
9092         start mgs $(mgsdevname) $MGS_MOUNT_OPTS || error "start mgs failed"
9093         $pass || error "test failed, see FAILED test_60a messages for specifics"
9094 }
9095 run_test 60a "llog_test run from kernel module and test llog_reader"
9096
9097 test_60b() { # bug 6411
9098         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9099
9100         dmesg > $DIR/$tfile
9101         LLOG_COUNT=$(do_facet mgs dmesg |
9102                      awk "/$TEST60_HEAD/ { marker = 1; from_marker = 0; }
9103                           /llog_[a-z]*.c:[0-9]/ {
9104                                 if (marker)
9105                                         from_marker++
9106                                 from_begin++
9107                           }
9108                           END {
9109                                 if (marker)
9110                                         print from_marker
9111                                 else
9112                                         print from_begin
9113                           }")
9114
9115         [[ $LLOG_COUNT -gt 120 ]] &&
9116                 error "CDEBUG_LIMIT not limiting messages ($LLOG_COUNT)" || true
9117 }
9118 run_test 60b "limit repeated messages from CERROR/CWARN"
9119
9120 test_60c() {
9121         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9122
9123         echo "create 5000 files"
9124         createmany -o $DIR/f60c- 5000
9125 #define OBD_FAIL_MDS_LLOG_CREATE_FAILED  0x137
9126         lctl set_param fail_loc=0x80000137
9127         unlinkmany $DIR/f60c- 5000
9128         lctl set_param fail_loc=0
9129 }
9130 run_test 60c "unlink file when mds full"
9131
9132 test_60d() {
9133         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9134
9135         SAVEPRINTK=$(lctl get_param -n printk)
9136         # verify "lctl mark" is even working"
9137         MESSAGE="test message ID $RANDOM $$"
9138         $LCTL mark "$MESSAGE" || error "$LCTL mark failed"
9139         dmesg | grep -q "$MESSAGE" || error "didn't find debug marker in log"
9140
9141         lctl set_param printk=0 || error "set lnet.printk failed"
9142         lctl get_param -n printk | grep emerg || error "lnet.printk dropped emerg"
9143         MESSAGE="new test message ID $RANDOM $$"
9144         # Assume here that libcfs_debug_mark_buffer() uses D_WARNING
9145         $LCTL mark "$MESSAGE" || error "$LCTL mark failed"
9146         dmesg | grep -q "$MESSAGE" && error "D_WARNING wasn't masked" || true
9147
9148         lctl set_param -n printk="$SAVEPRINTK"
9149 }
9150 run_test 60d "test printk console message masking"
9151
9152 test_60e() {
9153         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9154         remote_mds_nodsh && skip "remote MDS with nodsh"
9155
9156         touch $DIR/$tfile
9157 #define OBD_FAIL_MDS_LLOG_CREATE_FAILED2  0x15b
9158         do_facet mds1 lctl set_param fail_loc=0x15b
9159         rm $DIR/$tfile
9160 }
9161 run_test 60e "no space while new llog is being created"
9162
9163 test_60f() {
9164         local old_path=$($LCTL get_param -n debug_path)
9165
9166         stack_trap "$LCTL set_param debug_path=$old_path"
9167         stack_trap "rm -f $TMP/$tfile*"
9168         rm -f $TMP/$tfile* 2> /dev/null
9169         #define OBD_FAIL_PTLRPC_DUMP_LOG         0x50e
9170         $LCTL set_param debug_path=$TMP/$tfile fail_loc=0x8000050e
9171         test_mkdir $DIR/$tdir
9172         # retry in case the open is cached and not released
9173         for (( i = 0; i < 100 && $(ls $TMP/$tfile* | wc -l) == 0; i++ )); do
9174                 echo $i > $DIR/$tdir/$tfile.$i && cat $DIR/$tdir/$tfile.$i
9175                 sleep 0.1
9176         done
9177         ls $TMP/$tfile*
9178         (( $(ls $TMP/$tfile* | wc -l) > 0 )) || error "$TMP/$tfile not dumped"
9179 }
9180 run_test 60f "change debug_path works"
9181
9182 test_60g() {
9183         local pid
9184         local i
9185
9186         test_mkdir -c $MDSCOUNT $DIR/$tdir
9187
9188         (
9189                 local index=0
9190                 while true; do
9191                         $LFS setdirstripe -i $(($index % $MDSCOUNT)) \
9192                                 -c $MDSCOUNT $DIR/$tdir/subdir$index \
9193                                 2>/dev/null
9194                         mkdir $DIR/$tdir/subdir$index 2>/dev/null
9195                         rmdir $DIR/$tdir/subdir$index 2>/dev/null
9196                         index=$((index + 1))
9197                 done
9198         ) &
9199
9200         pid=$!
9201
9202         for i in {0..100}; do
9203                 # define OBD_FAIL_OSD_TXN_START    0x19a
9204                 local index=$((i % MDSCOUNT + 1))
9205
9206                 do_facet mds$index $LCTL set_param fail_loc=0x8000019a \
9207                         > /dev/null
9208                 sleep 0.01
9209         done
9210
9211         kill -9 $pid
9212
9213         for i in $(seq $MDSCOUNT); do
9214                 do_facet mds$i $LCTL set_param fail_loc=0 > /dev/null
9215         done
9216
9217         mkdir $DIR/$tdir/new || error "mkdir failed"
9218         rmdir $DIR/$tdir/new || error "rmdir failed"
9219
9220         do_facet mds1 $LCTL lfsck_start -M $(facet_svc mds1) -A -C \
9221                 -t namespace
9222         for i in $(seq $MDSCOUNT); do
9223                 wait_update_facet mds$i "$LCTL get_param -n \
9224                         mdd.$(facet_svc mds$i).lfsck_namespace |
9225                         awk '/^status/ { print \\\$2 }'" "completed"
9226         done
9227
9228         ls -R $DIR/$tdir
9229         rm -rf $DIR/$tdir || error "rmdir failed"
9230 }
9231 run_test 60g "transaction abort won't cause MDT hung"
9232
9233 test_60h() {
9234         [ $MDS1_VERSION -le $(version_code 2.12.52) ] &&
9235                 skip "Need MDS version at least 2.12.52"
9236         [ $MDSCOUNT -lt 2 ] && skip "Need at least 2 MDTs"
9237
9238         local f
9239
9240         #define OBD_FAIL_MDS_STRIPE_CREATE       0x188
9241         #define OBD_FAIL_MDS_STRIPE_FID          0x189
9242         for fail_loc in 0x80000188 0x80000189; do
9243                 do_facet mds1 "$LCTL set_param fail_loc=$fail_loc"
9244                 $LFS mkdir -c $MDSCOUNT -i 0 $DIR/$tdir-$fail_loc ||
9245                         error "mkdir $dir-$fail_loc failed"
9246                 for i in {0..10}; do
9247                         # create may fail on missing stripe
9248                         echo $i > $DIR/$tdir-$fail_loc/$i
9249                 done
9250                 $LFS getdirstripe $DIR/$tdir-$fail_loc ||
9251                         error "getdirstripe $tdir-$fail_loc failed"
9252                 $LFS migrate -m 1 $DIR/$tdir-$fail_loc ||
9253                         error "migrate $tdir-$fail_loc failed"
9254                 $LFS getdirstripe $DIR/$tdir-$fail_loc ||
9255                         error "getdirstripe $tdir-$fail_loc failed"
9256                 pushd $DIR/$tdir-$fail_loc
9257                 for f in *; do
9258                         echo $f | cmp $f - || error "$f data mismatch"
9259                 done
9260                 popd
9261                 rm -rf $DIR/$tdir-$fail_loc
9262         done
9263 }
9264 run_test 60h "striped directory with missing stripes can be accessed"
9265
9266 function t60i_load() {
9267         mkdir $DIR/$tdir
9268         #define OBD_FAIL_LLOG_PAUSE_AFTER_PAD               0x131c
9269         $LCTL set_param fail_loc=0x131c fail_val=1
9270         for ((i=0; i<5000; i++)); do
9271                 touch $DIR/$tdir/f$i
9272         done
9273 }
9274
9275 test_60i() {
9276         changelog_register || error "changelog_register failed"
9277         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
9278         changelog_users $SINGLEMDS | grep -q $cl_user ||
9279                 error "User $cl_user not found in changelog_users"
9280         changelog_chmask "ALL"
9281         t60i_load &
9282         local PID=$!
9283         for((i=0; i<100; i++)); do
9284                 changelog_dump >/dev/null ||
9285                         error "can't read changelog"
9286         done
9287         kill $PID
9288         wait $PID
9289         changelog_deregister || error "changelog_deregister failed"
9290         $LCTL set_param fail_loc=0
9291 }
9292 run_test 60i "llog: new record vs reader race"
9293
9294 test_60j() {
9295         (( $MDS1_VERSION >= $(version_code 2.15.50) )) ||
9296                 skip "need MDS version at least 2.15.50"
9297         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
9298         remote_mds_nodsh && skip "remote MDS with nodsh"
9299         [[ "$mds1_FSTYPE" == "ldiskfs" ]] || skip "ldiskfs only test"
9300
9301         changelog_users $SINGLEMDS | grep "^cl" &&
9302                 skip "active changelog user"
9303
9304         local llog_reader=$(do_facet $SINGLEMDS "which llog_reader 2> /dev/null")
9305
9306         [[ -z $(do_facet $SINGLEMDS ls -d $llog_reader 2> /dev/null) ]] &&
9307                 skip_env "missing llog_reader"
9308
9309         mkdir_on_mdt0 $DIR/$tdir
9310
9311         local f=$DIR/$tdir/$tfile
9312         local mdt_dev
9313         local tmpfile
9314         local plain
9315
9316         changelog_register || error "cannot register changelog user"
9317
9318         # set changelog_mask to ALL
9319         changelog_chmask "ALL"
9320         changelog_clear
9321
9322         createmany -o ${f}- 100 || error "createmany failed as $RUNAS_ID"
9323         unlinkmany ${f}- 100 || error "unlinkmany failed"
9324
9325         tmpfile="$(mktemp --tmpdir -u $tfile.XXXXXX)"
9326         mdt_dev=$(facet_device $SINGLEMDS)
9327
9328         do_facet $SINGLEMDS sync
9329         plain=$(do_facet $SINGLEMDS "$DEBUGFS -c -R 'dump changelog_catalog \
9330                 $tmpfile' $mdt_dev; $llog_reader $tmpfile" |
9331                 awk '{match($0,"path=([^ ]+)",a)}END{print a[1]}')
9332
9333         stack_trap "do_facet $SINGLEMDS rm -f $tmpfile"
9334
9335         # if $tmpfile is not on EXT3 filesystem for some reason
9336         [[ ${plain:0:1} == 'O' ]] ||
9337                 skip "path $plain is not in 'O/1/d<n>/<n>' format"
9338
9339         size=$(do_facet $SINGLEMDS "$DEBUGFS -c -R 'dump $plain $tmpfile' \
9340                 $mdt_dev; stat -c %s $tmpfile")
9341         echo "Truncate llog from $size to $((size - size % 8192))"
9342         size=$((size - size % 8192))
9343         do_facet $SINGLEMDS $TRUNCATE $tmpfile $size
9344         errs=$(do_facet $SINGLEMDS "$llog_reader $tmpfile" |
9345                 grep -c 'in bitmap only')
9346         (( $errs > 0 )) || error "llog_reader didn't find lost records"
9347
9348         size=$((size - 9000))
9349         echo "Corrupt llog in the middle at $size"
9350         do_facet $SINGLEMDS dd if=/dev/urandom of=$tmpfile bs=1 seek=$size \
9351                 count=333 conv=notrunc
9352         errs=$(do_facet $SINGLEMDS "$llog_reader $tmpfile" |
9353                 grep -c 'next chunk')
9354         (( $errs > 0 )) || error "llog_reader didn't skip bad chunk"
9355 }
9356 run_test 60j "llog_reader reports corruptions"
9357
9358 test_61a() {
9359         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9360
9361         f="$DIR/f61"
9362         dd if=/dev/zero of=$f bs=$PAGE_SIZE count=1 || error "dd $f failed"
9363         cancel_lru_locks osc
9364         $MULTIOP $f OSMWUc || error "$MULTIOP $f failed"
9365         sync
9366 }
9367 run_test 61a "mmap() writes don't make sync hang ================"
9368
9369 test_61b() {
9370         mmap_mknod_test $DIR/$tfile || error "mmap_mknod_test failed"
9371 }
9372 run_test 61b "mmap() of unstriped file is successful"
9373
9374 # bug 2319 - oig_wait() interrupted causes crash because of invalid waitq.
9375 # Though this test is irrelevant anymore, it helped to reveal some
9376 # other grant bugs (LU-4482), let's keep it.
9377 test_63a() {   # was test_63
9378         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9379
9380         MAX_DIRTY_MB=$(lctl get_param -n osc.*.max_dirty_mb | head -n 1)
9381
9382         for i in `seq 10` ; do
9383                 dd if=/dev/zero of=$DIR/f63 bs=8k &
9384                 sleep 5
9385                 kill $!
9386                 sleep 1
9387         done
9388
9389         rm -f $DIR/f63 || true
9390 }
9391 run_test 63a "Verify oig_wait interruption does not crash ======="
9392
9393 # bug 2248 - async write errors didn't return to application on sync
9394 # bug 3677 - async write errors left page locked
9395 test_63b() {
9396         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9397
9398         debugsave
9399         lctl set_param debug=-1
9400
9401         # ensure we have a grant to do async writes
9402         dd if=/dev/zero of=$DIR/$tfile bs=4k count=1
9403         rm $DIR/$tfile
9404
9405         sync    # sync lest earlier test intercept the fail_loc
9406
9407         #define OBD_FAIL_OSC_BRW_PREP_REQ        0x406
9408         lctl set_param fail_loc=0x80000406
9409         $MULTIOP $DIR/$tfile Owy && \
9410                 error "sync didn't return ENOMEM"
9411         sync; sleep 2; sync     # do a real sync this time to flush page
9412         lctl get_param -n llite.*.dump_page_cache | grep locked && \
9413                 error "locked page left in cache after async error" || true
9414         debugrestore
9415 }
9416 run_test 63b "async write errors should be returned to fsync ==="
9417
9418 test_64a () {
9419         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9420
9421         lfs df $DIR
9422         lctl get_param osc.*[oO][sS][cC][_-]*.cur* | grep "=[1-9]"
9423 }
9424 run_test 64a "verify filter grant calculations (in kernel) ====="
9425
9426 test_64b () {
9427         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9428
9429         bash oos.sh $MOUNT || error "oos.sh failed: $?"
9430 }
9431 run_test 64b "check out-of-space detection on client"
9432
9433 test_64c() {
9434         $LCTL set_param osc.*OST0000-osc-[^mM]*.cur_grant_bytes=0
9435 }
9436 run_test 64c "verify grant shrink"
9437
9438 import_param() {
9439         local tgt=$1
9440         local param=$2
9441
9442         $LCTL get_param osc.$tgt.import | awk "/$param/ { print \$2 }"
9443 }
9444
9445 # this does exactly what osc_request.c:osc_announce_cached() does in
9446 # order to calculate max amount of grants to ask from server
9447 want_grant() {
9448         local tgt=$1
9449
9450         local nrpages=$($LCTL get_param -n osc.$tgt.max_pages_per_rpc)
9451         local rpc_in_flight=$($LCTL get_param -n osc.$tgt.max_rpcs_in_flight)
9452
9453         ((rpc_in_flight++));
9454         nrpages=$((nrpages * rpc_in_flight))
9455
9456         local dirty_max_pages=$($LCTL get_param -n osc.$tgt.max_dirty_mb)
9457
9458         dirty_max_pages=$((dirty_max_pages * 1024 * 1024 / PAGE_SIZE))
9459
9460         [[ $dirty_max_pages -gt $nrpages ]] && nrpages=$dirty_max_pages
9461         local undirty=$((nrpages * PAGE_SIZE))
9462
9463         local max_extent_pages
9464         max_extent_pages=$(import_param $tgt grant_max_extent_size)
9465         max_extent_pages=$((max_extent_pages / PAGE_SIZE))
9466         local nrextents=$(((nrpages + max_extent_pages - 1) / max_extent_pages))
9467         local grant_extent_tax
9468         grant_extent_tax=$(import_param $tgt grant_extent_tax)
9469
9470         undirty=$((undirty + nrextents * grant_extent_tax))
9471
9472         echo $undirty
9473 }
9474
9475 # this is size of unit for grant allocation. It should be equal to
9476 # what tgt_grant.c:tgt_grant_chunk() calculates
9477 grant_chunk() {
9478         local tgt=$1
9479         local max_brw_size
9480         local grant_extent_tax
9481
9482         max_brw_size=$(import_param $tgt max_brw_size)
9483
9484         grant_extent_tax=$(import_param $tgt grant_extent_tax)
9485
9486         echo $(((max_brw_size + grant_extent_tax) * 2))
9487 }
9488
9489 test_64d() {
9490         [ $OST1_VERSION -ge $(version_code 2.10.56) ] ||
9491                 skip "OST < 2.10.55 doesn't limit grants enough"
9492
9493         local tgt=$($LCTL dl | awk '/OST0000-osc-[^mM]/ { print $4 }')
9494
9495         [[ "$($LCTL get_param osc.${tgt}.import)" =~ "grant_param" ]] ||
9496                 skip "no grant_param connect flag"
9497
9498         local olddebug="$($LCTL get_param -n debug 2> /dev/null)"
9499
9500         $LCTL set_param -n -n debug="$OLDDEBUG" || true
9501         stack_trap "$LCTL set_param -n debug='$olddebug'" EXIT
9502
9503
9504         local max_cur_granted=$(($(want_grant $tgt) + $(grant_chunk $tgt)))
9505         stack_trap "rm -f $DIR/$tfile && wait_delete_completed" EXIT
9506
9507         $LFS setstripe $DIR/$tfile -i 0 -c 1
9508         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1000 &
9509         ddpid=$!
9510
9511         while kill -0 $ddpid; do
9512                 local cur_grant=$($LCTL get_param -n osc.$tgt.cur_grant_bytes)
9513
9514                 if [[ $cur_grant -gt $max_cur_granted ]]; then
9515                         kill $ddpid
9516                         error "cur_grant $cur_grant > $max_cur_granted"
9517                 fi
9518
9519                 sleep 1
9520         done
9521 }
9522 run_test 64d "check grant limit exceed"
9523
9524 check_grants() {
9525         local tgt=$1
9526         local expected=$2
9527         local msg=$3
9528         local cur_grants=$($LCTL get_param -n osc.$tgt.cur_grant_bytes)
9529
9530         ((cur_grants == expected)) ||
9531                 error "$msg: grants mismatch: $cur_grants, expected $expected"
9532 }
9533
9534 round_up_p2() {
9535         echo $((($1 + $2 - 1) & ~($2 - 1)))
9536 }
9537
9538 test_64e() {
9539         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9540         [ $OST1_VERSION -ge $(version_code 2.11.56) ] ||
9541                 skip "Need OSS version at least 2.11.56"
9542
9543         local olddebug="$($LCTL get_param -n debug 2> /dev/null)"
9544         stack_trap "$LCTL set_param -n debug='$olddebug'" EXIT
9545         $LCTL set_param debug=+cache
9546
9547         # Remount client to reset grant
9548         remount_client $MOUNT || error "failed to remount client"
9549         local osc_tgt="$FSNAME-OST0000-osc-$($LFS getname -i $DIR)"
9550
9551         local init_grants=$(import_param $osc_tgt initial_grant)
9552
9553         check_grants $osc_tgt $init_grants "init grants"
9554
9555         local extent_tax=$(import_param $osc_tgt grant_extent_tax)
9556         local max_brw_size=$(import_param $osc_tgt max_brw_size)
9557         local gbs=$(import_param $osc_tgt grant_block_size)
9558
9559         # write random number of bytes from max_brw_size / 4 to max_brw_size
9560         local write_bytes=$(shuf -i $((max_brw_size / 4))-$max_brw_size -n 1)
9561         # align for direct io
9562         write_bytes=$(round_up_p2 $write_bytes PAGE_SIZE)
9563         # round to grant consumption unit
9564         local wb_round_up=$(round_up_p2 $write_bytes gbs)
9565
9566         local grants=$((wb_round_up + extent_tax))
9567
9568         $LFS setstripe -c 1 -i 0 $DIR/$tfile  || error "lfs setstripe failed"
9569         stack_trap "rm -f $DIR/$tfile"
9570
9571         # define OBD_FAIL_TGT_NO_GRANT 0x725
9572         # make the server not grant more back
9573         do_facet ost1 $LCTL set_param fail_loc=0x725
9574         dd if=/dev/zero of=$DIR/$tfile bs=$write_bytes count=1 oflag=direct
9575
9576         do_facet ost1 $LCTL set_param fail_loc=0
9577
9578         check_grants $osc_tgt $((init_grants - grants)) "dio w/o grant alloc"
9579
9580         rm -f $DIR/$tfile || error "rm failed"
9581
9582         # Remount client to reset grant
9583         remount_client $MOUNT || error "failed to remount client"
9584         osc_tgt="$FSNAME-OST0000-osc-$($LFS getname -i $DIR)"
9585
9586         $LFS setstripe -c 1 -i 0 $DIR/$tfile || error "lfs setstripe failed"
9587
9588         # define OBD_FAIL_TGT_NO_GRANT 0x725
9589         # make the server not grant more back
9590         do_facet ost1 $LCTL set_param fail_loc=0x725
9591         $MULTIOP $DIR/$tfile "oO_WRONLY:w${write_bytes}yc"
9592         do_facet ost1 $LCTL set_param fail_loc=0
9593
9594         check_grants $osc_tgt $((init_grants - grants)) "buf io w/o grant alloc"
9595 }
9596 run_test 64e "check grant consumption (no grant allocation)"
9597
9598 test_64f() {
9599         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9600
9601         local olddebug="$($LCTL get_param -n debug 2> /dev/null)"
9602         stack_trap "$LCTL set_param -n debug='$olddebug'" EXIT
9603         $LCTL set_param debug=+cache
9604
9605         # Remount client to reset grant
9606         remount_client $MOUNT || error "failed to remount client"
9607         local osc_tgt="$FSNAME-OST0000-osc-$($LFS getname -i $DIR)"
9608
9609         local init_grants=$(import_param $osc_tgt initial_grant)
9610         local extent_tax=$(import_param $osc_tgt grant_extent_tax)
9611         local max_brw_size=$(import_param $osc_tgt max_brw_size)
9612         local gbs=$(import_param $osc_tgt grant_block_size)
9613         local chunk=$(grant_chunk $osc_tgt)
9614
9615         # write random number of bytes from max_brw_size / 4 to max_brw_size
9616         local write_bytes=$(shuf -i $((max_brw_size / 4))-$max_brw_size -n 1)
9617         # align for direct io
9618         write_bytes=$(round_up_p2 $write_bytes PAGE_SIZE)
9619         # round to grant consumption unit
9620         local wb_round_up=$(round_up_p2 $write_bytes gbs)
9621
9622         local grants=$((wb_round_up + extent_tax))
9623
9624         $LFS setstripe -c 1 -i 0 $DIR/$tfile || error "lfs setstripe failed"
9625         dd if=/dev/zero of=$DIR/$tfile bs=$write_bytes count=1 oflag=direct ||
9626                 error "error writing to $DIR/$tfile"
9627
9628         check_grants $osc_tgt $((init_grants - grants + chunk)) \
9629                 "direct io with grant allocation"
9630
9631         rm -f $DIR/$tfile || error "rm failed"
9632
9633         # Remount client to reset grant
9634         remount_client $MOUNT || error "failed to remount client"
9635         osc_tgt="$FSNAME-OST0000-osc-$($LFS getname -i $DIR)"
9636
9637         $LFS setstripe -c 1 -i 0 $DIR/$tfile || error "lfs setstripe failed"
9638
9639         # Testing that buffered IO consumes grant on the client
9640
9641         # Delay the RPC on the server so it's guaranteed to not complete even
9642         # if the RPC is sent from the client
9643         #define OBD_FAIL_PTLRPC_PAUSE_REQ        0x50a
9644         $LCTL set_param fail_loc=0x50a fail_val=3
9645         dd if=/dev/zero of=$DIR/$tfile bs=$write_bytes count=1 conv=notrunc ||
9646                 error "error writing to $DIR/$tfile with buffered IO"
9647
9648         check_grants $osc_tgt $((init_grants - grants)) \
9649                 "buffered io, not write rpc"
9650
9651         # Clear the fail loc and do a sync on the client
9652         $LCTL set_param fail_loc=0 fail_val=0
9653         sync
9654
9655         # RPC is now known to have sent
9656         check_grants $osc_tgt $((init_grants - grants + chunk)) \
9657                 "buffered io, one RPC"
9658 }
9659 run_test 64f "check grant consumption (with grant allocation)"
9660
9661 test_64g() {
9662         (( $MDS1_VERSION >= $(version_code 2.14.56) )) ||
9663                 skip "Need MDS version at least 2.14.56"
9664
9665         local mdts=$(comma_list $(mdts_nodes))
9666
9667         local old=$($LCTL get_param mdc.$FSNAME-*.grant_shrink_interval |
9668                         tr '\n' ' ')
9669         stack_trap "$LCTL set_param $old"
9670
9671         # generate dirty pages and increase dirty granted on MDT
9672         stack_trap "rm -f $DIR/$tfile-*"
9673         for (( i = 0; i < 10; i++)); do
9674                 $LFS setstripe -E 1M -L mdt $DIR/$tfile-$i ||
9675                         error "can't set stripe"
9676                 dd if=/dev/zero of=$DIR/$tfile-$i bs=128k count=1 ||
9677                         error "can't dd"
9678                 $LFS getstripe $DIR/$tfile-$i | grep -q pattern.*mdt || {
9679                         $LFS getstripe $DIR/$tfile-$i
9680                         error "not DoM file"
9681                 }
9682         done
9683
9684         # flush dirty pages
9685         sync
9686
9687         # wait until grant shrink reset grant dirty on MDTs
9688         for ((i = 0; i < 120; i++)); do
9689                 grant_dirty=$(do_nodes $mdts $LCTL get_param -n  mdt.*.tot_dirty |
9690                         awk '{sum=sum+$1} END {print sum}')
9691                 vm_dirty=$(awk '/Dirty:/{print $2}' /proc/meminfo)
9692                 echo "$grant_dirty grants, $vm_dirty pages"
9693                 (( grant_dirty + vm_dirty == 0 )) && break
9694                 (( i == 3 )) && sync &&
9695                         $LCTL set_param mdc.$FSNAME-*.grant_shrink_interval=5
9696                 sleep 1
9697         done
9698
9699         grant_dirty=$(do_nodes $mdts $LCTL get_param -n  mdt.*.tot_dirty |
9700                 awk '{sum=sum+$1} END {print sum}')
9701         (( grant_dirty == 0 )) || error "$grant_dirty on MDT"
9702 }
9703 run_test 64g "grant shrink on MDT"
9704
9705 test_64h() {
9706         (( $OST1_VERSION >= $(version_code 2.14.56) )) ||
9707                 skip "need OST at least 2.14.56 to avoid grant shrink on read"
9708
9709         local instance=$($LFS getname -i $DIR)
9710         local osc_tgt="$FSNAME-OST0000-osc-$instance"
9711         local num_exps=$(do_facet ost1 \
9712             $LCTL get_param -n obdfilter.*OST0000*.num_exports)
9713         local max_brw_size=$(import_param $osc_tgt max_brw_size)
9714         local avail=$($LCTL get_param -n osc.*OST0000-osc-$instance.kbytesavail)
9715         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
9716
9717         # 10MiB is for file to be written, max_brw_size * 16 *
9718         # num_exps is space reserve so that tgt_grant_shrink() decided
9719         # to not shrink
9720         local expect=$((max_brw_size * 16 * num_exps + 10 * 1048576))
9721         (( avail * 1024 < expect )) &&
9722                 skip "need $expect bytes on ost1, have $(( avail * 1024 )) only"
9723
9724         save_lustre_params client "osc.*OST0000*.grant_shrink" > $p
9725         save_lustre_params client "osc.*OST0000*.grant_shrink_interval" >> $p
9726         stack_trap "restore_lustre_params < $p; rm -f $save" EXIT
9727         $LCTL set_param osc.*OST0000*.grant_shrink=1
9728         $LCTL set_param osc.*OST0000*.grant_shrink_interval=10
9729
9730         $LFS setstripe -c 1 -i 0 $DIR/$tfile
9731         stack_trap "rm -f $DIR/$tfile"
9732         dd if=/dev/zero of=$DIR/$tfile bs=1M count=10 oflag=sync
9733
9734         # drop cache so that coming read would do rpc
9735         cancel_lru_locks osc
9736
9737         # shrink interval is set to 10, pause for 7 seconds so that
9738         # grant thread did not wake up yet but coming read entered
9739         # shrink mode for rpc (osc_should_shrink_grant())
9740         sleep 7
9741
9742         declare -a cur_grant_bytes
9743         declare -a tot_granted
9744         cur_grant_bytes[0]=$($LCTL get_param -n osc.*OST0000*.cur_grant_bytes)
9745         tot_granted[0]=$(do_facet ost1 \
9746             $LCTL get_param -n obdfilter.*OST0000*.tot_granted)
9747
9748         dd if=$DIR/$tfile bs=4K count=1 of=/dev/null
9749
9750         cur_grant_bytes[1]=$($LCTL get_param -n osc.*OST0000*.cur_grant_bytes)
9751         tot_granted[1]=$(do_facet ost1 \
9752             $LCTL get_param -n obdfilter.*OST0000*.tot_granted)
9753
9754         # grant change should be equal on both sides
9755         (( cur_grant_bytes[0] - cur_grant_bytes[1] ==
9756                 tot_granted[0] - tot_granted[1])) ||
9757                 error "grant change mismatch, "                                \
9758                         "server: ${tot_granted[0]} to ${tot_granted[1]}, "     \
9759                         "client: ${cur_grant_bytes[0]} to ${cur_grant_bytes[1]}"
9760 }
9761 run_test 64h "grant shrink on read"
9762
9763 test_64i() {
9764         (( $OST1_VERSION >= $(version_code 2.14.56) )) ||
9765                 skip "need OST at least 2.14.56 to avoid grant shrink on replay"
9766
9767         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9768         remote_ost_nodsh && skip "remote OSTs with nodsh"
9769
9770         $LFS setstripe -c 1 -i 0 $DIR/$tfile
9771         stack_trap "rm -f $DIR/$tfile"
9772
9773         dd if=/dev/zero of=$DIR/$tfile bs=1M count=64
9774
9775         # lustre-ffff9fc75e850800 /mnt/lustre -> ffff9fc75e850800
9776         local instance=$($LFS getname -i $DIR)
9777
9778         local osc_tgt="$FSNAME-OST0000-osc-$instance"
9779         local cgb=$($LCTL get_param -n osc.$osc_tgt.cur_grant_bytes)
9780
9781         # shrink grants and simulate rpc loss
9782         #define OBD_FAIL_PTLRPC_DROP_REQ_OPC     0x513
9783         do_facet ost1 "$LCTL set_param fail_loc=0x80000513 fail_val=17"
9784         $LCTL set_param osc.$osc_tgt.cur_grant_bytes=$((cgb/2))B
9785
9786         fail ost1
9787
9788         dd if=/dev/zero of=$DIR/$tfile oflag=append bs=1M count=8 conv=notrunc
9789
9790         local testid=$(echo $TESTNAME | tr '_' ' ')
9791
9792         do_facet ost1 dmesg | tac | sed "/$testid/,$ d" |
9793                 grep "GRANT, real grant" &&
9794                 error "client has more grants then it owns" || true
9795 }
9796 run_test 64i "shrink on reconnect"
9797
9798 # bug 1414 - set/get directories' stripe info
9799 test_65a() {
9800         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9801
9802         test_mkdir $DIR/$tdir
9803         touch $DIR/$tdir/f1
9804         $LVERIFY $DIR/$tdir $DIR/$tdir/f1 || error "lverify failed"
9805 }
9806 run_test 65a "directory with no stripe info"
9807
9808 test_65b() {
9809         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9810
9811         test_mkdir $DIR/$tdir
9812         local STRIPESIZE=$($LFS getstripe -S $DIR/$tdir)
9813
9814         $LFS setstripe -S $((STRIPESIZE * 2)) -i 0 -c 1 $DIR/$tdir ||
9815                                                 error "setstripe"
9816         touch $DIR/$tdir/f2
9817         $LVERIFY $DIR/$tdir $DIR/$tdir/f2 || error "lverify failed"
9818 }
9819 run_test 65b "directory setstripe -S stripe_size*2 -i 0 -c 1"
9820
9821 test_65c() {
9822         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9823         [ $OSTCOUNT -lt 2 ] && skip_env "need at least 2 OSTs"
9824
9825         test_mkdir $DIR/$tdir
9826         local stripesize=$($LFS getstripe -S $DIR/$tdir)
9827
9828         $LFS setstripe -S $((stripesize * 4)) -i 1 \
9829                 -c $((OSTCOUNT - 1)) $DIR/$tdir || error "setstripe"
9830         touch $DIR/$tdir/f3
9831         $LVERIFY $DIR/$tdir $DIR/$tdir/f3 || error "lverify failed"
9832 }
9833 run_test 65c "directory setstripe -S stripe_size*4 -i 1 -c $((OSTCOUNT-1))"
9834
9835 test_65d() {
9836         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9837
9838         test_mkdir $DIR/$tdir
9839         local STRIPECOUNT=$($LFS getstripe -c $DIR/$tdir)
9840         local STRIPESIZE=$($LFS getstripe -S $DIR/$tdir)
9841
9842         if [[ $STRIPECOUNT -le 0 ]]; then
9843                 sc=1
9844         elif [[ $STRIPECOUNT -gt $LOV_MAX_STRIPE_COUNT ]]; then
9845                 [[ $OSTCOUNT -gt $LOV_MAX_STRIPE_COUNT ]] &&
9846                         sc=$LOV_MAX_STRIPE_COUNT || sc=$(($OSTCOUNT - 1))
9847         else
9848                 sc=$(($STRIPECOUNT - 1))
9849         fi
9850         $LFS setstripe -S $STRIPESIZE -c $sc $DIR/$tdir || error "setstripe"
9851         touch $DIR/$tdir/f4 $DIR/$tdir/f5
9852         $LVERIFY $DIR/$tdir $DIR/$tdir/f4 $DIR/$tdir/f5 ||
9853                 error "lverify failed"
9854 }
9855 run_test 65d "directory setstripe -S stripe_size -c stripe_count"
9856
9857 test_65e() {
9858         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9859
9860         # LU-16904 delete layout when root is set as PFL layout
9861         save_layout_restore_at_exit $MOUNT
9862         $LFS setstripe -d $MOUNT || error "setstripe failed"
9863
9864         test_mkdir $DIR/$tdir
9865
9866         $LFS setstripe $DIR/$tdir || error "setstripe"
9867         $LFS getstripe -v $DIR/$tdir | grep "Default" ||
9868                                         error "no stripe info failed"
9869         touch $DIR/$tdir/f6
9870         $LVERIFY $DIR/$tdir $DIR/$tdir/f6 || error "lverify failed"
9871 }
9872 run_test 65e "directory setstripe defaults"
9873
9874 test_65f() {
9875         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9876
9877         test_mkdir $DIR/${tdir}f
9878         $RUNAS $LFS setstripe $DIR/${tdir}f &&
9879                 error "setstripe succeeded" || true
9880 }
9881 run_test 65f "dir setstripe permission (should return error) ==="
9882
9883 test_65g() {
9884         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9885
9886         # LU-16904 delete layout when root is set as PFL layout
9887         save_layout_restore_at_exit $MOUNT
9888         $LFS setstripe -d $MOUNT || error "setstripe failed"
9889
9890         test_mkdir $DIR/$tdir
9891         local STRIPESIZE=$($LFS getstripe -S $DIR/$tdir)
9892
9893         $LFS setstripe -S $((STRIPESIZE * 2)) -i 0 -c 1 $DIR/$tdir ||
9894                 error "setstripe -S failed"
9895         $LFS setstripe -d $DIR/$tdir || error "setstripe -d failed"
9896         $LFS getstripe -v $DIR/$tdir | grep "Default" ||
9897                 error "delete default stripe failed"
9898 }
9899 run_test 65g "directory setstripe -d"
9900
9901 test_65h() {
9902         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9903
9904         test_mkdir $DIR/$tdir
9905         local STRIPESIZE=$($LFS getstripe -S $DIR/$tdir)
9906
9907         $LFS setstripe -S $((STRIPESIZE * 2)) -i 0 -c 1 $DIR/$tdir ||
9908                 error "setstripe -S failed"
9909         test_mkdir $DIR/$tdir/dd1
9910         [ $($LFS getstripe -c $DIR/$tdir) = $($LFS getstripe -c $DIR/$tdir/dd1) ] ||
9911                 error "stripe info inherit failed"
9912 }
9913 run_test 65h "directory stripe info inherit ===================="
9914
9915 test_65i() {
9916         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9917
9918         save_layout_restore_at_exit $MOUNT
9919
9920         # bug6367: set non-default striping on root directory
9921         $LFS setstripe -S 65536 -c -1 $MOUNT || error "error setting stripe"
9922
9923         # bug12836: getstripe on -1 default directory striping
9924         $LFS getstripe $MOUNT || error "getstripe $MOUNT failed"
9925
9926         # bug12836: getstripe -v on -1 default directory striping
9927         $LFS getstripe -v $MOUNT || error "getstripe -v $MOUNT failed"
9928
9929         # bug12836: new find on -1 default directory striping
9930         $LFS find -mtime -1 $MOUNT > /dev/null || error "find $MOUNT failed"
9931 }
9932 run_test 65i "various tests to set root directory striping"
9933
9934 test_65j() { # bug6367
9935         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9936
9937         sync; sleep 1
9938
9939         # if we aren't already remounting for each test, do so for this test
9940         if [ "$I_MOUNTED" = "yes" ]; then
9941                 cleanup || error "failed to unmount"
9942                 setup
9943         fi
9944
9945         save_layout_restore_at_exit $MOUNT
9946
9947         $LFS setstripe -d $MOUNT || error "setstripe failed"
9948 }
9949 run_test 65j "set default striping on root directory (bug 6367)="
9950
9951 cleanup_65k() {
9952         rm -rf $DIR/$tdir
9953         wait_delete_completed
9954         do_facet $SINGLEMDS "lctl set_param -n \
9955                 osp.$ost*MDT0000.max_create_count=$max_count"
9956         do_facet $SINGLEMDS "lctl set_param -n \
9957                 osp.$ost*MDT0000.create_count=$count"
9958         do_facet $SINGLEMDS lctl --device  %$INACTIVE_OSC activate
9959         echo $INACTIVE_OSC "is Activate"
9960
9961         wait_osc_import_state mds ost$(( ostnum + 1 )) FULL
9962 }
9963
9964 test_65k() { # bug11679
9965         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9966         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
9967         remote_mds_nodsh && skip "remote MDS with nodsh"
9968
9969         local disable_precreate=true
9970         [ $MDS1_VERSION -le $(version_code 2.8.54) ] &&
9971                 disable_precreate=false
9972
9973         echo "Check OST status: "
9974         local MDS_OSCS=$(do_facet $SINGLEMDS lctl dl |
9975                 awk '/[oO][sS][cC].*md[ts]/ { print $4 }')
9976
9977         for OSC in $MDS_OSCS; do
9978                 echo $OSC "is active"
9979                 do_facet $SINGLEMDS lctl --device %$OSC activate
9980         done
9981
9982         for INACTIVE_OSC in $MDS_OSCS; do
9983                 local ost=$(osc_to_ost $INACTIVE_OSC)
9984                 local ostnum=$(do_facet $SINGLEMDS lctl get_param -n \
9985                                lov.*md*.target_obd |
9986                                awk -F: /$ost/'{ print $1 }' | head -n 1)
9987
9988                 mkdir -p $DIR/$tdir
9989                 $LFS setstripe -i $ostnum -c 1 $DIR/$tdir
9990                 createmany -o $DIR/$tdir/$tfile.$ostnum. 1000
9991
9992                 echo "Deactivate: " $INACTIVE_OSC
9993                 do_facet $SINGLEMDS lctl --device %$INACTIVE_OSC deactivate
9994
9995                 local count=$(do_facet $SINGLEMDS "lctl get_param -n \
9996                               osp.$ost*MDT0000.create_count")
9997                 local max_count=$(do_facet $SINGLEMDS "lctl get_param -n \
9998                                   osp.$ost*MDT0000.max_create_count")
9999                 $disable_precreate &&
10000                         do_facet $SINGLEMDS "lctl set_param -n \
10001                                 osp.$ost*MDT0000.max_create_count=0"
10002
10003                 for idx in $(seq 0 $((OSTCOUNT - 1))); do
10004                         [ -f $DIR/$tdir/$idx ] && continue
10005                         echo "$LFS setstripe -i $idx -c 1 $DIR/$tdir/$idx"
10006                         $LFS setstripe -i $idx -c 1 $DIR/$tdir/$idx ||
10007                                 { cleanup_65k;
10008                                   error "setstripe $idx should succeed"; }
10009                         rm -f $DIR/$tdir/$idx || error "rm $idx failed"
10010                 done
10011                 unlinkmany $DIR/$tdir/$tfile.$ostnum. 1000
10012                 rmdir $DIR/$tdir
10013
10014                 do_facet $SINGLEMDS "lctl set_param -n \
10015                         osp.$ost*MDT0000.max_create_count=$max_count"
10016                 do_facet $SINGLEMDS "lctl set_param -n \
10017                         osp.$ost*MDT0000.create_count=$count"
10018                 do_facet $SINGLEMDS lctl --device  %$INACTIVE_OSC activate
10019                 echo $INACTIVE_OSC "is Activate"
10020
10021                 wait_osc_import_state mds ost$(( ostnum + 1 )) FULL
10022         done
10023 }
10024 run_test 65k "validate manual striping works properly with deactivated OSCs"
10025
10026 test_65l() { # bug 12836
10027         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10028
10029         test_mkdir -p $DIR/$tdir/test_dir
10030         $LFS setstripe -c -1 $DIR/$tdir/test_dir
10031         $LFS find -mtime -1 $DIR/$tdir >/dev/null
10032 }
10033 run_test 65l "lfs find on -1 stripe dir ========================"
10034
10035 test_65m() {
10036         local layout=$(save_layout $MOUNT)
10037         $RUNAS $LFS setstripe -c 2 $MOUNT && {
10038                 restore_layout $MOUNT $layout
10039                 error "setstripe should fail by non-root users"
10040         }
10041         true
10042 }
10043 run_test 65m "normal user can't set filesystem default stripe"
10044
10045 test_65n() {
10046         [ -n "$FILESET" ] && skip "Not functional for FILESET set"
10047         [[ $MDS1_VERSION -ge $(version_code 2.12.50) ]] ||
10048                 skip "Need MDS version at least 2.12.50"
10049         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
10050
10051         [[ $OSTCOUNT -ge 2 ]] || skip_env "needs >= 2 OSTs"
10052         which getfattr > /dev/null 2>&1 || skip_env "no getfattr command"
10053         which setfattr > /dev/null 2>&1 || skip_env "no setfattr command"
10054
10055         save_layout_restore_at_exit $MOUNT
10056
10057         # new subdirectory under root directory should not inherit
10058         # the default layout from root
10059         # LU-16904 check if the root is set as PFL layout
10060         local numcomp=$($LFS getstripe --component-count $MOUNT)
10061
10062         if [[ $numcomp -eq 0 ]]; then
10063                 local dir1=$MOUNT/$tdir-1
10064                 mkdir $dir1 || error "mkdir $dir1 failed"
10065                 ! getfattr -n trusted.lov $dir1 &> /dev/null ||
10066                         error "$dir1 shouldn't have LOV EA"
10067         fi
10068
10069         # delete the default layout on root directory
10070         $LFS setstripe -d $MOUNT || error "delete root default layout failed"
10071
10072         local dir2=$MOUNT/$tdir-2
10073         mkdir $dir2 || error "mkdir $dir2 failed"
10074         ! getfattr -n trusted.lov $dir2 &> /dev/null ||
10075                 error "$dir2 shouldn't have LOV EA"
10076
10077         # set a new striping pattern on root directory
10078         local def_stripe_size=$($LFS getstripe -S $MOUNT)
10079         local new_def_stripe_size=$((def_stripe_size * 2))
10080         $LFS setstripe -S $new_def_stripe_size $MOUNT ||
10081                 error "set stripe size on $MOUNT failed"
10082
10083         # new file created in $dir2 should inherit the new stripe size from
10084         # the filesystem default
10085         local file2=$dir2/$tfile-2
10086         touch $file2 || error "touch $file2 failed"
10087
10088         local file2_stripe_size=$($LFS getstripe -S $file2)
10089         [[ $file2_stripe_size -eq $new_def_stripe_size ]] ||
10090         {
10091                 echo "file2_stripe_size: '$file2_stripe_size'"
10092                 echo "new_def_stripe_size: '$new_def_stripe_size'"
10093                 error "$file2 didn't inherit stripe size $new_def_stripe_size"
10094         }
10095
10096         local dir3=$MOUNT/$tdir-3
10097         mkdir $dir3 || error "mkdir $dir3 failed"
10098         # $dir3 shouldn't have LOV EA, but "lfs getstripe -d $dir3" should show
10099         # the root layout, which is the actual default layout that will be used
10100         # when new files are created in $dir3.
10101         local dir3_layout=$(get_layout_param $dir3)
10102         local root_dir_layout=$(get_layout_param $MOUNT)
10103         [[ "$dir3_layout" = "$root_dir_layout" ]] ||
10104         {
10105                 echo "dir3_layout: '$dir3_layout'"
10106                 echo "root_dir_layout: '$root_dir_layout'"
10107                 error "$dir3 should show the default layout from $MOUNT"
10108         }
10109
10110         # set OST pool on root directory
10111         local pool=$TESTNAME
10112         pool_add $pool || error "add $pool failed"
10113         pool_add_targets $pool 0 $((OSTCOUNT - 1)) 1 ||
10114                 error "add targets to $pool failed"
10115
10116         $LFS setstripe -p $pool $MOUNT ||
10117                 error "set OST pool on $MOUNT failed"
10118
10119         # new file created in $dir3 should inherit the pool from
10120         # the filesystem default
10121         local file3=$dir3/$tfile-3
10122         touch $file3 || error "touch $file3 failed"
10123
10124         local file3_pool=$($LFS getstripe -p $file3)
10125         [[ "$file3_pool" = "$pool" ]] ||
10126                 error "$file3 ('$file3_pool') didn't inherit OST pool '$pool'"
10127
10128         local dir4=$MOUNT/$tdir-4
10129         mkdir $dir4 || error "mkdir $dir4 failed"
10130         local dir4_layout=$(get_layout_param $dir4)
10131         root_dir_layout=$(get_layout_param $MOUNT)
10132         echo "$LFS getstripe -d $dir4"
10133         $LFS getstripe -d $dir4
10134         echo "$LFS getstripe -d $MOUNT"
10135         $LFS getstripe -d $MOUNT
10136         [[ "$dir4_layout" = "$root_dir_layout" ]] ||
10137         {
10138                 echo "dir4_layout: '$dir4_layout'"
10139                 echo "root_dir_layout: '$root_dir_layout'"
10140                 error "$dir4 should show the default layout from $MOUNT"
10141         }
10142
10143         # new file created in $dir4 should inherit the pool from
10144         # the filesystem default
10145         local file4=$dir4/$tfile-4
10146         touch $file4 || error "touch $file4 failed"
10147
10148         local file4_pool=$($LFS getstripe -p $file4)
10149         [[ "$file4_pool" = "$pool" ]] ||
10150                 error "$file4 ('$file4_pool') didn't inherit OST pool $pool"
10151
10152         # new subdirectory under non-root directory should inherit
10153         # the default layout from its parent directory
10154         $LFS setstripe -S $new_def_stripe_size -p $pool $dir4 ||
10155                 error "set directory layout on $dir4 failed"
10156
10157         local dir5=$dir4/$tdir-5
10158         mkdir $dir5 || error "mkdir $dir5 failed"
10159
10160         dir4_layout=$(get_layout_param $dir4)
10161         local dir5_layout=$(get_layout_param $dir5)
10162         [[ "$dir4_layout" = "$dir5_layout" ]] ||
10163         {
10164                 echo "dir4_layout: '$dir4_layout'"
10165                 echo "dir5_layout: '$dir5_layout'"
10166                 error "$dir5 should inherit the default layout from $dir4"
10167         }
10168
10169         # though subdir under ROOT doesn't inherit default layout, but
10170         # its sub dir/file should be created with default layout.
10171         [[ $MDSCOUNT -ge 2 ]] || skip_env "needs >= 2 MDTs"
10172         [[ $MDS1_VERSION -ge $(version_code 2.12.59) ]] ||
10173                 skip "Need MDS version at least 2.12.59"
10174
10175         local default_lmv_count=$($LFS getdirstripe -D -c $MOUNT)
10176         local default_lmv_index=$($LFS getdirstripe -D -i $MOUNT)
10177         local default_lmv_hash=$($LFS getdirstripe -D -H $MOUNT)
10178
10179         if [ $default_lmv_hash == "none" ]; then
10180                 stack_trap "$LFS setdirstripe -D -d $MOUNT" EXIT
10181         else
10182                 stack_trap "$LFS setdirstripe -D -i $default_lmv_index \
10183                         -c $default_lmv_count -H $default_lmv_hash $MOUNT" EXIT
10184         fi
10185
10186         $LFS setdirstripe -D -c 2 $MOUNT ||
10187                 error "setdirstripe -D -c 2 failed"
10188         mkdir $MOUNT/$tdir-6 || error "mkdir $tdir-6 failed"
10189         local lmv_count=$($LFS getdirstripe -c $MOUNT/$tdir-6)
10190         [ $lmv_count -eq 2 ] || error "$tdir-6 stripe count $lmv_count"
10191
10192         # $dir4 layout includes pool
10193         $LFS setstripe -S $((new_def_stripe_size * 2)) $dir4
10194         [[ "$pool" = $($LFS getstripe -p -d $dir4) ]] ||
10195                 error "pool lost on setstripe"
10196         $LFS setstripe -E -1 -S $new_def_stripe_size $dir4
10197         [[ "$pool" = $($LFS getstripe -p -d $dir4) ]] ||
10198                 error "pool lost on compound layout setstripe"
10199 }
10200 run_test 65n "don't inherit default layout from root for new subdirectories"
10201
10202 test_65o() {
10203         (( $MDS1_VERSION >= $(version_code 2.14.57) )) ||
10204                 skip "need MDS version at least 2.14.57"
10205
10206         # set OST pool on root directory
10207         local pool=$TESTNAME
10208
10209         pool_add $pool || error "add $pool failed"
10210         pool_add_targets $pool 0 $((OSTCOUNT - 1)) 1 ||
10211                 error "add targets to $pool failed"
10212
10213         local dir1=$MOUNT/$tdir
10214
10215         mkdir $dir1 || error "mkdir $dir1 failed"
10216
10217         # set a new striping pattern on root directory
10218         local def_stripe_size=$($LFS getstripe -S $MOUNT)
10219
10220         $LFS setstripe -p $pool $dir1 ||
10221                 error "set directory layout on $dir1 failed"
10222
10223         # $dir1 layout includes pool
10224         $LFS setstripe -S $((def_stripe_size * 2)) $dir1
10225         [[ "$pool" = $($LFS getstripe -p -d $dir1) ]] ||
10226                 error "pool lost on setstripe"
10227         $LFS setstripe -E 1M -L mdt -E -1 -c 1 $dir1
10228         $LFS getstripe $dir1
10229         [[ "$pool" = $($LFS getstripe -p -d $dir1) ]] ||
10230                 error "pool lost on compound layout setstripe"
10231
10232         $LFS setdirstripe -i 0 -c 2 $dir1/dir2 ||
10233                 error "setdirstripe failed on sub-dir with inherited pool"
10234         $LFS getstripe $dir1/dir2
10235         [[ "$pool" = $($LFS getstripe -p -d $dir1/dir2) ]] ||
10236                 error "pool lost on compound layout setdirstripe"
10237
10238         $LFS setstripe -E -1 -c 1 $dir1
10239         $LFS getstripe -d $dir1
10240         [[ "$pool" = $($LFS getstripe -p -d $dir1) ]] ||
10241                 error "pool lost on setstripe"
10242 }
10243 run_test 65o "pool inheritance for mdt component"
10244
10245 test_65p () { # LU-16152
10246         local src_dir=$DIR/$tdir/src_dir
10247         local dst_dir=$DIR/$tdir/dst_dir
10248         local yaml_file=$DIR/$tdir/layout.yaml
10249         local border
10250
10251         (( $CLIENT_VERSION >= $(version_code 2.15.51) )) ||
10252                 skip "Need at least version 2.15.51"
10253
10254         test_mkdir -p $src_dir
10255         $LFS setstripe -E 2048M -c 4 -E EOF -c 8 $src_dir ||
10256                 error "failed to setstripe"
10257         $LFS getstripe --yaml -d $src_dir > $yaml_file ||
10258                 error "failed to getstripe"
10259
10260         test_mkdir -p $dst_dir
10261         $LFS setstripe --yaml $yaml_file $dst_dir ||
10262                 error "failed to setstripe with yaml file"
10263         border=$($LFS getstripe -d $dst_dir |
10264                 awk '/lcme_extent.e_end:/ { print $2; exit; }') ||
10265                 error "failed to getstripe"
10266
10267         # 2048M is 0x80000000, or 2147483648
10268         (( $border == 2147483648 )) ||
10269                 error "failed to handle huge number in yaml layout"
10270 }
10271 run_test 65p "setstripe with yaml file and huge number"
10272
10273 # bug 2543 - update blocks count on client
10274 test_66() {
10275         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10276
10277         local COUNT=${COUNT:-8}
10278         dd if=/dev/zero of=$DIR/f66 bs=1k count=$COUNT
10279         sync; sync_all_data; sync; sync_all_data
10280         cancel_lru_locks osc
10281         local BLOCKS=$(ls -s --block-size=1k $DIR/f66 | awk '{ print $1 }')
10282         (( BLOCKS >= COUNT )) || error "$DIR/f66 blocks $BLOCKS < $COUNT"
10283 }
10284 run_test 66 "update inode blocks count on client ==============="
10285
10286 meminfo() {
10287         awk '($1 == "'$1':") { print $2 }' /proc/meminfo
10288 }
10289
10290 swap_used() {
10291         swapon -s | awk '($1 == "'$1'") { print $4 }'
10292 }
10293
10294 # bug5265, obdfilter oa2dentry return -ENOENT
10295 # #define OBD_FAIL_SRV_ENOENT 0x217
10296 test_69() {
10297         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10298         remote_ost_nodsh && skip "remote OST with nodsh"
10299
10300         f="$DIR/$tfile"
10301         $LFS setstripe -c 1 -i 0 $f
10302         stack_trap "rm -f $f ${f}.2"
10303
10304         $DIRECTIO write ${f}.2 0 1 || error "directio write error"
10305
10306         do_facet ost1 lctl set_param fail_loc=0x217
10307         $TRUNCATE $f 1 # vmtruncate() will ignore truncate() error.
10308         $DIRECTIO write $f 0 2 && error "write succeeded, expect -ENOENT"
10309
10310         do_facet ost1 lctl set_param fail_loc=0
10311         $DIRECTIO write $f 0 2 || error "write error"
10312
10313         cancel_lru_locks osc
10314         $DIRECTIO read $f 0 1 || error "read error"
10315
10316         do_facet ost1 lctl set_param fail_loc=0x217
10317         $DIRECTIO read $f 1 1 && error "read succeeded, expect -ENOENT"
10318
10319         do_facet ost1 lctl set_param fail_loc=0
10320 }
10321 run_test 69 "verify oa2dentry return -ENOENT doesn't LBUG ======"
10322
10323 test_71() {
10324         test_mkdir $DIR/$tdir
10325         $LFS setdirstripe -D -c$MDSCOUNT $DIR/$tdir
10326         bash rundbench -C -D $DIR/$tdir 2 || error "dbench failed!"
10327 }
10328 run_test 71 "Running dbench on lustre (don't segment fault) ===="
10329
10330 test_72a() { # bug 5695 - Test that on 2.6 remove_suid works properly
10331         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10332         [ "$RUNAS_ID" = "$UID" ] &&
10333                 skip_env "RUNAS_ID = UID = $UID -- skipping"
10334         # Check that testing environment is properly set up. Skip if not
10335         FAIL_ON_ERROR=false check_runas_id_ret $RUNAS_ID $RUNAS_GID $RUNAS ||
10336                 skip_env "User $RUNAS_ID does not exist - skipping"
10337
10338         touch $DIR/$tfile
10339         chmod 777 $DIR/$tfile
10340         chmod ug+s $DIR/$tfile
10341         $RUNAS dd if=/dev/zero of=$DIR/$tfile bs=512 count=1 ||
10342                 error "$RUNAS dd $DIR/$tfile failed"
10343         # See if we are still setuid/sgid
10344         [ -u $DIR/$tfile ] || [ -g $DIR/$tfile ] &&
10345                 error "S/gid is not dropped on write"
10346         # Now test that MDS is updated too
10347         cancel_lru_locks mdc
10348         [ -u $DIR/$tfile ] || [ -g $DIR/$tfile ] &&
10349                 error "S/gid is not dropped on MDS"
10350         rm -f $DIR/$tfile
10351 }
10352 run_test 72a "Test that remove suid works properly (bug5695) ===="
10353
10354 test_72b() { # bug 24226 -- keep mode setting when size is not changing
10355         local perm
10356
10357         [ "$RUNAS_ID" = "$UID" ] &&
10358                 skip_env "RUNAS_ID = UID = $UID -- skipping"
10359         [ "$RUNAS_ID" -eq 0 ] &&
10360                 skip_env "RUNAS_ID = 0 -- skipping"
10361         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10362         # Check that testing environment is properly set up. Skip if not
10363         FAIL_ON_ERROR=false check_runas_id_ret $RUNAS_ID $RUNAS_ID $RUNAS ||
10364                 skip_env "User $RUNAS_ID does not exist - skipping"
10365
10366         touch $DIR/${tfile}-f{g,u}
10367         test_mkdir $DIR/${tfile}-dg
10368         test_mkdir $DIR/${tfile}-du
10369         chmod 770 $DIR/${tfile}-{f,d}{g,u}
10370         chmod g+s $DIR/${tfile}-{f,d}g
10371         chmod u+s $DIR/${tfile}-{f,d}u
10372         for perm in 777 2777 4777; do
10373                 $RUNAS chmod $perm $DIR/${tfile}-fg && error "S/gid file allowed improper chmod to $perm"
10374                 $RUNAS chmod $perm $DIR/${tfile}-fu && error "S/uid file allowed improper chmod to $perm"
10375                 $RUNAS chmod $perm $DIR/${tfile}-dg && error "S/gid dir allowed improper chmod to $perm"
10376                 $RUNAS chmod $perm $DIR/${tfile}-du && error "S/uid dir allowed improper chmod to $perm"
10377         done
10378         true
10379 }
10380 run_test 72b "Test that we keep mode setting if without file data changed (bug 24226)"
10381
10382 # bug 3462 - multiple simultaneous MDC requests
10383 test_73() {
10384         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10385
10386         test_mkdir $DIR/d73-1
10387         test_mkdir $DIR/d73-2
10388         multiop_bg_pause $DIR/d73-1/f73-1 O_c || return 1
10389         pid1=$!
10390
10391         lctl set_param fail_loc=0x80000129
10392         $MULTIOP $DIR/d73-1/f73-2 Oc &
10393         sleep 1
10394         lctl set_param fail_loc=0
10395
10396         $MULTIOP $DIR/d73-2/f73-3 Oc &
10397         pid3=$!
10398
10399         kill -USR1 $pid1
10400         wait $pid1 || return 1
10401
10402         sleep 25
10403
10404         $CHECKSTAT -t file $DIR/d73-1/f73-1 || return 4
10405         $CHECKSTAT -t file $DIR/d73-1/f73-2 || return 5
10406         $CHECKSTAT -t file $DIR/d73-2/f73-3 || return 6
10407
10408         rm -rf $DIR/d73-*
10409 }
10410 run_test 73 "multiple MDC requests (should not deadlock)"
10411
10412 test_74a() { # bug 6149, 6184
10413         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10414
10415         touch $DIR/f74a
10416         #define OBD_FAIL_LDLM_ENQUEUE_OLD_EXPORT 0x30e
10417         #
10418         # very important to OR with CFS_FAIL_ONCE (0x80000000) -- otherwise it
10419         # will spin in a tight reconnection loop
10420         $LCTL set_param fail_loc=0x8000030e
10421         # get any lock that won't be difficult - lookup works.
10422         ls $DIR/f74a
10423         $LCTL set_param fail_loc=0
10424         rm -f $DIR/f74a
10425         true
10426 }
10427 run_test 74a "ldlm_enqueue freed-export error path, ls (shouldn't LBUG)"
10428
10429 test_74b() { # bug 13310
10430         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10431
10432         #define OBD_FAIL_LDLM_ENQUEUE_OLD_EXPORT 0x30e
10433         #
10434         # very important to OR with CFS_FAIL_ONCE (0x80000000) -- otherwise it
10435         # will spin in a tight reconnection loop
10436         $LCTL set_param fail_loc=0x8000030e
10437         # get a "difficult" lock
10438         touch $DIR/f74b
10439         $LCTL set_param fail_loc=0
10440         rm -f $DIR/f74b
10441         true
10442 }
10443 run_test 74b "ldlm_enqueue freed-export error path, touch (shouldn't LBUG)"
10444
10445 test_74c() {
10446         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10447
10448         #define OBD_FAIL_LDLM_NEW_LOCK
10449         $LCTL set_param fail_loc=0x319
10450         touch $DIR/$tfile && error "touch successful"
10451         $LCTL set_param fail_loc=0
10452         true
10453 }
10454 run_test 74c "ldlm_lock_create error path, (shouldn't LBUG)"
10455
10456 slab_lic=/sys/kernel/slab/lustre_inode_cache
10457 num_objects() {
10458         [ -f $slab_lic/shrink ] && echo 1 > $slab_lic/shrink
10459         [ -f $slab_lic/objects ] && awk '{ print $1 }' $slab_lic/objects ||
10460                 awk '/lustre_inode_cache/ { print $2; exit }' /proc/slabinfo
10461 }
10462
10463 test_76a() { # Now for b=20433, added originally in b=1443
10464         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10465
10466         cancel_lru_locks osc
10467         # there may be some slab objects cached per core
10468         local cpus=$(getconf _NPROCESSORS_ONLN 2>/dev/null)
10469         local before=$(num_objects)
10470         local count=$((512 * cpus))
10471         [ "$SLOW" = "no" ] && count=$((128 * cpus))
10472         local margin=$((count / 10))
10473         if [[ -f $slab_lic/aliases ]]; then
10474                 local aliases=$(cat $slab_lic/aliases)
10475                 (( aliases > 0 )) && margin=$((margin * aliases))
10476         fi
10477
10478         echo "before slab objects: $before"
10479         for i in $(seq $count); do
10480                 touch $DIR/$tfile
10481                 rm -f $DIR/$tfile
10482         done
10483         cancel_lru_locks osc
10484         local after=$(num_objects)
10485         echo "created: $count, after slab objects: $after"
10486         # shared slab counts are not very accurate, allow significant margin
10487         # the main goal is that the cache growth is not permanently > $count
10488         while (( after > before + margin )); do
10489                 sleep 1
10490                 after=$(num_objects)
10491                 wait=$((wait + 1))
10492                 (( wait % 5 == 0 )) && echo "wait $wait seconds objects: $after"
10493                 if (( wait > 60 )); then
10494                         error "inode slab grew from $before+$margin to $after"
10495                 fi
10496         done
10497 }
10498 run_test 76a "confirm clients recycle inodes properly ===="
10499
10500 test_76b() {
10501         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10502         [ $CLIENT_VERSION -ge $(version_code 2.13.55) ] || skip "not supported"
10503
10504         local count=512
10505         local before=$(num_objects)
10506
10507         for i in $(seq $count); do
10508                 mkdir $DIR/$tdir
10509                 rmdir $DIR/$tdir
10510         done
10511
10512         local after=$(num_objects)
10513         local wait=0
10514
10515         while (( after > before )); do
10516                 sleep 1
10517                 after=$(num_objects)
10518                 wait=$((wait + 1))
10519                 (( wait % 5 == 0 )) && echo "wait $wait seconds objects: $after"
10520                 if (( wait > 60 )); then
10521                         error "inode slab grew from $before to $after"
10522                 fi
10523         done
10524
10525         echo "slab objects before: $before, after: $after"
10526 }
10527 run_test 76b "confirm clients recycle directory inodes properly ===="
10528
10529 export ORIG_CSUM=""
10530 set_checksums()
10531 {
10532         # Note: in sptlrpc modes which enable its own bulk checksum, the
10533         # original crc32_le bulk checksum will be automatically disabled,
10534         # and the OBD_FAIL_OSC_CHECKSUM_SEND/OBD_FAIL_OSC_CHECKSUM_RECEIVE
10535         # will be checked by sptlrpc code against sptlrpc bulk checksum.
10536         # In this case set_checksums() will not be no-op, because sptlrpc
10537         # bulk checksum will be enabled all through the test.
10538
10539         [ "$ORIG_CSUM" ] || ORIG_CSUM=`lctl get_param -n osc.*.checksums | head -n1`
10540         lctl set_param -n osc.*.checksums $1
10541         return 0
10542 }
10543
10544 export ORIG_CSUM_TYPE="`lctl get_param -n osc.*osc-[^mM]*.checksum_type |
10545                         sed 's/.*\[\(.*\)\].*/\1/g' | head -n1`"
10546 CKSUM_TYPES=${CKSUM_TYPES:-$(lctl get_param -n osc.*osc-[^mM]*.checksum_type |
10547                              tr -d [] | head -n1)}
10548 set_checksum_type()
10549 {
10550         lctl set_param -n osc.*osc-[^mM]*.checksum_type $1
10551         rc=$?
10552         log "set checksum type to $1, rc = $rc"
10553         return $rc
10554 }
10555
10556 get_osc_checksum_type()
10557 {
10558         # arugment 1: OST name, like OST0000
10559         ost=$1
10560         checksum_type=$(lctl get_param -n osc.*${ost}-osc-[^mM]*.checksum_type |
10561                         sed 's/.*\[\(.*\)\].*/\1/g')
10562         rc=$?
10563         [ $rc -ne 0 ] && error "failed to get checksum type of $ost, rc = $rc, output = $checksum_type"
10564         echo $checksum_type
10565 }
10566
10567 F77_TMP=$TMP/f77-temp
10568 F77SZ=8
10569 setup_f77() {
10570         dd if=/dev/urandom of=$F77_TMP bs=1M count=$F77SZ || \
10571                 error "error writing to $F77_TMP"
10572 }
10573
10574 test_77a() { # bug 10889
10575         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10576         $GSS && skip_env "could not run with gss"
10577
10578         [ ! -f $F77_TMP ] && setup_f77
10579         set_checksums 1
10580         dd if=$F77_TMP of=$DIR/$tfile bs=1M count=$F77SZ || error "dd error"
10581         set_checksums 0
10582         rm -f $DIR/$tfile
10583 }
10584 run_test 77a "normal checksum read/write operation"
10585
10586 test_77b() { # bug 10889
10587         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10588         $GSS && skip_env "could not run with gss"
10589
10590         [ ! -f $F77_TMP ] && setup_f77
10591         #define OBD_FAIL_OSC_CHECKSUM_SEND       0x409
10592         $LCTL set_param fail_loc=0x80000409
10593         set_checksums 1
10594
10595         dd if=$F77_TMP of=$DIR/$tfile bs=1M count=$F77SZ conv=sync ||
10596                 error "dd error: $?"
10597         $LCTL set_param fail_loc=0
10598
10599         for algo in $CKSUM_TYPES; do
10600                 cancel_lru_locks osc
10601                 set_checksum_type $algo
10602                 #define OBD_FAIL_OSC_CHECKSUM_RECEIVE    0x408
10603                 $LCTL set_param fail_loc=0x80000408
10604                 cmp $F77_TMP $DIR/$tfile || error "file compare failed"
10605                 $LCTL set_param fail_loc=0
10606         done
10607         set_checksums 0
10608         set_checksum_type $ORIG_CSUM_TYPE
10609         rm -f $DIR/$tfile
10610 }
10611 run_test 77b "checksum error on client write, read"
10612
10613 cleanup_77c() {
10614         trap 0
10615         set_checksums 0
10616         $LCTL set_param osc.*osc-[^mM]*.checksum_dump=0
10617         $check_ost &&
10618                 do_facet ost1 $LCTL set_param obdfilter.*-OST*.checksum_dump=0
10619         [ -n "$osc_file_prefix" ] && rm -f ${osc_file_prefix}*
10620         $check_ost && [ -n "$ost_file_prefix" ] &&
10621                 do_facet ost1 rm -f ${ost_file_prefix}\*
10622 }
10623
10624 test_77c() {
10625         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10626         $GSS && skip_env "could not run with gss"
10627         remote_ost_nodsh && skip "remote OST with nodsh"
10628
10629         local bad1
10630         local osc_file_prefix
10631         local osc_file
10632         local check_ost=false
10633         local ost_file_prefix
10634         local ost_file
10635         local orig_cksum
10636         local dump_cksum
10637         local fid
10638
10639         # ensure corruption will occur on first OSS/OST
10640         $LFS setstripe -i 0 $DIR/$tfile
10641
10642         [ ! -f $F77_TMP ] && setup_f77
10643         dd if=$F77_TMP of=$DIR/$tfile bs=1M count=$F77SZ conv=sync ||
10644                 error "dd write error: $?"
10645         fid=$($LFS path2fid $DIR/$tfile)
10646
10647         if [ $OST1_VERSION -ge $(version_code 2.9.57) ]
10648         then
10649                 check_ost=true
10650                 ost_file_prefix=$(do_facet ost1 $LCTL get_param -n debug_path)
10651                 ost_file_prefix=${ost_file_prefix}-checksum_dump-ost-\\${fid}
10652         else
10653                 echo "OSS do not support bulk pages dump upon error"
10654         fi
10655
10656         osc_file_prefix=$($LCTL get_param -n debug_path)
10657         osc_file_prefix=${osc_file_prefix}-checksum_dump-osc-\\${fid}
10658
10659         trap cleanup_77c EXIT
10660
10661         set_checksums 1
10662         # enable bulk pages dump upon error on Client
10663         $LCTL set_param osc.*osc-[^mM]*.checksum_dump=1
10664         # enable bulk pages dump upon error on OSS
10665         $check_ost &&
10666                 do_facet ost1 $LCTL set_param obdfilter.*-OST*.checksum_dump=1
10667
10668         # flush Client cache to allow next read to reach OSS
10669         cancel_lru_locks osc
10670
10671         #define OBD_FAIL_OSC_CHECKSUM_RECEIVE       0x408
10672         $LCTL set_param fail_loc=0x80000408
10673         dd if=$DIR/$tfile of=/dev/null bs=1M || error "dd read error: $?"
10674         $LCTL set_param fail_loc=0
10675
10676         rm -f $DIR/$tfile
10677
10678         # check cksum dump on Client
10679         osc_file=$(ls ${osc_file_prefix}*)
10680         [ -n "$osc_file" ] || error "no checksum dump file on Client"
10681         # OBD_FAIL_OSC_CHECKSUM_RECEIVE corrupts with "bad1" at start of file
10682         bad1=$(dd if=$osc_file bs=1 count=4 2>/dev/null) || error "dd error: $?"
10683         [ $bad1 == "bad1" ] || error "unexpected corrupt pattern"
10684         orig_cksum=$(dd if=$F77_TMP bs=1 skip=4 count=1048572 2>/dev/null |
10685                      cksum)
10686         dump_cksum=$(dd if=$osc_file bs=1 skip=4 2>/dev/null | cksum)
10687         [[ "$orig_cksum" == "$dump_cksum" ]] ||
10688                 error "dump content does not match on Client"
10689
10690         $check_ost || skip "No need to check cksum dump on OSS"
10691
10692         # check cksum dump on OSS
10693         ost_file=$(do_facet ost1 ls ${ost_file_prefix}\*)
10694         [ -n "$ost_file" ] || error "no checksum dump file on OSS"
10695         orig_cksum=$(dd if=$F77_TMP bs=1048576 count=1 2>/dev/null | cksum)
10696         dump_cksum=$(do_facet ost1 dd if=$ost_file 2>/dev/null \| cksum)
10697         [[ "$orig_cksum" == "$dump_cksum" ]] ||
10698                 error "dump content does not match on OSS"
10699
10700         cleanup_77c
10701 }
10702 run_test 77c "checksum error on client read with debug"
10703
10704 test_77d() { # bug 10889
10705         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10706         $GSS && skip_env "could not run with gss"
10707
10708         stack_trap "rm -f $DIR/$tfile"
10709         #define OBD_FAIL_OSC_CHECKSUM_SEND       0x409
10710         $LCTL set_param fail_loc=0x80000409
10711         set_checksums 1
10712         $DIRECTIO write $DIR/$tfile 0 $F77SZ $((1024 * 1024)) ||
10713                 error "direct write: rc=$?"
10714         $LCTL set_param fail_loc=0
10715         set_checksums 0
10716
10717         #define OBD_FAIL_OSC_CHECKSUM_RECEIVE    0x408
10718         $LCTL set_param fail_loc=0x80000408
10719         set_checksums 1
10720         cancel_lru_locks osc
10721         $DIRECTIO read $DIR/$tfile 0 $F77SZ $((1024 * 1024)) ||
10722                 error "direct read: rc=$?"
10723         $LCTL set_param fail_loc=0
10724         set_checksums 0
10725 }
10726 run_test 77d "checksum error on OST direct write, read"
10727
10728 test_77f() { # bug 10889
10729         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10730         $GSS && skip_env "could not run with gss"
10731
10732         set_checksums 1
10733         stack_trap "rm -f $DIR/$tfile"
10734         for algo in $CKSUM_TYPES; do
10735                 cancel_lru_locks osc
10736                 set_checksum_type $algo
10737                 #define OBD_FAIL_OSC_CHECKSUM_SEND       0x409
10738                 $LCTL set_param fail_loc=0x409
10739                 $DIRECTIO write $DIR/$tfile 0 $F77SZ $((1024 * 1024)) &&
10740                         error "direct write succeeded"
10741                 $LCTL set_param fail_loc=0
10742         done
10743         set_checksum_type $ORIG_CSUM_TYPE
10744         set_checksums 0
10745 }
10746 run_test 77f "repeat checksum error on write (expect error)"
10747
10748 test_77g() { # bug 10889
10749         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10750         $GSS && skip_env "could not run with gss"
10751         remote_ost_nodsh && skip "remote OST with nodsh"
10752
10753         [ ! -f $F77_TMP ] && setup_f77
10754
10755         local file=$DIR/$tfile
10756         stack_trap "rm -f $file" EXIT
10757
10758         $LFS setstripe -c 1 -i 0 $file
10759         #define OBD_FAIL_OST_CHECKSUM_RECEIVE       0x21a
10760         do_facet ost1 lctl set_param fail_loc=0x8000021a
10761         set_checksums 1
10762         dd if=$F77_TMP of=$file bs=1M count=$F77SZ ||
10763                 error "write error: rc=$?"
10764         do_facet ost1 lctl set_param fail_loc=0
10765         set_checksums 0
10766
10767         cancel_lru_locks osc
10768         #define OBD_FAIL_OST_CHECKSUM_SEND          0x21b
10769         do_facet ost1 lctl set_param fail_loc=0x8000021b
10770         set_checksums 1
10771         cmp $F77_TMP $file || error "file compare failed"
10772         do_facet ost1 lctl set_param fail_loc=0
10773         set_checksums 0
10774 }
10775 run_test 77g "checksum error on OST write, read"
10776
10777 test_77k() { # LU-10906
10778         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10779         $GSS && skip_env "could not run with gss"
10780
10781         local cksum_param="osc.$FSNAME*.checksums"
10782         local get_checksum="$LCTL get_param -n $cksum_param | head -n1"
10783         local checksum
10784         local i
10785
10786         [ "$ORIG_CSUM" ] || ORIG_CSUM=$(eval $get_checksum)
10787         stack_trap "wait_update $HOSTNAME '$get_checksum' $ORIG_CSUM || true"
10788         stack_trap "do_facet mgs $LCTL set_param -P $cksum_param=$ORIG_CSUM"
10789
10790         for i in 0 1; do
10791                 do_facet mgs $LCTL set_param -P $cksum_param=$i ||
10792                         error "failed to set checksum=$i on MGS"
10793                 wait_update $HOSTNAME "$get_checksum" $i
10794                 #remount
10795                 echo "remount client, checksum should be $i"
10796                 remount_client $MOUNT || error "failed to remount client"
10797                 checksum=$(eval $get_checksum)
10798                 [ $checksum -eq $i ] || error "checksum($checksum) != $i"
10799         done
10800         # remove persistent param to avoid races with checksum mountopt below
10801         do_facet mgs $LCTL set_param -P -d $cksum_param ||
10802                 error "failed to delete checksum on MGS"
10803
10804         for opt in "checksum" "nochecksum"; do
10805                 #remount with mount option
10806                 echo "remount client with option $opt, checksum should be $i"
10807                 umount_client $MOUNT || error "failed to umount client"
10808                 mount_client $MOUNT "$MOUNT_OPTS,$opt" ||
10809                         error "failed to mount client with option '$opt'"
10810                 checksum=$(eval $get_checksum)
10811                 [ $checksum -eq $i ] || error "checksum($checksum) != $i"
10812                 i=$((i - 1))
10813         done
10814
10815         remount_client $MOUNT || error "failed to remount client"
10816 }
10817 run_test 77k "enable/disable checksum correctly"
10818
10819 test_77l() {
10820         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10821         $GSS && skip_env "could not run with gss"
10822
10823         set_checksums 1
10824         stack_trap "set_checksums $ORIG_CSUM" EXIT
10825         stack_trap "set_checksum_type $ORIG_CSUM_TYPE" EXIT
10826
10827         set_checksum_type invalid && error "unexpected success of invalid checksum type"
10828
10829         $LFS setstripe -c 1 -i 0 $DIR/$tfile
10830         for algo in $CKSUM_TYPES; do
10831                 set_checksum_type $algo || error "fail to set checksum type $algo"
10832                 osc_algo=$(get_osc_checksum_type OST0000)
10833                 [ "$osc_algo" != "$algo" ] && error "checksum type is $osc_algo after setting it to $algo"
10834
10835                 # no locks, no reqs to let the connection idle
10836                 cancel_lru_locks osc
10837                 lru_resize_disable osc
10838                 wait_osc_import_state client ost1 IDLE
10839
10840                 # ensure ost1 is connected
10841                 stat $DIR/$tfile >/dev/null || error "can't stat"
10842                 wait_osc_import_state client ost1 FULL
10843
10844                 osc_algo=$(get_osc_checksum_type OST0000)
10845                 [ "$osc_algo" != "$algo" ] && error "checksum type changed from $algo to $osc_algo after reconnection"
10846         done
10847         return 0
10848 }
10849 run_test 77l "preferred checksum type is remembered after reconnected"
10850
10851 [ "$ORIG_CSUM" ] && set_checksums $ORIG_CSUM || true
10852 rm -f $F77_TMP
10853 unset F77_TMP
10854
10855 test_77m() {
10856         (( $CLIENT_VERSION >= $(version_code 2.14.52) )) ||
10857                 skip "Need at least version 2.14.52"
10858         local param=checksum_speed
10859
10860         $LCTL get_param $param || error "reading $param failed"
10861
10862         csum_speeds=$($LCTL get_param -n $param)
10863
10864         [[ "$csum_speeds" =~ "adler32" && "$csum_speeds" =~ "crc32" ]] ||
10865                 error "known checksum types are missing"
10866 }
10867 run_test 77m "Verify checksum_speed is correctly read"
10868
10869 check_filefrag_77n() {
10870         local nr_ext=0
10871         local starts=()
10872         local ends=()
10873
10874         while read extidx a b start end rest; do
10875                 if [[ "${extidx}" =~ ^[0-9]+: ]]; then
10876                         nr_ext=$(( $nr_ext + 1 ))
10877                         starts+=( ${start%..} )
10878                         ends+=( ${end%:} )
10879                 fi
10880         done < <( filefrag -sv $1 )
10881
10882         [[ $nr_ext -eq 2 ]] && [[ "${starts[-1]}" == $(( ${ends[0]} + 1 )) ]] && return 0
10883         return 1
10884 }
10885
10886 test_77n() {
10887         [[ "$CKSUM_TYPES" =~ t10 ]] || skip "no T10 checksum support on osc"
10888
10889         touch $DIR/$tfile
10890         $TRUNCATE $DIR/$tfile 0
10891         dd if=/dev/urandom of=$DIR/$tfile bs=4k conv=notrunc count=1 seek=0
10892         dd if=/dev/urandom of=$DIR/$tfile bs=4k conv=notrunc count=1 seek=2
10893         check_filefrag_77n $DIR/$tfile ||
10894                 skip "$tfile blocks not contiguous around hole"
10895
10896         set_checksums 1
10897         stack_trap "set_checksums $ORIG_CSUM" EXIT
10898         stack_trap "set_checksum_type $ORIG_CSUM_TYPE" EXIT
10899         stack_trap "rm -f $DIR/$tfile"
10900
10901         for algo in $CKSUM_TYPES; do
10902                 if [[ "$algo" =~ ^t10 ]]; then
10903                         set_checksum_type $algo ||
10904                                 error "fail to set checksum type $algo"
10905                         dd if=$DIR/$tfile of=/dev/null bs=12k count=1 iflag=direct ||
10906                                 error "fail to read $tfile with $algo"
10907                 fi
10908         done
10909         rm -f $DIR/$tfile
10910         return 0
10911 }
10912 run_test 77n "Verify read from a hole inside contiguous blocks with T10PI"
10913
10914 test_77o() {
10915         (( $MDS1_VERSION >= $(version_code 2.14.55) )) ||
10916                 skip "Need MDS version at least 2.14.55"
10917         (( $OST1_VERSION >= $(version_code 2.14.55) )) ||
10918                 skip "Need OST version at least 2.14.55"
10919         local ofd=obdfilter
10920         local mdt=mdt
10921
10922         # print OST checksum_type
10923         echo "$ofd.$FSNAME-*.checksum_type:"
10924         do_nodes $(comma_list $(osts_nodes)) \
10925                 $LCTL get_param -n $ofd.$FSNAME-*.checksum_type
10926
10927         # print MDT checksum_type
10928         echo "$mdt.$FSNAME-*.checksum_type:"
10929         do_nodes $(comma_list $(mdts_nodes)) \
10930                 $LCTL get_param -n $mdt.$FSNAME-*.checksum_type
10931
10932         local o_count=$(do_nodes $(comma_list $(osts_nodes)) \
10933                    $LCTL get_param -n $ofd.$FSNAME-*.checksum_type | wc -l)
10934
10935         (( $o_count == $OSTCOUNT )) ||
10936                 error "found $o_count checksums, not \$MDSCOUNT=$OSTCOUNT"
10937
10938         local m_count=$(do_nodes $(comma_list $(mdts_nodes)) \
10939                    $LCTL get_param -n $mdt.$FSNAME-*.checksum_type | wc -l)
10940
10941         (( $m_count == $MDSCOUNT )) ||
10942                 error "found $m_count checksums, not \$MDSCOUNT=$MDSCOUNT"
10943 }
10944 run_test 77o "Verify checksum_type for server (mdt and ofd(obdfilter))"
10945
10946 cleanup_test_78() {
10947         trap 0
10948         rm -f $DIR/$tfile
10949 }
10950
10951 test_78() { # bug 10901
10952         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10953         remote_ost || skip_env "local OST"
10954
10955         NSEQ=5
10956         F78SIZE=$(($(awk '/MemFree:/ { print $2 }' /proc/meminfo) / 1024))
10957         echo "MemFree: $F78SIZE, Max file size: $MAXFREE"
10958         MEMTOTAL=$(($(awk '/MemTotal:/ { print $2 }' /proc/meminfo) / 1024))
10959         echo "MemTotal: $MEMTOTAL"
10960
10961         # reserve 256MB of memory for the kernel and other running processes,
10962         # and then take 1/2 of the remaining memory for the read/write buffers.
10963         if [ $MEMTOTAL -gt 512 ] ;then
10964                 MEMTOTAL=$(((MEMTOTAL - 256 ) / 2))
10965         else
10966                 # for those poor memory-starved high-end clusters...
10967                 MEMTOTAL=$((MEMTOTAL / 2))
10968         fi
10969         echo "Mem to use for directio: $MEMTOTAL"
10970
10971         [[ $F78SIZE -gt $MEMTOTAL ]] && F78SIZE=$MEMTOTAL
10972         [[ $F78SIZE -gt 512 ]] && F78SIZE=512
10973         [[ $F78SIZE -gt $((MAXFREE / 1024)) ]] && F78SIZE=$((MAXFREE / 1024))
10974         SMALLESTOST=$($LFS df $DIR | grep OST | awk '{ print $4 }' | sort -n |
10975                 head -n1)
10976         echo "Smallest OST: $SMALLESTOST"
10977         [[ $SMALLESTOST -lt 10240 ]] &&
10978                 skip "too small OSTSIZE, useless to run large O_DIRECT test"
10979
10980         trap cleanup_test_78 EXIT
10981
10982         [[ $F78SIZE -gt $((SMALLESTOST * $OSTCOUNT / 1024 - 80)) ]] &&
10983                 F78SIZE=$((SMALLESTOST * $OSTCOUNT / 1024 - 80))
10984
10985         [ "$SLOW" = "no" ] && NSEQ=1 && [ $F78SIZE -gt 32 ] && F78SIZE=32
10986         echo "File size: $F78SIZE"
10987         $LFS setstripe -c $OSTCOUNT $DIR/$tfile || error "setstripe failed"
10988         for i in $(seq 1 $NSEQ); do
10989                 FSIZE=$(($F78SIZE / ($NSEQ - $i + 1)))
10990                 echo directIO rdwr round $i of $NSEQ
10991                 $DIRECTIO rdwr $DIR/$tfile 0 $FSIZE 1048576||error "rdwr failed"
10992         done
10993
10994         cleanup_test_78
10995 }
10996 run_test 78 "handle large O_DIRECT writes correctly ============"
10997
10998 test_79() { # bug 12743
10999         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11000
11001         wait_delete_completed
11002
11003         BKTOTAL=$(calc_osc_kbytes kbytestotal)
11004         BKFREE=$(calc_osc_kbytes kbytesfree)
11005         BKAVAIL=$(calc_osc_kbytes kbytesavail)
11006
11007         STRING=`df -P $MOUNT | tail -n 1 | awk '{print $2","$3","$4}'`
11008         DFTOTAL=`echo $STRING | cut -d, -f1`
11009         DFUSED=`echo $STRING  | cut -d, -f2`
11010         DFAVAIL=`echo $STRING | cut -d, -f3`
11011         DFFREE=$(($DFTOTAL - $DFUSED))
11012
11013         ALLOWANCE=$((64 * $OSTCOUNT))
11014
11015         if [ $DFTOTAL -lt $(($BKTOTAL - $ALLOWANCE)) ] ||
11016            [ $DFTOTAL -gt $(($BKTOTAL + $ALLOWANCE)) ] ; then
11017                 error "df total($DFTOTAL) mismatch OST total($BKTOTAL)"
11018         fi
11019         if [ $DFFREE -lt $(($BKFREE - $ALLOWANCE)) ] ||
11020            [ $DFFREE -gt $(($BKFREE + $ALLOWANCE)) ] ; then
11021                 error "df free($DFFREE) mismatch OST free($BKFREE)"
11022         fi
11023         if [ $DFAVAIL -lt $(($BKAVAIL - $ALLOWANCE)) ] ||
11024            [ $DFAVAIL -gt $(($BKAVAIL + $ALLOWANCE)) ] ; then
11025                 error "df avail($DFAVAIL) mismatch OST avail($BKAVAIL)"
11026         fi
11027 }
11028 run_test 79 "df report consistency check ======================="
11029
11030 test_80() { # bug 10718
11031         remote_ost_nodsh && skip "remote OST with nodsh"
11032         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11033
11034         # relax strong synchronous semantics for slow backends like ZFS
11035         if [ "$ost1_FSTYPE" != "ldiskfs" ]; then
11036                 local soc="obdfilter.*.sync_lock_cancel"
11037                 local save=$(do_facet ost1 $LCTL get_param -n $soc | head -n1)
11038
11039                 # "sync_on_lock_cancel" was broken by v2_11_55_0-26-g7059644e9a
11040                 if [ -z "$save" ]; then
11041                         soc="obdfilter.*.sync_on_lock_cancel"
11042                         save=$(do_facet ost1 $LCTL get_param -n $soc | head -n1)
11043                 fi
11044
11045                 if [ "$save" != "never" ]; then
11046                         local hosts=$(comma_list $(osts_nodes))
11047
11048                         do_nodes $hosts $LCTL set_param $soc=never
11049                         stack_trap "do_nodes $hosts $LCTL set_param $soc=$save"
11050                 fi
11051         fi
11052
11053         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 seek=1M
11054         sync; sleep 1; sync
11055         local before=$(date +%s)
11056         cancel_lru_locks osc
11057         local after=$(date +%s)
11058         local diff=$((after - before))
11059         [ $diff -le 1 ] || error "elapsed for 1M@1T = $diff"
11060
11061         rm -f $DIR/$tfile
11062 }
11063 run_test 80 "Page eviction is equally fast at high offsets too"
11064
11065 test_81a() { # LU-456
11066         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11067         remote_ost_nodsh && skip "remote OST with nodsh"
11068
11069         # define OBD_FAIL_OST_MAPBLK_ENOSPC    0x228
11070         # MUST OR with the CFS_FAIL_ONCE (0x80000000)
11071         do_facet ost1 lctl set_param fail_loc=0x80000228
11072
11073         # write should trigger a retry and success
11074         $LFS setstripe -i 0 -c 1 $DIR/$tfile
11075         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
11076         RC=$?
11077         if [ $RC -ne 0 ] ; then
11078                 error "write should success, but failed for $RC"
11079         fi
11080 }
11081 run_test 81a "OST should retry write when get -ENOSPC ==============="
11082
11083 test_81b() { # LU-456
11084         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11085         remote_ost_nodsh && skip "remote OST with nodsh"
11086
11087         # define OBD_FAIL_OST_MAPBLK_ENOSPC    0x228
11088         # Don't OR with the CFS_FAIL_ONCE (0x80000000)
11089         do_facet ost1 lctl set_param fail_loc=0x228
11090
11091         # write should retry several times and return -ENOSPC finally
11092         $LFS setstripe -i 0 -c 1 $DIR/$tfile
11093         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
11094         RC=$?
11095         ENOSPC=28
11096         if [ $RC -ne $ENOSPC ] ; then
11097                 error "dd should fail for -ENOSPC, but succeed."
11098         fi
11099 }
11100 run_test 81b "OST should return -ENOSPC when retry still fails ======="
11101
11102 test_99() {
11103         [ -z "$(which cvs 2>/dev/null)" ] && skip_env "could not find cvs"
11104
11105         test_mkdir $DIR/$tdir.cvsroot
11106         chown $RUNAS_ID $DIR/$tdir.cvsroot
11107
11108         cd $TMP
11109         $RUNAS cvs -d $DIR/$tdir.cvsroot init || error "cvs init failed"
11110
11111         cd /etc/init.d
11112         # some versions of cvs import exit(1) when asked to import links or
11113         # files they can't read.  ignore those files.
11114         local toignore=$(find . -type l -printf '-I %f\n' -o \
11115                          ! -perm /4 -printf '-I %f\n')
11116         $RUNAS cvs -d $DIR/$tdir.cvsroot import -m "nomesg" $toignore \
11117                 $tdir.reposname vtag rtag
11118
11119         cd $DIR
11120         test_mkdir $DIR/$tdir.reposname
11121         chown $RUNAS_ID $DIR/$tdir.reposname
11122         $RUNAS cvs -d $DIR/$tdir.cvsroot co $tdir.reposname
11123
11124         cd $DIR/$tdir.reposname
11125         $RUNAS touch foo99
11126         $RUNAS cvs add -m 'addmsg' foo99
11127         $RUNAS cvs update
11128         $RUNAS cvs commit -m 'nomsg' foo99
11129         rm -fr $DIR/$tdir.cvsroot
11130 }
11131 run_test 99 "cvs strange file/directory operations"
11132
11133 test_100() {
11134         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11135         [[ "$NETTYPE" =~ tcp ]] ||
11136                 skip_env "TCP secure port test, not useful for NETTYPE=$NETTYPE"
11137         [[ -n "$(type -p ss)" ]] || skip_env "ss not available"
11138         remote_ost_nodsh && skip "remote OST with nodsh"
11139         remote_mds_nodsh && skip "remote MDS with nodsh"
11140         remote_servers || skip "useless for local single node setup"
11141
11142         ss -tna | ( rc=1; while read STATE SND RCV LOCAL REMOTE STAT; do
11143                 [[ "${REMOTE/*:/}" == "$ACCEPTOR_PORT" ]] || continue
11144
11145                 rc=0
11146                 if (( ${LOCAL/*:/} >= 1024 )); then
11147                         echo "bad: $PROT $SND $RCV $LOCAL $REMOTE $STAT"
11148                         ss -tna
11149                         error "local: ${LOCAL/*:/} > 1024 remote: ${REMOTE/*:/}"
11150                 fi
11151         done
11152         (( $rc == 0 )) || error "privileged port not found" )
11153 }
11154 run_test 100 "check local port using privileged port"
11155
11156 function get_named_value()
11157 {
11158     local tag=$1
11159
11160     grep -w "$tag" | sed "s/^$tag  *\([0-9]*\)  *.*/\1/"
11161 }
11162
11163 test_101a() {
11164         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11165
11166         local s
11167         local discard
11168         local nreads=10000
11169         local cache_limit=32
11170
11171         $LCTL set_param -n osc.*-osc*.rpc_stats=0
11172         $LCTL set_param -n llite.*.read_ahead_stats=0
11173         local max_cached_mb=$($LCTL get_param llite.*.max_cached_mb |
11174                               awk '/^max_cached_mb/ { print $2 }')
11175         stack_trap "$LCTL set_param -n llite.*.max_cached_mb=$max_cached_mb"
11176         $LCTL set_param -n llite.*.max_cached_mb=$cache_limit
11177
11178         #
11179         # randomly read 10000 of 64K chunks from file 3x 32MB in size
11180         #
11181         echo "nreads: $nreads file size: $((cache_limit * 3))MB"
11182         $READS -f $DIR/$tfile -s$((cache_limit * 3192 * 1024)) -b65536 -C -n$nreads -t 180
11183
11184         discard=0
11185         for s in $($LCTL get_param -n llite.*.read_ahead_stats |
11186                    get_named_value 'read.but.discarded'); do
11187                         discard=$(($discard + $s))
11188         done
11189
11190         $LCTL get_param osc.*-osc*.rpc_stats
11191         $LCTL get_param llite.*.read_ahead_stats
11192
11193         # Discard is generally zero, but sometimes a few random reads line up
11194         # and trigger larger readahead, which is wasted & leads to discards.
11195         if [[ $(($discard)) -gt $nreads ]]; then
11196                 error "too many ($discard) discarded pages"
11197         fi
11198         rm -f $DIR/$tfile || true
11199 }
11200 run_test 101a "check read-ahead for random reads"
11201
11202 setup_test101bc() {
11203         test_mkdir $DIR/$tdir
11204         local ssize=$1
11205         local FILE_LENGTH=$2
11206         STRIPE_OFFSET=0
11207
11208         local FILE_SIZE_MB=$((FILE_LENGTH / ssize))
11209
11210         local list=$(comma_list $(osts_nodes))
11211         set_osd_param $list '' read_cache_enable 0
11212         set_osd_param $list '' writethrough_cache_enable 0
11213
11214         trap cleanup_test101bc EXIT
11215         # prepare the read-ahead file
11216         $LFS setstripe -S $ssize -i $STRIPE_OFFSET -c $OSTCOUNT $DIR/$tfile
11217
11218         dd if=/dev/zero of=$DIR/$tfile bs=$ssize \
11219                                 count=$FILE_SIZE_MB 2> /dev/null
11220
11221 }
11222
11223 cleanup_test101bc() {
11224         trap 0
11225         rm -rf $DIR/$tdir
11226         rm -f $DIR/$tfile
11227
11228         local list=$(comma_list $(osts_nodes))
11229         set_osd_param $list '' read_cache_enable 1
11230         set_osd_param $list '' writethrough_cache_enable 1
11231 }
11232
11233 calc_total() {
11234         awk 'BEGIN{total=0}; {total+=$1}; END{print total}'
11235 }
11236
11237 ra_check_101() {
11238         local read_size=$1
11239         local stripe_size=$2
11240         local stride_length=$((stripe_size / read_size))
11241         local stride_width=$((stride_length * OSTCOUNT))
11242         local discard_limit=$(( ((stride_length - 1) * 3 / stride_width) *
11243                                 (stride_width - stride_length) ))
11244         local discard=$($LCTL get_param -n llite.*.read_ahead_stats |
11245                   get_named_value 'read.but.discarded' | calc_total)
11246
11247         if [[ $discard -gt $discard_limit ]]; then
11248                 $LCTL get_param llite.*.read_ahead_stats
11249                 error "($discard limit ${discard_limit}) discarded pages with size (${read_size})"
11250         else
11251                 echo "Read-ahead success for size ${read_size}"
11252         fi
11253 }
11254
11255 test_101b() {
11256         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11257         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11258
11259         local STRIPE_SIZE=1048576
11260         local STRIDE_SIZE=$((STRIPE_SIZE*OSTCOUNT))
11261
11262         if [ $SLOW == "yes" ]; then
11263                 local FILE_LENGTH=$((STRIDE_SIZE * 64))
11264         else
11265                 local FILE_LENGTH=$((STRIDE_SIZE * 8))
11266         fi
11267
11268         local ITERATION=$((FILE_LENGTH / STRIDE_SIZE))
11269
11270         # prepare the read-ahead file
11271         setup_test101bc $STRIPE_SIZE $FILE_LENGTH
11272         cancel_lru_locks osc
11273         for BIDX in 2 4 8 16 32 64 128 256
11274         do
11275                 local BSIZE=$((BIDX*4096))
11276                 local READ_COUNT=$((STRIPE_SIZE/BSIZE))
11277                 local STRIDE_LENGTH=$((STRIDE_SIZE/BSIZE))
11278                 local OFFSET=$((STRIPE_SIZE/BSIZE*(OSTCOUNT - 1)))
11279                 $LCTL set_param -n llite.*.read_ahead_stats=0
11280                 $READS -f $DIR/$tfile  -l $STRIDE_LENGTH -o $OFFSET \
11281                               -s $FILE_LENGTH -b $STRIPE_SIZE -a $READ_COUNT -n $ITERATION
11282                 cancel_lru_locks osc
11283                 ra_check_101 $BSIZE $STRIPE_SIZE $FILE_LENGTH
11284         done
11285         cleanup_test101bc
11286         true
11287 }
11288 run_test 101b "check stride-io mode read-ahead ================="
11289
11290 test_101c() {
11291         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11292
11293         local STRIPE_SIZE=1048576
11294         local FILE_LENGTH=$((STRIPE_SIZE*100))
11295         local nreads=10000
11296         local rsize=65536
11297         local osc_rpc_stats
11298
11299         setup_test101bc $STRIPE_SIZE $FILE_LENGTH
11300
11301         cancel_lru_locks osc
11302         $LCTL set_param osc.*.rpc_stats=0
11303         $READS -f $DIR/$tfile -s$FILE_LENGTH -b$rsize -n$nreads -t 180
11304         $LCTL get_param osc.*.rpc_stats
11305         for osc_rpc_stats in $($LCTL get_param -N osc.*.rpc_stats); do
11306                 local stats=$($LCTL get_param -n $osc_rpc_stats)
11307                 local lines=$(echo "$stats" | awk 'END {print NR;}')
11308                 local size
11309
11310                 if [ $lines -le 20 ]; then
11311                         echo "continue debug"
11312                         continue
11313                 fi
11314                 for size in 1 2 4 8; do
11315                         local rpc=$(echo "$stats" |
11316                                     awk '($1 == "'$size':") {print $2; exit; }')
11317                         [ $rpc != 0 ] && ((size * PAGE_SIZE < rsize)) &&
11318                                 error "Small $((size*PAGE_SIZE)) read IO $rpc!"
11319                 done
11320                 echo "$osc_rpc_stats check passed!"
11321         done
11322         cleanup_test101bc
11323         true
11324 }
11325 run_test 101c "check stripe_size aligned read-ahead"
11326
11327 test_101d() {
11328         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11329
11330         local file=$DIR/$tfile
11331         local sz_MB=${FILESIZE_101d:-80}
11332         local ra_MB=${READAHEAD_MB:-40}
11333
11334         local free_MB=$(($(df -P $DIR | tail -n 1 | awk '{ print $4 }') / 1024))
11335         [ $free_MB -lt $sz_MB ] &&
11336                 skip "Need free space ${sz_MB}M, have ${free_MB}M"
11337
11338         echo "Create test file $file size ${sz_MB}M, ${free_MB}M free"
11339         $LFS setstripe -c -1 $file || error "setstripe failed"
11340
11341         dd if=/dev/zero of=$file bs=1M count=$sz_MB || error "dd failed"
11342         echo Cancel LRU locks on lustre client to flush the client cache
11343         cancel_lru_locks osc
11344
11345         echo Disable read-ahead
11346         local old_RA=$($LCTL get_param -n llite.*.max_read_ahead_mb | head -n 1)
11347         $LCTL set_param -n llite.*.max_read_ahead_mb=0
11348         stack_trap "$LCTL set_param -n llite.*.max_read_ahead_mb=$old_RA" EXIT
11349         $LCTL get_param -n llite.*.max_read_ahead_mb
11350
11351         echo "Reading the test file $file with read-ahead disabled"
11352         local sz_KB=$((sz_MB * 1024 / 4))
11353         # 10485760 bytes transferred in 0.000938 secs (11179579337 bytes/sec)
11354         # 104857600 bytes (105 MB) copied, 0.00876352 s, 12.0 GB/s
11355         local raOFF=$(LANG=C dd if=$file of=/dev/null bs=4k count=$sz_KB |&
11356                       sed -e '/records/d' -e 's/.* \([0-9]*\.[0-9]*\) *s.*/\1/')
11357
11358         echo "Cancel LRU locks on lustre client to flush the client cache"
11359         cancel_lru_locks osc
11360         echo Enable read-ahead with ${ra_MB}MB
11361         $LCTL set_param -n llite.*.max_read_ahead_mb=$ra_MB
11362
11363         echo "Reading the test file $file with read-ahead enabled"
11364         local raON=$(LANG=C dd if=$file of=/dev/null bs=4k count=$sz_KB |&
11365                      sed -e '/records/d' -e 's/.* \([0-9]*\.[0-9]*\) *s.*/\1/')
11366
11367         echo "read-ahead disabled time read $raOFF"
11368         echo "read-ahead enabled time read $raON"
11369
11370         rm -f $file
11371         wait_delete_completed
11372
11373         # use awk for this check instead of bash because it handles decimals
11374         awk "{ exit !($raOFF < 1.0 || $raOFF > $raON) }" <<<"ignore_me" ||
11375                 error "readahead ${raON}s > no-readahead ${raOFF}s ${sz_MB}M"
11376 }
11377 run_test 101d "file read with and without read-ahead enabled"
11378
11379 test_101e() {
11380         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11381
11382         local file=$DIR/$tfile
11383         local size_KB=500  #KB
11384         local count=100
11385         local bsize=1024
11386
11387         local free_KB=$(df -P $DIR | tail -n 1 | awk '{ print $4 }')
11388         local need_KB=$((count * size_KB))
11389         [[ $free_KB -le $need_KB ]] &&
11390                 skip_env "Need free space $need_KB, have $free_KB"
11391
11392         echo "Creating $count ${size_KB}K test files"
11393         for ((i = 0; i < $count; i++)); do
11394                 dd if=/dev/zero of=$file.$i bs=$bsize count=$size_KB 2>/dev/null
11395         done
11396
11397         echo "Cancel LRU locks on lustre client to flush the client cache"
11398         cancel_lru_locks $OSC
11399
11400         echo "Reset readahead stats"
11401         $LCTL set_param -n llite.*.read_ahead_stats=0
11402
11403         for ((i = 0; i < $count; i++)); do
11404                 dd if=$file.$i of=/dev/null bs=$bsize count=$size_KB 2>/dev/null
11405         done
11406
11407         $LCTL get_param llite.*.max_cached_mb
11408         $LCTL get_param llite.*.read_ahead_stats
11409         local miss=$($LCTL get_param -n llite.*.read_ahead_stats |
11410                      get_named_value 'misses' | calc_total)
11411
11412         for ((i = 0; i < $count; i++)); do
11413                 rm -rf $file.$i 2>/dev/null
11414         done
11415
11416         #10000 means 20% reads are missing in readahead
11417         [[ $miss -lt 10000 ]] ||  error "misses too much for small reads"
11418 }
11419 run_test 101e "check read-ahead for small read(1k) for small files(500k)"
11420
11421 test_101f() {
11422         which iozone || skip_env "no iozone installed"
11423
11424         local old_debug=$($LCTL get_param debug)
11425         old_debug=${old_debug#*=}
11426         $LCTL set_param debug="reada mmap"
11427
11428         # create a test file
11429         iozone -i 0 -+n -r 1m -s 128m -w -f $DIR/$tfile > /dev/null 2>&1
11430
11431         echo Cancel LRU locks on lustre client to flush the client cache
11432         cancel_lru_locks osc
11433
11434         echo Reset readahead stats
11435         $LCTL set_param -n llite.*.read_ahead_stats=0
11436
11437         echo mmap read the file with small block size
11438         iozone -i 1 -u 1 -l 1 -+n -r 32k -s 128m -B -f $DIR/$tfile \
11439                 > /dev/null 2>&1
11440
11441         echo checking missing pages
11442         $LCTL get_param llite.*.read_ahead_stats
11443         local miss=$($LCTL get_param -n llite.*.read_ahead_stats |
11444                         get_named_value 'misses' | calc_total)
11445
11446         $LCTL set_param debug="$old_debug"
11447         [ $miss -lt 3 ] || error "misses too much pages ('$miss')!"
11448         rm -f $DIR/$tfile
11449 }
11450 run_test 101f "check mmap read performance"
11451
11452 test_101g_brw_size_test() {
11453         local mb=$1
11454         local pages=$((mb * 1048576 / PAGE_SIZE))
11455         local file=$DIR/$tfile
11456
11457         $LCTL set_param osc.*.max_pages_per_rpc=${mb}M ||
11458                 { error "unable to set max_pages_per_rpc=${mb}M"; return 1; }
11459         for mp in $($LCTL get_param -n osc.*.max_pages_per_rpc); do
11460                 [ $mp -ne $pages ] && error "max_pages_per_rpc $mp != $pages" &&
11461                         return 2
11462         done
11463
11464         stack_trap "rm -f $file" EXIT
11465         $LCTL set_param -n osc.*.rpc_stats=0
11466
11467         # 10 RPCs should be enough for the test
11468         local count=10
11469         dd if=/dev/zero of=$file bs=${mb}M count=$count ||
11470                 { error "dd write ${mb} MB blocks failed"; return 3; }
11471         cancel_lru_locks osc
11472         dd of=/dev/null if=$file bs=${mb}M count=$count ||
11473                 { error "dd write ${mb} MB blocks failed"; return 4; }
11474
11475         # calculate number of full-sized read and write RPCs
11476         rpcs=($($LCTL get_param -n 'osc.*.rpc_stats' |
11477                 sed -n '/pages per rpc/,/^$/p' |
11478                 awk '/'$pages':/ { reads += $2; writes += $6 }; \
11479                 END { print reads,writes }'))
11480         # allow one extra full-sized read RPC for async readahead
11481         [[ ${rpcs[0]} == $count || ${rpcs[0]} == $((count + 1)) ]] ||
11482                 { error "${rpcs[0]} != $count read RPCs"; return 5; }
11483         [[ ${rpcs[1]} == $count ]] ||
11484                 { error "${rpcs[1]} != $count write RPCs"; return 6; }
11485 }
11486
11487 test_101g() {
11488         remote_ost_nodsh && skip "remote OST with nodsh"
11489
11490         local rpcs
11491         local osts=$(get_facets OST)
11492         local list=$(comma_list $(osts_nodes))
11493         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
11494         local brw_size="obdfilter.*.brw_size"
11495
11496         $LFS setstripe -i 0 -c 1 $DIR/$tfile
11497
11498         local orig_mb=$(do_facet ost1 $LCTL get_param -n $brw_size | head -n 1)
11499
11500         if { [ $OST1_VERSION -ge $(version_code 2.8.52) ] ||
11501                 { [ $OST1_VERSION -ge $(version_code 2.7.17) ] &&
11502                   [ $OST1_VERSION -lt $(version_code 2.7.50) ]; }; } &&
11503            { [ $CLIENT_VERSION -ge $(version_code 2.8.52) ] ||
11504                 { [ $CLIENT_VERSION -ge $(version_code 2.7.17) ] &&
11505                   [ $CLIENT_VERSION -lt $(version_code 2.7.50) ]; }; }; then
11506
11507                 [ $OST1_VERSION -ge $(version_code 2.9.52) ] &&
11508                         suffix="M"
11509
11510                 if [[ $orig_mb -lt 16 ]]; then
11511                         save_lustre_params $osts "$brw_size" > $p
11512                         do_nodes $list $LCTL set_param -n $brw_size=16$suffix ||
11513                                 error "set 16MB RPC size failed"
11514
11515                         echo "remount client to enable new RPC size"
11516                         remount_client $MOUNT || error "remount_client failed"
11517                 fi
11518
11519                 test_101g_brw_size_test 16 || error "16MB RPC test failed"
11520                 # should be able to set brw_size=12, but no rpc_stats for that
11521                 test_101g_brw_size_test 8 || error "8MB RPC test failed"
11522         fi
11523
11524         test_101g_brw_size_test 4 || error "4MB RPC test failed"
11525
11526         if [[ $orig_mb -lt 16 ]]; then
11527                 restore_lustre_params < $p
11528                 remount_client $MOUNT || error "remount_client restore failed"
11529         fi
11530
11531         rm -f $p $DIR/$tfile
11532 }
11533 run_test 101g "Big bulk(4/16 MiB) readahead"
11534
11535 test_101h() {
11536         $LFS setstripe -i 0 -c 1 $DIR/$tfile
11537
11538         dd if=/dev/zero of=$DIR/$tfile bs=1M count=70 ||
11539                 error "dd 70M file failed"
11540         echo Cancel LRU locks on lustre client to flush the client cache
11541         cancel_lru_locks osc
11542
11543         echo "Reset readahead stats"
11544         $LCTL set_param -n llite.*.read_ahead_stats 0
11545
11546         echo "Read 10M of data but cross 64M bundary"
11547         dd if=$DIR/$tfile of=/dev/null bs=10M skip=6 count=1
11548         local miss=$($LCTL get_param -n llite.*.read_ahead_stats |
11549                      get_named_value 'misses' | calc_total)
11550         [ $miss -eq 1 ] || error "expected miss 1 but got $miss"
11551         rm -f $p $DIR/$tfile
11552 }
11553 run_test 101h "Readahead should cover current read window"
11554
11555 test_101i() {
11556         dd if=/dev/zero of=$DIR/$tfile bs=1M count=10 ||
11557                 error "dd 10M file failed"
11558
11559         local max_per_file_mb=$($LCTL get_param -n \
11560                 llite.*.max_read_ahead_per_file_mb 2>/dev/null)
11561         cancel_lru_locks osc
11562         stack_trap "$LCTL set_param llite.*.max_read_ahead_per_file_mb=$max_per_file_mb"
11563         $LCTL set_param llite.*.max_read_ahead_per_file_mb=1 ||
11564                 error "set max_read_ahead_per_file_mb to 1 failed"
11565
11566         echo "Reset readahead stats"
11567         $LCTL set_param llite.*.read_ahead_stats=0
11568
11569         dd if=$DIR/$tfile of=/dev/null bs=2M
11570
11571         $LCTL get_param llite.*.read_ahead_stats
11572         local miss=$($LCTL get_param -n llite.*.read_ahead_stats |
11573                      awk '/misses/ { print $2 }')
11574         [ $miss -eq 5 ] || error "expected misses 5 but got $miss"
11575         rm -f $DIR/$tfile
11576 }
11577 run_test 101i "allow current readahead to exceed reservation"
11578
11579 test_101j() {
11580         $LFS setstripe -i 0 -c 1 $DIR/$tfile ||
11581                 error "setstripe $DIR/$tfile failed"
11582         local file_size=$((1048576 * 16))
11583         local old_ra=$($LCTL get_param -n llite.*.max_read_ahead_mb | head -n 1)
11584         stack_trap "$LCTL set_param -n llite.*.max_read_ahead_mb $old_ra" EXIT
11585
11586         echo Disable read-ahead
11587         $LCTL set_param -n llite.*.max_read_ahead_mb=0
11588
11589         dd if=/dev/zero of=$DIR/$tfile bs=1M count=$(($file_size / 1048576))
11590         for blk in $PAGE_SIZE 1048576 $file_size; do
11591                 cancel_lru_locks osc
11592                 echo "Reset readahead stats"
11593                 $LCTL set_param -n llite.*.read_ahead_stats=0
11594                 local count=$(($file_size / $blk))
11595                 dd if=$DIR/$tfile bs=$blk count=$count of=/dev/null
11596                 local miss=$($LCTL get_param -n llite.*.read_ahead_stats |
11597                              get_named_value 'failed.to.fast.read' | calc_total)
11598                 $LCTL get_param -n llite.*.read_ahead_stats
11599                 [ $miss -eq $count ] || error "expected $count got $miss"
11600         done
11601
11602         rm -f $p $DIR/$tfile
11603 }
11604 run_test 101j "A complete read block should be submitted when no RA"
11605
11606 test_readahead_base() {
11607         local file=$DIR/$tfile
11608         local size=$1
11609         local iosz
11610         local ramax
11611         local ranum
11612
11613         $LCTL set_param -n llite.*.read_ahead_stats=0
11614         # The first page is not accounted into readahead
11615         ramax=$(((size + PAGE_SIZE - 1) / PAGE_SIZE - 1))
11616         iosz=$(((size + 1048575) / 1048576 * 1048576))
11617         echo "Test readahead: size=$size ramax=$ramx iosz=$iosz"
11618
11619         $LCTL mark  "Test readahead: size=$size ramax=$ramx iosz=$iosz"
11620         fallocate -l $size $file || error "failed to fallocate $file"
11621         cancel_lru_locks osc
11622         $MULTIOP $file or${iosz}c || error "failed to read $file"
11623         $LCTL get_param -n llite.*.read_ahead_stats
11624         ranum=$($LCTL get_param -n llite.*.read_ahead_stats |
11625                 awk '/readahead.pages/ { print $7 }' | calc_total)
11626         (( $ranum <= $ramax )) ||
11627                 error "read-ahead pages is $ranum more than $ramax"
11628         rm -rf $file || error "failed to remove $file"
11629 }
11630
11631 test_101m()
11632 {
11633         local file=$DIR/$tfile
11634         local ramax
11635         local ranum
11636         local size
11637         local iosz
11638
11639         check_set_fallocate_or_skip
11640         stack_trap "rm -f $file" EXIT
11641
11642         test_readahead_base 4096
11643
11644         # file size: 16K = 16384
11645         test_readahead_base 16384
11646         test_readahead_base 16385
11647         test_readahead_base 16383
11648
11649         # file size: 1M + 1 = 1048576 + 1
11650         test_readahead_base 1048577
11651         # file size: 1M + 16K
11652         test_readahead_base $((1048576 + 16384))
11653
11654         # file size: stripe_size * (stripe_count - 1) + 16K
11655         $LFS setstripe -c -1 $file || error "failed to setstripe $file"
11656         test_readahead_base $((1048576 * (OSTCOUNT - 1) + 16384))
11657         # file size: stripe_size * stripe_count + 16K
11658         $LFS setstripe -c -1 $file || error "failed to setstripe $file"
11659         test_readahead_base $((1048576 * OSTCOUNT + 16384))
11660         # file size: 2 * stripe_size * stripe_count + 16K
11661         $LFS setstripe -c -1 $file || error "failed to setstripe $file"
11662         test_readahead_base $((2 * 1048576 * OSTCOUNT + 16384))
11663 }
11664 run_test 101m "read ahead for small file and last stripe of the file"
11665
11666 setup_test102() {
11667         test_mkdir $DIR/$tdir
11668         chown $RUNAS_ID $DIR/$tdir
11669         STRIPE_SIZE=65536
11670         STRIPE_OFFSET=1
11671         STRIPE_COUNT=$OSTCOUNT
11672         [[ $OSTCOUNT -gt 4 ]] && STRIPE_COUNT=4
11673
11674         trap cleanup_test102 EXIT
11675         cd $DIR
11676         $1 $LFS setstripe -S $STRIPE_SIZE -i $STRIPE_OFFSET -c $STRIPE_COUNT $tdir
11677         cd $DIR/$tdir
11678         for num in 1 2 3 4; do
11679                 for count in $(seq 1 $STRIPE_COUNT); do
11680                         for idx in $(seq 0 $[$STRIPE_COUNT - 1]); do
11681                                 local size=`expr $STRIPE_SIZE \* $num`
11682                                 local file=file"$num-$idx-$count"
11683                                 $1 $LFS setstripe -S $size -i $idx -c $count $file
11684                         done
11685                 done
11686         done
11687
11688         cd $DIR
11689         $1 tar cf $TMP/f102.tar $tdir --xattrs
11690 }
11691
11692 cleanup_test102() {
11693         trap 0
11694         rm -f $TMP/f102.tar
11695         rm -rf $DIR/d0.sanity/d102
11696 }
11697
11698 test_102a() {
11699         [ "$UID" != 0 ] && skip "must run as root"
11700         [ -z "$(lctl get_param -n mdc.*-mdc-*.connect_flags | grep xattr)" ] &&
11701                 skip_env "must have user_xattr"
11702
11703         [ -z "$(which setfattr 2>/dev/null)" ] &&
11704                 skip_env "could not find setfattr"
11705
11706         local testfile=$DIR/$tfile
11707
11708         touch $testfile
11709         echo "set/get xattr..."
11710         setfattr -n trusted.name1 -v value1 $testfile ||
11711                 error "setfattr -n trusted.name1=value1 $testfile failed"
11712         getfattr -n trusted.name1 $testfile 2> /dev/null |
11713           grep "trusted.name1=.value1" ||
11714                 error "$testfile missing trusted.name1=value1"
11715
11716         setfattr -n user.author1 -v author1 $testfile ||
11717                 error "setfattr -n user.author1=author1 $testfile failed"
11718         getfattr -n user.author1 $testfile 2> /dev/null |
11719           grep "user.author1=.author1" ||
11720                 error "$testfile missing trusted.author1=author1"
11721
11722         echo "listxattr..."
11723         setfattr -n trusted.name2 -v value2 $testfile ||
11724                 error "$testfile unable to set trusted.name2"
11725         setfattr -n trusted.name3 -v value3 $testfile ||
11726                 error "$testfile unable to set trusted.name3"
11727         [ $(getfattr -d -m "^trusted" $testfile 2> /dev/null |
11728             grep "trusted.name" | wc -l) -eq 3 ] ||
11729                 error "$testfile missing 3 trusted.name xattrs"
11730
11731         setfattr -n user.author2 -v author2 $testfile ||
11732                 error "$testfile unable to set user.author2"
11733         setfattr -n user.author3 -v author3 $testfile ||
11734                 error "$testfile unable to set user.author3"
11735         [ $(getfattr -d -m "^user" $testfile 2> /dev/null |
11736             grep "user.author" | wc -l) -eq 3 ] ||
11737                 error "$testfile missing 3 user.author xattrs"
11738
11739         echo "remove xattr..."
11740         setfattr -x trusted.name1 $testfile ||
11741                 error "$testfile error deleting trusted.name1"
11742         getfattr -d -m trusted $testfile 2> /dev/null | grep "trusted.name1" &&
11743                 error "$testfile did not delete trusted.name1 xattr"
11744
11745         setfattr -x user.author1 $testfile ||
11746                 error "$testfile error deleting user.author1"
11747         echo "set lustre special xattr ..."
11748         $LFS setstripe -c1 $testfile
11749         local lovea=$(getfattr -n "trusted.lov" -e hex $testfile |
11750                 awk -F "=" '/trusted.lov/ { print $2 }' )
11751         setfattr -n "trusted.lov" -v $lovea $testfile ||
11752                 error "$testfile doesn't ignore setting trusted.lov again"
11753         setfattr -n "trusted.lov" -v "invalid_value" $testfile &&
11754                 error "$testfile allow setting invalid trusted.lov"
11755         rm -f $testfile
11756 }
11757 run_test 102a "user xattr test =================================="
11758
11759 check_102b_layout() {
11760         local layout="$*"
11761         local testfile=$DIR/$tfile
11762
11763         echo "test layout '$layout'"
11764         $LFS setstripe $layout $testfile || error "setstripe failed"
11765         $LFS getstripe -y $testfile
11766
11767         echo "get/set/list trusted.lov xattr ..." # b=10930
11768         local value=$(getfattr -n trusted.lov -e hex $testfile | grep trusted)
11769         [[ "$value" =~ "trusted.lov" ]] ||
11770                 error "can't get trusted.lov from $testfile"
11771         local stripe_count_orig=$($LFS getstripe -c $testfile) ||
11772                 error "getstripe failed"
11773
11774         $MCREATE $testfile.2 || error "mcreate $testfile.2 failed"
11775
11776         value=$(cut -d= -f2 <<<$value)
11777         # LU-13168: truncated xattr should fail if short lov_user_md header
11778         [ $CLIENT_VERSION -lt $(version_code 2.13.53) ] &&
11779                 lens="${#value}" || lens="$(seq 4 2 ${#value})"
11780         for len in $lens; do
11781                 echo "setfattr $len $testfile.2"
11782                 setfattr -n trusted.lov -v ${value:0:$len} $testfile.2 &&
11783                         [ $len -lt 66 ] && error "short xattr len=$len worked"
11784         done
11785         local stripe_size=$($LFS getstripe -S $testfile.2)
11786         local stripe_count=$($LFS getstripe -c $testfile.2)
11787         [[ $stripe_size -eq 65536 ]] ||
11788                 error "stripe size $stripe_size != 65536"
11789         [[ $stripe_count -eq $stripe_count_orig ]] ||
11790                 error "stripe count $stripe_count != $stripe_count_orig"
11791         rm $testfile $testfile.2
11792 }
11793
11794 test_102b() {
11795         [ -z "$(which setfattr 2>/dev/null)" ] &&
11796                 skip_env "could not find setfattr"
11797         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11798
11799         # check plain layout
11800         check_102b_layout -S 65536 -i 1 -c $OSTCOUNT
11801
11802         # and also check composite layout
11803         check_102b_layout -E 1M -S 65536 -i 1 -c $OSTCOUNT -Eeof -S4M
11804
11805 }
11806 run_test 102b "getfattr/setfattr for trusted.lov EAs"
11807
11808 test_102c() {
11809         [ -z "$(which setfattr 2>/dev/null)" ] &&
11810                 skip_env "could not find setfattr"
11811         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11812
11813         # b10930: get/set/list lustre.lov xattr
11814         echo "get/set/list lustre.lov xattr ..."
11815         test_mkdir $DIR/$tdir
11816         chown $RUNAS_ID $DIR/$tdir
11817         local testfile=$DIR/$tdir/$tfile
11818         $RUNAS $LFS setstripe -S 65536 -i 1 -c $OSTCOUNT $testfile ||
11819                 error "setstripe failed"
11820         local STRIPECOUNT=$($RUNAS $LFS getstripe -c $testfile) ||
11821                 error "getstripe failed"
11822         $RUNAS getfattr -d -m "^lustre" $testfile 2> /dev/null | \
11823         grep "lustre.lov" || error "can't get lustre.lov from $testfile"
11824
11825         local testfile2=${testfile}2
11826         local value=`getfattr -n lustre.lov $testfile 2> /dev/null | \
11827                      grep "lustre.lov" |sed -e 's/[^=]\+=//'  `
11828
11829         $RUNAS $MCREATE $testfile2
11830         $RUNAS setfattr -n lustre.lov -v $value $testfile2
11831         local stripe_size=$($RUNAS $LFS getstripe -S $testfile2)
11832         local stripe_count=$($RUNAS $LFS getstripe -c $testfile2)
11833         [ $stripe_size -eq 65536 ] || error "stripe size $stripe_size != 65536"
11834         [ $stripe_count -eq $STRIPECOUNT ] ||
11835                 error "stripe count $stripe_count != $STRIPECOUNT"
11836 }
11837 run_test 102c "non-root getfattr/setfattr for lustre.lov EAs ==========="
11838
11839 compare_stripe_info1() {
11840         local stripe_index_all_zero=true
11841
11842         for num in 1 2 3 4; do
11843                 for count in $(seq 1 $STRIPE_COUNT); do
11844                         for offset in $(seq 0 $[$STRIPE_COUNT - 1]); do
11845                                 local size=$((STRIPE_SIZE * num))
11846                                 local file=file"$num-$offset-$count"
11847                                 stripe_size=$($LFS getstripe -S $PWD/$file)
11848                                 [[ $stripe_size -ne $size ]] &&
11849                                     error "$file: size $stripe_size != $size"
11850                                 stripe_count=$($LFS getstripe -c $PWD/$file)
11851                                 # allow fewer stripes to be created, ORI-601
11852                                 [[ $stripe_count -lt $(((3 * count + 3) / 4)) ]] &&
11853                                     error "$file: count $stripe_count != $count"
11854                                 stripe_index=$($LFS getstripe -i $PWD/$file)
11855                                 [[ $stripe_index -ne 0 ]] &&
11856                                         stripe_index_all_zero=false
11857                         done
11858                 done
11859         done
11860         $stripe_index_all_zero &&
11861                 error "all files are being extracted starting from OST index 0"
11862         return 0
11863 }
11864
11865 have_xattrs_include() {
11866         tar --help | grep -q xattrs-include &&
11867                 echo --xattrs-include="lustre.*"
11868 }
11869
11870 test_102d() {
11871         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11872         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11873
11874         XINC=$(have_xattrs_include)
11875         setup_test102
11876         tar xf $TMP/f102.tar -C $DIR/$tdir --xattrs $XINC
11877         cd $DIR/$tdir/$tdir
11878         compare_stripe_info1
11879 }
11880 run_test 102d "tar restore stripe info from tarfile,not keep osts"
11881
11882 test_102f() {
11883         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11884         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11885
11886         XINC=$(have_xattrs_include)
11887         setup_test102
11888         test_mkdir $DIR/$tdir.restore
11889         cd $DIR
11890         tar cf - --xattrs $tdir | tar xf - \
11891                 -C $DIR/$tdir.restore --xattrs $XINC
11892         cd $DIR/$tdir.restore/$tdir
11893         compare_stripe_info1
11894 }
11895 run_test 102f "tar copy files, not keep osts"
11896
11897 grow_xattr() {
11898         [ -z "$(lctl get_param -n mdc.*.connect_flags | grep xattr)" ] &&
11899                 skip "must have user_xattr"
11900         [ -z "$(which setfattr 2>/dev/null)" ] &&
11901                 skip_env "could not find setfattr"
11902         [ -z "$(which getfattr 2>/dev/null)" ] &&
11903                 skip_env "could not find getfattr"
11904
11905         local xsize=${1:-1024}  # in bytes
11906         local file=$DIR/$tfile
11907         local value="$(generate_string $xsize)"
11908         local xbig=trusted.big
11909         local toobig=$2
11910
11911         touch $file
11912         log "save $xbig on $file"
11913         if [ -z "$toobig" ]
11914         then
11915                 setfattr -n $xbig -v $value $file ||
11916                         error "saving $xbig on $file failed"
11917         else
11918                 setfattr -n $xbig -v $value $file &&
11919                         error "saving $xbig on $file succeeded"
11920                 return 0
11921         fi
11922
11923         local orig=$(get_xattr_value $xbig $file)
11924         [[ "$orig" != "$value" ]] && error "$xbig different after saving $xbig"
11925
11926         local xsml=trusted.sml
11927         log "save $xsml on $file"
11928         setfattr -n $xsml -v val $file || error "saving $xsml on $file failed"
11929
11930         local new=$(get_xattr_value $xbig $file)
11931         [[ "$new" != "$orig" ]] && error "$xbig different after saving $xsml"
11932
11933         log "grow $xsml on $file"
11934         setfattr -n $xsml -v "$value" $file ||
11935                 error "growing $xsml on $file failed"
11936
11937         new=$(get_xattr_value $xbig $file)
11938         [[ "$new" != "$orig" ]] && error "$xbig different after growing $xsml"
11939         log "$xbig still valid after growing $xsml"
11940
11941         rm -f $file
11942 }
11943
11944 test_102h() { # bug 15777
11945         grow_xattr 1024
11946 }
11947 run_test 102h "grow xattr from inside inode to external block"
11948
11949 test_102ha() {
11950         large_xattr_enabled || skip_env "ea_inode feature disabled"
11951
11952         echo "setting xattr of max xattr size: $(max_xattr_size)"
11953         grow_xattr $(max_xattr_size)
11954
11955         echo "setting xattr of > max xattr size: $(max_xattr_size) + 10"
11956         echo "This should fail:"
11957         grow_xattr $(($(max_xattr_size) + 10)) 1
11958 }
11959 run_test 102ha "grow xattr from inside inode to external inode"
11960
11961 test_102i() { # bug 17038
11962         [ -z "$(which getfattr 2>/dev/null)" ] &&
11963                 skip "could not find getfattr"
11964
11965         touch $DIR/$tfile
11966         ln -s $DIR/$tfile $DIR/${tfile}link
11967         getfattr -n trusted.lov $DIR/$tfile ||
11968                 error "lgetxattr on $DIR/$tfile failed"
11969         getfattr -h -n trusted.lov $DIR/${tfile}link 2>&1 |
11970                 grep -i "no such attr" ||
11971                 error "error for lgetxattr on $DIR/${tfile}link is not ENODATA"
11972         rm -f $DIR/$tfile $DIR/${tfile}link
11973 }
11974 run_test 102i "lgetxattr test on symbolic link ============"
11975
11976 test_102j() {
11977         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11978         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11979
11980         XINC=$(have_xattrs_include)
11981         setup_test102 "$RUNAS"
11982         chown $RUNAS_ID $DIR/$tdir
11983         $RUNAS tar xf $TMP/f102.tar -C $DIR/$tdir --xattrs $XINC
11984         cd $DIR/$tdir/$tdir
11985         compare_stripe_info1 "$RUNAS"
11986 }
11987 run_test 102j "non-root tar restore stripe info from tarfile, not keep osts ==="
11988
11989 test_102k() {
11990         [ -z "$(which setfattr 2>/dev/null)" ] &&
11991                 skip "could not find setfattr"
11992
11993         touch $DIR/$tfile
11994         # b22187 just check that does not crash for regular file.
11995         setfattr -n trusted.lov $DIR/$tfile
11996         # b22187 'setfattr -n trusted.lov' should remove LOV EA for directories
11997         local test_kdir=$DIR/$tdir
11998         test_mkdir $test_kdir
11999         local default_size=$($LFS getstripe -S $test_kdir)
12000         local default_count=$($LFS getstripe -c $test_kdir)
12001         local default_offset=$($LFS getstripe -i $test_kdir)
12002         $LFS setstripe -S 65536 -i 0 -c $OSTCOUNT $test_kdir ||
12003                 error 'dir setstripe failed'
12004         setfattr -n trusted.lov $test_kdir
12005         local stripe_size=$($LFS getstripe -S $test_kdir)
12006         local stripe_count=$($LFS getstripe -c $test_kdir)
12007         local stripe_offset=$($LFS getstripe -i $test_kdir)
12008         [ $stripe_size -eq $default_size ] ||
12009                 error "stripe size $stripe_size != $default_size"
12010         [ $stripe_count -eq $default_count ] ||
12011                 error "stripe count $stripe_count != $default_count"
12012         [ $stripe_offset -eq $default_offset ] ||
12013                 error "stripe offset $stripe_offset != $default_offset"
12014         rm -rf $DIR/$tfile $test_kdir
12015 }
12016 run_test 102k "setfattr without parameter of value shouldn't cause a crash"
12017
12018 test_102l() {
12019         [ -z "$(which getfattr 2>/dev/null)" ] &&
12020                 skip "could not find getfattr"
12021
12022         # LU-532 trusted. xattr is invisible to non-root
12023         local testfile=$DIR/$tfile
12024
12025         touch $testfile
12026
12027         echo "listxattr as user..."
12028         chown $RUNAS_ID $testfile
12029         $RUNAS getfattr -d -m '.*' $testfile 2>&1 |
12030             grep -q "trusted" &&
12031                 error "$testfile trusted xattrs are user visible"
12032
12033         return 0;
12034 }
12035 run_test 102l "listxattr size test =================================="
12036
12037 test_102m() { # LU-3403 llite: error of listxattr when buffer is small
12038         local path=$DIR/$tfile
12039         touch $path
12040
12041         listxattr_size_check $path || error "listattr_size_check $path failed"
12042 }
12043 run_test 102m "Ensure listxattr fails on small bufffer ========"
12044
12045 cleanup_test102
12046
12047 getxattr() { # getxattr path name
12048         # Return the base64 encoding of the value of xattr name on path.
12049         local path=$1
12050         local name=$2
12051
12052         # # getfattr --absolute-names --encoding=base64 --name=trusted.lov $path
12053         # file: $path
12054         # trusted.lov=0s0AvRCwEAAAAGAAAAAAAAAAAEAAACAAAAAAAQAAEAA...AAAAAAAAA=
12055         #
12056         # We print just 0s0AvRCwEAAAAGAAAAAAAAAAAEAAACAAAAAAAQAAEAA...AAAAAAAAA=
12057
12058         getfattr --absolute-names --encoding=base64 --name=$name $path |
12059                 awk -F= -v name=$name '$1 == name {
12060                         print substr($0, index($0, "=") + 1);
12061         }'
12062 }
12063
12064 test_102n() { # LU-4101 mdt: protect internal xattrs
12065         [ -z "$(which setfattr 2>/dev/null)" ] &&
12066                 skip "could not find setfattr"
12067         if [ $MDS1_VERSION -lt $(version_code 2.5.50) ]
12068         then
12069                 skip "MDT < 2.5.50 allows setxattr on internal trusted xattrs"
12070         fi
12071
12072         local file0=$DIR/$tfile.0
12073         local file1=$DIR/$tfile.1
12074         local xattr0=$TMP/$tfile.0
12075         local xattr1=$TMP/$tfile.1
12076         local namelist="lov lma lmv link fid version som hsm"
12077         local name
12078         local value
12079
12080         rm -rf $file0 $file1 $xattr0 $xattr1
12081         touch $file0 $file1
12082
12083         # Get 'before' xattrs of $file1.
12084         getfattr --absolute-names --dump --match=- $file1 > $xattr0
12085
12086         [ $MDS1_VERSION -lt $(version_code 2.8.53) ] &&
12087                 namelist+=" lfsck_namespace"
12088         for name in $namelist; do
12089                 # Try to copy xattr from $file0 to $file1.
12090                 value=$(getxattr $file0 trusted.$name 2> /dev/null)
12091
12092                 setfattr --name=trusted.$name --value="$value" $file1 ||
12093                         error "setxattr 'trusted.$name' failed"
12094
12095                 # Try to set a garbage xattr.
12096                 value=0sVGhlIHF1aWNrIGJyb3duIGZveCBqdW1wcyBvdmVyIGl0c2VsZi4=
12097
12098                 if [[ x$name == "xlov" ]]; then
12099                         setfattr --name=trusted.lov --value="$value" $file1 &&
12100                         error "setxattr invalid 'trusted.lov' success"
12101                 else
12102                         setfattr --name=trusted.$name --value="$value" $file1 ||
12103                                 error "setxattr invalid 'trusted.$name' failed"
12104                 fi
12105
12106                 # Try to remove the xattr from $file1. We don't care if this
12107                 # appears to succeed or fail, we just don't want there to be
12108                 # any changes or crashes.
12109                 setfattr --remove=$trusted.$name $file1 2> /dev/null
12110         done
12111
12112         if [ $MDS1_VERSION -gt $(version_code 2.6.50) ]
12113         then
12114                 name="lfsck_ns"
12115                 # Try to copy xattr from $file0 to $file1.
12116                 value=$(getxattr $file0 trusted.$name 2> /dev/null)
12117
12118                 setfattr --name=trusted.$name --value="$value" $file1 ||
12119                         error "setxattr 'trusted.$name' failed"
12120
12121                 # Try to set a garbage xattr.
12122                 value=0sVGhlIHF1aWNrIGJyb3duIGZveCBqdW1wcyBvdmVyIGl0c2VsZi4=
12123
12124                 setfattr --name=trusted.$name --value="$value" $file1 ||
12125                         error "setxattr 'trusted.$name' failed"
12126
12127                 # Try to remove the xattr from $file1. We don't care if this
12128                 # appears to succeed or fail, we just don't want there to be
12129                 # any changes or crashes.
12130                 setfattr --remove=$trusted.$name $file1 2> /dev/null
12131         fi
12132
12133         # Get 'after' xattrs of file1.
12134         getfattr --absolute-names --dump --match=- $file1 > $xattr1
12135
12136         if ! diff $xattr0 $xattr1; then
12137                 error "before and after xattrs of '$file1' differ"
12138         fi
12139
12140         rm -rf $file0 $file1 $xattr0 $xattr1
12141
12142         return 0
12143 }
12144 run_test 102n "silently ignore setxattr on internal trusted xattrs"
12145
12146 test_102p() { # LU-4703 setxattr did not check ownership
12147         [ $MDS1_VERSION -lt $(version_code 2.5.56) ] &&
12148                 skip "MDS needs to be at least 2.5.56"
12149
12150         local testfile=$DIR/$tfile
12151
12152         touch $testfile
12153
12154         echo "setfacl as user..."
12155         $RUNAS setfacl -m "u:$RUNAS_ID:rwx" $testfile
12156         [ $? -ne 0 ] || error "setfacl by $RUNAS_ID was allowed on $testfile"
12157
12158         echo "setfattr as user..."
12159         setfacl -m "u:$RUNAS_ID:---" $testfile
12160         $RUNAS setfattr -x system.posix_acl_access $testfile
12161         [ $? -ne 0 ] || error "setfattr by $RUNAS_ID was allowed on $testfile"
12162 }
12163 run_test 102p "check setxattr(2) correctly fails without permission"
12164
12165 test_102q() {
12166         [ $MDS1_VERSION -lt $(version_code 2.6.92) ] &&
12167                 skip "MDS needs to be at least 2.6.92"
12168
12169         orphan_linkea_check $DIR/$tfile || error "orphan_linkea_check"
12170 }
12171 run_test 102q "flistxattr should not return trusted.link EAs for orphans"
12172
12173 test_102r() {
12174         [ $MDS1_VERSION -lt $(version_code 2.6.93) ] &&
12175                 skip "MDS needs to be at least 2.6.93"
12176
12177         touch $DIR/$tfile || error "touch"
12178         setfattr -n user.$(basename $tfile) $DIR/$tfile || error "setfattr"
12179         getfattr -n user.$(basename $tfile) $DIR/$tfile || error "getfattr"
12180         rm $DIR/$tfile || error "rm"
12181
12182         #normal directory
12183         mkdir -p $DIR/$tdir || error "mkdir"
12184         setfattr -n user.$(basename $tdir) $DIR/$tdir || error "setfattr dir"
12185         getfattr -n user.$(basename $tdir) $DIR/$tdir || error "getfattr dir"
12186         setfattr -x user.$(basename $tdir) $DIR/$tdir ||
12187                 error "$testfile error deleting user.author1"
12188         getfattr -d -m user.$(basename $tdir) 2> /dev/null |
12189                 grep "user.$(basename $tdir)" &&
12190                 error "$tdir did not delete user.$(basename $tdir)"
12191         rmdir $DIR/$tdir || error "rmdir"
12192
12193         #striped directory
12194         test_mkdir $DIR/$tdir
12195         setfattr -n user.$(basename $tdir) $DIR/$tdir || error "setfattr dir"
12196         getfattr -n user.$(basename $tdir) $DIR/$tdir || error "getfattr dir"
12197         setfattr -x user.$(basename $tdir) $DIR/$tdir ||
12198                 error "$testfile error deleting user.author1"
12199         getfattr -d -m user.$(basename $tdir) 2> /dev/null |
12200                 grep "user.$(basename $tdir)" &&
12201                 error "$tdir did not delete user.$(basename $tdir)"
12202         rmdir $DIR/$tdir || error "rm striped dir"
12203 }
12204 run_test 102r "set EAs with empty values"
12205
12206 test_102s() {
12207         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
12208                 skip "MDS needs to be at least 2.11.52"
12209
12210         local save="$TMP/$TESTSUITE-$TESTNAME.parameters"
12211
12212         save_lustre_params client "llite.*.xattr_cache" > $save
12213
12214         for cache in 0 1; do
12215                 lctl set_param llite.*.xattr_cache=$cache
12216
12217                 rm -f $DIR/$tfile
12218                 touch $DIR/$tfile || error "touch"
12219                 for prefix in lustre security system trusted user; do
12220                         # Note getxattr() may fail with 'Operation not
12221                         # supported' or 'No such attribute' depending
12222                         # on prefix and cache.
12223                         getfattr -n $prefix.n102s $DIR/$tfile &&
12224                                 error "getxattr '$prefix.n102s' should fail (cache = $cache)"
12225                 done
12226         done
12227
12228         restore_lustre_params < $save
12229 }
12230 run_test 102s "getting nonexistent xattrs should fail"
12231
12232 test_102t() {
12233         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
12234                 skip "MDS needs to be at least 2.11.52"
12235
12236         local save="$TMP/$TESTSUITE-$TESTNAME.parameters"
12237
12238         save_lustre_params client "llite.*.xattr_cache" > $save
12239
12240         for cache in 0 1; do
12241                 lctl set_param llite.*.xattr_cache=$cache
12242
12243                 for buf_size in 0 256; do
12244                         rm -f $DIR/$tfile
12245                         touch $DIR/$tfile || error "touch"
12246                         setfattr -n user.multiop $DIR/$tfile
12247                         $MULTIOP $DIR/$tfile oa$buf_size ||
12248                                 error "cannot get zero length xattr value (buf_size = $buf_size)"
12249                 done
12250         done
12251
12252         restore_lustre_params < $save
12253 }
12254 run_test 102t "zero length xattr values handled correctly"
12255
12256 run_acl_subtest()
12257 {
12258         local test=$LUSTRE/tests/acl/$1.test
12259         local tmp=$(mktemp -t $1-XXXXXX).test
12260         local bin=$2
12261         local dmn=$3
12262         local grp=$4
12263         local nbd=$5
12264         export LANG=C
12265
12266
12267         local sedusers="-e s/bin/$bin/g -e s/daemon/$dmn/g"
12268         local sedgroups="-e s/:users/:$grp/g"
12269         [[ -z "$nbd" ]] || sedusers+=" -e s/nobody/$nbd/g"
12270
12271         sed $sedusers $sedgroups < $test > $tmp
12272         stack_trap "rm -f $tmp"
12273         [[ -s $tmp ]] || error "sed failed to create test script"
12274
12275         echo "performing $1 with bin='$bin' daemon='$dmn' users='$grp'..."
12276         $LUSTRE/tests/acl/run $tmp || error "run_acl_subtest '$1' failed"
12277 }
12278
12279 test_103a() {
12280         [ "$UID" != 0 ] && skip "must run as root"
12281         $GSS && skip_env "could not run under gss"
12282         [[ "$(lctl get_param -n mdc.*-mdc-*.connect_flags)" =~ "acl" ]] ||
12283                 skip_env "must have acl enabled"
12284         which setfacl || skip_env "could not find setfacl"
12285         remote_mds_nodsh && skip "remote MDS with nodsh"
12286
12287         local mdts=$(comma_list $(mdts_nodes))
12288         local saved=$(do_facet mds1 $LCTL get_param -n mdt.$FSNAME-MDT0000.job_xattr)
12289
12290         do_nodes $mdts $LCTL set_param mdt.*.job_xattr=NONE
12291         stack_trap "do_nodes $mdts $LCTL set_param mdt.*.job_xattr=$saved" EXIT
12292
12293         ACLBIN=${ACLBIN:-"bin"}
12294         ACLDMN=${ACLDMN:-"daemon"}
12295         ACLGRP=${ACLGRP:-"users"}
12296         ACLNBD=${ACLNBD:-"nobody"}
12297
12298         if ! id $ACLBIN ||
12299            [[ "$(id -u $ACLBIN)" != "$(do_facet mds1 id -u $ACLBIN)" ]]; then
12300                 echo "bad 'bin' user '$ACLBIN', using '$USER0'"
12301                 ACLBIN=$USER0
12302                 if ! id $ACLBIN ; then
12303                         cat /etc/passwd
12304                         skip_env "can't find suitable ACL 'bin' $ACLBIN"
12305                 fi
12306         fi
12307         if ! id $ACLDMN || (( $(id -u $ACLDMN) < $(id -u $ACLBIN) )) ||
12308            [[ "$(id -u $ACLDMN)" != "$(do_facet mds1 id -u $ACLDMN)" ]]; then
12309                 echo "bad 'daemon' user '$ACLDMN', using '$USER1'"
12310                 ACLDMN=$USER1
12311                 if ! id $ACLDMN ; then
12312                         cat /etc/passwd
12313                         skip_env "can't find suitable ACL 'daemon' $ACLDMN"
12314                 fi
12315         fi
12316         if ! getent group $ACLGRP; then
12317                 echo "missing 'users' group '$ACLGRP', using '$TSTUSR'"
12318                 ACLGRP="$TSTUSR"
12319                 if ! getent group $ACLGRP; then
12320                         echo "cannot find group '$ACLGRP', adding it"
12321                         cat /etc/group
12322                         add_group 60000 $ACLGRP
12323                 fi
12324         fi
12325
12326         local bingid=$(getent group $ACLBIN | cut -d: -f 3)
12327         local dmngid=$(getent group $ACLDMN | cut -d: -f 3)
12328         local grpgid=$(getent group $ACLGRP | cut -d: -f 3)
12329
12330         if (( $bingid > $grpgid || $dmngid > $grpgid )); then
12331                 echo "group '$ACLGRP' has low gid=$grpgid, use '$TSTUSR'"
12332                 ACLGRP="$TSTUSR"
12333                 if ! getent group $ACLGRP; then
12334                         echo "cannot find group '$ACLGRP', adding it"
12335                         cat /etc/group
12336                         add_group 60000 $ACLGRP
12337                 fi
12338                 grpgid=$(getent group $ACLGRP | cut -d: -f 3)
12339                 if (( $bingid > $grpgid || $dmngid > $grpgid )); then
12340                         cat /etc/group
12341                         skip_env "$ACLGRP gid=$grpgid less than $bingid|$dmngid"
12342                 fi
12343         fi
12344
12345         gpasswd -a $ACLDMN $ACLBIN ||
12346                 error "setting client group failed"             # LU-5641
12347         do_facet mds1 gpasswd -a $ACLDMN $ACLBIN ||
12348                 error "setting MDS group failed"                # LU-5641
12349
12350         declare -a identity_old
12351
12352         for num in $(seq $MDSCOUNT); do
12353                 switch_identity $num true || identity_old[$num]=$?
12354         done
12355
12356         SAVE_UMASK=$(umask)
12357         umask 0022
12358         mkdir -p $DIR/$tdir
12359         cd $DIR/$tdir
12360
12361         run_acl_subtest cp $ACLBIN $ACLDMN $ACLGRP
12362         run_acl_subtest getfacl-noacl $ACLBIN $ACLDMN $ACLGRP
12363         run_acl_subtest misc $ACLBIN $ACLDMN $ACLGRP
12364         run_acl_subtest permissions $ACLBIN $ACLDMN $ACLGRP
12365         # LU-1482 mdd: Setting xattr are properly checked with and without ACLs
12366         # CentOS7- uses nobody=99, while newer distros use nobody=65534
12367         if ! id -u $ACLNBD ||
12368            (( $(id -u nobody) != $(do_facet mds1 id -u nobody) )); then
12369                 ACLNBD="nfsnobody"
12370                 if ! id -u $ACLNBD; then
12371                         ACLNBD=""
12372                 fi
12373         fi
12374         if [[ -n "$ACLNBD" ]] && ! getent group $ACLNBD; then
12375                 add_group $(id -u $ACLNBD) $ACLNBD
12376                 if ! getent group $ACLNBD; then
12377                         ACLNBD=""
12378                 fi
12379         fi
12380         if (( $MDS1_VERSION > $(version_code 2.8.55) )) &&
12381            [[ -n "$ACLNBD" ]] && which setfattr; then
12382                 run_acl_subtest permissions_xattr \
12383                         $ACLBIN $ACLDMN $ACLGRP $ACLNBD
12384         elif [[ -z "$ACLNBD" ]]; then
12385                 echo "skip 'permission_xattr' test - missing 'nobody' user/grp"
12386         else
12387                 echo "skip 'permission_xattr' test - missing setfattr command"
12388         fi
12389         run_acl_subtest setfacl $ACLBIN $ACLDMN $ACLGRP
12390
12391         # inheritance test got from HP
12392         cp $LUSTRE/tests/acl/make-tree . || error "cannot copy make-tree"
12393         chmod +x make-tree || error "chmod +x failed"
12394         run_acl_subtest inheritance $ACLBIN $ACLDMN $ACLGRP
12395         rm -f make-tree
12396
12397         echo "LU-974 ignore umask when acl is enabled..."
12398         run_acl_subtest 974 $ACLBIN $ACLDMN $ACLGRP
12399         if [ $MDSCOUNT -ge 2 ]; then
12400                 run_acl_subtest 974_remote $ACLBIN $ACLDMN $ACLGRP
12401         fi
12402
12403         echo "LU-2561 newly created file is same size as directory..."
12404         if [ "$mds1_FSTYPE" != "zfs" ]; then
12405                 run_acl_subtest 2561 $ACLBIN $ACLDMN $ACLGRP
12406         else
12407                 run_acl_subtest 2561_zfs $ACLBIN $ACLDMN $ACLGRP
12408         fi
12409
12410         run_acl_subtest 4924 $ACLBIN $ACLDMN $ACLGRP
12411
12412         cd $SAVE_PWD
12413         umask $SAVE_UMASK
12414
12415         for num in $(seq $MDSCOUNT); do
12416                 if [ "${identity_old[$num]}" = 1 ]; then
12417                         switch_identity $num false || identity_old[$num]=$?
12418                 fi
12419         done
12420 }
12421 run_test 103a "acl test"
12422
12423 test_103b() {
12424         declare -a pids
12425         local U
12426
12427         stack_trap "rm -f $DIR/$tfile.*"
12428         for U in {0..511}; do
12429                 {
12430                 local O=$(printf "%04o" $U)
12431
12432                 umask $(printf "%04o" $((511 ^ $O)))
12433                 $LFS setstripe -c 1 $DIR/$tfile.s$O
12434                 local S=$(printf "%04o" 0$(stat -c%a $DIR/$tfile.s$O))
12435
12436                 (( $S == ($O & 0666) )) ||
12437                         error "lfs setstripe $DIR/$tfile.s$O '$S' != '$O'"
12438
12439                 $LFS setstripe -E16M -c 1 -E1G -S4M $DIR/$tfile.p$O
12440                 S=$(printf "%04o" 0$(stat -c%a $DIR/$tfile.p$O))
12441                 (( $S == ($O & 0666) )) ||
12442                         error "lfs setstripe -E $DIR/$tfile.p$O '$S' != '$O'"
12443
12444                 $LFS setstripe -N2 -c 1 $DIR/$tfile.m$O
12445                 S=$(printf "%04o" 0$(stat -c%a $DIR/$tfile.m$O))
12446                 (( $S == ($O & 0666) )) ||
12447                         error "lfs setstripe -N2 $DIR/$tfile.m$O '$S' != '$O'"
12448                 rm -f $DIR/$tfile.[smp]$0
12449                 } &
12450                 local pid=$!
12451
12452                 # limit the concurrently running threads to 64. LU-11878
12453                 local idx=$((U % 64))
12454                 [ -z "${pids[idx]}" ] || wait ${pids[idx]}
12455                 pids[idx]=$pid
12456         done
12457         wait
12458 }
12459 run_test 103b "umask lfs setstripe"
12460
12461 test_103c() {
12462         mkdir -p $DIR/$tdir
12463         cp -rp $DIR/$tdir $DIR/$tdir.bak
12464
12465         [ -n "$(getfattr -d -m. $DIR/$tdir | grep posix_acl_default)" ] &&
12466                 error "$DIR/$tdir shouldn't contain default ACL"
12467         [ -n "$(getfattr -d -m. $DIR/$tdir.bak | grep posix_acl_default)" ] &&
12468                 error "$DIR/$tdir.bak shouldn't contain default ACL"
12469         true
12470 }
12471 run_test 103c "'cp -rp' won't set empty acl"
12472
12473 test_103e() {
12474         local numacl
12475         local fileacl
12476         local saved_debug=$($LCTL get_param -n debug)
12477
12478         (( $MDS1_VERSION >= $(version_code 2.14.52) )) ||
12479                 skip "MDS needs to be at least 2.14.52"
12480
12481         large_xattr_enabled || skip_env "ea_inode feature disabled"
12482
12483         mkdir -p $DIR/$tdir
12484         # add big LOV EA to cause reply buffer overflow earlier
12485         $LFS setstripe -C 1000 $DIR/$tdir
12486         lctl set_param mdc.*-mdc*.stats=clear
12487
12488         $LCTL set_param debug=0
12489         stack_trap "$LCTL set_param debug=\"$saved_debug\"" EXIT
12490         stack_trap "$LCTL get_param mdc.*-mdc*.stats" EXIT
12491
12492         # add a large number of default ACLs (expect 8000+ for 2.13+)
12493         for U in {2..7000}; do
12494                 setfacl -d -m user:$U:rwx $DIR/$tdir ||
12495                         error "Able to add just $U default ACLs"
12496         done
12497         numacl=$(getfacl $DIR/$tdir |& grep -c "default:user")
12498         echo "$numacl default ACLs created"
12499
12500         stat $DIR/$tdir || error "Cannot stat directory"
12501         # check file creation
12502         touch $DIR/$tdir/$tfile ||
12503                 error "failed to create $tfile with $numacl default ACLs"
12504         stat $DIR/$tdir/$tfile  || error "Cannot stat file"
12505         fileacl=$(getfacl $DIR/$tdir/$tfile |& grep -c "user:")
12506         echo "$fileacl ACLs were inherited"
12507         (( $fileacl == $numacl )) ||
12508                 error "Not all default ACLs were inherited: $numacl != $fileacl"
12509         # check that new ACLs creation adds new ACLs to inherited ACLs
12510         setfacl -m user:19000:rwx $DIR/$tdir/$tfile ||
12511                 error "Cannot set new ACL"
12512         numacl=$((numacl + 1))
12513         fileacl=$(getfacl $DIR/$tdir/$tfile |& grep -c "user:")
12514         (( $fileacl == $numacl )) ||
12515                 error "failed to add new ACL: $fileacl != $numacl as expected"
12516         # adds more ACLs to a file to reach their maximum at 8000+
12517         numacl=0
12518         for U in {20000..25000}; do
12519                 setfacl -m user:$U:rwx $DIR/$tdir/$tfile || break
12520                 numacl=$((numacl + 1))
12521         done
12522         echo "Added $numacl more ACLs to the file"
12523         fileacl=$(getfacl $DIR/$tdir/$tfile |& grep -c "user:")
12524         echo "Total $fileacl ACLs in file"
12525         stat $DIR/$tdir/$tfile > /dev/null || error "Cannot stat file"
12526         rm -f $DIR/$tdir/$tfile || error "Cannot remove file"
12527         rmdir $DIR/$tdir || error "Cannot remove directory"
12528 }
12529 run_test 103e "inheritance of big amount of default ACLs"
12530
12531 test_103f() {
12532         (( $MDS1_VERSION >= $(version_code 2.14.51) )) ||
12533                 skip "MDS needs to be at least 2.14.51"
12534
12535         large_xattr_enabled || skip_env "ea_inode feature disabled"
12536
12537         # enable changelog to consume more internal MDD buffers
12538         changelog_register
12539
12540         mkdir -p $DIR/$tdir
12541         # add big LOV EA
12542         $LFS setstripe -C 1000 $DIR/$tdir
12543         setfacl -d -m user:$U:rwx $DIR/$tdir || error "Cannot add default ACLs"
12544         mkdir $DIR/$tdir/inherited || error "failed to create subdirectory"
12545         rmdir $DIR/$tdir/inherited || error "Cannot remove subdirectory"
12546         rmdir $DIR/$tdir || error "Cannot remove directory"
12547 }
12548 run_test 103f "changelog doesn't interfere with default ACLs buffers"
12549
12550 test_104a() {
12551         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12552
12553         touch $DIR/$tfile
12554         lfs df || error "lfs df failed"
12555         lfs df -ih || error "lfs df -ih failed"
12556         lfs df -h $DIR || error "lfs df -h $DIR failed"
12557         lfs df -i $DIR || error "lfs df -i $DIR failed"
12558         lfs df $DIR/$tfile || error "lfs df $DIR/$tfile failed"
12559         lfs df -ih $DIR/$tfile || error "lfs df -ih $DIR/$tfile failed"
12560
12561         local OSC=$(lctl dl | grep OST0000-osc-[^M] | awk '{ print $4 }')
12562         lctl --device %$OSC deactivate
12563         lfs df || error "lfs df with deactivated OSC failed"
12564         lctl --device %$OSC activate
12565         # wait the osc back to normal
12566         wait_osc_import_ready client ost
12567
12568         lfs df || error "lfs df with reactivated OSC failed"
12569         rm -f $DIR/$tfile
12570 }
12571 run_test 104a "lfs df [-ih] [path] test ========================="
12572
12573 test_104b() {
12574         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12575         [ $RUNAS_ID -eq $UID ] &&
12576                 skip_env "RUNAS_ID = UID = $UID -- skipping"
12577
12578         denied_cnt=$(($($RUNAS $LFS check servers 2>&1 |
12579                         grep "Permission denied" | wc -l)))
12580         if [ $denied_cnt -ne 0 ]; then
12581                 error "lfs check servers test failed"
12582         fi
12583 }
12584 run_test 104b "$RUNAS lfs check servers test ===================="
12585
12586 #
12587 # Verify $1 is within range of $2.
12588 # Success when $1 is within range. That is, when $1 is >= 2% of $2 and
12589 # $1 is <= 2% of $2. Else Fail.
12590 #
12591 value_in_range() {
12592         # Strip all units (M, G, T)
12593         actual=$(echo $1 | tr -d A-Z)
12594         expect=$(echo $2 | tr -d A-Z)
12595
12596         expect_lo=$(($expect * 98 / 100)) # 2% below
12597         expect_hi=$(($expect * 102 / 100)) # 2% above
12598
12599         # permit 2% drift above and below
12600         (( $actual >= $expect_lo && $actual <= $expect_hi ))
12601 }
12602
12603 test_104c() {
12604         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12605         [ "$ost1_FSTYPE" == "zfs" ] || skip "zfs only test"
12606
12607         local ost_param="osd-zfs.$FSNAME-OST0000."
12608         local mdt_param="osd-zfs.$FSNAME-MDT0000."
12609         local ofacets=$(get_facets OST)
12610         local mfacets=$(get_facets MDS)
12611         local saved_ost_blocks=
12612         local saved_mdt_blocks=
12613
12614         echo "Before recordsize change"
12615         lfs_df=($($LFS df -h | grep "filesystem_summary:"))
12616         df=($(df -h | grep "$MOUNT"$))
12617
12618         # For checking.
12619         echo "lfs output : ${lfs_df[*]}"
12620         echo "df  output : ${df[*]}"
12621
12622         for facet in ${ofacets//,/ }; do
12623                 if [ -z $saved_ost_blocks ]; then
12624                         saved_ost_blocks=$(do_facet $facet \
12625                                 lctl get_param -n $ost_param.blocksize)
12626                         echo "OST Blocksize: $saved_ost_blocks"
12627                 fi
12628                 ost=$(do_facet $facet lctl get_param -n $ost_param.mntdev)
12629                 do_facet $facet zfs set recordsize=32768 $ost
12630         done
12631
12632         # BS too small. Sufficient for functional testing.
12633         for facet in ${mfacets//,/ }; do
12634                 if [ -z $saved_mdt_blocks ]; then
12635                         saved_mdt_blocks=$(do_facet $facet \
12636                                 lctl get_param -n $mdt_param.blocksize)
12637                         echo "MDT Blocksize: $saved_mdt_blocks"
12638                 fi
12639                 mdt=$(do_facet $facet lctl get_param -n $mdt_param.mntdev)
12640                 do_facet $facet zfs set recordsize=32768 $mdt
12641         done
12642
12643         # Give new values chance to reflect change
12644         sleep 2
12645
12646         echo "After recordsize change"
12647         lfs_df_after=($($LFS df -h | grep "filesystem_summary:"))
12648         df_after=($(df -h | grep "$MOUNT"$))
12649
12650         # For checking.
12651         echo "lfs output : ${lfs_df_after[*]}"
12652         echo "df  output : ${df_after[*]}"
12653
12654         # Verify lfs df
12655         value_in_range ${lfs_df_after[1]%.*} ${lfs_df[1]%.*} ||
12656                 error "lfs_df bytes: ${lfs_df_after[1]%.*} != ${lfs_df[1]%.*}"
12657         value_in_range ${lfs_df_after[2]%.*} ${lfs_df[2]%.*} ||
12658                 error "lfs_df used: ${lfs_df_after[2]%.*} != ${lfs_df[2]%.*}"
12659         value_in_range ${lfs_df_after[3]%.*} ${lfs_df[3]%.*} ||
12660                 error "lfs_df avail: ${lfs_df_after[3]%.*} != ${lfs_df[3]%.*}"
12661
12662         # Verify df
12663         value_in_range ${df_after[1]%.*} ${df[1]%.*} ||
12664                 error "df bytes: ${df_after[1]%.*} != ${df[1]%.*}"
12665         value_in_range ${df_after[2]%.*} ${df[2]%.*} ||
12666                 error "df used: ${df_after[2]%.*} != ${df[2]%.*}"
12667         value_in_range ${df_after[3]%.*} ${df[3]%.*} ||
12668                 error "df avail: ${df_after[3]%.*} != ${df[3]%.*}"
12669
12670         # Restore MDT recordize back to original
12671         for facet in ${mfacets//,/ }; do
12672                 mdt=$(do_facet $facet lctl get_param -n $mdt_param.mntdev)
12673                 do_facet $facet zfs set recordsize=$saved_mdt_blocks $mdt
12674         done
12675
12676         # Restore OST recordize back to original
12677         for facet in ${ofacets//,/ }; do
12678                 ost=$(do_facet $facet lctl get_param -n $ost_param.mntdev)
12679                 do_facet $facet zfs set recordsize=$saved_ost_blocks $ost
12680         done
12681
12682         return 0
12683 }
12684 run_test 104c "Verify df vs lfs_df stays same after recordsize change"
12685
12686 test_104d() {
12687         (( $RUNAS_ID != $UID )) ||
12688                 skip_env "RUNAS_ID = UID = $UID -- skipping"
12689
12690         (( $CLIENT_VERSION >= $(version_code 2.15.51) )) ||
12691                 skip "lustre version doesn't support lctl dl with non-root"
12692
12693         # debugfs only allows root users to access files, so the
12694         # previous move of the "devices" file to debugfs broke
12695         # "lctl dl" for non-root users. The LU-9680 Netlink
12696         # interface again allows non-root users to list devices.
12697         [ "$($RUNAS $LCTL dl | wc -l)" -ge 3 ] ||
12698                 error "lctl dl doesn't work for non root"
12699
12700         ost_count="$($RUNAS $LCTL dl | grep $FSNAME-OST* | wc -l)"
12701         [ "$ost_count" -eq $OSTCOUNT ]  ||
12702                 error "lctl dl reports wrong number of OST devices"
12703
12704         mdt_count="$($RUNAS $LCTL dl | grep $FSNAME-MDT* | wc -l)"
12705         [ "$mdt_count" -eq $MDSCOUNT ]  ||
12706                 error "lctl dl reports wrong number of MDT devices"
12707 }
12708 run_test 104d "$RUNAS lctl dl test"
12709
12710 test_105a() {
12711         # doesn't work on 2.4 kernels
12712         touch $DIR/$tfile
12713         if $(flock_is_enabled); then
12714                 flocks_test 1 on -f $DIR/$tfile || error "fail flock on"
12715         else
12716                 flocks_test 1 off -f $DIR/$tfile || error "fail flock off"
12717         fi
12718         rm -f $DIR/$tfile
12719 }
12720 run_test 105a "flock when mounted without -o flock test ========"
12721
12722 test_105b() {
12723         touch $DIR/$tfile
12724         if $(flock_is_enabled); then
12725                 flocks_test 1 on -c $DIR/$tfile || error "fail flock on"
12726         else
12727                 flocks_test 1 off -c $DIR/$tfile || error "fail flock off"
12728         fi
12729         rm -f $DIR/$tfile
12730 }
12731 run_test 105b "fcntl when mounted without -o flock test ========"
12732
12733 test_105c() {
12734         touch $DIR/$tfile
12735         if $(flock_is_enabled); then
12736                 flocks_test 1 on -l $DIR/$tfile || error "fail flock on"
12737         else
12738                 flocks_test 1 off -l $DIR/$tfile || error "fail flock off"
12739         fi
12740         rm -f $DIR/$tfile
12741 }
12742 run_test 105c "lockf when mounted without -o flock test"
12743
12744 test_105d() { # bug 15924
12745         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12746
12747         test_mkdir $DIR/$tdir
12748         flock_is_enabled || skip_env "mount w/o flock enabled"
12749         #define OBD_FAIL_LDLM_CP_CB_WAIT  0x315
12750         $LCTL set_param fail_loc=0x80000315
12751         flocks_test 2 $DIR/$tdir
12752 }
12753 run_test 105d "flock race (should not freeze) ========"
12754
12755 test_105e() { # bug 22660 && 22040
12756         flock_is_enabled || skip_env "mount w/o flock enabled"
12757
12758         touch $DIR/$tfile
12759         flocks_test 3 $DIR/$tfile
12760 }
12761 run_test 105e "Two conflicting flocks from same process"
12762
12763 test_106() { #bug 10921
12764         test_mkdir $DIR/$tdir
12765         $DIR/$tdir && error "exec $DIR/$tdir succeeded"
12766         chmod 777 $DIR/$tdir || error "chmod $DIR/$tdir failed"
12767 }
12768 run_test 106 "attempt exec of dir followed by chown of that dir"
12769
12770 test_107() {
12771         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12772
12773         CDIR=`pwd`
12774         local file=core
12775
12776         cd $DIR
12777         rm -f $file
12778
12779         local save_pattern=$(sysctl -n kernel.core_pattern)
12780         local save_uses_pid=$(sysctl -n kernel.core_uses_pid)
12781         sysctl -w kernel.core_pattern=$file
12782         sysctl -w kernel.core_uses_pid=0
12783
12784         ulimit -c unlimited
12785         sleep 60 &
12786         SLEEPPID=$!
12787
12788         sleep 1
12789
12790         kill -s 11 $SLEEPPID
12791         wait $SLEEPPID
12792         if [ -e $file ]; then
12793                 size=`stat -c%s $file`
12794                 [ $size -eq 0 ] && error "Fail to create core file $file"
12795         else
12796                 error "Fail to create core file $file"
12797         fi
12798         rm -f $file
12799         sysctl -w kernel.core_pattern=$save_pattern
12800         sysctl -w kernel.core_uses_pid=$save_uses_pid
12801         cd $CDIR
12802 }
12803 run_test 107 "Coredump on SIG"
12804
12805 test_110() {
12806         test_mkdir $DIR/$tdir
12807         test_mkdir $DIR/$tdir/$(str_repeat 'a' 255)
12808         $LFS mkdir -c $MDSCOUNT $DIR/$tdir/$(str_repeat 'b' 256) &&
12809                 error "mkdir with 256 char should fail, but did not"
12810         touch $DIR/$tdir/$(str_repeat 'x' 255) ||
12811                 error "create with 255 char failed"
12812         touch $DIR/$tdir/$(str_repeat 'y' 256) &&
12813                 error "create with 256 char should fail, but did not"
12814
12815         ls -l $DIR/$tdir
12816         rm -rf $DIR/$tdir
12817 }
12818 run_test 110 "filename length checking"
12819
12820 test_116a() { # was previously test_116()
12821         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12822         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
12823         remote_mds_nodsh && skip "remote MDS with nodsh"
12824
12825         echo -n "Free space priority "
12826         do_facet $SINGLEMDS lctl get_param -n lo[vd].*-mdtlov.qos_prio_free |
12827                 head -n1
12828         declare -a AVAIL
12829         free_min_max
12830
12831         [ $MINV -eq 0 ] && skip "no free space in OST$MINI, skip"
12832         [ $MINV -gt 10000000 ] && skip "too much free space in OST$MINI, skip"
12833         stack_trap simple_cleanup_common
12834
12835         # Check if we need to generate uneven OSTs
12836         test_mkdir -p $DIR/$tdir/OST${MINI}
12837         local FILL=$((MINV / 4))
12838         local DIFF=$((MAXV - MINV))
12839         local DIFF2=$((DIFF * 100 / MINV))
12840
12841         local threshold=$(do_facet $SINGLEMDS \
12842                 lctl get_param -n *.*MDT0000-mdtlov.qos_threshold_rr | head -n1)
12843         threshold=${threshold%%%}
12844         echo -n "Check for uneven OSTs: "
12845         echo -n "diff=${DIFF}KB (${DIFF2}%) must be > ${threshold}% ..."
12846
12847         if [[ $DIFF2 -gt $threshold ]]; then
12848                 echo "ok"
12849                 echo "Don't need to fill OST$MINI"
12850         else
12851                 # generate uneven OSTs. Write 2% over the QOS threshold value
12852                 echo "no"
12853                 DIFF=$((threshold - DIFF2 + 2))
12854                 DIFF2=$((MINV * DIFF / 100))
12855                 echo "Fill $DIFF% remaining space in OST$MINI with ${DIFF2}KB"
12856                 $LFS setstripe -i $MINI -c 1 $DIR/$tdir/OST${MINI} ||
12857                         error "setstripe failed"
12858                 DIFF=$((DIFF2 / 2048))
12859                 i=0
12860                 while [ $i -lt $DIFF ]; do
12861                         i=$((i + 1))
12862                         dd if=/dev/zero of=$DIR/$tdir/OST${MINI}/$tfile-$i \
12863                                 bs=2M count=1 2>/dev/null
12864                         echo -n .
12865                 done
12866                 echo .
12867                 sync
12868                 sleep_maxage
12869                 free_min_max
12870         fi
12871
12872         DIFF=$((MAXV - MINV))
12873         DIFF2=$((DIFF * 100 / MINV))
12874         echo -n "diff=$DIFF=$DIFF2% must be > $threshold% for QOS mode..."
12875         if [ $DIFF2 -gt $threshold ]; then
12876                 echo "ok"
12877         else
12878                 skip "QOS imbalance criteria not met"
12879         fi
12880
12881         MINI1=$MINI
12882         MINV1=$MINV
12883         MAXI1=$MAXI
12884         MAXV1=$MAXV
12885
12886         # now fill using QOS
12887         $LFS setstripe -c 1 $DIR/$tdir
12888         FILL=$((FILL / 200))
12889         if [ $FILL -gt 600 ]; then
12890                 FILL=600
12891         fi
12892         echo "writing $FILL files to QOS-assigned OSTs"
12893         i=0
12894         while [ $i -lt $FILL ]; do
12895                 i=$((i + 1))
12896                 dd if=/dev/zero of=$DIR/$tdir/$tfile-$i bs=200k \
12897                         count=1 2>/dev/null
12898                 echo -n .
12899         done
12900         echo "wrote $i 200k files"
12901         sync
12902         sleep_maxage
12903
12904         echo "Note: free space may not be updated, so measurements might be off"
12905         free_min_max
12906         DIFF2=$((MAXV - MINV))
12907         echo "free space delta: orig $DIFF final $DIFF2"
12908         [ $DIFF2 -gt $DIFF ] && echo "delta got worse!"
12909         DIFF=$((MINV1 - ${AVAIL[$MINI1]}))
12910         echo "Wrote ${DIFF}KB to smaller OST $MINI1"
12911         DIFF2=$((MAXV1 - ${AVAIL[$MAXI1]}))
12912         echo "Wrote ${DIFF2}KB to larger OST $MAXI1"
12913         if [[ $DIFF -gt 0 ]]; then
12914                 FILL=$((DIFF2 * 100 / DIFF - 100))
12915                 echo "Wrote ${FILL}% more data to larger OST $MAXI1"
12916         fi
12917
12918         # Figure out which files were written where
12919         UUID=$(lctl get_param -n lov.${FSNAME}-clilov-*.target_obd |
12920                awk '/'$MINI1': / {print $2; exit}')
12921         echo $UUID
12922         MINC=$($LFS getstripe --ost $UUID $DIR/$tdir | grep $DIR | wc -l)
12923         echo "$MINC files created on smaller OST $MINI1"
12924         UUID=$(lctl get_param -n lov.${FSNAME}-clilov-*.target_obd |
12925                awk '/'$MAXI1': / {print $2; exit}')
12926         echo $UUID
12927         MAXC=$($LFS getstripe --ost $UUID $DIR/$tdir | grep $DIR | wc -l)
12928         echo "$MAXC files created on larger OST $MAXI1"
12929         if [[ $MINC -gt 0 ]]; then
12930                 FILL=$((MAXC * 100 / MINC - 100))
12931                 echo "Wrote ${FILL}% more files to larger OST $MAXI1"
12932         fi
12933         [[ $MAXC -gt $MINC ]] ||
12934                 error_ignore LU-9 "stripe QOS didn't balance free space"
12935 }
12936 run_test 116a "stripe QOS: free space balance ==================="
12937
12938 test_116b() { # LU-2093
12939         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12940         remote_mds_nodsh && skip "remote MDS with nodsh"
12941
12942 #define OBD_FAIL_MDS_OSC_CREATE_FAIL     0x147
12943         local old_rr=$(do_facet $SINGLEMDS lctl get_param -n \
12944                        lo[vd].$FSNAME-MDT0000-mdtlov.qos_threshold_rr | head -1)
12945         [ -z "$old_rr" ] && skip "no QOS"
12946         do_facet $SINGLEMDS lctl set_param \
12947                 lo[vd].$FSNAME-MDT0000-mdtlov.qos_threshold_rr=0
12948         mkdir -p $DIR/$tdir
12949         do_facet $SINGLEMDS lctl set_param fail_loc=0x147
12950         createmany -o $DIR/$tdir/f- 20 || error "can't create"
12951         do_facet $SINGLEMDS lctl set_param fail_loc=0
12952         rm -rf $DIR/$tdir
12953         do_facet $SINGLEMDS lctl set_param \
12954                 lo[vd].$FSNAME-MDT0000-mdtlov.qos_threshold_rr=$old_rr
12955 }
12956 run_test 116b "QoS shouldn't LBUG if not enough OSTs found on the 2nd pass"
12957
12958 test_117() # bug 10891
12959 {
12960         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12961
12962         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
12963         #define OBD_FAIL_OST_SETATTR_CREDITS 0x21e
12964         lctl set_param fail_loc=0x21e
12965         > $DIR/$tfile || error "truncate failed"
12966         lctl set_param fail_loc=0
12967         echo "Truncate succeeded."
12968         rm -f $DIR/$tfile
12969 }
12970 run_test 117 "verify osd extend =========="
12971
12972 NO_SLOW_RESENDCOUNT=4
12973 export OLD_RESENDCOUNT=""
12974 set_resend_count () {
12975         local PROC_RESENDCOUNT="osc.${FSNAME}-OST*-osc-*.resend_count"
12976         OLD_RESENDCOUNT=$(lctl get_param -n $PROC_RESENDCOUNT | head -n1)
12977         lctl set_param -n $PROC_RESENDCOUNT $1
12978         echo resend_count is set to $(lctl get_param -n $PROC_RESENDCOUNT)
12979 }
12980
12981 # for reduce test_118* time (b=14842)
12982 [ "$SLOW" = "no" ] && set_resend_count $NO_SLOW_RESENDCOUNT
12983
12984 # Reset async IO behavior after error case
12985 reset_async() {
12986         FILE=$DIR/reset_async
12987
12988         # Ensure all OSCs are cleared
12989         $LFS setstripe -c -1 $FILE
12990         dd if=/dev/zero of=$FILE bs=64k count=$OSTCOUNT
12991         sync
12992         rm $FILE
12993 }
12994
12995 test_118a() #bug 11710
12996 {
12997         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12998
12999         reset_async
13000
13001         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
13002         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13003         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache | grep -c writeback)
13004
13005         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13006                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13007                 return 1;
13008         fi
13009         rm -f $DIR/$tfile
13010 }
13011 run_test 118a "verify O_SYNC works =========="
13012
13013 test_118b()
13014 {
13015         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13016         remote_ost_nodsh && skip "remote OST with nodsh"
13017
13018         reset_async
13019
13020         #define OBD_FAIL_SRV_ENOENT 0x217
13021         set_nodes_failloc "$(osts_nodes)" 0x217
13022         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
13023         RC=$?
13024         set_nodes_failloc "$(osts_nodes)" 0
13025         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13026         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13027                     grep -c writeback)
13028
13029         if [[ $RC -eq 0 ]]; then
13030                 error "Must return error due to dropped pages, rc=$RC"
13031                 return 1;
13032         fi
13033
13034         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13035                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13036                 return 1;
13037         fi
13038
13039         echo "Dirty pages not leaked on ENOENT"
13040
13041         # Due to the above error the OSC will issue all RPCs syncronously
13042         # until a subsequent RPC completes successfully without error.
13043         $MULTIOP $DIR/$tfile Ow4096yc
13044         rm -f $DIR/$tfile
13045
13046         return 0
13047 }
13048 run_test 118b "Reclaim dirty pages on fatal error =========="
13049
13050 test_118c()
13051 {
13052         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13053
13054         # for 118c, restore the original resend count, LU-1940
13055         [ "$SLOW" = "no" ] && [ -n "$OLD_RESENDCOUNT" ] &&
13056                                 set_resend_count $OLD_RESENDCOUNT
13057         remote_ost_nodsh && skip "remote OST with nodsh"
13058
13059         reset_async
13060
13061         #define OBD_FAIL_OST_EROFS               0x216
13062         set_nodes_failloc "$(osts_nodes)" 0x216
13063
13064         # multiop should block due to fsync until pages are written
13065         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c &
13066         MULTIPID=$!
13067         sleep 1
13068
13069         if [[ `ps h -o comm -p $MULTIPID` != "multiop" ]]; then
13070                 error "Multiop failed to block on fsync, pid=$MULTIPID"
13071         fi
13072
13073         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13074                     grep -c writeback)
13075         if [[ $WRITEBACK -eq 0 ]]; then
13076                 error "No page in writeback, writeback=$WRITEBACK"
13077         fi
13078
13079         set_nodes_failloc "$(osts_nodes)" 0
13080         wait $MULTIPID
13081         RC=$?
13082         if [[ $RC -ne 0 ]]; then
13083                 error "Multiop fsync failed, rc=$RC"
13084         fi
13085
13086         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13087         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13088                     grep -c writeback)
13089         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13090                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13091         fi
13092
13093         rm -f $DIR/$tfile
13094         echo "Dirty pages flushed via fsync on EROFS"
13095         return 0
13096 }
13097 run_test 118c "Fsync blocks on EROFS until dirty pages are flushed =========="
13098
13099 # continue to use small resend count to reduce test_118* time (b=14842)
13100 [ "$SLOW" = "no" ] && set_resend_count $NO_SLOW_RESENDCOUNT
13101
13102 test_118d()
13103 {
13104         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13105         remote_ost_nodsh && skip "remote OST with nodsh"
13106
13107         reset_async
13108
13109         #define OBD_FAIL_OST_BRW_PAUSE_BULK
13110         set_nodes_failloc "$(osts_nodes)" 0x214
13111         # multiop should block due to fsync until pages are written
13112         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c &
13113         MULTIPID=$!
13114         sleep 1
13115
13116         if [[ `ps h -o comm -p $MULTIPID` != "multiop" ]]; then
13117                 error "Multiop failed to block on fsync, pid=$MULTIPID"
13118         fi
13119
13120         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13121                     grep -c writeback)
13122         if [[ $WRITEBACK -eq 0 ]]; then
13123                 error "No page in writeback, writeback=$WRITEBACK"
13124         fi
13125
13126         wait $MULTIPID || error "Multiop fsync failed, rc=$?"
13127         set_nodes_failloc "$(osts_nodes)" 0
13128
13129         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13130         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13131                     grep -c writeback)
13132         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13133                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13134         fi
13135
13136         rm -f $DIR/$tfile
13137         echo "Dirty pages gaurenteed flushed via fsync"
13138         return 0
13139 }
13140 run_test 118d "Fsync validation inject a delay of the bulk =========="
13141
13142 test_118f() {
13143         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13144
13145         reset_async
13146
13147         #define OBD_FAIL_OSC_BRW_PREP_REQ2        0x40a
13148         lctl set_param fail_loc=0x8000040a
13149
13150         # Should simulate EINVAL error which is fatal
13151         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
13152         RC=$?
13153         if [[ $RC -eq 0 ]]; then
13154                 error "Must return error due to dropped pages, rc=$RC"
13155         fi
13156
13157         lctl set_param fail_loc=0x0
13158
13159         LOCKED=$(lctl get_param -n llite.*.dump_page_cache | grep -c locked)
13160         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13161         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13162                     grep -c writeback)
13163         if [[ $LOCKED -ne 0 ]]; then
13164                 error "Locked pages remain in cache, locked=$LOCKED"
13165         fi
13166
13167         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13168                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13169         fi
13170
13171         rm -f $DIR/$tfile
13172         echo "No pages locked after fsync"
13173
13174         reset_async
13175         return 0
13176 }
13177 run_test 118f "Simulate unrecoverable OSC side error =========="
13178
13179 test_118g() {
13180         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13181
13182         reset_async
13183
13184         #define OBD_FAIL_OSC_BRW_PREP_REQ        0x406
13185         lctl set_param fail_loc=0x406
13186
13187         # simulate local -ENOMEM
13188         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
13189         RC=$?
13190
13191         lctl set_param fail_loc=0
13192         if [[ $RC -eq 0 ]]; then
13193                 error "Must return error due to dropped pages, rc=$RC"
13194         fi
13195
13196         LOCKED=$(lctl get_param -n llite.*.dump_page_cache | grep -c locked)
13197         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13198         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13199                         grep -c writeback)
13200         if [[ $LOCKED -ne 0 ]]; then
13201                 error "Locked pages remain in cache, locked=$LOCKED"
13202         fi
13203
13204         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13205                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13206         fi
13207
13208         rm -f $DIR/$tfile
13209         echo "No pages locked after fsync"
13210
13211         reset_async
13212         return 0
13213 }
13214 run_test 118g "Don't stay in wait if we got local -ENOMEM  =========="
13215
13216 test_118h() {
13217         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13218         remote_ost_nodsh && skip "remote OST with nodsh"
13219
13220         reset_async
13221
13222         #define OBD_FAIL_OST_BRW_WRITE_BULK      0x20e
13223         set_nodes_failloc "$(osts_nodes)" 0x20e
13224         # Should simulate ENOMEM error which is recoverable and should be handled by timeout
13225         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
13226         RC=$?
13227
13228         set_nodes_failloc "$(osts_nodes)" 0
13229         if [[ $RC -eq 0 ]]; then
13230                 error "Must return error due to dropped pages, rc=$RC"
13231         fi
13232
13233         LOCKED=$(lctl get_param -n llite.*.dump_page_cache | grep -c locked)
13234         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13235         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13236                     grep -c writeback)
13237         if [[ $LOCKED -ne 0 ]]; then
13238                 error "Locked pages remain in cache, locked=$LOCKED"
13239         fi
13240
13241         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13242                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13243         fi
13244
13245         rm -f $DIR/$tfile
13246         echo "No pages locked after fsync"
13247
13248         return 0
13249 }
13250 run_test 118h "Verify timeout in handling recoverables errors  =========="
13251
13252 [ "$SLOW" = "no" ] && [ -n "$OLD_RESENDCOUNT" ] && set_resend_count $OLD_RESENDCOUNT
13253
13254 test_118i() {
13255         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13256         remote_ost_nodsh && skip "remote OST with nodsh"
13257
13258         reset_async
13259
13260         #define OBD_FAIL_OST_BRW_WRITE_BULK      0x20e
13261         set_nodes_failloc "$(osts_nodes)" 0x20e
13262
13263         # Should simulate ENOMEM error which is recoverable and should be handled by timeout
13264         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c &
13265         PID=$!
13266         sleep 5
13267         set_nodes_failloc "$(osts_nodes)" 0
13268
13269         wait $PID
13270         RC=$?
13271         if [[ $RC -ne 0 ]]; then
13272                 error "got error, but should be not, rc=$RC"
13273         fi
13274
13275         LOCKED=$(lctl get_param -n llite.*.dump_page_cache | grep -c locked)
13276         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13277         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache | grep -c writeback)
13278         if [[ $LOCKED -ne 0 ]]; then
13279                 error "Locked pages remain in cache, locked=$LOCKED"
13280         fi
13281
13282         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13283                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13284         fi
13285
13286         rm -f $DIR/$tfile
13287         echo "No pages locked after fsync"
13288
13289         return 0
13290 }
13291 run_test 118i "Fix error before timeout in recoverable error  =========="
13292
13293 [ "$SLOW" = "no" ] && set_resend_count 4
13294
13295 test_118j() {
13296         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13297         remote_ost_nodsh && skip "remote OST with nodsh"
13298
13299         reset_async
13300
13301         #define OBD_FAIL_OST_BRW_WRITE_BULK2     0x220
13302         set_nodes_failloc "$(osts_nodes)" 0x220
13303
13304         # return -EIO from OST
13305         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
13306         RC=$?
13307         set_nodes_failloc "$(osts_nodes)" 0x0
13308         if [[ $RC -eq 0 ]]; then
13309                 error "Must return error due to dropped pages, rc=$RC"
13310         fi
13311
13312         LOCKED=$(lctl get_param -n llite.*.dump_page_cache | grep -c locked)
13313         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13314         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache | grep -c writeback)
13315         if [[ $LOCKED -ne 0 ]]; then
13316                 error "Locked pages remain in cache, locked=$LOCKED"
13317         fi
13318
13319         # in recoverable error on OST we want resend and stay until it finished
13320         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13321                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13322         fi
13323
13324         rm -f $DIR/$tfile
13325         echo "No pages locked after fsync"
13326
13327         return 0
13328 }
13329 run_test 118j "Simulate unrecoverable OST side error =========="
13330
13331 test_118k()
13332 {
13333         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13334         remote_ost_nodsh && skip "remote OSTs with nodsh"
13335
13336         #define OBD_FAIL_OST_BRW_WRITE_BULK      0x20e
13337         set_nodes_failloc "$(osts_nodes)" 0x20e
13338         test_mkdir $DIR/$tdir
13339
13340         for ((i=0;i<10;i++)); do
13341                 (dd if=/dev/zero of=$DIR/$tdir/$tfile-$i bs=1M count=10 || \
13342                         error "dd to $DIR/$tdir/$tfile-$i failed" )&
13343                 SLEEPPID=$!
13344                 sleep 0.500s
13345                 kill $SLEEPPID
13346                 wait $SLEEPPID
13347         done
13348
13349         set_nodes_failloc "$(osts_nodes)" 0
13350         rm -rf $DIR/$tdir
13351 }
13352 run_test 118k "bio alloc -ENOMEM and IO TERM handling ========="
13353
13354 test_118l() # LU-646
13355 {
13356         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13357
13358         test_mkdir $DIR/$tdir
13359         $MULTIOP $DIR/$tdir Dy || error "fsync dir failed"
13360         rm -rf $DIR/$tdir
13361 }
13362 run_test 118l "fsync dir"
13363
13364 test_118m() # LU-3066
13365 {
13366         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13367
13368         test_mkdir $DIR/$tdir
13369         $MULTIOP $DIR/$tdir DY || error "fdatasync dir failed"
13370         rm -rf $DIR/$tdir
13371 }
13372 run_test 118m "fdatasync dir ========="
13373
13374 [ "$SLOW" = "no" ] && [ -n "$OLD_RESENDCOUNT" ] && set_resend_count $OLD_RESENDCOUNT
13375
13376 test_118n()
13377 {
13378         local begin
13379         local end
13380
13381         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13382         remote_ost_nodsh && skip "remote OSTs with nodsh"
13383
13384         # Sleep to avoid a cached response.
13385         #define OBD_STATFS_CACHE_SECONDS 1
13386         sleep 2
13387
13388         # Inject a 10 second delay in the OST_STATFS handler.
13389         #define OBD_FAIL_OST_STATFS_DELAY 0x242
13390         set_nodes_failloc "$(osts_nodes)" 0x242
13391
13392         begin=$SECONDS
13393         stat --file-system $MOUNT > /dev/null
13394         end=$SECONDS
13395
13396         set_nodes_failloc "$(osts_nodes)" 0
13397
13398         if ((end - begin > 20)); then
13399             error "statfs took $((end - begin)) seconds, expected 10"
13400         fi
13401 }
13402 run_test 118n "statfs() sends OST_STATFS requests in parallel"
13403
13404 test_119a() # bug 11737
13405 {
13406         BSIZE=$((512 * 1024))
13407         directio write $DIR/$tfile 0 1 $BSIZE
13408         # We ask to read two blocks, which is more than a file size.
13409         # directio will indicate an error when requested and actual
13410         # sizes aren't equeal (a normal situation in this case) and
13411         # print actual read amount.
13412         NOB=`directio read $DIR/$tfile 0 2 $BSIZE | awk '/error/ {print $6}'`
13413         if [ "$NOB" != "$BSIZE" ]; then
13414                 error "read $NOB bytes instead of $BSIZE"
13415         fi
13416         rm -f $DIR/$tfile
13417 }
13418 run_test 119a "Short directIO read must return actual read amount"
13419
13420 test_119b() # bug 11737
13421 {
13422         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
13423
13424         $LFS setstripe -c 2 $DIR/$tfile || error "setstripe failed"
13425         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 seek=1 || error "dd failed"
13426         sync
13427         $MULTIOP $DIR/$tfile oO_RDONLY:O_DIRECT:r$((2048 * 1024)) ||
13428                 error "direct read failed"
13429         rm -f $DIR/$tfile
13430 }
13431 run_test 119b "Sparse directIO read must return actual read amount"
13432
13433 test_119c() # bug 13099
13434 {
13435         BSIZE=1048576
13436         directio write $DIR/$tfile 3 1 $BSIZE || error "direct write failed"
13437         directio readhole $DIR/$tfile 0 2 $BSIZE || error "reading hole failed"
13438         rm -f $DIR/$tfile
13439 }
13440 run_test 119c "Testing for direct read hitting hole"
13441
13442 # Note: test 119d was removed, skipping 119d for new tests to avoid polluting
13443 # Maloo test history
13444
13445 test_119e()
13446 {
13447         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
13448
13449         local stripe_size=$((1024 * 1024)) #1 MiB
13450         # Max i/o below is ~ 4 * stripe_size, so this gives ~5 i/os
13451         local file_size=$((25 * stripe_size))
13452         local bsizes
13453
13454         $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.1
13455         stack_trap "rm -f $DIR/$tfile*"
13456
13457         # Just a bit bigger than the largest size in the test set below
13458         dd if=/dev/urandom bs=$file_size count=1 of=$DIR/$tfile.1 ||
13459                 error "buffered i/o to create file failed"
13460
13461         if zfs_or_rotational; then
13462                 # DIO on ZFS can take up to 2 seconds per IO
13463                 # rotational is better, but still slow.
13464                 # Limit testing on those media to larger sizes
13465                 bsizes="$((stripe_size - PAGE_SIZE)) $stripe_size"
13466         else
13467                 bsizes="$PAGE_SIZE $((PAGE_SIZE * 4)) $stripe_size \
13468                         $((stripe_size * 4))"
13469         fi
13470
13471         for bs in $bsizes; do
13472                 $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.2
13473                 echo "Read/write with DIO at size $bs"
13474                 # Read and write with DIO from source to dest
13475                 dd if=$DIR/$tfile.1 bs=$bs of=$DIR/$tfile.2 \
13476                         iflag=direct oflag=direct ||
13477                         error "dio failed"
13478
13479                 ls -la $DIR/$tfile.1 $DIR/$tfile.2
13480                 $CHECKSTAT -t file -s $file_size $DIR/$tfile.2 ||
13481                         error "size incorrect, file copy read/write bsize: $bs"
13482                 cmp --verbose $DIR/$tfile.1 $DIR/$tfile.2 ||
13483                         error "files differ, bsize $bs"
13484                 rm -f $DIR/$tfile.2
13485         done
13486 }
13487 run_test 119e "Basic tests of dio read and write at various sizes"
13488
13489 test_119f()
13490 {
13491         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
13492
13493         local stripe_size=$((1024 * 1024)) #1 MiB
13494         # Max i/o below is ~ 4 * stripe_size, so this gives ~5 i/os
13495         local file_size=$((25 * stripe_size))
13496         local bsizes
13497
13498         $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.1
13499         stack_trap "rm -f $DIR/$tfile*"
13500
13501         # Just a bit bigger than the largest size in the test set below
13502         dd if=/dev/urandom bs=$file_size count=1 of=$DIR/$tfile.1 ||
13503                 error "buffered i/o to create file failed"
13504
13505         if zfs_or_rotational; then
13506                 # DIO on ZFS can take up to 2 seconds per IO
13507                 # rotational is better, but still slow.
13508                 # Limit testing on those media to larger sizes
13509                 bsizes="$((stripe_size - PAGE_SIZE)) $stripe_size"
13510         else
13511                 bsizes="$PAGE_SIZE $((PAGE_SIZE * 4)) $stripe_size \
13512                         $((stripe_size * 4))"
13513         fi
13514
13515         for bs in $bsizes; do
13516                 $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.2
13517                 # Read and write with DIO from source to dest in two
13518                 # threads - should give correct copy of file
13519
13520                 echo "bs: $bs"
13521                 dd if=$DIR/$tfile.1 bs=$bs of=$DIR/$tfile.2 iflag=direct \
13522                         oflag=direct conv=notrunc &
13523                 pid_dio1=$!
13524                 # Note block size is different here for a more interesting race
13525                 dd if=$DIR/$tfile.1 bs=$((bs * 2)) of=$DIR/$tfile.2 \
13526                         iflag=direct oflag=direct conv=notrunc &
13527                 pid_dio2=$!
13528                 wait $pid_dio1
13529                 rc1=$?
13530                 wait $pid_dio2
13531                 rc2=$?
13532                 if (( rc1 != 0 )); then
13533                         error "dio copy 1 w/bsize $bs failed: $rc1"
13534                 fi
13535                 if (( rc2 != 0 )); then
13536                         error "dio copy 2 w/bsize $bs failed: $rc2"
13537                 fi
13538
13539
13540                 $CHECKSTAT -t file -s $file_size $DIR/$tfile.2 ||
13541                         error "size incorrect, file copy read/write bsize: $bs"
13542                 cmp --verbose $DIR/$tfile.1 $DIR/$tfile.2 ||
13543                         error "files differ, bsize $bs"
13544                 rm -f $DIR/$tfile.2
13545         done
13546 }
13547 run_test 119f "dio vs dio race"
13548
13549 test_119g()
13550 {
13551         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
13552
13553         local stripe_size=$((1024 * 1024)) #1 MiB
13554         # Max i/o below is ~ 4 * stripe_size, so this gives ~5 i/os
13555         local file_size=$((25 * stripe_size))
13556         local bsizes
13557
13558         $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.1
13559         stack_trap "rm -f $DIR/$tfile*"
13560
13561         # Just a bit bigger than the largest size in the test set below
13562         dd if=/dev/urandom bs=$file_size count=1 of=$DIR/$tfile.1 ||
13563                 error "buffered i/o to create file failed"
13564
13565         if zfs_or_rotational; then
13566                 # DIO on ZFS can take up to 2 seconds per IO
13567                 # rotational is better, but still slow.
13568                 # Limit testing on those media to larger sizes
13569                 bsizes="$((stripe_size - PAGE_SIZE)) $stripe_size"
13570         else
13571                 bsizes="$PAGE_SIZE $((PAGE_SIZE * 4)) $stripe_size \
13572                         $((stripe_size * 4))"
13573         fi
13574
13575         for bs in $bsizes; do
13576                 $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.2
13577                 echo "bs: $bs"
13578                 dd if=$DIR/$tfile.1 bs=$bs of=$DIR/$tfile.2 iflag=direct \
13579                         oflag=direct conv=notrunc &
13580                 pid_dio1=$!
13581                 # Buffered I/O with similar but not the same block size
13582                 dd if=$DIR/$tfile.1 bs=$((bs * 2)) of=$DIR/$tfile.2 &
13583                 pid_bio2=$!
13584                 wait $pid_dio1
13585                 rc1=$?
13586                 wait $pid_bio2
13587                 rc2=$?
13588                 if (( rc1 != 0 )); then
13589                         error "dio copy 1 w/bsize $bs failed: $rc1"
13590                 fi
13591                 if (( rc2 != 0 )); then
13592                         error "buffered copy 2 w/bsize $bs failed: $rc2"
13593                 fi
13594
13595                 $CHECKSTAT -t file -s $file_size $DIR/$tfile.2 ||
13596                         error "size incorrect"
13597                 cmp --verbose $DIR/$tfile.1 $DIR/$tfile.2 ||
13598                         error "files differ, bsize $bs"
13599                 rm -f $DIR/$tfile.2
13600         done
13601 }
13602 run_test 119g "dio vs buffered I/O race"
13603
13604 test_120a() {
13605         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13606         remote_mds_nodsh && skip "remote MDS with nodsh"
13607         test_mkdir -i0 -c1 $DIR/$tdir
13608         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13609                 skip_env "no early lock cancel on server"
13610
13611         lru_resize_disable mdc
13612         lru_resize_disable osc
13613         cancel_lru_locks mdc
13614         # asynchronous object destroy at MDT could cause bl ast to client
13615         cancel_lru_locks osc
13616
13617         stat $DIR/$tdir > /dev/null
13618         can1=$(do_facet mds1 \
13619                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13620                awk '/ldlm_cancel/ {print $2}')
13621         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13622                awk '/ldlm_bl_callback/ {print $2}')
13623         test_mkdir -i0 -c1 $DIR/$tdir/d1
13624         can2=$(do_facet mds1 \
13625                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13626                awk '/ldlm_cancel/ {print $2}')
13627         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13628                awk '/ldlm_bl_callback/ {print $2}')
13629         [ $can1 -eq $can2 ] || error $((can2-can1)) "cancel RPC occured."
13630         [ $blk1 -eq $blk2 ] || error $((blk2-blk1)) "blocking RPC occured."
13631         lru_resize_enable mdc
13632         lru_resize_enable osc
13633 }
13634 run_test 120a "Early Lock Cancel: mkdir test"
13635
13636 test_120b() {
13637         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13638         remote_mds_nodsh && skip "remote MDS with nodsh"
13639         test_mkdir $DIR/$tdir
13640         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13641                 skip_env "no early lock cancel on server"
13642
13643         lru_resize_disable mdc
13644         lru_resize_disable osc
13645         cancel_lru_locks mdc
13646         stat $DIR/$tdir > /dev/null
13647         can1=$(do_facet $SINGLEMDS \
13648                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13649                awk '/ldlm_cancel/ {print $2}')
13650         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13651                awk '/ldlm_bl_callback/ {print $2}')
13652         touch $DIR/$tdir/f1
13653         can2=$(do_facet $SINGLEMDS \
13654                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13655                awk '/ldlm_cancel/ {print $2}')
13656         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13657                awk '/ldlm_bl_callback/ {print $2}')
13658         [ $can1 -eq $can2 ] || error $((can2-can1)) "cancel RPC occured."
13659         [ $blk1 -eq $blk2 ] || error $((blk2-blk1)) "blocking RPC occured."
13660         lru_resize_enable mdc
13661         lru_resize_enable osc
13662 }
13663 run_test 120b "Early Lock Cancel: create test"
13664
13665 test_120c() {
13666         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13667         remote_mds_nodsh && skip "remote MDS with nodsh"
13668         test_mkdir -i0 -c1 $DIR/$tdir
13669         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13670                 skip "no early lock cancel on server"
13671
13672         lru_resize_disable mdc
13673         lru_resize_disable osc
13674         test_mkdir -i0 -c1 $DIR/$tdir/d1
13675         test_mkdir -i0 -c1 $DIR/$tdir/d2
13676         touch $DIR/$tdir/d1/f1
13677         cancel_lru_locks mdc
13678         stat $DIR/$tdir/d1 $DIR/$tdir/d2 $DIR/$tdir/d1/f1 > /dev/null
13679         can1=$(do_facet mds1 \
13680                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13681                awk '/ldlm_cancel/ {print $2}')
13682         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13683                awk '/ldlm_bl_callback/ {print $2}')
13684         ln $DIR/$tdir/d1/f1 $DIR/$tdir/d2/f2
13685         can2=$(do_facet mds1 \
13686                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13687                awk '/ldlm_cancel/ {print $2}')
13688         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13689                awk '/ldlm_bl_callback/ {print $2}')
13690         [ $can1 -eq $can2 ] || error $((can2-can1)) "cancel RPC occured."
13691         [ $blk1 -eq $blk2 ] || error $((blk2-blk1)) "blocking RPC occured."
13692         lru_resize_enable mdc
13693         lru_resize_enable osc
13694 }
13695 run_test 120c "Early Lock Cancel: link test"
13696
13697 test_120d() {
13698         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13699         remote_mds_nodsh && skip "remote MDS with nodsh"
13700         test_mkdir -i0 -c1 $DIR/$tdir
13701         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13702                 skip_env "no early lock cancel on server"
13703
13704         lru_resize_disable mdc
13705         lru_resize_disable osc
13706         touch $DIR/$tdir
13707         cancel_lru_locks mdc
13708         stat $DIR/$tdir > /dev/null
13709         can1=$(do_facet mds1 \
13710                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13711                awk '/ldlm_cancel/ {print $2}')
13712         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13713                awk '/ldlm_bl_callback/ {print $2}')
13714         chmod a+x $DIR/$tdir
13715         can2=$(do_facet mds1 \
13716                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13717                awk '/ldlm_cancel/ {print $2}')
13718         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13719                awk '/ldlm_bl_callback/ {print $2}')
13720         [ $can1 -eq $can2 ] || error $((can2-can1)) "cancel RPC occured."
13721         [ $blk1 -eq $blk2 ] || error $((blk2-blk1)) "blocking RPC occured."
13722         lru_resize_enable mdc
13723         lru_resize_enable osc
13724 }
13725 run_test 120d "Early Lock Cancel: setattr test"
13726
13727 test_120e() {
13728         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13729         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13730                 skip_env "no early lock cancel on server"
13731         remote_mds_nodsh && skip "remote MDS with nodsh"
13732
13733         local dlmtrace_set=false
13734
13735         test_mkdir -i0 -c1 $DIR/$tdir
13736         lru_resize_disable mdc
13737         lru_resize_disable osc
13738         ! $LCTL get_param debug | grep -q dlmtrace &&
13739                 $LCTL set_param debug=+dlmtrace && dlmtrace_set=true
13740         dd if=/dev/zero of=$DIR/$tdir/f1 count=1
13741         cancel_lru_locks mdc
13742         cancel_lru_locks osc
13743         dd if=$DIR/$tdir/f1 of=/dev/null
13744         stat $DIR/$tdir $DIR/$tdir/f1 > /dev/null
13745         # XXX client can not do early lock cancel of OST lock
13746         # during unlink (LU-4206), so cancel osc lock now.
13747         sleep 2
13748         cancel_lru_locks osc
13749         can1=$(do_facet mds1 \
13750                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13751                awk '/ldlm_cancel/ {print $2}')
13752         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13753                awk '/ldlm_bl_callback/ {print $2}')
13754         unlink $DIR/$tdir/f1
13755         sleep 5
13756         can2=$(do_facet mds1 \
13757                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13758                awk '/ldlm_cancel/ {print $2}')
13759         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13760                awk '/ldlm_bl_callback/ {print $2}')
13761         [ $can1 -ne $can2 ] && error "$((can2 - can1)) cancel RPC occured" &&
13762                 $LCTL dk $TMP/cancel.debug.txt
13763         [ $blk1 -ne $blk2 ] && error "$((blk2 - blk1)) blocking RPC occured" &&
13764                 $LCTL dk $TMP/blocking.debug.txt
13765         $dlmtrace_set && $LCTL set_param debug=-dlmtrace
13766         lru_resize_enable mdc
13767         lru_resize_enable osc
13768 }
13769 run_test 120e "Early Lock Cancel: unlink test"
13770
13771 test_120f() {
13772         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13773         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13774                 skip_env "no early lock cancel on server"
13775         remote_mds_nodsh && skip "remote MDS with nodsh"
13776
13777         test_mkdir -i0 -c1 $DIR/$tdir
13778         lru_resize_disable mdc
13779         lru_resize_disable osc
13780         test_mkdir -i0 -c1 $DIR/$tdir/d1
13781         test_mkdir -i0 -c1 $DIR/$tdir/d2
13782         dd if=/dev/zero of=$DIR/$tdir/d1/f1 count=1
13783         dd if=/dev/zero of=$DIR/$tdir/d2/f2 count=1
13784         cancel_lru_locks mdc
13785         cancel_lru_locks osc
13786         dd if=$DIR/$tdir/d1/f1 of=/dev/null
13787         dd if=$DIR/$tdir/d2/f2 of=/dev/null
13788         stat $DIR/$tdir/d1 $DIR/$tdir/d2 $DIR/$tdir/d1/f1 $DIR/$tdir/d2/f2 > /dev/null
13789         # XXX client can not do early lock cancel of OST lock
13790         # during rename (LU-4206), so cancel osc lock now.
13791         sleep 2
13792         cancel_lru_locks osc
13793         can1=$(do_facet mds1 \
13794                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13795                awk '/ldlm_cancel/ {print $2}')
13796         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13797                awk '/ldlm_bl_callback/ {print $2}')
13798         mrename $DIR/$tdir/d1/f1 $DIR/$tdir/d2/f2
13799         sleep 5
13800         can2=$(do_facet mds1 \
13801                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13802                awk '/ldlm_cancel/ {print $2}')
13803         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13804                awk '/ldlm_bl_callback/ {print $2}')
13805         [ $can1 -eq $can2 ] || error $((can2-can1)) "cancel RPC occured."
13806         [ $blk1 -eq $blk2 ] || error $((blk2-blk1)) "blocking RPC occured."
13807         lru_resize_enable mdc
13808         lru_resize_enable osc
13809 }
13810 run_test 120f "Early Lock Cancel: rename test"
13811
13812 test_120g() {
13813         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13814         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13815                 skip_env "no early lock cancel on server"
13816         remote_mds_nodsh && skip "remote MDS with nodsh"
13817
13818         lru_resize_disable mdc
13819         lru_resize_disable osc
13820         count=10000
13821         echo create $count files
13822         test_mkdir $DIR/$tdir
13823         cancel_lru_locks mdc
13824         cancel_lru_locks osc
13825         t0=$(date +%s)
13826
13827         can0=$(do_facet $SINGLEMDS \
13828                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13829                awk '/ldlm_cancel/ {print $2}')
13830         blk0=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13831                awk '/ldlm_bl_callback/ {print $2}')
13832         createmany -o $DIR/$tdir/f $count
13833         sync
13834         can1=$(do_facet $SINGLEMDS \
13835                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13836                awk '/ldlm_cancel/ {print $2}')
13837         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13838                awk '/ldlm_bl_callback/ {print $2}')
13839         t1=$(date +%s)
13840         echo total: $((can1-can0)) cancels, $((blk1-blk0)) blockings
13841         echo rm $count files
13842         rm -r $DIR/$tdir
13843         sync
13844         can2=$(do_facet $SINGLEMDS \
13845                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13846                awk '/ldlm_cancel/ {print $2}')
13847         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13848                awk '/ldlm_bl_callback/ {print $2}')
13849         t2=$(date +%s)
13850         echo total: $count removes in $((t2-t1))
13851         echo total: $((can2-can1)) cancels, $((blk2-blk1)) blockings
13852         sleep 2
13853         # wait for commitment of removal
13854         lru_resize_enable mdc
13855         lru_resize_enable osc
13856 }
13857 run_test 120g "Early Lock Cancel: performance test"
13858
13859 test_121() { #bug #10589
13860         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13861
13862         rm -rf $DIR/$tfile
13863         writes=$(LANG=C dd if=/dev/zero of=$DIR/$tfile count=1 2>&1 | awk -F '+' '/out$/ {print $1}')
13864 #define OBD_FAIL_LDLM_CANCEL_RACE        0x310
13865         lctl set_param fail_loc=0x310
13866         cancel_lru_locks osc > /dev/null
13867         reads=$(LANG=C dd if=$DIR/$tfile of=/dev/null 2>&1 | awk -F '+' '/in$/ {print $1}')
13868         lctl set_param fail_loc=0
13869         [[ $reads -eq $writes ]] ||
13870                 error "read $reads blocks, must be $writes blocks"
13871 }
13872 run_test 121 "read cancel race ========="
13873
13874 test_123a_base() { # was test 123, statahead(bug 11401)
13875         local lsx="$1"
13876
13877         ost_set_temp_seq_width_all $DATA_SEQ_MAX_WIDTH
13878
13879         SLOWOK=0
13880         if ! grep -q "processor.*: 1" /proc/cpuinfo; then
13881                 log "testing UP system. Performance may be lower than expected."
13882                 SLOWOK=1
13883         fi
13884         running_in_vm && SLOWOK=1
13885
13886         $LCTL set_param mdc.*.batch_stats=0
13887
13888         rm -rf $DIR/$tdir
13889         test_mkdir $DIR/$tdir
13890         NUMFREE=$(df -i -P $DIR | tail -n 1 | awk '{ print $4 }')
13891         [[ $NUMFREE -gt 100000 ]] && NUMFREE=100000 || NUMFREE=$((NUMFREE-1000))
13892         MULT=10
13893         for ((i=100, j=0; i<=$NUMFREE; j=$i, i=$((i * MULT)) )); do
13894                 createmany -o $DIR/$tdir/$tfile $j $((i - j))
13895
13896                 max=$(lctl get_param -n llite.*.statahead_max | head -n 1)
13897                 lctl set_param -n llite.*.statahead_max 0
13898                 lctl get_param llite.*.statahead_max
13899                 cancel_lru_locks mdc
13900                 cancel_lru_locks osc
13901                 stime=$(date +%s)
13902                 time $lsx $DIR/$tdir | wc -l
13903                 etime=$(date +%s)
13904                 delta=$((etime - stime))
13905                 log "$lsx $i files without statahead: $delta sec"
13906                 lctl set_param llite.*.statahead_max=$max
13907
13908                 swrong=$(lctl get_param -n llite.*.statahead_stats |
13909                          awk '/statahead.wrong:/ { print $NF }')
13910                 lctl get_param -n llite.*.statahead_max | grep '[0-9]'
13911                 cancel_lru_locks mdc
13912                 cancel_lru_locks osc
13913                 stime=$(date +%s)
13914                 time $lsx $DIR/$tdir | wc -l
13915                 etime=$(date +%s)
13916                 delta_sa=$((etime - stime))
13917                 log "$lsx $i files with statahead: $delta_sa sec"
13918                 lctl get_param -n llite.*.statahead_stats
13919                 ewrong=$(lctl get_param -n llite.*.statahead_stats |
13920                          awk '/statahead.wrong:/ { print $NF }')
13921
13922                 [[ $swrong -lt $ewrong ]] &&
13923                         log "statahead was stopped, maybe too many locks held!"
13924                 [[ $delta -eq 0 || $delta_sa -eq 0 ]] && continue
13925
13926                 if (( $delta_sa*100 > $delta*105 && $delta_sa > $delta+2)); then
13927                         max=$(lctl get_param -n llite.*.statahead_max |
13928                                 head -n 1)
13929                         lctl set_param -n llite.*.statahead_max 0
13930                         lctl get_param llite.*.statahead_max
13931                         cancel_lru_locks mdc
13932                         cancel_lru_locks osc
13933                         stime=$(date +%s)
13934                         time $lsx $DIR/$tdir | wc -l
13935                         etime=$(date +%s)
13936                         delta=$((etime - stime))
13937                         log "$lsx $i files again without statahead: $delta sec"
13938                         lctl set_param llite.*.statahead_max=$max
13939                         if (( $delta_sa*100 > delta*105 && delta_sa > delta+2 )); then
13940                                 if [ $SLOWOK -eq 0 ]; then
13941                                         error "$lsx $i files is slower with statahead!"
13942                                 else
13943                                         log "$lsx $i files is slower with statahead!"
13944                                 fi
13945                                 break
13946                         fi
13947                 fi
13948
13949                 [ $delta -gt 20 ] && break
13950                 [ $delta -gt 8 ] && MULT=$((50 / delta))
13951                 [ "$SLOW" = "no" -a $delta -gt 5 ] && break
13952         done
13953         log "$lsx done"
13954
13955         stime=$(date +%s)
13956         rm -r $DIR/$tdir
13957         sync
13958         etime=$(date +%s)
13959         delta=$((etime - stime))
13960         log "rm -r $DIR/$tdir/: $delta seconds"
13961         log "rm done"
13962         lctl get_param -n llite.*.statahead_stats
13963         $LCTL get_param mdc.*.batch_stats
13964 }
13965
13966 test_123aa() {
13967         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13968
13969         test_123a_base "ls -l"
13970 }
13971 run_test 123aa "verify statahead work"
13972
13973 test_123ab() {
13974         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13975
13976         statx_supported || skip_env "Test must be statx() syscall supported"
13977
13978         test_123a_base "$STATX -l"
13979 }
13980 run_test 123ab "verify statahead work by using statx"
13981
13982 test_123ac() {
13983         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13984
13985         statx_supported || skip_env "Test must be statx() syscall supported"
13986
13987         local rpcs_before
13988         local rpcs_after
13989         local agl_before
13990         local agl_after
13991
13992         cancel_lru_locks $OSC
13993         rpcs_before=$(calc_stats $OSC.*$OSC*.stats ldlm_glimpse_enqueue)
13994         agl_before=$($LCTL get_param -n llite.*.statahead_stats |
13995                      awk '/agl.total:/ { print $NF }')
13996         test_123a_base "$STATX -c \"%n %i %A %h %u %g %W %X %Z\" -D"
13997         test_123a_base "$STATX --cached=always -D"
13998         agl_after=$($LCTL get_param -n llite.*.statahead_stats |
13999                     awk '/agl.total:/ { print $NF }')
14000         [ $agl_before -eq $agl_after ] ||
14001                 error "Should not trigger AGL thread - $agl_before:$agl_after"
14002         rpcs_after=$(calc_stats $OSC.*$OSC*.stats ldlm_glimpse_enqueue)
14003         [ $rpcs_after -eq $rpcs_before ] ||
14004                 error "$STATX should not send glimpse RPCs to $OSC"
14005 }
14006 run_test 123ac "verify statahead work by using statx without glimpse RPCs"
14007
14008 test_batch_statahead() {
14009         local max=$1
14010         local batch_max=$2
14011         local num=10000
14012         local batch_rpcs
14013         local unbatch_rpcs
14014         local hit_total
14015
14016         echo -e "\nbatching: statahead_max=$max statahead_batch_max=$batch_max"
14017         $LCTL set_param mdc.*.batch_stats=0
14018         $LCTL set_param llite.*.statahead_max=$max
14019         $LCTL set_param llite.*.statahead_batch_max=$batch_max
14020         # Verify that batched statahead is faster than one without statahead
14021         test_123a_base "ls -l"
14022
14023         stack_trap "rm -rf $DIR/$tdir" EXIT
14024         mkdir $DIR/$tdir || error "failed to mkdir $DIR/$tdir"
14025         createmany -o $DIR/$tdir/$tfile $num || error "failed to create files"
14026
14027         # unbatched statahead
14028         $LCTL set_param llite.*.statahead_batch_max=0
14029         $LCTL set_param llite.*.statahead_stats=clear
14030         $LCTL set_param mdc.*.stats=clear
14031         cancel_lru_locks mdc
14032         cancel_lru_locks osc
14033         time ls -l $DIR/$tdir | wc -l
14034         unbatch_rpcs=$(calc_stats mdc.*.stats ldlm_ibits_enqueue)
14035         sleep 2
14036         hit_total=$($LCTL get_param -n llite.*.statahead_stats |
14037                     awk '/hit.total:/ { print $NF }')
14038         # hit ratio should be larger than 75% (7500).
14039         (( $hit_total > 7500 )) ||
14040                 error "unbatched statahead hit count ($hit_total) is too low"
14041
14042         # batched statahead
14043         $LCTL set_param llite.*.statahead_batch_max=$batch_max
14044         $LCTL set_param llite.*.statahead_stats=clear
14045         $LCTL set_param mdc.*.batch_stats=clear
14046         $LCTL set_param mdc.*.stats=clear
14047         cancel_lru_locks mdc
14048         cancel_lru_locks osc
14049         time ls -l $DIR/$tdir | wc -l
14050         batch_rpcs=$(calc_stats mdc.*.stats mds_batch)
14051         # wait for statahead thread to quit and update statahead stats
14052         sleep 2
14053         hit_total=$($LCTL get_param -n llite.*.statahead_stats |
14054                     awk '/hit.total:/ { print $NF }')
14055         # hit ratio should be larger than 75% (7500).
14056         (( $hit_total > 7500 )) ||
14057                 error "batched statahead hit count ($hit_total) is too low"
14058
14059         echo "unbatched RPCs: $unbatch_rpcs, batched RPCs: $batch_rpcs"
14060         (( $unbatch_rpcs > $batch_rpcs )) ||
14061                 error "batched statahead does not reduce RPC count"
14062         $LCTL get_param mdc.*.batch_stats
14063 }
14064
14065 test_123ad() {
14066         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14067
14068         (( $MDS1_VERSION >= $(version_code 2.15.53) )) ||
14069                 skip "Need server version at least 2.15.53"
14070
14071         local max
14072         local batch_max
14073
14074         max=$($LCTL get_param -n llite.*.statahead_max | head -n 1)
14075         batch_max=$($LCTL get_param -n llite.*.statahead_batch_max | head -n 1)
14076
14077         stack_trap "$LCTL set_param llite.*.statahead_max=$max" EXIT
14078         stack_trap "$LCTL set_param llite.*.statahead_batch_max=$batch_max" EXIT
14079
14080         test_batch_statahead 32 32
14081         test_batch_statahead 2048 256
14082 }
14083 run_test 123ad "Verify batching statahead works correctly"
14084
14085 test_123b () { # statahead(bug 15027)
14086         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14087
14088         test_mkdir $DIR/$tdir
14089         createmany -o $DIR/$tdir/$tfile-%d 1000
14090
14091         cancel_lru_locks mdc
14092         cancel_lru_locks osc
14093
14094 #define OBD_FAIL_MDC_GETATTR_ENQUEUE     0x803
14095         lctl set_param fail_loc=0x80000803
14096         ls -lR $DIR/$tdir > /dev/null
14097         log "ls done"
14098         lctl set_param fail_loc=0x0
14099         lctl get_param -n llite.*.statahead_stats
14100         rm -r $DIR/$tdir
14101         sync
14102
14103 }
14104 run_test 123b "not panic with network error in statahead enqueue (bug 15027)"
14105
14106 test_123c() {
14107         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
14108
14109         test_mkdir -i 0 -c 1 $DIR/$tdir.0
14110         test_mkdir -i 1 -c 1 $DIR/$tdir.1
14111         touch $DIR/$tdir.1/{1..3}
14112         mv $DIR/$tdir.1/{1..3} $DIR/$tdir.0
14113
14114         remount_client $MOUNT
14115
14116         $MULTIOP $DIR/$tdir.0 Q
14117
14118         # let statahead to complete
14119         ls -l $DIR/$tdir.0 > /dev/null
14120
14121         testid=$(echo $TESTNAME | tr '_' ' ')
14122         dmesg | tac | sed "/$testid/,$ d" | grep "Can not initialize inode" &&
14123                 error "statahead warning" || true
14124 }
14125 run_test 123c "Can not initialize inode warning on DNE statahead"
14126
14127 test_123d() {
14128         local num=100
14129         local swrong
14130         local ewrong
14131
14132         test_mkdir -c -1 $DIR/$tdir || error "test_mkdir $DIR/$tdir failed"
14133         $LFS setdirstripe -D -c $MDSCOUNT $DIR/$tdir ||
14134                 error "setdirstripe $DIR/$tdir failed"
14135         createmany -d $DIR/$tdir/$tfile $num || error "createmany $num failed"
14136         remount_client $MOUNT
14137         $LCTL get_param llite.*.statahead_max
14138         $LCTL set_param llite.*.statahead_stats=0 ||
14139                 error "clear statahead_stats failed"
14140         swrong=$(lctl get_param -n llite.*.statahead_stats |
14141                  awk '/statahead.wrong:/ { print $NF }')
14142         ls -l $DIR/$tdir || error "ls -l $DIR/$tdir failed"
14143         # wait for statahead thread finished to update hit/miss stats.
14144         sleep 1
14145         $LCTL get_param -n llite.*.statahead_stats
14146         ewrong=$(lctl get_param -n llite.*.statahead_stats |
14147                  awk '/statahead.wrong:/ { print $NF }')
14148         (( $swrong == $ewrong )) ||
14149                 log "statahead was stopped, maybe too many locks held!"
14150 }
14151 run_test 123d "Statahead on striped directories works correctly"
14152
14153 test_123e() {
14154         local max
14155         local batch_max
14156         local dir=$DIR/$tdir
14157
14158         mkdir $dir || error "mkdir $dir failed"
14159         $LFS setstripe -C 32 $dir || error "setstripe $dir failed"
14160         stack_trap "rm -rf $dir"
14161
14162         touch $dir/$tfile.{0..1000} || error "touch 1000 files failed"
14163
14164         max=$($LCTL get_param -n llite.*.statahead_max | head -n 1)
14165         batch_max=$($LCTL get_param -n llite.*.statahead_batch_max | head -n 1)
14166         stack_trap "$LCTL set_param llite.*.statahead_max=$max" EXIT
14167         stack_trap "$LCTL set_param llite.*.statahead_batch_max=$batch_max" EXIT
14168
14169         $LCTL set_param llite.*.statahead_max=2048
14170         $LCTL set_param llite.*.statahead_batch_max=1024
14171
14172         ls -l $dir
14173         $LCTL get_param mdc.*.batch_stats
14174         $LCTL get_param llite.*.statahead_*
14175 }
14176 run_test 123e "statahead with large wide striping"
14177
14178 test_123f() {
14179         local max
14180         local batch_max
14181         local dir=$DIR/$tdir
14182
14183         mkdir $dir || error "mkdir $dir failed"
14184         $LFS setstripe -C 1000 $dir || error "setstripe $dir failed"
14185         stack_trap "rm -rf $dir"
14186
14187         touch $dir/$tfile.{0..200} || error "touch 200 files failed"
14188
14189         max=$($LCTL get_param -n llite.*.statahead_max | head -n 1)
14190         batch_max=$($LCTL get_param -n llite.*.statahead_batch_max | head -n 1)
14191
14192         $LCTL set_param llite.*.statahead_max=64
14193         $LCTL set_param llite.*.statahead_batch_max=64
14194
14195         ls -l $dir
14196         lctl get_param mdc.*.batch_stats
14197         lctl get_param llite.*.statahead_*
14198
14199         $LCTL set_param llite.*.statahead_max=$max
14200         $LCTL set_param llite.*.statahead_batch_max=$batch_max
14201 }
14202 run_test 123f "Retry mechanism with large wide striping files"
14203
14204 test_124a() {
14205         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14206         $LCTL get_param -n mdc.*.connect_flags | grep -q lru_resize ||
14207                 skip_env "no lru resize on server"
14208
14209         local NR=2000
14210
14211         test_mkdir $DIR/$tdir
14212
14213         log "create $NR files at $DIR/$tdir"
14214         createmany -o $DIR/$tdir/f $NR ||
14215                 error "failed to create $NR files in $DIR/$tdir"
14216
14217         cancel_lru_locks mdc
14218         ls -l $DIR/$tdir > /dev/null
14219
14220         local NSDIR=""
14221         local LRU_SIZE=0
14222         for VALUE in $($LCTL get_param ldlm.namespaces.*mdc-*.lru_size); do
14223                 local PARAM=$(echo ${VALUE[0]} | cut -d "=" -f1)
14224                 LRU_SIZE=$($LCTL get_param -n $PARAM)
14225                 if [[ $LRU_SIZE -gt $(default_lru_size) ]]; then
14226                         NSDIR=$(echo $PARAM | cut -d "." -f1-3)
14227                         log "NSDIR=$NSDIR"
14228                         log "NS=$(basename $NSDIR)"
14229                         break
14230                 fi
14231         done
14232
14233         if [[ -z "$NSDIR" || $LRU_SIZE -lt $(default_lru_size) ]]; then
14234                 skip "Not enough cached locks created!"
14235         fi
14236         log "LRU=$LRU_SIZE"
14237
14238         local SLEEP=30
14239
14240         # We know that lru resize allows one client to hold $LIMIT locks
14241         # for 10h. After that locks begin to be killed by client.
14242         local MAX_HRS=10
14243         local LIMIT=$($LCTL get_param -n $NSDIR.pool.limit)
14244         log "LIMIT=$LIMIT"
14245         if [ $LIMIT -lt $LRU_SIZE ]; then
14246                 skip "Limit is too small $LIMIT"
14247         fi
14248
14249         # Make LVF so higher that sleeping for $SLEEP is enough to _start_
14250         # killing locks. Some time was spent for creating locks. This means
14251         # that up to the moment of sleep finish we must have killed some of
14252         # them (10-100 locks). This depends on how fast ther were created.
14253         # Many of them were touched in almost the same moment and thus will
14254         # be killed in groups.
14255         local LVF=$(($MAX_HRS * 60 * 60 / $SLEEP * $LIMIT / $LRU_SIZE * 100))
14256
14257         # Use $LRU_SIZE_B here to take into account real number of locks
14258         # created in the case of CMD, LRU_SIZE_B != $NR in most of cases
14259         local LRU_SIZE_B=$LRU_SIZE
14260         log "LVF=$LVF"
14261         local OLD_LVF=$($LCTL get_param -n $NSDIR.pool.lock_volume_factor)
14262         log "OLD_LVF=$OLD_LVF"
14263         $LCTL set_param -n $NSDIR.pool.lock_volume_factor $LVF
14264
14265         # Let's make sure that we really have some margin. Client checks
14266         # cached locks every 10 sec.
14267         SLEEP=$((SLEEP+20))
14268         log "Sleep ${SLEEP} sec"
14269         local SEC=0
14270         while ((SEC<$SLEEP)); do
14271                 echo -n "..."
14272                 sleep 5
14273                 SEC=$((SEC+5))
14274                 LRU_SIZE=$($LCTL get_param -n $NSDIR/lru_size)
14275                 echo -n "$LRU_SIZE"
14276         done
14277         echo ""
14278         $LCTL set_param -n $NSDIR.pool.lock_volume_factor $OLD_LVF
14279         local LRU_SIZE_A=$($LCTL get_param -n $NSDIR.lru_size)
14280
14281         [[ $LRU_SIZE_B -gt $LRU_SIZE_A ]] || {
14282                 error "No locks dropped in ${SLEEP}s. LRU size: $LRU_SIZE_A"
14283                 unlinkmany $DIR/$tdir/f $NR
14284                 return
14285         }
14286
14287         log "Dropped "$((LRU_SIZE_B-LRU_SIZE_A))" locks in ${SLEEP}s"
14288         log "unlink $NR files at $DIR/$tdir"
14289         unlinkmany $DIR/$tdir/f $NR
14290 }
14291 run_test 124a "lru resize ======================================="
14292
14293 get_max_pool_limit()
14294 {
14295         local limit=$($LCTL get_param \
14296                       -n ldlm.namespaces.*-MDT0000-mdc-*.pool.limit)
14297         local max=0
14298         for l in $limit; do
14299                 if [[ $l -gt $max ]]; then
14300                         max=$l
14301                 fi
14302         done
14303         echo $max
14304 }
14305
14306 test_124b() {
14307         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14308         $LCTL get_param -n mdc.*.connect_flags | grep -q lru_resize ||
14309                 skip_env "no lru resize on server"
14310
14311         LIMIT=$(get_max_pool_limit)
14312
14313         NR=$(($(default_lru_size)*20))
14314         if [[ $NR -gt $LIMIT ]]; then
14315                 log "Limit lock number by $LIMIT locks"
14316                 NR=$LIMIT
14317         fi
14318
14319         IFree=$(mdsrate_inodes_available)
14320         if [ $IFree -lt $NR ]; then
14321                 log "Limit lock number by $IFree inodes"
14322                 NR=$IFree
14323         fi
14324
14325         lru_resize_disable mdc
14326         test_mkdir -p $DIR/$tdir/disable_lru_resize
14327
14328         createmany -o $DIR/$tdir/disable_lru_resize/f $NR
14329         log "doing ls -la $DIR/$tdir/disable_lru_resize 3 times"
14330         cancel_lru_locks mdc
14331         stime=`date +%s`
14332         PID=""
14333         ls -la $DIR/$tdir/disable_lru_resize > /dev/null &
14334         PID="$PID $!"
14335         sleep 2
14336         ls -la $DIR/$tdir/disable_lru_resize > /dev/null &
14337         PID="$PID $!"
14338         sleep 2
14339         ls -la $DIR/$tdir/disable_lru_resize > /dev/null &
14340         PID="$PID $!"
14341         wait $PID
14342         etime=`date +%s`
14343         nolruresize_delta=$((etime-stime))
14344         log "ls -la time: $nolruresize_delta seconds"
14345         log "lru_size = $(lctl get_param -n ldlm.namespaces.*mdc*.lru_size)"
14346         unlinkmany $DIR/$tdir/disable_lru_resize/f $NR
14347
14348         lru_resize_enable mdc
14349         test_mkdir -p $DIR/$tdir/enable_lru_resize
14350
14351         createmany -o $DIR/$tdir/enable_lru_resize/f $NR
14352         log "doing ls -la $DIR/$tdir/enable_lru_resize 3 times"
14353         cancel_lru_locks mdc
14354         stime=`date +%s`
14355         PID=""
14356         ls -la $DIR/$tdir/enable_lru_resize > /dev/null &
14357         PID="$PID $!"
14358         sleep 2
14359         ls -la $DIR/$tdir/enable_lru_resize > /dev/null &
14360         PID="$PID $!"
14361         sleep 2
14362         ls -la $DIR/$tdir/enable_lru_resize > /dev/null &
14363         PID="$PID $!"
14364         wait $PID
14365         etime=`date +%s`
14366         lruresize_delta=$((etime-stime))
14367         log "ls -la time: $lruresize_delta seconds"
14368         log "lru_size = $(lctl get_param -n ldlm.namespaces.*mdc*.lru_size)"
14369
14370         if [ $lruresize_delta -gt $nolruresize_delta ]; then
14371                 log "ls -la is $(((lruresize_delta - $nolruresize_delta) * 100 / $nolruresize_delta))% slower with lru resize enabled"
14372         elif [ $nolruresize_delta -gt $lruresize_delta ]; then
14373                 log "ls -la is $(((nolruresize_delta - $lruresize_delta) * 100 / $nolruresize_delta))% faster with lru resize enabled"
14374         else
14375                 log "lru resize performs the same with no lru resize"
14376         fi
14377         unlinkmany $DIR/$tdir/enable_lru_resize/f $NR
14378 }
14379 run_test 124b "lru resize (performance test) ======================="
14380
14381 test_124c() {
14382         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14383         $LCTL get_param -n mdc.*.connect_flags | grep -q lru_resize ||
14384                 skip_env "no lru resize on server"
14385
14386         # cache ununsed locks on client
14387         local nr=100
14388         cancel_lru_locks mdc
14389         test_mkdir $DIR/$tdir
14390         createmany -o $DIR/$tdir/f $nr ||
14391                 error "failed to create $nr files in $DIR/$tdir"
14392         ls -l $DIR/$tdir > /dev/null
14393
14394         local nsdir="ldlm.namespaces.*-MDT0000-mdc-*"
14395         local unused=$($LCTL get_param -n $nsdir.lock_unused_count)
14396         local max_age=$($LCTL get_param -n $nsdir.lru_max_age)
14397         local recalc_p=$($LCTL get_param -n $nsdir.pool.recalc_period)
14398         echo "unused=$unused, max_age=$max_age, recalc_p=$recalc_p"
14399
14400         # set lru_max_age to 1 sec
14401         $LCTL set_param $nsdir.lru_max_age=1000 # milliseconds
14402         echo "sleep $((recalc_p * 2)) seconds..."
14403         sleep $((recalc_p * 2))
14404
14405         local remaining=$($LCTL get_param -n $nsdir.lock_unused_count)
14406         # restore lru_max_age
14407         $LCTL set_param -n $nsdir.lru_max_age $max_age
14408         [ $remaining -eq 0 ] || error "$remaining locks are not canceled"
14409         unlinkmany $DIR/$tdir/f $nr
14410 }
14411 run_test 124c "LRUR cancel very aged locks"
14412
14413 test_124d() {
14414         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14415         $LCTL get_param -n mdc.*.connect_flags | grep -q lru_resize ||
14416                 skip_env "no lru resize on server"
14417
14418         # cache ununsed locks on client
14419         local nr=100
14420
14421         lru_resize_disable mdc
14422         stack_trap "lru_resize_enable mdc" EXIT
14423
14424         cancel_lru_locks mdc
14425
14426         # asynchronous object destroy at MDT could cause bl ast to client
14427         test_mkdir $DIR/$tdir
14428         createmany -o $DIR/$tdir/f $nr ||
14429                 error "failed to create $nr files in $DIR/$tdir"
14430         stack_trap "unlinkmany $DIR/$tdir/f $nr" EXIT
14431
14432         ls -l $DIR/$tdir > /dev/null
14433
14434         local nsdir="ldlm.namespaces.*-MDT0000-mdc-*"
14435         local unused=$($LCTL get_param -n $nsdir.lock_unused_count)
14436         local max_age=$($LCTL get_param -n $nsdir.lru_max_age)
14437         local recalc_p=$($LCTL get_param -n $nsdir.pool.recalc_period)
14438
14439         echo "unused=$unused, max_age=$max_age, recalc_p=$recalc_p"
14440
14441         # set lru_max_age to 1 sec
14442         $LCTL set_param $nsdir.lru_max_age=1000 # milliseconds
14443         stack_trap "$LCTL set_param -n $nsdir.lru_max_age $max_age" EXIT
14444
14445         echo "sleep $((recalc_p * 2)) seconds..."
14446         sleep $((recalc_p * 2))
14447
14448         local remaining=$($LCTL get_param -n $nsdir.lock_unused_count)
14449
14450         [ $remaining -eq 0 ] || error "$remaining locks are not canceled"
14451 }
14452 run_test 124d "cancel very aged locks if lru-resize diasbaled"
14453
14454 test_125() { # 13358
14455         $LCTL get_param -n llite.*.client_type | grep -q local ||
14456                 skip "must run as local client"
14457         $LCTL get_param -n mdc.*-mdc-*.connect_flags | grep -q acl ||
14458                 skip_env "must have acl enabled"
14459         [ -z "$(which setfacl)" ] && skip_env "must have setfacl tool"
14460         id $USER0 || skip_env "missing user $USER0"
14461
14462         test_mkdir $DIR/$tdir
14463         $LFS setstripe -S 65536 -c -1 $DIR/$tdir || error "setstripe failed"
14464         setfacl -R -m u:$USER0:rwx $DIR/$tdir ||
14465                 error "setfacl $DIR/$tdir failed"
14466         ls -ld $DIR/$tdir || error "cannot access $DIR/$tdir"
14467 }
14468 run_test 125 "don't return EPROTO when a dir has a non-default striping and ACLs"
14469
14470 test_126() { # bug 12829/13455
14471         $GSS && skip_env "must run as gss disabled"
14472         $LCTL get_param -n llite.*.client_type | grep -q local ||
14473                 skip "must run as local client"
14474         [ "$UID" != 0 ] && skip "must run as root, not UID $UID"
14475
14476         $RUNAS -u 0 -g 1 touch $DIR/$tfile || error "touch failed"
14477         gid=`ls -n $DIR/$tfile | awk '{print $4}'`
14478         rm -f $DIR/$tfile
14479         [ $gid -eq "1" ] || error "gid is set to" $gid "instead of 1"
14480 }
14481 run_test 126 "check that the fsgid provided by the client is taken into account"
14482
14483 test_127a() { # bug 15521
14484         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14485         local name count samp unit min max sum sumsq
14486         local tmpfile=$TMP/$tfile.tmp
14487
14488         # enable stats header if it is disabled
14489         $LCTL set_param enable_stats_header=1
14490
14491         $LFS setstripe -i 0 -c 1 $DIR/$tfile || error "setstripe failed"
14492         echo "stats before reset"
14493         stack_trap "rm -f $tmpfile"
14494         local now=$(date +%s)
14495
14496         $LCTL get_param osc.*.stats | tee $tmpfile
14497
14498         local snapshot_time=$(awk '/snapshot_time/ { print $2; exit }' $tmpfile)
14499         local start_time=$(awk '/start_time/ { print $2; exit }' $tmpfile)
14500         local elapsed=$(awk '/elapsed_time/ { print $2; exit }' $tmpfile)
14501         local uptime=$(awk '{ print $1 }' /proc/uptime)
14502
14503         # snapshot_time should match POSIX epoch time, allow some delta for VMs
14504         (( ${snapshot_time%\.*} >= $now - 5 &&
14505            ${snapshot_time%\.*} <= $now + 5 )) ||
14506                 error "snapshot_time=$snapshot_time != now=$now"
14507         # elapsed _should_ be from mount, but at least less than uptime
14508         (( ${elapsed%\.*} < ${uptime%\.*} )) ||
14509                 error "elapsed=$elapsed > uptime=$uptime"
14510         (( ${snapshot_time%\.*} - ${start_time%\.*} >= ${elapsed%\.*} - 2 &&
14511            ${snapshot_time%\.*} - ${start_time%\.*} <= ${elapsed%\.*} + 2 )) ||
14512                 error "elapsed=$elapsed != $snapshot_time - $start_time"
14513
14514         $LCTL set_param osc.*.stats=0
14515         local reset=$(date +%s)
14516         local fsize=$((2048 * 1024))
14517
14518         dd if=/dev/zero of=$DIR/$tfile bs=$fsize count=1
14519         cancel_lru_locks osc
14520         dd if=$DIR/$tfile of=/dev/null bs=$fsize
14521
14522         now=$(date +%s)
14523         $LCTL get_param osc.*0000-osc-*.stats > $tmpfile
14524         while read name count samp unit min max sum sumsq; do
14525                 [[ "$samp" == "samples" ]] || continue
14526
14527                 echo "got name=$name count=$count unit=$unit min=$min max=$max"
14528                 [ ! $min ] && error "Missing min value for $name proc entry"
14529                 eval $name=$count || error "Wrong proc format"
14530
14531                 case $name in
14532                 read_bytes|write_bytes)
14533                         [[ "$unit" =~ "bytes" ]] ||
14534                                 error "unit is not 'bytes': $unit"
14535                         (( $min >= 4096 )) || error "min is too small: $min"
14536                         (( $min <= $fsize )) || error "min is too big: $min"
14537                         (( $max >= 4096 )) || error "max is too small: $max"
14538                         (( $max <= $fsize )) || error "max is too big: $max"
14539                         (( $sum == $fsize )) || error "sum is wrong: $sum"
14540                         (( $sumsq >= ($fsize / 4096) * (4096 * 4096) )) ||
14541                                 error "sumsquare is too small: $sumsq"
14542                         (( $sumsq <= $fsize * $fsize )) ||
14543                                 error "sumsquare is too big: $sumsq"
14544                         ;;
14545                 ost_read|ost_write)
14546                         [[ "$unit" =~ "usec" ]] ||
14547                                 error "unit is not 'usec': $unit"
14548                         ;;
14549                 *)      ;;
14550                 esac
14551         done < $tmpfile
14552
14553         #check that we actually got some stats
14554         [ "$read_bytes" ] || error "Missing read_bytes stats"
14555         [ "$write_bytes" ] || error "Missing write_bytes stats"
14556         [ "$read_bytes" != 0 ] || error "no read done"
14557         [ "$write_bytes" != 0 ] || error "no write done"
14558
14559         snapshot_time=$(awk '/snapshot_time/ { print $2; exit }' $tmpfile)
14560         start_time=$(awk '/start_time/ { print $2; exit }' $tmpfile)
14561         elapsed=$(awk '/elapsed_time/ { print $2; exit }' $tmpfile)
14562
14563         # snapshot_time should match POSIX epoch time, allow some delta for VMs
14564         (( ${snapshot_time%\.*} >= $now - 5 &&
14565            ${snapshot_time%\.*} <= $now + 5 )) ||
14566                 error "reset snapshot_time=$snapshot_time != now=$now"
14567         # elapsed should be from time of stats reset
14568         (( ${elapsed%\.*} >= $now - $reset - 2 &&
14569            ${elapsed%\.*} <= $now - $reset + 2 )) ||
14570                 error "reset elapsed=$elapsed > $now - $reset"
14571         (( ${snapshot_time%\.*} - ${start_time%\.*} >= ${elapsed%\.*} - 2 &&
14572            ${snapshot_time%\.*} - ${start_time%\.*} <= ${elapsed%\.*} + 2 )) ||
14573                 error "reset elapsed=$elapsed != $snapshot_time - $start_time"
14574 }
14575 run_test 127a "verify the client stats are sane"
14576
14577 test_127b() { # bug LU-333
14578         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14579         local name count samp unit min max sum sumsq
14580
14581         echo "stats before reset"
14582         $LCTL get_param llite.*.stats
14583         $LCTL set_param llite.*.stats=0
14584
14585         # perform 2 reads and writes so MAX is different from SUM.
14586         dd if=/dev/zero of=$DIR/$tfile bs=$PAGE_SIZE count=1
14587         dd if=/dev/zero of=$DIR/$tfile bs=$PAGE_SIZE count=1
14588         cancel_lru_locks osc
14589         dd if=$DIR/$tfile of=/dev/null bs=$PAGE_SIZE count=1
14590         dd if=$DIR/$tfile of=/dev/null bs=$PAGE_SIZE count=1
14591
14592         $LCTL get_param llite.*.stats | grep samples > $TMP/$tfile.tmp
14593         stack_trap "rm -f $TMP/$tfile.tmp"
14594         while read name count samp unit min max sum sumsq; do
14595                 echo "got name=$name count=$count unit=$unit min=$min max=$max"
14596                 eval $name=$count || error "Wrong proc format"
14597
14598                 case $name in
14599                 read_bytes|write_bytes)
14600                         [[ "$unit" =~ "bytes" ]] ||
14601                                 error "unit is not 'bytes': $unit"
14602                         (( $count == 2 )) || error "count is not 2: $count"
14603                         (( $min == $PAGE_SIZE )) ||
14604                                 error "min is not $PAGE_SIZE: $min"
14605                         (( $max == $PAGE_SIZE )) ||
14606                                 error "max is not $PAGE_SIZE: $max"
14607                         (( $sum == $PAGE_SIZE * 2 )) ||
14608                                 error "sum is not $((PAGE_SIZE * 2)): $sum"
14609                         ;;
14610                 read|write)
14611                         [[ "$unit" =~ "usec" ]] ||
14612                                 error "unit is not 'usec': $unit"
14613                         ;;
14614                 *)      ;;
14615                 esac
14616         done < $TMP/$tfile.tmp
14617
14618         #check that we actually got some stats
14619         [ "$read_bytes" ] || error "Missing read_bytes stats"
14620         [ "$write_bytes" ] || error "Missing write_bytes stats"
14621         [ "$read_bytes" != 0 ] || error "no read done"
14622         [ "$write_bytes" != 0 ] || error "no write done"
14623 }
14624 run_test 127b "verify the llite client stats are sane"
14625
14626 test_127c() { # LU-12394
14627         [ "$OSTCOUNT" -lt "2" ] && skip_env "needs >= 2 OSTs"
14628         local size
14629         local bsize
14630         local reads
14631         local writes
14632         local count
14633
14634         $LCTL set_param llite.*.extents_stats=1
14635         stack_trap "$LCTL set_param llite.*.extents_stats=0" EXIT
14636
14637         # Use two stripes so there is enough space in default config
14638         $LFS setstripe -c 2 $DIR/$tfile
14639
14640         # Extent stats start at 0-4K and go in power of two buckets
14641         # LL_HIST_START = 12 --> 2^12 = 4K
14642         # We do 3K*2^i, so 3K, 6K, 12K, 24K... hitting each bucket.
14643         # We do not do buckets larger than 64 MiB to avoid ENOSPC issues on
14644         # small configs
14645         for size in 3K 6K 12K 24K 48K 96K 192K 384K 768K 1536K 3M 6M 12M 24M 48M;
14646                 do
14647                 # Write and read, 2x each, second time at a non-zero offset
14648                 dd if=/dev/zero of=$DIR/$tfile bs=$size count=1
14649                 dd if=/dev/zero of=$DIR/$tfile bs=$size count=1 seek=10
14650                 dd if=$DIR/$tfile of=/dev/null bs=$size count=1
14651                 dd if=$DIR/$tfile of=/dev/null bs=$size count=1 seek=10
14652                 rm -f $DIR/$tfile
14653         done
14654
14655         $LCTL get_param llite.*.extents_stats
14656
14657         count=2
14658         for bsize in 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M;
14659                 do
14660                 local bucket=$($LCTL get_param -n llite.*.extents_stats |
14661                                 grep -m 1 $bsize)
14662                 reads=$(echo $bucket | awk '{print $5}')
14663                 writes=$(echo $bucket | awk '{print $9}')
14664                 [ "$reads" -eq $count ] ||
14665                         error "$reads reads in < $bsize bucket, expect $count"
14666                 [ "$writes" -eq $count ] ||
14667                         error "$writes writes in < $bsize bucket, expect $count"
14668         done
14669
14670         # Test mmap write and read
14671         $LCTL set_param llite.*.extents_stats=c
14672         size=512
14673         dd if=/dev/zero of=$DIR/$tfile bs=${size}K count=1
14674         $MULTIOP $DIR/$tfile OSMRUc || error "$MULTIOP $DIR/$tfile failed"
14675         $MULTIOP $DIR/$tfile OSMWUc || error "$MULTIOP $DIR/$tfile failed"
14676
14677         $LCTL get_param llite.*.extents_stats
14678
14679         count=$(((size*1024) / PAGE_SIZE))
14680
14681         bsize=$((2 * PAGE_SIZE / 1024))K
14682
14683         bucket=$($LCTL get_param -n llite.*.extents_stats |
14684                         grep -m 1 $bsize)
14685         reads=$(echo $bucket | awk '{print $5}')
14686         writes=$(echo $bucket | awk '{print $9}')
14687         # mmap writes fault in the page first, creating an additonal read
14688         [ "$reads" -eq $((2 * count)) ] ||
14689                 error "$reads reads in < $bsize bucket, expect $count"
14690         [ "$writes" -eq $count ] ||
14691                 error "$writes writes in < $bsize bucket, expect $count"
14692 }
14693 run_test 127c "test llite extent stats with regular & mmap i/o"
14694
14695 test_128() { # bug 15212
14696         touch $DIR/$tfile
14697         $LFS 2>&1 <<-EOF | tee $TMP/$tfile.log
14698                 find $DIR/$tfile
14699                 find $DIR/$tfile
14700         EOF
14701
14702         result=$(grep error $TMP/$tfile.log)
14703         rm -f $DIR/$tfile $TMP/$tfile.log
14704         [ -z "$result" ] ||
14705                 error "consecutive find's under interactive lfs failed"
14706 }
14707 run_test 128 "interactive lfs for 2 consecutive find's"
14708
14709 set_dir_limits () {
14710         local mntdev
14711         local canondev
14712         local node
14713
14714         local ldproc=/proc/fs/ldiskfs
14715         local facets=$(get_facets MDS)
14716
14717         for facet in ${facets//,/ }; do
14718                 canondev=$(ldiskfs_canon \
14719                            *.$(convert_facet2label $facet).mntdev $facet)
14720                 do_facet $facet "test -e $ldproc/$canondev/max_dir_size" ||
14721                         ldproc=/sys/fs/ldiskfs
14722                 do_facet $facet "echo $1 >$ldproc/$canondev/max_dir_size"
14723                 do_facet $facet "echo $2 >$ldproc/$canondev/warning_dir_size"
14724         done
14725 }
14726
14727 check_mds_dmesg() {
14728         local facets=$(get_facets MDS)
14729         for facet in ${facets//,/ }; do
14730                 do_facet $facet "dmesg | tail -3 | grep $1" && return 0
14731         done
14732         return 1
14733 }
14734
14735 test_129() {
14736         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14737         [[ $MDS1_VERSION -ge $(version_code 2.5.56) ]] ||
14738                 skip "Need MDS version with at least 2.5.56"
14739         if [ "$mds1_FSTYPE" != ldiskfs ]; then
14740                 skip_env "ldiskfs only test"
14741         fi
14742         remote_mds_nodsh && skip "remote MDS with nodsh"
14743
14744         local ENOSPC=28
14745         local has_warning=false
14746
14747         rm -rf $DIR/$tdir
14748         mkdir -p $DIR/$tdir
14749
14750         # block size of mds1
14751         local maxsize=$(($($LCTL get_param -n mdc.*MDT0000*.blocksize) * 8))
14752         set_dir_limits $maxsize $((maxsize * 6 / 8))
14753         stack_trap "set_dir_limits 0 0"
14754         stack_trap "unlinkmany $DIR/$tdir/file_base_ 2000 || true"
14755         local dirsize=$(stat -c%s "$DIR/$tdir")
14756         local nfiles=0
14757         while (( $dirsize <= $maxsize )); do
14758                 $MCREATE $DIR/$tdir/file_base_$nfiles
14759                 rc=$?
14760                 # check two errors:
14761                 # ENOSPC for ext4 max_dir_size, which has been used since
14762                 # kernel v3.6-rc1-8-gdf981d03ee, lustre v2_4_50_0-79-gaed82035c0
14763                 if (( rc == ENOSPC )); then
14764                         set_dir_limits 0 0
14765                         echo "rc=$rc returned as expected after $nfiles files"
14766
14767                         createmany -o $DIR/$tdir/file_extra_$nfiles. 5 ||
14768                                 error "create failed w/o dir size limit"
14769
14770                         # messages may be rate limited if test is run repeatedly
14771                         check_mds_dmesg '"is approaching max"' ||
14772                                 echo "warning message should be output"
14773                         check_mds_dmesg '"has reached max"' ||
14774                                 echo "reached message should be output"
14775
14776                         dirsize=$(stat -c%s "$DIR/$tdir")
14777
14778                         [[ $dirsize -ge $maxsize ]] && return 0
14779                         error "dirsize $dirsize < $maxsize after $nfiles files"
14780                 elif (( rc != 0 )); then
14781                         break
14782                 fi
14783                 nfiles=$((nfiles + 1))
14784                 dirsize=$(stat -c%s "$DIR/$tdir")
14785         done
14786
14787         error "rc=$rc, size=$dirsize/$maxsize, mdt=$MDSCOUNT, nfiles=$nfiles"
14788 }
14789 run_test 129 "test directory size limit ========================"
14790
14791 OLDIFS="$IFS"
14792 cleanup_130() {
14793         trap 0
14794         IFS="$OLDIFS"
14795         rm -f $DIR/$tfile
14796 }
14797
14798 test_130a() {
14799         local filefrag_op=$(filefrag -e 2>&1 | grep "invalid option")
14800         [[ -z "$filefrag_op" ]] || skip_env "filefrag does not support FIEMAP"
14801
14802         trap cleanup_130 EXIT RETURN
14803
14804         local fm_file=$DIR/$tfile
14805         $LFS setstripe -S 65536 -c 1 $fm_file || error "setstripe on $fm_file"
14806         dd if=/dev/zero of=$fm_file bs=65536 count=1 ||
14807                 error "dd failed for $fm_file"
14808
14809         # LU-1795: test filefrag/FIEMAP once, even if unsupported on ZFS
14810         filefrag -ves $fm_file
14811         local rc=$?
14812         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14813                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14814         (( $rc == 0 )) || error "filefrag $fm_file failed"
14815
14816         filefrag_op=$(filefrag -ve -k $fm_file |
14817                       sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
14818         local lun=$($LFS getstripe -i $fm_file)
14819
14820         local start_blk=$(echo $filefrag_op | cut -d: -f2 | cut -d. -f1)
14821         IFS=$'\n'
14822         local tot_len=0
14823         for line in $filefrag_op; do
14824                 local frag_lun=$(echo $line | cut -d: -f5)
14825                 local ext_len=$(echo $line | cut -d: -f4)
14826
14827                 if (( $frag_lun != $lun )); then
14828                         error "FIEMAP on 1-stripe file($fm_file) failed"
14829                         return
14830                 fi
14831                 (( tot_len += ext_len ))
14832         done
14833
14834         if (( lun != frag_lun || start_blk != 0 || tot_len != 64 )); then
14835                 error "FIEMAP on 1-stripe file($fm_file) failed"
14836                 return
14837         fi
14838
14839         echo "FIEMAP on single striped file succeeded"
14840 }
14841 run_test 130a "FIEMAP (1-stripe file)"
14842
14843 test_130b() {
14844         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
14845
14846         local filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
14847         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
14848         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14849                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14850
14851         trap cleanup_130 EXIT RETURN
14852
14853         local fm_file=$DIR/$tfile
14854         $LFS setstripe -S 65536 -c $OSTCOUNT $fm_file ||
14855                 error "setstripe on $fm_file"
14856
14857         dd if=/dev/zero of=$fm_file bs=1M count=$OSTCOUNT ||
14858                 error "dd failed on $fm_file"
14859
14860         filefrag -ves $fm_file || error "filefrag $fm_file failed"
14861         filefrag_op=$(filefrag -ve -k $fm_file |
14862                       sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
14863
14864         local last_lun=$(echo $filefrag_op | cut -d: -f5 |
14865                          sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14866
14867         IFS=$'\n'
14868         local tot_len=0
14869         local num_luns=1
14870
14871         for line in $filefrag_op; do
14872                 local frag_lun=$(echo $line | cut -d: -f5 |
14873                                  sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14874                 local ext_len=$(echo $line | cut -d: -f4)
14875                 if (( $frag_lun != $last_lun )); then
14876                         if (( tot_len != 1024 )); then
14877                                 error "FIEMAP on $fm_file failed; returned len $tot_len for OST $last_lun instead of 1024"
14878                                 return
14879                         else
14880                                 (( num_luns += 1 ))
14881                                 tot_len=0
14882                         fi
14883                 fi
14884                 (( tot_len += ext_len ))
14885                 last_lun=$frag_lun
14886         done
14887         if (( num_luns != $OSTCOUNT || tot_len != 1024 )); then
14888                 error "FIEMAP on $fm_file failed; returned wrong number of luns or wrong len for OST $last_lun"
14889                 return
14890         fi
14891
14892         echo "FIEMAP on $OSTCOUNT-stripe file succeeded"
14893 }
14894 run_test 130b "FIEMAP ($OSTCOUNT-stripe file)"
14895
14896 test_130c() {
14897         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
14898
14899         local filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
14900         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
14901         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14902                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14903
14904         trap cleanup_130 EXIT RETURN
14905
14906         local fm_file=$DIR/$tfile
14907         $LFS setstripe -S 65536 -c 2 $fm_file || error "setstripe on $fm_file"
14908
14909         dd if=/dev/zero of=$fm_file seek=1 bs=1M count=1 ||
14910                 error "dd failed on $fm_file"
14911
14912         filefrag -ves $fm_file || error "filefrag $fm_file failed"
14913         filefrag_op=$(filefrag -ve -k $fm_file |
14914                       sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
14915
14916         local last_lun=$(echo $filefrag_op | cut -d: -f5 |
14917                          sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14918
14919         IFS=$'\n'
14920         local tot_len=0
14921         local num_luns=1
14922         for line in $filefrag_op; do
14923                 local frag_lun=$(echo $line | cut -d: -f5 |
14924                                  sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14925                 local ext_len=$(echo $line | cut -d: -f4)
14926                 if (( $frag_lun != $last_lun )); then
14927                         local logical=$(echo $line | cut -d: -f2 | cut -d. -f1)
14928                         if (( logical != 512 )); then
14929                                 error "FIEMAP on $fm_file failed; returned logical start for lun $logical instead of 512"
14930                                 return
14931                         fi
14932                         if (( tot_len != 512 )); then
14933                                 error "FIEMAP on $fm_file failed; returned len $tot_len for OST $last_lun instead of 1024"
14934                                 return
14935                         else
14936                                 (( num_luns += 1 ))
14937                                 tot_len=0
14938                         fi
14939                 fi
14940                 (( tot_len += ext_len ))
14941                 last_lun=$frag_lun
14942         done
14943         if (( num_luns != 2 || tot_len != 512 )); then
14944                 error "FIEMAP on $fm_file failed; returned wrong number of luns or wrong len for OST $last_lun"
14945                 return
14946         fi
14947
14948         echo "FIEMAP on 2-stripe file with hole succeeded"
14949 }
14950 run_test 130c "FIEMAP (2-stripe file with hole)"
14951
14952 test_130d() {
14953         (( $OSTCOUNT >= 3 )) || skip "needs >= 3 OSTs"
14954
14955         filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
14956         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
14957         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14958                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14959
14960         trap cleanup_130 EXIT RETURN
14961
14962         local fm_file=$DIR/$tfile
14963         $LFS setstripe -S 65536 -c $OSTCOUNT $fm_file ||
14964                         error "setstripe on $fm_file"
14965
14966         local actual_stripe_count=$($LFS getstripe -c $fm_file)
14967         dd if=/dev/zero of=$fm_file bs=1M count=$actual_stripe_count ||
14968                 error "dd failed on $fm_file"
14969
14970         filefrag -ves $fm_file || error "filefrag $fm_file failed"
14971         filefrag_op=$(filefrag -ve -k $fm_file |
14972                       sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
14973
14974         local last_lun=$(echo $filefrag_op | cut -d: -f5 |
14975                          sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14976
14977         IFS=$'\n'
14978         local tot_len=0
14979         local num_luns=1
14980         for line in $filefrag_op; do
14981                 local frag_lun=$(echo $line | cut -d: -f5 |
14982                                  sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14983                 local ext_len=$(echo $line | cut -d: -f4)
14984                 if (( $frag_lun != $last_lun )); then
14985                         if (( tot_len != 1024 )); then
14986                                 error "FIEMAP on $fm_file failed; returned len $tot_len for OST $last_lun instead of 1024"
14987                                 return
14988                         else
14989                                 (( num_luns += 1 ))
14990                                 local tot_len=0
14991                         fi
14992                 fi
14993                 (( tot_len += ext_len ))
14994                 last_lun=$frag_lun
14995         done
14996         if (( num_luns != actual_stripe_count || tot_len != 1024 )); then
14997                 error "FIEMAP on $fm_file failed; returned wrong number of luns or wrong len for OST $last_lun"
14998                 return
14999         fi
15000
15001         echo "FIEMAP on N-stripe file succeeded"
15002 }
15003 run_test 130d "FIEMAP (N-stripe file)"
15004
15005 test_130e() {
15006         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
15007
15008         local filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
15009         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
15010         [[ "$ost1_FSTYPE" != "zfs" ]] ||
15011                 skip "LU-1941: FIEMAP unimplemented on ZFS"
15012
15013         trap cleanup_130 EXIT RETURN
15014
15015         local fm_file=$DIR/$tfile
15016         $LFS setstripe -S 131072 -c 2 $fm_file || error "setstripe on $fm_file"
15017         stack_trap "rm -f $fm_file"
15018
15019         local num_blks=512
15020         local expected_len=$(( (num_blks / 2) * 64 ))
15021         for ((i = 0; i < $num_blks; i++)); do
15022                 dd if=/dev/zero of=$fm_file count=1 bs=64k seek=$((2*$i)) \
15023                         conv=notrunc > /dev/null 2>&1
15024         done
15025
15026         filefrag -ves $fm_file || error "filefrag $fm_file failed"
15027         filefrag_op=$(filefrag -ve -k $fm_file |
15028                       sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
15029
15030         local last_lun=$(echo $filefrag_op | cut -d: -f5)
15031
15032         IFS=$'\n'
15033         local tot_len=0
15034         local num_luns=1
15035         for line in $filefrag_op; do
15036                 local frag_lun=$(echo $line | cut -d: -f5)
15037                 local ext_len=$(echo $line | cut -d: -f4)
15038                 if (( $frag_lun != $last_lun )); then
15039                         if (( tot_len != $expected_len )); then
15040                                 error "OST$last_lun $tot_len != $expected_len"
15041                         else
15042                                 (( num_luns += 1 ))
15043                                 tot_len=0
15044                         fi
15045                 fi
15046                 (( tot_len += ext_len ))
15047                 last_lun=$frag_lun
15048         done
15049         if (( num_luns != 2 || tot_len != $expected_len )); then
15050                 error "OST$last_lun $num_luns != 2, $tot_len != $expected_len"
15051         fi
15052
15053         echo "FIEMAP with continuation calls succeeded"
15054 }
15055 run_test 130e "FIEMAP (test continuation FIEMAP calls)"
15056
15057 test_130f() {
15058         local filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
15059         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
15060         [[ "$ost1_FSTYPE" != "zfs" ]] ||
15061                 skip "LU-1941: FIEMAP unimplemented on ZFS"
15062
15063         local fm_file=$DIR/$tfile
15064         $MULTIOP $fm_file oO_RDWR:O_CREAT:O_LOV_DELAY_CREATE:T33554432c ||
15065                 error "multiop create with lov_delay_create on $fm_file"
15066
15067         filefrag -ves $fm_file || error "filefrag $fm_file failed"
15068         filefrag_extents=$(filefrag -vek $fm_file |
15069                            awk '/extents? found/ { print $2 }')
15070         if (( $filefrag_extents != 0 )); then
15071                 error "$fm_file: filefrag_extents=$filefrag_extents != 0"
15072         fi
15073
15074         rm -f $fm_file
15075 }
15076 run_test 130f "FIEMAP (unstriped file)"
15077
15078 test_130g() {
15079         (( $MDS1_VERSION >= $(version_code 2.12.53) )) ||
15080                 skip "Need MDS version with at least 2.12.53 for overstriping"
15081         local filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
15082         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
15083         [[ "$ost1_FSTYPE" != "zfs" ]] ||
15084                 skip "LU-1941: FIEMAP unimplemented on ZFS"
15085
15086         local file=$DIR/$tfile
15087         local nr=$((OSTCOUNT * 100))
15088
15089         $LFS setstripe -C $nr $file || error "failed to setstripe -C $nr $file"
15090
15091         stack_trap "rm -f $file"
15092         dd if=/dev/zero of=$file count=$nr bs=1M
15093         sync
15094         nr=$($LFS getstripe -c $file)
15095
15096         local extents=$(filefrag -v $file |
15097                         sed -n '/ext:/,/found/{/ext:/d; /found/d; p}' | wc -l)
15098
15099         echo "filefrag list $extents extents in file with stripecount $nr"
15100         if (( extents < nr )); then
15101                 $LFS getstripe $file
15102                 filefrag -v $file
15103                 error "filefrag printed $extents < $nr extents"
15104         fi
15105 }
15106 run_test 130g "FIEMAP (overstripe file)"
15107
15108 # Test for writev/readv
15109 test_131a() {
15110         rwv -f $DIR/$tfile -w -n 3 524288 1048576 1572864 ||
15111                 error "writev test failed"
15112         rwv -f $DIR/$tfile -r -v -n 2 1572864 1048576 ||
15113                 error "readv failed"
15114         rm -f $DIR/$tfile
15115 }
15116 run_test 131a "test iov's crossing stripe boundary for writev/readv"
15117
15118 test_131b() {
15119         local fsize=$((524288 + 1048576 + 1572864))
15120         rwv -f $DIR/$tfile -w -a -n 3 524288 1048576 1572864 &&
15121                 $CHECKSTAT -t file $DIR/$tfile -s $fsize ||
15122                         error "append writev test failed"
15123
15124         ((fsize += 1572864 + 1048576))
15125         rwv -f $DIR/$tfile -w -a -n 2 1572864 1048576 &&
15126                 $CHECKSTAT -t file $DIR/$tfile -s $fsize ||
15127                         error "append writev test failed"
15128         rm -f $DIR/$tfile
15129 }
15130 run_test 131b "test append writev"
15131
15132 test_131c() {
15133         rwv -f $DIR/$tfile -w -d -n 1 1048576 || return 0
15134         error "NOT PASS"
15135 }
15136 run_test 131c "test read/write on file w/o objects"
15137
15138 test_131d() {
15139         rwv -f $DIR/$tfile -w -n 1 1572864
15140         NOB=`rwv -f $DIR/$tfile -r -n 3 524288 524288 1048576 | awk '/error/ {print $6}'`
15141         if [ "$NOB" != 1572864 ]; then
15142                 error "Short read filed: read $NOB bytes instead of 1572864"
15143         fi
15144         rm -f $DIR/$tfile
15145 }
15146 run_test 131d "test short read"
15147
15148 test_131e() {
15149         rwv -f $DIR/$tfile -w -s 1048576 -n 1 1048576
15150         rwv -f $DIR/$tfile -r -z -s 0 -n 1 524288 || \
15151         error "read hitting hole failed"
15152         rm -f $DIR/$tfile
15153 }
15154 run_test 131e "test read hitting hole"
15155
15156 check_stats() {
15157         local facet=$1
15158         local op=$2
15159         local want=${3:-0}
15160         local res
15161
15162         # open             11 samples [usecs] 468 4793 13658 35791898
15163         case $facet in
15164         mds*) res=($(do_facet $facet \
15165                    $LCTL get_param mdt.$FSNAME-MDT0000.md_stats | grep "$op"))
15166                  ;;
15167         ost*) res=($(do_facet $facet \
15168                   $LCTL get_param obdfilter.$FSNAME-OST0000.stats | grep "$op"))
15169                  ;;
15170         *) error "Wrong facet '$facet'" ;;
15171         esac
15172         [[ -n "$res" ]] || error "counter for $op on $facet not incremented"
15173         # if $want is zero, it means any stat increment is ok.
15174         if (( $want > 0 )); then
15175                 local count=${res[1]}
15176
15177                 if (( $count != $want )); then
15178                         if [[ $facet =~ "mds" ]]; then
15179                                 do_nodes $(comma_list $(mdts_nodes)) \
15180                                         $LCTL get_param mdt.*.md_stats
15181                         else
15182                                 do_nodes $(comma_list $(osts-nodes)) \
15183                                         $LCTL get_param obdfilter.*.stats
15184                         fi
15185                         error "The $op counter on $facet is $count, not $want"
15186                 fi
15187         fi
15188 }
15189
15190 test_133a() {
15191         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15192         remote_ost_nodsh && skip "remote OST with nodsh"
15193         remote_mds_nodsh && skip "remote MDS with nodsh"
15194         do_facet $SINGLEMDS $LCTL list_param mdt.*.rename_stats ||
15195                 skip_env "MDS doesn't support rename stats"
15196
15197         local testdir=$DIR/${tdir}/stats_testdir
15198
15199         mkdir -p $DIR/${tdir}
15200
15201         # clear stats.
15202         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15203         do_facet ost1 $LCTL set_param obdfilter.*.stats=clear
15204
15205         # verify mdt stats first.
15206         mkdir_on_mdt0 ${testdir} || error "mkdir_on_mdt0 failed"
15207         check_stats $SINGLEMDS "mkdir" 1
15208
15209         # clear "open" from "lfs mkdir" above
15210         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15211         touch ${testdir}/${tfile} || error "touch failed"
15212         check_stats $SINGLEMDS "open" 1
15213         check_stats $SINGLEMDS "close" 1
15214         [ $MDS1_VERSION -ge $(version_code 2.8.54) ] && {
15215                 mknod ${testdir}/${tfile}-pipe p || error "mknod failed"
15216                 check_stats $SINGLEMDS "mknod" 2
15217         }
15218         rm -f ${testdir}/${tfile}-pipe || error "pipe remove failed"
15219         check_stats $SINGLEMDS "unlink" 1
15220         rm -f ${testdir}/${tfile} || error "file remove failed"
15221         check_stats $SINGLEMDS "unlink" 2
15222
15223         # remove working dir and check mdt stats again.
15224         rmdir ${testdir} || error "rmdir failed"
15225         check_stats $SINGLEMDS "rmdir" 1
15226
15227         local testdir1=$DIR/${tdir}/stats_testdir1
15228         mkdir_on_mdt0 -p ${testdir}
15229         mkdir_on_mdt0 -p ${testdir1}
15230         touch ${testdir1}/test1
15231         mv ${testdir1}/test1 ${testdir} || error "file crossdir rename"
15232         check_stats $SINGLEMDS "crossdir_rename" 1
15233
15234         mv ${testdir}/test1 ${testdir}/test0 || error "file samedir rename"
15235         check_stats $SINGLEMDS "samedir_rename" 1
15236
15237         rm -rf $DIR/${tdir}
15238 }
15239 run_test 133a "Verifying MDT stats ========================================"
15240
15241 test_133b() {
15242         local res
15243
15244         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15245         remote_ost_nodsh && skip "remote OST with nodsh"
15246         remote_mds_nodsh && skip "remote MDS with nodsh"
15247
15248         local testdir=$DIR/${tdir}/stats_testdir
15249
15250         mkdir -p $DIR/$tdir || error "mkdir $tdir failed"
15251         mkdir_on_mdt0 ${testdir} || error "mkdir_on_mdt0 failed"
15252         touch ${testdir}/${tfile} || error "touch failed"
15253         cancel_lru_locks mdc
15254
15255         # clear stats.
15256         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15257         do_facet ost1 $LCTL set_param obdfilter.*.stats=clear
15258
15259         # extra mdt stats verification.
15260         chmod 444 ${testdir}/${tfile} || error "chmod failed"
15261         check_stats $SINGLEMDS "setattr" 1
15262         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15263         if [ $MDS1_VERSION -ne $(version_code 2.2.0) ]
15264         then            # LU-1740
15265                 ls -l ${testdir}/${tfile} > /dev/null|| error "ls failed"
15266                 check_stats $SINGLEMDS "getattr" 1
15267         fi
15268         rm -rf $DIR/${tdir}
15269
15270         # when DNE is enabled, MDT uses STATFS RPC to ping other targets
15271         # so the check below is not reliable
15272         [ $MDSCOUNT -eq 1 ] || return 0
15273
15274         # Sleep to avoid a cached response.
15275         #define OBD_STATFS_CACHE_SECONDS 1
15276         sleep 2
15277         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15278         do_facet ost1 $LCTL set_param obdfilter.*.exports.*.stats=clear
15279         $LFS df || error "lfs failed"
15280         check_stats $SINGLEMDS "statfs" 1
15281
15282         # check aggregated statfs (LU-10018)
15283         [ $MDS1_VERSION -lt $(version_code 2.11.54) ] &&
15284                 return 0
15285         [ $CLIENT_VERSION -lt $(version_code 2.11.54) ] &&
15286                 return 0
15287         sleep 2
15288         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15289         do_facet ost1 $LCTL set_param obdfilter.*.exports.*.stats=clear
15290         df $DIR
15291         check_stats $SINGLEMDS "statfs" 1
15292
15293         # We want to check that the client didn't send OST_STATFS to
15294         # ost1 but the MDT also uses OST_STATFS for precreate. So some
15295         # extra care is needed here.
15296         if remote_mds; then
15297                 local nid=$($LCTL list_nids | head -1 | sed  "s/\./\\\./g")
15298                 local param="obdfilter.$FSNAME-OST0000.exports.'$nid'.stats"
15299
15300                 res=$(do_facet ost1 $LCTL get_param $param | grep statfs)
15301                 [ "$res" ] && error "OST got STATFS"
15302         fi
15303
15304         return 0
15305 }
15306 run_test 133b "Verifying extra MDT stats =================================="
15307
15308 test_133c() {
15309         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15310         remote_ost_nodsh && skip "remote OST with nodsh"
15311         remote_mds_nodsh && skip "remote MDS with nodsh"
15312
15313         local testdir=$DIR/$tdir/stats_testdir
15314
15315         test_mkdir -p $testdir
15316
15317         # verify obdfilter stats.
15318         $LFS setstripe -c 1 -i 0 $testdir/$tfile
15319         sync
15320         cancel_lru_locks osc
15321         wait_delete_completed
15322
15323         # clear stats.
15324         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15325         do_facet ost1 $LCTL set_param obdfilter.*.stats=clear
15326
15327         dd if=/dev/zero of=$testdir/$tfile conv=notrunc bs=512k count=1 ||
15328                 error "dd failed"
15329         sync
15330         cancel_lru_locks osc
15331         check_stats ost1 "write" 1
15332
15333         dd if=$testdir/$tfile of=/dev/null bs=1k count=1 || error "dd failed"
15334         check_stats ost1 "read" 1
15335
15336         > $testdir/$tfile || error "truncate failed"
15337         check_stats ost1 "punch" 1
15338
15339         rm -f $testdir/$tfile || error "file remove failed"
15340         wait_delete_completed
15341         check_stats ost1 "destroy" 1
15342
15343         rm -rf $DIR/$tdir
15344 }
15345 run_test 133c "Verifying OST stats ========================================"
15346
15347 order_2() {
15348         local value=$1
15349         local orig=$value
15350         local order=1
15351
15352         while [ $value -ge 2 ]; do
15353                 order=$((order*2))
15354                 value=$((value/2))
15355         done
15356
15357         if [ $orig -gt $order ]; then
15358                 order=$((order*2))
15359         fi
15360         echo $order
15361 }
15362
15363 size_in_KMGT() {
15364     local value=$1
15365     local size=('K' 'M' 'G' 'T');
15366     local i=0
15367     local size_string=$value
15368
15369     while [ $value -ge 1024 ]; do
15370         if [ $i -gt 3 ]; then
15371             #T is the biggest unit we get here, if that is bigger,
15372             #just return XXXT
15373             size_string=${value}T
15374             break
15375         fi
15376         value=$((value >> 10))
15377         if [ $value -lt 1024 ]; then
15378             size_string=${value}${size[$i]}
15379             break
15380         fi
15381         i=$((i + 1))
15382     done
15383
15384     echo $size_string
15385 }
15386
15387 get_rename_size() {
15388         local size=$1
15389         local context=${2:-.}
15390         local sample=$(do_facet $SINGLEMDS $LCTL \
15391                 get_param mdt.$FSNAME-MDT0000.rename_stats |
15392                 grep -A1 $context |
15393                 awk '/ '${size}'/ {print $4}' | sed -e "s/,//g")
15394         echo $sample
15395 }
15396
15397 test_133d() {
15398         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15399         remote_ost_nodsh && skip "remote OST with nodsh"
15400         remote_mds_nodsh && skip "remote MDS with nodsh"
15401         do_facet $SINGLEMDS $LCTL list_param mdt.*.rename_stats ||
15402                 skip_env "MDS doesn't support rename stats"
15403
15404         local testdir1=$DIR/${tdir}/stats_testdir1
15405         local testdir2=$DIR/${tdir}/stats_testdir2
15406         mkdir -p $DIR/${tdir} || error "mkdir $tdir failed"
15407
15408         do_facet $SINGLEMDS $LCTL set_param mdt.*.rename_stats=clear
15409
15410         mkdir_on_mdt0 ${testdir1} || error "mkdir $testdir1 failed"
15411         mkdir_on_mdt0 ${testdir2} || error "mkdir $testdir2 failed"
15412
15413         createmany -o $testdir1/test 512 || error "createmany failed"
15414
15415         # check samedir rename size
15416         mv ${testdir1}/test0 ${testdir1}/test_0
15417
15418         local testdir1_size=$(ls -l $DIR/${tdir} |
15419                 awk '/stats_testdir1/ {print $5}')
15420         local testdir2_size=$(ls -l $DIR/${tdir} |
15421                 awk '/stats_testdir2/ {print $5}')
15422
15423         testdir1_size=$(order_2 $testdir1_size)
15424         testdir2_size=$(order_2 $testdir2_size)
15425
15426         testdir1_size=$(size_in_KMGT $testdir1_size)
15427         testdir2_size=$(size_in_KMGT $testdir2_size)
15428
15429         echo "source rename dir size: ${testdir1_size}"
15430         echo "target rename dir size: ${testdir2_size}"
15431
15432         local cmd="do_facet $SINGLEMDS $LCTL "
15433         cmd+="get_param mdt.$FSNAME-MDT0000.rename_stats"
15434
15435         eval $cmd || error "$cmd failed"
15436         local samedir=$($cmd | grep 'same_dir')
15437         local same_sample=$(get_rename_size $testdir1_size)
15438         [ -z "$samedir" ] && error "samedir_rename_size count error"
15439         [[ $same_sample -eq 1 ]] ||
15440                 error "samedir_rename_size error $same_sample"
15441         echo "Check same dir rename stats success"
15442
15443         do_facet $SINGLEMDS $LCTL set_param mdt.*.rename_stats=clear
15444
15445         # check crossdir rename size
15446         mv ${testdir1}/test_0 ${testdir2}/test_0
15447
15448         testdir1_size=$(ls -l $DIR/${tdir} |
15449                 awk '/stats_testdir1/ {print $5}')
15450         testdir2_size=$(ls -l $DIR/${tdir} |
15451                 awk '/stats_testdir2/ {print $5}')
15452
15453         testdir1_size=$(order_2 $testdir1_size)
15454         testdir2_size=$(order_2 $testdir2_size)
15455
15456         testdir1_size=$(size_in_KMGT $testdir1_size)
15457         testdir2_size=$(size_in_KMGT $testdir2_size)
15458
15459         echo "source rename dir size: ${testdir1_size}"
15460         echo "target rename dir size: ${testdir2_size}"
15461
15462         eval $cmd || error "$cmd failed"
15463         local crossdir=$($cmd | grep 'crossdir')
15464         local src_sample=$(get_rename_size $testdir1_size crossdir_src)
15465         local tgt_sample=$(get_rename_size $testdir2_size crossdir_tgt)
15466         [ -z "$crossdir" ] && error "crossdir_rename_size count error"
15467         [[ $src_sample -eq 1 ]] ||
15468                 error "crossdir_rename_size error $src_sample"
15469         [[ $tgt_sample -eq 1 ]] ||
15470                 error "crossdir_rename_size error $tgt_sample"
15471         echo "Check cross dir rename stats success"
15472         rm -rf $DIR/${tdir}
15473 }
15474 run_test 133d "Verifying rename_stats ========================================"
15475
15476 test_133e() {
15477         remote_mds_nodsh && skip "remote MDS with nodsh"
15478         remote_ost_nodsh && skip "remote OST with nodsh"
15479         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15480
15481         local testdir=$DIR/${tdir}/stats_testdir
15482         local ctr f0 f1 bs=32768 count=42 sum
15483
15484         mkdir -p ${testdir} || error "mkdir failed"
15485
15486         $LFS setstripe -c 1 -i 0 ${testdir}/${tfile}
15487
15488         for ctr in {write,read}_bytes; do
15489                 sync
15490                 cancel_lru_locks osc
15491
15492                 do_facet ost1 $LCTL set_param -n \
15493                         "obdfilter.*.exports.clear=clear"
15494
15495                 if [ $ctr = write_bytes ]; then
15496                         f0=/dev/zero
15497                         f1=${testdir}/${tfile}
15498                 else
15499                         f0=${testdir}/${tfile}
15500                         f1=/dev/null
15501                 fi
15502
15503                 dd if=$f0 of=$f1 conv=notrunc bs=$bs count=$count || \
15504                         error "dd failed"
15505                 sync
15506                 cancel_lru_locks osc
15507
15508                 sum=$(do_facet ost1 $LCTL get_param \
15509                         "obdfilter.*.exports.*.stats" |
15510                         awk -v ctr=$ctr 'BEGIN { sum = 0 }
15511                                 $1 == ctr { sum += $7 }
15512                                 END { printf("%0.0f", sum) }')
15513
15514                 if ((sum != bs * count)); then
15515                         error "Bad $ctr sum, expected $((bs * count)), got $sum"
15516                 fi
15517         done
15518
15519         rm -rf $DIR/${tdir}
15520 }
15521 run_test 133e "Verifying OST {read,write}_bytes nid stats ================="
15522
15523 test_133f() {
15524         [[ $(lustre_version_code $facet) -ge $(version_code 2.7.65) ]] ||
15525                 skip "too old lustre for get_param -R ($facet_ver)"
15526
15527         # verifying readability.
15528         $LCTL get_param -R '*' &> /dev/null
15529
15530         # Verifing writability with badarea_io.
15531         local proc_dirs=$(eval \ls -d $proc_regexp 2>/dev/null)
15532         local skipped_params='force_lbug|changelog_mask|daemon_file'
15533         $LCTL list_param -FR '*' | grep '=' | tr -d = |
15534                 egrep -v "$skipped_params" |
15535                 xargs -n 1 find $proc_dirs -name |
15536                 xargs -n 1 badarea_io ||
15537                 error "client badarea_io failed"
15538
15539         # remount the FS in case writes/reads /proc break the FS
15540         cleanup || error "failed to unmount"
15541         setup || error "failed to setup"
15542 }
15543 run_test 133f "Check reads/writes of client lustre proc files with bad area io"
15544
15545 test_133g() {
15546         remote_mds_nodsh && skip "remote MDS with nodsh"
15547         remote_ost_nodsh && skip "remote OST with nodsh"
15548
15549         local proc_dirs=$(eval \ls -d $proc_regexp 2>/dev/null)
15550         local proc_dirs_str=$(eval echo $proc_dirs)
15551         local skipped_params="'force_lbug|changelog_mask|daemon_file'"
15552         local facet
15553         for facet in mds1 ost1; do
15554                 local facet_ver=$(lustre_version_code $facet)
15555                 if [ $facet_ver -ge $(version_code 2.7.65) ]; then
15556                         do_facet $facet "$LCTL get_param -R '*'" &> /dev/null
15557                 else
15558                         log "$facet: too old lustre for get_param -R"
15559                 fi
15560                 if [ $facet_ver -ge $(version_code 2.5.54) ]; then
15561                         do_facet $facet "$LCTL list_param -FR '*' | grep '=' |
15562                                 tr -d = | egrep -v $skipped_params |
15563                                 xargs -n 1 find $proc_dirs_str -name |
15564                                 xargs -n 1 badarea_io" ||
15565                                         error "$facet badarea_io failed"
15566                 else
15567                         skip_noexit "$facet: too old lustre for get_param -R"
15568                 fi
15569         done
15570
15571         # remount the FS in case writes/reads /proc break the FS
15572         cleanup || error "failed to unmount"
15573         setup || error "failed to setup"
15574 }
15575 run_test 133g "Check reads/writes of server lustre proc files with bad area io"
15576
15577 test_133h() {
15578         remote_mds_nodsh && skip "remote MDS with nodsh"
15579         remote_ost_nodsh && skip "remote OST with nodsh"
15580         [[ $MDS1_VERSION -lt $(version_code 2.9.54) ]] &&
15581                 skip "Need MDS version at least 2.9.54"
15582
15583         local facet
15584         for facet in client mds1 ost1; do
15585                 # Get the list of files that are missing the terminating newline
15586                 local plist=$(do_facet $facet
15587                         $LCTL list_param -FR '*' | grep '=' | tr -d =)
15588                 local ent
15589                 for ent in $plist; do
15590                         local missing=$(do_facet $facet $LCTL get_param $ent \|\
15591                                 awk -v FS='\v' -v RS='\v\v' \
15592                                 "'END { if(NR>0 && \\\$NF !~ /.*\\\n\$/) \
15593                                         print FILENAME}'" 2>/dev/null)
15594                         [ -z $missing ] || {
15595                                 do_facet $facet $LCTL get_param $ent | od -An -tx1
15596                                 error "file does not end with newline: $facet-$ent"
15597                         }
15598                 done
15599         done
15600 }
15601 run_test 133h "Proc files should end with newlines"
15602
15603 test_134a() {
15604         remote_mds_nodsh && skip "remote MDS with nodsh"
15605         [[ $MDS1_VERSION -lt $(version_code 2.7.54) ]] &&
15606                 skip "Need MDS version at least 2.7.54"
15607
15608         mkdir_on_mdt0 $DIR/$tdir || error "failed to create $DIR/$tdir"
15609         cancel_lru_locks mdc
15610
15611         local nsdir="ldlm.namespaces.*-MDT0000-mdc-*"
15612         local unused=$($LCTL get_param -n $nsdir.lock_unused_count)
15613         [ $unused -eq 0 ] || error "$unused locks are not cleared"
15614
15615         local nr=1000
15616         createmany -o $DIR/$tdir/f $nr ||
15617                 error "failed to create $nr files in $DIR/$tdir"
15618         unused=$($LCTL get_param -n $nsdir.lock_unused_count)
15619
15620         #define OBD_FAIL_LDLM_WATERMARK_LOW     0x327
15621         do_facet mds1 $LCTL set_param fail_loc=0x327
15622         do_facet mds1 $LCTL set_param fail_val=500
15623         touch $DIR/$tdir/m
15624
15625         echo "sleep 10 seconds ..."
15626         sleep 10
15627         local lck_cnt=$($LCTL get_param -n $nsdir.lock_unused_count)
15628
15629         do_facet mds1 $LCTL set_param fail_loc=0
15630         do_facet mds1 $LCTL set_param fail_val=0
15631         [ $lck_cnt -lt $unused ] ||
15632                 error "No locks reclaimed, before:$unused, after:$lck_cnt"
15633
15634         rm $DIR/$tdir/m
15635         unlinkmany $DIR/$tdir/f $nr
15636 }
15637 run_test 134a "Server reclaims locks when reaching lock_reclaim_threshold"
15638
15639 test_134b() {
15640         remote_mds_nodsh && skip "remote MDS with nodsh"
15641         [[ $MDS1_VERSION -lt $(version_code 2.7.54) ]] &&
15642                 skip "Need MDS version at least 2.7.54"
15643
15644         mkdir_on_mdt0 $DIR/$tdir || error "failed to create $DIR/$tdir"
15645         cancel_lru_locks mdc
15646
15647         local low_wm=$(do_facet mds1 $LCTL get_param -n \
15648                         ldlm.lock_reclaim_threshold_mb)
15649         # disable reclaim temporarily
15650         do_facet mds1 $LCTL set_param ldlm.lock_reclaim_threshold_mb=0
15651
15652         #define OBD_FAIL_LDLM_WATERMARK_HIGH     0x328
15653         do_facet mds1 $LCTL set_param fail_loc=0x328
15654         do_facet mds1 $LCTL set_param fail_val=500
15655
15656         $LCTL set_param debug=+trace
15657
15658         local nr=600
15659         createmany -o $DIR/$tdir/f $nr &
15660         local create_pid=$!
15661
15662         echo "Sleep $TIMEOUT seconds ..."
15663         sleep $TIMEOUT
15664         if ! ps -p $create_pid  > /dev/null 2>&1; then
15665                 do_facet mds1 $LCTL set_param fail_loc=0
15666                 do_facet mds1 $LCTL set_param fail_val=0
15667                 do_facet mds1 $LCTL set_param \
15668                         ldlm.lock_reclaim_threshold_mb=${low_wm}m
15669                 error "createmany finished incorrectly!"
15670         fi
15671         do_facet mds1 $LCTL set_param fail_loc=0
15672         do_facet mds1 $LCTL set_param fail_val=0
15673         do_facet mds1 $LCTL set_param ldlm.lock_reclaim_threshold_mb=${low_wm}m
15674         wait $create_pid || return 1
15675
15676         unlinkmany $DIR/$tdir/f $nr
15677 }
15678 run_test 134b "Server rejects lock request when reaching lock_limit_mb"
15679
15680 test_135() {
15681         remote_mds_nodsh && skip "remote MDS with nodsh"
15682         [[ $MDS1_VERSION -lt $(version_code 2.13.50) ]] &&
15683                 skip "Need MDS version at least 2.13.50"
15684         local fname
15685
15686         mkdir -p $DIR/$tdir || error "failed to create $DIR/$tdir"
15687
15688 #define OBD_FAIL_PLAIN_RECORDS 0x1319
15689         #set only one record at plain llog
15690         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x1319 fail_val=1
15691
15692         ost_set_temp_seq_width_all $DATA_SEQ_MAX_WIDTH
15693
15694         #fill already existed plain llog each 64767
15695         #wrapping whole catalog
15696         createmany -o -u $DIR/$tdir/$tfile- $((64767 * 1))
15697
15698         createmany -o $DIR/$tdir/$tfile_ 64700
15699         for (( i = 0; i < 64700; i = i + 2 ))
15700         do
15701                 rm $DIR/$tdir/$tfile_$i &
15702                 rm $DIR/$tdir/$tfile_$((i + 1)) &
15703                 local pid=$!
15704                 wait $pid
15705         done
15706
15707         #waiting osp synchronization
15708         wait_delete_completed
15709 }
15710 run_test 135 "Race catalog processing"
15711
15712 test_136() {
15713         remote_mds_nodsh && skip "remote MDS with nodsh"
15714         [[ $MDS1_VERSION -lt $(version_code 2.13.50) ]] &&
15715                 skip "Need MDS version at least 2.13.50"
15716         local fname
15717
15718         mkdir -p $DIR/$tdir || error "failed to create $DIR/$tdir"
15719         $LFS setstripe -c 1 -i 0 $DIR/$tdir || error "failed to set striping"
15720         #set only one record at plain llog
15721 #define OBD_FAIL_CATALOG_FULL_CHECK                0x131a
15722         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x131a fail_val=1
15723
15724         ost_set_temp_seq_width_all $DATA_SEQ_MAX_WIDTH
15725
15726         #fill already existed 2 plain llogs each 64767
15727         #wrapping whole catalog
15728         createmany -o -u $DIR/$tdir/$tfile- $((64767 * 1))
15729         createmany -o -u $DIR/$tdir/$tfile- $((64767 * 3 / 2))
15730         wait_delete_completed
15731
15732         createmany -o $DIR/$tdir/$tfile_ 10
15733         sleep 25
15734
15735         do_facet $SINGLEMDS $LCTL set_param fail_val=3
15736         for (( i = 0; i < 10; i = i + 3 ))
15737         do
15738                 rm $DIR/$tdir/$tfile_$i &
15739                 rm $DIR/$tdir/$tfile_$((i + 1)) &
15740                 local pid=$!
15741                 wait $pid
15742                 sleep 7
15743                 rm $DIR/$tdir/$tfile_$((i + 2)) &
15744         done
15745
15746         #waiting osp synchronization
15747         wait_delete_completed
15748 }
15749 run_test 136 "Race catalog processing 2"
15750
15751 test_140() { #bug-17379
15752         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15753
15754         test_mkdir $DIR/$tdir
15755         cd $DIR/$tdir || error "Changing to $DIR/$tdir"
15756         cp $(which stat) . || error "Copying stat to $DIR/$tdir"
15757
15758         # VFS limits max symlink depth to 5(4KSTACK) or 7(8KSTACK) or 8
15759         # For kernel > 3.5, bellow only tests consecutive symlink (MAX 40)
15760         local i=0
15761         while i=$((i + 1)); do
15762                 test_mkdir $i
15763                 cd $i || error "Changing to $i"
15764                 ln -s ../stat stat || error "Creating stat symlink"
15765                 # Read the symlink until ELOOP present,
15766                 # not LBUGing the system is considered success,
15767                 # we didn't overrun the stack.
15768                 $OPENFILE -f O_RDONLY stat >/dev/null 2>&1; ret=$?
15769                 if [ $ret -ne 0 ]; then
15770                         if [ $ret -eq 40 ]; then
15771                                 break  # -ELOOP
15772                         else
15773                                 error "Open stat symlink"
15774                                         return
15775                         fi
15776                 fi
15777         done
15778         i=$((i - 1))
15779         echo "The symlink depth = $i"
15780         [ $i -eq 5 ] || [ $i -eq 7 ] || [ $i -eq 8 ] || [ $i -eq 40 ] ||
15781                 error "Invalid symlink depth"
15782
15783         # Test recursive symlink
15784         ln -s symlink_self symlink_self
15785         $OPENFILE -f O_RDONLY symlink_self >/dev/null 2>&1; ret=$?
15786         echo "open symlink_self returns $ret"
15787         [ $ret -eq 40 ] || error "recursive symlink doesn't return -ELOOP"
15788 }
15789 run_test 140 "Check reasonable stack depth (shouldn't LBUG) ===="
15790
15791 test_150a() {
15792         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15793
15794         local TF="$TMP/$tfile"
15795
15796         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15797         dd if=/dev/urandom of=$TF bs=6096 count=1 || error "dd failed"
15798         cp $TF $DIR/$tfile
15799         cancel_lru_locks $OSC
15800         cmp $TF $DIR/$tfile || error "$TMP/$tfile $DIR/$tfile differ"
15801         remount_client $MOUNT
15802         df -P $MOUNT
15803         cmp $TF $DIR/$tfile || error "$TF $DIR/$tfile differ (remount)"
15804
15805         $TRUNCATE $TF 6000
15806         $TRUNCATE $DIR/$tfile 6000
15807         cancel_lru_locks $OSC
15808         cmp $TF $DIR/$tfile || error "$TF $DIR/$tfile differ (truncate1)"
15809
15810         echo "12345" >>$TF
15811         echo "12345" >>$DIR/$tfile
15812         cancel_lru_locks $OSC
15813         cmp $TF $DIR/$tfile || error "$TF $DIR/$tfile differ (append1)"
15814
15815         echo "12345" >>$TF
15816         echo "12345" >>$DIR/$tfile
15817         cancel_lru_locks $OSC
15818         cmp $TF $DIR/$tfile || error "$TF $DIR/$tfile differ (append2)"
15819 }
15820 run_test 150a "truncate/append tests"
15821
15822 test_150b() {
15823         check_set_fallocate_or_skip
15824         local out
15825
15826         touch $DIR/$tfile
15827         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15828         out=$(check_fallocate $DIR/$tfile 2>&1) ||
15829                 skip_eopnotsupp "$out|check_fallocate failed"
15830 }
15831 run_test 150b "Verify fallocate (prealloc) functionality"
15832
15833 test_150bb() {
15834         check_set_fallocate_or_skip
15835
15836         touch $DIR/$tfile
15837         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15838         dd if=/dev/urandom of=$DIR/$tfile bs=1M count=20 || error "dd failed"
15839         > $DIR/$tfile
15840         fallocate -l $((1048576 * 20)) $DIR/$tfile || error "fallocate failed"
15841         # precomputed md5sum for 20MB of zeroes
15842         local expect="8f4e33f3dc3e414ff94e5fb6905cba8c"
15843         local sum=($(md5sum $DIR/$tfile))
15844
15845         [[ "${sum[0]}" == "$expect" ]] || error "fallocate unwritten is not zero"
15846
15847         check_set_fallocate 1
15848
15849         > $DIR/$tfile
15850         fallocate -l $((1048576 * 20)) $DIR/$tfile || error "fallocate failed"
15851         sum=($(md5sum $DIR/$tfile))
15852
15853         [[ "${sum[0]}" == "$expect" ]] || error "fallocate zero is not zero"
15854 }
15855 run_test 150bb "Verify fallocate modes both zero space"
15856
15857 test_150c() {
15858         check_set_fallocate_or_skip
15859         local striping="-c2"
15860
15861         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15862         $LFS setstripe -c $OSTCOUNT -S1M $DIR/$tfile || error "setstripe failed"
15863         fallocate -l ${OSTCOUNT}m $DIR/$tfile || error "fallocate failed"
15864         local bytes=$(($(stat -c '%b * %B' $DIR/$tfile)))
15865         local want=$((OSTCOUNT * 1048576))
15866
15867         # Must allocate all requested space, not more than 5% extra
15868         (( $bytes >= $want && $bytes < $want * 105 / 100 )) ||
15869                 error "bytes $bytes is not $want"
15870
15871         rm -f $DIR/$tfile
15872
15873         echo "verify fallocate on PFL file"
15874
15875         [[ "x$DOM" == "xyes" ]] && striping="-L mdt"
15876
15877         $LFS setstripe -E1M $striping -E16M -c3 -Eeof -c 4 $DIR/$tfile ||
15878                 error "Create $DIR/$tfile failed"
15879         fallocate -l $((1048576 * 512)) $DIR/$tfile || error "fallocate failed"
15880         bytes=$(($(stat -c '%b * %B' $DIR/$tfile)))
15881         want=$((512 * 1048576))
15882
15883         # Must allocate all requested space, not more than 5% extra
15884         (( $bytes >= $want && $bytes < $want * 105 / 100 )) ||
15885                 error "bytes $bytes is not $want"
15886 }
15887 run_test 150c "Verify fallocate Size and Blocks"
15888
15889 test_150d() {
15890         check_set_fallocate_or_skip
15891         local striping="-c2"
15892
15893         [[ "x$DOM" == "xyes" ]] && striping="-L mdt"
15894
15895         stack_trap "rm -f $DIR/$tdir; wait_delete_completed"
15896         $LFS setstripe -E1M $striping -E eof -c $OSTCOUNT -S1M $DIR/$tdir ||
15897                 error "setstripe failed"
15898         fallocate -o 1G -l ${OSTCOUNT}m $DIR/$tdir || error "fallocate failed"
15899         local bytes=$(($(stat -c '%b * %B' $DIR/$tdir)))
15900         local want=$((OSTCOUNT * 1048576))
15901
15902         # Must allocate all requested space, not more than 5% extra
15903         (( $bytes >= $want && $bytes < $want * 105 / 100 )) ||
15904                 error "bytes $bytes is not $want"
15905 }
15906 run_test 150d "Verify fallocate Size and Blocks - Non zero start"
15907
15908 test_150e() {
15909         check_set_fallocate_or_skip
15910
15911         echo "df before:"
15912         $LFS df
15913         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15914         $LFS setstripe -c${OSTCOUNT} $DIR/$tfile ||
15915                 error "$LFS setstripe -c${OSTCOUNT} $DIR/$tfile failed"
15916
15917         # Find OST with Minimum Size
15918         min_size_ost=$($LFS df | awk "/$FSNAME-OST/ { print \$4 }" |
15919                        sort -un | head -1)
15920
15921         # Get 100MB per OST of the available space to reduce run time
15922         # else 60% of the available space if we are running SLOW tests
15923         if [ $SLOW == "no" ]; then
15924                 local space=$((1024 * 100 * OSTCOUNT))
15925         else
15926                 local space=$(((min_size_ost * 60)/100 * OSTCOUNT))
15927         fi
15928
15929         fallocate -l${space}k $DIR/$tfile ||
15930                 error "fallocate ${space}k $DIR/$tfile failed"
15931         echo "'fallocate -l ${space}k $DIR/$tfile' succeeded"
15932
15933         # get size immediately after fallocate. This should be correctly
15934         # updated
15935         local size=$(stat -c '%s' $DIR/$tfile)
15936         local used=$(( $(stat -c '%b * %B' $DIR/$tfile) / 1024))
15937
15938         # Sleep for a while for statfs to get updated. And not pull from cache.
15939         sleep 2
15940
15941         echo "df after fallocate:"
15942         $LFS df
15943
15944         (( size / 1024 == space )) || error "size $size != requested $space"
15945         [ "$ost1_FSTYPE" != ldiskfs ] || (( used >= space )) ||
15946                 error "used $used < space $space"
15947
15948         rm $DIR/$tfile || error "rm failed"
15949         sync
15950         wait_delete_completed
15951
15952         echo "df after unlink:"
15953         $LFS df
15954 }
15955 run_test 150e "Verify 60% of available OST space consumed by fallocate"
15956
15957 test_150f() {
15958         local size
15959         local blocks
15960         local want_size_before=20480 # in bytes
15961         local want_blocks_before=40 # 512 sized blocks
15962         local want_blocks_after=24  # 512 sized blocks
15963         local length=$(((want_blocks_before - want_blocks_after) * 512))
15964
15965         [[ $OST1_VERSION -ge $(version_code 2.14.0) ]] ||
15966                 skip "need at least 2.14.0 for fallocate punch"
15967
15968         if [ "$ost1_FSTYPE" = "zfs" ] || [ "$mds1_FSTYPE" = "zfs" ]; then
15969                 skip "LU-14160: punch mode is not implemented on OSD ZFS"
15970         fi
15971
15972         check_set_fallocate_or_skip
15973         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15974
15975         [[ "x$DOM" == "xyes" ]] &&
15976                 $LFS setstripe -E1M -L mdt -E eof $DIR/$tfile
15977
15978         echo "Verify fallocate punch: Range within the file range"
15979         yes 'A' | dd of=$DIR/$tfile bs=4096 count=5 ||
15980                 error "dd failed for bs 4096 and count 5"
15981
15982         # Call fallocate with punch range which is within the file range
15983         out=$(fallocate -p --offset 4096 -l $length $DIR/$tfile 2>&1) ||
15984                 skip_eopnotsupp "$out|fallocate: offset 4096 and length $length"
15985         # client must see changes immediately after fallocate
15986         size=$(stat -c '%s' $DIR/$tfile)
15987         blocks=$(stat -c '%b' $DIR/$tfile)
15988
15989         # Verify punch worked.
15990         (( blocks == want_blocks_after )) ||
15991                 error "punch failed: blocks $blocks != $want_blocks_after"
15992
15993         (( size == want_size_before )) ||
15994                 error "punch failed: size $size != $want_size_before"
15995
15996         # Verify there is hole in file
15997         local data_off=$(lseek_test -d 4096 $DIR/$tfile)
15998         # precomputed md5sum
15999         local expect="4a9a834a2db02452929c0a348273b4aa"
16000
16001         cksum=($(md5sum $DIR/$tfile))
16002         [[ "${cksum[0]}" == "$expect" ]] ||
16003                 error "unexpected MD5SUM after punch: ${cksum[0]}"
16004
16005         # Start second sub-case for fallocate punch.
16006         echo "Verify fallocate punch: Range overlapping and less than blocksize"
16007         yes 'A' | dd of=$DIR/$tfile bs=4096 count=5 ||
16008                 error "dd failed for bs 4096 and count 5"
16009
16010         # Punch range less than block size will have no change in block count
16011         want_blocks_after=40  # 512 sized blocks
16012
16013         # Punch overlaps two blocks and less than blocksize
16014         out=$(fallocate -p --offset 4000 -l 3000 $DIR/$tfile 2>&1) ||
16015                 skip_eopnotsupp "$out|fallocate: offset 4000 length 3000"
16016         size=$(stat -c '%s' $DIR/$tfile)
16017         blocks=$(stat -c '%b' $DIR/$tfile)
16018
16019         # Verify punch worked.
16020         (( blocks == want_blocks_after )) ||
16021                 error "punch failed: blocks $blocks != $want_blocks_after"
16022
16023         (( size == want_size_before )) ||
16024                 error "punch failed: size $size != $want_size_before"
16025
16026         # Verify if range is really zero'ed out. We expect Zeros.
16027         # precomputed md5sum
16028         expect="c57ec5d769c3dbe3426edc3f7d7e11d3"
16029         cksum=($(md5sum $DIR/$tfile))
16030         [[ "${cksum[0]}" == "$expect" ]] ||
16031                 error "unexpected MD5SUM after punch: ${cksum[0]}"
16032 }
16033 run_test 150f "Verify fallocate punch functionality"
16034
16035 test_150g() {
16036         local space
16037         local size
16038         local blocks
16039         local blocks_after
16040         local size_after
16041         local BS=4096 # Block size in bytes
16042
16043         [[ $OST1_VERSION -ge $(version_code 2.14.0) ]] ||
16044                 skip "need at least 2.14.0 for fallocate punch"
16045
16046         if [ "$ost1_FSTYPE" = "zfs" ] || [ "$mds1_FSTYPE" = "zfs" ]; then
16047                 skip "LU-14160: punch mode is not implemented on OSD ZFS"
16048         fi
16049
16050         check_set_fallocate_or_skip
16051         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
16052
16053         if [[ "x$DOM" == "xyes" ]]; then
16054                 $LFS setstripe -E2M -L mdt -E eof -c${OSTCOUNT} $DIR/$tfile ||
16055                         error "$LFS setstripe DoM + ${OSTCOUNT} OST failed"
16056         else
16057                 $LFS setstripe -c${OSTCOUNT} $DIR/$tfile ||
16058                         error "$LFS setstripe -c${OSTCOUNT} $DIR/$tfile failed"
16059         fi
16060
16061         # Get 100MB per OST of the available space to reduce run time
16062         # else 60% of the available space if we are running SLOW tests
16063         if [ $SLOW == "no" ]; then
16064                 space=$((1024 * 100 * OSTCOUNT))
16065         else
16066                 # Find OST with Minimum Size
16067                 space=$($LFS df | awk "/$FSNAME-OST/ { print \$4 }" |
16068                         sort -un | head -1)
16069                 echo "min size OST: $space"
16070                 space=$(((space * 60)/100 * OSTCOUNT))
16071         fi
16072         # space in 1k units, round to 4k blocks
16073         local blkcount=$((space * 1024 / $BS))
16074
16075         echo "Verify fallocate punch: Very large Range"
16076         fallocate -l${space}k $DIR/$tfile ||
16077                 error "fallocate ${space}k $DIR/$tfile failed"
16078         # write 1M at the end, start and in the middle
16079         yes 'A' | dd of=$DIR/$tfile bs=$BS count=256 ||
16080                 error "dd failed: bs $BS count 256"
16081         yes 'A' | dd of=$DIR/$tfile bs=$BS seek=$((blkcount - 256)) count=256 ||
16082                 error "dd failed: bs $BS count 256 seek $((blkcount - 256))"
16083         yes 'A' | dd of=$DIR/$tfile bs=$BS seek=$((blkcount / 2)) count=1024 ||
16084                 error "dd failed: bs $BS count 256 seek $((blkcount / 2))"
16085
16086         # Gather stats.
16087         size=$(stat -c '%s' $DIR/$tfile)
16088
16089         # gather punch length.
16090         local punch_size=$((size - (BS * 2)))
16091
16092         echo "punch_size = $punch_size"
16093         echo "size - punch_size: $((size - punch_size))"
16094         echo "size - punch_size in blocks: $(((size - punch_size)/BS))"
16095
16096         # Call fallocate to punch all except 2 blocks. We leave the
16097         # first and the last block
16098         echo "fallocate -p --offset $BS -l $punch_size $DIR/$tfile"
16099         out=$(fallocate -p --offset $BS -l $punch_size $DIR/$tfile 2>&1) ||
16100                 skip_eopnotsupp "$out|fallocate: offset $BS length $punch_size"
16101
16102         size_after=$(stat -c '%s' $DIR/$tfile)
16103         blocks_after=$(stat -c '%b' $DIR/$tfile)
16104
16105         # Verify punch worked.
16106         # Size should be kept
16107         (( size == size_after )) ||
16108                 error "punch failed: size $size != $size_after"
16109
16110         # two 4k data blocks to remain plus possible 1 extra extent block
16111         (( blocks_after <= ((BS / 512) * 3) )) ||
16112                 error "too many blocks remains: $blocks_after"
16113
16114         # Verify that file has hole between the first and the last blocks
16115         local hole_start=$(lseek_test -l 0 $DIR/$tfile)
16116         local hole_end=$(lseek_test -d $BS $DIR/$tfile)
16117
16118         echo "Hole at [$hole_start, $hole_end)"
16119         (( hole_start == BS )) ||
16120                 error "no hole at offset $BS after punch"
16121
16122         (( hole_end == BS + punch_size )) ||
16123                 error "data at offset $hole_end < $((BS + punch_size))"
16124 }
16125 run_test 150g "Verify fallocate punch on large range"
16126
16127 test_150h() {
16128         local file=$DIR/$tfile
16129         local size
16130
16131         check_set_fallocate_or_skip
16132         statx_supported || skip_env "Test must be statx() syscall supported"
16133
16134         # fallocate() does not update the size information on the MDT
16135         fallocate -l 16K $file || error "failed to fallocate $file"
16136         cancel_lru_locks $OSC
16137         # STATX with cached-always mode will not send glimpse RPCs to OST,
16138         # it uses the caching attrs on the client side as much as possible.
16139         size=$($STATX --cached=always -c %s $file)
16140         [ $size == 16384 ] ||
16141                 error "size after fallocate() is $size, expected 16384"
16142 }
16143 run_test 150h "Verify extend fallocate updates the file size"
16144
16145 #LU-2902 roc_hit was not able to read all values from lproc
16146 function roc_hit_init() {
16147         local list=$(comma_list $(osts_nodes))
16148         local dir=$DIR/$tdir-check
16149         local file=$dir/$tfile
16150         local BEFORE
16151         local AFTER
16152         local idx
16153
16154         test_mkdir $dir
16155         #use setstripe to do a write to every ost
16156         for i in $(seq 0 $((OSTCOUNT-1))); do
16157                 $LFS setstripe -c 1 -i $i $dir || error "$LFS setstripe $file failed"
16158                 dd if=/dev/urandom of=$file bs=4k count=4 2>&1 > /dev/null
16159                 idx=$(printf %04x $i)
16160                 BEFORE=$(get_osd_param $list *OST*$idx stats |
16161                         awk '$1 == "cache_access" {sum += $7}
16162                                 END { printf("%0.0f", sum) }')
16163
16164                 cancel_lru_locks osc
16165                 cat $file >/dev/null
16166
16167                 AFTER=$(get_osd_param $list *OST*$idx stats |
16168                         awk '$1 == "cache_access" {sum += $7}
16169                                 END { printf("%0.0f", sum) }')
16170
16171                 echo BEFORE:$BEFORE AFTER:$AFTER
16172                 if ! let "AFTER - BEFORE == 4"; then
16173                         rm -rf $dir
16174                         error "roc_hit is not safe to use"
16175                 fi
16176                 rm $file
16177         done
16178
16179         rm -rf $dir
16180 }
16181
16182 function roc_hit() {
16183         local list=$(comma_list $(osts_nodes))
16184         echo $(get_osd_param $list '' stats |
16185                 awk '$1 == "cache_hit" {sum += $7}
16186                         END { printf("%0.0f", sum) }')
16187 }
16188
16189 function set_cache() {
16190         local on=1
16191
16192         if [ "$2" == "off" ]; then
16193                 on=0;
16194         fi
16195         local list=$(comma_list $(osts_nodes))
16196         set_osd_param $list '' $1_cache_enable $on
16197
16198         cancel_lru_locks osc
16199 }
16200
16201 test_151() {
16202         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16203         remote_ost_nodsh && skip "remote OST with nodsh"
16204         (( CLIENT_VERSION == OST1_VERSION )) ||
16205                 skip "LU-13081: no interop testing for OSS cache"
16206
16207         local CPAGES=3
16208         local list=$(comma_list $(osts_nodes))
16209
16210         # check whether obdfilter is cache capable at all
16211         if ! get_osd_param $list '' read_cache_enable >/dev/null; then
16212                 skip "not cache-capable obdfilter"
16213         fi
16214
16215         # check cache is enabled on all obdfilters
16216         if get_osd_param $list '' read_cache_enable | grep 0; then
16217                 skip "oss cache is disabled"
16218         fi
16219
16220         set_osd_param $list '' writethrough_cache_enable 1
16221
16222         # check write cache is enabled on all obdfilters
16223         if get_osd_param $list '' writethrough_cache_enable | grep 0; then
16224                 skip "oss write cache is NOT enabled"
16225         fi
16226
16227         roc_hit_init
16228
16229         #define OBD_FAIL_OBD_NO_LRU  0x609
16230         do_nodes $list $LCTL set_param fail_loc=0x609
16231
16232         # pages should be in the case right after write
16233         dd if=/dev/urandom of=$DIR/$tfile bs=4k count=$CPAGES ||
16234                 error "dd failed"
16235
16236         local BEFORE=$(roc_hit)
16237         cancel_lru_locks osc
16238         cat $DIR/$tfile >/dev/null
16239         local AFTER=$(roc_hit)
16240
16241         do_nodes $list $LCTL set_param fail_loc=0
16242
16243         if ! let "AFTER - BEFORE == CPAGES"; then
16244                 error "NOT IN CACHE: before: $BEFORE, after: $AFTER"
16245         fi
16246
16247         cancel_lru_locks osc
16248         # invalidates OST cache
16249         do_nodes $list "echo 1 > /proc/sys/vm/drop_caches"
16250         set_osd_param $list '' read_cache_enable 0
16251         cat $DIR/$tfile >/dev/null
16252
16253         # now data shouldn't be found in the cache
16254         BEFORE=$(roc_hit)
16255         cancel_lru_locks osc
16256         cat $DIR/$tfile >/dev/null
16257         AFTER=$(roc_hit)
16258         if let "AFTER - BEFORE != 0"; then
16259                 error "IN CACHE: before: $BEFORE, after: $AFTER"
16260         fi
16261
16262         set_osd_param $list '' read_cache_enable 1
16263         rm -f $DIR/$tfile
16264 }
16265 run_test 151 "test cache on oss and controls ==============================="
16266
16267 test_152() {
16268         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16269
16270         local TF="$TMP/$tfile"
16271
16272         # simulate ENOMEM during write
16273 #define OBD_FAIL_OST_NOMEM      0x226
16274         lctl set_param fail_loc=0x80000226
16275         dd if=/dev/urandom of=$TF bs=6096 count=1 || error "dd failed"
16276         cp $TF $DIR/$tfile
16277         sync || error "sync failed"
16278         lctl set_param fail_loc=0
16279
16280         # discard client's cache
16281         cancel_lru_locks osc
16282
16283         # simulate ENOMEM during read
16284         lctl set_param fail_loc=0x80000226
16285         cmp $TF $DIR/$tfile || error "cmp failed"
16286         lctl set_param fail_loc=0
16287
16288         rm -f $TF
16289 }
16290 run_test 152 "test read/write with enomem ============================"
16291
16292 test_153() {
16293         $MULTIOP $DIR/$tfile Ow4096Ycu || error "multiop failed"
16294 }
16295 run_test 153 "test if fdatasync does not crash ======================="
16296
16297 dot_lustre_fid_permission_check() {
16298         local fid=$1
16299         local ffid=$MOUNT/.lustre/fid/$fid
16300         local test_dir=$2
16301
16302         echo "stat fid $fid"
16303         stat $ffid || error "stat $ffid failed."
16304         echo "touch fid $fid"
16305         touch $ffid || error "touch $ffid failed."
16306         echo "write to fid $fid"
16307         cat /etc/hosts > $ffid || error "write $ffid failed."
16308         echo "read fid $fid"
16309         diff /etc/hosts $ffid || error "read $ffid failed."
16310         echo "append write to fid $fid"
16311         cat /etc/hosts >> $ffid || error "append write $ffid failed."
16312         echo "rename fid $fid"
16313         mv $ffid $test_dir/$tfile.1 &&
16314                 error "rename $ffid to $tfile.1 should fail."
16315         touch $test_dir/$tfile.1
16316         mv $test_dir/$tfile.1 $ffid &&
16317                 error "rename $tfile.1 to $ffid should fail."
16318         rm -f $test_dir/$tfile.1
16319         echo "truncate fid $fid"
16320         $TRUNCATE $ffid 777 || error "truncate $ffid failed."
16321         echo "link fid $fid"
16322         ln -f $ffid $test_dir/tfile.lnk || error "link $ffid failed."
16323         if [[ $($LCTL get_param -n mdc.*-mdc-*.connect_flags) =~ acl ]]; then
16324                 id $USER0 || skip_env "missing user $USER0"
16325                 echo "setfacl fid $fid"
16326                 setfacl -R -m u:$USER0:rwx $ffid ||
16327                         error "setfacl $ffid failed"
16328                 echo "getfacl fid $fid"
16329                 getfacl $ffid || error "getfacl $ffid failed."
16330         fi
16331         echo "unlink fid $fid"
16332         unlink $MOUNT/.lustre/fid/$fid && error "unlink $ffid should fail."
16333         echo "mknod fid $fid"
16334         mknod $ffid c 1 3 && error "mknod $ffid should fail."
16335
16336         fid=[0xf00000400:0x1:0x0]
16337         ffid=$MOUNT/.lustre/fid/$fid
16338
16339         echo "stat non-exist fid $fid"
16340         stat $ffid > /dev/null && error "stat non-exist $ffid should fail."
16341         echo "write to non-exist fid $fid"
16342         cat /etc/hosts > $ffid && error "write non-exist $ffid should fail."
16343         echo "link new fid $fid"
16344         ln $test_dir/$tfile $ffid && error "link $ffid should fail."
16345
16346         mkdir -p $test_dir/$tdir
16347         touch $test_dir/$tdir/$tfile
16348         fid=$($LFS path2fid $test_dir/$tdir)
16349         rc=$?
16350         [ $rc -ne 0 ] &&
16351                 error "error: could not get fid for $test_dir/$dir/$tfile."
16352
16353         ffid=$MOUNT/.lustre/fid/$fid
16354
16355         echo "ls $fid"
16356         ls $ffid || error "ls $ffid failed."
16357         echo "touch $fid/$tfile.1"
16358         touch $ffid/$tfile.1 || error "touch $ffid/$tfile.1 failed."
16359
16360         echo "touch $MOUNT/.lustre/fid/$tfile"
16361         touch $MOUNT/.lustre/fid/$tfile && \
16362                 error "touch $MOUNT/.lustre/fid/$tfile should fail."
16363
16364         echo "setxattr to $MOUNT/.lustre/fid"
16365         setfattr -n trusted.name1 -v value1 $MOUNT/.lustre/fid
16366
16367         echo "listxattr for $MOUNT/.lustre/fid"
16368         getfattr -d -m "^trusted" $MOUNT/.lustre/fid
16369
16370         echo "delxattr from $MOUNT/.lustre/fid"
16371         setfattr -x trusted.name1 $MOUNT/.lustre/fid
16372
16373         echo "touch invalid fid: $MOUNT/.lustre/fid/[0x200000400:0x2:0x3]"
16374         touch $MOUNT/.lustre/fid/[0x200000400:0x2:0x3] &&
16375                 error "touch invalid fid should fail."
16376
16377         echo "touch non-normal fid: $MOUNT/.lustre/fid/[0x1:0x2:0x0]"
16378         touch $MOUNT/.lustre/fid/[0x1:0x2:0x0] &&
16379                 error "touch non-normal fid should fail."
16380
16381         echo "rename $tdir to $MOUNT/.lustre/fid"
16382         mrename $test_dir/$tdir $MOUNT/.lustre/fid &&
16383                 error "rename to $MOUNT/.lustre/fid should fail."
16384
16385         if [ $MDS1_VERSION -ge $(version_code 2.3.51) ]
16386         then            # LU-3547
16387                 local old_obf_mode=$(stat --format="%a" $DIR/.lustre/fid)
16388                 local new_obf_mode=777
16389
16390                 echo "change mode of $DIR/.lustre/fid to $new_obf_mode"
16391                 chmod $new_obf_mode $DIR/.lustre/fid ||
16392                         error "chmod $new_obf_mode $DIR/.lustre/fid failed"
16393
16394                 local obf_mode=$(stat --format=%a $DIR/.lustre/fid)
16395                 [ $obf_mode -eq $new_obf_mode ] ||
16396                         error "stat $DIR/.lustre/fid returned wrong mode $obf_mode"
16397
16398                 echo "restore mode of $DIR/.lustre/fid to $old_obf_mode"
16399                 chmod $old_obf_mode $DIR/.lustre/fid ||
16400                         error "chmod $old_obf_mode $DIR/.lustre/fid failed"
16401         fi
16402
16403         $OPENFILE -f O_LOV_DELAY_CREATE:O_CREAT $test_dir/$tfile-2
16404         fid=$($LFS path2fid $test_dir/$tfile-2)
16405
16406         if [ $MDS1_VERSION -ge $(version_code 2.6.50) ]
16407         then # LU-5424
16408                 echo "cp /etc/passwd $MOUNT/.lustre/fid/$fid"
16409                 cp /etc/passwd $MOUNT/.lustre/fid/$fid ||
16410                         error "create lov data thru .lustre failed"
16411         fi
16412         echo "cp /etc/passwd $test_dir/$tfile-2"
16413         cp /etc/passwd $test_dir/$tfile-2 ||
16414                 error "copy to $test_dir/$tfile-2 failed."
16415         echo "diff /etc/passwd $MOUNT/.lustre/fid/$fid"
16416         diff /etc/passwd $MOUNT/.lustre/fid/$fid ||
16417                 error "diff /etc/passwd $MOUNT/.lustre/fid/$fid failed."
16418
16419         rm -rf $test_dir/tfile.lnk
16420         rm -rf $test_dir/$tfile-2
16421 }
16422
16423 test_154A() {
16424         [[ $MDS1_VERSION -lt $(version_code 2.4.1) ]] &&
16425                 skip "Need MDS version at least 2.4.1"
16426
16427         local tf=$DIR/$tfile
16428         touch $tf
16429
16430         local fid=$($LFS path2fid $tf)
16431         [ -z "$fid" ] && error "path2fid unable to get $tf FID"
16432
16433         # check that we get the same pathname back
16434         local rootpath
16435         local found
16436         for rootpath in "$MOUNT" "$MOUNT///" "$MOUNT/$tfile"; do
16437                 echo "$rootpath $fid"
16438                 found=$($LFS fid2path $rootpath "$fid")
16439                 [ -z "$found" ] && error "fid2path unable to get '$fid' path"
16440                 [ "$found" == "$tf" ] || error "fid2path $found != $tf"
16441         done
16442
16443         # check wrong root path format
16444         rootpath=$MOUNT"_wrong"
16445         found=$($LFS fid2path $rootpath "$fid")
16446         [ -z "$found" ] || error "should fail ($rootpath != $MOUNT)"
16447 }
16448 run_test 154A "lfs path2fid and fid2path basic checks"
16449
16450 test_154B() {
16451         [[ $MDS1_VERSION -lt $(version_code 2.4.1) ]] &&
16452                 skip "Need MDS version at least 2.4.1"
16453
16454         mkdir -p $DIR/$tdir || error "mkdir $tdir failed"
16455         touch $DIR/$tdir/$tfile || error "touch $DIR/$tdir/$tfile failed"
16456         local linkea=$($LL_DECODE_LINKEA $DIR/$tdir/$tfile | grep 'pfid')
16457         [ -z "$linkea" ] && error "decode linkea $DIR/$tdir/$tfile failed"
16458
16459         local name=$(echo $linkea | awk '/pfid/ {print $5}' | sed -e "s/'//g")
16460         local PFID=$(echo $linkea | awk '/pfid/ {print $3}' | sed -e "s/,//g")
16461
16462         # check that we get the same pathname
16463         echo "PFID: $PFID, name: $name"
16464         local FOUND=$($LFS fid2path $MOUNT "$PFID")
16465         [ -z "$FOUND" ] && error "fid2path unable to get $PFID path"
16466         [ "$FOUND/$name" != "$DIR/$tdir/$tfile" ] &&
16467                 error "ll_decode_linkea has $FOUND/$name != $DIR/$tdir/$tfile"
16468
16469         rm -rf $DIR/$tdir || error "Can not delete directory $DIR/$tdir"
16470 }
16471 run_test 154B "verify the ll_decode_linkea tool"
16472
16473 test_154a() {
16474         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16475         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
16476         (( $MDS1_VERSION >= $(version_code 2.2.51) )) ||
16477                 skip "Need MDS version at least 2.2.51"
16478         [ -z "$(which setfacl)" ] && skip_env "must have setfacl tool"
16479
16480         cp /etc/hosts $DIR/$tfile
16481
16482         fid=$($LFS path2fid $DIR/$tfile)
16483         rc=$?
16484         [ $rc -ne 0 ] && error "error: could not get fid for $DIR/$tfile."
16485
16486         dot_lustre_fid_permission_check "$fid" $DIR ||
16487                 error "dot lustre permission check $fid failed"
16488
16489         ls -a $MOUNT | grep "\.lustre" && error ".lustre should not be listed"
16490
16491         rm -rf $MOUNT/.lustre && error ".lustre is not allowed to be unlinked"
16492
16493         touch $MOUNT/.lustre/file &&
16494                 error "creation is not allowed under .lustre"
16495
16496         mkdir $MOUNT/.lustre/dir &&
16497                 error "mkdir is not allowed under .lustre"
16498
16499         rm -rf $DIR/$tfile
16500 }
16501 run_test 154a "Open-by-FID"
16502
16503 test_154b() {
16504         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16505         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
16506         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
16507         [[ $MDS1_VERSION -ge $(version_code 2.2.51) ]] ||
16508                 skip "Need MDS version at least 2.2.51"
16509
16510         local remote_dir=$DIR/$tdir/remote_dir
16511         local MDTIDX=1
16512         local rc=0
16513
16514         mkdir -p $DIR/$tdir
16515         $LFS mkdir -i $MDTIDX $remote_dir ||
16516                 error "create remote directory failed"
16517
16518         cp /etc/hosts $remote_dir/$tfile
16519
16520         fid=$($LFS path2fid $remote_dir/$tfile)
16521         rc=$?
16522         [ $rc -ne 0 ] && error "error: could not get fid for $remote_dir/$tfile"
16523
16524         dot_lustre_fid_permission_check "$fid" $remote_dir ||
16525                 error "dot lustre permission check $fid failed"
16526         rm -rf $DIR/$tdir
16527 }
16528 run_test 154b "Open-by-FID for remote directory"
16529
16530 test_154c() {
16531         [[ $MDS1_VERSION -lt $(version_code 2.4.1) ]] &&
16532                 skip "Need MDS version at least 2.4.1"
16533
16534         touch $DIR/$tfile.1 $DIR/$tfile.2 $DIR/$tfile.3
16535         local FID1=$($LFS path2fid $DIR/$tfile.1)
16536         local FID2=$($LFS path2fid $DIR/$tfile.2)
16537         local FID3=$($LFS path2fid $DIR/$tfile.3)
16538
16539         local N=1
16540         $LFS path2fid $DIR/$tfile.[123] | while read PATHNAME FID; do
16541                 [ "$PATHNAME" = "$DIR/$tfile.$N:" ] ||
16542                         error "path2fid pathname $PATHNAME != $DIR/$tfile.$N:"
16543                 local want=FID$N
16544                 [ "$FID" = "${!want}" ] ||
16545                         error "path2fid $PATHNAME FID $FID != FID$N ${!want}"
16546                 N=$((N + 1))
16547         done
16548
16549         $LFS fid2path $MOUNT "$FID1" "$FID2" "$FID3" | while read PATHNAME;
16550         do
16551                 [ "$PATHNAME" = "$DIR/$tfile.$N" ] ||
16552                         error "fid2path pathname $PATHNAME != $DIR/$tfile.$N:"
16553                 N=$((N + 1))
16554         done
16555 }
16556 run_test 154c "lfs path2fid and fid2path multiple arguments"
16557
16558 test_154d() {
16559         remote_mds_nodsh && skip "remote MDS with nodsh"
16560         [[ $MDS1_VERSION -lt $(version_code 2.5.53) ]] &&
16561                 skip "Need MDS version at least 2.5.53"
16562
16563         if remote_mds; then
16564                 nid=$($LCTL list_nids | sed  "s/\./\\\./g")
16565         else
16566                 nid="0@lo"
16567         fi
16568         local proc_ofile="mdt.*.exports.'$nid'.open_files"
16569         local fd
16570         local cmd
16571
16572         rm -f $DIR/$tfile
16573         touch $DIR/$tfile
16574
16575         local fid=$($LFS path2fid $DIR/$tfile)
16576         # Open the file
16577         fd=$(free_fd)
16578         cmd="exec $fd<$DIR/$tfile"
16579         eval $cmd
16580         local fid_list=$(do_facet $SINGLEMDS $LCTL get_param $proc_ofile)
16581         echo "$fid_list" | grep "$fid"
16582         rc=$?
16583
16584         cmd="exec $fd>/dev/null"
16585         eval $cmd
16586         if [ $rc -ne 0 ]; then
16587                 error "FID $fid not found in open files list $fid_list"
16588         fi
16589 }
16590 run_test 154d "Verify open file fid"
16591
16592 test_154e()
16593 {
16594         [[ $MDS1_VERSION -lt $(version_code 2.6.50) ]] &&
16595                 skip "Need MDS version at least 2.6.50"
16596
16597         if ls -a $MOUNT | grep -q '^\.lustre$'; then
16598                 error ".lustre returned by readdir"
16599         fi
16600 }
16601 run_test 154e ".lustre is not returned by readdir"
16602
16603 test_154f() {
16604         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
16605
16606         # create parent directory on a single MDT to avoid cross-MDT hardlinks
16607         mkdir_on_mdt0 $DIR/$tdir
16608         # test dirs inherit from its stripe
16609         mkdir -p $DIR/$tdir/foo1 || error "mkdir error"
16610         mkdir -p $DIR/$tdir/foo2 || error "mkdir error"
16611         cp /etc/hosts $DIR/$tdir/foo1/$tfile
16612         ln $DIR/$tdir/foo1/$tfile $DIR/$tdir/foo2/link
16613         touch $DIR/f
16614
16615         # get fid of parents
16616         local FID0=$($LFS path2fid $DIR/$tdir)
16617         local FID1=$($LFS path2fid $DIR/$tdir/foo1)
16618         local FID2=$($LFS path2fid $DIR/$tdir/foo2)
16619         local FID3=$($LFS path2fid $DIR)
16620
16621         # check that path2fid --parents returns expected <parent_fid>/name
16622         # 1) test for a directory (single parent)
16623         local parent=$($LFS path2fid --parents $DIR/$tdir/foo1)
16624         [ "$parent" == "$FID0/foo1" ] ||
16625                 error "expected parent: $FID0/foo1, got: $parent"
16626
16627         # 2) test for a file with nlink > 1 (multiple parents)
16628         parent=$($LFS path2fid --parents $DIR/$tdir/foo1/$tfile)
16629         echo "$parent" | grep -F "$FID1/$tfile" ||
16630                 error "$FID1/$tfile not returned in parent list"
16631         echo "$parent" | grep -F "$FID2/link" ||
16632                 error "$FID2/link not returned in parent list"
16633
16634         # 3) get parent by fid
16635         local file_fid=$($LFS path2fid $DIR/$tdir/foo1/$tfile)
16636         parent=$($LFS path2fid --parents $MOUNT/.lustre/fid/$file_fid)
16637         echo "$parent" | grep -F "$FID1/$tfile" ||
16638                 error "$FID1/$tfile not returned in parent list (by fid)"
16639         echo "$parent" | grep -F "$FID2/link" ||
16640                 error "$FID2/link not returned in parent list (by fid)"
16641
16642         # 4) test for entry in root directory
16643         parent=$($LFS path2fid --parents $DIR/f)
16644         echo "$parent" | grep -F "$FID3/f" ||
16645                 error "$FID3/f not returned in parent list"
16646
16647         # 5) test it on root directory
16648         [ -z "$($LFS path2fid --parents $MOUNT 2>/dev/null)" ] ||
16649                 error "$MOUNT should not have parents"
16650
16651         # enable xattr caching and check that linkea is correctly updated
16652         local save="$TMP/$TESTSUITE-$TESTNAME.parameters"
16653         save_lustre_params client "llite.*.xattr_cache" > $save
16654         lctl set_param llite.*.xattr_cache 1
16655
16656         # 6.1) linkea update on rename
16657         mv $DIR/$tdir/foo1/$tfile $DIR/$tdir/foo2/$tfile.moved
16658
16659         # get parents by fid
16660         parent=$($LFS path2fid --parents $MOUNT/.lustre/fid/$file_fid)
16661         # foo1 should no longer be returned in parent list
16662         echo "$parent" | grep -F "$FID1" &&
16663                 error "$FID1 should no longer be in parent list"
16664         # the new path should appear
16665         echo "$parent" | grep -F "$FID2/$tfile.moved" ||
16666                 error "$FID2/$tfile.moved is not in parent list"
16667
16668         # 6.2) linkea update on unlink
16669         rm -f $DIR/$tdir/foo2/link
16670         parent=$($LFS path2fid --parents $MOUNT/.lustre/fid/$file_fid)
16671         # foo2/link should no longer be returned in parent list
16672         echo "$parent" | grep -F "$FID2/link" &&
16673                 error "$FID2/link should no longer be in parent list"
16674         true
16675
16676         rm -f $DIR/f
16677         restore_lustre_params < $save
16678         rm -f $save
16679 }
16680 run_test 154f "get parent fids by reading link ea"
16681
16682 test_154g()
16683 {
16684         [[ $MDS1_VERSION -ge $(version_code 2.6.92) &&
16685            $CLIENT_VERSION -gt $(version_code 2.6.99) ]] ||
16686                 skip "Need MDS version at least 2.6.92"
16687
16688         mkdir_on_mdt0 $DIR/$tdir
16689         llapi_fid_test -d $DIR/$tdir
16690 }
16691 run_test 154g "various llapi FID tests"
16692
16693 test_154h()
16694 {
16695         (( $CLIENT_VERSION >= $(version_code 2.15.55.1) )) ||
16696                 skip "Need client at least version 2.15.55.1"
16697
16698         # Create an empty file
16699         touch $DIR/$tfile
16700
16701         # Get FID (interactive mode) and save under $TMP/$tfile.log
16702         $LFS 2>&1 <<-EOF | tee $TMP/$tfile.log
16703                 path2fid $DIR/$tfile
16704         EOF
16705
16706         fid=$(cat $TMP/$tfile.log)
16707         # $fid should not be empty
16708         [[ ! -z $fid ]] || error "FID is empty"
16709         $LFS rmfid $DIR "$fid" || error "rmfid failed for $fid"
16710 }
16711 run_test 154h "Verify interactive path2fid"
16712
16713 test_155_small_load() {
16714     local temp=$TMP/$tfile
16715     local file=$DIR/$tfile
16716
16717     dd if=/dev/urandom of=$temp bs=6096 count=1 || \
16718         error "dd of=$temp bs=6096 count=1 failed"
16719     cp $temp $file
16720     cancel_lru_locks $OSC
16721     cmp $temp $file || error "$temp $file differ"
16722
16723     $TRUNCATE $temp 6000
16724     $TRUNCATE $file 6000
16725     cmp $temp $file || error "$temp $file differ (truncate1)"
16726
16727     echo "12345" >>$temp
16728     echo "12345" >>$file
16729     cmp $temp $file || error "$temp $file differ (append1)"
16730
16731     echo "12345" >>$temp
16732     echo "12345" >>$file
16733     cmp $temp $file || error "$temp $file differ (append2)"
16734
16735     rm -f $temp $file
16736     true
16737 }
16738
16739 test_155_big_load() {
16740         remote_ost_nodsh && skip "remote OST with nodsh"
16741
16742         local temp=$TMP/$tfile
16743         local file=$DIR/$tfile
16744
16745         free_min_max
16746         local cache_size=$(do_facet ost$((MAXI+1)) \
16747                 "awk '/cache/ {sum+=\\\$4} END {print sum}' /proc/cpuinfo")
16748
16749         # LU-16042: can not get the cache size on Arm64 VM here, fallback to a
16750         # pre-set value
16751         if [ -z "$cache_size" ]; then
16752                 cache_size=256
16753         fi
16754         local large_file_size=$((cache_size * 2))
16755
16756         echo "OSS cache size: $cache_size KB"
16757         echo "Large file size: $large_file_size KB"
16758
16759         [ $MAXV -le $large_file_size ] &&
16760                 skip_env "max available OST size needs > $large_file_size KB"
16761
16762         $LFS setstripe $file -c 1 -i $MAXI || error "$LFS setstripe $file failed"
16763
16764         dd if=/dev/urandom of=$temp bs=$large_file_size count=1k ||
16765                 error "dd of=$temp bs=$large_file_size count=1k failed"
16766         cp $temp $file
16767         ls -lh $temp $file
16768         cancel_lru_locks osc
16769         cmp $temp $file || error "$temp $file differ"
16770
16771         rm -f $temp $file
16772         true
16773 }
16774
16775 save_writethrough() {
16776         local facets=$(get_facets OST)
16777
16778         save_lustre_params $facets "osd-*.*.writethrough_cache_enable" > $1
16779 }
16780
16781 test_155a() {
16782         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16783
16784         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16785
16786         save_writethrough $p
16787
16788         set_cache read on
16789         set_cache writethrough on
16790         test_155_small_load
16791         restore_lustre_params < $p
16792         rm -f $p
16793 }
16794 run_test 155a "Verify small file correctness: read cache:on write_cache:on"
16795
16796 test_155b() {
16797         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16798
16799         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16800
16801         save_writethrough $p
16802
16803         set_cache read on
16804         set_cache writethrough off
16805         test_155_small_load
16806         restore_lustre_params < $p
16807         rm -f $p
16808 }
16809 run_test 155b "Verify small file correctness: read cache:on write_cache:off"
16810
16811 test_155c() {
16812         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16813
16814         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16815
16816         save_writethrough $p
16817
16818         set_cache read off
16819         set_cache writethrough on
16820         test_155_small_load
16821         restore_lustre_params < $p
16822         rm -f $p
16823 }
16824 run_test 155c "Verify small file correctness: read cache:off write_cache:on"
16825
16826 test_155d() {
16827         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16828
16829         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16830
16831         save_writethrough $p
16832
16833         set_cache read off
16834         set_cache writethrough off
16835         test_155_small_load
16836         restore_lustre_params < $p
16837         rm -f $p
16838 }
16839 run_test 155d "Verify small file correctness: read cache:off write_cache:off"
16840
16841 test_155e() {
16842         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16843
16844         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16845
16846         save_writethrough $p
16847
16848         set_cache read on
16849         set_cache writethrough on
16850         test_155_big_load
16851         restore_lustre_params < $p
16852         rm -f $p
16853 }
16854 run_test 155e "Verify big file correctness: read cache:on write_cache:on"
16855
16856 test_155f() {
16857         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16858
16859         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16860
16861         save_writethrough $p
16862
16863         set_cache read on
16864         set_cache writethrough off
16865         test_155_big_load
16866         restore_lustre_params < $p
16867         rm -f $p
16868 }
16869 run_test 155f "Verify big file correctness: read cache:on write_cache:off"
16870
16871 test_155g() {
16872         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16873
16874         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16875
16876         save_writethrough $p
16877
16878         set_cache read off
16879         set_cache writethrough on
16880         test_155_big_load
16881         restore_lustre_params < $p
16882         rm -f $p
16883 }
16884 run_test 155g "Verify big file correctness: read cache:off write_cache:on"
16885
16886 test_155h() {
16887         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16888
16889         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16890
16891         save_writethrough $p
16892
16893         set_cache read off
16894         set_cache writethrough off
16895         test_155_big_load
16896         restore_lustre_params < $p
16897         rm -f $p
16898 }
16899 run_test 155h "Verify big file correctness: read cache:off write_cache:off"
16900
16901 test_156() {
16902         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16903         remote_ost_nodsh && skip "remote OST with nodsh"
16904         [ $OST1_VERSION -lt $(version_code 2.6.93) ] &&
16905                 skip "stats not implemented on old servers"
16906         [ "$ost1_FSTYPE" = "zfs" ] &&
16907                 skip "LU-1956/LU-2261: stats not implemented on OSD ZFS"
16908         (( CLIENT_VERSION == OST1_VERSION )) ||
16909                 skip "LU-13081: no interop testing for OSS cache"
16910
16911         local CPAGES=3
16912         local BEFORE
16913         local AFTER
16914         local file="$DIR/$tfile"
16915         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16916
16917         save_writethrough $p
16918         roc_hit_init
16919
16920         log "Turn on read and write cache"
16921         set_cache read on
16922         set_cache writethrough on
16923
16924         log "Write data and read it back."
16925         log "Read should be satisfied from the cache."
16926         dd if=/dev/urandom of=$file bs=4k count=$CPAGES || error "dd failed"
16927         BEFORE=$(roc_hit)
16928         cancel_lru_locks osc
16929         cat $file >/dev/null
16930         AFTER=$(roc_hit)
16931         if ! let "AFTER - BEFORE == CPAGES"; then
16932                 error "NOT IN CACHE (2): before: $BEFORE, after: $AFTER"
16933         else
16934                 log "cache hits: before: $BEFORE, after: $AFTER"
16935         fi
16936
16937         log "Read again; it should be satisfied from the cache."
16938         BEFORE=$AFTER
16939         cancel_lru_locks osc
16940         cat $file >/dev/null
16941         AFTER=$(roc_hit)
16942         if ! let "AFTER - BEFORE == CPAGES"; then
16943                 error "NOT IN CACHE (3): before: $BEFORE, after: $AFTER"
16944         else
16945                 log "cache hits:: before: $BEFORE, after: $AFTER"
16946         fi
16947
16948         log "Turn off the read cache and turn on the write cache"
16949         set_cache read off
16950         set_cache writethrough on
16951
16952         log "Read again; it should be satisfied from the cache."
16953         BEFORE=$(roc_hit)
16954         cancel_lru_locks osc
16955         cat $file >/dev/null
16956         AFTER=$(roc_hit)
16957         if ! let "AFTER - BEFORE == CPAGES"; then
16958                 error "NOT IN CACHE (4): before: $BEFORE, after: $AFTER"
16959         else
16960                 log "cache hits:: before: $BEFORE, after: $AFTER"
16961         fi
16962
16963         if [ $OST1_VERSION -lt $(version_code 2.12.55) ]; then
16964                 # > 2.12.56 uses pagecache if cached
16965                 log "Read again; it should not be satisfied from the cache."
16966                 BEFORE=$AFTER
16967                 cancel_lru_locks osc
16968                 cat $file >/dev/null
16969                 AFTER=$(roc_hit)
16970                 if ! let "AFTER - BEFORE == 0"; then
16971                         error "IN CACHE (5): before: $BEFORE, after: $AFTER"
16972                 else
16973                         log "cache hits:: before: $BEFORE, after: $AFTER"
16974                 fi
16975         fi
16976
16977         log "Write data and read it back."
16978         log "Read should be satisfied from the cache."
16979         dd if=/dev/urandom of=$file bs=4k count=$CPAGES || error "dd failed"
16980         BEFORE=$(roc_hit)
16981         cancel_lru_locks osc
16982         cat $file >/dev/null
16983         AFTER=$(roc_hit)
16984         if ! let "AFTER - BEFORE == CPAGES"; then
16985                 error "NOT IN CACHE (6): before: $BEFORE, after: $AFTER"
16986         else
16987                 log "cache hits:: before: $BEFORE, after: $AFTER"
16988         fi
16989
16990         if [ $OST1_VERSION -lt $(version_code 2.12.55) ]; then
16991                 # > 2.12.56 uses pagecache if cached
16992                 log "Read again; it should not be satisfied from the cache."
16993                 BEFORE=$AFTER
16994                 cancel_lru_locks osc
16995                 cat $file >/dev/null
16996                 AFTER=$(roc_hit)
16997                 if ! let "AFTER - BEFORE == 0"; then
16998                         error "IN CACHE (7): before: $BEFORE, after: $AFTER"
16999                 else
17000                         log "cache hits:: before: $BEFORE, after: $AFTER"
17001                 fi
17002         fi
17003
17004         log "Turn off read and write cache"
17005         set_cache read off
17006         set_cache writethrough off
17007
17008         log "Write data and read it back"
17009         log "It should not be satisfied from the cache."
17010         rm -f $file
17011         dd if=/dev/urandom of=$file bs=4k count=$CPAGES || error "dd failed"
17012         cancel_lru_locks osc
17013         BEFORE=$(roc_hit)
17014         cat $file >/dev/null
17015         AFTER=$(roc_hit)
17016         if ! let "AFTER - BEFORE == 0"; then
17017                 error_ignore bz20762 "IN CACHE (8):before:$BEFORE,after:$AFTER"
17018         else
17019                 log "cache hits:: before: $BEFORE, after: $AFTER"
17020         fi
17021
17022         log "Turn on the read cache and turn off the write cache"
17023         set_cache read on
17024         set_cache writethrough off
17025
17026         log "Write data and read it back"
17027         log "It should not be satisfied from the cache."
17028         rm -f $file
17029         dd if=/dev/urandom of=$file bs=4k count=$CPAGES || error "dd failed"
17030         BEFORE=$(roc_hit)
17031         cancel_lru_locks osc
17032         cat $file >/dev/null
17033         AFTER=$(roc_hit)
17034         if ! let "AFTER - BEFORE == 0"; then
17035                 error_ignore bz20762 "IN CACHE (9):before:$BEFORE,after:$AFTER"
17036         else
17037                 log "cache hits:: before: $BEFORE, after: $AFTER"
17038         fi
17039
17040         log "Read again; it should be satisfied from the cache."
17041         BEFORE=$(roc_hit)
17042         cancel_lru_locks osc
17043         cat $file >/dev/null
17044         AFTER=$(roc_hit)
17045         if ! let "AFTER - BEFORE == CPAGES"; then
17046                 error "NOT IN CACHE (1): before: $BEFORE, after: $AFTER"
17047         else
17048                 log "cache hits:: before: $BEFORE, after: $AFTER"
17049         fi
17050
17051         restore_lustre_params < $p
17052         rm -f $p $file
17053 }
17054 run_test 156 "Verification of tunables"
17055
17056 test_160a() {
17057         [ $PARALLEL == "yes" ] && skip "skip parallel run"
17058         remote_mds_nodsh && skip "remote MDS with nodsh"
17059         [ $MDS1_VERSION -ge $(version_code 2.2.0) ] ||
17060                 skip "Need MDS version at least 2.2.0"
17061
17062         changelog_register || error "changelog_register failed"
17063         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
17064         changelog_users $SINGLEMDS | grep -q $cl_user ||
17065                 error "User $cl_user not found in changelog_users"
17066
17067         mkdir_on_mdt0 $DIR/$tdir
17068
17069         # change something
17070         test_mkdir -p $DIR/$tdir/pics/2008/zachy
17071         changelog_clear 0 || error "changelog_clear failed"
17072         touch $DIR/$tdir/pics/2008/zachy/$tfile                 # open 1
17073         cp /etc/hosts $DIR/$tdir/pics/2008/zachy/pic1.jpg       # open 2
17074         mv $DIR/$tdir/pics/2008/zachy $DIR/$tdir/pics/zach
17075         ln $DIR/$tdir/pics/zach/pic1.jpg $DIR/$tdir/pics/2008/portland.jpg
17076         ln -s $DIR/$tdir/pics/2008/portland.jpg $DIR/$tdir/pics/desktop.jpg
17077         rm $DIR/$tdir/pics/desktop.jpg
17078
17079         echo "verifying changelog mask"
17080         changelog_chmask "-MKDIR"
17081         changelog_chmask "-CLOSE"
17082
17083         test_mkdir -p $DIR/$tdir/pics/zach/sofia                # not logged
17084         echo "zzzzzz" > $DIR/$tdir/pics/zach/file               # not logged
17085
17086         changelog_chmask "+MKDIR"
17087         changelog_chmask "+CLOSE"
17088
17089         test_mkdir -p $DIR/$tdir/pics/2008/sofia                # mkdir 1
17090         echo "zzzzzz" > $DIR/$tdir/pics/zach/file               # open 3
17091
17092         MKDIRS=$(changelog_dump | grep -c "MKDIR")
17093         CLOSES=$(changelog_dump | grep -c "CLOSE")
17094         [ $MKDIRS -eq 1 ] || error "MKDIR changelog mask count $MKDIRS != 1"
17095         [ $CLOSES -eq 3 ] || error "CLOSE changelog mask count $CLOSES != 3"
17096
17097         # verify contents
17098         echo "verifying target fid"
17099         local fidc=$(changelog_extract_field "CREAT" "$tfile" "t=")
17100         local fidf=$($LFS path2fid $DIR/$tdir/pics/zach/$tfile)
17101         [ "$fidc" == "$fidf" ] ||
17102                 error "changelog '$tfile' fid $fidc != file fid $fidf"
17103         echo "verifying parent fid"
17104         # The FID returned from the Changelog may be the directory shard on
17105         # a different MDT, and not the FID returned by path2fid on the parent.
17106         # Instead of comparing FIDs, verify that fid2path(fidp) is correct,
17107         # since this is what will matter when recreating this file in the tree.
17108         local fidp=$(changelog_extract_field "CREAT" "$tfile" "p=")
17109         local pathp=$($LFS fid2path $MOUNT "$fidp")
17110         [ "${pathp%/}" == "$DIR/$tdir/pics/zach" ] ||
17111                 error "changelog fid2path($fidc) $pathp != $DIR/$tdir/pics/zach"
17112
17113         echo "getting records for $cl_user"
17114         changelog_users $SINGLEMDS
17115         local user_rec1=$(changelog_user_rec $SINGLEMDS $cl_user)
17116         local nclr=3
17117         __changelog_clear $SINGLEMDS $cl_user +$nclr ||
17118                 error "changelog_clear failed"
17119         local user_rec2=$(changelog_user_rec $SINGLEMDS $cl_user)
17120         echo "verifying user clear: $user_rec1 + $nclr == $user_rec2"
17121         [ $user_rec2 == $((user_rec1 + nclr)) ] ||
17122                 error "user index expect $user_rec1 + $nclr != $user_rec2"
17123
17124         local min0_rec=$(changelog_users $SINGLEMDS |
17125                 awk 'min == "" || $2 < min { min = $2 }; END { print min }')
17126         local first_rec=$($LFS changelog $(facet_svc $SINGLEMDS) |
17127                           awk '{ print $1; exit; }')
17128
17129         changelog_dump | tail -n 5
17130         echo "verifying user min purge: $min0_rec + 1 == $first_rec"
17131         [ $first_rec == $((min0_rec + 1)) ] ||
17132                 error "first index should be $min0_rec + 1 not $first_rec"
17133
17134         # LU-3446 changelog index reset on MDT restart
17135         local cur_rec1=$(changelog_users $SINGLEMDS |
17136                          awk '/^current.index:/ { print $NF }')
17137         changelog_clear 0 ||
17138                 error "clear all changelog records for $cl_user failed"
17139         stop $SINGLEMDS || error "Fail to stop $SINGLEMDS"
17140         start $SINGLEMDS $(mdsdevname ${SINGLEMDS//mds/}) $MDS_MOUNT_OPTS ||
17141                 error "Fail to start $SINGLEMDS"
17142         local cur_rec2=$(changelog_users $SINGLEMDS |
17143                          awk '/^current.index:/ { print $NF }')
17144         echo "verifying index survives MDT restart: $cur_rec1 == $cur_rec2"
17145         [ $cur_rec1 == $cur_rec2 ] ||
17146                 error "current index should be $cur_rec1 not $cur_rec2"
17147
17148         echo "verifying users from this test are deregistered"
17149         changelog_deregister || error "changelog_deregister failed"
17150         changelog_users $SINGLEMDS | grep -q $cl_user &&
17151                 error "User '$cl_user' still in changelog_users"
17152
17153         # lctl get_param -n mdd.*.changelog_users
17154         # current_index: 144
17155         # ID    index (idle seconds)
17156         # cl3   144   (2) mask=<list>
17157         if [ -z "$(changelog_users $SINGLEMDS | grep -v current.index)" ]; then
17158                 # this is the normal case where all users were deregistered
17159                 # make sure no new records are added when no users are present
17160                 local last_rec1=$(changelog_users $SINGLEMDS |
17161                                   awk '/^current.index:/ { print $NF }')
17162                 touch $DIR/$tdir/chloe
17163                 local last_rec2=$(changelog_users $SINGLEMDS |
17164                                   awk '/^current.index:/ { print $NF }')
17165                 echo "verify changelogs are off: $last_rec1 == $last_rec2"
17166                 [ $last_rec1 == $last_rec2 ] || error "changelogs not off"
17167         else
17168                 # any changelog users must be leftovers from a previous test
17169                 changelog_users $SINGLEMDS
17170                 echo "other changelog users; can't verify off"
17171         fi
17172 }
17173 run_test 160a "changelog sanity"
17174
17175 test_160b() { # LU-3587
17176         [ $PARALLEL == "yes" ] && skip "skip parallel run"
17177         remote_mds_nodsh && skip "remote MDS with nodsh"
17178         [ $MDS1_VERSION -ge $(version_code 2.2.0) ] ||
17179                 skip "Need MDS version at least 2.2.0"
17180
17181         changelog_register || error "changelog_register failed"
17182         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
17183         changelog_users $SINGLEMDS | grep -q $cl_user ||
17184                 error "User '$cl_user' not found in changelog_users"
17185
17186         local longname1=$(str_repeat a 255)
17187         local longname2=$(str_repeat b 255)
17188
17189         cd $DIR
17190         echo "creating very long named file"
17191         touch $longname1 || error "create of '$longname1' failed"
17192         echo "renaming very long named file"
17193         mv $longname1 $longname2
17194
17195         changelog_dump | grep RENME | tail -n 5
17196         rm -f $longname2
17197 }
17198 run_test 160b "Verify that very long rename doesn't crash in changelog"
17199
17200 test_160c() {
17201         [ $PARALLEL == "yes" ] && skip "skip parallel run"
17202         remote_mds_nodsh && skip "remote MDS with nodsh"
17203
17204         [[ $MDS1_VERSION -gt $(version_code 2.5.57) ]] ||
17205                 [[ $MDS1_VERSION -gt $(version_code 2.5.1) &&
17206                    $MDS1_VERSION -lt $(version_code 2.5.50) ]] ||
17207                 skip "Need MDS version at least 2.5.58 or 2.5.2+"
17208
17209         local rc=0
17210
17211         # Registration step
17212         changelog_register || error "changelog_register failed"
17213
17214         rm -rf $DIR/$tdir
17215         mkdir -p $DIR/$tdir
17216         $MCREATE $DIR/$tdir/foo_160c
17217         changelog_chmask "-TRUNC"
17218         $TRUNCATE $DIR/$tdir/foo_160c 200
17219         changelog_chmask "+TRUNC"
17220         $TRUNCATE $DIR/$tdir/foo_160c 199
17221         changelog_dump | tail -n 5
17222         local truncs=$(changelog_dump | tail -n 5 | grep -c TRUNC)
17223         [ $truncs -eq 1 ] || error "TRUNC changelog mask count $truncs != 1"
17224 }
17225 run_test 160c "verify that changelog log catch the truncate event"
17226
17227 test_160d() {
17228         remote_mds_nodsh && skip "remote MDS with nodsh"
17229         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
17230         [ $PARALLEL == "yes" ] && skip "skip parallel run"
17231         [[ $MDS1_VERSION -ge $(version_code 2.7.60) ]] ||
17232                 skip "Need MDS version at least 2.7.60"
17233
17234         # Registration step
17235         changelog_register || error "changelog_register failed"
17236
17237         mkdir -p $DIR/$tdir/migrate_dir
17238         changelog_clear 0 || error "changelog_clear failed"
17239
17240         $LFS migrate -m 1 $DIR/$tdir/migrate_dir || error "migrate fails"
17241         changelog_dump | tail -n 5
17242         local migrates=$(changelog_dump | grep -c "MIGRT")
17243         [ $migrates -eq 1 ] || error "MIGRATE changelog count $migrates != 1"
17244 }
17245 run_test 160d "verify that changelog log catch the migrate event"
17246
17247 test_160e() {
17248         remote_mds_nodsh && skip "remote MDS with nodsh"
17249
17250         # Create a user
17251         changelog_register || error "changelog_register failed"
17252
17253         local MDT0=$(facet_svc $SINGLEMDS)
17254         local rc
17255
17256         # No user (expect fail)
17257         do_facet $SINGLEMDS $LCTL --device $MDT0 changelog_deregister
17258         rc=$?
17259         if [ $rc -eq 0 ]; then
17260                 error "Should fail without user"
17261         elif [ $rc -ne 4 ]; then
17262                 error "changelog_deregister failed with $rc, expect 4(CMD_HELP)"
17263         fi
17264
17265         # Delete a future user (expect fail)
17266         do_facet $SINGLEMDS $LCTL --device $MDT0 changelog_deregister "cl77"
17267         rc=$?
17268         if [ $rc -eq 0 ]; then
17269                 error "Deleted non-existant user cl77"
17270         elif [ $rc -ne 2 ]; then
17271                 error "changelog_deregister failed with $rc, expect 2 (ENOENT)"
17272         fi
17273
17274         # Clear to a bad index (1 billion should be safe)
17275         $LFS changelog_clear $MDT0 "${CL_USERS[$SINGLEMDS]%% *}" 1000000000
17276         rc=$?
17277
17278         if [ $rc -eq 0 ]; then
17279                 error "Successfully cleared to invalid CL index"
17280         elif [ $rc -ne 22 ]; then
17281                 error "changelog_clear failed with $rc, expected 22 (EINVAL)"
17282         fi
17283 }
17284 run_test 160e "changelog negative testing (should return errors)"
17285
17286 test_160f() {
17287         remote_mds_nodsh && skip "remote MDS with nodsh" && return
17288         [[ $MDS1_VERSION -ge $(version_code 2.10.56) ]] ||
17289                 skip "Need MDS version at least 2.10.56"
17290
17291         local mdts=$(comma_list $(mdts_nodes))
17292
17293         # Create a user
17294         changelog_register || error "first changelog_register failed"
17295         changelog_register || error "second changelog_register failed"
17296         local cl_users
17297         declare -A cl_user1
17298         declare -A cl_user2
17299         local user_rec1
17300         local user_rec2
17301         local i
17302
17303         # generate some changelog records to accumulate on each MDT
17304         # use all_char because created files should be evenly distributed
17305         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17306                 error "test_mkdir $tdir failed"
17307         log "$(date +%s): creating first files"
17308         for ((i = 0; i < MDSCOUNT * 2; i++)); do
17309                 $LFS mkdir -i $((i%MDSCOUNT)) $DIR/$tdir/d$i.$((i/MDSCOUNT)) ||
17310                         error "create $DIR/$tdir/d$i.$((i/MDSCOUNT)) failed"
17311         done
17312
17313         # check changelogs have been generated
17314         local start=$SECONDS
17315         local idle_time=$((MDSCOUNT * 5 + 5))
17316         local nbcl=$(changelog_dump | wc -l)
17317         [[ $nbcl -eq 0 ]] && error "no changelogs found"
17318
17319         for param in "changelog_max_idle_time=$idle_time" \
17320                      "changelog_gc=1" \
17321                      "changelog_min_gc_interval=2" \
17322                      "changelog_min_free_cat_entries=3"; do
17323                 local MDT0=$(facet_svc $SINGLEMDS)
17324                 local var="${param%=*}"
17325                 local old=$(do_facet mds1 "$LCTL get_param -n mdd.$MDT0.$var")
17326
17327                 stack_trap "do_nodes $mdts $LCTL set_param mdd.*.$var=$old" EXIT
17328                 do_nodes $mdts $LCTL set_param mdd.*.$param
17329         done
17330
17331         # force cl_user2 to be idle (1st part), but also cancel the
17332         # cl_user1 records so that it is not evicted later in the test.
17333         local sleep1=$((idle_time / 2))
17334         echo "$(date +%s): sleep1 $sleep1/${idle_time}s"
17335         sleep $sleep1
17336
17337         # simulate changelog catalog almost full
17338         #define OBD_FAIL_CAT_FREE_RECORDS       0x1313
17339         do_nodes $mdts "$LCTL set_param fail_loc=0x1313 fail_val=3"
17340
17341         for i in $(seq $MDSCOUNT); do
17342                 cl_users=(${CL_USERS[mds$i]})
17343                 cl_user1[mds$i]="${cl_users[0]}"
17344                 cl_user2[mds$i]="${cl_users[1]}"
17345
17346                 [ -n "${cl_user1[mds$i]}" ] ||
17347                         error "mds$i: no user registered"
17348                 [ -n "${cl_user2[mds$i]}" ] ||
17349                         error "mds$i: only ${cl_user2[mds$i]} is registered"
17350
17351                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17352                 [ -n "$user_rec1" ] ||
17353                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17354                 __changelog_clear mds$i ${cl_user1[mds$i]} +2
17355                 user_rec2=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17356                 [ -n "$user_rec2" ] ||
17357                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17358                 echo "mds$i: verifying user ${cl_user1[mds$i]} clear: " \
17359                      "$user_rec1 + 2 == $user_rec2"
17360                 [ $((user_rec1 + 2)) == $user_rec2 ] ||
17361                         error "mds$i: user ${cl_user1[mds$i]} index expected " \
17362                               "$user_rec1 + 2, but is $user_rec2"
17363                 user_rec2=$(changelog_user_rec mds$i ${cl_user2[mds$i]})
17364                 [ -n "$user_rec2" ] ||
17365                         error "mds$i: User ${cl_user2[mds$i]} not registered"
17366                 [ $user_rec1 == $user_rec2 ] ||
17367                         error "mds$i: user ${cl_user2[mds$i]} index expected " \
17368                               "$user_rec1, but is $user_rec2"
17369         done
17370
17371         # force cl_user2 idle (2nd part) to just exceed changelog_max_idle_time
17372         local sleep2=$((idle_time - (SECONDS - start) + 1))
17373         echo "$(date +%s): sleep2 $sleep2/${idle_time}s"
17374         sleep $sleep2
17375
17376         # Generate one more changelog to trigger GC at fail_loc for cl_user2.
17377         # cl_user1 should be OK because it recently processed records.
17378         echo "$(date +%s): creating $((MDSCOUNT * 2)) files"
17379         for ((i = 0; i < MDSCOUNT * 2; i++)); do
17380                 $LFS mkdir -i $((i%MDSCOUNT)) $DIR/$tdir/d$i.$((i/MDSCOUNT+2))||
17381                         error "create $DIR/$tdir/d$i.$((i/MDSCOUNT+2)) failed"
17382         done
17383
17384         # ensure gc thread is done
17385         for i in $(mdts_nodes); do
17386                 wait_update $i "ps -e -o comm= | grep chlg_gc_thread" "" 20 ||
17387                         error "$i: GC-thread not done"
17388         done
17389
17390         local first_rec
17391         for (( i = 1; i <= MDSCOUNT; i++ )); do
17392                 # check cl_user1 still registered
17393                 changelog_users mds$i | grep -q "${cl_user1[mds$i]}" ||
17394                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17395                 # check cl_user2 unregistered
17396                 changelog_users mds$i | grep -q "${cl_user2[mds$i]}" &&
17397                         error "mds$i: User ${cl_user2[mds$i]} still registered"
17398
17399                 # check changelogs are present and starting at $user_rec1 + 1
17400                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17401                 [ -n "$user_rec1" ] ||
17402                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17403                 first_rec=$($LFS changelog $(facet_svc mds$i) |
17404                             awk '{ print $1; exit; }')
17405
17406                 echo "mds$i: $(date +%s) verify rec $user_rec1+1 == $first_rec"
17407                 [ $((user_rec1 + 1)) == $first_rec ] ||
17408                         error "mds$i: rec $first_rec != $user_rec1 + 1"
17409         done
17410 }
17411 run_test 160f "changelog garbage collect (timestamped users)"
17412
17413 test_160g() {
17414         remote_mds_nodsh && skip "remote MDS with nodsh"
17415         [[ $MDS1_VERSION -ge $(version_code 2.14.55) ]] ||
17416                 skip "Need MDS version at least 2.14.55"
17417
17418         local mdts=$(comma_list $(mdts_nodes))
17419
17420         # Create a user
17421         changelog_register || error "first changelog_register failed"
17422         changelog_register || error "second changelog_register failed"
17423         local cl_users
17424         declare -A cl_user1
17425         declare -A cl_user2
17426         local user_rec1
17427         local user_rec2
17428         local i
17429
17430         # generate some changelog records to accumulate on each MDT
17431         # use all_char because created files should be evenly distributed
17432         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17433                 error "test_mkdir $tdir failed"
17434         for ((i = 0; i < MDSCOUNT; i++)); do
17435                 $LFS mkdir -i $i $DIR/$tdir/d$i.1 $DIR/$tdir/d$i.2 ||
17436                         error "create $DIR/$tdir/d$i.1 failed"
17437         done
17438
17439         # check changelogs have been generated
17440         local nbcl=$(changelog_dump | wc -l)
17441         (( $nbcl > 0 )) || error "no changelogs found"
17442
17443         # reduce the max_idle_indexes value to make sure we exceed it
17444         for param in "changelog_max_idle_indexes=2" \
17445                      "changelog_gc=1" \
17446                      "changelog_min_gc_interval=2"; do
17447                 local MDT0=$(facet_svc $SINGLEMDS)
17448                 local var="${param%=*}"
17449                 local old=$(do_facet mds1 "$LCTL get_param -n mdd.$MDT0.$var")
17450
17451                 stack_trap "do_nodes $mdts $LCTL set_param mdd.*.$var=$old" EXIT
17452                 do_nodes $mdts $LCTL set_param mdd.*.$param ||
17453                         error "unable to set mdd.*.$param"
17454         done
17455
17456         local start=$SECONDS
17457         for i in $(seq $MDSCOUNT); do
17458                 cl_users=(${CL_USERS[mds$i]})
17459                 cl_user1[mds$i]="${cl_users[0]}"
17460                 cl_user2[mds$i]="${cl_users[1]}"
17461
17462                 [ -n "${cl_user1[mds$i]}" ] ||
17463                         error "mds$i: user1 is not registered"
17464                 [ -n "${cl_user2[mds$i]}" ] ||
17465                         error "mds$i: only ${cl_user1[mds$i]} is registered"
17466
17467                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17468                 [ -n "$user_rec1" ] ||
17469                         error "mds$i: user1 ${cl_user1[mds$i]} not found"
17470                 __changelog_clear mds$i ${cl_user1[mds$i]} +2
17471                 user_rec2=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17472                 [ -n "$user_rec2" ] ||
17473                         error "mds$i: user1 ${cl_user1[mds$i]} not found (2)"
17474                 echo "mds$i: verifying user1 ${cl_user1[mds$i]} clear: " \
17475                      "$user_rec1 + 2 == $user_rec2"
17476                 [ $((user_rec1 + 2)) == $user_rec2 ] ||
17477                         error "mds$i: user1 ${cl_user1[mds$i]} index " \
17478                               "expected $user_rec1 + 2, but is $user_rec2"
17479                 user_rec2=$(changelog_user_rec mds$i ${cl_user2[mds$i]})
17480                 [ -n "$user_rec2" ] ||
17481                         error "mds$i: user2 ${cl_user2[mds$i]} not found"
17482                 [ $user_rec1 == $user_rec2 ] ||
17483                         error "mds$i: user2 ${cl_user2[mds$i]} index " \
17484                               "expected $user_rec1, but is $user_rec2"
17485         done
17486
17487         # ensure we are past the previous changelog_min_gc_interval set above
17488         local sleep2=$((start + 2 - SECONDS))
17489         (( sleep2 > 0 )) && echo "sleep $sleep2 for interval" && sleep $sleep2
17490         # Generate one more changelog to trigger GC at fail_loc for cl_user2.
17491         # cl_user1 should be OK because it recently processed records.
17492         for ((i = 0; i < MDSCOUNT; i++)); do
17493                 $LFS mkdir -i $i $DIR/$tdir/d$i.3 ||
17494                         error "create $DIR/$tdir/d$i.3 failed"
17495         done
17496
17497         # ensure gc thread is done
17498         for i in $(mdts_nodes); do
17499                 wait_update $i "ps -e -o comm= | grep chlg_gc_thread" "" 20 ||
17500                         error "$i: GC-thread not done"
17501         done
17502
17503         local first_rec
17504         for (( i = 1; i <= MDSCOUNT; i++ )); do
17505                 # check cl_user1 still registered
17506                 changelog_users mds$i | grep -q "${cl_user1[mds$i]}" ||
17507                         error "mds$i: user1 ${cl_user1[mds$i]} not found (3)"
17508                 # check cl_user2 unregistered
17509                 changelog_users mds$i | grep -q "${cl_user2[mds$i]}" &&
17510                         error "mds$i: user2 ${cl_user2[mds$i]} is registered"
17511
17512                 # check changelogs are present and starting at $user_rec1 + 1
17513                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17514                 [ -n "$user_rec1" ] ||
17515                         error "mds$i: user1 ${cl_user1[mds$i]} not found (4)"
17516                 first_rec=$($LFS changelog $(facet_svc mds$i) |
17517                             awk '{ print $1; exit; }')
17518
17519                 echo "mds$i: $(date +%s) verify rec $user_rec1+1 == $first_rec"
17520                 [ $((user_rec1 + 1)) == $first_rec ] ||
17521                         error "mds$i: rec $first_rec != $user_rec1 + 1"
17522         done
17523 }
17524 run_test 160g "changelog garbage collect on idle records"
17525
17526 test_160h() {
17527         remote_mds_nodsh && skip "remote MDS with nodsh" && return
17528         [[ $MDS1_VERSION -ge $(version_code 2.10.56) ]] ||
17529                 skip "Need MDS version at least 2.10.56"
17530
17531         local mdts=$(comma_list $(mdts_nodes))
17532
17533         # Create a user
17534         changelog_register || error "first changelog_register failed"
17535         changelog_register || error "second changelog_register failed"
17536         local cl_users
17537         declare -A cl_user1
17538         declare -A cl_user2
17539         local user_rec1
17540         local user_rec2
17541         local i
17542
17543         # generate some changelog records to accumulate on each MDT
17544         # use all_char because created files should be evenly distributed
17545         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17546                 error "test_mkdir $tdir failed"
17547         for ((i = 0; i < MDSCOUNT; i++)); do
17548                 $LFS mkdir -i $i $DIR/$tdir/d$i.1 $DIR/$tdir/d$i.2 ||
17549                         error "create $DIR/$tdir/d$i.1 failed"
17550         done
17551
17552         # check changelogs have been generated
17553         local nbcl=$(changelog_dump | wc -l)
17554         [[ $nbcl -eq 0 ]] && error "no changelogs found"
17555
17556         for param in "changelog_max_idle_time=10" \
17557                      "changelog_gc=1" \
17558                      "changelog_min_gc_interval=2"; do
17559                 local MDT0=$(facet_svc $SINGLEMDS)
17560                 local var="${param%=*}"
17561                 local old=$(do_facet mds1 "$LCTL get_param -n mdd.$MDT0.$var")
17562
17563                 stack_trap "do_nodes $mdts $LCTL set_param mdd.*.$var=$old" EXIT
17564                 do_nodes $mdts $LCTL set_param mdd.*.$param
17565         done
17566
17567         # force cl_user2 to be idle (1st part)
17568         sleep 9
17569
17570         for i in $(seq $MDSCOUNT); do
17571                 cl_users=(${CL_USERS[mds$i]})
17572                 cl_user1[mds$i]="${cl_users[0]}"
17573                 cl_user2[mds$i]="${cl_users[1]}"
17574
17575                 [ -n "${cl_user1[mds$i]}" ] ||
17576                         error "mds$i: no user registered"
17577                 [ -n "${cl_user2[mds$i]}" ] ||
17578                         error "mds$i: only ${cl_user2[mds$i]} is registered"
17579
17580                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17581                 [ -n "$user_rec1" ] ||
17582                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17583                 __changelog_clear mds$i ${cl_user1[mds$i]} +2
17584                 user_rec2=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17585                 [ -n "$user_rec2" ] ||
17586                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17587                 echo "mds$i: verifying user ${cl_user1[mds$i]} clear: " \
17588                      "$user_rec1 + 2 == $user_rec2"
17589                 [ $((user_rec1 + 2)) == $user_rec2 ] ||
17590                         error "mds$i: user ${cl_user1[mds$i]} index expected " \
17591                               "$user_rec1 + 2, but is $user_rec2"
17592                 user_rec2=$(changelog_user_rec mds$i ${cl_user2[mds$i]})
17593                 [ -n "$user_rec2" ] ||
17594                         error "mds$i: User ${cl_user2[mds$i]} not registered"
17595                 [ $user_rec1 == $user_rec2 ] ||
17596                         error "mds$i: user ${cl_user2[mds$i]} index expected " \
17597                               "$user_rec1, but is $user_rec2"
17598         done
17599
17600         # force cl_user2 to be idle (2nd part) and to reach
17601         # changelog_max_idle_time
17602         sleep 2
17603
17604         # force each GC-thread start and block then
17605         # one per MDT/MDD, set fail_val accordingly
17606         #define OBD_FAIL_FORCE_GC_THREAD 0x1316
17607         do_nodes $mdts $LCTL set_param fail_loc=0x1316
17608
17609         # generate more changelogs to trigger fail_loc
17610         createmany -m $DIR/$tdir/${tfile}bis $((MDSCOUNT * 2)) ||
17611                 error "create $DIR/$tdir/${tfile}bis failed"
17612
17613         # stop MDT to stop GC-thread, should be done in back-ground as it will
17614         # block waiting for the thread to be released and exit
17615         declare -A stop_pids
17616         for i in $(seq $MDSCOUNT); do
17617                 stop mds$i &
17618                 stop_pids[mds$i]=$!
17619         done
17620
17621         for i in $(mdts_nodes); do
17622                 local facet
17623                 local nb=0
17624                 local facets=$(facets_up_on_host $i)
17625
17626                 for facet in ${facets//,/ }; do
17627                         if [[ $facet == mds* ]]; then
17628                                 nb=$((nb + 1))
17629                         fi
17630                 done
17631                 # ensure each MDS's gc threads are still present and all in "R"
17632                 # state (OBD_FAIL_FORCE_GC_THREAD effect!)
17633                 [[ $(do_node $i pgrep chlg_gc_thread | wc -l) -eq $nb ]] ||
17634                         error "$i: expected $nb GC-thread"
17635                 wait_update $i \
17636                         "ps -C chlg_gc_thread -o state --no-headers | uniq" \
17637                         "R" 20 ||
17638                         error "$i: GC-thread not found in R-state"
17639                 # check umounts of each MDT on MDS have reached kthread_stop()
17640                 [[ $(do_node $i pgrep umount | wc -l) -eq $nb ]] ||
17641                         error "$i: expected $nb umount"
17642                 wait_update $i \
17643                         "ps -C umount -o state --no-headers | uniq" "D" 20 ||
17644                         error "$i: umount not found in D-state"
17645         done
17646
17647         # release all GC-threads
17648         do_nodes $mdts $LCTL set_param fail_loc=0
17649
17650         # wait for MDT stop to complete
17651         for i in $(seq $MDSCOUNT); do
17652                 wait ${stop_pids[mds$i]} || error "mds$i: stop failed"
17653         done
17654
17655         # XXX
17656         # may try to check if any orphan changelog records are present
17657         # via ldiskfs/zfs and llog_reader...
17658
17659         # re-start/mount MDTs
17660         for i in $(seq $MDSCOUNT); do
17661                 start mds$i $(mdsdevname $i) $MDS_MOUNT_OPTS ||
17662                         error "Fail to start mds$i"
17663         done
17664
17665         local first_rec
17666         for i in $(seq $MDSCOUNT); do
17667                 # check cl_user1 still registered
17668                 changelog_users mds$i | grep -q "${cl_user1[mds$i]}" ||
17669                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17670                 # check cl_user2 unregistered
17671                 changelog_users mds$i | grep -q "${cl_user2[mds$i]}" &&
17672                         error "mds$i: User ${cl_user2[mds$i]} still registered"
17673
17674                 # check changelogs are present and starting at $user_rec1 + 1
17675                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17676                 [ -n "$user_rec1" ] ||
17677                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17678                 first_rec=$($LFS changelog $(facet_svc mds$i) |
17679                             awk '{ print $1; exit; }')
17680
17681                 echo "mds$i: verifying first index $user_rec1 + 1 == $first_rec"
17682                 [ $((user_rec1 + 1)) == $first_rec ] ||
17683                         error "mds$i: first index should be $user_rec1 + 1, " \
17684                               "but is $first_rec"
17685         done
17686 }
17687 run_test 160h "changelog gc thread stop upon umount, orphan records delete " \
17688               "during mount"
17689
17690 test_160i() {
17691
17692         local mdts=$(comma_list $(mdts_nodes))
17693
17694         changelog_register || error "first changelog_register failed"
17695
17696         # generate some changelog records to accumulate on each MDT
17697         # use all_char because created files should be evenly distributed
17698         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17699                 error "test_mkdir $tdir failed"
17700         for ((i = 0; i < MDSCOUNT; i++)); do
17701                 $LFS mkdir -i $i $DIR/$tdir/d$i.1 $DIR/$tdir/d$i.2 ||
17702                         error "create $DIR/$tdir/d$i.1 failed"
17703         done
17704
17705         # check changelogs have been generated
17706         local nbcl=$(changelog_dump | wc -l)
17707         [[ $nbcl -eq 0 ]] && error "no changelogs found"
17708
17709         # simulate race between register and unregister
17710         # XXX as fail_loc is set per-MDS, with DNE configs the race
17711         # simulation will only occur for one MDT per MDS and for the
17712         # others the normal race scenario will take place
17713         #define CFS_FAIL_CHLOG_USER_REG_UNREG_RACE          0x1315
17714         do_nodes $mdts $LCTL set_param fail_loc=0x10001315
17715         do_nodes $mdts $LCTL set_param fail_val=1
17716
17717         # unregister 1st user
17718         changelog_deregister &
17719         local pid1=$!
17720         # wait some time for deregister work to reach race rdv
17721         sleep 2
17722         # register 2nd user
17723         changelog_register || error "2nd user register failed"
17724
17725         wait $pid1 || error "1st user deregister failed"
17726
17727         local i
17728         local last_rec
17729         declare -A LAST_REC
17730         for i in $(seq $MDSCOUNT); do
17731                 if changelog_users mds$i | grep "^cl"; then
17732                         # make sure new records are added with one user present
17733                         LAST_REC[mds$i]=$(changelog_users $SINGLEMDS |
17734                                           awk '/^current.index:/ { print $NF }')
17735                 else
17736                         error "mds$i has no user registered"
17737                 fi
17738         done
17739
17740         # generate more changelog records to accumulate on each MDT
17741         createmany -m $DIR/$tdir/${tfile}bis $((MDSCOUNT * 2)) ||
17742                 error "create $DIR/$tdir/${tfile}bis failed"
17743
17744         for i in $(seq $MDSCOUNT); do
17745                 last_rec=$(changelog_users $SINGLEMDS |
17746                            awk '/^current.index:/ { print $NF }')
17747                 echo "verify changelogs are on: $last_rec != ${LAST_REC[mds$i]}"
17748                 [ $last_rec != ${LAST_REC[mds$i]} ] ||
17749                         error "changelogs are off on mds$i"
17750         done
17751 }
17752 run_test 160i "changelog user register/unregister race"
17753
17754 test_160j() {
17755         remote_mds_nodsh && skip "remote MDS with nodsh"
17756         [[ $MDS1_VERSION -lt $(version_code 2.12.56) ]] &&
17757                 skip "Need MDS version at least 2.12.56"
17758
17759         mount_client $MOUNT2 || error "mount_client on $MOUNT2 failed"
17760         stack_trap "umount $MOUNT2" EXIT
17761
17762         changelog_register || error "first changelog_register failed"
17763         stack_trap "changelog_deregister" EXIT
17764
17765         # generate some changelog
17766         # use all_char because created files should be evenly distributed
17767         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17768                 error "mkdir $tdir failed"
17769         for ((i = 0; i < MDSCOUNT; i++)); do
17770                 $LFS mkdir -i $i $DIR/$tdir/d$i.1 $DIR/$tdir/d$i.2 ||
17771                         error "create $DIR/$tdir/d$i.1 failed"
17772         done
17773
17774         # open the changelog device
17775         exec 3>/dev/changelog-$FSNAME-MDT0000
17776         stack_trap "exec 3>&-" EXIT
17777         exec 4</dev/changelog-$FSNAME-MDT0000
17778         stack_trap "exec 4<&-" EXIT
17779
17780         # umount the first lustre mount
17781         umount $MOUNT
17782         stack_trap "mount_client $MOUNT" EXIT
17783
17784         # read changelog, which may or may not fail, but should not crash
17785         cat <&4 >/dev/null
17786
17787         # clear changelog
17788         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
17789         changelog_users $SINGLEMDS | grep -q $cl_user ||
17790                 error "User $cl_user not found in changelog_users"
17791
17792         printf 'clear:'$cl_user':0' >&3
17793 }
17794 run_test 160j "client can be umounted while its chanangelog is being used"
17795
17796 test_160k() {
17797         [ $PARALLEL == "yes" ] && skip "skip parallel run"
17798         remote_mds_nodsh && skip "remote MDS with nodsh"
17799
17800         mkdir -p $DIR/$tdir/1/1
17801
17802         changelog_register || error "changelog_register failed"
17803         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
17804
17805         changelog_users $SINGLEMDS | grep -q $cl_user ||
17806                 error "User '$cl_user' not found in changelog_users"
17807 #define OBD_FAIL_MDS_CHANGELOG_REORDER 0x15d
17808         do_facet mds1 $LCTL set_param fail_loc=0x8000015d fail_val=3
17809         rmdir $DIR/$tdir/1/1 & sleep 1
17810         mkdir $DIR/$tdir/2
17811         touch $DIR/$tdir/2/2
17812         rm -rf $DIR/$tdir/2
17813
17814         wait
17815         sleep 4
17816
17817         changelog_dump | grep rmdir || error "rmdir not recorded"
17818 }
17819 run_test 160k "Verify that changelog records are not lost"
17820
17821 # Verifies that a file passed as a parameter has recently had an operation
17822 # performed on it that has generated an MTIME changelog which contains the
17823 # correct parent FID. As files might reside on a different MDT from the
17824 # parent directory in DNE configurations, the FIDs are translated to paths
17825 # before being compared, which should be identical
17826 compare_mtime_changelog() {
17827         local file="${1}"
17828         local mdtidx
17829         local mtime
17830         local cl_fid
17831         local pdir
17832         local dir
17833
17834         mdtidx=$($LFS getstripe --mdt-index $file)
17835         mdtidx=$(printf "%04x" $mdtidx)
17836
17837         # Obtain the parent FID from the MTIME changelog
17838         mtime=$($LFS changelog $FSNAME-MDT$mdtidx | tail -n 1 | grep MTIME)
17839         [ -z "$mtime" ] && error "MTIME changelog not recorded"
17840
17841         cl_fid=$(sed -e 's/.* p=//' -e 's/ .*//' <<<$mtime)
17842         [ -z "$cl_fid" ] && error "parent FID not present"
17843
17844         # Verify that the path for the parent FID is the same as the path for
17845         # the test directory
17846         pdir=$($LFS fid2path $MOUNT "$cl_fid")
17847
17848         dir=$(dirname $1)
17849
17850         [[ "${pdir%/}" == "$dir" ]] ||
17851                 error "MTIME changelog parent FID is wrong, expected $dir, got $pdir"
17852 }
17853
17854 test_160l() {
17855         [ $PARALLEL == "yes" ] && skip "skip parallel run"
17856
17857         remote_mds_nodsh && skip "remote MDS with nodsh"
17858         [[ $MDS1_VERSION -ge $(version_code 2.13.55) ]] ||
17859                 skip "Need MDS version at least 2.13.55"
17860
17861         local cl_user
17862
17863         changelog_register || error "changelog_register failed"
17864         cl_user="${CL_USERS[$SINGLEMDS]%% *}"
17865
17866         changelog_users $SINGLEMDS | grep -q $cl_user ||
17867                 error "User '$cl_user' not found in changelog_users"
17868
17869         # Clear some types so that MTIME changelogs are generated
17870         changelog_chmask "-CREAT"
17871         changelog_chmask "-CLOSE"
17872
17873         test_mkdir $DIR/$tdir || error "failed to mkdir $DIR/$tdir"
17874
17875         # Test CL_MTIME during setattr
17876         touch $DIR/$tdir/$tfile
17877         compare_mtime_changelog $DIR/$tdir/$tfile
17878
17879         # Test CL_MTIME during close
17880         $MULTIOP $DIR/$tdir/${tfile}_2 O_2w4096c || error "multiop failed"
17881         compare_mtime_changelog $DIR/$tdir/${tfile}_2
17882 }
17883 run_test 160l "Verify that MTIME changelog records contain the parent FID"
17884
17885 test_160m() {
17886         remote_mds_nodsh && skip "remote MDS with nodsh" && return
17887         [[ $MDS1_VERSION -ge $(version_code 2.14.51) ]] ||
17888                 skip "Need MDS version at least 2.14.51"
17889         local cl_users
17890         local cl_user1
17891         local cl_user2
17892         local pid1
17893
17894         # Create a user
17895         changelog_register || error "first changelog_register failed"
17896         changelog_register || error "second changelog_register failed"
17897
17898         cl_users=(${CL_USERS[mds1]})
17899         cl_user1="${cl_users[0]}"
17900         cl_user2="${cl_users[1]}"
17901         # generate some changelog records to accumulate on MDT0
17902         test_mkdir -p -i0 -c1 $DIR/$tdir || error "test_mkdir $tdir failed"
17903         createmany -m $DIR/$tdir/$tfile 50 ||
17904                 error "create $DIR/$tdir/$tfile failed"
17905         unlinkmany $DIR/$tdir/$tfile 50 || error "unlinkmany failed"
17906         rm -f $DIR/$tdir
17907
17908         # check changelogs have been generated
17909         local nbcl=$(changelog_dump | wc -l)
17910         [[ $nbcl -eq 0 ]] && error "no changelogs found"
17911
17912 #define OBD_FAIL_MDS_CHANGELOG_RACE      0x15f
17913         do_facet mds1 $LCTL set_param fail_loc=0x8000015f fail_val=0
17914
17915         __changelog_clear mds1 $cl_user1 +10
17916         __changelog_clear mds1 $cl_user2 0 &
17917         pid1=$!
17918         sleep 2
17919         __changelog_clear mds1 $cl_user1 0 ||
17920                 error "fail to cancel record for $cl_user1"
17921         wait $pid1
17922         [[ $? -eq 0 ]] || error "fail to cancel record for $cl_user2"
17923 }
17924 run_test 160m "Changelog clear race"
17925
17926 test_160n() {
17927         remote_mds_nodsh && skip "remote MDS with nodsh" && return
17928         [[ $MDS1_VERSION -ge $(version_code 2.14.51) ]] ||
17929                 skip "Need MDS version at least 2.14.51"
17930         local cl_users
17931         local cl_user1
17932         local cl_user2
17933         local pid1
17934         local first_rec
17935         local last_rec=0
17936
17937         # Create a user
17938         changelog_register || error "first changelog_register failed"
17939
17940         cl_users=(${CL_USERS[mds1]})
17941         cl_user1="${cl_users[0]}"
17942
17943         # generate some changelog records to accumulate on MDT0
17944         test_mkdir -i0 -c1 $DIR/$tdir || error "test_mkdir $tdir failed"
17945         first_rec=$(changelog_users $SINGLEMDS |
17946                         awk '/^current.index:/ { print $NF }')
17947         while (( last_rec < (( first_rec + 65000)) )); do
17948                 createmany -m $DIR/$tdir/$tfile 10000 ||
17949                         error "create $DIR/$tdir/$tfile failed"
17950
17951                 for i in $(seq 0 10000); do
17952                         mrename $DIR/$tdir/$tfile$i $DIR/$tdir/$tfile-new$i \
17953                                 > /dev/null
17954                 done
17955
17956                 unlinkmany $DIR/$tdir/$tfile-new 10000 ||
17957                         error "unlinkmany failed unlink"
17958                 last_rec=$(changelog_users $SINGLEMDS |
17959                         awk '/^current.index:/ { print $NF }')
17960                 echo last record $last_rec
17961                 (( last_rec == 0 )) && error "no changelog found"
17962         done
17963
17964 #define OBD_FAIL_MDS_CHANGELOG_DEL       0x16c
17965         do_facet mds1 $LCTL set_param fail_loc=0x8000016c fail_val=0
17966
17967         __changelog_clear mds1 $cl_user1 0 &
17968         pid1=$!
17969         sleep 2
17970         __changelog_clear mds1 $cl_user1 0 ||
17971                 error "fail to cancel record for $cl_user1"
17972         wait $pid1
17973         [[ $? -eq 0 ]] || error "fail to cancel record for $cl_user2"
17974 }
17975 run_test 160n "Changelog destroy race"
17976
17977 test_160o() {
17978         local mdt="$(facet_svc $SINGLEMDS)"
17979
17980         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
17981         remote_mds_nodsh && skip "remote MDS with nodsh"
17982         [ $MDS1_VERSION -ge $(version_code 2.14.52) ] ||
17983                 skip "Need MDS version at least 2.14.52"
17984
17985         changelog_register --user test_160o -m unlnk+close+open ||
17986                 error "changelog_register failed"
17987
17988         do_facet $SINGLEMDS $LCTL --device $mdt \
17989                                 changelog_register -u "Tt3_-#" &&
17990                 error "bad symbols in name should fail"
17991
17992         do_facet $SINGLEMDS $LCTL --device $mdt \
17993                                 changelog_register -u test_160o &&
17994                 error "the same name registration should fail"
17995
17996         do_facet $SINGLEMDS $LCTL --device $mdt \
17997                         changelog_register -u test_160toolongname &&
17998                 error "too long name registration should fail"
17999
18000         changelog_chmask "MARK+HSM"
18001         lctl get_param mdd.*.changelog*mask
18002         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
18003         changelog_users $SINGLEMDS | grep -q $cl_user ||
18004                 error "User $cl_user not found in changelog_users"
18005         #verify username
18006         echo $cl_user | grep -q test_160o ||
18007                 error "User $cl_user has no specific name 'test160o'"
18008
18009         # change something
18010         changelog_clear 0 || error "changelog_clear failed"
18011         # generate some changelog records to accumulate on MDT0
18012         test_mkdir -p -i0 -c1 $DIR/$tdir || error "test_mkdir $tdir failed"
18013         touch $DIR/$tdir/$tfile                 # open 1
18014
18015         OPENS=$(changelog_dump | grep -c "OPEN")
18016         [[ $OPENS -eq 1 ]] || error "OPEN changelog mask count $OPENS != 1"
18017
18018         # must be no MKDIR it wasn't set as user mask
18019         MKDIR=$(changelog_dump | grep -c "MKDIR")
18020         [[ $MKDIR -eq 0 ]] || error "MKDIR changelog mask found $MKDIR > 0"
18021
18022         oldmask=$(do_facet $SINGLEMDS $LCTL get_param \
18023                                 mdd.$mdt.changelog_current_mask -n)
18024         # register maskless user
18025         changelog_register || error "changelog_register failed"
18026         # effective mask should be not changed because it is not minimal
18027         mask=$(do_facet $SINGLEMDS $LCTL get_param \
18028                                 mdd.$mdt.changelog_current_mask -n)
18029         [[ $mask == $oldmask ]] || error "mask was changed: $mask vs $oldmask"
18030         # set server mask to minimal value
18031         changelog_chmask "MARK"
18032         # check effective mask again, should be treated as DEFMASK now
18033         mask=$(do_facet $SINGLEMDS $LCTL get_param \
18034                                 mdd.$mdt.changelog_current_mask -n)
18035         [[ $mask == *"HLINK"* ]] || error "mask is not DEFMASK as expected"
18036
18037         if (( $MDS1_VERSION >= $(version_code 2.15.52) )) ; then
18038                 # set server mask back to some value
18039                 changelog_chmask "CLOSE,UNLNK"
18040                 # check effective mask again, should not remain as DEFMASK
18041                 mask=$(do_facet $SINGLEMDS $LCTL get_param \
18042                                 mdd.$mdt.changelog_current_mask -n)
18043                 [[ $mask != *"HLINK"* ]] || error "mask is still DEFMASK"
18044         fi
18045
18046         do_facet $SINGLEMDS $LCTL --device $mdt \
18047                                 changelog_deregister -u test_160o ||
18048                 error "cannot deregister by name"
18049 }
18050 run_test 160o "changelog user name and mask"
18051
18052 test_160p() {
18053         remote_mds_nodsh && skip "remote MDS with nodsh" && return
18054         [[ $MDS1_VERSION -ge $(version_code 2.14.51) ]] ||
18055                 skip "Need MDS version at least 2.14.51"
18056         [[ "$mds1_FSTYPE" == "ldiskfs" ]] || skip "ldiskfs only test"
18057         local cl_users
18058         local cl_user1
18059         local entry_count
18060
18061         # Create a user
18062         changelog_register || error "first changelog_register failed"
18063
18064         cl_users=(${CL_USERS[mds1]})
18065         cl_user1="${cl_users[0]}"
18066
18067         test_mkdir -p -i0 -c1 $DIR/$tdir || error "test_mkdir $tdir failed"
18068         createmany -m $DIR/$tdir/$tfile 50 ||
18069                 error "create $DIR/$tdir/$tfile failed"
18070         unlinkmany $DIR/$tdir/$tfile 50 || error "unlinkmany failed"
18071         rm -rf $DIR/$tdir
18072
18073         # check changelogs have been generated
18074         entry_count=$(changelog_dump | wc -l)
18075         ((entry_count != 0)) || error "no changelog entries found"
18076
18077         # remove changelog_users and check that orphan entries are removed
18078         stop mds1
18079         local dev=$(mdsdevname 1)
18080         do_facet mds1 "$DEBUGFS -w -R 'rm changelog_users' $dev"
18081         start mds1 $dev $MDS_MOUNT_OPTS || error "cannot start mds1"
18082         entry_count=$(changelog_dump | wc -l)
18083         ((entry_count == 0)) ||
18084                 error "found $entry_count changelog entries, expected none"
18085 }
18086 run_test 160p "Changelog orphan cleanup with no users"
18087
18088 test_160q() {
18089         local mdt="$(facet_svc $SINGLEMDS)"
18090         local clu
18091
18092         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
18093         remote_mds_nodsh && skip "remote MDS with nodsh"
18094         [ $MDS1_VERSION -ge $(version_code 2.14.54) ] ||
18095                 skip "Need MDS version at least 2.14.54"
18096
18097         # set server mask to minimal value like server init does
18098         changelog_chmask "MARK"
18099         clu=$(do_facet $SINGLEMDS $LCTL --device $mdt changelog_register -n) ||
18100                 error "changelog_register failed"
18101         # check effective mask again, should be treated as DEFMASK now
18102         mask=$(do_facet $SINGLEMDS $LCTL get_param \
18103                                 mdd.$mdt.changelog_current_mask -n)
18104         do_facet $SINGLEMDS $LCTL --device $mdt changelog_deregister $clu ||
18105                 error "changelog_deregister failed"
18106         [[ $mask == *"HLINK"* ]] || error "mask is not DEFMASK as expected"
18107 }
18108 run_test 160q "changelog effective mask is DEFMASK if not set"
18109
18110 test_160s() {
18111         remote_mds_nodsh && skip "remote MDS with nodsh"
18112         (( $MDS1_VERSION >= $(version_code 2.14.55) )) ||
18113                 skip "Need MDS version at least 2.14.55"
18114
18115         local mdts=$(comma_list $(mdts_nodes))
18116
18117         #define OBD_FAIL_TIME_IN_CHLOG_USER     0x1314
18118         do_nodes $mdts $LCTL set_param fail_loc=0x1314 \
18119                                        fail_val=$((24 * 3600 * 10))
18120
18121         # Create a user which is 10 days old
18122         changelog_register || error "first changelog_register failed"
18123         local cl_users
18124         declare -A cl_user1
18125         local i
18126
18127         # generate some changelog records to accumulate on each MDT
18128         # use all_char because created files should be evenly distributed
18129         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
18130                 error "test_mkdir $tdir failed"
18131         for ((i = 0; i < MDSCOUNT; i++)); do
18132                 $LFS mkdir -i $i $DIR/$tdir/d$i.1 $DIR/$tdir/d$i.2 ||
18133                         error "create $DIR/$tdir/d$i.1 failed"
18134         done
18135
18136         # check changelogs have been generated
18137         local nbcl=$(changelog_dump | wc -l)
18138         (( nbcl > 0 )) || error "no changelogs found"
18139
18140         # reduce the max_idle_indexes value to make sure we exceed it
18141         for param in "changelog_max_idle_indexes=2097446912" \
18142                      "changelog_max_idle_time=2592000" \
18143                      "changelog_gc=1" \
18144                      "changelog_min_gc_interval=2"; do
18145                 local MDT0=$(facet_svc $SINGLEMDS)
18146                 local var="${param%=*}"
18147                 local old=$(do_facet mds1 "$LCTL get_param -n mdd.$MDT0.$var")
18148
18149                 stack_trap "do_nodes $mdts $LCTL set_param mdd.*.$var=$old" EXIT
18150                 do_nodes $mdts $LCTL set_param mdd.*.$param ||
18151                         error "unable to set mdd.*.$param"
18152         done
18153
18154         local start=$SECONDS
18155         for i in $(seq $MDSCOUNT); do
18156                 cl_users=(${CL_USERS[mds$i]})
18157                 cl_user1[mds$i]="${cl_users[0]}"
18158
18159                 [[ -n "${cl_user1[mds$i]}" ]] ||
18160                         error "mds$i: no user registered"
18161         done
18162
18163         #define OBD_FAIL_MDS_CHANGELOG_IDX_PUMP   0x16d
18164         do_nodes $mdts $LCTL set_param fail_loc=0x16d fail_val=500000000
18165
18166         # ensure we are past the previous changelog_min_gc_interval set above
18167         local sleep2=$((start + 2 - SECONDS))
18168         (( sleep2 > 0 )) && echo "sleep $sleep2 for interval" && sleep $sleep2
18169
18170         # Generate one more changelog to trigger GC
18171         for ((i = 0; i < MDSCOUNT; i++)); do
18172                 $LFS mkdir -i $i $DIR/$tdir/d$i.3 $DIR/$tdir/d$i.4 ||
18173                         error "create $DIR/$tdir/d$i.3 failed"
18174         done
18175
18176         # ensure gc thread is done
18177         for node in $(mdts_nodes); do
18178                 wait_update $node "pgrep chlg_gc_thread" "" 20 ||
18179                         error "$node: GC-thread not done"
18180         done
18181
18182         do_nodes $mdts $LCTL set_param fail_loc=0
18183
18184         for (( i = 1; i <= MDSCOUNT; i++ )); do
18185                 # check cl_user1 is purged
18186                 changelog_users mds$i | grep -q "${cl_user1[mds$i]}" &&
18187                         error "mds$i: User ${cl_user1[mds$i]} is registered"
18188         done
18189         return 0
18190 }
18191 run_test 160s "changelog garbage collect on idle records * time"
18192
18193 test_160t() {
18194         remote_mds_nodsh && skip "remote MDS with nodsh"
18195         (( $MDS1_VERSION >= $(version_code 2.15.50) )) ||
18196                 skip "Need MDS version at least 2.15.50"
18197
18198         local MDT0=$(facet_svc $SINGLEMDS)
18199         local cl_users
18200         local cl_user1
18201         local cl_user2
18202         local start
18203
18204         changelog_register --user user1 -m all ||
18205                 error "user1 failed to register"
18206
18207         mkdir_on_mdt0 $DIR/$tdir
18208         # create default overstripe to maximize changelog size
18209         $LFS setstripe  -C 8 $DIR/$tdir || error "setstripe failed"
18210         createmany -o $DIR/$tdir/u1_ 2000 || error "createmany for user1 failed"
18211         llog_size1=$(do_facet mds1 $LCTL get_param -n mdd.$MDT0.changelog_size)
18212
18213         # user2 consumes less records so less space
18214         changelog_register --user user2 || error "user2 failed to register"
18215         createmany -o $DIR/$tdir/u2_ 500 || error "createmany for user2 failed"
18216         llog_size2=$(do_facet mds1 $LCTL get_param -n mdd.$MDT0.changelog_size)
18217
18218         # check changelogs have been generated
18219         local nbcl=$(changelog_dump | wc -l)
18220         (( nbcl > 0 )) || error "no changelogs found"
18221
18222         # reduce the changelog_min_gc_interval to force check
18223         for param in "changelog_gc=1" "changelog_min_gc_interval=2"; do
18224                 local var="${param%=*}"
18225                 local old=$(do_facet mds1 "$LCTL get_param -n mdd.$MDT0.$var")
18226
18227                 stack_trap "do_facet mds1 $LCTL set_param mdd.$MDT0.$var=$old"
18228                 do_facet mds1 $LCTL set_param mdd.$MDT0.$param ||
18229                         error "unable to set mdd.*.$param"
18230         done
18231
18232         start=$SECONDS
18233         cl_users=(${CL_USERS[mds1]})
18234         cl_user1="${cl_users[0]}"
18235         cl_user2="${cl_users[1]}"
18236
18237         [[ -n $cl_user1 ]] ||
18238                 error "mds1: user #1 isn't registered"
18239         [[ -n $cl_user2 ]] ||
18240                 error "mds1: user #2 isn't registered"
18241
18242         # ensure we are past the previous changelog_min_gc_interval set above
18243         local sleep2=$((start + 2 - SECONDS))
18244         (( sleep2 > 0 )) && echo "sleep $sleep2 for interval" && sleep $sleep2
18245
18246         #define OBD_FAIL_MDS_CHANGELOG_ENOSPC 0x018c
18247         do_facet mds1 $LCTL set_param fail_loc=0x018c \
18248                         fail_val=$(((llog_size1 + llog_size2) / 2))
18249
18250         # Generate more changelog to trigger GC
18251         createmany -o $DIR/$tdir/u3_ 4 ||
18252                 error "create failed for more files"
18253
18254         # ensure gc thread is done
18255         wait_update_facet mds1 "pgrep chlg_gc_thread" "" 20 ||
18256                 error "mds1: GC-thread not done"
18257
18258         do_facet mds1 $LCTL set_param fail_loc=0
18259
18260         # check cl_user1 is purged
18261         changelog_users mds1 | grep -q "$cl_user1" &&
18262                 error "User $cl_user1 is registered"
18263         # check cl_user2 is not purged
18264         changelog_users mds1 | grep -q "$cl_user2" ||
18265                 error "User $cl_user2 is not registered"
18266 }
18267 run_test 160t "changelog garbage collect on lack of space"
18268
18269 test_161a() {
18270         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18271
18272         test_mkdir -c1 $DIR/$tdir
18273         cp /etc/hosts $DIR/$tdir/$tfile
18274         test_mkdir -c1 $DIR/$tdir/foo1
18275         test_mkdir -c1 $DIR/$tdir/foo2
18276         ln $DIR/$tdir/$tfile $DIR/$tdir/foo1/sofia
18277         ln $DIR/$tdir/$tfile $DIR/$tdir/foo2/zachary
18278         ln $DIR/$tdir/$tfile $DIR/$tdir/foo1/luna
18279         ln $DIR/$tdir/$tfile $DIR/$tdir/foo2/thor
18280         local FID=$($LFS path2fid $DIR/$tdir/$tfile | tr -d '[]')
18281         if [ "$($LFS fid2path $DIR $FID | wc -l)" != "5" ]; then
18282                 $LFS fid2path $DIR $FID
18283                 error "bad link ea"
18284         fi
18285         # middle
18286         rm $DIR/$tdir/foo2/zachary
18287         # last
18288         rm $DIR/$tdir/foo2/thor
18289         # first
18290         rm $DIR/$tdir/$tfile
18291         # rename
18292         mv $DIR/$tdir/foo1/sofia $DIR/$tdir/foo2/maggie
18293         [ "$($LFS fid2path $FSNAME --link 1 $FID)" != "$tdir/foo2/maggie" ] &&
18294                 { $LFS fid2path $DIR $FID; error "bad link rename"; }
18295         rm $DIR/$tdir/foo2/maggie
18296
18297         # overflow the EA
18298         local longname=$tfile.avg_len_is_thirty_two_
18299         stack_trap "unlinkmany $DIR/$tdir/foo2/$longname 1000 || \
18300                 error_noexit 'failed to unlink many hardlinks'" EXIT
18301         createmany -l$DIR/$tdir/foo1/luna $DIR/$tdir/foo2/$longname 1000 ||
18302                 error "failed to hardlink many files"
18303         links=$($LFS fid2path $DIR $FID | wc -l)
18304         echo -n "${links}/1000 links in link EA"
18305         [[ $links -gt 60 ]] || error "expected at least 60 links in link EA"
18306 }
18307 run_test 161a "link ea sanity"
18308
18309 test_161b() {
18310         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18311         [ $MDSCOUNT -lt 2 ] && skip_env "skipping remote directory test"
18312
18313         local MDTIDX=1
18314         local remote_dir=$DIR/$tdir/remote_dir
18315
18316         mkdir -p $DIR/$tdir
18317         $LFS mkdir -i $MDTIDX $remote_dir ||
18318                 error "create remote directory failed"
18319
18320         cp /etc/hosts $remote_dir/$tfile
18321         mkdir -p $remote_dir/foo1
18322         mkdir -p $remote_dir/foo2
18323         ln $remote_dir/$tfile $remote_dir/foo1/sofia
18324         ln $remote_dir/$tfile $remote_dir/foo2/zachary
18325         ln $remote_dir/$tfile $remote_dir/foo1/luna
18326         ln $remote_dir/$tfile $remote_dir/foo2/thor
18327
18328         local FID=$($LFS path2fid $remote_dir/$tfile | tr -d '[' |
18329                      tr -d ']')
18330         if [ "$($LFS fid2path $DIR $FID | wc -l)" != "5" ]; then
18331                 $LFS fid2path $DIR $FID
18332                 error "bad link ea"
18333         fi
18334         # middle
18335         rm $remote_dir/foo2/zachary
18336         # last
18337         rm $remote_dir/foo2/thor
18338         # first
18339         rm $remote_dir/$tfile
18340         # rename
18341         mv $remote_dir/foo1/sofia $remote_dir/foo2/maggie
18342         local link_path=$($LFS fid2path $FSNAME --link 1 $FID)
18343         if [ "$DIR/$link_path" != "$remote_dir/foo2/maggie" ]; then
18344                 $LFS fid2path $DIR $FID
18345                 error "bad link rename"
18346         fi
18347         rm $remote_dir/foo2/maggie
18348
18349         # overflow the EA
18350         local longname=filename_avg_len_is_thirty_two_
18351         createmany -l$remote_dir/foo1/luna $remote_dir/foo2/$longname 1000 ||
18352                 error "failed to hardlink many files"
18353         links=$($LFS fid2path $DIR $FID | wc -l)
18354         echo -n "${links}/1000 links in link EA"
18355         [[ ${links} -gt 60 ]] ||
18356                 error "expected at least 60 links in link EA"
18357         unlinkmany $remote_dir/foo2/$longname 1000 ||
18358         error "failed to unlink many hardlinks"
18359 }
18360 run_test 161b "link ea sanity under remote directory"
18361
18362 test_161c() {
18363         remote_mds_nodsh && skip "remote MDS with nodsh"
18364         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18365         [[ $MDS1_VERSION -lt $(version_code 2.1.5) ]] &&
18366                 skip "Need MDS version at least 2.1.5"
18367
18368         # define CLF_RENAME_LAST 0x0001
18369         # rename overwrite a target having nlink = 1 (changelog flag 0x1)
18370         changelog_register || error "changelog_register failed"
18371
18372         rm -rf $DIR/$tdir
18373         test_mkdir -i $((MDSCOUNT - 1)) $DIR/$tdir
18374         touch $DIR/$tdir/foo_161c
18375         touch $DIR/$tdir/bar_161c
18376         mv -f $DIR/$tdir/foo_161c $DIR/$tdir/bar_161c
18377         changelog_dump | grep RENME | tail -n 5
18378         local flags=$(changelog_dump | grep "RENME.*bar_161c" | cut -f5 -d' ')
18379         changelog_clear 0 || error "changelog_clear failed"
18380         if [ x$flags != "x0x1" ]; then
18381                 error "flag $flags is not 0x1"
18382         fi
18383
18384         echo "rename overwrite target with nlink = 1, changelog flags=$flags"
18385         # rename overwrite a target having nlink > 1 (changelog flag 0x0)
18386         touch $DIR/$tdir/foo_161c
18387         touch $DIR/$tdir/bar_161c
18388         ln $DIR/$tdir/bar_161c $DIR/$tdir/foobar_161c
18389         mv -f $DIR/$tdir/foo_161c $DIR/$tdir/bar_161c
18390         changelog_dump | grep RENME | tail -n 5
18391         flags=$(changelog_dump | grep "RENME.*bar_161c" | cut -f5 -d' ')
18392         changelog_clear 0 || error "changelog_clear failed"
18393         if [ x$flags != "x0x0" ]; then
18394                 error "flag $flags is not 0x0"
18395         fi
18396         echo "rename overwrite a target having nlink > 1," \
18397                 "changelog record has flags of $flags"
18398
18399         # rename doesn't overwrite a target (changelog flag 0x0)
18400         touch $DIR/$tdir/foo_161c
18401         mv -f $DIR/$tdir/foo_161c $DIR/$tdir/foo2_161c
18402         changelog_dump | grep RENME | tail -n 5
18403         flags=$(changelog_dump | grep RENME | tail -1 | cut -f5 -d' ')
18404         changelog_clear 0 || error "changelog_clear failed"
18405         if [ x$flags != "x0x0" ]; then
18406                 error "flag $flags is not 0x0"
18407         fi
18408         echo "rename doesn't overwrite a target," \
18409                 "changelog record has flags of $flags"
18410
18411         # define CLF_UNLINK_LAST 0x0001
18412         # unlink a file having nlink = 1 (changelog flag 0x1)
18413         rm -f $DIR/$tdir/foo2_161c
18414         changelog_dump | grep UNLNK | tail -n 5
18415         flags=$(changelog_dump | grep UNLNK | tail -1 | cut -f5 -d' ')
18416         changelog_clear 0 || error "changelog_clear failed"
18417         if [ x$flags != "x0x1" ]; then
18418                 error "flag $flags is not 0x1"
18419         fi
18420         echo "unlink a file having nlink = 1," \
18421                 "changelog record has flags of $flags"
18422
18423         # unlink a file having nlink > 1 (changelog flag 0x0)
18424         ln -f $DIR/$tdir/bar_161c $DIR/$tdir/foobar_161c
18425         rm -f $DIR/$tdir/foobar_161c
18426         changelog_dump | grep UNLNK | tail -n 5
18427         flags=$(changelog_dump | grep UNLNK | tail -1 | cut -f5 -d' ')
18428         changelog_clear 0 || error "changelog_clear failed"
18429         if [ x$flags != "x0x0" ]; then
18430                 error "flag $flags is not 0x0"
18431         fi
18432         echo "unlink a file having nlink > 1, changelog record flags '$flags'"
18433 }
18434 run_test 161c "check CL_RENME[UNLINK] changelog record flags"
18435
18436 test_161d() {
18437         remote_mds_nodsh && skip "remote MDS with nodsh"
18438         [ -n "$FILESET" ] && skip "Not functional for FILESET set"
18439
18440         local pid
18441         local fid
18442
18443         changelog_register || error "changelog_register failed"
18444
18445         # work in a standalone dir to avoid locking on $DIR/$MOUNT to
18446         # interfer with $MOUNT/.lustre/fid/ access
18447         mkdir $DIR/$tdir
18448         [[ $? -eq 0 ]] || error "mkdir failed"
18449
18450         #define OBD_FAIL_LLITE_CREATE_NODE_PAUSE 0x140c | CFS_FAIL_ONCE
18451         $LCTL set_param fail_loc=0x8000140c
18452         # 5s pause
18453         $LCTL set_param fail_val=5
18454
18455         # create file
18456         echo foofoo > $DIR/$tdir/$tfile &
18457         pid=$!
18458
18459         # wait for create to be delayed
18460         sleep 2
18461
18462         ps -p $pid
18463         [[ $? -eq 0 ]] || error "create should be blocked"
18464
18465         local tempfile="$(mktemp --tmpdir $tfile.XXXXXX)"
18466         stack_trap "rm -f $tempfile"
18467         fid=$(changelog_extract_field "CREAT" "$tfile" "t=")
18468         cat $MOUNT/.lustre/fid/$fid 2>/dev/null >$tempfile || error "cat failed"
18469         # some delay may occur during ChangeLog publishing and file read just
18470         # above, that could allow file write to happen finally
18471         [[ -s $tempfile ]] && echo "file should be empty"
18472
18473         $LCTL set_param fail_loc=0
18474
18475         wait $pid
18476         [[ $? -eq 0 ]] || error "create failed"
18477 }
18478 run_test 161d "create with concurrent .lustre/fid access"
18479
18480 check_path() {
18481         local expected="$1"
18482         shift
18483         local fid="$2"
18484
18485         local path
18486         path=$($LFS fid2path "$@")
18487         local rc=$?
18488
18489         if [ $rc -ne 0 ]; then
18490                 error "path looked up of '$expected' failed: rc=$rc"
18491         elif [ "$path" != "$expected" ]; then
18492                 error "path looked up '$path' instead of '$expected'"
18493         else
18494                 echo "FID '$fid' resolves to path '$path' as expected"
18495         fi
18496 }
18497
18498 test_162a() { # was test_162
18499         test_mkdir -p -c1 $DIR/$tdir/d2
18500         touch $DIR/$tdir/d2/$tfile
18501         touch $DIR/$tdir/d2/x1
18502         touch $DIR/$tdir/d2/x2
18503         test_mkdir -p -c1 $DIR/$tdir/d2/a/b/c
18504         test_mkdir -p -c1 $DIR/$tdir/d2/p/q/r
18505         # regular file
18506         local fid=$($LFS path2fid $DIR/$tdir/d2/$tfile | tr -d '[]')
18507         check_path "$tdir/d2/$tfile" $FSNAME "$fid" --link 0
18508
18509         # softlink
18510         ln -s $DIR/$tdir/d2/$tfile $DIR/$tdir/d2/p/q/r/slink
18511         fid=$($LFS path2fid $DIR/$tdir/d2/p/q/r/slink | tr -d '[]')
18512         check_path "$tdir/d2/p/q/r/slink" $FSNAME "$fid" --link 0
18513
18514         # softlink to wrong file
18515         ln -s /this/is/garbage $DIR/$tdir/d2/p/q/r/slink.wrong
18516         fid=$($LFS path2fid $DIR/$tdir/d2/p/q/r/slink.wrong | tr -d '[]')
18517         check_path "$tdir/d2/p/q/r/slink.wrong" $FSNAME "$fid" --link 0
18518
18519         # hardlink
18520         ln $DIR/$tdir/d2/$tfile $DIR/$tdir/d2/p/q/r/hlink
18521         mv $DIR/$tdir/d2/$tfile $DIR/$tdir/d2/a/b/c/new_file
18522         fid=$($LFS path2fid $DIR/$tdir/d2/a/b/c/new_file | tr -d '[]')
18523         # fid2path dir/fsname should both work
18524         check_path "$tdir/d2/a/b/c/new_file" $FSNAME "$fid" --link 1
18525         check_path "$DIR/$tdir/d2/p/q/r/hlink" $DIR "$fid" --link 0
18526
18527         # hardlink count: check that there are 2 links
18528         local nlinks=$($LFS fid2path $DIR "$fid" | wc -l)
18529         [ $nlinks -eq 2 ] || error "expect 2 links, found $nlinks"
18530
18531         # hardlink indexing: remove the first link
18532         rm $DIR/$tdir/d2/p/q/r/hlink
18533         check_path "$tdir/d2/a/b/c/new_file" $FSNAME $fid --link 0
18534 }
18535 run_test 162a "path lookup sanity"
18536
18537 test_162b() {
18538         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18539         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
18540
18541         mkdir $DIR/$tdir
18542         $LFS setdirstripe -i0 -c$MDSCOUNT -H all_char $DIR/$tdir/striped_dir ||
18543                                 error "create striped dir failed"
18544
18545         local FID=$($LFS getdirstripe $DIR/$tdir/striped_dir |
18546                                         tail -n 1 | awk '{print $2}')
18547         stat $MOUNT/.lustre/fid/$FID && error "sub_stripe can be accessed"
18548
18549         touch $DIR/$tdir/striped_dir/f{0..4} || error "touch f0..4 failed"
18550         mkdir $DIR/$tdir/striped_dir/d{0..4} || error "mkdir d0..4 failed"
18551
18552         # regular file
18553         for ((i=0;i<5;i++)); do
18554                 FID=$($LFS path2fid $DIR/$tdir/striped_dir/f$i | tr -d '[]') ||
18555                         error "get fid for f$i failed"
18556                 check_path "$tdir/striped_dir/f$i" $FSNAME $FID --link 0
18557
18558                 FID=$($LFS path2fid $DIR/$tdir/striped_dir/d$i | tr -d '[]') ||
18559                         error "get fid for d$i failed"
18560                 check_path "$tdir/striped_dir/d$i" $FSNAME $FID --link 0
18561         done
18562
18563         return 0
18564 }
18565 run_test 162b "striped directory path lookup sanity"
18566
18567 # LU-4239: Verify fid2path works with paths 100 or more directories deep
18568 test_162c() {
18569         [[ $MDS1_VERSION -lt $(version_code 2.7.51) ]] &&
18570                 skip "Need MDS version at least 2.7.51"
18571
18572         local lpath=$tdir.local
18573         local rpath=$tdir.remote
18574
18575         test_mkdir $DIR/$lpath
18576         test_mkdir $DIR/$rpath
18577
18578         for ((i = 0; i <= 101; i++)); do
18579                 lpath="$lpath/$i"
18580                 mkdir $DIR/$lpath
18581                 FID=$($LFS path2fid $DIR/$lpath | tr -d '[]') ||
18582                         error "get fid for local directory $DIR/$lpath failed"
18583                 check_path "$DIR/$lpath" $MOUNT $FID --link 0
18584
18585                 rpath="$rpath/$i"
18586                 test_mkdir $DIR/$rpath
18587                 FID=$($LFS path2fid $DIR/$rpath | tr -d '[]') ||
18588                         error "get fid for remote directory $DIR/$rpath failed"
18589                 check_path "$DIR/$rpath" $MOUNT $FID --link 0
18590         done
18591
18592         return 0
18593 }
18594 run_test 162c "fid2path works with paths 100 or more directories deep"
18595
18596 oalr_event_count() {
18597         local event="${1}"
18598         local trace="${2}"
18599
18600         awk -v name="${FSNAME}-OST0000" \
18601             -v event="${event}" \
18602             '$1 == "TRACE" && $2 == event && $3 == name' \
18603             "${trace}" |
18604         wc -l
18605 }
18606
18607 oalr_expect_event_count() {
18608         local event="${1}"
18609         local trace="${2}"
18610         local expect="${3}"
18611         local count
18612
18613         count=$(oalr_event_count "${event}" "${trace}")
18614         if ((count == expect)); then
18615                 return 0
18616         fi
18617
18618         error_noexit "${event} event count was '${count}', expected ${expect}"
18619         cat "${trace}" >&2
18620         exit 1
18621 }
18622
18623 cleanup_165() {
18624         do_facet ost1 killall --quiet -KILL ofd_access_log_reader || true
18625         stop ost1
18626         start ost1 "$(ostdevname 1)" $OST_MOUNT_OPTS
18627 }
18628
18629 setup_165() {
18630         sync # Flush previous IOs so we can count log entries.
18631         do_facet ost1 $LCTL set_param "obdfilter.${FSNAME}-OST0000.access_log_size=4096"
18632         stack_trap cleanup_165 EXIT
18633 }
18634
18635 test_165a() {
18636         local trace="/tmp/${tfile}.trace"
18637         local rc
18638         local count
18639
18640         (( $OST1_VERSION >= $(version_code 2.13.54) )) ||
18641                 skip "OFD access log unsupported"
18642
18643         setup_165
18644         do_facet ost1 ofd_access_log_reader --debug=- --trace=- > "${trace}" &
18645         sleep 5
18646
18647         do_facet ost1 ofd_access_log_reader --list
18648         stop ost1
18649
18650         do_facet ost1 killall -TERM ofd_access_log_reader
18651         wait
18652         rc=$?
18653
18654         if ((rc != 0)); then
18655                 error "ofd_access_log_reader exited with rc = '${rc}'"
18656         fi
18657
18658         # Parse trace file for discovery events:
18659         oalr_expect_event_count alr_log_add "${trace}" 1
18660         oalr_expect_event_count alr_log_eof "${trace}" 1
18661         oalr_expect_event_count alr_log_free "${trace}" 1
18662 }
18663 run_test 165a "ofd access log discovery"
18664
18665 test_165b() {
18666         local trace="/tmp/${tfile}.trace"
18667         local file="${DIR}/${tfile}"
18668         local pfid1
18669         local pfid2
18670         local -a entry
18671         local rc
18672         local count
18673         local size
18674         local flags
18675
18676         (( $OST1_VERSION >= $(version_code 2.13.54) )) ||
18677                 skip "OFD access log unsupported"
18678
18679         setup_165
18680         do_facet ost1 ofd_access_log_reader --debug=- --trace=- > "${trace}" &
18681         sleep 5
18682
18683         do_facet ost1 ofd_access_log_reader --list
18684
18685         lfs setstripe -c 1 -i 0 "${file}"
18686         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_WRONLY:w1048576c ||
18687                 error "cannot create '${file}'"
18688
18689         sleep 5
18690         do_facet ost1 killall -TERM ofd_access_log_reader
18691         wait
18692         rc=$?
18693
18694         if ((rc != 0)); then
18695                 error "ofd_access_log_reader exited with rc = '${rc}'"
18696         fi
18697
18698         oalr_expect_event_count alr_log_entry "${trace}" 1
18699
18700         pfid1=$($LFS path2fid "${file}")
18701
18702         # 1     2             3   4    5     6   7    8    9     10
18703         # TRACE alr_log_entry OST PFID BEGIN END TIME SIZE COUNT FLAGS
18704         entry=( - $(awk -v pfid="${pfid}" '$1 == "TRACE" && $2 == "alr_log_entry"' "${trace}" ) )
18705
18706         echo "entry = '${entry[*]}'" >&2
18707
18708         pfid2=${entry[4]}
18709         if [[ "${pfid1}" != "${pfid2}" ]]; then
18710                 error "entry '${entry[*]}' has invalid PFID '${pfid2}', expected ${pfid1}"
18711         fi
18712
18713         size=${entry[8]}
18714         if ((size != 1048576)); then
18715                 error "entry '${entry[*]}' has invalid io size '${size}', expected 1048576"
18716         fi
18717
18718         flags=${entry[10]}
18719         if [[ "${flags}" != "w" ]]; then
18720                 error "entry '${entry[*]}' has invalid io flags '${flags}', expected 'w'"
18721         fi
18722
18723         do_facet ost1 ofd_access_log_reader --debug=- --trace=- > "${trace}" &
18724         sleep 5
18725
18726         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_RDONLY:r524288c ||
18727                 error "cannot read '${file}'"
18728         sleep 5
18729
18730         do_facet ost1 killall -TERM ofd_access_log_reader
18731         wait
18732         rc=$?
18733
18734         if ((rc != 0)); then
18735                 error "ofd_access_log_reader exited with rc = '${rc}'"
18736         fi
18737
18738         oalr_expect_event_count alr_log_entry "${trace}" 1
18739
18740         entry=( - $(awk -v pfid="${pfid}" '$1 == "TRACE" && $2 == "alr_log_entry"' "${trace}" ) )
18741         echo "entry = '${entry[*]}'" >&2
18742
18743         pfid2=${entry[4]}
18744         if [[ "${pfid1}" != "${pfid2}" ]]; then
18745                 error "entry '${entry[*]}' has invalid PFID '${pfid2}', expected ${pfid1}"
18746         fi
18747
18748         size=${entry[8]}
18749         if ((size != 524288)); then
18750                 error "entry '${entry[*]}' has invalid io size '${size}', 524288"
18751         fi
18752
18753         flags=${entry[10]}
18754         if [[ "${flags}" != "r" ]]; then
18755                 error "entry '${entry[*]}' has invalid io flags '${flags}', expected 'r'"
18756         fi
18757 }
18758 run_test 165b "ofd access log entries are produced and consumed"
18759
18760 test_165c() {
18761         local trace="/tmp/${tfile}.trace"
18762         local file="${DIR}/${tdir}/${tfile}"
18763
18764         (( $OST1_VERSION >= $(version_code 2.13.54) )) ||
18765                 skip "OFD access log unsupported"
18766
18767         test_mkdir "${DIR}/${tdir}"
18768
18769         setup_165
18770         do_facet ost1 ofd_access_log_reader --debug=- --trace=- > "${trace}" &
18771         sleep 5
18772
18773         lfs setstripe -c 1 -i 0 "${DIR}/${tdir}"
18774
18775         # 4096 / 64 = 64. Create twice as many entries.
18776         for ((i = 0; i < 128; i++)); do
18777                 $MULTIOP "${file}-${i}" oO_CREAT:O_WRONLY:w512c ||
18778                         error "cannot create file"
18779         done
18780
18781         sync
18782
18783         do_facet ost1 killall -TERM ofd_access_log_reader
18784         wait
18785         rc=$?
18786         if ((rc != 0)); then
18787                 error "ofd_access_log_reader exited with rc = '${rc}'"
18788         fi
18789
18790         unlinkmany  "${file}-%d" 128
18791 }
18792 run_test 165c "full ofd access logs do not block IOs"
18793
18794 oal_get_read_count() {
18795         local stats="$1"
18796
18797         # STATS lustre-OST0001 alr_read_count 1
18798
18799         do_facet ost1 cat "${stats}" |
18800         awk '$1 == "STATS" && $3 == "alr_read_count" { count = $4; }
18801              END { print count; }'
18802 }
18803
18804 oal_expect_read_count() {
18805         local stats="$1"
18806         local count
18807         local expect="$2"
18808
18809         # Ask ofd_access_log_reader to write stats.
18810         do_facet ost1 killall -USR1 ofd_access_log_reader
18811
18812         # Allow some time for things to happen.
18813         sleep 1
18814
18815         count=$(oal_get_read_count "${stats}")
18816         if ((count == expect)); then
18817                 return 0
18818         fi
18819
18820         error_noexit "bad read count, got ${count}, expected ${expect}"
18821         do_facet ost1 cat "${stats}" >&2
18822         exit 1
18823 }
18824
18825 test_165d() {
18826         local stats="/tmp/${tfile}.stats"
18827         local file="${DIR}/${tdir}/${tfile}"
18828         local param="obdfilter.${FSNAME}-OST0000.access_log_mask"
18829
18830         (( $OST1_VERSION >= $(version_code 2.13.54) )) ||
18831                 skip "OFD access log unsupported"
18832
18833         test_mkdir "${DIR}/${tdir}"
18834
18835         setup_165
18836         do_facet ost1 ofd_access_log_reader --stats="${stats}" &
18837         sleep 5
18838
18839         lfs setstripe -c 1 -i 0 "${file}"
18840
18841         do_facet ost1 lctl set_param "${param}=rw"
18842         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_WRONLY:w1048576c ||
18843                 error "cannot create '${file}'"
18844         oal_expect_read_count "${stats}" 1
18845
18846         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_RDONLY:r1048576c ||
18847                 error "cannot read '${file}'"
18848         oal_expect_read_count "${stats}" 2
18849
18850         do_facet ost1 lctl set_param "${param}=r"
18851         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_WRONLY:w1048576c ||
18852                 error "cannot create '${file}'"
18853         oal_expect_read_count "${stats}" 2
18854
18855         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_RDONLY:r1048576c ||
18856                 error "cannot read '${file}'"
18857         oal_expect_read_count "${stats}" 3
18858
18859         do_facet ost1 lctl set_param "${param}=w"
18860         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_WRONLY:w1048576c ||
18861                 error "cannot create '${file}'"
18862         oal_expect_read_count "${stats}" 4
18863
18864         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_RDONLY:r1048576c ||
18865                 error "cannot read '${file}'"
18866         oal_expect_read_count "${stats}" 4
18867
18868         do_facet ost1 lctl set_param "${param}=0"
18869         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_WRONLY:w1048576c ||
18870                 error "cannot create '${file}'"
18871         oal_expect_read_count "${stats}" 4
18872
18873         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_RDONLY:r1048576c ||
18874                 error "cannot read '${file}'"
18875         oal_expect_read_count "${stats}" 4
18876
18877         do_facet ost1 killall -TERM ofd_access_log_reader
18878         wait
18879         rc=$?
18880         if ((rc != 0)); then
18881                 error "ofd_access_log_reader exited with rc = '${rc}'"
18882         fi
18883 }
18884 run_test 165d "ofd_access_log mask works"
18885
18886 test_165e() {
18887         local stats="/tmp/${tfile}.stats"
18888         local file0="${DIR}/${tdir}-0/${tfile}"
18889         local file1="${DIR}/${tdir}-1/${tfile}"
18890
18891         (( $OST1_VERSION >= $(version_code 2.13.54) )) ||
18892                 skip "OFD access log unsupported"
18893
18894         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
18895
18896         test_mkdir -c 1 -i 0 "${DIR}/${tdir}-0"
18897         test_mkdir -c 1 -i 1 "${DIR}/${tdir}-1"
18898
18899         lfs setstripe -c 1 -i 0 "${file0}"
18900         lfs setstripe -c 1 -i 0 "${file1}"
18901
18902         setup_165
18903         do_facet ost1 ofd_access_log_reader -I 1 --stats="${stats}" &
18904         sleep 5
18905
18906         $MULTIOP "${file0}" oO_CREAT:O_WRONLY:w512c ||
18907                 error "cannot create '${file0}'"
18908         sync
18909         oal_expect_read_count "${stats}" 0
18910
18911         $MULTIOP "${file1}" oO_CREAT:O_WRONLY:w512c ||
18912                 error "cannot create '${file1}'"
18913         sync
18914         oal_expect_read_count "${stats}" 1
18915
18916         do_facet ost1 killall -TERM ofd_access_log_reader
18917         wait
18918         rc=$?
18919         if ((rc != 0)); then
18920                 error "ofd_access_log_reader exited with rc = '${rc}'"
18921         fi
18922 }
18923 run_test 165e "ofd_access_log MDT index filter works"
18924
18925 test_165f() {
18926         local trace="/tmp/${tfile}.trace"
18927         local rc
18928         local count
18929
18930         setup_165
18931         do_facet ost1 timeout 60 ofd_access_log_reader \
18932                 --exit-on-close --debug=- --trace=- > "${trace}" &
18933         sleep 5
18934         stop ost1
18935
18936         wait
18937         rc=$?
18938
18939         if ((rc != 0)); then
18940                 error_noexit "ofd_access_log_reader exited with rc = '${rc}'"
18941                 cat "${trace}"
18942                 exit 1
18943         fi
18944 }
18945 run_test 165f "ofd_access_log_reader --exit-on-close works"
18946
18947 test_169() {
18948         # do directio so as not to populate the page cache
18949         log "creating a 10 Mb file"
18950         $MULTIOP $DIR/$tfile oO_CREAT:O_DIRECT:O_RDWR:w$((10*1048576))c ||
18951                 error "multiop failed while creating a file"
18952         log "starting reads"
18953         dd if=$DIR/$tfile of=/dev/null bs=4096 &
18954         log "truncating the file"
18955         $MULTIOP $DIR/$tfile oO_TRUNC:c ||
18956                 error "multiop failed while truncating the file"
18957         log "killing dd"
18958         kill %+ || true # reads might have finished
18959         echo "wait until dd is finished"
18960         wait
18961         log "removing the temporary file"
18962         rm -rf $DIR/$tfile || error "tmp file removal failed"
18963 }
18964 run_test 169 "parallel read and truncate should not deadlock"
18965
18966 test_170() {
18967         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18968
18969         $LCTL clear     # bug 18514
18970         $LCTL debug_daemon start $TMP/${tfile}_log_good
18971         touch $DIR/$tfile
18972         $LCTL debug_daemon stop
18973         sed -e "s/^...../a/g" $TMP/${tfile}_log_good > $TMP/${tfile}_log_bad ||
18974                 error "sed failed to read log_good"
18975
18976         $LCTL debug_daemon start $TMP/${tfile}_log_good
18977         rm -rf $DIR/$tfile
18978         $LCTL debug_daemon stop
18979
18980         $LCTL df $TMP/${tfile}_log_bad > $TMP/${tfile}_log_bad.out 2>&1 ||
18981                error "lctl df log_bad failed"
18982
18983         local bad_line=$(tail -n 1 $TMP/${tfile}_log_bad.out | awk '{print $9}')
18984         local good_line1=$(tail -n 1 $TMP/${tfile}_log_bad.out | awk '{print $5}')
18985
18986         $LCTL df $TMP/${tfile}_log_good > $TMP/${tfile}_log_good.out 2>&1
18987         local good_line2=$(tail -n 1 $TMP/${tfile}_log_good.out | awk '{print $5}')
18988
18989         [ "$bad_line" ] && [ "$good_line1" ] && [ "$good_line2" ] ||
18990                 error "bad_line good_line1 good_line2 are empty"
18991
18992         cat $TMP/${tfile}_log_good >> $TMP/${tfile}_logs_corrupt
18993         cat $TMP/${tfile}_log_bad >> $TMP/${tfile}_logs_corrupt
18994         cat $TMP/${tfile}_log_good >> $TMP/${tfile}_logs_corrupt
18995
18996         $LCTL df $TMP/${tfile}_logs_corrupt > $TMP/${tfile}_log_bad.out 2>&1
18997         local bad_line_new=$(tail -n 1 $TMP/${tfile}_log_bad.out | awk '{print $9}')
18998         local good_line_new=$(tail -n 1 $TMP/${tfile}_log_bad.out | awk '{print $5}')
18999
19000         [ "$bad_line_new" ] && [ "$good_line_new" ] ||
19001                 error "bad_line_new good_line_new are empty"
19002
19003         local expected_good=$((good_line1 + good_line2*2))
19004
19005         rm -f $TMP/${tfile}*
19006         # LU-231, short malformed line may not be counted into bad lines
19007         if [ $bad_line -ne $bad_line_new ] &&
19008                    [ $bad_line -ne $((bad_line_new - 1)) ]; then
19009                 error "expected $bad_line bad lines, but got $bad_line_new"
19010                 return 1
19011         fi
19012
19013         if [ $expected_good -ne $good_line_new ]; then
19014                 error "expected $expected_good good lines, but got $good_line_new"
19015                 return 2
19016         fi
19017         true
19018 }
19019 run_test 170 "test lctl df to handle corrupted log ====================="
19020
19021 test_171() { # bug20592
19022         [ $PARALLEL == "yes" ] && skip "skip parallel run"
19023
19024         #define OBD_FAIL_PTLRPC_DUMP_LOG         0x50e
19025         $LCTL set_param fail_loc=0x50e
19026         $LCTL set_param fail_val=3000
19027         multiop_bg_pause $DIR/$tfile O_s || true
19028         local MULTIPID=$!
19029         kill -USR1 $MULTIPID
19030         # cause log dump
19031         sleep 3
19032         wait $MULTIPID
19033         if dmesg | grep "recursive fault"; then
19034                 error "caught a recursive fault"
19035         fi
19036         $LCTL set_param fail_loc=0
19037         true
19038 }
19039 run_test 171 "test libcfs_debug_dumplog_thread stuck in do_exit() ======"
19040
19041 test_172() {
19042
19043         #define OBD_FAIL_OBD_CLEANUP  0x60e
19044         $LCTL set_param fail_loc=0x60e
19045         umount $MOUNT || error "umount $MOUNT failed"
19046         stack_trap "mount_client $MOUNT"
19047
19048         (( $($LCTL dl | egrep -c " osc | lov | lmv | mdc ") > 0 )) ||
19049                 error "no client OBDs are remained"
19050
19051         $LCTL dl | while read devno state type name foo; do
19052                 case $type in
19053                 lov|osc|lmv|mdc)
19054                         $LCTL --device $name cleanup
19055                         $LCTL --device $name detach
19056                         ;;
19057                 *)
19058                         # skip server devices
19059                         ;;
19060                 esac
19061         done
19062
19063         if (( $($LCTL dl | egrep -c " osc | lov | lmv | mdc ") > 0 )); then
19064                 $LCTL dl | egrep " osc | lov | lmv | mdc "
19065                 error "some client OBDs are still remained"
19066         fi
19067
19068 }
19069 run_test 172 "manual device removal with lctl cleanup/detach ======"
19070
19071 # it would be good to share it with obdfilter-survey/iokit-libecho code
19072 setup_obdecho_osc () {
19073         local rc=0
19074         local ost_nid=$1
19075         local obdfilter_name=$2
19076         echo "Creating new osc for $obdfilter_name on $ost_nid"
19077         # make sure we can find loopback nid
19078         $LCTL add_uuid $ost_nid $ost_nid >/dev/null 2>&1
19079
19080         [ $rc -eq 0 ] && { $LCTL attach osc ${obdfilter_name}_osc     \
19081                            ${obdfilter_name}_osc_UUID || rc=2; }
19082         [ $rc -eq 0 ] && { $LCTL --device ${obdfilter_name}_osc setup \
19083                            ${obdfilter_name}_UUID  $ost_nid || rc=3; }
19084         return $rc
19085 }
19086
19087 cleanup_obdecho_osc () {
19088         local obdfilter_name=$1
19089         $LCTL --device ${obdfilter_name}_osc cleanup >/dev/null
19090         $LCTL --device ${obdfilter_name}_osc detach  >/dev/null
19091         return 0
19092 }
19093
19094 obdecho_test() {
19095         local OBD=$1
19096         local node=$2
19097         local pages=${3:-64}
19098         local rc=0
19099         local id
19100
19101         local count=10
19102         local obd_size=$(get_obd_size $node $OBD)
19103         local page_size=$(get_page_size $node)
19104         if [[ -n "$obd_size" ]]; then
19105                 local new_count=$((obd_size / (pages * page_size / 1024)))
19106                 [[ $new_count -ge $count ]] || count=$new_count
19107         fi
19108
19109         do_facet $node "$LCTL attach echo_client ec ec_uuid" || rc=1
19110         [ $rc -eq 0 ] && { do_facet $node "$LCTL --device ec setup $OBD" ||
19111                            rc=2; }
19112         if [ $rc -eq 0 ]; then
19113             id=$(do_facet $node "$LCTL --device ec create 1"  | awk '/object id/ {print $6}')
19114             [ ${PIPESTATUS[0]} -eq 0 -a -n "$id" ] || rc=3
19115         fi
19116         echo "New object id is $id"
19117         [ $rc -eq 0 ] && { do_facet $node "$LCTL --device ec getattr $id" ||
19118                            rc=4; }
19119         [ $rc -eq 0 ] && { do_facet $node "$LCTL --device ec "                 \
19120                            "test_brw $count w v $pages $id" || rc=4; }
19121         [ $rc -eq 0 ] && { do_facet $node "$LCTL --device ec destroy $id 1" ||
19122                            rc=4; }
19123         [ $rc -eq 0 ] || [ $rc -gt 2 ] &&
19124                 { do_facet $node "$LCTL --device ec cleanup" || rc=5; }
19125         [ $rc -eq 0 ] || [ $rc -gt 1 ] &&
19126                 { do_facet $node "$LCTL --device ec detach" || rc=6; }
19127         [ $rc -ne 0 ] && echo "obecho_create_test failed: $rc"
19128         return $rc
19129 }
19130
19131 test_180a() {
19132         skip "obdecho on osc is no longer supported"
19133 }
19134 run_test 180a "test obdecho on osc"
19135
19136 test_180b() {
19137         [ $PARALLEL == "yes" ] && skip "skip parallel run"
19138         remote_ost_nodsh && skip "remote OST with nodsh"
19139
19140         do_rpc_nodes $(facet_active_host ost1) load_module obdecho/obdecho &&
19141                 stack_trap "do_facet ost1 rmmod obdecho" EXIT ||
19142                 error "failed to load module obdecho"
19143
19144         local target=$(do_facet ost1 $LCTL dl |
19145                        awk '/obdfilter/ { print $4; exit; }')
19146
19147         if [ -n "$target" ]; then
19148                 obdecho_test $target ost1 || error "obdecho_test failed with $?"
19149         else
19150                 do_facet ost1 $LCTL dl
19151                 error "there is no obdfilter target on ost1"
19152         fi
19153 }
19154 run_test 180b "test obdecho directly on obdfilter"
19155
19156 test_180c() { # LU-2598
19157         [ $PARALLEL == "yes" ] && skip "skip parallel run"
19158         remote_ost_nodsh && skip "remote OST with nodsh"
19159         [[ $MDS1_VERSION -lt $(version_code 2.4.0) ]] &&
19160                 skip "Need MDS version at least 2.4.0"
19161
19162         do_rpc_nodes $(facet_active_host ost1) load_module obdecho/obdecho &&
19163                 stack_trap "do_facet ost1 rmmod obdecho" EXIT ||
19164                 error "failed to load module obdecho"
19165
19166         local target=$(do_facet ost1 $LCTL dl |
19167                        awk '/obdfilter/ { print $4; exit; }')
19168
19169         if [ -n "$target" ]; then
19170                 local pages=16384 # 64MB bulk I/O RPC size
19171
19172                 obdecho_test "$target" ost1 "$pages" ||
19173                         error "obdecho_test with pages=$pages failed with $?"
19174         else
19175                 do_facet ost1 $LCTL dl
19176                 error "there is no obdfilter target on ost1"
19177         fi
19178 }
19179 run_test 180c "test huge bulk I/O size on obdfilter, don't LASSERT"
19180
19181 test_181() { # bug 22177
19182         test_mkdir $DIR/$tdir
19183         # create enough files to index the directory
19184         createmany -o $DIR/$tdir/foobar 4000
19185         # print attributes for debug purpose
19186         lsattr -d .
19187         # open dir
19188         multiop_bg_pause $DIR/$tdir D_Sc || return 1
19189         MULTIPID=$!
19190         # remove the files & current working dir
19191         unlinkmany $DIR/$tdir/foobar 4000
19192         rmdir $DIR/$tdir
19193         kill -USR1 $MULTIPID
19194         wait $MULTIPID
19195         stat $DIR/$tdir && error "open-unlinked dir was not removed!"
19196         return 0
19197 }
19198 run_test 181 "Test open-unlinked dir ========================"
19199
19200 test_182a() {
19201         local fcount=1000
19202         local tcount=10
19203
19204         mkdir -p $DIR/$tdir || error "creating dir $DIR/$tdir"
19205
19206         $LCTL set_param mdc.*.rpc_stats=clear
19207
19208         for (( i = 0; i < $tcount; i++ )) ; do
19209                 mkdir $DIR/$tdir/$i
19210         done
19211
19212         for (( i = 0; i < $tcount; i++ )) ; do
19213                 createmany -o $DIR/$tdir/$i/f- $fcount &
19214         done
19215         wait
19216
19217         for (( i = 0; i < $tcount; i++ )) ; do
19218                 unlinkmany $DIR/$tdir/$i/f- $fcount &
19219         done
19220         wait
19221
19222         $LCTL get_param mdc.*.rpc_stats
19223
19224         rm -rf $DIR/$tdir
19225 }
19226 run_test 182a "Test parallel modify metadata operations from mdc"
19227
19228 test_182b() {
19229         [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
19230         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
19231         local dcount=1000
19232         local tcount=10
19233         local stime
19234         local etime
19235         local delta
19236
19237         do_facet mds1 $LCTL list_param \
19238                 osp.$FSNAME-MDT*-osp-MDT*.rpc_stats ||
19239                 skip "MDS lacks parallel RPC handling"
19240
19241         $LFS mkdir -i 0 $DIR/$tdir || error "creating dir $DIR/$tdir"
19242
19243         rpc_count=$(do_facet mds1 $LCTL get_param -n \
19244                     osp.$FSNAME-MDT0001-osp-MDT0000.max_mod_rpcs_in_flight)
19245
19246         stime=$(date +%s)
19247         createmany -i 0 -d $DIR/$tdir/t- $tcount
19248
19249         for (( i = 0; i < $tcount; i++ )) ; do
19250                 createmany -i 0 -d $DIR/$tdir/t-$i/d- 0 $dcount &
19251         done
19252         wait
19253         etime=$(date +%s)
19254         delta=$((etime - stime))
19255         echo "Time for file creation $delta sec for $rpc_count parallel RPCs"
19256
19257         stime=$(date +%s)
19258         for (( i = 0; i < $tcount; i++ )) ; do
19259                 unlinkmany -d $DIR/$tdir/$i/d- $dcount &
19260         done
19261         wait
19262         etime=$(date +%s)
19263         delta=$((etime - stime))
19264         echo "Time for file removal $delta sec for $rpc_count parallel RPCs"
19265
19266         rm -rf $DIR/$tdir
19267
19268         $LFS mkdir -i 0 $DIR/$tdir || error "creating dir $DIR/$tdir"
19269
19270         do_facet mds1 $LCTL set_param osp.$FSNAME-MDT0001-osp-MDT0000.max_mod_rpcs_in_flight=1
19271
19272         stime=$(date +%s)
19273         createmany -i 0 -d $DIR/$tdir/t- $tcount
19274
19275         for (( i = 0; i < $tcount; i++ )) ; do
19276                 createmany -i 0 -d $DIR/$tdir/t-$i/d- 0 $dcount &
19277         done
19278         wait
19279         etime=$(date +%s)
19280         delta=$((etime - stime))
19281         echo "Time for file creation $delta sec for 1 RPC sent at a time"
19282
19283         stime=$(date +%s)
19284         for (( i = 0; i < $tcount; i++ )) ; do
19285                 unlinkmany -d $DIR/$tdir/t-$i/d- $dcount &
19286         done
19287         wait
19288         etime=$(date +%s)
19289         delta=$((etime - stime))
19290         echo "Time for file removal $delta sec for 1 RPC sent at a time"
19291
19292         do_facet mds1 $LCTL set_param osp.$FSNAME-MDT0001-osp-MDT0000.max_mod_rpcs_in_flight=$rpc_count
19293 }
19294 run_test 182b "Test parallel modify metadata operations from osp"
19295
19296 test_183() { # LU-2275
19297         [ $PARALLEL == "yes" ] && skip "skip parallel run"
19298         remote_mds_nodsh && skip "remote MDS with nodsh"
19299         [[ $MDS1_VERSION -lt $(version_code 2.3.56) ]] &&
19300                 skip "Need MDS version at least 2.3.56"
19301
19302         mkdir_on_mdt0 $DIR/$tdir || error "creating dir $DIR/$tdir"
19303         echo aaa > $DIR/$tdir/$tfile
19304
19305 #define OBD_FAIL_MDS_NEGATIVE_POSITIVE  0x148
19306         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x148
19307
19308         ls -l $DIR/$tdir && error "ls succeeded, should have failed"
19309         cat $DIR/$tdir/$tfile && error "cat succeeded, should have failed"
19310
19311         do_facet $SINGLEMDS $LCTL set_param fail_loc=0
19312
19313         # Flush negative dentry cache
19314         touch $DIR/$tdir/$tfile
19315
19316         # We are not checking for any leaked references here, they'll
19317         # become evident next time we do cleanup with module unload.
19318         rm -rf $DIR/$tdir
19319 }
19320 run_test 183 "No crash or request leak in case of strange dispositions ========"
19321
19322 # test suite 184 is for LU-2016, LU-2017
19323 test_184a() {
19324         check_swap_layouts_support
19325
19326         dir0=$DIR/$tdir/$testnum
19327         test_mkdir -p -c1 $dir0
19328         ref1=/etc/passwd
19329         ref2=/etc/group
19330         file1=$dir0/f1
19331         file2=$dir0/f2
19332         $LFS setstripe -c1 $file1
19333         cp $ref1 $file1
19334         $LFS setstripe -c2 $file2
19335         cp $ref2 $file2
19336         gen1=$($LFS getstripe -g $file1)
19337         gen2=$($LFS getstripe -g $file2)
19338
19339         $LFS swap_layouts $file1 $file2 || error "swap of file layout failed"
19340         gen=$($LFS getstripe -g $file1)
19341         [[ $gen1 != $gen ]] ||
19342                 error "Layout generation on $file1 does not change"
19343         gen=$($LFS getstripe -g $file2)
19344         [[ $gen2 != $gen ]] ||
19345                 error "Layout generation on $file2 does not change"
19346
19347         cmp $ref1 $file2 || error "content compare failed ($ref1 != $file2)"
19348         cmp $ref2 $file1 || error "content compare failed ($ref2 != $file1)"
19349
19350         lfsck_verify_pfid $file1 $file2 || error "PFID are not transferred"
19351 }
19352 run_test 184a "Basic layout swap"
19353
19354 test_184b() {
19355         check_swap_layouts_support
19356
19357         dir0=$DIR/$tdir/$testnum
19358         mkdir -p $dir0 || error "creating dir $dir0"
19359         file1=$dir0/f1
19360         file2=$dir0/f2
19361         file3=$dir0/f3
19362         dir1=$dir0/d1
19363         dir2=$dir0/d2
19364         mkdir $dir1 $dir2
19365         $LFS setstripe -c1 $file1
19366         $LFS setstripe -c2 $file2
19367         $LFS setstripe -c1 $file3
19368         chown $RUNAS_ID $file3
19369         gen1=$($LFS getstripe -g $file1)
19370         gen2=$($LFS getstripe -g $file2)
19371
19372         $LFS swap_layouts $dir1 $dir2 &&
19373                 error "swap of directories layouts should fail"
19374         $LFS swap_layouts $dir1 $file1 &&
19375                 error "swap of directory and file layouts should fail"
19376         $RUNAS $LFS swap_layouts $file1 $file2 &&
19377                 error "swap of file we cannot write should fail"
19378         $LFS swap_layouts $file1 $file3 &&
19379                 error "swap of file with different owner should fail"
19380         /bin/true # to clear error code
19381 }
19382 run_test 184b "Forbidden layout swap (will generate errors)"
19383
19384 test_184c() {
19385         local cmpn_arg=$(cmp -n 2>&1 | grep "invalid option")
19386         [ -n "$cmpn_arg" ] && skip_env "cmp does not support -n"
19387         check_swap_layouts_support
19388         check_swap_layout_no_dom $DIR
19389
19390         local dir0=$DIR/$tdir/$testnum
19391         mkdir -p $dir0 || error "creating dir $dir0"
19392
19393         local ref1=$dir0/ref1
19394         local ref2=$dir0/ref2
19395         local file1=$dir0/file1
19396         local file2=$dir0/file2
19397         # create a file large enough for the concurrent test
19398         dd if=/dev/urandom of=$ref1 bs=1M count=$((RANDOM % 50 + 20))
19399         dd if=/dev/urandom of=$ref2 bs=1M count=$((RANDOM % 50 + 20))
19400         echo "ref file size: ref1($(stat -c %s $ref1))," \
19401              "ref2($(stat -c %s $ref2))"
19402
19403         cp $ref2 $file2
19404         dd if=$ref1 of=$file1 bs=16k &
19405         local DD_PID=$!
19406
19407         # Make sure dd starts to copy file, but wait at most 5 seconds
19408         local loops=0
19409         while [ ! -s $file1 -a $((loops++)) -lt 50 ]; do sleep 0.1; done
19410
19411         $LFS swap_layouts $file1 $file2
19412         local rc=$?
19413         wait $DD_PID
19414         [[ $? == 0 ]] || error "concurrent write on $file1 failed"
19415         [[ $rc == 0 ]] || error "swap of $file1 and $file2 failed"
19416
19417         # how many bytes copied before swapping layout
19418         local copied=$(stat -c %s $file2)
19419         local remaining=$(stat -c %s $ref1)
19420         remaining=$((remaining - copied))
19421         echo "Copied $copied bytes before swapping layout..."
19422
19423         cmp -n $copied $file1 $ref2 | grep differ &&
19424                 error "Content mismatch [0, $copied) of ref2 and file1"
19425         cmp -n $copied $file2 $ref1 ||
19426                 error "Content mismatch [0, $copied) of ref1 and file2"
19427         cmp -i $copied:$copied -n $remaining $file1 $ref1 ||
19428                 error "Content mismatch [$copied, EOF) of ref1 and file1"
19429
19430         # clean up
19431         rm -f $ref1 $ref2 $file1 $file2
19432 }
19433 run_test 184c "Concurrent write and layout swap"
19434
19435 test_184d() {
19436         check_swap_layouts_support
19437         check_swap_layout_no_dom $DIR
19438         [ -z "$(which getfattr 2>/dev/null)" ] &&
19439                 skip_env "no getfattr command"
19440
19441         local file1=$DIR/$tdir/$tfile-1
19442         local file2=$DIR/$tdir/$tfile-2
19443         local file3=$DIR/$tdir/$tfile-3
19444         local lovea1
19445         local lovea2
19446
19447         mkdir -p $DIR/$tdir
19448         touch $file1 || error "create $file1 failed"
19449         $OPENFILE -f O_CREAT:O_LOV_DELAY_CREATE $file2 ||
19450                 error "create $file2 failed"
19451         $OPENFILE -f O_CREAT:O_LOV_DELAY_CREATE $file3 ||
19452                 error "create $file3 failed"
19453         lovea1=$(get_layout_param $file1)
19454
19455         $LFS swap_layouts $file2 $file3 ||
19456                 error "swap $file2 $file3 layouts failed"
19457         $LFS swap_layouts $file1 $file2 ||
19458                 error "swap $file1 $file2 layouts failed"
19459
19460         lovea2=$(get_layout_param $file2)
19461         echo "$lovea1"
19462         echo "$lovea2"
19463         [ "$lovea1" == "$lovea2" ] || error "lovea $lovea1 != $lovea2"
19464
19465         lovea1=$(getfattr -n trusted.lov $file1 | grep ^trusted)
19466         [[ -z "$lovea1" ]] || error "$file1 shouldn't have lovea"
19467 }
19468 run_test 184d "allow stripeless layouts swap"
19469
19470 test_184e() {
19471         [[ $MDS1_VERSION -ge $(version_code 2.6.94) ]] ||
19472                 skip "Need MDS version at least 2.6.94"
19473         check_swap_layouts_support
19474         check_swap_layout_no_dom $DIR
19475         [ -z "$(which getfattr 2>/dev/null)" ] &&
19476                 skip_env "no getfattr command"
19477
19478         local file1=$DIR/$tdir/$tfile-1
19479         local file2=$DIR/$tdir/$tfile-2
19480         local file3=$DIR/$tdir/$tfile-3
19481         local lovea
19482
19483         mkdir -p $DIR/$tdir
19484         touch $file1 || error "create $file1 failed"
19485         $OPENFILE -f O_CREAT:O_LOV_DELAY_CREATE $file2 ||
19486                 error "create $file2 failed"
19487         $OPENFILE -f O_CREAT:O_LOV_DELAY_CREATE $file3 ||
19488                 error "create $file3 failed"
19489
19490         $LFS swap_layouts $file1 $file2 ||
19491                 error "swap $file1 $file2 layouts failed"
19492
19493         lovea=$(getfattr -n trusted.lov $file1 | grep ^trusted)
19494         [[ -z "$lovea" ]] || error "$file1 shouldn't have lovea"
19495
19496         echo 123 > $file1 || error "Should be able to write into $file1"
19497
19498         $LFS swap_layouts $file1 $file3 ||
19499                 error "swap $file1 $file3 layouts failed"
19500
19501         echo 123 > $file1 || error "Should be able to write into $file1"
19502
19503         rm -rf $file1 $file2 $file3
19504 }
19505 run_test 184e "Recreate layout after stripeless layout swaps"
19506
19507 test_184f() {
19508         # Create a file with name longer than sizeof(struct stat) ==
19509         # 144 to see if we can get chars from the file name to appear
19510         # in the returned striping. Note that 'f' == 0x66.
19511         local file=$(for ((i = 0; i < 200; i++)); do echo -n f; done)
19512
19513         mkdir -p $DIR/$tdir
19514         mcreate $DIR/$tdir/$file
19515         if lfs find --stripe-count 0x6666 $DIR/$tdir | grep $file; then
19516                 error "IOC_MDC_GETFILEINFO returned garbage striping"
19517         fi
19518 }
19519 run_test 184f "IOC_MDC_GETFILEINFO for files with long names but no striping"
19520
19521 test_185() { # LU-2441
19522         # LU-3553 - no volatile file support in old servers
19523         [[ $MDS1_VERSION -ge $(version_code 2.3.60) ]] ||
19524                 skip "Need MDS version at least 2.3.60"
19525
19526         mkdir -p $DIR/$tdir || error "creating dir $DIR/$tdir"
19527         touch $DIR/$tdir/spoo
19528         local mtime1=$(stat -c "%Y" $DIR/$tdir)
19529         local fid=$($MULTIOP $DIR/$tdir VFw4096c) ||
19530                 error "cannot create/write a volatile file"
19531         [ "$FILESET" == "" ] &&
19532         $CHECKSTAT -t file $MOUNT/.lustre/fid/$fid 2>/dev/null &&
19533                 error "FID is still valid after close"
19534
19535         multiop_bg_pause $DIR/$tdir Vw4096_c
19536         local multi_pid=$!
19537
19538         local OLD_IFS=$IFS
19539         IFS=":"
19540         local fidv=($fid)
19541         IFS=$OLD_IFS
19542         # assume that the next FID for this client is sequential, since stdout
19543         # is unfortunately eaten by multiop_bg_pause
19544         local n=$((${fidv[1]} + 1))
19545         local next_fid="${fidv[0]}:$(printf "0x%x" $n):${fidv[2]}"
19546         if [ "$FILESET" == "" ]; then
19547                 $CHECKSTAT -t file $MOUNT/.lustre/fid/$next_fid ||
19548                         error "FID is missing before close"
19549         fi
19550         kill -USR1 $multi_pid
19551         # 1 second delay, so if mtime change we will see it
19552         sleep 1
19553         local mtime2=$(stat -c "%Y" $DIR/$tdir)
19554         [[ $mtime1 == $mtime2 ]] || error "mtime has changed"
19555 }
19556 run_test 185 "Volatile file support"
19557
19558 function create_check_volatile() {
19559         local idx=$1
19560         local tgt
19561
19562         $MULTIOP $MOUNT/.lustre/fid V${idx}Fw4096_c >&/tmp/${tfile}.fid &
19563         local PID=$!
19564         sleep 1
19565         local FID=$(cat /tmp/${tfile}.fid)
19566         [ "$FID" == "" ] && error "can't get FID for volatile"
19567         $CHECKSTAT -t file $MOUNT/.lustre/fid/$FID || error "can't stat $FID"
19568         tgt=$($LFS getstripe -m $MOUNT/.lustre/fid/$FID)
19569         [ "$tgt" != "$idx" ] && error "wrong MDS $tgt, expected $idx"
19570         kill -USR1 $PID
19571         wait
19572         sleep 1
19573         cancel_lru_locks mdc # flush opencache
19574         $CHECKSTAT -t file $MOUNT/.lustre/fid/$FID && error "can stat $FID"
19575         return 0
19576 }
19577
19578 test_185a(){
19579         # LU-12516 - volatile creation via .lustre
19580         [[ $MDS1_VERSION -ge $(version_code 2.12.55) ]] ||
19581                 skip "Need MDS version at least 2.3.55"
19582
19583         create_check_volatile 0
19584         [ $MDSCOUNT -lt 2 ] && return 0
19585
19586         # DNE case
19587         create_check_volatile 1
19588
19589         return 0
19590 }
19591 run_test 185a "Volatile file creation in .lustre/fid/"
19592
19593 test_187a() {
19594         remote_mds_nodsh && skip "remote MDS with nodsh"
19595         [ $MDS1_VERSION -lt $(version_code 2.3.0) ] &&
19596                 skip "Need MDS version at least 2.3.0"
19597
19598         local dir0=$DIR/$tdir/$testnum
19599         mkdir -p $dir0 || error "creating dir $dir0"
19600
19601         local file=$dir0/file1
19602         dd if=/dev/urandom of=$file count=10 bs=1M conv=fsync
19603         stack_trap "rm -f $file"
19604         local dv1=$($LFS data_version $file)
19605         dd if=/dev/urandom of=$file seek=10 count=1 bs=1M conv=fsync
19606         local dv2=$($LFS data_version $file)
19607         [[ $dv1 != $dv2 ]] ||
19608                 error "data version did not change on write $dv1 == $dv2"
19609 }
19610 run_test 187a "Test data version change"
19611
19612 test_187b() {
19613         remote_mds_nodsh && skip "remote MDS with nodsh"
19614         [ $MDS1_VERSION -lt $(version_code 2.3.0) ] &&
19615                 skip "Need MDS version at least 2.3.0"
19616
19617         local dir0=$DIR/$tdir/$testnum
19618         mkdir -p $dir0 || error "creating dir $dir0"
19619
19620         declare -a DV=$($MULTIOP $dir0 Vw1000xYw1000xY | cut -f3 -d" ")
19621         [[ ${DV[0]} != ${DV[1]} ]] ||
19622                 error "data version did not change on write"\
19623                       " ${DV[0]} == ${DV[1]}"
19624
19625         # clean up
19626         rm -f $file1
19627 }
19628 run_test 187b "Test data version change on volatile file"
19629
19630 test_200() {
19631         [ $PARALLEL == "yes" ] && skip "skip parallel run"
19632         remote_mgs_nodsh && skip "remote MGS with nodsh"
19633         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
19634
19635         local POOL=${POOL:-cea1}
19636         local POOL_ROOT=${POOL_ROOT:-$DIR/d200.pools}
19637         local POOL_DIR_NAME=${POOL_DIR_NAME:-dir_tst}
19638         # Pool OST targets
19639         local first_ost=0
19640         local last_ost=$(($OSTCOUNT - 1))
19641         local ost_step=2
19642         local ost_list=$(seq $first_ost $ost_step $last_ost)
19643         local ost_range="$first_ost $last_ost $ost_step"
19644         local test_path=$POOL_ROOT/$POOL_DIR_NAME
19645         local file_dir=$POOL_ROOT/file_tst
19646         local subdir=$test_path/subdir
19647         local rc=0
19648
19649         while : ; do
19650                 # former test_200a test_200b
19651                 pool_add $POOL                          || { rc=$? ; break; }
19652                 pool_add_targets  $POOL $ost_range      || { rc=$? ; break; }
19653                 # former test_200c test_200d
19654                 mkdir -p $test_path
19655                 pool_set_dir      $POOL $test_path      || { rc=$? ; break; }
19656                 pool_check_dir    $POOL $test_path      || { rc=$? ; break; }
19657                 mkdir -p $subdir
19658                 pool_check_dir    $POOL $subdir         || { rc=$? ; break; }
19659                 pool_dir_rel_path $POOL $POOL_DIR_NAME $POOL_ROOT \
19660                                                         || { rc=$? ; break; }
19661                 # former test_200e test_200f
19662                 local files=$((OSTCOUNT*3))
19663                 pool_alloc_files  $POOL $test_path $files "$ost_list" \
19664                                                         || { rc=$? ; break; }
19665                 pool_create_files $POOL $file_dir $files "$ost_list" \
19666                                                         || { rc=$? ; break; }
19667                 # former test_200g test_200h
19668                 pool_lfs_df $POOL                       || { rc=$? ; break; }
19669                 pool_file_rel_path $POOL $test_path     || { rc=$? ; break; }
19670
19671                 # former test_201a test_201b test_201c
19672                 pool_remove_first_target $POOL          || { rc=$? ; break; }
19673
19674                 local f=$test_path/$tfile
19675                 pool_remove_all_targets $POOL $f        || { rc=$? ; break; }
19676                 pool_remove $POOL $f                    || { rc=$? ; break; }
19677                 break
19678         done
19679
19680         destroy_test_pools
19681
19682         return $rc
19683 }
19684 run_test 200 "OST pools"
19685
19686 # usage: default_attr <count | size | offset>
19687 default_attr() {
19688         $LCTL get_param -n lov.$FSNAME-clilov-\*.stripe${1}
19689 }
19690
19691 # usage: check_default_stripe_attr
19692 check_default_stripe_attr() {
19693         ACTUAL=$($LFS getstripe $* $DIR/$tdir)
19694         case $1 in
19695         --stripe-count|-c)
19696                 [ -n "$2" ] && EXPECTED=0 || EXPECTED=$(default_attr count);;
19697         --stripe-size|-S)
19698                 [ -n "$2" ] && EXPECTED=0 || EXPECTED=$(default_attr size);;
19699         --stripe-index|-i)
19700                 EXPECTED=-1;;
19701         *)
19702                 error "unknown getstripe attr '$1'"
19703         esac
19704
19705         [ $ACTUAL == $EXPECTED ] ||
19706                 error "$DIR/$tdir has $1 '$ACTUAL', not '$EXPECTED'"
19707 }
19708
19709 test_204a() {
19710         test_mkdir $DIR/$tdir
19711         $LFS setstripe --stripe-count 0 --stripe-size 0 --stripe-index -1 $DIR/$tdir
19712
19713         check_default_stripe_attr --stripe-count
19714         check_default_stripe_attr --stripe-size
19715         check_default_stripe_attr --stripe-index
19716 }
19717 run_test 204a "Print default stripe attributes"
19718
19719 test_204b() {
19720         test_mkdir $DIR/$tdir
19721         $LFS setstripe --stripe-count 1 $DIR/$tdir
19722
19723         check_default_stripe_attr --stripe-size
19724         check_default_stripe_attr --stripe-index
19725 }
19726 run_test 204b "Print default stripe size and offset"
19727
19728 test_204c() {
19729         test_mkdir $DIR/$tdir
19730         $LFS setstripe --stripe-size 65536 $DIR/$tdir
19731
19732         check_default_stripe_attr --stripe-count
19733         check_default_stripe_attr --stripe-index
19734 }
19735 run_test 204c "Print default stripe count and offset"
19736
19737 test_204d() {
19738         test_mkdir $DIR/$tdir
19739         $LFS setstripe --stripe-index 0 $DIR/$tdir
19740
19741         check_default_stripe_attr --stripe-count
19742         check_default_stripe_attr --stripe-size
19743 }
19744 run_test 204d "Print default stripe count and size"
19745
19746 test_204e() {
19747         test_mkdir $DIR/$tdir
19748         $LFS setstripe -d $DIR/$tdir
19749
19750         # LU-16904 check if root is set as PFL layout
19751         local numcomp=$($LFS getstripe --component-count $MOUNT)
19752
19753         if [[ $numcomp -gt 0 ]]; then
19754                 check_default_stripe_attr --stripe-count
19755         else
19756                 check_default_stripe_attr --stripe-count --raw
19757         fi
19758         check_default_stripe_attr --stripe-size --raw
19759         check_default_stripe_attr --stripe-index --raw
19760 }
19761 run_test 204e "Print raw stripe attributes"
19762
19763 test_204f() {
19764         test_mkdir $DIR/$tdir
19765         $LFS setstripe --stripe-count 1 $DIR/$tdir
19766
19767         check_default_stripe_attr --stripe-size --raw
19768         check_default_stripe_attr --stripe-index --raw
19769 }
19770 run_test 204f "Print raw stripe size and offset"
19771
19772 test_204g() {
19773         test_mkdir $DIR/$tdir
19774         $LFS setstripe --stripe-size 65536 $DIR/$tdir
19775
19776         check_default_stripe_attr --stripe-count --raw
19777         check_default_stripe_attr --stripe-index --raw
19778 }
19779 run_test 204g "Print raw stripe count and offset"
19780
19781 test_204h() {
19782         test_mkdir $DIR/$tdir
19783         $LFS setstripe --stripe-index 0 $DIR/$tdir
19784
19785         check_default_stripe_attr --stripe-count --raw
19786         check_default_stripe_attr --stripe-size --raw
19787 }
19788 run_test 204h "Print raw stripe count and size"
19789
19790 # Figure out which job scheduler is being used, if any,
19791 # or use a fake one
19792 if [ -n "$SLURM_JOB_ID" ]; then # SLURM
19793         JOBENV=SLURM_JOB_ID
19794 elif [ -n "$LSB_JOBID" ]; then # Load Sharing Facility
19795         JOBENV=LSB_JOBID
19796 elif [ -n "$PBS_JOBID" ]; then # PBS/Maui/Moab
19797         JOBENV=PBS_JOBID
19798 elif [ -n "$LOADL_STEPID" ]; then # LoadLeveller
19799         JOBENV=LOADL_STEP_ID
19800 elif [ -n "$JOB_ID" ]; then # Sun Grid Engine
19801         JOBENV=JOB_ID
19802 else
19803         $LCTL list_param jobid_name > /dev/null 2>&1
19804         if [ $? -eq 0 ]; then
19805                 JOBENV=nodelocal
19806         else
19807                 JOBENV=FAKE_JOBID
19808         fi
19809 fi
19810 LUSTRE_JOBID_SIZE=31 # plus NUL terminator
19811
19812 verify_jobstats() {
19813         local cmd=($1)
19814         shift
19815         local facets="$@"
19816
19817 # we don't really need to clear the stats for this test to work, since each
19818 # command has a unique jobid, but it makes debugging easier if needed.
19819 #       for facet in $facets; do
19820 #               local dev=$(convert_facet2label $facet)
19821 #               # clear old jobstats
19822 #               do_facet $facet lctl set_param *.$dev.job_stats="clear"
19823 #       done
19824
19825         # use a new JobID for each test, or we might see an old one
19826         [ "$JOBENV" = "FAKE_JOBID" ] &&
19827                 FAKE_JOBID=id.$testnum.$(basename ${cmd[0]}).$RANDOM
19828
19829         JOBVAL=${!JOBENV:0:$LUSTRE_JOBID_SIZE}
19830
19831         [ "$JOBENV" = "nodelocal" ] && {
19832                 FAKE_JOBID=id.$testnum.%e.$RANDOM
19833                 $LCTL set_param jobid_name=$FAKE_JOBID
19834                 JOBVAL=${FAKE_JOBID/\%e/$(basename ${cmd[0]})}
19835         }
19836
19837         log "Test: ${cmd[*]}"
19838         log "Using JobID environment $($LCTL get_param -n jobid_var)=$JOBVAL"
19839
19840         if [ $JOBENV = "FAKE_JOBID" ]; then
19841                 FAKE_JOBID=$JOBVAL ${cmd[*]}
19842         else
19843                 ${cmd[*]}
19844         fi
19845
19846         # all files are created on OST0000
19847         for facet in $facets; do
19848                 local stats="*.$(convert_facet2label $facet).job_stats"
19849
19850                 # strip out libtool wrappers for in-tree executables
19851                 if (( $(do_facet $facet lctl get_param $stats |
19852                         sed -e 's/\.lt-/./' | grep -cw $JOBVAL) != 1 )); then
19853                         do_facet $facet lctl get_param $stats
19854                         error "No jobstats for $JOBVAL found on $facet::$stats"
19855                 fi
19856         done
19857 }
19858
19859 jobstats_set() {
19860         local new_jobenv=$1
19861
19862         set_persistent_param_and_check client "jobid_var" \
19863                 "$FSNAME.sys.jobid_var" $new_jobenv
19864 }
19865
19866 test_205a() { # Job stats
19867         [ $PARALLEL == "yes" ] && skip "skip parallel run"
19868         [[ $MDS1_VERSION -ge $(version_code 2.7.1) ]] ||
19869                 skip "Need MDS version with at least 2.7.1"
19870         remote_mgs_nodsh && skip "remote MGS with nodsh"
19871         remote_mds_nodsh && skip "remote MDS with nodsh"
19872         remote_ost_nodsh && skip "remote OST with nodsh"
19873         [ -z "$(lctl get_param -n mdc.*.connect_flags | grep jobstats)" ] &&
19874                 skip "Server doesn't support jobstats"
19875         [[ $JOBID_VAR = disable ]] && skip_env "jobstats is disabled"
19876
19877         local old_jobenv=$($LCTL get_param -n jobid_var)
19878         [ $old_jobenv != $JOBENV ] && jobstats_set $JOBENV
19879         stack_trap "jobstats_set $old_jobenv" EXIT
19880
19881         changelog_register
19882
19883         local old_jobid_name=$($LCTL get_param jobid_name)
19884         stack_trap "$LCTL set_param $old_jobid_name" EXIT
19885
19886         local old_interval=$(do_facet $SINGLEMDS lctl get_param -n \
19887                                 mdt.*.job_cleanup_interval | head -n 1)
19888         local new_interval=5
19889         do_facet $SINGLEMDS \
19890                 $LCTL set_param mdt.*.job_cleanup_interval=$new_interval
19891         stack_trap "do_facet $SINGLEMDS \
19892                 $LCTL set_param mdt.*.job_cleanup_interval=$old_interval" EXIT
19893         local start=$SECONDS
19894
19895         local cmd
19896         # mkdir
19897         cmd="$LFS mkdir -i 0 -c 1 $DIR/$tdir"
19898         verify_jobstats "$cmd" "$SINGLEMDS"
19899         # rmdir
19900         cmd="rmdir $DIR/$tdir"
19901         verify_jobstats "$cmd" "$SINGLEMDS"
19902         # mkdir on secondary MDT
19903         if [ $MDSCOUNT -gt 1 ]; then
19904                 cmd="lfs mkdir -i 1 $DIR/$tdir.remote"
19905                 verify_jobstats "$cmd" "mds2"
19906         fi
19907         # mknod
19908         cmd="mknod $DIR/$tfile c 1 3"
19909         verify_jobstats "$cmd" "$SINGLEMDS"
19910         # unlink
19911         cmd="rm -f $DIR/$tfile"
19912         verify_jobstats "$cmd" "$SINGLEMDS"
19913         # create all files on OST0000 so verify_jobstats can find OST stats
19914         # open & close
19915         cmd="$LFS setstripe -i 0 -c 1 $DIR/$tfile"
19916         verify_jobstats "$cmd" "$SINGLEMDS"
19917         # setattr
19918         cmd="touch $DIR/$tfile"
19919         verify_jobstats "$cmd" "$SINGLEMDS ost1"
19920         # write
19921         cmd="dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 oflag=sync"
19922         verify_jobstats "$cmd" "ost1"
19923         # read
19924         cancel_lru_locks osc
19925         cmd="dd if=$DIR/$tfile of=/dev/null bs=1M count=1 iflag=direct"
19926         verify_jobstats "$cmd" "ost1"
19927         # truncate
19928         cmd="$TRUNCATE $DIR/$tfile 0"
19929         verify_jobstats "$cmd" "$SINGLEMDS ost1"
19930         # rename
19931         cmd="mv -f $DIR/$tfile $DIR/$tdir.rename"
19932         verify_jobstats "$cmd" "$SINGLEMDS"
19933         # jobstats expiry - sleep until old stats should be expired
19934         local left=$((new_interval + 5 - (SECONDS - start)))
19935         [ $left -ge 0 ] && wait_update_facet $SINGLEMDS \
19936                 "lctl get_param *.*.job_stats | grep -c 'job_id.*mkdir'" \
19937                         "0" $left
19938         cmd="$LFS mkdir -i 0 -c 1 $DIR/$tdir.expire"
19939         verify_jobstats "$cmd" "$SINGLEMDS"
19940         [ $(do_facet $SINGLEMDS lctl get_param *.*.job_stats |
19941             grep -c "job_id.*mkdir") -gt 1 ] && error "old jobstats not expired"
19942
19943         # Ensure that jobid are present in changelog (if supported by MDS)
19944         if [ $MDS1_VERSION -ge $(version_code 2.6.52) ];then
19945                 changelog_dump | tail -10
19946                 jobids=$(changelog_dump | tail -9 | grep -c "j=")
19947                 [ $jobids -eq 9 ] ||
19948                         error "Wrong changelog jobid count $jobids != 9"
19949
19950                 # LU-5862
19951                 JOBENV="disable"
19952                 jobstats_set $JOBENV
19953                 touch $DIR/$tfile
19954                 changelog_dump | grep $tfile
19955                 jobids=$(changelog_dump | grep $tfile | tail -1 | grep -c "j=")
19956                 [ $jobids -eq 0 ] ||
19957                         error "Unexpected jobids when jobid_var=$JOBENV"
19958         fi
19959
19960         # test '%j' access to environment variable - if supported
19961         if lctl set_param jobid_var=USER jobid_name="S.%j.%e.%u.%h.E"; then
19962                 JOBENV="JOBCOMPLEX"
19963                 JOBCOMPLEX="S.$USER.touch.$(id -u).$(hostname).E"
19964
19965                 verify_jobstats "touch $DIR/$tfile" $SINGLEMDS
19966         fi
19967
19968         if lctl set_param jobid_var=USER jobid_name="S.%j.%e.%u.%H.E"; then
19969                 JOBENV="JOBCOMPLEX"
19970                 JOBCOMPLEX="S.$USER.touch.$(id -u).$(hostname -s).E"
19971
19972                 verify_jobstats "touch $DIR/$tfile" $SINGLEMDS
19973         fi
19974
19975         # test '%j' access to per-session jobid - if supported
19976         if lctl list_param jobid_this_session > /dev/null 2>&1
19977         then
19978                 lctl set_param jobid_var=session jobid_name="S.%j.%e.%u.%h.E"
19979                 lctl set_param jobid_this_session=$USER
19980
19981                 JOBENV="JOBCOMPLEX"
19982                 JOBCOMPLEX="S.$USER.touch.$(id -u).$(hostname).E"
19983
19984                 verify_jobstats "touch $DIR/$tfile" $SINGLEMDS
19985         fi
19986 }
19987 run_test 205a "Verify job stats"
19988
19989 # LU-13117, LU-13597, LU-16599
19990 test_205b() {
19991         (( $MDS1_VERSION >= $(version_code 2.13.54.91) )) ||
19992                 skip "Need MDS version at least 2.13.54.91"
19993
19994         local job_stats="mdt.*.job_stats"
19995         local old_jobid=$(do_facet mds1 $LCTL get_param jobid_var)
19996
19997         do_facet mds1 $LCTL set_param $job_stats=clear
19998
19999         # Setting jobid_var to USER might not be supported
20000         [[ -n "$old_jobid" ]] && stack_trap "$LCTL set_param $old_jobid"
20001         $LCTL set_param jobid_var=USER || true
20002         stack_trap "$LCTL set_param $($LCTL get_param jobid_name)"
20003         $LCTL set_param jobid_name="%j.%e.%u"
20004
20005         env -i USERTESTJOBSTATS=foolish touch $DIR/$tfile.1
20006         do_facet mds1 $LCTL get_param $job_stats | grep "job_id:.*foolish" &&
20007                 { do_facet mds1 $LCTL get_param $job_stats;
20008                   error "Unexpected jobid found"; }
20009         do_facet mds1 $LCTL get_param $job_stats | grep "open:.*min.*max.*sum"||
20010                 { do_facet mds1 $LCTL get_param $job_stats;
20011                   error "wrong job_stats format found"; }
20012
20013         (( $MDS1_VERSION <= $(version_code 2.15.0) )) &&
20014                 echo "MDS does not yet escape jobid" && return 0
20015
20016         mkdir_on_mdt0 $DIR/$tdir
20017         $LCTL set_param jobid_var=TEST205b
20018         env -i TEST205b="has sp" touch $DIR/$tdir/$tfile.2
20019         local jobid=$(do_facet mds1 $LCTL get_param $job_stats |
20020                       awk '/has\\x20sp/ {print $3}')
20021         [[ -n "$jobid" ]] || { do_facet mds1 $LCTL get_param $job_stats;
20022                   error "jobid not escaped"; }
20023
20024         if (( $MDS1_VERSION >= $(version_code 2.15.53.139) )); then
20025                 # need to run such a command on mds1:
20026                 # lctl set_param mdt.$FSNAME-MDT0000.job_stats='"has\x20sp.touch.0"'
20027                 #
20028                 # there might be multiple MDTs on single mds server, so need to
20029                 # specifiy MDT0000. Or the command will fail due to other MDTs
20030                 do_facet_vp mds1 $LCTL set_param mdt.$FSNAME-MDT0000.job_stats=$jobid ||
20031                         error "cannot clear escaped jobid in job_stats";
20032         else
20033                 echo "MDS does not support clearing escaped jobid"
20034         fi
20035 }
20036 run_test 205b "Verify job stats jobid and output format"
20037
20038 # LU-13733
20039 test_205c() {
20040         $LCTL set_param llite.*.stats=0
20041         dd if=/dev/zero of=$DIR/$tfile.1 bs=4k count=1
20042         $LCTL get_param llite.*.stats
20043         $LCTL get_param llite.*.stats | grep \
20044                 "write_bytes *1 samples \[bytes\] 4096 4096 4096 16777216" ||
20045                         error "wrong client stats format found"
20046 }
20047 run_test 205c "Verify client stats format"
20048
20049 test_205d() {
20050         local file=$DIR/$tdir/$tfile
20051
20052         (( $MDS1_VERSION >= $(version_code 2.15.53) )) ||
20053                 skip "need lustre >= 2.15.53 for lljobstat"
20054         (( $OST1_VERSION >= $(version_code 2.15.53) )) ||
20055                 skip "need lustre >= 2.15.53 for lljobstat"
20056         verify_yaml_available || skip_env "YAML verification not installed"
20057
20058         test_mkdir -i 0 $DIR/$tdir
20059         $LFS setstripe -E 1M -L mdt -E -1 $file || error "create file failed"
20060         stack_trap "rm -rf $DIR/$tdir"
20061
20062         dd if=/dev/zero of=$file bs=1M count=10 conv=sync ||
20063                 error "failed to write data to $file"
20064         mv $file $file.2
20065
20066         do_facet mds1 "$LCTL get_param -n mdt.$FSNAME-MDT0000.rename_stats"
20067         echo -n 'verify rename_stats...'
20068         do_facet mds1 "$LCTL get_param -n mdt.$FSNAME-MDT0000.rename_stats" |
20069                 verify_yaml || error "rename_stats is not valid YAML"
20070         echo " OK"
20071
20072         echo -n 'verify mdt job_stats...'
20073         do_facet mds1 "$LCTL get_param -n mdt.$FSNAME-MDT0000.job_stats" |
20074                 verify_yaml || error "job_stats on mds1 is not valid YAML"
20075         echo " OK"
20076
20077         echo -n 'verify ost job_stats...'
20078         do_facet ost1 "$LCTL get_param -n obdfilter.$FSNAME-OST0000.job_stats" |
20079                 verify_yaml || error "job_stats on ost1 is not valid YAML"
20080         echo " OK"
20081 }
20082 run_test 205d "verify the format of some stats files"
20083
20084 test_205e() {
20085         local ops_comma
20086         local file=$DIR/$tdir/$tfile
20087         local -a cli_params
20088
20089         (( $MDS1_VERSION >= $(version_code 2.15.53) )) ||
20090                 skip "need lustre >= 2.15.53 for lljobstat"
20091         (( $OST1_VERSION >= $(version_code 2.15.53) )) ||
20092                 skip "need lustre >= 2.15.53 for lljobstat"
20093         verify_yaml_available || skip_env "YAML verification not installed"
20094
20095         cli_params=( $($LCTL get_param jobid_name jobid_var) )
20096         $LCTL set_param jobid_var=nodelocal jobid_name=205e.%e.%u
20097         stack_trap "$LCTL set_param ${cli_params[*]}" EXIT
20098
20099         mkdir_on_mdt0 $DIR/$tdir || error "failed to create dir"
20100         stack_trap "rm -rf $DIR/$tdir"
20101
20102         $LFS setstripe -E EOF -i 0 -c 1 $file ||
20103                 error "failed to create $file on ost1"
20104         dd if=/dev/zero of=$file bs=1M count=10 oflag=sync ||
20105                 error "failed to write data to $file"
20106
20107         do_facet mds1 "$LCTL get_param *.*.job_stats"
20108         do_facet ost1 "$LCTL get_param *.*.job_stats"
20109
20110         do_facet ost1 "lljobstat -n 1 -i 0 -c 1000"
20111         do_facet ost1 "lljobstat -n 1 -i 0 -c 1000" | verify_yaml ||
20112                 error "The output of lljobstat is not an valid YAML"
20113
20114         # verify that job dd.0 does exist and has some ops on ost1
20115         # typically this line is like:
20116         # - 205e.dd.0:            {ops: 20, ...}
20117         ops_comma=$(do_facet ost1 "lljobstat -n 1 -i 0 -c 1000" |
20118                     awk '$2=="205e.dd.0:" {print $4}')
20119
20120         (( ${ops_comma%,} >= 10 )) ||
20121                 error "cannot find job 205e.dd.0 with ops >= 10"
20122 }
20123 run_test 205e "verify the output of lljobstat"
20124
20125 test_205f() {
20126         verify_yaml_available || skip_env "YAML verification not installed"
20127
20128         # check both qos_ost_weights and qos_mdt_weights
20129         do_facet mds1 $LCTL get_param -n lod.*.qos*weights
20130         do_facet mds1 $LCTL get_param -n lod.*.qos*weights | verify_yaml ||
20131                 error "qos_ost_weights is not valid YAML"
20132 }
20133 run_test 205f "verify qos_ost_weights YAML format "
20134
20135 __test_205_jobstats_dump() {
20136         local -a pids
20137         local nbr_instance=$1
20138
20139         while true; do
20140                 if (( ${#pids[@]} >= nbr_instance )); then
20141                         wait ${pids[@]}
20142                         pids=()
20143                 fi
20144
20145                 do_facet mds1 "$LCTL get_param mdt.*.job_stats > /dev/null" &
20146                 pids+=( $! )
20147         done
20148 }
20149
20150 __test_205_cleanup() {
20151         kill $@
20152         # Clear all job entries
20153         do_facet mds1 "$LCTL set_param mdt.*.job_stats=clear"
20154 }
20155
20156 test_205g() {
20157         local -a mds1_params
20158         local -a cli_params
20159         local pids
20160         local interval=5
20161
20162         mds1_params=( $(do_facet mds1 $LCTL get_param mdt.*.job_cleanup_interval) )
20163         do_facet mds1 $LCTL set_param mdt.*.job_cleanup_interval=$interval
20164         stack_trap "do_facet mds1 $LCTL set_param ${mds1_params[*]}" EXIT
20165
20166         cli_params=( $($LCTL get_param jobid_name jobid_var) )
20167         $LCTL set_param jobid_var=TEST205G_ID jobid_name=%j.%p
20168         stack_trap "$LCTL set_param ${cli_params[*]}" EXIT
20169
20170         # start jobs loop
20171         export TEST205G_ID=205g
20172         stack_trap "unset TEST205G_ID" EXIT
20173         while true; do
20174                 printf $DIR/$tfile.{0001..1000} | xargs -P10 -n1 touch
20175         done & pids="$! "
20176
20177         __test_205_jobstats_dump 4 & pids+="$! "
20178         stack_trap "__test_205_cleanup $pids" EXIT INT
20179
20180         [[ $SLOW == "no" ]] && sleep 90 || sleep 240
20181 }
20182 run_test 205g "stress test for job_stats procfile"
20183
20184 test_205h() {
20185         which getfattr > /dev/null 2>&1 || skip_env "no getfattr command"
20186
20187         local dir=$DIR/$tdir
20188         local f=$dir/$tfile
20189         local f2=$dir/$tfile-2
20190         local f3=$dir/$tfile-3
20191         local subdir=$DIR/dir
20192         local val
20193
20194         local mdts=$(comma_list $(mdts_nodes))
20195         local mds_saved=$(do_facet mds1 $LCTL get_param -n mdt.$FSNAME-MDT0000.job_xattr)
20196         local client_saved=$($LCTL get_param -n jobid_var)
20197
20198         stack_trap "do_nodes $mdts $LCTL set_param mdt.*.job_xattr=$mds_saved" EXIT
20199         stack_trap "$LCTL set_param jobid_var=$client_saved" EXIT
20200
20201         do_nodes $mdts $LCTL set_param mdt.*.job_xattr=user.job ||
20202                 error "failed to set job_xattr parameter to user.job"
20203         $LCTL set_param jobid_var=procname.uid ||
20204                 error "failed to set jobid_var parameter"
20205
20206         test_mkdir $dir
20207
20208         touch $f
20209         val=$(getfattr -n user.job $f | grep user.job)
20210         [[ $val = user.job=\"touch.0\" ]] ||
20211                 error "expected user.job=\"touch.0\", got '$val'"
20212
20213         mkdir $subdir
20214         val=$(getfattr -n user.job $subdir | grep user.job)
20215         [[ $val = user.job=\"mkdir.0\" ]] ||
20216                 error "expected user.job=\"mkdir.0\", got '$val'"
20217
20218         do_nodes $mdts $LCTL set_param mdt.*.job_xattr=NONE ||
20219                 error "failed to set job_xattr parameter to NONE"
20220
20221         touch $f2
20222         val=$(getfattr -d $f2)
20223         [[ -z $val ]] ||
20224                 error "expected no user xattr, got '$val'"
20225
20226         do_nodes $mdts $LCTL set_param mdt.*.job_xattr=trusted.job ||
20227                 error "failed to set job_xattr parameter to trusted.job"
20228
20229         touch $f3
20230         val=$(getfattr -n trusted.job $f3 | grep trusted.job)
20231         [[ $val = trusted.job=\"touch.0\" ]] ||
20232                 error "expected trusted.job=\"touch.0\", got '$val'"
20233 }
20234 run_test 205h "check jobid xattr is stored correctly"
20235
20236 test_205i() {
20237         local mdts=$(comma_list $(mdts_nodes))
20238         local mds_saved=$(do_facet mds1 $LCTL get_param -n mdt.$FSNAME-MDT0000.job_xattr)
20239
20240         stack_trap "do_nodes $mdts $LCTL set_param mdt.*.job_xattr=$mds_saved" EXIT
20241
20242         do_nodes $mdts $LCTL set_param mdt.*.job_xattr=user.1234567 ||
20243                 error "failed to set mdt.*.job_xattr to user.1234567"
20244
20245         do_nodes $mdts $LCTL set_param mdt.*.job_xattr=user.12345678 &&
20246                 error "failed to reject too long job_xattr name"
20247
20248         do_nodes $mdts $LCTL set_param mdt.*.job_xattr=userjob &&
20249                 error "failed to reject job_xattr name in bad format"
20250
20251         do_nodes $mdts $LCTL set_param mdt.*.job_xattr=user.job/ &&
20252                 error "failed to reject job_xattr name with invalid character"
20253
20254         do_nodes $mdts "printf 'mdt.*.job_xattr=user.job\x80' |
20255                         xargs $LCTL set_param" &&
20256                 error "failed to reject job_xattr name with non-ascii character"
20257
20258         return 0
20259 }
20260 run_test 205i "check job_xattr parameter accepts and rejects values correctly"
20261
20262 # LU-1480, LU-1773 and LU-1657
20263 test_206() {
20264         mkdir -p $DIR/$tdir
20265         $LFS setstripe -c -1 $DIR/$tdir
20266 #define OBD_FAIL_LOV_INIT 0x1403
20267         $LCTL set_param fail_loc=0xa0001403
20268         $LCTL set_param fail_val=1
20269         touch $DIR/$tdir/$tfile || true
20270 }
20271 run_test 206 "fail lov_init_raid0() doesn't lbug"
20272
20273 test_207a() {
20274         dd if=/dev/zero of=$DIR/$tfile bs=4k count=$((RANDOM%10+1))
20275         local fsz=`stat -c %s $DIR/$tfile`
20276         cancel_lru_locks mdc
20277
20278         # do not return layout in getattr intent
20279 #define OBD_FAIL_MDS_NO_LL_GETATTR 0x170
20280         $LCTL set_param fail_loc=0x170
20281         local sz=`stat -c %s $DIR/$tfile`
20282
20283         [ $fsz -eq $sz ] || error "file size expected $fsz, actual $sz"
20284
20285         rm -rf $DIR/$tfile
20286 }
20287 run_test 207a "can refresh layout at glimpse"
20288
20289 test_207b() {
20290         dd if=/dev/zero of=$DIR/$tfile bs=4k count=$((RANDOM%10+1))
20291         local cksum=`md5sum $DIR/$tfile`
20292         local fsz=`stat -c %s $DIR/$tfile`
20293         cancel_lru_locks mdc
20294         cancel_lru_locks osc
20295
20296         # do not return layout in getattr intent
20297 #define OBD_FAIL_MDS_NO_LL_OPEN 0x171
20298         $LCTL set_param fail_loc=0x171
20299
20300         # it will refresh layout after the file is opened but before read issues
20301         echo checksum is "$cksum"
20302         echo "$cksum" |md5sum -c --quiet || error "file differs"
20303
20304         rm -rf $DIR/$tfile
20305 }
20306 run_test 207b "can refresh layout at open"
20307
20308 test_208() {
20309         # FIXME: in this test suite, only RD lease is used. This is okay
20310         # for now as only exclusive open is supported. After generic lease
20311         # is done, this test suite should be revised. - Jinshan
20312
20313         remote_mds_nodsh && skip "remote MDS with nodsh"
20314         [[ $MDS1_VERSION -ge $(version_code 2.4.52) ]] ||
20315                 skip "Need MDS version at least 2.4.52"
20316
20317         echo "==== test 1: verify get lease work"
20318         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:eRE+eU || error "get lease error"
20319
20320         echo "==== test 2: verify lease can be broken by upcoming open"
20321         $MULTIOP $DIR/$tfile oO_RDWR:eR_E-eUc &
20322         local PID=$!
20323         sleep 2
20324
20325         $MULTIOP $DIR/$tfile oO_RDWR:c
20326         kill -USR1 $PID && wait $PID || error "break lease error"
20327
20328         echo "==== test 3: verify lease can't be granted if an open already exists"
20329         $MULTIOP $DIR/$tfile oO_RDWR:_c &
20330         local PID=$!
20331         sleep 2
20332
20333         $MULTIOP $DIR/$tfile oO_RDWR:eReUc && error "apply lease should fail"
20334         kill -USR1 $PID && wait $PID || error "open file error"
20335
20336         echo "==== test 4: lease can sustain over recovery"
20337         $MULTIOP $DIR/$tfile oO_RDWR:eR_E+eUc &
20338         PID=$!
20339         sleep 2
20340
20341         fail mds1
20342
20343         kill -USR1 $PID && wait $PID || error "lease broken over recovery"
20344
20345         echo "==== test 5: lease broken can't be regained by replay"
20346         $MULTIOP $DIR/$tfile oO_RDWR:eR_E-eUc &
20347         PID=$!
20348         sleep 2
20349
20350         # open file to break lease and then recovery
20351         $MULTIOP $DIR/$tfile oO_RDWR:c || error "open file error"
20352         fail mds1
20353
20354         kill -USR1 $PID && wait $PID || error "lease not broken over recovery"
20355
20356         rm -f $DIR/$tfile
20357 }
20358 run_test 208 "Exclusive open"
20359
20360 test_209() {
20361         [ -z "$(lctl get_param -n mdc.*.connect_flags | grep disp_stripe)" ] &&
20362                 skip_env "must have disp_stripe"
20363
20364         touch $DIR/$tfile
20365         sync; sleep 5; sync;
20366
20367         echo 3 > /proc/sys/vm/drop_caches
20368         [ -f /sys/kernel/slab/ptlrpc_cache/shrink ] &&
20369                 echo 1 > /sys/kernel/slab/ptlrpc_cache/shrink
20370         req_before=$(awk '/ptlrpc_cache / { print $2 }' /proc/slabinfo)
20371
20372         # open/close 500 times
20373         for i in $(seq 500); do
20374                 cat $DIR/$tfile
20375         done
20376
20377         echo 3 > /proc/sys/vm/drop_caches
20378         [ -f /sys/kernel/slab/ptlrpc_cache/shrink ] &&
20379                 echo 1 > /sys/kernel/slab/ptlrpc_cache/shrink
20380         req_after=$(awk '/ptlrpc_cache / { print $2 }' /proc/slabinfo)
20381
20382         echo "before: $req_before, after: $req_after"
20383         [ $((req_after - req_before)) -ge 300 ] &&
20384                 error "open/close requests are not freed"
20385         return 0
20386 }
20387 run_test 209 "read-only open/close requests should be freed promptly"
20388
20389 test_210() {
20390         local pid
20391
20392         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:eW_E+eUc &
20393         pid=$!
20394         sleep 1
20395
20396         $LFS getstripe $DIR/$tfile
20397         kill -USR1 $pid
20398         wait $pid || error "multiop failed"
20399
20400         $MULTIOP $DIR/$tfile oO_RDONLY:eR_E+eUc &
20401         pid=$!
20402         sleep 1
20403
20404         $LFS getstripe $DIR/$tfile
20405         kill -USR1 $pid
20406         wait $pid || error "multiop failed"
20407 }
20408 run_test 210 "lfs getstripe does not break leases"
20409
20410 function test_211() {
20411         local PID
20412         local id
20413         local rc
20414
20415         stack_trap "rm -f $DIR/$tfile" EXIT
20416         dd if=/dev/zero of=$DIR/$tfile bs=$PAGE_SIZE count=10 oflag=direct ||
20417                 error "can't create file"
20418         $LFS mirror extend -N $DIR/$tfile ||
20419                 error "can't create a replica"
20420         dd if=/dev/zero of=$DIR/$tfile bs=$PAGE_SIZE count=1 oflag=direct
20421         $LFS getstripe $DIR/$tfile
20422         stale=$($LFS getstripe $DIR/$tfile | grep stale | wc -l)
20423         (( $stale != 1 )) && error "expected 1 stale, found $stale"
20424
20425         $MULTIOP $DIR/$tfile OeW_E+eUc &
20426         PID=$!
20427         sleep 0.3
20428
20429         id=$($LFS getstripe $DIR/$tfile |
20430                 awk '/lcme_mirror_id:/{id=$2}/lcme_flags.*init$/{print id}')
20431         $LFS mirror split -d --mirror-id $id $DIR/$tfile &&
20432                 error "removed last in-sync replica?"
20433
20434         kill -USR1 $PID
20435         wait $PID
20436         (( $? == 0 )) || error "failed split broke the lease"
20437 }
20438 run_test 211 "failed mirror split doesn't break write lease"
20439
20440 test_212() {
20441         size=`date +%s`
20442         size=$((size % 8192 + 1))
20443         dd if=/dev/urandom of=$DIR/f212 bs=1k count=$size
20444         sendfile $DIR/f212 $DIR/f212.xyz || error "sendfile wrong"
20445         rm -f $DIR/f212 $DIR/f212.xyz
20446 }
20447 run_test 212 "Sendfile test ============================================"
20448
20449 test_213() {
20450         dd if=/dev/zero of=$DIR/$tfile bs=4k count=4
20451         cancel_lru_locks osc
20452         lctl set_param fail_loc=0x8000040f
20453         # generate a read lock
20454         cat $DIR/$tfile > /dev/null
20455         # write to the file, it will try to cancel the above read lock.
20456         cat /etc/hosts >> $DIR/$tfile
20457 }
20458 run_test 213 "OSC lock completion and cancel race don't crash - bug 18829"
20459
20460 test_214() { # for bug 20133
20461         mkdir -p $DIR/$tdir/d214c || error "mkdir $DIR/$tdir/d214c failed"
20462         for (( i=0; i < 340; i++ )) ; do
20463                 touch $DIR/$tdir/d214c/a$i
20464         done
20465
20466         ls -l $DIR/$tdir || error "ls -l $DIR/d214p failed"
20467         mv $DIR/$tdir/d214c $DIR/ || error "mv $DIR/d214p/d214c $DIR/ failed"
20468         ls $DIR/d214c || error "ls $DIR/d214c failed"
20469         rm -rf $DIR/$tdir || error "rm -rf $DIR/d214* failed"
20470         rm -rf $DIR/d214* || error "rm -rf $DIR/d214* failed"
20471 }
20472 run_test 214 "hash-indexed directory test - bug 20133"
20473
20474 # having "abc" as 1st arg, creates $TMP/lnet_abc.out and $TMP/lnet_abc.sys
20475 create_lnet_proc_files() {
20476         lctl get_param -n $1 >$TMP/lnet_$1.sys || error "cannot read lnet.$1"
20477 }
20478
20479 # counterpart of create_lnet_proc_files
20480 remove_lnet_proc_files() {
20481         rm -f $TMP/lnet_$1.sys
20482 }
20483
20484 # uses 1st arg as trailing part of filename, 2nd arg as description for reports,
20485 # 3rd arg as regexp for body
20486 check_lnet_proc_stats() {
20487         local l=$(cat "$TMP/lnet_$1" |wc -l)
20488         [ $l = 1 ] || (cat "$TMP/lnet_$1" && error "$2 is not of 1 line: $l")
20489
20490         grep -E "$3" "$TMP/lnet_$1" || (cat "$TMP/lnet_$1" && error "$2 misformatted")
20491 }
20492
20493 # uses 1st arg as trailing part of filename, 2nd arg as description for reports,
20494 # 3rd arg as regexp for body, 4th arg as regexp for 1st line, 5th arg is
20495 # optional and can be regexp for 2nd line (lnet.routes case)
20496 check_lnet_proc_entry() {
20497         local blp=2          # blp stands for 'position of 1st line of body'
20498         [ -z "$5" ] || blp=3 # lnet.routes case
20499
20500         local l=$(cat "$TMP/lnet_$1" |wc -l)
20501         # subtracting one from $blp because the body can be empty
20502         [ "$l" -ge "$(($blp - 1))" ] || (cat "$TMP/lnet_$1" && error "$2 is too short: $l")
20503
20504         sed -n '1 p' "$TMP/lnet_$1" |grep -E "$4" >/dev/null ||
20505                 (cat "$TMP/lnet_$1" && error "1st line of $2 misformatted")
20506
20507         [ "$5" = "" ] || sed -n '2 p' "$TMP/lnet_$1" |grep -E "$5" >/dev/null ||
20508                 (cat "$TMP/lnet_$1" && error "2nd line of $2 misformatted")
20509
20510         # bail out if any unexpected line happened
20511         sed -n "$blp p" "$TMP/lnet_$1" | grep -Ev "$3"
20512         [ "$?" != 0 ] || error "$2 misformatted"
20513 }
20514
20515 test_215() { # for bugs 18102, 21079, 21517
20516         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20517
20518         local N='(0|[1-9][0-9]*)'       # non-negative numeric
20519         local P='[1-9][0-9]*'           # positive numeric
20520         local I='(0|-?[1-9][0-9]*|NA)'  # any numeric (0 | >0 | <0) or NA if no value
20521         local NET='[a-z][a-z0-9]*'      # LNET net like o2ib2
20522         local ADDR='[0-9.]+'            # LNET addr like 10.0.0.1
20523         local NID="$ADDR@$NET"          # LNET nid like 10.0.0.1@o2ib2
20524
20525         local L1 # regexp for 1st line
20526         local L2 # regexp for 2nd line (optional)
20527         local BR # regexp for the rest (body)
20528
20529         # lnet.stats should look as 11 space-separated non-negative numerics
20530         BR="^$N $N $N $N $N $N $N $N $N $N $N$"
20531         create_lnet_proc_files "stats"
20532         check_lnet_proc_stats "stats.sys" "lnet.stats" "$BR"
20533         remove_lnet_proc_files "stats"
20534
20535         # lnet.routes should look like this:
20536         # Routing disabled/enabled
20537         # net hops priority state router
20538         # where net is a string like tcp0, hops > 0, priority >= 0,
20539         # state is up/down,
20540         # router is a string like 192.168.1.1@tcp2
20541         L1="^Routing (disabled|enabled)$"
20542         L2="^net +hops +priority +state +router$"
20543         BR="^$NET +$N +(0|1) +(up|down) +$NID$"
20544         create_lnet_proc_files "routes"
20545         check_lnet_proc_entry "routes.sys" "lnet.routes" "$BR" "$L1" "$L2"
20546         remove_lnet_proc_files "routes"
20547
20548         # lnet.routers should look like this:
20549         # ref rtr_ref alive_cnt state last_ping ping_sent deadline down_ni router
20550         # where ref > 0, rtr_ref > 0, alive_cnt >= 0, state is up/down,
20551         # last_ping >= 0, ping_sent is boolean (0/1), deadline and down_ni are
20552         # numeric (0 or >0 or <0), router is a string like 192.168.1.1@tcp2
20553         L1="^ref +rtr_ref +alive +router$"
20554         BR="^$P +$P +(up|down) +$NID$"
20555         create_lnet_proc_files "routers"
20556         check_lnet_proc_entry "routers.sys" "lnet.routers" "$BR" "$L1"
20557         remove_lnet_proc_files "routers"
20558
20559         # lnet.peers should look like this:
20560         # nid refs state last max rtr min tx min queue
20561         # where nid is a string like 192.168.1.1@tcp2, refs > 0,
20562         # state is up/down/NA, max >= 0. last, rtr, min, tx, min are
20563         # numeric (0 or >0 or <0), queue >= 0.
20564         L1="^nid +refs +state +last +max +rtr +min +tx +min +queue$"
20565         BR="^$NID +$P +(up|down|NA) +$I +$N +$I +$I +$I +$I +$N$"
20566         create_lnet_proc_files "peers"
20567         check_lnet_proc_entry "peers.sys" "lnet.peers" "$BR" "$L1"
20568         remove_lnet_proc_files "peers"
20569
20570         # lnet.buffers  should look like this:
20571         # pages count credits min
20572         # where pages >=0, count >=0, credits and min are numeric (0 or >0 or <0)
20573         L1="^pages +count +credits +min$"
20574         BR="^ +$N +$N +$I +$I$"
20575         create_lnet_proc_files "buffers"
20576         check_lnet_proc_entry "buffers.sys" "lnet.buffers" "$BR" "$L1"
20577         remove_lnet_proc_files "buffers"
20578
20579         # lnet.nis should look like this:
20580         # nid status alive refs peer rtr max tx min
20581         # where nid is a string like 192.168.1.1@tcp2, status is up/down,
20582         # alive is numeric (0 or >0 or <0), refs >= 0, peer >= 0,
20583         # rtr >= 0, max >=0, tx and min are numeric (0 or >0 or <0).
20584         L1="^nid +status +alive +refs +peer +rtr +max +tx +min$"
20585         BR="^$NID +(up|down) +$I +$N +$N +$N +$N +$I +$I$"
20586         create_lnet_proc_files "nis"
20587         check_lnet_proc_entry "nis.sys" "lnet.nis" "$BR" "$L1"
20588         remove_lnet_proc_files "nis"
20589
20590         # can we successfully write to lnet.stats?
20591         lctl set_param -n stats=0 || error "cannot write to lnet.stats"
20592 }
20593 run_test 215 "lnet exists and has proper content - bugs 18102, 21079, 21517"
20594
20595 test_216() { # bug 20317
20596         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20597         remote_ost_nodsh && skip "remote OST with nodsh"
20598
20599         local node
20600         local facets=$(get_facets OST)
20601         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
20602
20603         save_lustre_params client "osc.*.contention_seconds" > $p
20604         save_lustre_params $facets \
20605                 "ldlm.namespaces.filter-*.max_nolock_bytes" >> $p
20606         save_lustre_params $facets \
20607                 "ldlm.namespaces.filter-*.contended_locks" >> $p
20608         save_lustre_params $facets \
20609                 "ldlm.namespaces.filter-*.contention_seconds" >> $p
20610         clear_stats osc.*.osc_stats
20611
20612         # agressive lockless i/o settings
20613         do_nodes $(comma_list $(osts_nodes)) \
20614                 "lctl set_param -n ldlm.namespaces.*.max_nolock_bytes=2000000 \
20615                         ldlm.namespaces.filter-*.contended_locks=0 \
20616                         ldlm.namespaces.filter-*.contention_seconds=60"
20617         lctl set_param -n osc.*.contention_seconds=60
20618
20619         $DIRECTIO write $DIR/$tfile 0 10 4096
20620         $CHECKSTAT -s 40960 $DIR/$tfile
20621
20622         # disable lockless i/o
20623         do_nodes $(comma_list $(osts_nodes)) \
20624                 "lctl set_param -n ldlm.namespaces.filter-*.max_nolock_bytes=0 \
20625                         ldlm.namespaces.filter-*.contended_locks=32 \
20626                         ldlm.namespaces.filter-*.contention_seconds=0"
20627         lctl set_param -n osc.*.contention_seconds=0
20628         clear_stats osc.*.osc_stats
20629
20630         dd if=/dev/zero of=$DIR/$tfile count=0
20631         $CHECKSTAT -s 0 $DIR/$tfile
20632
20633         restore_lustre_params <$p
20634         rm -f $p
20635         rm $DIR/$tfile
20636 }
20637 run_test 216 "check lockless direct write updates file size and kms correctly"
20638
20639 test_217() { # bug 22430
20640         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20641
20642         local node
20643
20644         for node in $(nodes_list); do
20645                 local nid=$(host_nids_address $node $NETTYPE)
20646                 local node_ip=$(do_node $node getent ahostsv4 $node |
20647                                 awk '{ print $1; exit; }')
20648
20649                 echo "node: '$node', nid: '$nid', node_ip='$node_ip'"
20650                 # if hostname matches any NID, use hostname for better testing
20651                 if [[ -z "$nid" || "$nid" =~ "$node_ip" ]]; then
20652                         echo "lctl ping node $node@$NETTYPE"
20653                         lctl ping $node@$NETTYPE
20654                 else # otherwise, at least test 'lctl ping' is working
20655                         echo "lctl ping nid $(h2nettype $nid)"
20656                         lctl ping $(h2nettype $nid)
20657                         echo "skipping $node (no hyphen detected)"
20658                 fi
20659         done
20660 }
20661 run_test 217 "check lctl ping for hostnames with embedded hyphen ('-')"
20662
20663 test_218() {
20664         # do directio so as not to populate the page cache
20665         log "creating a 10 Mb file"
20666         $MULTIOP $DIR/$tfile oO_CREAT:O_DIRECT:O_RDWR:w$((10*1048576))c ||
20667                 error "multiop failed while creating a file"
20668         log "starting reads"
20669         dd if=$DIR/$tfile of=/dev/null bs=4096 &
20670         log "truncating the file"
20671         $MULTIOP $DIR/$tfile oO_TRUNC:c ||
20672                 error "multiop failed while truncating the file"
20673         log "killing dd"
20674         kill %+ || true # reads might have finished
20675         echo "wait until dd is finished"
20676         wait
20677         log "removing the temporary file"
20678         rm -rf $DIR/$tfile || error "tmp file removal failed"
20679 }
20680 run_test 218 "parallel read and truncate should not deadlock"
20681
20682 test_219() {
20683         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20684
20685         # write one partial page
20686         dd if=/dev/zero of=$DIR/$tfile bs=1024 count=1
20687         # set no grant so vvp_io_commit_write will do sync write
20688         $LCTL set_param fail_loc=0x411
20689         # write a full page at the end of file
20690         dd if=/dev/zero of=$DIR/$tfile bs=4096 count=1 seek=1 conv=notrunc
20691
20692         $LCTL set_param fail_loc=0
20693         dd if=/dev/zero of=$DIR/$tfile bs=4096 count=1 seek=3
20694         $LCTL set_param fail_loc=0x411
20695         dd if=/dev/zero of=$DIR/$tfile bs=1024 count=1 seek=2 conv=notrunc
20696
20697         # LU-4201
20698         dd if=/dev/zero of=$DIR/$tfile-2 bs=1024 count=1
20699         $CHECKSTAT -s 1024 $DIR/$tfile-2 || error "checkstat wrong size"
20700 }
20701 run_test 219 "LU-394: Write partial won't cause uncontiguous pages vec at LND"
20702
20703 test_220() { #LU-325
20704         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20705         remote_ost_nodsh && skip "remote OST with nodsh"
20706         remote_mds_nodsh && skip "remote MDS with nodsh"
20707         remote_mgs_nodsh && skip "remote MGS with nodsh"
20708
20709         local OSTIDX=0
20710
20711         # create on MDT0000 so the last_id and next_id are correct
20712         mkdir_on_mdt0 $DIR/$tdir
20713         local OST=$($LFS df $DIR | awk '/OST:'$OSTIDX'/ { print $1 }')
20714         OST=${OST%_UUID}
20715
20716         # on the mdt's osc
20717         local mdtosc_proc1=$(get_mdtosc_proc_path $SINGLEMDS $OST)
20718         local last_id=$(do_facet $SINGLEMDS lctl get_param -n \
20719                         osp.$mdtosc_proc1.prealloc_last_id)
20720         local next_id=$(do_facet $SINGLEMDS lctl get_param -n \
20721                         osp.$mdtosc_proc1.prealloc_next_id)
20722
20723         $LFS df -i
20724
20725         do_facet ost$((OSTIDX + 1)) lctl set_param fail_val=-1
20726         #define OBD_FAIL_OST_ENOINO              0x229
20727         do_facet ost$((OSTIDX + 1)) lctl set_param fail_loc=0x229
20728         create_pool $FSNAME.$TESTNAME || return 1
20729         do_facet mgs $LCTL pool_add $FSNAME.$TESTNAME $OST || return 2
20730
20731         $LFS setstripe $DIR/$tdir -i $OSTIDX -c 1 -p $FSNAME.$TESTNAME
20732
20733         MDSOBJS=$((last_id - next_id))
20734         echo "preallocated objects on MDS is $MDSOBJS" "($last_id - $next_id)"
20735
20736         blocks=$($LFS df $MOUNT | awk '($1 == '$OSTIDX') { print $4 }')
20737         echo "OST still has $count kbytes free"
20738
20739         echo "create $MDSOBJS files @next_id..."
20740         createmany -o $DIR/$tdir/f $MDSOBJS || return 3
20741
20742         local last_id2=$(do_facet mds${MDSIDX} lctl get_param -n \
20743                         osp.$mdtosc_proc1.prealloc_last_id)
20744         local next_id2=$(do_facet mds${MDSIDX} lctl get_param -n \
20745                         osp.$mdtosc_proc1.prealloc_next_id)
20746
20747         echo "after creation, last_id=$last_id2, next_id=$next_id2"
20748         $LFS df -i
20749
20750         echo "cleanup..."
20751
20752         do_facet ost$((OSTIDX + 1)) lctl set_param fail_val=0
20753         do_facet ost$((OSTIDX + 1)) lctl set_param fail_loc=0
20754
20755         do_facet mgs $LCTL pool_remove $FSNAME.$TESTNAME $OST ||
20756                 error "$LCTL pool_remove $FSNAME.$TESTNAME $OST failed"
20757         do_facet mgs $LCTL pool_destroy $FSNAME.$TESTNAME ||
20758                 error "$LCTL pool_destroy $FSNAME.$TESTNAME failed"
20759         echo "unlink $MDSOBJS files @$next_id..."
20760         unlinkmany $DIR/$tdir/f $MDSOBJS || error "unlinkmany failed"
20761 }
20762 run_test 220 "preallocated MDS objects still used if ENOSPC from OST"
20763
20764 test_221() {
20765         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20766
20767         dd if=`which date` of=$MOUNT/date oflag=sync
20768         chmod +x $MOUNT/date
20769
20770         #define OBD_FAIL_LLITE_FAULT_TRUNC_RACE  0x1401
20771         $LCTL set_param fail_loc=0x80001401
20772
20773         $MOUNT/date > /dev/null
20774         rm -f $MOUNT/date
20775 }
20776 run_test 221 "make sure fault and truncate race to not cause OOM"
20777
20778 test_222a () {
20779         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20780
20781         rm -rf $DIR/$tdir
20782         test_mkdir $DIR/$tdir
20783         $LFS setstripe -c 1 -i 0 $DIR/$tdir
20784         createmany -o $DIR/$tdir/$tfile 10
20785         cancel_lru_locks mdc
20786         cancel_lru_locks osc
20787         #define OBD_FAIL_LDLM_AGL_DELAY           0x31a
20788         $LCTL set_param fail_loc=0x31a
20789         ls -l $DIR/$tdir > /dev/null || error "AGL for ls failed"
20790         $LCTL set_param fail_loc=0
20791         rm -r $DIR/$tdir
20792 }
20793 run_test 222a "AGL for ls should not trigger CLIO lock failure"
20794
20795 test_222b () {
20796         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20797
20798         rm -rf $DIR/$tdir
20799         test_mkdir $DIR/$tdir
20800         $LFS setstripe -c 1 -i 0 $DIR/$tdir
20801         createmany -o $DIR/$tdir/$tfile 10
20802         cancel_lru_locks mdc
20803         cancel_lru_locks osc
20804         #define OBD_FAIL_LDLM_AGL_DELAY           0x31a
20805         $LCTL set_param fail_loc=0x31a
20806         rm -r $DIR/$tdir || error "AGL for rmdir failed"
20807         $LCTL set_param fail_loc=0
20808 }
20809 run_test 222b "AGL for rmdir should not trigger CLIO lock failure"
20810
20811 test_223 () {
20812         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20813
20814         rm -rf $DIR/$tdir
20815         test_mkdir $DIR/$tdir
20816         $LFS setstripe -c 1 -i 0 $DIR/$tdir
20817         createmany -o $DIR/$tdir/$tfile 10
20818         cancel_lru_locks mdc
20819         cancel_lru_locks osc
20820         #define OBD_FAIL_LDLM_AGL_NOLOCK          0x31b
20821         $LCTL set_param fail_loc=0x31b
20822         ls -l $DIR/$tdir > /dev/null || error "reenqueue failed"
20823         $LCTL set_param fail_loc=0
20824         rm -r $DIR/$tdir
20825 }
20826 run_test 223 "osc reenqueue if without AGL lock granted ======================="
20827
20828 test_224a() { # LU-1039, MRP-303
20829         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20830         #define OBD_FAIL_PTLRPC_CLIENT_BULK_CB   0x508
20831         $LCTL set_param fail_loc=0x508
20832         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 conv=fsync
20833         $LCTL set_param fail_loc=0
20834         df $DIR
20835 }
20836 run_test 224a "Don't panic on bulk IO failure"
20837
20838 test_224bd_sub() { # LU-1039, MRP-303
20839         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20840         local timeout=$1
20841
20842         shift
20843         dd if=/dev/urandom of=$TMP/$tfile bs=1M count=1
20844
20845         $LFS setstripe -c 1 -i 0 $DIR/$tfile
20846
20847         dd if=$TMP/$tfile of=$DIR/$tfile bs=1M count=1
20848         cancel_lru_locks osc
20849         set_checksums 0
20850         stack_trap "set_checksums $ORIG_CSUM" EXIT
20851         local at_max_saved=0
20852
20853         # adaptive timeouts may prevent seeing the issue
20854         if at_is_enabled; then
20855                 at_max_saved=$(at_max_get mds)
20856                 at_max_set 0 mds client
20857                 stack_trap "at_max_set $at_max_saved mds client" EXIT
20858         fi
20859
20860         #define OBD_FAIL_PTLRPC_CLIENT_BULK_CB2   0x515
20861         do_facet ost1 $LCTL set_param fail_val=$timeout fail_loc=0x80000515
20862         dd of=$TMP/$tfile.new if=$DIR/$tfile bs=1M count=1 || "$@"
20863
20864         do_facet ost1 $LCTL set_param fail_loc=0
20865         cmp $TMP/$tfile $TMP/$tfile.new || error "file contents wrong"
20866         df $DIR
20867 }
20868
20869 test_224b() {
20870         test_224bd_sub 3 error "dd failed"
20871 }
20872 run_test 224b "Don't panic on bulk IO failure"
20873
20874 test_224c() { # LU-6441
20875         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20876         remote_mds_nodsh && skip "remote MDS with nodsh"
20877
20878         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
20879         save_writethrough $p
20880         set_cache writethrough on
20881
20882         local pages_per_rpc=$($LCTL get_param osc.*.max_pages_per_rpc)
20883         local at_max=$($LCTL get_param -n at_max)
20884         local timeout=$($LCTL get_param -n timeout)
20885         local test_at="at_max"
20886         local param_at="$FSNAME.sys.at_max"
20887         local test_timeout="timeout"
20888         local param_timeout="$FSNAME.sys.timeout"
20889
20890         $LCTL set_param -n osc.*.max_pages_per_rpc=1024
20891
20892         set_persistent_param_and_check client "$test_at" "$param_at" 0
20893         set_persistent_param_and_check client "$test_timeout" "$param_timeout" 5
20894
20895         #define OBD_FAIL_PTLRPC_CLIENT_BULK_CB3 0x520
20896         do_facet ost1 "$LCTL set_param fail_loc=0x520"
20897         $LFS setstripe -c 1 -i 0 $DIR/$tfile
20898         stack_trap "rm -f $DIR/$tfile"
20899         dd if=/dev/zero of=$DIR/$tfile bs=8MB count=1
20900         sync
20901         do_facet ost1 "$LCTL set_param fail_loc=0"
20902
20903         set_persistent_param_and_check client "$test_at" "$param_at" $at_max
20904         set_persistent_param_and_check client "$test_timeout" "$param_timeout" \
20905                 $timeout
20906
20907         $LCTL set_param -n $pages_per_rpc
20908         restore_lustre_params < $p
20909         rm -f $p
20910 }
20911 run_test 224c "Don't hang if one of md lost during large bulk RPC"
20912
20913 test_224d() { # LU-11169
20914         test_224bd_sub $((TIMEOUT + 2)) error "dd failed"
20915 }
20916 run_test 224d "Don't corrupt data on bulk IO timeout"
20917
20918 MDSSURVEY=${MDSSURVEY:-$(which mds-survey 2>/dev/null || true)}
20919 test_225a () {
20920         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20921         if [ -z ${MDSSURVEY} ]; then
20922                 skip_env "mds-survey not found"
20923         fi
20924         [ $MDS1_VERSION -ge $(version_code 2.2.51) ] ||
20925                 skip "Need MDS version at least 2.2.51"
20926
20927         local mds=$(facet_host $SINGLEMDS)
20928         local target=$(do_nodes $mds 'lctl dl' |
20929                        awk '{ if ($2 == "UP" && $3 == "mdt") { print $4 }}')
20930
20931         local cmd1="file_count=1000 thrhi=4"
20932         local cmd2="dir_count=2 layer=mdd stripe_count=0"
20933         local cmd3="rslt_loc=${TMP} targets=\"$mds:$target\" $MDSSURVEY"
20934         local cmd="$cmd1 $cmd2 $cmd3"
20935
20936         rm -f ${TMP}/mds_survey*
20937         echo + $cmd
20938         eval $cmd || error "mds-survey with zero-stripe failed"
20939         cat ${TMP}/mds_survey*
20940         rm -f ${TMP}/mds_survey*
20941 }
20942 run_test 225a "Metadata survey sanity with zero-stripe"
20943
20944 test_225b () {
20945         if [ -z ${MDSSURVEY} ]; then
20946                 skip_env "mds-survey not found"
20947         fi
20948         [ $MDS1_VERSION -ge $(version_code 2.2.51) ] ||
20949                 skip "Need MDS version at least 2.2.51"
20950         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20951         remote_mds_nodsh && skip "remote MDS with nodsh"
20952         if [ $($LCTL dl | grep -c osc) -eq 0 ]; then
20953                 skip_env "Need to mount OST to test"
20954         fi
20955
20956         local mds=$(facet_host $SINGLEMDS)
20957         local target=$(do_nodes $mds 'lctl dl' |
20958                        awk '{ if ($2 == "UP" && $3 == "mdt") { print $4 }}')
20959
20960         local cmd1="file_count=1000 thrhi=4"
20961         local cmd2="dir_count=2 layer=mdd stripe_count=1"
20962         local cmd3="rslt_loc=${TMP} targets=\"$mds:$target\" $MDSSURVEY"
20963         local cmd="$cmd1 $cmd2 $cmd3"
20964
20965         rm -f ${TMP}/mds_survey*
20966         echo + $cmd
20967         eval $cmd || error "mds-survey with stripe_count failed"
20968         cat ${TMP}/mds_survey*
20969         rm -f ${TMP}/mds_survey*
20970 }
20971 run_test 225b "Metadata survey sanity with stripe_count = 1"
20972
20973 mcreate_path2fid () {
20974         local mode=$1
20975         local major=$2
20976         local minor=$3
20977         local name=$4
20978         local desc=$5
20979         local path=$DIR/$tdir/$name
20980         local fid
20981         local rc
20982         local fid_path
20983
20984         $MCREATE --mode=$1 --major=$2 --minor=$3 $path ||
20985                 error "cannot create $desc"
20986
20987         fid=$($LFS path2fid $path | tr -d '[' | tr -d ']')
20988         rc=$?
20989         [ $rc -ne 0 ] && error "cannot get fid of a $desc"
20990
20991         fid_path=$($LFS fid2path $MOUNT $fid)
20992         rc=$?
20993         [ $rc -ne 0 ] && error "cannot get path of $desc by $DIR $path $fid"
20994
20995         [ "$path" == "$fid_path" ] ||
20996                 error "fid2path returned $fid_path, expected $path"
20997
20998         echo "pass with $path and $fid"
20999 }
21000
21001 test_226a () {
21002         rm -rf $DIR/$tdir
21003         mkdir -p $DIR/$tdir
21004
21005         mcreate_path2fid 0010666 0 0 fifo "FIFO"
21006         mcreate_path2fid 0020666 1 3 null "character special file (null)"
21007         mcreate_path2fid 0020666 1 255 none "character special file (no device)"
21008         mcreate_path2fid 0040666 0 0 dir "directory"
21009         mcreate_path2fid 0060666 7 0 loop0 "block special file (loop)"
21010         mcreate_path2fid 0100666 0 0 file "regular file"
21011         mcreate_path2fid 0120666 0 0 link "symbolic link"
21012         mcreate_path2fid 0140666 0 0 sock "socket"
21013 }
21014 run_test 226a "call path2fid and fid2path on files of all type"
21015
21016 test_226b () {
21017         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21018
21019         local MDTIDX=1
21020
21021         rm -rf $DIR/$tdir
21022         mkdir -p $DIR/$tdir
21023         $LFS setdirstripe -i $MDTIDX $DIR/$tdir/remote_dir ||
21024                 error "create remote directory failed"
21025         mcreate_path2fid 0010666 0 0 "remote_dir/fifo" "FIFO"
21026         mcreate_path2fid 0020666 1 3 "remote_dir/null" \
21027                                 "character special file (null)"
21028         mcreate_path2fid 0020666 1 255 "remote_dir/none" \
21029                                 "character special file (no device)"
21030         mcreate_path2fid 0040666 0 0 "remote_dir/dir" "directory"
21031         mcreate_path2fid 0060666 7 0 "remote_dir/loop0" \
21032                                 "block special file (loop)"
21033         mcreate_path2fid 0100666 0 0 "remote_dir/file" "regular file"
21034         mcreate_path2fid 0120666 0 0 "remote_dir/link" "symbolic link"
21035         mcreate_path2fid 0140666 0 0 "remote_dir/sock" "socket"
21036 }
21037 run_test 226b "call path2fid and fid2path on files of all type under remote dir"
21038
21039 test_226c () {
21040         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21041         [[ $MDS1_VERSION -ge $(version_code 2.13.55) ]] ||
21042                 skip "Need MDS version at least 2.13.55"
21043
21044         local submnt=/mnt/submnt
21045         local srcfile=/etc/passwd
21046         local dstfile=$submnt/passwd
21047         local path
21048         local fid
21049
21050         rm -rf $DIR/$tdir
21051         rm -rf $submnt
21052         $LFS setdirstripe -c -1 -i 1 $DIR/$tdir ||
21053                 error "create remote directory failed"
21054         mkdir -p $submnt || error "create $submnt failed"
21055         $MOUNT_CMD $MGSNID:/$FSNAME/$tdir $submnt ||
21056                 error "mount $submnt failed"
21057         stack_trap "umount $submnt" EXIT
21058
21059         cp $srcfile $dstfile
21060         fid=$($LFS path2fid $dstfile)
21061         path=$($LFS fid2path $submnt "$fid")
21062         [ "$path" = "$dstfile" ] ||
21063                 error "fid2path $submnt $fid failed ($path != $dstfile)"
21064 }
21065 run_test 226c "call path2fid and fid2path under remote dir with subdir mount"
21066
21067 test_226d () {
21068         (( $CLIENT_VERSION >= $(version_code 2.15.57) )) ||
21069                 skip "Need client at least version 2.15.57"
21070
21071         # Define First test dataset
21072         local testdirs_01=$DIR/$tdir
21073         local testdata_01=$testdirs_01/${tdir}_01
21074         local testresult_01=${tdir}_01
21075         # Define Second test dataset
21076         local testdirs_02=$DIR/$tdir/$tdir
21077         local testdata_02=$testdirs_02/${tdir}_02
21078         local testresult_02=${tdir}_02
21079         # Define third test dataset (top level)
21080         local testdata_03=$DIR/${tdir}_03
21081         local testresult_03=${tdir}_03
21082
21083         # Create first test dataset
21084         mkdir -p $testdirs_01 || error "cannot create dir $testdirs_01"
21085         touch $testdata_01 || error "cannot create file $testdata_01"
21086
21087         # Create second test dataset
21088         mkdir -p $testdirs_02 || error "cannot create dir $testdirs_02"
21089         touch $testdata_02 || error "cannot create file $testdata_02"
21090
21091         # Create third test dataset
21092         touch $testdata_03 || error "cannot create file $testdata_03"
21093
21094         local fid01=$($LFS getstripe -F "$testdata_01") ||
21095                 error "getstripe failed on $testdata_01"
21096         local fid02=$($LFS getstripe -F "$testdata_02") ||
21097                 error "getstripe failed on $testdata_01"
21098         local fid03=$($LFS getstripe -F "$testdata_03") ||
21099                 error "getstripe failed on $testdata_03"
21100
21101         # Verify only -n option
21102         local out1=$($LFS fid2path -n $DIR $fid01) ||
21103                 error "fid2path failed on $fid01"
21104         local out2=$($LFS fid2path -n $DIR $fid02) ||
21105                 error "fid2path failed on $fid02"
21106         local out3=$($LFS fid2path -n $DIR $fid03) ||
21107                 error "fid2path failed on $fid03"
21108
21109         [[ "$out1" == "$testresult_01" ]] ||
21110                 error "fid2path failed: Expected $testresult_01 got $out1"
21111         [[ "$out2" == "$testresult_02" ]] ||
21112                 error "fid2path failed: Expected $testresult_02 got $out2"
21113         [[ "$out3" == "$testresult_03" ]] ||
21114                 error "fid2path failed: Expected $testresult_03 got $out3"
21115
21116         # Verify with option -fn together
21117         out1=$($LFS fid2path -fn $DIR $fid01) ||
21118                 error "fid2path -fn failed on $fid01"
21119         out2=$($LFS fid2path -fn $DIR $fid02) ||
21120                 error "fid2path -fn failed on $fid02"
21121         out3=$($LFS fid2path -fn $DIR $fid03) ||
21122                 error "fid2path -fn failed on $fid03"
21123
21124         local tmpout=$(echo $out1 | cut -d" " -f2)
21125         [[ "$tmpout" == "$testresult_01" ]] ||
21126                 error "fid2path -fn failed: Expected $testresult_01 got $out1"
21127
21128         tmpout=$(echo $out2 | cut -d" " -f2)
21129         [[ "$tmpout" == "$testresult_02" ]] ||
21130                 error "fid2path -fn failed: Expected $testresult_02 got $out2"
21131
21132         tmpout=$(echo $out3 | cut -d" " -f2)
21133         [[ "$tmpout" == "$testresult_03" ]] ||
21134                 error "fid2path -fn failed: Expected $testresult_03 got $out3"
21135 }
21136 run_test 226d "verify fid2path with -n and -fn option"
21137
21138 test_226e () {
21139         (( $CLIENT_VERSION >= $(version_code 2.15.56) )) ||
21140                 skip "Need client at least version 2.15.56"
21141
21142         # Define filename with 'newline' and a space
21143         local testfile="Test"$'\n'"file 01"
21144         # Define link name with multiple 'newline' and a space
21145         local linkfile="Link"$'\n'"file "$'\n'"01"
21146         # Remove prior hard link
21147         rm -f $DIR/"$linkfile"
21148
21149         # Create file
21150         touch $DIR/"$testfile"
21151         # Create link
21152         ln $DIR/"$testfile" $DIR/"$linkfile"
21153
21154         local fid=$($LFS getstripe -F "$DIR/$testfile") ||
21155                 error "getstripe failed on $DIR/$testfile"
21156
21157         # Call with -0 option
21158         local out1=$($LFS fid2path -0 $DIR $fid | xargs --null -n1 \
21159                 echo "FILE:" | grep -c "FILE:")
21160
21161         # With -0 option the output should be exactly 2 lines.
21162         (( $out1 == 2 )) || error "fid2path -0 failed on $fid, $out1"
21163 }
21164 run_test 226e "Verify path2fid -0 option with newline and space"
21165
21166 # LU-1299 Executing or running ldd on a truncated executable does not
21167 # cause an out-of-memory condition.
21168 test_227() {
21169         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21170         [ -z "$(which ldd)" ] && skip_env "should have ldd tool"
21171
21172         dd if=$(which date) of=$MOUNT/date bs=1k count=1
21173         chmod +x $MOUNT/date
21174
21175         $MOUNT/date > /dev/null
21176         ldd $MOUNT/date > /dev/null
21177         rm -f $MOUNT/date
21178 }
21179 run_test 227 "running truncated executable does not cause OOM"
21180
21181 # LU-1512 try to reuse idle OI blocks
21182 test_228a() {
21183         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21184         remote_mds_nodsh && skip "remote MDS with nodsh"
21185         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
21186
21187         local MDT_DEV=$(mdsdevname ${SINGLEMDS//mds/})
21188         local myDIR=$DIR/$tdir
21189
21190         mkdir -p $myDIR
21191         #define OBD_FAIL_SEQ_EXHAUST             0x1002
21192         $LCTL set_param fail_loc=0x80001002
21193         createmany -o $myDIR/t- 10000
21194         $LCTL set_param fail_loc=0
21195         # The guard is current the largest FID holder
21196         touch $myDIR/guard
21197         local SEQ=$($LFS path2fid $myDIR/guard | awk -F ':' '{print $1}' |
21198                     tr -d '[')
21199         local IDX=$(($SEQ % 64))
21200
21201         do_facet $SINGLEMDS sync
21202         # Make sure journal flushed.
21203         sleep 6
21204         local blk1=$(do_facet $SINGLEMDS \
21205                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
21206                      grep Blockcount | awk '{print $4}')
21207
21208         # Remove old files, some OI blocks will become idle.
21209         unlinkmany $myDIR/t- 10000
21210         # Create new files, idle OI blocks should be reused.
21211         createmany -o $myDIR/t- 2000
21212         do_facet $SINGLEMDS sync
21213         # Make sure journal flushed.
21214         sleep 6
21215         local blk2=$(do_facet $SINGLEMDS \
21216                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
21217                      grep Blockcount | awk '{print $4}')
21218
21219         [ $blk1 == $blk2 ] || error "old blk1=$blk1, new blk2=$blk2, unmatched!"
21220 }
21221 run_test 228a "try to reuse idle OI blocks"
21222
21223 test_228b() {
21224         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21225         remote_mds_nodsh && skip "remote MDS with nodsh"
21226         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
21227
21228         local MDT_DEV=$(mdsdevname ${SINGLEMDS//mds/})
21229         local myDIR=$DIR/$tdir
21230
21231         mkdir -p $myDIR
21232         #define OBD_FAIL_SEQ_EXHAUST             0x1002
21233         $LCTL set_param fail_loc=0x80001002
21234         createmany -o $myDIR/t- 10000
21235         $LCTL set_param fail_loc=0
21236         # The guard is current the largest FID holder
21237         touch $myDIR/guard
21238         local SEQ=$($LFS path2fid $myDIR/guard | awk -F ':' '{print $1}' |
21239                     tr -d '[')
21240         local IDX=$(($SEQ % 64))
21241
21242         do_facet $SINGLEMDS sync
21243         # Make sure journal flushed.
21244         sleep 6
21245         local blk1=$(do_facet $SINGLEMDS \
21246                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
21247                      grep Blockcount | awk '{print $4}')
21248
21249         # Remove old files, some OI blocks will become idle.
21250         unlinkmany $myDIR/t- 10000
21251
21252         # stop the MDT
21253         stop $SINGLEMDS || error "Fail to stop MDT."
21254         # remount the MDT
21255         start $SINGLEMDS $(facet_device $SINGLEMDS) $MDS_MOUNT_OPTS ||
21256                 error "Fail to start MDT."
21257
21258         client_up || error "Fail to df."
21259         # Create new files, idle OI blocks should be reused.
21260         createmany -o $myDIR/t- 2000
21261         do_facet $SINGLEMDS sync
21262         # Make sure journal flushed.
21263         sleep 6
21264         local blk2=$(do_facet $SINGLEMDS \
21265                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
21266                      grep Blockcount | awk '{print $4}')
21267
21268         [ $blk1 == $blk2 ] || error "old blk1=$blk1, new blk2=$blk2, unmatched!"
21269 }
21270 run_test 228b "idle OI blocks can be reused after MDT restart"
21271
21272 #LU-1881
21273 test_228c() {
21274         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21275         remote_mds_nodsh && skip "remote MDS with nodsh"
21276         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
21277
21278         local MDT_DEV=$(mdsdevname ${SINGLEMDS//mds/})
21279         local myDIR=$DIR/$tdir
21280
21281         mkdir -p $myDIR
21282         #define OBD_FAIL_SEQ_EXHAUST             0x1002
21283         $LCTL set_param fail_loc=0x80001002
21284         # 20000 files can guarantee there are index nodes in the OI file
21285         createmany -o $myDIR/t- 20000
21286         $LCTL set_param fail_loc=0
21287         # The guard is current the largest FID holder
21288         touch $myDIR/guard
21289         local SEQ=$($LFS path2fid $myDIR/guard | awk -F ':' '{print $1}' |
21290                     tr -d '[')
21291         local IDX=$(($SEQ % 64))
21292
21293         do_facet $SINGLEMDS sync
21294         # Make sure journal flushed.
21295         sleep 6
21296         local blk1=$(do_facet $SINGLEMDS \
21297                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
21298                      grep Blockcount | awk '{print $4}')
21299
21300         # Remove old files, some OI blocks will become idle.
21301         unlinkmany $myDIR/t- 20000
21302         rm -f $myDIR/guard
21303         # The OI file should become empty now
21304
21305         # Create new files, idle OI blocks should be reused.
21306         createmany -o $myDIR/t- 2000
21307         do_facet $SINGLEMDS sync
21308         # Make sure journal flushed.
21309         sleep 6
21310         local blk2=$(do_facet $SINGLEMDS \
21311                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
21312                      grep Blockcount | awk '{print $4}')
21313
21314         [ $blk1 == $blk2 ] || error "old blk1=$blk1, new blk2=$blk2, unmatched!"
21315 }
21316 run_test 228c "NOT shrink the last entry in OI index node to recycle idle leaf"
21317
21318 test_229() { # LU-2482, LU-3448
21319         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21320         [ $OSTCOUNT -lt 2 ] && skip_env "needs >= 2 OSTs"
21321         [ $MDS1_VERSION -lt $(version_code 2.4.53) ] &&
21322                 skip "No HSM $(lustre_build_version $SINGLEMDS) MDS < 2.4.53"
21323
21324         rm -f $DIR/$tfile
21325
21326         # Create a file with a released layout and stripe count 2.
21327         $MULTIOP $DIR/$tfile H2c ||
21328                 error "failed to create file with released layout"
21329
21330         $LFS getstripe -v $DIR/$tfile
21331
21332         local pattern=$($LFS getstripe -L $DIR/$tfile)
21333         [ X"$pattern" = X"released" ] || error "pattern error ($pattern)"
21334
21335         local stripe_count=$($LFS getstripe -c $DIR/$tfile) ||
21336                 error "getstripe"
21337         [ $stripe_count -eq 2 ] || error "stripe count not 2 ($stripe_count)"
21338         stat $DIR/$tfile || error "failed to stat released file"
21339
21340         chown $RUNAS_ID $DIR/$tfile ||
21341                 error "chown $RUNAS_ID $DIR/$tfile failed"
21342
21343         chgrp $RUNAS_ID $DIR/$tfile ||
21344                 error "chgrp $RUNAS_ID $DIR/$tfile failed"
21345
21346         touch $DIR/$tfile || error "touch $DIR/$tfile failed"
21347         rm $DIR/$tfile || error "failed to remove released file"
21348 }
21349 run_test 229 "getstripe/stat/rm/attr changes work on released files"
21350
21351 test_230a() {
21352         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21353         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21354         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21355                 skip "Need MDS version at least 2.11.52"
21356
21357         local MDTIDX=1
21358
21359         test_mkdir $DIR/$tdir
21360         test_mkdir -i0 -c1 $DIR/$tdir/test_230_local
21361         local mdt_idx=$($LFS getstripe -m $DIR/$tdir/test_230_local)
21362         [ $mdt_idx -ne 0 ] &&
21363                 error "create local directory on wrong MDT $mdt_idx"
21364
21365         $LFS mkdir -i $MDTIDX $DIR/$tdir/test_230 ||
21366                         error "create remote directory failed"
21367         local mdt_idx=$($LFS getstripe -m $DIR/$tdir/test_230)
21368         [ $mdt_idx -ne $MDTIDX ] &&
21369                 error "create remote directory on wrong MDT $mdt_idx"
21370
21371         createmany -o $DIR/$tdir/test_230/t- 10 ||
21372                 error "create files on remote directory failed"
21373         mdt_idx=$($LFS getstripe -m $DIR/$tdir/test_230/t-0)
21374         [ $mdt_idx -ne $MDTIDX ] && error "create files on wrong MDT $mdt_idx"
21375         rm -r $DIR/$tdir || error "unlink remote directory failed"
21376 }
21377 run_test 230a "Create remote directory and files under the remote directory"
21378
21379 test_230b() {
21380         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21381         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21382         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21383                 skip "Need MDS version at least 2.11.52"
21384
21385         local MDTIDX=1
21386         local mdt_index
21387         local i
21388         local file
21389         local pid
21390         local stripe_count
21391         local migrate_dir=$DIR/$tdir/migrate_dir
21392         local other_dir=$DIR/$tdir/other_dir
21393
21394         test_mkdir $DIR/$tdir
21395         test_mkdir -i0 -c1 $migrate_dir
21396         test_mkdir -i0 -c1 $other_dir
21397         for ((i=0; i<10; i++)); do
21398                 mkdir -p $migrate_dir/dir_${i}
21399                 createmany -o $migrate_dir/dir_${i}/f 10 ||
21400                         error "create files under remote dir failed $i"
21401         done
21402
21403         cp /etc/passwd $migrate_dir/$tfile
21404         cp /etc/passwd $other_dir/$tfile
21405         chattr +SAD $migrate_dir
21406         chattr +SAD $migrate_dir/$tfile
21407
21408         local old_dir_flag=$(lsattr -a $migrate_dir | awk '/\/\.$/ {print $1}')
21409         local old_file_flag=$(lsattr $migrate_dir/$tfile | awk '{print $1}')
21410         local old_dir_mode=$(stat -c%f $migrate_dir)
21411         local old_file_mode=$(stat -c%f $migrate_dir/$tfile)
21412
21413         mkdir -p $migrate_dir/dir_default_stripe2
21414         $LFS setstripe -c 2 $migrate_dir/dir_default_stripe2
21415         $LFS setstripe -c 2 $migrate_dir/${tfile}_stripe2
21416
21417         mkdir -p $other_dir
21418         ln $migrate_dir/$tfile $other_dir/luna
21419         ln $migrate_dir/$tfile $migrate_dir/sofia
21420         ln $other_dir/$tfile $migrate_dir/david
21421         ln -s $migrate_dir/$tfile $other_dir/zachary
21422         ln -s $migrate_dir/$tfile $migrate_dir/${tfile}_ln
21423         ln -s $other_dir/$tfile $migrate_dir/${tfile}_ln_other
21424
21425         local len
21426         local lnktgt
21427
21428         # inline symlink
21429         for len in 58 59 60; do
21430                 lnktgt=$(str_repeat 'l' $len)
21431                 touch $migrate_dir/$lnktgt
21432                 ln -s $lnktgt $migrate_dir/${len}char_ln
21433         done
21434
21435         # PATH_MAX
21436         for len in 4094 4095; do
21437                 lnktgt=$(str_repeat 'l' $len)
21438                 ln -s $lnktgt $migrate_dir/${len}char_ln
21439         done
21440
21441         # NAME_MAX
21442         for len in 254 255; do
21443                 touch $migrate_dir/$(str_repeat 'l' $len)
21444         done
21445
21446         $LFS migrate -m $MDTIDX $migrate_dir ||
21447                 error "fails on migrating remote dir to MDT1"
21448
21449         echo "migratate to MDT1, then checking.."
21450         for ((i = 0; i < 10; i++)); do
21451                 for file in $(find $migrate_dir/dir_${i}); do
21452                         mdt_index=$($LFS getstripe -m $file)
21453                         # broken symlink getstripe will fail
21454                         [ $mdt_index -ne $MDTIDX ] && stat -L $file &&
21455                                 error "$file is not on MDT${MDTIDX}"
21456                 done
21457         done
21458
21459         # the multiple link file should still in MDT0
21460         mdt_index=$($LFS getstripe -m $migrate_dir/$tfile)
21461         [ $mdt_index == 0 ] ||
21462                 error "$file is not on MDT${MDTIDX}"
21463
21464         local new_dir_flag=$(lsattr -a $migrate_dir | awk '/\/\.$/ {print $1}')
21465         [ "$old_dir_flag" = "$new_dir_flag" ] ||
21466                 error " expect $old_dir_flag get $new_dir_flag"
21467
21468         local new_file_flag=$(lsattr $migrate_dir/$tfile | awk '{print $1}')
21469         [ "$old_file_flag" = "$new_file_flag" ] ||
21470                 error " expect $old_file_flag get $new_file_flag"
21471
21472         local new_dir_mode=$(stat -c%f $migrate_dir)
21473         [ "$old_dir_mode" = "$new_dir_mode" ] ||
21474                 error "expect mode $old_dir_mode get $new_dir_mode"
21475
21476         local new_file_mode=$(stat -c%f $migrate_dir/$tfile)
21477         [ "$old_file_mode" = "$new_file_mode" ] ||
21478                 error "expect mode $old_file_mode get $new_file_mode"
21479
21480         diff /etc/passwd $migrate_dir/$tfile ||
21481                 error "$tfile different after migration"
21482
21483         diff /etc/passwd $other_dir/luna ||
21484                 error "luna different after migration"
21485
21486         diff /etc/passwd $migrate_dir/sofia ||
21487                 error "sofia different after migration"
21488
21489         diff /etc/passwd $migrate_dir/david ||
21490                 error "david different after migration"
21491
21492         diff /etc/passwd $other_dir/zachary ||
21493                 error "zachary different after migration"
21494
21495         diff /etc/passwd $migrate_dir/${tfile}_ln ||
21496                 error "${tfile}_ln different after migration"
21497
21498         diff /etc/passwd $migrate_dir/${tfile}_ln_other ||
21499                 error "${tfile}_ln_other different after migration"
21500
21501         stripe_count=$($LFS getstripe -c $migrate_dir/dir_default_stripe2)
21502         [ $stripe_count = 2 ] ||
21503                 error "dir strpe_count $d != 2 after migration."
21504
21505         stripe_count=$($LFS getstripe -c $migrate_dir/${tfile}_stripe2)
21506         [ $stripe_count = 2 ] ||
21507                 error "file strpe_count $d != 2 after migration."
21508
21509         #migrate back to MDT0
21510         MDTIDX=0
21511
21512         $LFS migrate -m $MDTIDX $migrate_dir ||
21513                 error "fails on migrating remote dir to MDT0"
21514
21515         echo "migrate back to MDT0, checking.."
21516         for file in $(find $migrate_dir); do
21517                 mdt_index=$($LFS getstripe -m $file)
21518                 [ $mdt_index -ne $MDTIDX ] && stat -L $file &&
21519                         error "$file is not on MDT${MDTIDX}"
21520         done
21521
21522         local new_dir_flag=$(lsattr -a $migrate_dir | awk '/\/\.$/ {print $1}')
21523         [ "$old_dir_flag" = "$new_dir_flag" ] ||
21524                 error " expect $old_dir_flag get $new_dir_flag"
21525
21526         local new_file_flag=$(lsattr $migrate_dir/$tfile | awk '{print $1}')
21527         [ "$old_file_flag" = "$new_file_flag" ] ||
21528                 error " expect $old_file_flag get $new_file_flag"
21529
21530         local new_dir_mode=$(stat -c%f $migrate_dir)
21531         [ "$old_dir_mode" = "$new_dir_mode" ] ||
21532                 error "expect mode $old_dir_mode get $new_dir_mode"
21533
21534         local new_file_mode=$(stat -c%f $migrate_dir/$tfile)
21535         [ "$old_file_mode" = "$new_file_mode" ] ||
21536                 error "expect mode $old_file_mode get $new_file_mode"
21537
21538         diff /etc/passwd ${migrate_dir}/$tfile ||
21539                 error "$tfile different after migration"
21540
21541         diff /etc/passwd ${other_dir}/luna ||
21542                 error "luna different after migration"
21543
21544         diff /etc/passwd ${migrate_dir}/sofia ||
21545                 error "sofia different after migration"
21546
21547         diff /etc/passwd ${other_dir}/zachary ||
21548                 error "zachary different after migration"
21549
21550         diff /etc/passwd $migrate_dir/${tfile}_ln ||
21551                 error "${tfile}_ln different after migration"
21552
21553         diff /etc/passwd $migrate_dir/${tfile}_ln_other ||
21554                 error "${tfile}_ln_other different after migration"
21555
21556         stripe_count=$($LFS getstripe -c ${migrate_dir}/dir_default_stripe2)
21557         [ $stripe_count = 2 ] ||
21558                 error "dir strpe_count $d != 2 after migration."
21559
21560         stripe_count=$($LFS getstripe -c ${migrate_dir}/${tfile}_stripe2)
21561         [ $stripe_count = 2 ] ||
21562                 error "file strpe_count $d != 2 after migration."
21563
21564         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21565 }
21566 run_test 230b "migrate directory"
21567
21568 test_230c() {
21569         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21570         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21571         remote_mds_nodsh && skip "remote MDS with nodsh"
21572         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21573                 skip "Need MDS version at least 2.11.52"
21574
21575         local MDTIDX=1
21576         local total=3
21577         local mdt_index
21578         local file
21579         local migrate_dir=$DIR/$tdir/migrate_dir
21580
21581         #If migrating directory fails in the middle, all entries of
21582         #the directory is still accessiable.
21583         test_mkdir $DIR/$tdir
21584         test_mkdir -i0 -c1 $migrate_dir
21585         test_mkdir -i1 -c1 $DIR/$tdir/remote_dir
21586         stat $migrate_dir
21587         createmany -o $migrate_dir/f $total ||
21588                 error "create files under ${migrate_dir} failed"
21589
21590         # fail after migrating top dir, and this will fail only once, so the
21591         # first sub file migration will fail (currently f3), others succeed.
21592         #OBD_FAIL_MIGRATE_ENTRIES       0x1801
21593         do_facet mds1 lctl set_param fail_loc=0x1801
21594         local t=$(ls $migrate_dir | wc -l)
21595         $LFS migrate --mdt-index $MDTIDX $migrate_dir &&
21596                 error "migrate should fail"
21597         local u=$(ls $migrate_dir | wc -l)
21598         [ "$u" == "$t" ] || error "$u != $t during migration"
21599
21600         # add new dir/file should succeed
21601         mkdir $migrate_dir/dir ||
21602                 error "mkdir failed under migrating directory"
21603         touch $migrate_dir/file ||
21604                 error "create file failed under migrating directory"
21605
21606         # add file with existing name should fail
21607         for file in $migrate_dir/f*; do
21608                 stat $file > /dev/null || error "stat $file failed"
21609                 $OPENFILE -f O_CREAT:O_EXCL $file &&
21610                         error "open(O_CREAT|O_EXCL) $file should fail"
21611                 $MULTIOP $file m && error "create $file should fail"
21612                 touch $DIR/$tdir/remote_dir/$tfile ||
21613                         error "touch $tfile failed"
21614                 ln $DIR/$tdir/remote_dir/$tfile $file &&
21615                         error "link $file should fail"
21616                 mdt_index=$($LFS getstripe -m $file)
21617                 if [ $mdt_index == 0 ]; then
21618                         # file failed to migrate is not allowed to rename to
21619                         mv $DIR/$tdir/remote_dir/$tfile $file &&
21620                                 error "rename to $file should fail"
21621                 else
21622                         mv $DIR/$tdir/remote_dir/$tfile $file ||
21623                                 error "rename to $file failed"
21624                 fi
21625                 echo hello >> $file || error "write $file failed"
21626         done
21627
21628         # resume migration with different options should fail
21629         $LFS migrate -m 0 $migrate_dir &&
21630                 error "migrate -m 0 $migrate_dir should fail"
21631
21632         $LFS migrate -m $MDTIDX -c 2 $migrate_dir &&
21633                 error "migrate -c 2 $migrate_dir should fail"
21634
21635         # resume migration should succeed
21636         $LFS migrate -m $MDTIDX $migrate_dir ||
21637                 error "migrate $migrate_dir failed"
21638
21639         echo "Finish migration, then checking.."
21640         for file in $(find $migrate_dir); do
21641                 mdt_index=$($LFS getstripe -m $file)
21642                 [ $mdt_index == $MDTIDX ] ||
21643                         error "$file is not on MDT${MDTIDX}"
21644         done
21645
21646         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21647 }
21648 run_test 230c "check directory accessiblity if migration failed"
21649
21650 test_230d() {
21651         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21652         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21653         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21654                 skip "Need MDS version at least 2.11.52"
21655         # LU-11235
21656         [ "$mds1_FSTYPE" == "zfs" ] && skip "skip ZFS backend"
21657
21658         local migrate_dir=$DIR/$tdir/migrate_dir
21659         local old_index
21660         local new_index
21661         local old_count
21662         local new_count
21663         local new_hash
21664         local mdt_index
21665         local i
21666         local j
21667
21668         old_index=$((RANDOM % MDSCOUNT))
21669         old_count=$((MDSCOUNT - old_index))
21670         new_index=$((RANDOM % MDSCOUNT))
21671         new_count=$((MDSCOUNT - new_index))
21672         new_hash=1 # for all_char
21673
21674         [ $old_count -gt 1 ] && old_count=$((old_count - RANDOM % old_count))
21675         [ $new_count -gt 1 ] && new_count=$((new_count - RANDOM % new_count))
21676
21677         test_mkdir $DIR/$tdir
21678         test_mkdir -i $old_index -c $old_count $migrate_dir
21679
21680         for ((i=0; i<100; i++)); do
21681                 test_mkdir -i0 -c1 $migrate_dir/dir_${i}
21682                 createmany -o $migrate_dir/dir_${i}/f 100 ||
21683                         error "create files under remote dir failed $i"
21684         done
21685
21686         echo -n "Migrate from MDT$old_index "
21687         [ $old_count -gt 1 ] && echo -n "... MDT$((old_index + old_count - 1)) "
21688         echo -n "to MDT$new_index"
21689         [ $new_count -gt 1 ] && echo -n " ... MDT$((new_index + new_count - 1))"
21690         echo
21691
21692         echo "$LFS migrate -m$new_index -c$new_count -H $new_hash $migrate_dir"
21693         $LFS migrate -m $new_index -c $new_count -H $new_hash $migrate_dir ||
21694                 error "migrate remote dir error"
21695
21696         echo "Finish migration, then checking.."
21697         for file in $(find $migrate_dir -maxdepth 1); do
21698                 mdt_index=$($LFS getstripe -m $file)
21699                 if [ $mdt_index -lt $new_index ] ||
21700                    [ $mdt_index -gt $((new_index + new_count - 1)) ]; then
21701                         error "$file is on MDT$mdt_index"
21702                 fi
21703         done
21704
21705         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21706 }
21707 run_test 230d "check migrate big directory"
21708
21709 test_230e() {
21710         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21711         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21712         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21713                 skip "Need MDS version at least 2.11.52"
21714
21715         local i
21716         local j
21717         local a_fid
21718         local b_fid
21719
21720         mkdir_on_mdt0 $DIR/$tdir
21721         mkdir $DIR/$tdir/migrate_dir
21722         mkdir $DIR/$tdir/other_dir
21723         touch $DIR/$tdir/migrate_dir/a
21724         ln $DIR/$tdir/migrate_dir/a $DIR/$tdir/other_dir/b
21725         ls $DIR/$tdir/other_dir
21726
21727         $LFS migrate -m 1 $DIR/$tdir/migrate_dir ||
21728                 error "migrate dir fails"
21729
21730         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir)
21731         [ $mdt_index == 1 ] || error "migrate_dir is not on MDT1"
21732
21733         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir/a)
21734         [ $mdt_index == 0 ] || error "a is not on MDT0"
21735
21736         $LFS migrate -m 1 $DIR/$tdir/other_dir ||
21737                 error "migrate dir fails"
21738
21739         mdt_index=$($LFS getstripe -m $DIR/$tdir/other_dir)
21740         [ $mdt_index == 1 ] || error "other_dir is not on MDT1"
21741
21742         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir/a)
21743         [ $mdt_index == 1 ] || error "a is not on MDT1"
21744
21745         mdt_index=$($LFS getstripe -m $DIR/$tdir/other_dir/b)
21746         [ $mdt_index == 1 ] || error "b is not on MDT1"
21747
21748         a_fid=$($LFS path2fid $DIR/$tdir/migrate_dir/a)
21749         b_fid=$($LFS path2fid $DIR/$tdir/other_dir/b)
21750
21751         [ "$a_fid" = "$b_fid" ] || error "different fid after migration"
21752
21753         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21754 }
21755 run_test 230e "migrate mulitple local link files"
21756
21757 test_230f() {
21758         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21759         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21760         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21761                 skip "Need MDS version at least 2.11.52"
21762
21763         local a_fid
21764         local ln_fid
21765
21766         mkdir -p $DIR/$tdir
21767         mkdir $DIR/$tdir/migrate_dir
21768         $LFS mkdir -i1 $DIR/$tdir/other_dir
21769         touch $DIR/$tdir/migrate_dir/a
21770         ln $DIR/$tdir/migrate_dir/a $DIR/$tdir/other_dir/ln1
21771         ln $DIR/$tdir/migrate_dir/a $DIR/$tdir/other_dir/ln2
21772         ls $DIR/$tdir/other_dir
21773
21774         # a should be migrated to MDT1, since no other links on MDT0
21775         $LFS migrate -m 1 $DIR/$tdir/migrate_dir ||
21776                 error "#1 migrate dir fails"
21777         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir)
21778         [ $mdt_index == 1 ] || error "migrate_dir is not on MDT1"
21779         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir/a)
21780         [ $mdt_index == 1 ] || error "a is not on MDT1"
21781
21782         # a should stay on MDT1, because it is a mulitple link file
21783         $LFS migrate -m 0 $DIR/$tdir/migrate_dir ||
21784                 error "#2 migrate dir fails"
21785         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir/a)
21786         [ $mdt_index == 1 ] || error "a is not on MDT1"
21787
21788         $LFS migrate -m 1 $DIR/$tdir/migrate_dir ||
21789                 error "#3 migrate dir fails"
21790
21791         a_fid=$($LFS path2fid $DIR/$tdir/migrate_dir/a)
21792         ln_fid=$($LFS path2fid $DIR/$tdir/other_dir/ln1)
21793         [ "$a_fid" = "$ln_fid" ] || error "different fid after migrate to MDT1"
21794
21795         rm -rf $DIR/$tdir/other_dir/ln1 || error "unlink ln1 fails"
21796         rm -rf $DIR/$tdir/other_dir/ln2 || error "unlink ln2 fails"
21797
21798         # a should be migrated to MDT0, since no other links on MDT1
21799         $LFS migrate -m 0 $DIR/$tdir/migrate_dir ||
21800                 error "#4 migrate dir fails"
21801         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir/a)
21802         [ $mdt_index == 0 ] || error "a is not on MDT0"
21803
21804         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21805 }
21806 run_test 230f "migrate mulitple remote link files"
21807
21808 test_230g() {
21809         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21810         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21811         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21812                 skip "Need MDS version at least 2.11.52"
21813
21814         mkdir -p $DIR/$tdir/migrate_dir
21815
21816         $LFS migrate -m 1000 $DIR/$tdir/migrate_dir &&
21817                 error "migrating dir to non-exist MDT succeeds"
21818         true
21819 }
21820 run_test 230g "migrate dir to non-exist MDT"
21821
21822 test_230h() {
21823         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21824         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21825         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21826                 skip "Need MDS version at least 2.11.52"
21827
21828         local mdt_index
21829
21830         mkdir -p $DIR/$tdir/migrate_dir
21831
21832         $LFS migrate -m1 $DIR &&
21833                 error "migrating mountpoint1 should fail"
21834
21835         $LFS migrate -m1 $DIR/$tdir/.. &&
21836                 error "migrating mountpoint2 should fail"
21837
21838         # same as mv
21839         $LFS migrate -m1 $DIR/$tdir/migrate_dir/.. &&
21840                 error "migrating $tdir/migrate_dir/.. should fail"
21841
21842         true
21843 }
21844 run_test 230h "migrate .. and root"
21845
21846 test_230i() {
21847         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21848         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21849         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21850                 skip "Need MDS version at least 2.11.52"
21851
21852         mkdir -p $DIR/$tdir/migrate_dir
21853
21854         $LFS migrate -m 1 $DIR/$tdir/migrate_dir/ ||
21855                 error "migration fails with a tailing slash"
21856
21857         $LFS migrate -m 0 $DIR/$tdir/migrate_dir// ||
21858                 error "migration fails with two tailing slashes"
21859 }
21860 run_test 230i "lfs migrate -m tolerates trailing slashes"
21861
21862 test_230j() {
21863         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
21864         [ $MDS1_VERSION -lt $(version_code 2.13.52) ] &&
21865                 skip "Need MDS version at least 2.11.52"
21866
21867         $LFS mkdir -i 0 -c 1 $DIR/$tdir || error "mkdir $tdir failed"
21868         $LFS setstripe -E 1M -L mdt $DIR/$tdir/$tfile ||
21869                 error "create $tfile failed"
21870         cat /etc/passwd > $DIR/$tdir/$tfile
21871
21872         $LFS migrate -m 1 $DIR/$tdir || error "migrate failed"
21873
21874         cmp /etc/passwd $DIR/$tdir/$tfile ||
21875                 error "DoM file mismatch after migration"
21876 }
21877 run_test 230j "DoM file data not changed after dir migration"
21878
21879 test_230k() {
21880         [ $MDSCOUNT -lt 4 ] && skip "needs >= 4 MDTs"
21881         [ $MDS1_VERSION -lt $(version_code 2.11.56) ] &&
21882                 skip "Need MDS version at least 2.11.56"
21883
21884         local total=20
21885         local files_on_starting_mdt=0
21886
21887         $LFS mkdir -i -1 -c 2 $DIR/$tdir || error "mkdir failed"
21888         $LFS getdirstripe $DIR/$tdir
21889         for i in $(seq $total); do
21890                 echo $((i*i - i)) > $DIR/$tdir/$tfile.$i || error "write failed"
21891                 [[ $($LFS getstripe -m $DIR/$tdir/$tfile.$i) -eq 0 ]] &&
21892                         files_on_starting_mdt=$((files_on_starting_mdt + 1))
21893         done
21894
21895         echo "$files_on_starting_mdt files on MDT0"
21896
21897         $LFS migrate -m 1,3 $DIR/$tdir || error "migrate -m 1,3 failed"
21898         $LFS getdirstripe $DIR/$tdir
21899
21900         files_on_starting_mdt=0
21901         for i in $(seq $total); do
21902                 $(echo $((i*i - i)) | cmp $DIR/$tdir/$tfile.$i -) ||
21903                         error "file $tfile.$i mismatch after migration"
21904                 [[ $($LFS getstripe -m $DIR/$tdir/$tfile.$i) -eq 1 ]] &&
21905                         files_on_starting_mdt=$((files_on_starting_mdt + 1))
21906         done
21907
21908         echo "$files_on_starting_mdt files on MDT1 after migration"
21909         [[ $files_on_starting_mdt -eq $total ]] && error "all files on MDT1"
21910
21911         $LFS migrate -m 0 -c 2 $DIR/$tdir || error "migrate -m 0 -c 2 failed"
21912         $LFS getdirstripe $DIR/$tdir
21913
21914         files_on_starting_mdt=0
21915         for i in $(seq $total); do
21916                 $(echo $((i*i - i)) | cmp $DIR/$tdir/$tfile.$i -) ||
21917                         error "file $tfile.$i mismatch after 2nd migration"
21918                 [[ $($LFS getstripe -m $DIR/$tdir/$tfile.$i) -eq 0 ]] &&
21919                         files_on_starting_mdt=$((files_on_starting_mdt + 1))
21920         done
21921
21922         echo "$files_on_starting_mdt files on MDT0 after 2nd migration"
21923         [[ $files_on_starting_mdt -eq $total ]] && error "all files on MDT0"
21924
21925         true
21926 }
21927 run_test 230k "file data not changed after dir migration"
21928
21929 test_230l() {
21930         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
21931         [ $MDS1_VERSION -lt $(version_code 2.11.56) ] &&
21932                 skip "Need MDS version at least 2.11.56"
21933
21934         $LFS mkdir -i 0 -c 1 $DIR/$tdir || error "mkdir failed"
21935         createmany -o $DIR/$tdir/f___________________________________ 1000 ||
21936                 error "create files under remote dir failed $i"
21937         $LFS migrate -m 1 $DIR/$tdir || error "migrate failed"
21938 }
21939 run_test 230l "readdir between MDTs won't crash"
21940
21941 test_230m() {
21942         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
21943         [ $MDS1_VERSION -lt $(version_code 2.11.56) ] &&
21944                 skip "Need MDS version at least 2.11.56"
21945
21946         local MDTIDX=1
21947         local mig_dir=$DIR/$tdir/migrate_dir
21948         local longstr="aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa"
21949         local shortstr="b"
21950         local val
21951
21952         echo "Creating files and dirs with xattrs"
21953         test_mkdir $DIR/$tdir
21954         test_mkdir -i0 -c1 $mig_dir
21955         mkdir $mig_dir/dir
21956         setfattr -n user.attr1 -v $longstr $mig_dir/dir ||
21957                 error "cannot set xattr attr1 on dir"
21958         setfattr -n user.attr2 -v $shortstr $mig_dir/dir ||
21959                 error "cannot set xattr attr2 on dir"
21960         touch $mig_dir/dir/f0
21961         setfattr -n user.attr1 -v $longstr $mig_dir/dir/f0 ||
21962                 error "cannot set xattr attr1 on file"
21963         setfattr -n user.attr2 -v $shortstr $mig_dir/dir/f0 ||
21964                 error "cannot set xattr attr2 on file"
21965         sync ; sync ; echo 3 > /proc/sys/vm/drop_caches
21966         val=$(getfattr --only-values -n user.attr1 $mig_dir/dir 2>/dev/null)
21967         [ "$val" = $longstr ] || error "xattr attr1 not set properly on dir"
21968         val=$(getfattr --only-values -n user.attr2 $mig_dir/dir 2>/dev/null)
21969         [ "$val" = $shortstr ] || error "xattr attr2 not set properly on dir"
21970         val=$(getfattr --only-values -n user.attr1 $mig_dir/dir/f0 2>/dev/null)
21971         [ "$val" = $longstr ] || error "xattr attr1 not set properly on file"
21972         val=$(getfattr --only-values -n user.attr2 $mig_dir/dir/f0 2>/dev/null)
21973         [ "$val" = $shortstr ] || error "xattr attr2 not set properly on file"
21974
21975         echo "Migrating to MDT1"
21976         $LFS migrate -m $MDTIDX $mig_dir ||
21977                 error "fails on migrating dir to MDT1"
21978
21979         sync ; sync ; echo 3 > /proc/sys/vm/drop_caches
21980         echo "Checking xattrs"
21981         val=$(getfattr --only-values -n user.attr1 $mig_dir/dir 2>/dev/null)
21982         [ "$val" = $longstr ] ||
21983                 error "expecting xattr1 $longstr on dir, found $val"
21984         val=$(getfattr --only-values -n user.attr2 $mig_dir/dir 2>/dev/null)
21985         [ "$val" = $shortstr ] ||
21986                 error "expecting xattr2 $shortstr on dir, found $val"
21987         val=$(getfattr --only-values -n user.attr1 $mig_dir/dir/f0 2>/dev/null)
21988         [ "$val" = $longstr ] ||
21989                 error "expecting xattr1 $longstr on file, found $val"
21990         val=$(getfattr --only-values -n user.attr2 $mig_dir/dir/f0 2>/dev/null)
21991         [ "$val" = $shortstr ] ||
21992                 error "expecting xattr2 $shortstr on file, found $val"
21993 }
21994 run_test 230m "xattrs not changed after dir migration"
21995
21996 test_230n() {
21997         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
21998         [[ $MDS1_VERSION -ge $(version_code 2.13.53) ]] ||
21999                 skip "Need MDS version at least 2.13.53"
22000
22001         $LFS mkdir -i 0 $DIR/$tdir || error "mkdir $tdir failed"
22002         cat /etc/hosts > $DIR/$tdir/$tfile
22003         $LFS mirror extend -N1 $DIR/$tdir/$tfile || error "Mirroring failed"
22004         $LFS migrate -m 1 $DIR/$tdir || error "Migration failed"
22005
22006         cmp /etc/hosts $DIR/$tdir/$tfile ||
22007                 error "File data mismatch after migration"
22008 }
22009 run_test 230n "Dir migration with mirrored file"
22010
22011 test_230o() {
22012         [ $MDSCOUNT -ge 2 ] || skip "needs >= 2 MDTs"
22013         [ $MDS1_VERSION -ge $(version_code 2.13.52) ] ||
22014                 skip "Need MDS version at least 2.13.52"
22015
22016         local mdts=$(comma_list $(mdts_nodes))
22017         local timeout=100
22018         local restripe_status
22019         local delta
22020         local i
22021
22022         [[ $mds1_FSTYPE == zfs ]] && timeout=300
22023
22024         # in case "crush" hash type is not set
22025         do_nodes $mdts "$LCTL set_param lod.*.mdt_hash=crush"
22026
22027         restripe_status=$(do_facet mds1 $LCTL get_param -n \
22028                            mdt.*MDT0000.enable_dir_restripe)
22029         do_nodes $mdts "$LCTL set_param mdt.*.enable_dir_restripe=1"
22030         stack_trap "do_nodes $mdts $LCTL set_param \
22031                     mdt.*.enable_dir_restripe=$restripe_status"
22032
22033         mkdir $DIR/$tdir
22034         createmany -m $DIR/$tdir/f 100 ||
22035                 error "create files under remote dir failed $i"
22036         createmany -d $DIR/$tdir/d 100 ||
22037                 error "create dirs under remote dir failed $i"
22038
22039         for i in $(seq 2 $MDSCOUNT); do
22040                 do_nodes $mdts "$LCTL set_param mdt.*.md_stats=clear >/dev/null"
22041                 $LFS setdirstripe -c $i $DIR/$tdir ||
22042                         error "split -c $i $tdir failed"
22043                 wait_update $HOSTNAME \
22044                         "$LFS getdirstripe -H $DIR/$tdir" "crush" $timeout ||
22045                         error "dir split not finished"
22046                 delta=$(do_nodes $mdts "lctl get_param -n mdt.*MDT*.md_stats" |
22047                         awk '/migrate/ {sum += $2} END { print sum }')
22048                 echo "$delta migrated when dir split $((i - 1)) to $i stripes"
22049                 # delta is around total_files/stripe_count
22050                 (( $delta < 200 / (i - 1) + 4 )) ||
22051                         error "$delta files migrated >= $((200 / (i - 1) + 4))"
22052         done
22053 }
22054 run_test 230o "dir split"
22055
22056 test_230p() {
22057         (( MDSCOUNT > 1 )) || skip "needs >= 2 MDTs"
22058         (( MDS1_VERSION >= $(version_code 2.13.52) )) ||
22059                 skip "Need MDS version at least 2.13.52"
22060
22061         local mdts=$(comma_list $(mdts_nodes))
22062         local timeout=100
22063         local restripe_status
22064         local delta
22065         local c
22066
22067         [[ $mds1_FSTYPE == zfs ]] && timeout=300
22068
22069         do_nodes $mdts "$LCTL set_param lod.*.mdt_hash=crush"
22070
22071         restripe_status=$(do_facet mds1 $LCTL get_param -n \
22072                            mdt.*MDT0000.enable_dir_restripe)
22073         do_nodes $mdts "$LCTL set_param mdt.*.enable_dir_restripe=1"
22074         stack_trap "do_nodes $mdts $LCTL set_param \
22075                     mdt.*.enable_dir_restripe=$restripe_status"
22076
22077         test_mkdir -c $MDSCOUNT -H crush $DIR/$tdir
22078         createmany -m $DIR/$tdir/f 100 ||
22079                 error "create files under remote dir failed"
22080         createmany -d $DIR/$tdir/d 100 ||
22081                 error "create dirs under remote dir failed"
22082
22083         for c in $(seq $((MDSCOUNT - 1)) -1 1); do
22084                 local mdt_hash="crush"
22085
22086                 do_nodes $mdts "$LCTL set_param mdt.*.md_stats=clear >/dev/null"
22087                 $LFS setdirstripe -c $c $DIR/$tdir ||
22088                         error "split -c $c $tdir failed"
22089                 if (( MDS1_VERSION >= $(version_code 2.14.51) )); then
22090                         mdt_hash="$mdt_hash,fixed"
22091                 elif [ $c -eq 1 ]; then
22092                         mdt_hash="none"
22093                 fi
22094                 wait_update $HOSTNAME \
22095                         "$LFS getdirstripe -H $DIR/$tdir" $mdt_hash $timeout ||
22096                         error "dir merge not finished"
22097                 delta=$(do_nodes $mdts "lctl get_param -n mdt.*MDT*.md_stats" |
22098                         awk '/migrate/ {sum += $2} END { print sum }')
22099                 echo "$delta migrated when dir merge $((c + 1)) to $c stripes"
22100                 # delta is around total_files/stripe_count
22101                 (( delta < 200 / c + 4 )) ||
22102                         error "$delta files migrated >= $((200 / c + 4))"
22103         done
22104 }
22105 run_test 230p "dir merge"
22106
22107 test_230q() {
22108         (( MDSCOUNT > 1)) || skip "needs >= 2 MDTs"
22109         (( MDS1_VERSION >= $(version_code 2.13.52) )) ||
22110                 skip "Need MDS version at least 2.13.52"
22111
22112         local mdts=$(comma_list $(mdts_nodes))
22113         local saved_threshold=$(do_facet mds1 \
22114                         $LCTL get_param -n mdt.*-MDT0000.dir_split_count)
22115         local saved_delta=$(do_facet mds1 \
22116                         $LCTL get_param -n mdt.*-MDT0000.dir_split_delta)
22117         local threshold=100
22118         local delta=2
22119         local total=0
22120         local stripe_count=0
22121         local stripe_index
22122         local nr_files
22123         local create
22124
22125         # test with fewer files on ZFS
22126         [ "$mds1_FSTYPE" == "zfs" ] && threshold=40
22127
22128         stack_trap "do_nodes $mdts $LCTL set_param \
22129                     mdt.*.dir_split_count=$saved_threshold"
22130         stack_trap "do_nodes $mdts $LCTL set_param \
22131                     mdt.*.dir_split_delta=$saved_delta"
22132         stack_trap "do_nodes $mdts $LCTL set_param mdt.*.dir_restripe_nsonly=1"
22133         do_nodes $mdts "$LCTL set_param mdt.*.enable_dir_auto_split=1"
22134         do_nodes $mdts "$LCTL set_param mdt.*.dir_split_count=$threshold"
22135         do_nodes $mdts "$LCTL set_param mdt.*.dir_split_delta=$delta"
22136         do_nodes $mdts "$LCTL set_param mdt.*.dir_restripe_nsonly=0"
22137         do_nodes $mdts "$LCTL set_param lod.*.mdt_hash=crush"
22138
22139         $LFS mkdir -i -1 -c 1 $DIR/$tdir || error "mkdir $tdir failed"
22140         stripe_index=$($LFS getdirstripe -i $DIR/$tdir)
22141
22142         create=$((threshold * 3 / 2))
22143         while [ $stripe_count -lt $MDSCOUNT ]; do
22144                 createmany -m $DIR/$tdir/f $total $create ||
22145                         error "create sub files failed"
22146                 stat $DIR/$tdir > /dev/null
22147                 total=$((total + create))
22148                 stripe_count=$((stripe_count + delta))
22149                 [ $stripe_count -gt $MDSCOUNT ] && stripe_count=$MDSCOUNT
22150
22151                 wait_update $HOSTNAME \
22152                         "$LFS getdirstripe -c $DIR/$tdir" "$stripe_count" 40 ||
22153                         error "stripe count $($LFS getdirstripe -c $DIR/$tdir) != $stripe_count"
22154
22155                 wait_update $HOSTNAME \
22156                         "$LFS getdirstripe -H $DIR/$tdir" "crush" 200 ||
22157                         error "stripe hash $($LFS getdirstripe -H $DIR/$tdir) != crush"
22158
22159                 nr_files=$($LFS find -m 1 $DIR/$tdir | grep -c -w $stripe_index)
22160                 echo "$nr_files/$total files on MDT$stripe_index after split"
22161                 # allow 10% margin of imbalance with crush hash
22162                 (( $nr_files <= $total / $stripe_count + $create / 10)) ||
22163                         error "$nr_files files on MDT$stripe_index after split"
22164
22165                 nr_files=$($LFS find -type f $DIR/$tdir | wc -l)
22166                 [ $nr_files -eq $total ] ||
22167                         error "total sub files $nr_files != $total"
22168         done
22169
22170         (( MDS1_VERSION >= $(version_code 2.14.51) )) || return 0
22171
22172         echo "fixed layout directory won't auto split"
22173         $LFS migrate -m 0 $DIR/$tdir || error "migrate $tdir failed"
22174         wait_update $HOSTNAME "$LFS getdirstripe -H $DIR/$tdir" "crush,fixed" \
22175                 10 || error "stripe hash $($LFS getdirstripe -H $DIR/$tdir)"
22176         wait_update $HOSTNAME "$LFS getdirstripe -c $DIR/$tdir" 1 10 ||
22177                 error "stripe count $($LFS getdirstripe -c $DIR/$tdir)"
22178 }
22179 run_test 230q "dir auto split"
22180
22181 test_230r() {
22182         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
22183         [[ $MDSCOUNT -ge 2 ]] || skip_env "needs >= 2 MDTs"
22184         [[ $MDS1_VERSION -ge $(version_code 2.13.54) ]] ||
22185                 skip "Need MDS version at least 2.13.54"
22186
22187         # maximum amount of local locks:
22188         # parent striped dir - 2 locks
22189         # new stripe in parent to migrate to - 1 lock
22190         # source and target - 2 locks
22191         # Total 5 locks for regular file
22192         mkdir -p $DIR/$tdir
22193         $LFS mkdir -i1 -c2 $DIR/$tdir/dir1
22194         touch $DIR/$tdir/dir1/eee
22195
22196         # create 4 hardlink for 4 more locks
22197         # Total: 9 locks > RS_MAX_LOCKS (8)
22198         $LFS mkdir -i1 -c1 $DIR/$tdir/dir2
22199         $LFS mkdir -i1 -c1 $DIR/$tdir/dir3
22200         $LFS mkdir -i1 -c1 $DIR/$tdir/dir4
22201         $LFS mkdir -i1 -c1 $DIR/$tdir/dir5
22202         ln $DIR/$tdir/dir1/eee $DIR/$tdir/dir2/eee
22203         ln $DIR/$tdir/dir1/eee $DIR/$tdir/dir3/eee
22204         ln $DIR/$tdir/dir1/eee $DIR/$tdir/dir4/eee
22205         ln $DIR/$tdir/dir1/eee $DIR/$tdir/dir5/eee
22206
22207         cancel_lru_locks mdc
22208
22209         $LFS migrate -m1 -c1 $DIR/$tdir/dir1 ||
22210                 error "migrate dir fails"
22211
22212         rm -rf $DIR/$tdir || error "rm dir failed after migration"
22213 }
22214 run_test 230r "migrate with too many local locks"
22215
22216 test_230s() {
22217         (( $MDS1_VERSION >= $(version_code 2.14.52) )) ||
22218                 skip "Need MDS version at least 2.14.52"
22219
22220         local mdts=$(comma_list $(mdts_nodes))
22221         local restripe_status=$(do_facet mds1 $LCTL get_param -n \
22222                                 mdt.*MDT0000.enable_dir_restripe)
22223
22224         stack_trap "do_nodes $mdts $LCTL set_param \
22225                     mdt.*.enable_dir_restripe=$restripe_status"
22226
22227         local st
22228         for st in 0 1; do
22229                 do_nodes $mdts "$LCTL set_param mdt.*.enable_dir_restripe=$st"
22230                 test_mkdir $DIR/$tdir
22231                 $LFS mkdir $DIR/$tdir |& grep "File exists" ||
22232                         error "$LFS mkdir should return EEXIST if target exists"
22233                 rmdir $DIR/$tdir
22234         done
22235 }
22236 run_test 230s "lfs mkdir should return -EEXIST if target exists"
22237
22238 test_230t()
22239 {
22240         [[ $MDSCOUNT -ge 2 ]] || skip_env "needs >= 2 MDTs"
22241         [[ $MDS1_VERSION -ge $(version_code 2.14.50) ]] ||
22242                 skip "Need MDS version at least 2.14.50"
22243
22244         test_mkdir $DIR/$tdir || error "mkdir $tdir failed"
22245         test_mkdir $DIR/$tdir/subdir || error "mkdir subdir failed"
22246         $LFS project -p 1 -s $DIR/$tdir ||
22247                 error "set $tdir project id failed"
22248         $LFS project -p 2 -s $DIR/$tdir/subdir ||
22249                 error "set subdir project id failed"
22250         $LFS migrate -m 1 -c $MDSCOUNT $DIR/$tdir || error "migrate failed"
22251 }
22252 run_test 230t "migrate directory with project ID set"
22253
22254 test_230u()
22255 {
22256         (( MDSCOUNT > 3 )) || skip_env "needs >= 4 MDTs"
22257         (( MDS1_VERSION >= $(version_code 2.14.53) )) ||
22258                 skip "Need MDS version at least 2.14.53"
22259
22260         local count
22261
22262         mkdir_on_mdt0 $DIR/$tdir || error "mkdir $tdir failed"
22263         mkdir $DIR/$tdir/sub{0..99} || error "mkdir sub failed"
22264         $LFS migrate -m -1 $DIR/$tdir/sub{0..99} || error "migrate sub failed"
22265         for i in $(seq 0 $((MDSCOUNT - 1))); do
22266                 count=$($LFS getstripe -m $DIR/$tdir/sub* | grep -c ^$i)
22267                 echo "$count dirs migrated to MDT$i"
22268         done
22269         count=$($LFS getstripe -m $DIR/$tdir/sub* | sort -u | wc -l)
22270         (( count >= MDSCOUNT - 1 )) || error "dirs migrated to $count MDTs"
22271 }
22272 run_test 230u "migrate directory by QOS"
22273
22274 test_230v()
22275 {
22276         (( MDSCOUNT > 3 )) || skip_env "needs >= 4 MDTs"
22277         (( MDS1_VERSION >= $(version_code 2.14.53) )) ||
22278                 skip "Need MDS version at least 2.14.53"
22279
22280         local count
22281
22282         mkdir $DIR/$tdir || error "mkdir $tdir failed"
22283         mkdir $DIR/$tdir/sub{0..99} || error "mkdir sub failed"
22284         $LFS migrate -m 0,2,1 $DIR/$tdir || error "migrate $tdir failed"
22285         for i in $(seq 0 $((MDSCOUNT - 1))); do
22286                 count=$($LFS getstripe -m $DIR/$tdir/sub* | grep -c ^$i)
22287                 echo "$count subdirs migrated to MDT$i"
22288                 (( i == 3 )) && (( count > 0 )) &&
22289                         error "subdir shouldn't be migrated to MDT3"
22290         done
22291         count=$($LFS getstripe -m $DIR/$tdir/sub* | sort -u | wc -l)
22292         (( count == 3 )) || error "dirs migrated to $count MDTs"
22293 }
22294 run_test 230v "subdir migrated to the MDT where its parent is located"
22295
22296 test_230w() {
22297         (( MDSCOUNT > 1 )) || skip "needs >= 2 MDTs"
22298         (( MDS1_VERSION >= $(version_code 2.15.0) )) ||
22299                 skip "Need MDS version at least 2.15.0"
22300
22301         mkdir -p $DIR/$tdir || error "mkdir $tdir failed"
22302         createmany -o $DIR/$tdir/f 10 || error "create files failed"
22303         createmany -d $DIR/$tdir/d 10 || error "create dirs failed"
22304
22305         $LFS migrate -m 1 -c $MDSCOUNT -d $DIR/$tdir ||
22306                 error "migrate failed"
22307
22308         (( $($LFS getdirstripe -c $DIR/$tdir) == MDSCOUNT )) ||
22309                 error "$tdir stripe count mismatch"
22310
22311         for i in $(seq 0 9); do
22312                 (( $($LFS getdirstripe -c $DIR/$tdir/d$i) == 0 )) ||
22313                         error "d$i is striped"
22314         done
22315 }
22316 run_test 230w "non-recursive mode dir migration"
22317
22318 test_230x() {
22319         (( MDSCOUNT > 1 )) || skip "needs >= 2 MDTs"
22320         (( MDS1_VERSION >= $(version_code 2.15.0) )) ||
22321                 skip "Need MDS version at least 2.15.0"
22322
22323         mkdir -p $DIR/$tdir || error "mkdir failed"
22324         createmany -d $DIR/$tdir/sub 100 || error "createmany failed"
22325
22326         local mdt_name=$(mdtname_from_index 0)
22327         local low=$(do_facet mds2 $LCTL get_param -n \
22328                 osp.*$mdt_name-osp-MDT0001.reserved_ino_low)
22329         local high=$(do_facet mds2 $LCTL get_param -n \
22330                 osp.*$mdt_name-osp-MDT0001.reserved_ino_high)
22331         local ffree=$($LFS df -i $MOUNT | awk "/$mdt_name/ { print \$4 }")
22332         local maxage=$(do_facet mds2 $LCTL get_param -n \
22333                 osp.*$mdt_name-osp-MDT0001.maxage)
22334
22335         stack_trap "do_facet mds2 $LCTL set_param -n \
22336                 osp.*$mdt_name-osp-MDT0001.reserved_ino_low=$low \
22337                 osp.*$mdt_name-osp-MDT0001.reserved_ino_high=$high" EXIT
22338         stack_trap "do_facet mds2 $LCTL set_param -n \
22339                 osp.*$mdt_name-osp-MDT0001.maxage=$maxage" EXIT
22340
22341         do_facet mds2 $LCTL set_param -n \
22342                 osp.*$mdt_name-osp-MDT0001.reserved_ino_low=$((ffree + 1))
22343         do_facet mds2 $LCTL set_param -n osp.*$mdt_name-osp-MDT0001.maxage=1
22344         sleep 4
22345         $LFS migrate -m 1 -c $MDSCOUNT $DIR/$tdir &&
22346                 error "migrate $tdir should fail"
22347
22348         do_facet mds2 $LCTL set_param -n \
22349                 osp.*$mdt_name-osp-MDT0001.reserved_ino_low=$low
22350         do_facet mds2 $LCTL set_param -n \
22351                 osp.*$mdt_name-osp-MDT0001.reserved_ino_high=$high
22352         sleep 4
22353         $LFS migrate -m 1 -c $MDSCOUNT $DIR/$tdir ||
22354                 error "migrate failed"
22355         (( $($LFS getdirstripe -c $DIR/$tdir) == $MDSCOUNT )) ||
22356                 error "$tdir stripe count mismatch"
22357 }
22358 run_test 230x "dir migration check space"
22359
22360 test_230y() {
22361         (( MDSCOUNT > 1 )) || skip "needs >= 2 MDTs"
22362         (( MDS1_VERSION >= $(version_code 2.15.55.45) )) ||
22363                 skip "Need MDS version at least 2.15.55.45"
22364
22365         local pid
22366
22367         test_mkdir -c -1 $DIR/$tdir || error "mkdir $tdir failed"
22368         $LFS getdirstripe $DIR/$tdir
22369         createmany -d $DIR/$tdir/d 100 || error "createmany failed"
22370         $LFS migrate -m 1 -c 2 $DIR/$tdir &
22371         pid=$!
22372         sleep 1
22373
22374         #OBD_FAIL_MIGRATE_BAD_HASH      0x1802
22375         do_facet mds2 lctl set_param fail_loc=0x1802
22376
22377         wait $pid
22378         do_facet mds2 lctl set_param fail_loc=0
22379         $LFS getdirstripe $DIR/$tdir
22380         unlinkmany -d $DIR/$tdir/d 100 || error "unlinkmany failed"
22381         rmdir $DIR/$tdir || error "rmdir $tdir failed"
22382 }
22383 run_test 230y "unlink dir with bad hash type"
22384
22385 test_230z() {
22386         (( MDSCOUNT > 1 )) || skip "needs >= 2 MDTs"
22387         (( MDS1_VERSION >= $(version_code 2.15.55.45) )) ||
22388                 skip "Need MDS version at least 2.15.55.45"
22389
22390         local pid
22391
22392         test_mkdir -c -1 $DIR/$tdir || error "mkdir $tdir failed"
22393         $LFS getdirstripe $DIR/$tdir
22394         createmany -d $DIR/$tdir/d 100 || error "createmany failed"
22395         $LFS migrate -m 1 -c 2 -H fnv_1a_64 $DIR/$tdir &
22396         pid=$!
22397         sleep 1
22398
22399         #OBD_FAIL_MIGRATE_BAD_HASH      0x1802
22400         do_facet mds2 lctl set_param fail_loc=0x1802
22401
22402         wait $pid
22403         do_facet mds2 lctl set_param fail_loc=0
22404         $LFS getdirstripe $DIR/$tdir
22405
22406         # resume migration
22407         $LFS migrate -m 1 -c 2 -H fnv_1a_64 $DIR/$tdir ||
22408                 error "resume migration failed"
22409         $LFS getdirstripe $DIR/$tdir
22410         [ $($LFS getdirstripe -H $DIR/$tdir) == "fnv_1a_64,fixed" ] ||
22411                 error "migration is not finished"
22412 }
22413 run_test 230z "resume dir migration with bad hash type"
22414
22415 test_231a()
22416 {
22417         # For simplicity this test assumes that max_pages_per_rpc
22418         # is the same across all OSCs
22419         local max_pages=$($LCTL get_param -n osc.*.max_pages_per_rpc | head -n1)
22420         local bulk_size=$((max_pages * PAGE_SIZE))
22421         local brw_size=$(do_facet ost1 $LCTL get_param -n obdfilter.*.brw_size |
22422                                        head -n 1)
22423
22424         mkdir -p $DIR/$tdir
22425         $LFS setstripe -S ${brw_size}M $DIR/$tdir ||
22426                 error "failed to set stripe with -S ${brw_size}M option"
22427         stack_trap "rm -rf $DIR/$tdir"
22428
22429         # clear the OSC stats
22430         $LCTL set_param osc.*.stats=0 &>/dev/null
22431         stop_writeback
22432
22433         # Client writes $bulk_size - there must be 1 rpc for $max_pages.
22434         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=$bulk_size count=1 \
22435                 oflag=direct &>/dev/null || error "dd failed"
22436
22437         sync; sleep 1; sync # just to be safe
22438         local nrpcs=$($LCTL get_param osc.*.stats |awk '/ost_write/ {print $2}')
22439         if [ x$nrpcs != "x1" ]; then
22440                 $LCTL get_param osc.*.stats
22441                 error "found $nrpcs ost_write RPCs, not 1 as expected"
22442         fi
22443
22444         start_writeback
22445         # Drop the OSC cache, otherwise we will read from it
22446         cancel_lru_locks osc
22447
22448         # clear the OSC stats
22449         $LCTL set_param osc.*.stats=0 &>/dev/null
22450
22451         # Client reads $bulk_size.
22452         dd if=$DIR/$tdir/$tfile of=/dev/null bs=$bulk_size count=1 \
22453                 iflag=direct &>/dev/null || error "dd failed"
22454
22455         nrpcs=$($LCTL get_param osc.*.stats | awk '/ost_read/ { print $2 }')
22456         if [ x$nrpcs != "x1" ]; then
22457                 $LCTL get_param osc.*.stats
22458                 error "found $nrpcs ost_read RPCs, not 1 as expected"
22459         fi
22460 }
22461 run_test 231a "checking that reading/writing of BRW RPC size results in one RPC"
22462
22463 test_231b() {
22464         mkdir -p $DIR/$tdir
22465         stack_trap "rm -rf $DIR/$tdir"
22466         local i
22467         for i in {0..1023}; do
22468                 dd if=/dev/zero of=$DIR/$tdir/$tfile conv=notrunc \
22469                         seek=$((2 * i)) bs=4096 count=1 &>/dev/null ||
22470                         error "dd of=$DIR/$tdir/$tfile seek=$((2 * i)) failed"
22471         done
22472         sync
22473 }
22474 run_test 231b "must not assert on fully utilized OST request buffer"
22475
22476 test_232a() {
22477         mkdir -p $DIR/$tdir
22478         $LFS setstripe -c1 -i0 $DIR/$tdir/$tfile
22479
22480         #define OBD_FAIL_LDLM_OST_LVB            0x31c
22481         do_facet ost1 $LCTL set_param fail_loc=0x31c
22482
22483         # ignore dd failure
22484         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=1 || true
22485         stack_trap "rm -f $DIR/$tdir/$tfile"
22486
22487         do_facet ost1 $LCTL set_param fail_loc=0
22488         umount_client $MOUNT || error "umount failed"
22489         mount_client $MOUNT || error "mount failed"
22490         stop ost1 || error "cannot stop ost1"
22491         start ost1 $(ostdevname 1) $OST_MOUNT_OPTS || error "cannot start ost1"
22492 }
22493 run_test 232a "failed lock should not block umount"
22494
22495 test_232b() {
22496         [ $MDS1_VERSION -ge $(version_code 2.10.58) ] ||
22497                 skip "Need MDS version at least 2.10.58"
22498
22499         mkdir -p $DIR/$tdir
22500         $LFS setstripe -c1 -i0 $DIR/$tdir/$tfile
22501         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=1
22502         stack_trap "rm -f $DIR/$tdir/$tfile"
22503         sync
22504         cancel_lru_locks osc
22505
22506         #define OBD_FAIL_LDLM_OST_LVB            0x31c
22507         do_facet ost1 $LCTL set_param fail_loc=0x31c
22508
22509         # ignore failure
22510         $LFS data_version $DIR/$tdir/$tfile || true
22511
22512         do_facet ost1 $LCTL set_param fail_loc=0
22513         umount_client $MOUNT || error "umount failed"
22514         mount_client $MOUNT || error "mount failed"
22515         stop ost1 || error "cannot stop ost1"
22516         start ost1 $(ostdevname 1) $OST_MOUNT_OPTS || error "cannot start ost1"
22517 }
22518 run_test 232b "failed data version lock should not block umount"
22519
22520 test_233a() {
22521         [ $MDS1_VERSION -ge $(version_code 2.3.64) ] ||
22522                 skip "Need MDS version at least 2.3.64"
22523         [ -n "$FILESET" ] && skip_env "SKIP due to FILESET set"
22524
22525         local fid=$($LFS path2fid $MOUNT)
22526
22527         stat $MOUNT/.lustre/fid/$fid > /dev/null ||
22528                 error "cannot access $MOUNT using its FID '$fid'"
22529 }
22530 run_test 233a "checking that OBF of the FS root succeeds"
22531
22532 test_233b() {
22533         [ $MDS1_VERSION -ge $(version_code 2.5.90) ] ||
22534                 skip "Need MDS version at least 2.5.90"
22535         [ -n "$FILESET" ] && skip_env "SKIP due to FILESET set"
22536
22537         local fid=$($LFS path2fid $MOUNT/.lustre)
22538
22539         stat $MOUNT/.lustre/fid/$fid > /dev/null ||
22540                 error "cannot access $MOUNT/.lustre using its FID '$fid'"
22541
22542         fid=$($LFS path2fid $MOUNT/.lustre/fid)
22543         stat $MOUNT/.lustre/fid/$fid > /dev/null ||
22544                 error "cannot access $MOUNT/.lustre/fid using its FID '$fid'"
22545 }
22546 run_test 233b "checking that OBF of the FS .lustre succeeds"
22547
22548 test_234() {
22549         local p="$TMP/sanityN-$TESTNAME.parameters"
22550         save_lustre_params client "llite.*.xattr_cache" > $p
22551         lctl set_param llite.*.xattr_cache 1 ||
22552                 skip_env "xattr cache is not supported"
22553
22554         mkdir -p $DIR/$tdir || error "mkdir failed"
22555         touch $DIR/$tdir/$tfile || error "touch failed"
22556         # OBD_FAIL_LLITE_XATTR_ENOMEM
22557         $LCTL set_param fail_loc=0x1405
22558         getfattr -n user.attr $DIR/$tdir/$tfile &&
22559                 error "getfattr should have failed with ENOMEM"
22560         $LCTL set_param fail_loc=0x0
22561         rm -rf $DIR/$tdir
22562
22563         restore_lustre_params < $p
22564         rm -f $p
22565 }
22566 run_test 234 "xattr cache should not crash on ENOMEM"
22567
22568 test_235() {
22569         [ $MDS1_VERSION -lt $(version_code 2.4.52) ] &&
22570                 skip "Need MDS version at least 2.4.52"
22571
22572         flock_deadlock $DIR/$tfile
22573         local RC=$?
22574         case $RC in
22575                 0)
22576                 ;;
22577                 124) error "process hangs on a deadlock"
22578                 ;;
22579                 *) error "error executing flock_deadlock $DIR/$tfile"
22580                 ;;
22581         esac
22582 }
22583 run_test 235 "LU-1715: flock deadlock detection does not work properly"
22584
22585 #LU-2935
22586 test_236() {
22587         check_swap_layouts_support
22588
22589         local ref1=/etc/passwd
22590         local ref2=/etc/group
22591         local file1=$DIR/$tdir/f1
22592         local file2=$DIR/$tdir/f2
22593
22594         test_mkdir -c1 $DIR/$tdir
22595         $LFS setstripe -c 1 $file1 || error "cannot setstripe on '$file1': rc = $?"
22596         cp $ref1 $file1 || error "cp $ref1 $file1 failed: rc = $?"
22597         $LFS setstripe -c 2 $file2 || error "cannot setstripe on '$file2': rc = $?"
22598         cp $ref2 $file2 || error "cp $ref2 $file2 failed: rc = $?"
22599         local fd=$(free_fd)
22600         local cmd="exec $fd<>$file2"
22601         eval $cmd
22602         rm $file2
22603         $LFS swap_layouts $file1 /proc/self/fd/${fd} ||
22604                 error "cannot swap layouts of '$file1' and /proc/self/fd/${fd}"
22605         cmd="exec $fd>&-"
22606         eval $cmd
22607         cmp $ref2 $file1 || error "content compare failed ($ref2 != $file1)"
22608
22609         #cleanup
22610         rm -rf $DIR/$tdir
22611 }
22612 run_test 236 "Layout swap on open unlinked file"
22613
22614 # LU-4659 linkea consistency
22615 test_238() {
22616         [[ $MDS1_VERSION -gt $(version_code 2.5.57) ]] ||
22617                 [[ $MDS1_VERSION -gt $(version_code 2.5.1) &&
22618                    $MDS1_VERSION -lt $(version_code 2.5.50) ]] ||
22619                 skip "Need MDS version at least 2.5.58 or 2.5.2+"
22620
22621         touch $DIR/$tfile
22622         ln $DIR/$tfile $DIR/$tfile.lnk
22623         touch $DIR/$tfile.new
22624         mv $DIR/$tfile.new $DIR/$tfile
22625         local fid1=$($LFS path2fid $DIR/$tfile)
22626         local fid2=$($LFS path2fid $DIR/$tfile.lnk)
22627         local path1=$($LFS fid2path $FSNAME "$fid1")
22628         [ $tfile == $path1 ] || error "linkea inconsistent: $tfile $fid1 $path1"
22629         local path2=$($LFS fid2path $FSNAME "$fid2")
22630         [ $tfile.lnk == $path2 ] ||
22631                 error "linkea inconsistent: $tfile.lnk $fid2 $path2!"
22632         rm -f $DIR/$tfile*
22633 }
22634 run_test 238 "Verify linkea consistency"
22635
22636 test_239A() { # was test_239
22637         [ $MDS1_VERSION -lt $(version_code 2.5.60) ] &&
22638                 skip "Need MDS version at least 2.5.60"
22639
22640         local list=$(comma_list $(mdts_nodes))
22641
22642         mkdir -p $DIR/$tdir
22643         createmany -o $DIR/$tdir/f- 5000
22644         unlinkmany $DIR/$tdir/f- 5000
22645         [ $MDS1_VERSION -gt $(version_code 2.10.4) ] &&
22646                 do_nodes $list "lctl set_param -n osp.*.force_sync=1"
22647         changes=$(do_nodes $list "lctl get_param -n osp.*MDT*.sync_changes \
22648                         osp.*MDT*.sync_in_flight" | calc_sum)
22649         [ "$changes" -eq 0 ] || error "$changes not synced"
22650 }
22651 run_test 239A "osp_sync test"
22652
22653 test_239a() { #LU-5297
22654         remote_mds_nodsh && skip "remote MDS with nodsh"
22655
22656         touch $DIR/$tfile
22657         #define OBD_FAIL_OSP_CHECK_INVALID_REC     0x2100
22658         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x2100
22659         chgrp $RUNAS_GID $DIR/$tfile
22660         wait_delete_completed
22661 }
22662 run_test 239a "process invalid osp sync record correctly"
22663
22664 test_239b() { #LU-5297
22665         remote_mds_nodsh && skip "remote MDS with nodsh"
22666
22667         touch $DIR/$tfile1
22668         #define OBD_FAIL_OSP_CHECK_ENOMEM     0x2101
22669         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x2101
22670         chgrp $RUNAS_GID $DIR/$tfile1
22671         wait_delete_completed
22672         do_facet $SINGLEMDS $LCTL set_param fail_loc=0
22673         touch $DIR/$tfile2
22674         chgrp $RUNAS_GID $DIR/$tfile2
22675         wait_delete_completed
22676 }
22677 run_test 239b "process osp sync record with ENOMEM error correctly"
22678
22679 test_240() {
22680         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
22681         remote_mds_nodsh && skip "remote MDS with nodsh"
22682
22683         mkdir -p $DIR/$tdir
22684
22685         $LFS mkdir -i 0 $DIR/$tdir/d0 ||
22686                 error "failed to mkdir $DIR/$tdir/d0 on MDT0"
22687         $LFS mkdir -i 1 $DIR/$tdir/d0/d1 ||
22688                 error "failed to mkdir $DIR/$tdir/d0/d1 on MDT1"
22689
22690         umount_client $MOUNT || error "umount failed"
22691         #define OBD_FAIL_TGT_DELAY_CONDITIONAL   0x713
22692         do_facet mds2 lctl set_param fail_loc=0x713 fail_val=1
22693         mount_client $MOUNT || error "failed to mount client"
22694
22695         echo "stat $DIR/$tdir/d0/d1, should not fail/ASSERT"
22696         stat $DIR/$tdir/d0/d1 || error "fail to stat $DIR/$tdir/d0/d1"
22697 }
22698 run_test 240 "race between ldlm enqueue and the connection RPC (no ASSERT)"
22699
22700 test_241_bio() {
22701         local count=$1
22702         local bsize=$2
22703
22704         for LOOP in $(seq $count); do
22705                 dd if=$DIR/$tfile of=/dev/null bs=$bsize count=1 2>/dev/null
22706                 cancel_lru_locks $OSC || true
22707         done
22708 }
22709
22710 test_241_dio() {
22711         local count=$1
22712         local bsize=$2
22713
22714         for LOOP in $(seq $1); do
22715                 dd if=$DIR/$tfile of=/dev/null bs=$bsize count=1 iflag=direct \
22716                         2>/dev/null
22717         done
22718 }
22719
22720 test_241a() { # was test_241
22721         local bsize=$PAGE_SIZE
22722
22723         (( bsize < 40960 )) && bsize=40960
22724         dd if=/dev/zero of=$DIR/$tfile count=1 bs=$bsize
22725         ls -la $DIR/$tfile
22726         cancel_lru_locks $OSC
22727         test_241_bio 1000 $bsize &
22728         PID=$!
22729         test_241_dio 1000 $bsize
22730         wait $PID
22731 }
22732 run_test 241a "bio vs dio"
22733
22734 test_241b() {
22735         local bsize=$PAGE_SIZE
22736
22737         (( bsize < 40960 )) && bsize=40960
22738         dd if=/dev/zero of=$DIR/$tfile count=1 bs=$bsize
22739         ls -la $DIR/$tfile
22740         test_241_dio 1000 $bsize &
22741         PID=$!
22742         test_241_dio 1000 $bsize
22743         wait $PID
22744 }
22745 run_test 241b "dio vs dio"
22746
22747 test_242() {
22748         remote_mds_nodsh && skip "remote MDS with nodsh"
22749
22750         mkdir_on_mdt0 $DIR/$tdir
22751         touch $DIR/$tdir/$tfile
22752
22753         #define OBD_FAIL_MDS_READPAGE_PACK      0x105
22754         do_facet mds1 lctl set_param fail_loc=0x105
22755         /bin/ls $DIR/$tdir && error "ls $DIR/$tdir should fail"
22756
22757         do_facet mds1 lctl set_param fail_loc=0
22758         /bin/ls $DIR/$tdir || error "ls $DIR/$tdir failed"
22759 }
22760 run_test 242 "mdt_readpage failure should not cause directory unreadable"
22761
22762 test_243()
22763 {
22764         test_mkdir $DIR/$tdir
22765         group_lock_test -d $DIR/$tdir || error "A group lock test failed"
22766 }
22767 run_test 243 "various group lock tests"
22768
22769 test_244a()
22770 {
22771         test_mkdir $DIR/$tdir
22772         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=35
22773         sendfile_grouplock $DIR/$tdir/$tfile || \
22774                 error "sendfile+grouplock failed"
22775         rm -rf $DIR/$tdir
22776 }
22777 run_test 244a "sendfile with group lock tests"
22778
22779 test_244b()
22780 {
22781         [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
22782
22783         local threads=50
22784         local size=$((1024*1024))
22785
22786         test_mkdir $DIR/$tdir
22787         for i in $(seq 1 $threads); do
22788                 local file=$DIR/$tdir/file_$((i / 10))
22789                 $MULTIOP $file OG1234w$size_$((i % 3))w$size_$((i % 4))g1234c &
22790                 local pids[$i]=$!
22791         done
22792         for i in $(seq 1 $threads); do
22793                 wait ${pids[$i]}
22794         done
22795 }
22796 run_test 244b "multi-threaded write with group lock"
22797
22798 test_245a() {
22799         local flagname="multi_mod_rpcs"
22800         local connect_data_name="max_mod_rpcs"
22801         local out
22802
22803         # check if multiple modify RPCs flag is set
22804         out=$($LCTL get_param mdc.$FSNAME-MDT0000-*.import |
22805                 grep "connect_flags:")
22806         echo "$out"
22807
22808         echo "$out" | grep -qw $flagname
22809         if [ $? -ne 0 ]; then
22810                 echo "connect flag $flagname is not set"
22811                 return
22812         fi
22813
22814         # check if multiple modify RPCs data is set
22815         out=$($LCTL get_param mdc.$FSNAME-MDT0000-*.import)
22816         echo "$out"
22817
22818         echo "$out" | grep -qw $connect_data_name ||
22819                 error "import should have connect data $connect_data_name"
22820 }
22821 run_test 245a "check mdc connection flag/data: multiple modify RPCs"
22822
22823 test_245b() {
22824         local flagname="multi_mod_rpcs"
22825         local connect_data_name="max_mod_rpcs"
22826         local out
22827
22828         remote_mds_nodsh && skip "remote MDS with nodsh"
22829         [[ $MDSCOUNT -ge 2 ]] || skip "needs >= 2 MDTs"
22830
22831         # check if multiple modify RPCs flag is set
22832         out=$(do_facet mds1 \
22833               $LCTL get_param osp.$FSNAME-MDT0001-osp-MDT0000.import |
22834               grep "connect_flags:")
22835         echo "$out"
22836
22837         [[ "$out" =~ $flagname ]] || skip "connect flag $flagname is not set"
22838
22839         # check if multiple modify RPCs data is set
22840         out=$(do_facet mds1 \
22841               $LCTL get_param osp.$FSNAME-MDT0001-osp-MDT0000.import)
22842
22843         [[ "$out" =~ $connect_data_name ]] ||
22844                 {
22845                         echo "$out"
22846                         error "missing connect data $connect_data_name"
22847                 }
22848 }
22849 run_test 245b "check osp connection flag/data: multiple modify RPCs"
22850
22851 cleanup_247() {
22852         local submount=$1
22853
22854         trap 0
22855         umount_client $submount
22856         rmdir $submount
22857 }
22858
22859 test_247a() {
22860         lctl get_param -n mdc.$FSNAME-MDT0000*.import |
22861                 grep -q subtree ||
22862                 skip_env "Fileset feature is not supported"
22863
22864         local submount=${MOUNT}_$tdir
22865
22866         mkdir $MOUNT/$tdir
22867         mkdir -p $submount || error "mkdir $submount failed"
22868         FILESET="$FILESET/$tdir" mount_client $submount ||
22869                 error "mount $submount failed"
22870         trap "cleanup_247 $submount" EXIT
22871         echo foo > $submount/$tfile || error "write $submount/$tfile failed"
22872         [ $(cat $MOUNT/$tdir/$tfile) = "foo" ] ||
22873                 error "read $MOUNT/$tdir/$tfile failed"
22874         cleanup_247 $submount
22875 }
22876 run_test 247a "mount subdir as fileset"
22877
22878 test_247b() {
22879         lctl get_param -n mdc.$FSNAME-MDT0000*.import | grep -q subtree ||
22880                 skip_env "Fileset feature is not supported"
22881
22882         local submount=${MOUNT}_$tdir
22883
22884         rm -rf $MOUNT/$tdir
22885         mkdir -p $submount || error "mkdir $submount failed"
22886         SKIP_FILESET=1
22887         FILESET="$FILESET/$tdir" mount_client $submount &&
22888                 error "mount $submount should fail"
22889         rmdir $submount
22890 }
22891 run_test 247b "mount subdir that dose not exist"
22892
22893 test_247c() {
22894         lctl get_param -n mdc.$FSNAME-MDT0000*.import | grep -q subtree ||
22895                 skip_env "Fileset feature is not supported"
22896
22897         local submount=${MOUNT}_$tdir
22898
22899         mkdir -p $MOUNT/$tdir/dir1
22900         mkdir -p $submount || error "mkdir $submount failed"
22901         trap "cleanup_247 $submount" EXIT
22902         FILESET="$FILESET/$tdir" mount_client $submount ||
22903                 error "mount $submount failed"
22904         local fid=$($LFS path2fid $MOUNT/)
22905         $LFS fid2path $submount $fid && error "fid2path should fail"
22906         cleanup_247 $submount
22907 }
22908 run_test 247c "running fid2path outside subdirectory root"
22909
22910 test_247d() {
22911         lctl get_param -n mdc.$FSNAME-MDT0000*.import | grep -q subtree ||
22912                 skip "Fileset feature is not supported"
22913
22914         local submount=${MOUNT}_$tdir
22915
22916         mkdir -p $MOUNT/$tdir/dir1
22917         mkdir -p $submount || error "mkdir $submount failed"
22918         FILESET="$FILESET/$tdir" mount_client $submount ||
22919                 error "mount $submount failed"
22920         trap "cleanup_247 $submount" EXIT
22921
22922         local td=$submount/dir1
22923         local fid=$($LFS path2fid $td)
22924         [ -z "$fid" ] && error "path2fid unable to get $td FID"
22925
22926         # check that we get the same pathname back
22927         local rootpath
22928         local found
22929         for rootpath in "$submount" "$submount///" "$submount/dir1"; do
22930                 echo "$rootpath $fid"
22931                 found=$($LFS fid2path $rootpath "$fid")
22932                 [ -n "$found" ] || error "fid2path should succeed"
22933                 [ "$found" == "$td" ] || error "fid2path $found != $td"
22934         done
22935         # check wrong root path format
22936         rootpath=$submount"_wrong"
22937         found=$($LFS fid2path $rootpath "$fid")
22938         [ -z "$found" ] || error "fid2path should fail ($rootpath != $submount)"
22939
22940         cleanup_247 $submount
22941 }
22942 run_test 247d "running fid2path inside subdirectory root"
22943
22944 # LU-8037
22945 test_247e() {
22946         lctl get_param -n mdc.$FSNAME-MDT0000*.import |
22947                 grep -q subtree ||
22948                 skip "Fileset feature is not supported"
22949
22950         local submount=${MOUNT}_$tdir
22951
22952         mkdir $MOUNT/$tdir
22953         mkdir -p $submount || error "mkdir $submount failed"
22954         FILESET="$FILESET/.." mount_client $submount &&
22955                 error "mount $submount should fail"
22956         rmdir $submount
22957 }
22958 run_test 247e "mount .. as fileset"
22959
22960 test_247f() {
22961         (( $MDSCOUNT > 1 )) || skip_env "needs >= 2 MDTs"
22962         (( $MDS1_VERSION >= $(version_code 2.14.50.162) )) ||
22963                 skip "Need at least version 2.14.50.162"
22964         lctl get_param -n mdc.$FSNAME-MDT0000*.import | grep -q subtree ||
22965                 skip "Fileset feature is not supported"
22966
22967         mkdir_on_mdt0 $DIR/$tdir || error "mkdir $tdir failed"
22968         $LFS mkdir -i $((MDSCOUNT - 1)) $DIR/$tdir/remote ||
22969                 error "mkdir remote failed"
22970         $LFS mkdir -i $((MDSCOUNT - 1)) $DIR/$tdir/remote/subdir ||
22971                 error "mkdir remote/subdir failed"
22972         $LFS mkdir -i 0 -c $MDSCOUNT $DIR/$tdir/striped ||
22973                 error "mkdir striped failed"
22974         mkdir $DIR/$tdir/striped/subdir || error "mkdir striped/subdir failed"
22975
22976         local submount=${MOUNT}_$tdir
22977
22978         mkdir -p $submount || error "mkdir $submount failed"
22979         stack_trap "rmdir $submount"
22980
22981         local dir
22982         local fileset=$FILESET
22983         local mdts=$(comma_list $(mdts_nodes))
22984
22985         do_nodes $mdts "$LCTL set_param mdt.*.enable_remote_subdir_mount=1"
22986         for dir in $tdir/remote $tdir/remote/subdir $tdir/striped \
22987                 $tdir/striped/subdir $tdir/striped/.; do
22988                 FILESET="$fileset/$dir" mount_client $submount ||
22989                         error "mount $dir failed"
22990                 umount_client $submount
22991         done
22992 }
22993 run_test 247f "mount striped or remote directory as fileset"
22994
22995 test_subdir_mount_lock()
22996 {
22997         local testdir=$1
22998         local submount=${MOUNT}_$(basename $testdir)
22999
23000         touch $DIR/$testdir/$tfile || error "touch $tfile failed"
23001
23002         mkdir -p $submount || error "mkdir $submount failed"
23003         stack_trap "rmdir $submount"
23004
23005         FILESET="$fileset/$testdir" mount_client $submount ||
23006                 error "mount $FILESET failed"
23007         stack_trap "umount $submount"
23008
23009         local mdts=$(comma_list $(mdts_nodes))
23010
23011         local nrpcs
23012
23013         stat $submount > /dev/null || error "stat $submount failed"
23014         cancel_lru_locks $MDC
23015         stat $submount > /dev/null || error "stat $submount failed"
23016         stat $submount/$tfile > /dev/null || error "stat $tfile failed"
23017         do_nodes $mdts "$LCTL set_param mdt.*.md_stats=clear > /dev/null"
23018         stat $submount/$tfile > /dev/null || error "stat $tfile failed"
23019         nrpcs=$(do_nodes $mdts "lctl get_param -n mdt.*.md_stats" |
23020                 awk '/getattr/ {sum += $2} END {print sum}')
23021
23022         [ -z "$nrpcs" ] || error "$nrpcs extra getattr sent"
23023 }
23024
23025 test_247g() {
23026         (( $MDSCOUNT > 1 )) || skip_env "needs > 1 MDTs"
23027
23028         $LFS mkdir -i 0 -c 4 -H fnv_1a_64 $DIR/$tdir ||
23029                 error "mkdir $tdir failed"
23030         test_subdir_mount_lock $tdir
23031 }
23032 run_test 247g "striped directory submount revalidate ROOT from cache"
23033
23034 test_247h() {
23035         (( $MDSCOUNT > 1 )) || skip_env "needs > 1 MDTs"
23036         (( $MDS1_VERSION >= $(version_code 2.15.51) )) ||
23037                 skip "Need MDS version at least 2.15.51"
23038
23039         $LFS mkdir -i 1 -c $MDSCOUNT $DIR/$tdir || error "mkdir $tdir failed"
23040         test_subdir_mount_lock $tdir
23041         mkdir_on_mdt -i 0 $DIR/$tdir/$tdir.0 || error "mkdir $tdir.0 failed"
23042         mkdir_on_mdt -i 1 $DIR/$tdir/$tdir.0/$tdir.1 ||
23043                 error "mkdir $tdir.1 failed"
23044         test_subdir_mount_lock $tdir/$tdir.0/$tdir.1
23045 }
23046 run_test 247h "remote directory submount revalidate ROOT from cache"
23047
23048 test_248a() {
23049         local fast_read_sav=$($LCTL get_param -n llite.*.fast_read 2>/dev/null)
23050         [ -z "$fast_read_sav" ] && skip "no fast read support"
23051
23052         # create a large file for fast read verification
23053         dd if=/dev/zero of=$DIR/$tfile bs=1M count=128 > /dev/null 2>&1
23054
23055         # make sure the file is created correctly
23056         $CHECKSTAT -s $((128*1024*1024)) $DIR/$tfile ||
23057                 { rm -f $DIR/$tfile; skip "file creation error"; }
23058
23059         echo "Test 1: verify that fast read is 4 times faster on cache read"
23060
23061         # small read with fast read enabled
23062         $LCTL set_param -n llite.*.fast_read=1
23063         local t_fast=$(dd if=$DIR/$tfile of=/dev/null bs=4k 2>&1 |
23064                 egrep -o '([[:digit:]\.\,e-]+) s' | cut -d's' -f1 |
23065                 sed -e 's/,/./' -e 's/[eE]+*/\*10\^/')
23066         # small read with fast read disabled
23067         $LCTL set_param -n llite.*.fast_read=0
23068         local t_slow=$(dd if=$DIR/$tfile of=/dev/null bs=4k 2>&1 |
23069                 egrep -o '([[:digit:]\.\,e-]+) s' | cut -d's' -f1 |
23070                 sed -e 's/,/./' -e 's/[eE]+*/\*10\^/')
23071
23072         # verify that fast read is 4 times faster for cache read
23073         [ $(bc <<< "4 * $t_fast < $t_slow") -eq 1 ] ||
23074                 error_not_in_vm "fast read was not 4 times faster: " \
23075                            "$t_fast vs $t_slow"
23076
23077         echo "Test 2: verify the performance between big and small read"
23078         $LCTL set_param -n llite.*.fast_read=1
23079
23080         # 1k non-cache read
23081         cancel_lru_locks osc
23082         local t_1k=$(dd if=$DIR/$tfile of=/dev/null bs=1k 2>&1 |
23083                 egrep -o '([[:digit:]\.\,e-]+) s' | cut -d's' -f1 |
23084                 sed -e 's/,/./' -e 's/[eE]+*/\*10\^/')
23085
23086         # 1M non-cache read
23087         cancel_lru_locks osc
23088         local t_1m=$(dd if=$DIR/$tfile of=/dev/null bs=1k 2>&1 |
23089                 egrep -o '([[:digit:]\.\,e-]+) s' | cut -d's' -f1 |
23090                 sed -e 's/,/./' -e 's/[eE]+*/\*10\^/')
23091
23092         # verify that big IO is not 4 times faster than small IO
23093         [ $(bc <<< "4 * $t_1k >= $t_1m") -eq 1 ] ||
23094                 error_not_in_vm "bigger IO is way too fast: $t_1k vs $t_1m"
23095
23096         $LCTL set_param -n llite.*.fast_read=$fast_read_sav
23097         rm -f $DIR/$tfile
23098 }
23099 run_test 248a "fast read verification"
23100
23101 test_248b() {
23102         # Default short_io_bytes=16384, try both smaller and larger sizes.
23103         # Lustre O_DIRECT read and write needs to be a multiple of PAGE_SIZE.
23104         # 6017024 = 2^12*13*113 = 47008*128 = 11752*512 = 4096*1469 = 53248*113
23105         echo "bs=53248 count=113 normal buffered write"
23106         dd if=/dev/urandom of=$TMP/$tfile.0 bs=53248 count=113 ||
23107                 error "dd of initial data file failed"
23108         stack_trap "rm -f $DIR/$tfile.[0-3] $TMP/$tfile.[0-3]" EXIT
23109
23110         echo "bs=47008 count=128 oflag=dsync normal write $tfile.0"
23111         dd if=$TMP/$tfile.0 of=$DIR/$tfile.0 bs=47008 count=128 oflag=dsync ||
23112                 error "dd with sync normal writes failed"
23113         cmp $TMP/$tfile.0 $DIR/$tfile.0 || error "compare $DIR/$tfile.0 failed"
23114
23115         echo "bs=11752 count=512 oflag=dsync small write $tfile.1"
23116         dd if=$TMP/$tfile.0 of=$DIR/$tfile.1 bs=11752 count=512 oflag=dsync ||
23117                 error "dd with sync small writes failed"
23118         cmp $TMP/$tfile.0 $DIR/$tfile.1 || error "compare $DIR/$tfile.1 failed"
23119
23120         cancel_lru_locks osc
23121
23122         # calculate the small O_DIRECT size and count for the client PAGE_SIZE
23123         local num=$((13 * 113 / (PAGE_SIZE / 4096)))
23124         echo "bs=$PAGE_SIZE count=$num iflag=direct small read $tfile.1"
23125         dd if=$DIR/$tfile.1 of=$TMP/$tfile.1 bs=$PAGE_SIZE count=$num \
23126                 iflag=direct || error "dd with O_DIRECT small read failed"
23127         # adjust bytes checked to handle larger PAGE_SIZE for ARM/PPC
23128         cmp --bytes=$((PAGE_SIZE * num)) $TMP/$tfile.0 $TMP/$tfile.1 ||
23129                 error "compare $TMP/$tfile.1 failed"
23130
23131         local save=$($LCTL get_param -n osc.*OST000*.short_io_bytes | head -n 1)
23132         stack_trap "$LCTL set_param osc.$FSNAME-*.short_io_bytes=$save" EXIT
23133
23134         # just to see what the maximum tunable value is, and test parsing
23135         echo "test invalid parameter 2MB"
23136         $LCTL set_param osc.$FSNAME-OST0000*.short_io_bytes=2M &&
23137                 error "too-large short_io_bytes allowed"
23138         echo "test maximum parameter 512KB"
23139         # if we can set a larger short_io_bytes, run test regardless of version
23140         if ! $LCTL set_param osc.$FSNAME-OST0000*.short_io_bytes=512K; then
23141                 # older clients may not allow setting it this large, that's OK
23142                 [ $CLIENT_VERSION -ge $(version_code 2.13.50) ] ||
23143                         skip "Need at least client version 2.13.50"
23144                 error "medium short_io_bytes failed"
23145         fi
23146         $LCTL get_param osc.$FSNAME-OST0000*.short_io_bytes
23147         size=$($LCTL get_param -n osc.$FSNAME-OST0000*.short_io_bytes)
23148
23149         echo "test large parameter 64KB"
23150         $LCTL set_param osc.$FSNAME-*.short_io_bytes=65536
23151         $LCTL get_param osc.$FSNAME-OST0000*.short_io_bytes
23152
23153         echo "bs=47008 count=128 oflag=dsync large write $tfile.2"
23154         dd if=$TMP/$tfile.0 of=$DIR/$tfile.2 bs=47008 count=128 oflag=dsync ||
23155                 error "dd with sync large writes failed"
23156         cmp $TMP/$tfile.0 $DIR/$tfile.2 || error "compare $DIR/$tfile.2 failed"
23157
23158         # calculate the large O_DIRECT size and count for the client PAGE_SIZE
23159         local size=$(((4096 * 13 + PAGE_SIZE - 1) / PAGE_SIZE * PAGE_SIZE))
23160         num=$((113 * 4096 / PAGE_SIZE))
23161         echo "bs=$size count=$num oflag=direct large write $tfile.3"
23162         dd if=$TMP/$tfile.0 of=$DIR/$tfile.3 bs=$size count=$num oflag=direct ||
23163                 error "dd with O_DIRECT large writes failed"
23164         cmp --bytes=$((size * num)) $TMP/$tfile.0 $DIR/$tfile.3 ||
23165                 error "compare $DIR/$tfile.3 failed"
23166
23167         cancel_lru_locks osc
23168
23169         echo "bs=$size count=$num iflag=direct large read $tfile.2"
23170         dd if=$DIR/$tfile.2 of=$TMP/$tfile.2 bs=$size count=$num iflag=direct ||
23171                 error "dd with O_DIRECT large read failed"
23172         cmp --bytes=$((size * num)) $TMP/$tfile.0 $TMP/$tfile.2 ||
23173                 error "compare $TMP/$tfile.2 failed"
23174
23175         echo "bs=$size count=$num iflag=direct large read $tfile.3"
23176         dd if=$DIR/$tfile.3 of=$TMP/$tfile.3 bs=$size count=$num iflag=direct ||
23177                 error "dd with O_DIRECT large read failed"
23178         cmp --bytes=$((size * num)) $TMP/$tfile.0 $TMP/$tfile.3 ||
23179                 error "compare $TMP/$tfile.3 failed"
23180 }
23181 run_test 248b "test short_io read and write for both small and large sizes"
23182
23183 test_249() { # LU-7890
23184         [ $MDS1_VERSION -lt $(version_code 2.8.53) ] &&
23185                 skip "Need at least version 2.8.54"
23186
23187         rm -f $DIR/$tfile
23188         $LFS setstripe -c 1 $DIR/$tfile
23189         # Offset 2T == 4k * 512M
23190         dd if=/dev/zero of=$DIR/$tfile bs=4k count=1 seek=512M ||
23191                 error "dd to 2T offset failed"
23192 }
23193 run_test 249 "Write above 2T file size"
23194
23195 test_250() {
23196         [ "$(facet_fstype ost$(($($LFS getstripe -i $DIR/$tfile) + 1)))" = "zfs" ] \
23197          && skip "no 16TB file size limit on ZFS"
23198
23199         $LFS setstripe -c 1 $DIR/$tfile
23200         # ldiskfs extent file size limit is (16TB - 4KB - 1) bytes
23201         local size=$((16 * 1024 * 1024 * 1024 * 1024 - 4096 - 1))
23202         $TRUNCATE $DIR/$tfile $size || error "truncate $tfile to $size failed"
23203         dd if=/dev/zero of=$DIR/$tfile bs=10 count=1 oflag=append \
23204                 conv=notrunc,fsync && error "append succeeded"
23205         return 0
23206 }
23207 run_test 250 "Write above 16T limit"
23208
23209 test_251() {
23210         $LFS setstripe -c -1 -S 1048576 $DIR/$tfile
23211
23212         #define OBD_FAIL_LLITE_LOST_LAYOUT 0x1407
23213         #Skip once - writing the first stripe will succeed
23214         $LCTL set_param fail_loc=0xa0001407 fail_val=1
23215         $MULTIOP $DIR/$tfile o:O_RDWR:w2097152c 2>&1 | grep -q "short write" &&
23216                 error "short write happened"
23217
23218         $LCTL set_param fail_loc=0xa0001407 fail_val=1
23219         $MULTIOP $DIR/$tfile or2097152c 2>&1 | grep -q "short read" &&
23220                 error "short read happened"
23221
23222         rm -f $DIR/$tfile
23223 }
23224 run_test 251 "Handling short read and write correctly"
23225
23226 test_252() {
23227         remote_mds_nodsh && skip "remote MDS with nodsh"
23228         remote_ost_nodsh && skip "remote OST with nodsh"
23229         if [ "$ost1_FSTYPE" != ldiskfs ] || [ "$mds1_FSTYPE" != ldiskfs ]; then
23230                 skip_env "ldiskfs only test"
23231         fi
23232
23233         local tgt
23234         local dev
23235         local out
23236         local uuid
23237         local num
23238         local gen
23239
23240         # check lr_reader on OST0000
23241         tgt=ost1
23242         dev=$(facet_device $tgt)
23243         out=$(do_facet $tgt $LR_READER $dev)
23244         [ $? -eq 0 ] || error "$LR_READER failed on target $tgt device $dev"
23245         echo "$out"
23246         uuid=$(echo "$out" | grep -i uuid | awk '{ print $2 }')
23247         [ "$uuid" == "$(ostuuid_from_index 0)" ] ||
23248                 error "Invalid uuid returned by $LR_READER on target $tgt"
23249         echo -e "uuid returned by $LR_READER is '$uuid'\n"
23250
23251         # check lr_reader -c on MDT0000
23252         tgt=mds1
23253         dev=$(facet_device $tgt)
23254         if ! do_facet $tgt $LR_READER -h | grep -q OPTIONS; then
23255                 skip "$LR_READER does not support additional options"
23256         fi
23257         out=$(do_facet $tgt $LR_READER -c $dev)
23258         [ $? -eq 0 ] || error "$LR_READER failed on target $tgt device $dev"
23259         echo "$out"
23260         num=$(echo "$out" | grep -c "mdtlov")
23261         [ "$num" -eq $((MDSCOUNT - 1)) ] ||
23262                 error "Invalid number of mdtlov clients returned by $LR_READER"
23263         echo -e "Number of mdtlov clients returned by $LR_READER is '$num'\n"
23264
23265         # check lr_reader -cr on MDT0000
23266         out=$(do_facet $tgt $LR_READER -cr $dev)
23267         [ $? -eq 0 ] || error "$LR_READER failed on target $tgt device $dev"
23268         echo "$out"
23269         echo "$out" | grep -q "^reply_data:$" ||
23270                 error "$LR_READER should have returned 'reply_data' section"
23271         num=$(echo "$out" | grep -c "client_generation")
23272         echo -e "Number of reply data returned by $LR_READER is '$num'\n"
23273 }
23274 run_test 252 "check lr_reader tool"
23275
23276 test_253() {
23277         [ $PARALLEL == "yes" ] && skip "skip parallel run"
23278         remote_mds_nodsh && skip "remote MDS with nodsh"
23279         remote_mgs_nodsh && skip "remote MGS with nodsh"
23280
23281         local ostidx=0
23282         local rc=0
23283         local ost_name=$(ostname_from_index $ostidx)
23284
23285         # on the mdt's osc
23286         local mdtosc_proc1=$(get_mdtosc_proc_path $SINGLEMDS $ost_name)
23287         do_facet $SINGLEMDS $LCTL get_param -n \
23288                 osp.$mdtosc_proc1.reserved_mb_high ||
23289                 skip  "remote MDS does not support reserved_mb_high"
23290
23291         rm -rf $DIR/$tdir
23292         wait_mds_ost_sync
23293         wait_delete_completed
23294         mkdir $DIR/$tdir
23295         stack_trap "rm -rf $DIR/$tdir"
23296
23297         pool_add $TESTNAME || error "Pool creation failed"
23298         pool_add_targets $TESTNAME 0 || error "Pool add targets failed"
23299
23300         $LFS setstripe $DIR/$tdir -i $ostidx -c 1 -p $FSNAME.$TESTNAME ||
23301                 error "Setstripe failed"
23302
23303         dd if=/dev/zero of=$DIR/$tdir/$tfile.0 bs=1M count=10
23304
23305         local wms=$(ost_watermarks_set_enospc $tfile $ostidx |
23306                     grep "watermarks")
23307         stack_trap "ost_watermarks_clear_enospc $tfile $ostidx $wms" EXIT
23308
23309         local oa_status=$(do_facet $SINGLEMDS $LCTL get_param -n \
23310                         osp.$mdtosc_proc1.prealloc_status)
23311         echo "prealloc_status $oa_status"
23312
23313         dd if=/dev/zero of=$DIR/$tdir/$tfile.1 bs=1M count=1 &&
23314                 error "File creation should fail"
23315
23316         #object allocation was stopped, but we still able to append files
23317         dd if=/dev/zero of=$DIR/$tdir/$tfile.0 bs=1M seek=6 count=5 \
23318                 oflag=append || error "Append failed"
23319
23320         rm -f $DIR/$tdir/$tfile.0
23321
23322         # For this test, we want to delete the files we created to go out of
23323         # space but leave the watermark, so we remain nearly out of space
23324         ost_watermarks_enospc_delete_files $tfile $ostidx
23325
23326         wait_delete_completed
23327
23328         sleep_maxage
23329
23330         for i in $(seq 10 12); do
23331                 dd if=/dev/zero of=$DIR/$tdir/$tfile.$i bs=1M count=1 \
23332                         2>/dev/null || error "File creation failed after rm"
23333         done
23334
23335         oa_status=$(do_facet $SINGLEMDS $LCTL get_param -n \
23336                         osp.$mdtosc_proc1.prealloc_status)
23337         echo "prealloc_status $oa_status"
23338
23339         if (( oa_status != 0 )); then
23340                 error "Object allocation still disable after rm"
23341         fi
23342 }
23343 run_test 253 "Check object allocation limit"
23344
23345 test_254() {
23346         [ $PARALLEL == "yes" ] && skip "skip parallel run"
23347         remote_mds_nodsh && skip "remote MDS with nodsh"
23348
23349         local mdt=$(facet_svc $SINGLEMDS)
23350
23351         do_facet $SINGLEMDS $LCTL get_param -n mdd.$mdt.changelog_size ||
23352                 skip "MDS does not support changelog_size"
23353
23354         local cl_user
23355
23356         changelog_register || error "changelog_register failed"
23357
23358         changelog_clear 0 || error "changelog_clear failed"
23359
23360         local size1=$(do_facet $SINGLEMDS \
23361                       $LCTL get_param -n mdd.$mdt.changelog_size)
23362         echo "Changelog size $size1"
23363
23364         rm -rf $DIR/$tdir
23365         $LFS mkdir -i 0 $DIR/$tdir
23366         # change something
23367         mkdir -p $DIR/$tdir/pics/2008/zachy
23368         touch $DIR/$tdir/pics/2008/zachy/timestamp
23369         cp /etc/hosts $DIR/$tdir/pics/2008/zachy/pic1.jpg
23370         mv $DIR/$tdir/pics/2008/zachy $DIR/$tdir/pics/zach
23371         ln $DIR/$tdir/pics/zach/pic1.jpg $DIR/$tdir/pics/2008/portland.jpg
23372         ln -s $DIR/$tdir/pics/2008/portland.jpg $DIR/$tdir/pics/desktop.jpg
23373         rm $DIR/$tdir/pics/desktop.jpg
23374
23375         local size2=$(do_facet $SINGLEMDS \
23376                       $LCTL get_param -n mdd.$mdt.changelog_size)
23377         echo "Changelog size after work $size2"
23378
23379         (( $size2 > $size1 )) ||
23380                 error "new Changelog size=$size2 less than old size=$size1"
23381 }
23382 run_test 254 "Check changelog size"
23383
23384 ladvise_no_type()
23385 {
23386         local type=$1
23387         local file=$2
23388
23389         lfs ladvise -a invalid $file 2>&1 | grep "Valid types" |
23390                 awk -F: '{print $2}' | grep $type > /dev/null
23391         if [ $? -ne 0 ]; then
23392                 return 0
23393         fi
23394         return 1
23395 }
23396
23397 ladvise_no_ioctl()
23398 {
23399         local file=$1
23400
23401         lfs ladvise -a willread $file > /dev/null 2>&1
23402         if [ $? -eq 0 ]; then
23403                 return 1
23404         fi
23405
23406         lfs ladvise -a willread $file 2>&1 |
23407                 grep "Inappropriate ioctl for device" > /dev/null
23408         if [ $? -eq 0 ]; then
23409                 return 0
23410         fi
23411         return 1
23412 }
23413
23414 percent() {
23415         bc <<<"scale=2; ($1 - $2) * 100 / $2"
23416 }
23417
23418 # run a random read IO workload
23419 # usage: random_read_iops <filename> <filesize> <iosize>
23420 random_read_iops() {
23421         local file=$1
23422         local fsize=$2
23423         local iosize=${3:-4096}
23424
23425         $READS -f $file -s $fsize -b $iosize -n $((fsize / iosize)) -t 60 |
23426                 sed -e '/^$/d' -e 's#.*s, ##' -e 's#MB/s##'
23427 }
23428
23429 drop_file_oss_cache() {
23430         local file="$1"
23431         local nodes="$2"
23432
23433         $LFS ladvise -a dontneed $file 2>/dev/null ||
23434                 do_nodes $nodes "echo 3 > /proc/sys/vm/drop_caches"
23435 }
23436
23437 ladvise_willread_performance()
23438 {
23439         local repeat=10
23440         local average_origin=0
23441         local average_cache=0
23442         local average_ladvise=0
23443
23444         for ((i = 1; i <= $repeat; i++)); do
23445                 echo "Iter $i/$repeat: reading without willread hint"
23446                 cancel_lru_locks osc
23447                 drop_file_oss_cache $DIR/$tfile $(comma_list $(osts_nodes))
23448                 local speed_origin=$(random_read_iops $DIR/$tfile $size)
23449                 echo "Iter $i/$repeat: uncached speed: $speed_origin"
23450                 average_origin=$(bc <<<"$average_origin + $speed_origin")
23451
23452                 cancel_lru_locks osc
23453                 local speed_cache=$(random_read_iops $DIR/$tfile $size)
23454                 echo "Iter $i/$repeat: OSS cache speed: $speed_cache"
23455                 average_cache=$(bc <<<"$average_cache + $speed_cache")
23456
23457                 cancel_lru_locks osc
23458                 drop_file_oss_cache $DIR/$tfile $(comma_list $(osts_nodes))
23459                 $LFS ladvise -a willread $DIR/$tfile || error "ladvise failed"
23460                 local speed_ladvise=$(random_read_iops $DIR/$tfile $size)
23461                 echo "Iter $i/$repeat: ladvise speed: $speed_ladvise"
23462                 average_ladvise=$(bc <<<"$average_ladvise + $speed_ladvise")
23463         done
23464         average_origin=$(bc <<<"scale=2; $average_origin / $repeat")
23465         average_cache=$(bc <<<"scale=2; $average_cache / $repeat")
23466         average_ladvise=$(bc <<<"scale=2; $average_ladvise / $repeat")
23467
23468         speedup_cache=$(percent $average_cache $average_origin)
23469         speedup_ladvise=$(percent $average_ladvise $average_origin)
23470
23471         echo "Average uncached read: $average_origin"
23472         echo "Average speedup with OSS cached read: " \
23473                 "$average_cache = +$speedup_cache%"
23474         echo "Average speedup with ladvise willread: " \
23475                 "$average_ladvise = +$speedup_ladvise%"
23476
23477         local lowest_speedup=20
23478         if (( ${average_cache%.*} < $lowest_speedup )); then
23479                 echo "Speedup with OSS cached read less than $lowest_speedup%,"\
23480                      " got $average_cache%. Skipping ladvise willread check."
23481                 return 0
23482         fi
23483
23484         # the test won't work on ZFS until it supports 'ladvise dontneed', but
23485         # it is still good to run until then to exercise 'ladvise willread'
23486         ! $LFS ladvise -a dontneed $DIR/$tfile &&
23487                 [ "$ost1_FSTYPE" = "zfs" ] &&
23488                 echo "osd-zfs does not support dontneed or drop_caches" &&
23489                 return 0
23490
23491         lowest_speedup=$(bc <<<"scale=2; $average_cache / 2")
23492         (( ${average_ladvise%.*} > ${lowest_speedup%.*} )) ||
23493                 error_not_in_vm "Speedup with willread is less than " \
23494                         "$lowest_speedup%, got $average_ladvise%"
23495 }
23496
23497 test_255a() {
23498         [ $OST1_VERSION -lt $(version_code 2.8.54) ] &&
23499                 skip "lustre < 2.8.54 does not support ladvise "
23500         remote_ost_nodsh && skip "remote OST with nodsh"
23501
23502         stack_trap "rm -f $DIR/$tfile"
23503         lfs setstripe -c -1 -i 0 $DIR/$tfile || error "$tfile failed"
23504
23505         ladvise_no_type willread $DIR/$tfile &&
23506                 skip "willread ladvise is not supported"
23507
23508         ladvise_no_ioctl $DIR/$tfile &&
23509                 skip "ladvise ioctl is not supported"
23510
23511         local size_mb=100
23512         local size=$((size_mb * 1048576))
23513         dd if=/dev/zero of=$DIR/$tfile bs=1048576 count=$size_mb ||
23514                 error "dd to $DIR/$tfile failed"
23515
23516         lfs ladvise -a willread $DIR/$tfile ||
23517                 error "Ladvise failed with no range argument"
23518
23519         lfs ladvise -a willread -s 0 $DIR/$tfile ||
23520                 error "Ladvise failed with no -l or -e argument"
23521
23522         lfs ladvise -a willread -e 1 $DIR/$tfile ||
23523                 error "Ladvise failed with only -e argument"
23524
23525         lfs ladvise -a willread -l 1 $DIR/$tfile ||
23526                 error "Ladvise failed with only -l argument"
23527
23528         lfs ladvise -a willread -s 2 -e 1 $DIR/$tfile &&
23529                 error "End offset should not be smaller than start offset"
23530
23531         lfs ladvise -a willread -s 2 -e 2 $DIR/$tfile &&
23532                 error "End offset should not be equal to start offset"
23533
23534         lfs ladvise -a willread -s $size -l 1 $DIR/$tfile ||
23535                 error "Ladvise failed with overflowing -s argument"
23536
23537         lfs ladvise -a willread -s 1 -e $((size + 1)) $DIR/$tfile ||
23538                 error "Ladvise failed with overflowing -e argument"
23539
23540         lfs ladvise -a willread -s 1 -l $size $DIR/$tfile ||
23541                 error "Ladvise failed with overflowing -l argument"
23542
23543         lfs ladvise -a willread -l 1 -e 2 $DIR/$tfile &&
23544                 error "Ladvise succeeded with conflicting -l and -e arguments"
23545
23546         echo "Synchronous ladvise should wait"
23547         local delay=8
23548 #define OBD_FAIL_OST_LADVISE_PAUSE       0x237
23549         do_nodes $(comma_list $(osts_nodes)) \
23550                 $LCTL set_param fail_val=$delay fail_loc=0x237
23551         stack_trap "do_nodes $(comma_list $(osts_nodes)) \
23552                 $LCTL set_param fail_loc=0"
23553
23554         local start_ts=$SECONDS
23555         lfs ladvise -a willread $DIR/$tfile ||
23556                 error "Ladvise failed with no range argument"
23557         local end_ts=$SECONDS
23558         local inteval_ts=$((end_ts - start_ts))
23559
23560         if [ $inteval_ts -lt $(($delay - 1)) ]; then
23561                 error "Synchronous advice didn't wait reply"
23562         fi
23563
23564         echo "Asynchronous ladvise shouldn't wait"
23565         local start_ts=$SECONDS
23566         lfs ladvise -a willread -b $DIR/$tfile ||
23567                 error "Ladvise failed with no range argument"
23568         local end_ts=$SECONDS
23569         local inteval_ts=$((end_ts - start_ts))
23570
23571         if [ $inteval_ts -gt $(($delay / 2)) ]; then
23572                 error "Asynchronous advice blocked"
23573         fi
23574
23575         ladvise_willread_performance
23576 }
23577 run_test 255a "check 'lfs ladvise -a willread'"
23578
23579 facet_meminfo() {
23580         local facet=$1
23581         local info=$2
23582
23583         do_facet $facet "cat /proc/meminfo | grep ^${info}:" | awk '{print $2}'
23584 }
23585
23586 test_255b() {
23587         [ $OST1_VERSION -lt $(version_code 2.8.54) ] &&
23588                 skip "lustre < 2.8.54 does not support ladvise "
23589         remote_ost_nodsh && skip "remote OST with nodsh"
23590
23591         stack_trap "rm -f $DIR/$tfile"
23592         lfs setstripe -c 1 -i 0 $DIR/$tfile
23593
23594         ladvise_no_type dontneed $DIR/$tfile &&
23595                 skip "dontneed ladvise is not supported"
23596
23597         ladvise_no_ioctl $DIR/$tfile &&
23598                 skip "ladvise ioctl is not supported"
23599
23600         ! $LFS ladvise -a dontneed $DIR/$tfile &&
23601                 [ "$ost1_FSTYPE" = "zfs" ] &&
23602                 skip "zfs-osd does not support 'ladvise dontneed'"
23603
23604         local size_mb=100
23605         local size=$((size_mb * 1048576))
23606         # In order to prevent disturbance of other processes, only check 3/4
23607         # of the memory usage
23608         local kibibytes=$((size_mb * 1024 * 3 / 4))
23609
23610         dd if=/dev/zero of=$DIR/$tfile bs=1048576 count=$size_mb ||
23611                 error "dd to $DIR/$tfile failed"
23612
23613         #force write to complete before dropping OST cache & checking memory
23614         sync
23615
23616         local total=$(facet_meminfo ost1 MemTotal)
23617         echo "Total memory: $total KiB"
23618
23619         do_facet ost1 "sync && echo 3 > /proc/sys/vm/drop_caches"
23620         local before_read=$(facet_meminfo ost1 Cached)
23621         echo "Cache used before read: $before_read KiB"
23622
23623         lfs ladvise -a willread $DIR/$tfile ||
23624                 error "Ladvise willread failed"
23625         local after_read=$(facet_meminfo ost1 Cached)
23626         echo "Cache used after read: $after_read KiB"
23627
23628         lfs ladvise -a dontneed $DIR/$tfile ||
23629                 error "Ladvise dontneed again failed"
23630         local no_read=$(facet_meminfo ost1 Cached)
23631         echo "Cache used after dontneed ladvise: $no_read KiB"
23632
23633         if [ $total -lt $((before_read + kibibytes)) ]; then
23634                 echo "Memory is too small, abort checking"
23635                 return 0
23636         fi
23637
23638         if [ $((before_read + kibibytes)) -gt $after_read ]; then
23639                 error "Ladvise willread should use more memory" \
23640                         "than $kibibytes KiB"
23641         fi
23642
23643         if [ $((no_read + kibibytes)) -gt $after_read ]; then
23644                 error "Ladvise dontneed should release more memory" \
23645                         "than $kibibytes KiB"
23646         fi
23647 }
23648 run_test 255b "check 'lfs ladvise -a dontneed'"
23649
23650 test_255c() {
23651         [ $OST1_VERSION -lt $(version_code 2.10.50) ] &&
23652                 skip "lustre < 2.10.50 does not support lockahead"
23653
23654         local ost1_imp=$(get_osc_import_name client ost1)
23655         local imp_name=$($LCTL list_param osc.$ost1_imp | head -n1 |
23656                          cut -d'.' -f2)
23657         local count
23658         local new_count
23659         local difference
23660         local i
23661         local rc
23662
23663         test_mkdir -p $DIR/$tdir
23664         $LFS setstripe -i 0 -c 1 $DIR/$tdir
23665
23666         #test 10 returns only success/failure
23667         i=10
23668         lockahead_test -d $DIR/$tdir -t $i -f $tfile
23669         rc=$?
23670         if [ $rc -eq 255 ]; then
23671                 error "Ladvise test${i} failed, ${rc}"
23672         fi
23673
23674         #test 11 counts lock enqueue requests, all others count new locks
23675         i=11
23676         count=$(do_facet ost1 \
23677                 $LCTL get_param -n ost.OSS.ost.stats)
23678         count=$(echo "$count" | grep ldlm_extent_enqueue | awk '{ print $2 }')
23679
23680         lockahead_test -d $DIR/$tdir -t $i -f $tfile
23681         rc=$?
23682         if [ $rc -eq 255 ]; then
23683                 error "Ladvise test${i} failed, ${rc}"
23684         fi
23685
23686         new_count=$(do_facet ost1 \
23687                 $LCTL get_param -n ost.OSS.ost.stats)
23688         new_count=$(echo "$new_count" | grep ldlm_extent_enqueue | \
23689                    awk '{ print $2 }')
23690
23691         difference="$((new_count - count))"
23692         if [ $difference -ne $rc ]; then
23693                 error "Ladvise test${i}, bad enqueue count, returned " \
23694                       "${rc}, actual ${difference}"
23695         fi
23696
23697         for i in $(seq 12 21); do
23698                 # If we do not do this, we run the risk of having too many
23699                 # locks and starting lock cancellation while we are checking
23700                 # lock counts.
23701                 cancel_lru_locks osc
23702
23703                 count=$($LCTL get_param -n \
23704                        ldlm.namespaces.$imp_name.lock_unused_count)
23705
23706                 lockahead_test -d $DIR/$tdir -t $i -f $tfile
23707                 rc=$?
23708                 if [ $rc -eq 255 ]; then
23709                         error "Ladvise test ${i} failed, ${rc}"
23710                 fi
23711
23712                 new_count=$($LCTL get_param -n \
23713                        ldlm.namespaces.$imp_name.lock_unused_count)
23714                 difference="$((new_count - count))"
23715
23716                 # Test 15 output is divided by 100 to map down to valid return
23717                 if [ $i -eq 15 ]; then
23718                         rc="$((rc * 100))"
23719                 fi
23720
23721                 if [ $difference -ne $rc ]; then
23722                         error "Ladvise test ${i}, bad lock count, returned " \
23723                               "${rc}, actual ${difference}"
23724                 fi
23725         done
23726
23727         #test 22 returns only success/failure
23728         i=22
23729         lockahead_test -d $DIR/$tdir -t $i -f $tfile
23730         rc=$?
23731         if [ $rc -eq 255 ]; then
23732                 error "Ladvise test${i} failed, ${rc}"
23733         fi
23734 }
23735 run_test 255c "suite of ladvise lockahead tests"
23736
23737 test_256() {
23738         [ $PARALLEL == "yes" ] && skip "skip parallel run"
23739         remote_mds_nodsh && skip "remote MDS with nodsh"
23740         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip "ldiskfs only test"
23741         changelog_users $SINGLEMDS | grep "^cl" &&
23742                 skip "active changelog user"
23743
23744         local cl_user
23745         local cat_sl
23746         local mdt_dev
23747
23748         mdt_dev=$(facet_device $SINGLEMDS)
23749         echo $mdt_dev
23750
23751         changelog_register || error "changelog_register failed"
23752
23753         rm -rf $DIR/$tdir
23754         mkdir_on_mdt -i$(($(facet_number $SINGLEMDS) - 1)) $DIR/$tdir
23755
23756         changelog_clear 0 || error "changelog_clear failed"
23757
23758         # change something
23759         touch $DIR/$tdir/{1..10}
23760
23761         # stop the MDT
23762         stop $SINGLEMDS || error "Fail to stop MDT"
23763
23764         # remount the MDT
23765         start $SINGLEMDS $(facet_device $SINGLEMDS) $MDS_MOUNT_OPTS ||
23766                 error "Fail to start MDT"
23767
23768         #after mount new plainllog is used
23769         touch $DIR/$tdir/{11..19}
23770         local tmpfile="$(mktemp --tmpdir -u $tfile.XXXXXX)"
23771         stack_trap "rm -f $tmpfile"
23772         cat_sl=$(do_facet $SINGLEMDS "sync; \
23773                  $DEBUGFS -c -R 'dump changelog_catalog $tmpfile' $mdt_dev; \
23774                  llog_reader $tmpfile | grep -c type=1064553b")
23775         do_facet $SINGLEMDS llog_reader $tmpfile
23776
23777         [ $cat_sl != 2 ] && error "Changelog catalog has $cat_sl != 2 slots"
23778
23779         changelog_clear 0 || error "changelog_clear failed"
23780
23781         cat_sl=$(do_facet $SINGLEMDS "sync; \
23782                  $DEBUGFS -c -R 'dump changelog_catalog $tmpfile' $mdt_dev; \
23783                  llog_reader $tmpfile | grep -c type=1064553b")
23784
23785         if (( cat_sl == 2 )); then
23786                 error "Empty plain llog was not deleted from changelog catalog"
23787         elif (( cat_sl != 1 )); then
23788                 error "Active plain llog shouldn't be deleted from catalog"
23789         fi
23790 }
23791 run_test 256 "Check llog delete for empty and not full state"
23792
23793 test_257() {
23794         remote_mds_nodsh && skip "remote MDS with nodsh"
23795         [[ $MDS1_VERSION -lt $(version_code 2.8.55) ]] &&
23796                 skip "Need MDS version at least 2.8.55"
23797
23798         test_mkdir $DIR/$tdir
23799
23800         setfattr -n trusted.name1 -v value1 $DIR/$tdir ||
23801                 error "setfattr -n trusted.name1=value1 $DIR/$tdir failed"
23802         stat $DIR/$tdir
23803
23804 #define OBD_FAIL_MDS_XATTR_REP                  0x161
23805         local mdtidx=$($LFS getstripe -m $DIR/$tdir)
23806         local facet=mds$((mdtidx + 1))
23807         set_nodes_failloc $(facet_active_host $facet) 0x80000161
23808         getfattr -n trusted.name1 $DIR/$tdir 2> /dev/null
23809
23810         stop $facet || error "stop MDS failed"
23811         start $facet $(mdsdevname $((mdtidx + 1))) $MDS_MOUNT_OPTS ||
23812                 error "start MDS fail"
23813         wait_recovery_complete $facet
23814 }
23815 run_test 257 "xattr locks are not lost"
23816
23817 # Verify we take the i_mutex when security requires it
23818 test_258a() {
23819 #define OBD_FAIL_IMUTEX_SEC 0x141c
23820         $LCTL set_param fail_loc=0x141c
23821         touch $DIR/$tfile
23822         chmod u+s $DIR/$tfile
23823         chmod a+rwx $DIR/$tfile
23824         $RUNAS dd if=/dev/zero of=$DIR/$tfile bs=4k count=1 oflag=append
23825         RC=$?
23826         if [ $RC -ne 0 ]; then
23827                 error "error, failed to take i_mutex, rc=$?"
23828         fi
23829         rm -f $DIR/$tfile
23830 }
23831 run_test 258a "verify i_mutex security behavior when suid attributes is set"
23832
23833 # Verify we do NOT take the i_mutex in the normal case
23834 test_258b() {
23835 #define OBD_FAIL_IMUTEX_NOSEC 0x141d
23836         $LCTL set_param fail_loc=0x141d
23837         touch $DIR/$tfile
23838         chmod a+rwx $DIR
23839         chmod a+rw $DIR/$tfile
23840         $RUNAS dd if=/dev/zero of=$DIR/$tfile bs=4k count=1 oflag=append
23841         RC=$?
23842         if [ $RC -ne 0 ]; then
23843                 error "error, took i_mutex unnecessarily, rc=$?"
23844         fi
23845         rm -f $DIR/$tfile
23846
23847 }
23848 run_test 258b "verify i_mutex security behavior"
23849
23850 test_259() {
23851         local file=$DIR/$tfile
23852         local before
23853         local after
23854
23855         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip "ldiskfs only test"
23856
23857         stack_trap "rm -f $file" EXIT
23858
23859         wait_delete_completed
23860         before=$(do_facet ost1 "$LCTL get_param -n osd-*.*OST0000.kbytesfree")
23861         echo "before: $before"
23862
23863         $LFS setstripe -i 0 -c 1 $file
23864         dd if=/dev/zero of=$file bs=1M count=10 || error "couldn't write"
23865         sync_all_data
23866         after=$(do_facet ost1 "$LCTL get_param -n osd-*.*OST0000.kbytesfree")
23867         echo "after write: $after"
23868
23869 #define OBD_FAIL_OSD_FAIL_AT_TRUNCATE          0x2301
23870         do_facet ost1 $LCTL set_param fail_loc=0x2301
23871         $TRUNCATE $file 0
23872         after=$(do_facet ost1 "$LCTL get_param -n osd-*.*OST0000.kbytesfree")
23873         echo "after truncate: $after"
23874
23875         stop ost1
23876         do_facet ost1 $LCTL set_param fail_loc=0
23877         start ost1 $(ostdevname 1) $OST_MOUNT_OPTS || error "cannot start ost1"
23878         sleep 2
23879         after=$(do_facet ost1 "$LCTL get_param -n osd-*.*OST0000.kbytesfree")
23880         echo "after restart: $after"
23881         [ $((after - before)) -ge $(fs_log_size ost1) ] &&
23882                 error "missing truncate?"
23883
23884         return 0
23885 }
23886 run_test 259 "crash at delayed truncate"
23887
23888 test_260() {
23889 #define OBD_FAIL_MDC_CLOSE               0x806
23890         $LCTL set_param fail_loc=0x80000806
23891         touch $DIR/$tfile
23892
23893 }
23894 run_test 260 "Check mdc_close fail"
23895
23896 ### Data-on-MDT sanity tests ###
23897 test_270a() {
23898         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23899                 skip "Need MDS version at least 2.10.55 for DoM"
23900
23901         # create DoM file
23902         local dom=$DIR/$tdir/dom_file
23903         local tmp=$DIR/$tdir/tmp_file
23904
23905         mkdir_on_mdt0 $DIR/$tdir
23906
23907         # basic checks for DoM component creation
23908         $LFS setstripe -E 1024K -E 2048K -L mdt $dom 2>/dev/null &&
23909                 error "Can set MDT layout to non-first entry"
23910
23911         $LFS setstripe -E 1024K -L mdt -E 2048K -L mdt $dom 2>/dev/null &&
23912                 error "Can define multiple entries as MDT layout"
23913
23914         $LFS setstripe -E 1M -L mdt $dom || error "Can't create DoM layout"
23915
23916         [ $($LFS getstripe -L $dom) == "mdt" ] || error "bad pattern"
23917         [ $($LFS getstripe -c $dom) == 0 ] || error "bad stripe count"
23918         [ $($LFS getstripe -S $dom) == 1048576 ] || error "bad stripe size"
23919
23920         local mdtidx=$($LFS getstripe -m $dom)
23921         local mdtname=MDT$(printf %04x $mdtidx)
23922         local facet=mds$((mdtidx + 1))
23923         local space_check=1
23924
23925         # Skip free space checks with ZFS
23926         [ "$(facet_fstype $facet)" == "zfs" ] && space_check=0
23927
23928         # write
23929         sync
23930         local size_tmp=$((65536 * 3))
23931         local mdtfree1=$(do_facet $facet \
23932                          lctl get_param -n osd*.*$mdtname.kbytesfree)
23933
23934         dd if=/dev/urandom of=$tmp bs=1024 count=$((size_tmp / 1024))
23935         # check also direct IO along write
23936         # IO size must be a multiple of PAGE_SIZE on all platforms (ARM=64KB)
23937         dd if=$tmp of=$dom bs=65536 count=$((size_tmp / 65536)) oflag=direct
23938         sync
23939         cmp $tmp $dom || error "file data is different"
23940         [ $(stat -c%s $dom) == $size_tmp ] ||
23941                 error "bad size after write: $(stat -c%s $dom) != $size_tmp"
23942         if [ $space_check == 1 ]; then
23943                 local mdtfree2=$(do_facet $facet \
23944                                  lctl get_param -n osd*.*$mdtname.kbytesfree)
23945
23946                 # increase in usage from by $size_tmp
23947                 [ $(($mdtfree1 - $mdtfree2)) -ge $((size_tmp / 1024)) ] ||
23948                         error "MDT free space wrong after write: " \
23949                               "$mdtfree1 >= $mdtfree2 + $size_tmp/1024"
23950         fi
23951
23952         # truncate
23953         local size_dom=10000
23954
23955         $TRUNCATE $dom $size_dom
23956         [ $(stat -c%s $dom) == $size_dom ] ||
23957                 error "bad size after truncate: $(stat -c%s $dom) != $size_dom"
23958         if [ $space_check == 1 ]; then
23959                 mdtfree1=$(do_facet $facet \
23960                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
23961                 # decrease in usage from $size_tmp to new $size_dom
23962                 [ $(($mdtfree1 - $mdtfree2)) -ge \
23963                   $(((size_tmp - size_dom) / 1024)) ] ||
23964                         error "MDT free space is wrong after truncate: " \
23965                               "$mdtfree1 >= $mdtfree2 + ($size_tmp - $size_dom) / 1024"
23966         fi
23967
23968         # append
23969         cat $tmp >> $dom
23970         sync
23971         size_dom=$((size_dom + size_tmp))
23972         [ $(stat -c%s $dom) == $size_dom ] ||
23973                 error "bad size after append: $(stat -c%s $dom) != $size_dom"
23974         if [ $space_check == 1 ]; then
23975                 mdtfree2=$(do_facet $facet \
23976                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
23977                 # increase in usage by $size_tmp from previous
23978                 [ $(($mdtfree1 - $mdtfree2)) -ge $((size_tmp / 1024)) ] ||
23979                         error "MDT free space is wrong after append: " \
23980                               "$mdtfree1 >= $mdtfree2 + $size_tmp/1024"
23981         fi
23982
23983         # delete
23984         rm $dom
23985         if [ $space_check == 1 ]; then
23986                 mdtfree1=$(do_facet $facet \
23987                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
23988                 # decrease in usage by $size_dom from previous
23989                 [ $(($mdtfree1 - $mdtfree2)) -ge $((size_dom / 1024)) ] ||
23990                         error "MDT free space is wrong after removal: " \
23991                               "$mdtfree1 >= $mdtfree2 + $size_dom/1024"
23992         fi
23993
23994         # combined striping
23995         $LFS setstripe -E 1024K -L mdt -E EOF $dom ||
23996                 error "Can't create DoM + OST striping"
23997
23998         size_tmp=2031616 # must be a multiple of PAGE_SIZE=65536 on ARM
23999         dd if=/dev/urandom of=$tmp bs=1024 count=$((size_tmp / 1024))
24000         # check also direct IO along write
24001         dd if=$tmp of=$dom bs=65536 count=$((size_tmp / 65536)) oflag=direct
24002         sync
24003         cmp $tmp $dom || error "file data is different"
24004         [ $(stat -c%s $dom) == $size_tmp ] ||
24005                 error "bad size after write: $(stat -c%s $dom) != $size_tmp"
24006         rm $dom $tmp
24007
24008         return 0
24009 }
24010 run_test 270a "DoM: basic functionality tests"
24011
24012 test_270b() {
24013         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
24014                 skip "Need MDS version at least 2.10.55"
24015
24016         local dom=$DIR/$tdir/dom_file
24017         local max_size=1048576
24018
24019         mkdir -p $DIR/$tdir
24020         $LFS setstripe -E $max_size -L mdt $dom
24021
24022         # truncate over the limit
24023         $TRUNCATE $dom $(($max_size + 1)) &&
24024                 error "successful truncate over the maximum size"
24025         # write over the limit
24026         dd if=/dev/zero of=$dom bs=$max_size seek=1 count=1 &&
24027                 error "successful write over the maximum size"
24028         # append over the limit
24029         dd if=/dev/zero of=$dom bs=$(($max_size - 3)) count=1
24030         echo "12345" >> $dom && error "successful append over the maximum size"
24031         rm $dom
24032
24033         return 0
24034 }
24035 run_test 270b "DoM: maximum size overflow checks for DoM-only file"
24036
24037 test_270c() {
24038         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
24039                 skip "Need MDS version at least 2.10.55"
24040
24041         mkdir -p $DIR/$tdir
24042         $LFS setstripe -E 1024K -L mdt $DIR/$tdir
24043
24044         # check files inherit DoM EA
24045         touch $DIR/$tdir/first
24046         [ $($LFS getstripe -L $DIR/$tdir/first) == "mdt" ] ||
24047                 error "bad pattern"
24048         [ $($LFS getstripe -c $DIR/$tdir/first) == 0 ] ||
24049                 error "bad stripe count"
24050         [ $($LFS getstripe -S $DIR/$tdir/first) == 1048576 ] ||
24051                 error "bad stripe size"
24052
24053         # check directory inherits DoM EA and uses it as default
24054         mkdir $DIR/$tdir/subdir
24055         touch $DIR/$tdir/subdir/second
24056         [ $($LFS getstripe -L $DIR/$tdir/subdir/second) == "mdt" ] ||
24057                 error "bad pattern in sub-directory"
24058         [ $($LFS getstripe -c $DIR/$tdir/subdir/second) == 0 ] ||
24059                 error "bad stripe count in sub-directory"
24060         [ $($LFS getstripe -S $DIR/$tdir/subdir/second) == 1048576 ] ||
24061                 error "bad stripe size in sub-directory"
24062         return 0
24063 }
24064 run_test 270c "DoM: DoM EA inheritance tests"
24065
24066 test_270d() {
24067         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
24068                 skip "Need MDS version at least 2.10.55"
24069
24070         mkdir -p $DIR/$tdir
24071         $LFS setstripe -E 1024K -L mdt $DIR/$tdir
24072
24073         # inherit default DoM striping
24074         mkdir $DIR/$tdir/subdir
24075         touch $DIR/$tdir/subdir/f1
24076
24077         # change default directory striping
24078         $LFS setstripe -c 1 $DIR/$tdir/subdir
24079         touch $DIR/$tdir/subdir/f2
24080         [ $($LFS getstripe -c $DIR/$tdir/subdir/f2) == 1 ] ||
24081                 error "wrong default striping in file 2"
24082         [ $($LFS getstripe -L $DIR/$tdir/subdir/f2) == "raid0" ] ||
24083                 error "bad pattern in file 2"
24084         return 0
24085 }
24086 run_test 270d "DoM: change striping from DoM to RAID0"
24087
24088 test_270e() {
24089         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
24090                 skip "Need MDS version at least 2.10.55"
24091
24092         mkdir -p $DIR/$tdir/dom
24093         mkdir -p $DIR/$tdir/norm
24094         DOMFILES=20
24095         NORMFILES=10
24096         $LFS setstripe -E 1M -L mdt $DIR/$tdir/dom
24097         $LFS setstripe -i 0 -S 2M $DIR/$tdir/norm
24098
24099         createmany -o $DIR/$tdir/dom/dom- $DOMFILES
24100         createmany -o $DIR/$tdir/norm/norm- $NORMFILES
24101
24102         # find DoM files by layout
24103         NUM=$($LFS find -L mdt -type f $DIR/$tdir 2>/dev/null | wc -l)
24104         [ $NUM -eq  $DOMFILES ] ||
24105                 error "lfs find -L: found $NUM, expected $DOMFILES"
24106         echo "Test 1: lfs find 20 DOM files by layout: OK"
24107
24108         # there should be 1 dir with default DOM striping
24109         NUM=$($LFS find -L mdt -type d $DIR/$tdir 2>/dev/null | wc -l)
24110         [ $NUM -eq  1 ] ||
24111                 error "lfs find -L: found $NUM, expected 1 dir"
24112         echo "Test 2: lfs find 1 DOM dir by layout: OK"
24113
24114         # find DoM files by stripe size
24115         NUM=$($LFS find -S -1200K -type f $DIR/$tdir 2>/dev/null | wc -l)
24116         [ $NUM -eq  $DOMFILES ] ||
24117                 error "lfs find -S: found $NUM, expected $DOMFILES"
24118         echo "Test 4: lfs find 20 DOM files by stripe size: OK"
24119
24120         # find files by stripe offset except DoM files
24121         NUM=$($LFS find -i 0 -type f $DIR/$tdir 2>/dev/null | wc -l)
24122         [ $NUM -eq  $NORMFILES ] ||
24123                 error "lfs find -i: found $NUM, expected $NORMFILES"
24124         echo "Test 5: lfs find no DOM files by stripe index: OK"
24125         return 0
24126 }
24127 run_test 270e "DoM: lfs find with DoM files test"
24128
24129 test_270f() {
24130         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
24131                 skip "Need MDS version at least 2.10.55"
24132
24133         local mdtname=${FSNAME}-MDT0000-mdtlov
24134         local dom=$DIR/$tdir/dom_file
24135         local dom_limit_saved=$(do_facet mds1 $LCTL get_param -n \
24136                                                 lod.$mdtname.dom_stripesize)
24137         local dom_limit=131072
24138
24139         do_facet mds1 $LCTL set_param -n lod.$mdtname.dom_stripesize=$dom_limit
24140         local dom_current=$(do_facet mds1 $LCTL get_param -n \
24141                                                 lod.$mdtname.dom_stripesize)
24142         [ ${dom_limit} -eq ${dom_current} ] ||
24143                 error "Cannot change per-MDT DoM stripe limit to $dom_limit"
24144
24145         $LFS mkdir -i 0 -c 1 $DIR/$tdir
24146         $LFS setstripe -d $DIR/$tdir
24147         $LFS setstripe -E $dom_limit -L mdt $DIR/$tdir ||
24148                 error "Can't set directory default striping"
24149
24150         # exceed maximum stripe size
24151         $LFS setstripe -E $((dom_limit * 2)) -L mdt $dom ||
24152                 error "Can't create file with $((dom_limit * 2)) DoM stripe"
24153         [ $($LFS getstripe -S $dom) -eq $((dom_limit * 2)) ] &&
24154                 error "Able to create DoM component size more than LOD limit"
24155
24156         do_facet mds1 $LCTL set_param -n lod.$mdtname.dom_stripesize=0
24157         dom_current=$(do_facet mds1 $LCTL get_param -n \
24158                                                 lod.$mdtname.dom_stripesize)
24159         [ 0 -eq ${dom_current} ] ||
24160                 error "Can't set zero DoM stripe limit"
24161         rm $dom
24162
24163         # attempt to create DoM file on server with disabled DoM should
24164         # remove DoM entry from layout and be succeed
24165         $LFS setstripe -E $dom_limit -L mdt -E -1 $dom ||
24166                 error "Can't create DoM file (DoM is disabled)"
24167         [ $($LFS getstripe -L $dom) == "mdt" ] &&
24168                 error "File has DoM component while DoM is disabled"
24169         rm $dom
24170
24171         # attempt to create DoM file with only DoM stripe should return error
24172         $LFS setstripe -E $dom_limit -L mdt $dom &&
24173                 error "Able to create DoM-only file while DoM is disabled"
24174
24175         # too low values to be aligned with smallest stripe size 64K
24176         do_facet mds1 $LCTL set_param -n lod.$mdtname.dom_stripesize=30000
24177         dom_current=$(do_facet mds1 $LCTL get_param -n \
24178                                                 lod.$mdtname.dom_stripesize)
24179         [ 30000 -eq ${dom_current} ] &&
24180                 error "Can set too small DoM stripe limit"
24181
24182         # 64K is a minimal stripe size in Lustre, expect limit of that size
24183         [ 65536 -eq ${dom_current} ] ||
24184                 error "Limit is not set to 64K but ${dom_current}"
24185
24186         do_facet mds1 $LCTL set_param -n lod.$mdtname.dom_stripesize=2147483648
24187         dom_current=$(do_facet mds1 $LCTL get_param -n \
24188                                                 lod.$mdtname.dom_stripesize)
24189         echo $dom_current
24190         [ 2147483648 -eq ${dom_current} ] &&
24191                 error "Can set too large DoM stripe limit"
24192
24193         do_facet mds1 $LCTL set_param -n \
24194                                 lod.$mdtname.dom_stripesize=$((dom_limit * 2))
24195         $LFS setstripe -E $((dom_limit * 2)) -L mdt $dom ||
24196                 error "Can't create DoM component size after limit change"
24197         do_facet mds1 $LCTL set_param -n \
24198                                 lod.$mdtname.dom_stripesize=$((dom_limit / 2))
24199         $LFS setstripe -E $dom_limit -L mdt ${dom}_big ||
24200                 error "Can't create DoM file after limit decrease"
24201         [ $($LFS getstripe -S ${dom}_big) -eq $((dom_limit / 2)) ] ||
24202                 error "Can create big DoM component after limit decrease"
24203         touch ${dom}_def ||
24204                 error "Can't create file with old default layout"
24205
24206         do_facet mds1 $LCTL set_param -n lod.*.dom_stripesize=$dom_limit_saved
24207         return 0
24208 }
24209 run_test 270f "DoM: maximum DoM stripe size checks"
24210
24211 test_270g() {
24212         [ $MDS1_VERSION -ge $(version_code 2.13.52) ] ||
24213                 skip "Need MDS version at least 2.13.52"
24214         local dom=$DIR/$tdir/$tfile
24215
24216         $LFS mkdir -i 0 -c 1 $DIR/$tdir
24217         local lodname=${FSNAME}-MDT0000-mdtlov
24218
24219         local save="$TMP/$TESTSUITE-$TESTNAME.parameters"
24220         save_lustre_params mds1 "lod.${lodname}.dom_stripesize_max_kb" > $save
24221         save_lustre_params mds1 "lod.${lodname}.dom_threshold_free_mb" >> $save
24222         stack_trap "restore_lustre_params < $save; rm -f $save" EXIT
24223
24224         local dom_limit=1024
24225         local dom_threshold="50%"
24226
24227         $LFS setstripe -d $DIR/$tdir
24228         $LFS setstripe -E ${dom_limit}K -L mdt $DIR/$tdir ||
24229                 error "Can't set directory default striping"
24230
24231         do_facet mds1 $LCTL set_param -n \
24232                                 lod.${lodname}.dom_stripesize_max_kb=$dom_limit
24233         # set 0 threshold and create DOM file to change tunable stripesize
24234         do_facet mds1 $LCTL set_param -n lod.${lodname}.dom_threshold_free_mb=0
24235         $LFS setstripe -E ${dom_limit}K -L mdt -E -1 $dom ||
24236                 error "Failed to create $dom file"
24237         # now tunable dom_cur_stripesize should reach maximum
24238         local dom_current=$(do_facet mds1 $LCTL get_param -n \
24239                                         lod.${lodname}.dom_stripesize_cur_kb)
24240         [[ $dom_current == $dom_limit ]] ||
24241                 error "Current DOM stripesize is not maximum"
24242         rm $dom
24243
24244         # set threshold for further tests
24245         do_facet mds1 $LCTL set_param -n \
24246                         lod.${lodname}.dom_threshold_free_mb=$dom_threshold
24247         echo "DOM threshold is $dom_threshold free space"
24248         local dom_def
24249         local dom_set
24250         # Spoof bfree to exceed threshold
24251         #define OBD_FAIL_MDS_STATFS_SPOOF   0x168
24252         do_facet mds1 $LCTL set_param -n fail_loc=0x0168
24253         for spfree in 40 20 0 15 30 55; do
24254                 do_facet mds1 $LCTL set_param -n fail_val=$spfree
24255                 $LFS setstripe -E ${dom_limit}K -L mdt -E -1 $dom ||
24256                         error "Failed to create $dom file"
24257                 dom_def=$(do_facet mds1 $LCTL get_param -n \
24258                                         lod.${lodname}.dom_stripesize_cur_kb)
24259                 echo "Free space: ${spfree}%, default DOM stripe: ${dom_def}K"
24260                 [[ $dom_def != $dom_current ]] ||
24261                         error "Default stripe size was not changed"
24262                 if (( spfree > 0 )) ; then
24263                         dom_set=$($LFS getstripe -S $dom)
24264                         (( dom_set == dom_def * 1024 )) ||
24265                                 error "DOM component size is still old"
24266                 else
24267                         [[ $($LFS getstripe -L $dom) != "mdt" ]] ||
24268                                 error "DoM component is set with no free space"
24269                 fi
24270                 rm $dom
24271                 dom_current=$dom_def
24272         done
24273 }
24274 run_test 270g "DoM: default DoM stripe size depends on free space"
24275
24276 test_270h() {
24277         [[ $MDS1_VERSION -ge $(version_code 2.13.53) ]] ||
24278                 skip "Need MDS version at least 2.13.53"
24279
24280         local mdtname=${FSNAME}-MDT0000-mdtlov
24281         local dom=$DIR/$tdir/$tfile
24282         local save="$TMP/$TESTSUITE-$TESTNAME.parameters"
24283
24284         save_lustre_params mds1 "lod.*.dom_stripesize" > $save
24285         stack_trap "restore_lustre_params < $save; rm -f $save" EXIT
24286
24287         $LFS mkdir -i 0 -c 1 $DIR/$tdir
24288         $LFS setstripe -E 1M -c1  -E -1 -c2 ${dom}_1 ||
24289                 error "can't create OST file"
24290         # mirrored file with DOM entry in the second mirror
24291         $LFS mirror extend -N -E 1M -L mdt -E eof -c2 ${dom}_1 ||
24292                 error "can't create mirror with DoM component"
24293
24294         do_facet mds1 $LCTL set_param -n lod.$mdtname.dom_stripesize=0
24295
24296         # DOM component in the middle and has other enries in the same mirror,
24297         # should succeed but lost DoM component
24298         $LFS setstripe --copy=${dom}_1 $dom ||
24299                 error "Can't create file from OST|DOM mirror layout"
24300         # check new file has no DoM layout after all
24301         [[ $($LFS getstripe -L $dom) != "mdt" ]] ||
24302                 error "File has DoM component while DoM is disabled"
24303 }
24304 run_test 270h "DoM: DoM stripe removal when disabled on server"
24305
24306 test_270i() {
24307         (( $MDS1_VERSION >= $(version_code 2.14.54) )) ||
24308                 skip "Need MDS version at least 2.14.54"
24309
24310         mkdir $DIR/$tdir
24311         # DoM with plain layout
24312         $LFS setstripe -L mdt -S 128k -c -1 $DIR/$tdir &&
24313                 error "default plain layout with DoM must fail"
24314         $LFS setstripe -L mdt -S 128k -c -1 $DIR/$tdir/$tfile &&
24315                 error "setstripe plain file layout with DoM must fail"
24316         $LFS setstripe -E 1M -L mdt -S 128k -c -1 -E eof $DIR/$tdir &&
24317                 error "default DoM layout with bad striping must fail"
24318         $LFS setstripe -E 1M -L mdt -S 128k -c -1 -E eof $DIR/$tdir/$tfile &&
24319                 error "setstripe to DoM layout with bad striping must fail"
24320         return 0
24321 }
24322 run_test 270i "DoM: setting invalid DoM striping should fail"
24323
24324 test_270j() {
24325         (( $MDS1_VERSION >= $(version_code 2.15.55.203) )) ||
24326                 skip "Need MDS version at least 2.15.55.203"
24327
24328         local dom=$DIR/$tdir/$tfile
24329         local odv
24330         local ndv
24331
24332         mkdir -p $DIR/$tdir
24333
24334         $LFS setstripe -E 1M -L mdt -E -1 -c1 $dom
24335
24336         odv=$($LFS data_version $dom)
24337         chmod 666 $dom
24338         mv $dom ${dom}_moved
24339         link ${dom}_moved $dom
24340         setfattr -n user.attrx -v "some_attr" $dom
24341         ndv=$($LFS data_version $dom)
24342         (( $ndv == $odv )) ||
24343                 error "data version was changed by metadata operations"
24344
24345         dd if=/dev/urandom of=$dom bs=1M count=1 ||
24346                 error "failed to write data into $dom"
24347         cancel_lru_locks mdc
24348         ndv=$($LFS data_version $dom)
24349         (( $ndv != $odv )) ||
24350                 error "data version wasn't changed on write"
24351
24352         odv=$ndv
24353         $TRUNCATE $dom 1000 || error "failed to truncate $dom"
24354         ndv=$($LFS data_version $dom)
24355         (( $ndv != $odv )) ||
24356                 error "data version wasn't changed on truncate down"
24357
24358         odv=$ndv
24359         $TRUNCATE $dom 25000
24360         ndv=$($LFS data_version $dom)
24361         (( $ndv != $odv )) ||
24362                 error "data version wasn't changed on truncate up"
24363
24364         # check also fallocate for ldiskfs
24365         if [[ "$mds1_FSTYPE" == ldiskfs ]]; then
24366                 odv=$ndv
24367                 fallocate -l 1048576 $dom
24368                 ndv=$($LFS data_version $dom)
24369                 (( $ndv != $odv )) ||
24370                         error "data version wasn't changed on fallocate"
24371
24372                 odv=$ndv
24373                 fallocate -p --offset 4096 -l 4096 $dom
24374                 ndv=$($LFS data_version $dom)
24375                 (( $ndv != $odv )) ||
24376                         error "data version wasn't changed on fallocate punch"
24377         fi
24378 }
24379 run_test 270j "DoM migration: DOM file to the OST-striped file (plain)"
24380
24381 test_271a() {
24382         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
24383                 skip "Need MDS version at least 2.10.55"
24384
24385         local dom=$DIR/$tdir/dom
24386
24387         mkdir -p $DIR/$tdir
24388
24389         $LFS setstripe -E 1024K -L mdt $dom
24390
24391         lctl set_param -n mdc.*.stats=clear
24392         dd if=/dev/zero of=$dom bs=4096 count=1 || return 1
24393         cat $dom > /dev/null
24394         local reads=$(lctl get_param -n mdc.*.stats | grep -c ost_read)
24395         [ $reads -eq 0 ] || error "Unexpected $reads READ RPCs"
24396         ls $dom
24397         rm -f $dom
24398 }
24399 run_test 271a "DoM: data is cached for read after write"
24400
24401 test_271b() {
24402         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
24403                 skip "Need MDS version at least 2.10.55"
24404
24405         local dom=$DIR/$tdir/dom
24406
24407         mkdir -p $DIR/$tdir
24408
24409         $LFS setstripe -E 1024K -L mdt -E EOF $dom
24410
24411         lctl set_param -n mdc.*.stats=clear
24412         dd if=/dev/zero of=$dom bs=4096 count=1 || return 1
24413         cancel_lru_locks mdc
24414         $CHECKSTAT -t file -s 4096 $dom || error "stat #1 fails"
24415         # second stat to check size is cached on client
24416         $CHECKSTAT -t file -s 4096 $dom || error "stat #2 fails"
24417         local gls=$(lctl get_param -n mdc.*.stats | grep -c ldlm_glimpse)
24418         [ $gls -eq 0 ] || error "Unexpected $gls glimpse RPCs"
24419         rm -f $dom
24420 }
24421 run_test 271b "DoM: no glimpse RPC for stat (DoM only file)"
24422
24423 test_271ba() {
24424         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
24425                 skip "Need MDS version at least 2.10.55"
24426
24427         local dom=$DIR/$tdir/dom
24428
24429         mkdir -p $DIR/$tdir
24430
24431         $LFS setstripe -E 1024K -L mdt -E EOF $dom
24432
24433         lctl set_param -n mdc.*.stats=clear
24434         lctl set_param -n osc.*.stats=clear
24435         dd if=/dev/zero of=$dom bs=2048K count=1 || return 1
24436         cancel_lru_locks mdc
24437         $CHECKSTAT -t file -s 2097152 $dom || error "stat"
24438         # second stat to check size is cached on client
24439         $CHECKSTAT -t file -s 2097152 $dom || error "stat"
24440         local gls=$(lctl get_param -n mdc.*.stats | grep -c ldlm_glimpse)
24441         [ $gls == 0 ] || error "Unexpected $gls glimpse RPCs"
24442         local gls=$(lctl get_param -n osc.*.stats | grep -c ldlm_glimpse)
24443         [ $gls == 0 ] || error "Unexpected $gls OSC glimpse RPCs"
24444         rm -f $dom
24445 }
24446 run_test 271ba "DoM: no glimpse RPC for stat (combined file)"
24447
24448
24449 get_mdc_stats() {
24450         local mdtidx=$1
24451         local param=$2
24452         local mdt=MDT$(printf %04x $mdtidx)
24453
24454         if [ -z $param ]; then
24455                 lctl get_param -n mdc.*$mdt*.stats
24456         else
24457                 lctl get_param -n mdc.*$mdt*.stats | awk "/$param/"'{print $2}'
24458         fi
24459 }
24460
24461 test_271c() {
24462         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
24463                 skip "Need MDS version at least 2.10.55"
24464
24465         local dom=$DIR/$tdir/dom
24466
24467         mkdir -p $DIR/$tdir
24468
24469         $LFS setstripe -E 1024K -L mdt $DIR/$tdir
24470
24471         local mdtidx=$($LFS getstripe -m $DIR/$tdir)
24472         local facet=mds$((mdtidx + 1))
24473
24474         cancel_lru_locks mdc
24475         do_facet $facet lctl set_param -n mdt.*.dom_lock=0
24476         createmany -o $dom 1000
24477         lctl set_param -n mdc.*.stats=clear
24478         smalliomany -w $dom 1000 200
24479         get_mdc_stats $mdtidx
24480         local enq=$(get_mdc_stats $mdtidx ldlm_ibits_enqueue)
24481         # Each file has 1 open, 1 IO enqueues, total 2000
24482         # but now we have also +1 getxattr for security.capability, total 3000
24483         [ $enq -ge 2000 ] || error "Too few enqueues $enq, expected > 2000"
24484         unlinkmany $dom 1000
24485
24486         cancel_lru_locks mdc
24487         do_facet $facet lctl set_param -n mdt.*.dom_lock=1
24488         createmany -o $dom 1000
24489         lctl set_param -n mdc.*.stats=clear
24490         smalliomany -w $dom 1000 200
24491         local enq_2=$(get_mdc_stats $mdtidx ldlm_ibits_enqueue)
24492         # Expect to see reduced amount of RPCs by 1000 due to single enqueue
24493         # for OPEN and IO lock.
24494         [ $((enq - enq_2)) -ge 1000 ] ||
24495                 error "Too many enqueues $enq_2, expected about $((enq - 1000))"
24496         unlinkmany $dom 1000
24497         return 0
24498 }
24499 run_test 271c "DoM: IO lock at open saves enqueue RPCs"
24500
24501 cleanup_271def_tests() {
24502         trap 0
24503         rm -f $1
24504 }
24505
24506 test_271d() {
24507         [ $MDS1_VERSION -lt $(version_code 2.10.57) ] &&
24508                 skip "Need MDS version at least 2.10.57"
24509
24510         local dom=$DIR/$tdir/dom
24511         local tmp=$TMP/$tfile
24512         trap "cleanup_271def_tests $tmp" EXIT
24513
24514         mkdir -p $DIR/$tdir
24515
24516         $LFS setstripe -E 1024K -L mdt $DIR/$tdir
24517
24518         local mdtidx=$($LFS getstripe --mdt-index $DIR/$tdir)
24519
24520         cancel_lru_locks mdc
24521         dd if=/dev/urandom of=$tmp bs=1000 count=1
24522         dd if=$tmp of=$dom bs=1000 count=1
24523         cancel_lru_locks mdc
24524
24525         cat /etc/hosts >> $tmp
24526         lctl set_param -n mdc.*.stats=clear
24527
24528         # append data to the same file it should update local page
24529         echo "Append to the same page"
24530         cat /etc/hosts >> $dom
24531         local num=$(get_mdc_stats $mdtidx ost_read)
24532         local ra=$(get_mdc_stats $mdtidx req_active)
24533         local rw=$(get_mdc_stats $mdtidx req_waittime)
24534
24535         [ -z $num ] || error "$num READ RPC occured"
24536         [ $ra == $rw ] || error "$((ra - rw)) resend occured"
24537         echo "... DONE"
24538
24539         # compare content
24540         cmp $tmp $dom || error "file miscompare"
24541
24542         cancel_lru_locks mdc
24543         lctl set_param -n mdc.*.stats=clear
24544
24545         echo "Open and read file"
24546         cat $dom > /dev/null
24547         local num=$(get_mdc_stats $mdtidx ost_read)
24548         local ra=$(get_mdc_stats $mdtidx req_active)
24549         local rw=$(get_mdc_stats $mdtidx req_waittime)
24550
24551         [ -z $num ] || error "$num READ RPC occured"
24552         [ $ra == $rw ] || error "$((ra - rw)) resend occured"
24553         echo "... DONE"
24554
24555         # compare content
24556         cmp $tmp $dom || error "file miscompare"
24557
24558         return 0
24559 }
24560 run_test 271d "DoM: read on open (1K file in reply buffer)"
24561
24562 test_271f() {
24563         [ $MDS1_VERSION -lt $(version_code 2.10.57) ] &&
24564                 skip "Need MDS version at least 2.10.57"
24565
24566         local dom=$DIR/$tdir/dom
24567         local tmp=$TMP/$tfile
24568         trap "cleanup_271def_tests $tmp" EXIT
24569
24570         mkdir -p $DIR/$tdir
24571
24572         $LFS setstripe -E 1024K -L mdt $DIR/$tdir
24573
24574         local mdtidx=$($LFS getstripe --mdt-index $DIR/$tdir)
24575
24576         cancel_lru_locks mdc
24577         dd if=/dev/urandom of=$tmp bs=265000 count=1
24578         dd if=$tmp of=$dom bs=265000 count=1
24579         cancel_lru_locks mdc
24580         cat /etc/hosts >> $tmp
24581         lctl set_param -n mdc.*.stats=clear
24582
24583         echo "Append to the same page"
24584         cat /etc/hosts >> $dom
24585         local num=$(get_mdc_stats $mdtidx ost_read)
24586         local ra=$(get_mdc_stats $mdtidx req_active)
24587         local rw=$(get_mdc_stats $mdtidx req_waittime)
24588
24589         [ -z $num ] || error "$num READ RPC occured"
24590         [ $ra == $rw ] || error "$((ra - rw)) resend occured"
24591         echo "... DONE"
24592
24593         # compare content
24594         cmp $tmp $dom || error "file miscompare"
24595
24596         cancel_lru_locks mdc
24597         lctl set_param -n mdc.*.stats=clear
24598
24599         echo "Open and read file"
24600         cat $dom > /dev/null
24601         local num=$(get_mdc_stats $mdtidx ost_read)
24602         local ra=$(get_mdc_stats $mdtidx req_active)
24603         local rw=$(get_mdc_stats $mdtidx req_waittime)
24604
24605         [ -z $num ] && num=0
24606         [ $num -eq 1 ] || error "expect 1 READ RPC, $num occured"
24607         [ $ra == $rw ] || error "$((ra - rw)) resend occured"
24608         echo "... DONE"
24609
24610         # compare content
24611         cmp $tmp $dom || error "file miscompare"
24612
24613         return 0
24614 }
24615 run_test 271f "DoM: read on open (200K file and read tail)"
24616
24617 test_271g() {
24618         [[ $($LCTL get_param mdc.*.import) =~ async_discard ]] ||
24619                 skip "Skipping due to old client or server version"
24620
24621         $LFS setstripe -E 1024K -L mdt -E EOF $DIR1/$tfile
24622         # to get layout
24623         $CHECKSTAT -t file $DIR1/$tfile
24624
24625         $MULTIOP $DIR1/$tfile Ow40960_w4096c &
24626         MULTIOP_PID=$!
24627         sleep 1
24628         #define OBD_FAIL_LDLM_CANCEL_BL_CB_RACE
24629         $LCTL set_param fail_loc=0x80000314
24630         rm $DIR1/$tfile || error "Unlink fails"
24631         RC=$?
24632         kill -USR1 $MULTIOP_PID && wait $MULTIOP_PID || error "multiop failure"
24633         [ $RC -eq 0 ] || error "Failed write to stale object"
24634 }
24635 run_test 271g "Discard DoM data vs client flush race"
24636
24637 test_272a() {
24638         [ $MDS1_VERSION -lt $(version_code 2.11.50) ] &&
24639                 skip "Need MDS version at least 2.11.50"
24640
24641         local dom=$DIR/$tdir/dom
24642         mkdir -p $DIR/$tdir
24643
24644         $LFS setstripe -E 256K -L mdt -E -1 -c1 $dom
24645         dd if=/dev/urandom of=$dom bs=512K count=1 ||
24646                 error "failed to write data into $dom"
24647         local old_md5=$(md5sum $dom)
24648
24649         $LFS migrate -E 256K -L mdt -E -1 -c2 $dom ||
24650                 error "failed to migrate to the same DoM component"
24651
24652         local new_md5=$(md5sum $dom)
24653
24654         [ "$old_md5" == "$new_md5" ] ||
24655                 error "md5sum differ: $old_md5, $new_md5"
24656
24657         [ $($LFS getstripe -c $dom) -eq 2 ] ||
24658                 error "bad final stripe count: $($LFS getstripe -c $dom) != 2"
24659 }
24660 run_test 272a "DoM migration: new layout with the same DOM component"
24661
24662 test_272b() {
24663         [ $MDS1_VERSION -lt $(version_code 2.11.50) ] &&
24664                 skip "Need MDS version at least 2.11.50"
24665
24666         local dom=$DIR/$tdir/dom
24667         mkdir -p $DIR/$tdir
24668         $LFS setstripe -E 1M -L mdt -E -1 -c1 $dom
24669         stack_trap "rm -rf $DIR/$tdir"
24670
24671         local mdtidx=$($LFS getstripe -m $dom)
24672         local mdtname=MDT$(printf %04x $mdtidx)
24673         local facet=mds$((mdtidx + 1))
24674
24675         local mdtfree1=$(do_facet $facet \
24676                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24677         dd if=/dev/urandom of=$dom bs=2M count=1 ||
24678                 error "failed to write data into $dom"
24679         local old_md5=$(md5sum $dom)
24680         cancel_lru_locks mdc
24681         local mdtfree1=$(do_facet $facet \
24682                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24683
24684         $LFS migrate -c2 $dom ||
24685                 error "failed to migrate to the new composite layout"
24686         [[ $($LFS getstripe --component-start=0 -L $dom) != 'mdt' ]] ||
24687                 error "MDT stripe was not removed"
24688         ! getfattr -n trusted.dataver $dom &> /dev/null ||
24689                 error "$dir1 shouldn't have DATAVER EA"
24690
24691         cancel_lru_locks mdc
24692         local new_md5=$(md5sum $dom)
24693         [ "$old_md5" == "$new_md5" ] ||
24694                 error "$old_md5 != $new_md5"
24695
24696         # Skip free space checks with ZFS
24697         if [ "$(facet_fstype $facet)" != "zfs" ]; then
24698                 local mdtfree2=$(do_facet $facet \
24699                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24700                 [ $mdtfree2 -gt $mdtfree1 ] ||
24701                         error "MDT space is not freed after migration"
24702         fi
24703         return 0
24704 }
24705 run_test 272b "DoM migration: DOM file to the OST-striped file (plain)"
24706
24707 test_272c() {
24708         [ $MDS1_VERSION -lt $(version_code 2.11.50) ] &&
24709                 skip "Need MDS version at least 2.11.50"
24710
24711         local dom=$DIR/$tdir/$tfile
24712         mkdir -p $DIR/$tdir
24713         $LFS setstripe -E 1M -L mdt -E -1 -c1 $dom
24714         stack_trap "rm -rf $DIR/$tdir"
24715
24716         local mdtidx=$($LFS getstripe -m $dom)
24717         local mdtname=MDT$(printf %04x $mdtidx)
24718         local facet=mds$((mdtidx + 1))
24719
24720         dd if=/dev/urandom of=$dom bs=2M count=1 oflag=direct ||
24721                 error "failed to write data into $dom"
24722         local old_md5=$(md5sum $dom)
24723         cancel_lru_locks mdc
24724         local mdtfree1=$(do_facet $facet \
24725                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24726
24727         $LFS migrate -E 2M -c1 -E -1 -c2 $dom ||
24728                 error "failed to migrate to the new composite layout"
24729         [[ $($LFS getstripe --component-start=0 -L $dom) != 'mdt' ]] ||
24730                 error "MDT stripe was not removed"
24731
24732         cancel_lru_locks mdc
24733         local new_md5=$(md5sum $dom)
24734         [ "$old_md5" == "$new_md5" ] ||
24735                 error "$old_md5 != $new_md5"
24736
24737         # Skip free space checks with ZFS
24738         if [ "$(facet_fstype $facet)" != "zfs" ]; then
24739                 local mdtfree2=$(do_facet $facet \
24740                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24741                 [ $mdtfree2 -gt $mdtfree1 ] ||
24742                         error "MDS space is not freed after migration"
24743         fi
24744         return 0
24745 }
24746 run_test 272c "DoM migration: DOM file to the OST-striped file (composite)"
24747
24748 test_272d() {
24749         [ $MDS1_VERSION -lt $(version_code 2.12.55) ] &&
24750                 skip "Need MDS version at least 2.12.55"
24751
24752         local dom=$DIR/$tdir/$tfile
24753         mkdir -p $DIR/$tdir
24754         $LFS setstripe -E 1M -L mdt -E -1 -c1 $dom
24755
24756         local mdtidx=$($LFS getstripe -m $dom)
24757         local mdtname=MDT$(printf %04x $mdtidx)
24758         local facet=mds$((mdtidx + 1))
24759
24760         dd if=/dev/urandom of=$dom bs=2M count=1 oflag=direct ||
24761                 error "failed to write data into $dom"
24762         local old_md5=$(md5sum $dom)
24763         cancel_lru_locks mdc
24764         local mdtfree1=$(do_facet $facet \
24765                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24766
24767         $LFS mirror extend -N -E 2M -c1 -E -1 -c2 $dom ||
24768                 error "failed mirroring to the new composite layout"
24769         $LFS mirror resync $dom ||
24770                 error "failed mirror resync"
24771         $LFS mirror split --mirror-id 1 -d $dom ||
24772                 error "failed mirror split"
24773
24774         [ $($LFS getstripe -L $dom) != 'mdt' ] ||
24775                 error "MDT stripe was not removed"
24776
24777         cancel_lru_locks mdc
24778         local new_md5=$(md5sum $dom)
24779         [ "$old_md5" == "$new_md5" ] ||
24780                 error "$old_md5 != $new_md5"
24781
24782         # Skip free space checks with ZFS
24783         if [ "$(facet_fstype $facet)" != "zfs" ]; then
24784                 local mdtfree2=$(do_facet $facet \
24785                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24786                 [ $mdtfree2 -gt $mdtfree1 ] ||
24787                         error "MDS space is not freed after DOM mirror deletion"
24788         fi
24789         return 0
24790 }
24791 run_test 272d "DoM mirroring: OST-striped mirror to DOM file"
24792
24793 test_272e() {
24794         [ $MDS1_VERSION -lt $(version_code 2.12.55) ] &&
24795                 skip "Need MDS version at least 2.12.55"
24796
24797         local dom=$DIR/$tdir/$tfile
24798         mkdir -p $DIR/$tdir
24799         $LFS setstripe -c 2 $dom
24800
24801         dd if=/dev/urandom of=$dom bs=2M count=1 oflag=direct ||
24802                 error "failed to write data into $dom"
24803         local old_md5=$(md5sum $dom)
24804         cancel_lru_locks
24805
24806         $LFS mirror extend -N -E 1M -L mdt -E eof -c2 $dom ||
24807                 error "failed mirroring to the DOM layout"
24808         $LFS mirror resync $dom ||
24809                 error "failed mirror resync"
24810         $LFS mirror split --mirror-id 1 -d $dom ||
24811                 error "failed mirror split"
24812
24813         [[ $($LFS getstripe -L --component-start=0 $dom) == 'mdt' ]] ||
24814                 error "MDT stripe wasn't set"
24815
24816         cancel_lru_locks
24817         local new_md5=$(md5sum $dom)
24818         [ "$old_md5" == "$new_md5" ] ||
24819                 error "$old_md5 != $new_md5"
24820
24821         return 0
24822 }
24823 run_test 272e "DoM mirroring: DOM mirror to the OST-striped file"
24824
24825 test_272f() {
24826         [ $MDS1_VERSION -lt $(version_code 2.12.55) ] &&
24827                 skip "Need MDS version at least 2.12.55"
24828
24829         local dom=$DIR/$tdir/$tfile
24830         mkdir -p $DIR/$tdir
24831         $LFS setstripe -c 2 $dom
24832
24833         dd if=/dev/urandom of=$dom bs=2M count=1 oflag=direct ||
24834                 error "failed to write data into $dom"
24835         local old_md5=$(md5sum $dom)
24836         cancel_lru_locks
24837
24838         $LFS migrate -E 1M -L mdt -E eof -c2 -v $dom ||
24839                 error "failed migrating to the DOM file"
24840
24841         [[ $($LFS getstripe -L --component-start=0 $dom) == 'mdt' ]] ||
24842                 error "MDT stripe wasn't set"
24843
24844         cancel_lru_locks
24845         local new_md5=$(md5sum $dom)
24846         [ "$old_md5" != "$new_md5" ] &&
24847                 error "$old_md5 != $new_md5"
24848
24849         return 0
24850 }
24851 run_test 272f "DoM migration: OST-striped file to DOM file"
24852
24853 test_273a() {
24854         [ $MDS1_VERSION -lt $(version_code 2.11.50) ] &&
24855                 skip "Need MDS version at least 2.11.50"
24856
24857         # Layout swap cannot be done if either file has DOM component,
24858         # this will never be supported, migration should be used instead
24859
24860         local dom=$DIR/$tdir/$tfile
24861         mkdir -p $DIR/$tdir
24862
24863         $LFS setstripe -c2 ${dom}_plain
24864         $LFS setstripe -E 1M -L mdt -E -1 -c2 ${dom}_dom
24865         $LFS swap_layouts ${dom}_plain ${dom}_dom &&
24866                 error "can swap layout with DoM component"
24867         $LFS swap_layouts ${dom}_dom ${dom}_plain &&
24868                 error "can swap layout with DoM component"
24869
24870         $LFS setstripe -E 1M -c1 -E -1 -c2 ${dom}_comp
24871         $LFS swap_layouts ${dom}_comp ${dom}_dom &&
24872                 error "can swap layout with DoM component"
24873         $LFS swap_layouts ${dom}_dom ${dom}_comp &&
24874                 error "can swap layout with DoM component"
24875         return 0
24876 }
24877 run_test 273a "DoM: layout swapping should fail with DOM"
24878
24879 test_273b() {
24880         mkdir -p $DIR/$tdir
24881         $LFS setstripe -E 1M -L mdt -E -1 -c -1 $DIR/$tdir
24882
24883 #define OBD_FAIL_MDS_COMMITRW_DELAY      0x16b
24884         do_facet mds1 $LCTL set_param fail_loc=0x8000016b fail_val=2
24885
24886         $MULTIOP $DIR/$tdir/$tfile Ouw2097152c
24887 }
24888 run_test 273b "DoM: race writeback and object destroy"
24889
24890 test_273c() {
24891         mkdir -p $DIR/$tdir
24892         $LFS setstripe -E 1M -E-1 -c-1 $DIR/$tdir
24893
24894         #define OBD_FAIL_OFD_COMMITRW_DELAY      0x1e1
24895         do_facet ost1 $LCTL set_param fail_loc=0x800001e1 fail_val=2
24896
24897         $MULTIOP $DIR/$tdir/$tfile Ouw2097152c
24898 }
24899 run_test 273c "race writeback and object destroy"
24900
24901 test_275() {
24902         remote_ost_nodsh && skip "remote OST with nodsh"
24903         [ $OST1_VERSION -lt $(version_code 2.10.57) ] &&
24904                 skip "Need OST version >= 2.10.57"
24905
24906         local file=$DIR/$tfile
24907         local oss
24908
24909         oss=$(comma_list $(osts_nodes))
24910
24911         dd if=/dev/urandom of=$file bs=1M count=2 ||
24912                 error "failed to create a file"
24913         stack_trap "rm -f $file"
24914         cancel_lru_locks osc
24915
24916         #lock 1
24917         dd if=$file of=/dev/null bs=1M count=1 iflag=direct ||
24918                 error "failed to read a file"
24919
24920 #define OBD_FAIL_LDLM_PAUSE_CANCEL2      0x31f
24921         $LCTL set_param fail_loc=0x8000031f
24922
24923         cancel_lru_locks osc &
24924         sleep 1
24925
24926 #define OBD_FAIL_LDLM_PROLONG_PAUSE      0x32b
24927         do_nodes $oss $LCTL set_param fail_loc=0x8000032b
24928         #IO takes another lock, but matches the PENDING one
24929         #and places it to the IO RPC
24930         dd if=$file of=/dev/null bs=1M count=1 iflag=direct ||
24931                 error "failed to read a file with PENDING lock"
24932 }
24933 run_test 275 "Read on a canceled duplicate lock"
24934
24935 test_276() {
24936         remote_ost_nodsh && skip "remote OST with nodsh"
24937         local pid
24938
24939         do_facet ost1 "(while true; do \
24940                 $LCTL get_param obdfilter.*.filesfree > /dev/null 2>&1; \
24941                 done) & pid=\\\$!; echo \\\$pid > $TMP/sanity_276_pid" &
24942         pid=$!
24943
24944         for LOOP in $(seq 20); do
24945                 stop ost1
24946                 start ost1 $(ostdevname 1) $OST_MOUNT_OPTS
24947         done
24948         kill -9 $pid
24949         do_facet ost1 "pid=\\\$(cat $TMP/sanity_276_pid); kill -9 \\\$pid; \
24950                 rm $TMP/sanity_276_pid"
24951 }
24952 run_test 276 "Race between mount and obd_statfs"
24953
24954 test_277() {
24955         $LCTL set_param ldlm.namespaces.*.lru_size=0
24956         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
24957         local cached_mb=$($LCTL get_param llite.*.max_cached_mb |
24958                           awk '/^used_mb/ { print $2 }')
24959         [ $cached_mb -eq 1 ] || error "expected mb 1 got $cached_mb"
24960         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 \
24961                 oflag=direct conv=notrunc
24962         cached_mb=$($LCTL get_param llite.*.max_cached_mb |
24963                     awk '/^used_mb/ { print $2 }')
24964         [ $cached_mb -eq 0 ] || error "expected mb 0 got $cached_mb"
24965 }
24966 run_test 277 "Direct IO shall drop page cache"
24967
24968 test_278() {
24969         [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
24970         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
24971         [[ "$(facet_host mds1)" != "$(facet_host mds2)" ]] &&
24972                 skip "needs the same host for mdt1 mdt2" && return
24973
24974         local pid1
24975         local pid2
24976
24977 #define OBD_FAIL_OBD_STOP_MDS_RACE     0x60b
24978         do_facet mds2 $LCTL set_param fail_loc=0x8000060c
24979         stop mds2 &
24980         pid2=$!
24981
24982         stop mds1
24983
24984         echo "Starting MDTs"
24985         start mds1 $(mdsdevname 1) $MDS_MOUNT_OPTS
24986         wait $pid2
24987 #For the error assertion will happen. lu_env_get_key(..., &mdt_thread_key)
24988 #will return NULL
24989         do_facet mds2 $LCTL set_param fail_loc=0
24990
24991         start mds2 $(mdsdevname 2) $MDS_MOUNT_OPTS
24992         wait_recovery_complete mds2
24993 }
24994 run_test 278 "Race starting MDS between MDTs stop/start"
24995
24996 test_280() {
24997         [ $MGS_VERSION -lt $(version_code 2.13.52) ] &&
24998                 skip "Need MGS version at least 2.13.52"
24999         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25000         combined_mgs_mds || skip "needs combined MGS/MDT"
25001
25002         umount_client $MOUNT
25003 #define OBD_FAIL_MDS_LLOG_UMOUNT_RACE   0x15e
25004         do_facet mgs $LCTL set_param fail_loc=0x8000015e fail_val=0
25005
25006         mount_client $MOUNT &
25007         sleep 1
25008         stop mgs || error "stop mgs failed"
25009         #for a race mgs would crash
25010         start mgs $(mgsdevname) $MGS_MOUNT_OPTS || error "start mgs failed"
25011         # make sure we unmount client before remounting
25012         wait
25013         umount_client $MOUNT
25014         mount_client $MOUNT || error "mount client failed"
25015 }
25016 run_test 280 "Race between MGS umount and client llog processing"
25017
25018 cleanup_test_300() {
25019         trap 0
25020         umask $SAVE_UMASK
25021 }
25022 test_striped_dir() {
25023         local mdt_index=$1
25024         local stripe_count
25025         local stripe_index
25026
25027         mkdir -p $DIR/$tdir
25028
25029         SAVE_UMASK=$(umask)
25030         trap cleanup_test_300 RETURN EXIT
25031
25032         $LFS setdirstripe -i $mdt_index -c 2 -H all_char -o 755 \
25033                                                 $DIR/$tdir/striped_dir ||
25034                 error "set striped dir error"
25035
25036         local mode=$(stat -c%a $DIR/$tdir/striped_dir)
25037         [ "$mode" = "755" ] || error "expect 755 got $mode"
25038
25039         $LFS getdirstripe $DIR/$tdir/striped_dir > /dev/null 2>&1 ||
25040                 error "getdirstripe failed"
25041         stripe_count=$($LFS getdirstripe -c $DIR/$tdir/striped_dir)
25042         if [ "$stripe_count" != "2" ]; then
25043                 error "1:stripe_count is $stripe_count, expect 2"
25044         fi
25045         stripe_count=$($LFS getdirstripe -T $DIR/$tdir/striped_dir)
25046         if [ "$stripe_count" != "2" ]; then
25047                 error "2:stripe_count is $stripe_count, expect 2"
25048         fi
25049
25050         stripe_index=$($LFS getdirstripe -i $DIR/$tdir/striped_dir)
25051         if [ "$stripe_index" != "$mdt_index" ]; then
25052                 error "stripe_index is $stripe_index, expect $mdt_index"
25053         fi
25054
25055         [ $(stat -c%h $DIR/$tdir/striped_dir) == '2' ] ||
25056                 error "nlink error after create striped dir"
25057
25058         mkdir $DIR/$tdir/striped_dir/a
25059         mkdir $DIR/$tdir/striped_dir/b
25060
25061         stat $DIR/$tdir/striped_dir/a ||
25062                 error "create dir under striped dir failed"
25063         stat $DIR/$tdir/striped_dir/b ||
25064                 error "create dir under striped dir failed"
25065
25066         [ $(stat -c%h $DIR/$tdir/striped_dir) == '4' ] ||
25067                 error "nlink error after mkdir"
25068
25069         rmdir $DIR/$tdir/striped_dir/a
25070         [ $(stat -c%h $DIR/$tdir/striped_dir) == '3' ] ||
25071                 error "nlink error after rmdir"
25072
25073         rmdir $DIR/$tdir/striped_dir/b
25074         [ $(stat -c%h $DIR/$tdir/striped_dir) == '2' ] ||
25075                 error "nlink error after rmdir"
25076
25077         chattr +i $DIR/$tdir/striped_dir
25078         createmany -o $DIR/$tdir/striped_dir/f 10 &&
25079                 error "immutable flags not working under striped dir!"
25080         chattr -i $DIR/$tdir/striped_dir
25081
25082         rmdir $DIR/$tdir/striped_dir ||
25083                 error "rmdir striped dir error"
25084
25085         cleanup_test_300
25086
25087         true
25088 }
25089
25090 test_300a() {
25091         [ $MDS1_VERSION -lt $(version_code 2.7.0) ] &&
25092                 skip "skipped for lustre < 2.7.0"
25093         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25094         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25095
25096         test_striped_dir 0 || error "failed on striped dir on MDT0"
25097         test_striped_dir 1 || error "failed on striped dir on MDT0"
25098 }
25099 run_test 300a "basic striped dir sanity test"
25100
25101 test_300b() {
25102         [ $MDS1_VERSION -lt $(version_code 2.7.0) ] &&
25103                 skip "skipped for lustre < 2.7.0"
25104         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25105         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25106
25107         local i
25108         local mtime1
25109         local mtime2
25110         local mtime3
25111
25112         test_mkdir $DIR/$tdir || error "mkdir fail"
25113         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir ||
25114                 error "set striped dir error"
25115         for i in {0..9}; do
25116                 mtime1=$(stat -c %Y $DIR/$tdir/striped_dir)
25117                 sleep 1
25118                 touch $DIR/$tdir/striped_dir/file_$i || error "touch error $i"
25119                 mtime2=$(stat -c %Y $DIR/$tdir/striped_dir)
25120                 [ $mtime1 -eq $mtime2 ] && error "mtime unchanged after create"
25121                 sleep 1
25122                 rm -f $DIR/$tdir/striped_dir/file_$i || error "unlink error $i"
25123                 mtime3=$(stat -c %Y $DIR/$tdir/striped_dir)
25124                 [ $mtime2 -eq $mtime3 ] && error "mtime unchanged after unlink"
25125         done
25126         true
25127 }
25128 run_test 300b "check ctime/mtime for striped dir"
25129
25130 test_300c() {
25131         [ $MDS1_VERSION -lt $(version_code 2.7.0) ] &&
25132                 skip "skipped for lustre < 2.7.0"
25133         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25134         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25135
25136         local file_count
25137
25138         mkdir_on_mdt0 $DIR/$tdir
25139         $LFS setdirstripe -i 0 -c 2 $DIR/$tdir/striped_dir ||
25140                 error "set striped dir error"
25141
25142         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/striped_dir ||
25143                 error "chown striped dir failed"
25144
25145         $RUNAS createmany -o $DIR/$tdir/striped_dir/f 5000 ||
25146                 error "create 5k files failed"
25147
25148         file_count=$(ls $DIR/$tdir/striped_dir | wc -l)
25149
25150         [ "$file_count" = 5000 ] || error "file count $file_count != 5000"
25151
25152         rm -rf $DIR/$tdir
25153 }
25154 run_test 300c "chown && check ls under striped directory"
25155
25156 test_300d() {
25157         [ $MDS1_VERSION -lt $(version_code 2.7.0) ] &&
25158                 skip "skipped for lustre < 2.7.0"
25159         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25160         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25161
25162         local stripe_count
25163         local file
25164
25165         mkdir -p $DIR/$tdir
25166         $LFS setstripe -c 2 $DIR/$tdir
25167
25168         #local striped directory
25169         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir ||
25170                 error "set striped dir error"
25171         #look at the directories for debug purposes
25172         ls -l $DIR/$tdir
25173         $LFS getdirstripe $DIR/$tdir
25174         ls -l $DIR/$tdir/striped_dir
25175         $LFS getdirstripe $DIR/$tdir/striped_dir
25176         createmany -o $DIR/$tdir/striped_dir/f 10 ||
25177                 error "create 10 files failed"
25178
25179         #remote striped directory
25180         $LFS setdirstripe -i 1 -c 2 $DIR/$tdir/remote_striped_dir ||
25181                 error "set striped dir error"
25182         #look at the directories for debug purposes
25183         ls -l $DIR/$tdir
25184         $LFS getdirstripe $DIR/$tdir
25185         ls -l $DIR/$tdir/remote_striped_dir
25186         $LFS getdirstripe $DIR/$tdir/remote_striped_dir
25187         createmany -o $DIR/$tdir/remote_striped_dir/f 10 ||
25188                 error "create 10 files failed"
25189
25190         for file in $(find $DIR/$tdir); do
25191                 stripe_count=$($LFS getstripe -c $file)
25192                 [ $stripe_count -eq 2 ] ||
25193                         error "wrong stripe $stripe_count for $file"
25194         done
25195
25196         rm -rf $DIR/$tdir
25197 }
25198 run_test 300d "check default stripe under striped directory"
25199
25200 test_300e() {
25201         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25202                 skip "Need MDS version at least 2.7.55"
25203         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25204         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25205
25206         local stripe_count
25207         local file
25208
25209         mkdir -p $DIR/$tdir
25210
25211         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir ||
25212                 error "set striped dir error"
25213
25214         touch $DIR/$tdir/striped_dir/a
25215         touch $DIR/$tdir/striped_dir/b
25216         touch $DIR/$tdir/striped_dir/c
25217
25218         mkdir $DIR/$tdir/striped_dir/dir_a
25219         mkdir $DIR/$tdir/striped_dir/dir_b
25220         mkdir $DIR/$tdir/striped_dir/dir_c
25221
25222         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir/stp_a ||
25223                 error "set striped adir under striped dir error"
25224
25225         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir/stp_b ||
25226                 error "set striped bdir under striped dir error"
25227
25228         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir/stp_c ||
25229                 error "set striped cdir under striped dir error"
25230
25231         mrename $DIR/$tdir/striped_dir/dir_a $DIR/$tdir/striped_dir/dir_b ||
25232                 error "rename dir under striped dir fails"
25233
25234         mrename $DIR/$tdir/striped_dir/stp_a $DIR/$tdir/striped_dir/stp_b ||
25235                 error "rename dir under different stripes fails"
25236
25237         mrename $DIR/$tdir/striped_dir/a $DIR/$tdir/striped_dir/c ||
25238                 error "rename file under striped dir should succeed"
25239
25240         mrename $DIR/$tdir/striped_dir/dir_b $DIR/$tdir/striped_dir/dir_c ||
25241                 error "rename dir under striped dir should succeed"
25242
25243         rm -rf $DIR/$tdir
25244 }
25245 run_test 300e "check rename under striped directory"
25246
25247 test_300f() {
25248         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25249         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25250         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25251                 skip "Need MDS version at least 2.7.55"
25252
25253         local stripe_count
25254         local file
25255
25256         rm -rf $DIR/$tdir
25257         mkdir -p $DIR/$tdir
25258
25259         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir ||
25260                 error "set striped dir error"
25261
25262         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir1 ||
25263                 error "set striped dir error"
25264
25265         touch $DIR/$tdir/striped_dir/a
25266         mkdir $DIR/$tdir/striped_dir/dir_a
25267         $LFS setdirstripe -i 0 -c 2 $DIR/$tdir/striped_dir/stp_a ||
25268                 error "create striped dir under striped dir fails"
25269
25270         touch $DIR/$tdir/striped_dir1/b
25271         mkdir $DIR/$tdir/striped_dir1/dir_b
25272         $LFS setdirstripe -i 0 -c 2 $DIR/$tdir/striped_dir/stp_b ||
25273                 error "create striped dir under striped dir fails"
25274
25275         mrename $DIR/$tdir/striped_dir/dir_a $DIR/$tdir/striped_dir1/dir_b ||
25276                 error "rename dir under different striped dir should fail"
25277
25278         mrename $DIR/$tdir/striped_dir/stp_a $DIR/$tdir/striped_dir1/stp_b ||
25279                 error "rename striped dir under diff striped dir should fail"
25280
25281         mrename $DIR/$tdir/striped_dir/a $DIR/$tdir/striped_dir1/a ||
25282                 error "rename file under diff striped dirs fails"
25283
25284         rm -rf $DIR/$tdir
25285 }
25286 run_test 300f "check rename cross striped directory"
25287
25288 test_300_check_default_striped_dir()
25289 {
25290         local dirname=$1
25291         local default_count=$2
25292         local default_index=$3
25293         local stripe_count
25294         local stripe_index
25295         local dir_stripe_index
25296         local dir
25297
25298         echo "checking $dirname $default_count $default_index"
25299         $LFS setdirstripe -D -c $default_count -i $default_index \
25300                                 -H all_char $DIR/$tdir/$dirname ||
25301                 error "set default stripe on striped dir error"
25302         stripe_count=$($LFS getdirstripe -D -c $DIR/$tdir/$dirname)
25303         [ $stripe_count -eq $default_count ] ||
25304                 error "expect $default_count get $stripe_count for $dirname"
25305
25306         stripe_index=$($LFS getdirstripe -D -i $DIR/$tdir/$dirname)
25307         [ $stripe_index -eq $default_index ] ||
25308                 error "expect $default_index get $stripe_index for $dirname"
25309
25310         mkdir $DIR/$tdir/$dirname/{test1,test2,test3,test4} ||
25311                                                 error "create dirs failed"
25312
25313         createmany -o $DIR/$tdir/$dirname/f- 10 || error "create files failed"
25314         unlinkmany $DIR/$tdir/$dirname/f- 10    || error "unlink files failed"
25315         for dir in $(find $DIR/$tdir/$dirname/*); do
25316                 stripe_count=$($LFS getdirstripe -c $dir)
25317                 (( $stripe_count == $default_count )) ||
25318                 (( $stripe_count == $MDSCOUNT && $default_count == -1 )) ||
25319                 (( $stripe_count == 0 )) || (( $default_count == 1 )) ||
25320                 error "stripe count $default_count != $stripe_count for $dir"
25321
25322                 stripe_index=$($LFS getdirstripe -i $dir)
25323                 [ $default_index -eq -1 ] ||
25324                         [ $stripe_index -eq $default_index ] ||
25325                         error "$stripe_index != $default_index for $dir"
25326
25327                 #check default stripe
25328                 stripe_count=$($LFS getdirstripe -D -c $dir)
25329                 [ $stripe_count -eq $default_count ] ||
25330                 error "default count $default_count != $stripe_count for $dir"
25331
25332                 stripe_index=$($LFS getdirstripe -D -i $dir)
25333                 [ $stripe_index -eq $default_index ] ||
25334                 error "default index $default_index != $stripe_index for $dir"
25335         done
25336         rmdir $DIR/$tdir/$dirname/* || error "rmdir failed"
25337 }
25338
25339 test_300g() {
25340         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25341         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25342                 skip "Need MDS version at least 2.7.55"
25343
25344         local dir
25345         local stripe_count
25346         local stripe_index
25347
25348         mkdir_on_mdt0 $DIR/$tdir
25349         mkdir $DIR/$tdir/normal_dir
25350
25351         #Checking when client cache stripe index
25352         $LFS setdirstripe -c$MDSCOUNT $DIR/$tdir/striped_dir
25353         $LFS setdirstripe -D -i1 $DIR/$tdir/striped_dir ||
25354                 error "create striped_dir failed"
25355
25356         $LFS setdirstripe -i0 $DIR/$tdir/striped_dir/dir0 ||
25357                 error "create dir0 fails"
25358         stripe_index=$($LFS getdirstripe -i $DIR/$tdir/striped_dir/dir0)
25359         [ $stripe_index -eq 0 ] ||
25360                 error "dir0 expect index 0 got $stripe_index"
25361
25362         mkdir $DIR/$tdir/striped_dir/dir1 ||
25363                 error "create dir1 fails"
25364         stripe_index=$($LFS getdirstripe -i $DIR/$tdir/striped_dir/dir1)
25365         [ $stripe_index -eq 1 ] ||
25366                 error "dir1 expect index 1 got $stripe_index"
25367
25368         #check default stripe count/stripe index
25369         test_300_check_default_striped_dir normal_dir $MDSCOUNT 1
25370         test_300_check_default_striped_dir normal_dir 1 0
25371         test_300_check_default_striped_dir normal_dir -1 1
25372         test_300_check_default_striped_dir normal_dir 2 -1
25373
25374         #delete default stripe information
25375         echo "delete default stripeEA"
25376         $LFS setdirstripe -d $DIR/$tdir/normal_dir ||
25377                 error "set default stripe on striped dir error"
25378
25379         mkdir -p $DIR/$tdir/normal_dir/{test1,test2,test3,test4}
25380         for dir in $(find $DIR/$tdir/normal_dir/*); do
25381                 stripe_count=$($LFS getdirstripe -c $dir)
25382                 [ $stripe_count -eq 0 ] ||
25383                         error "expect 1 get $stripe_count for $dir"
25384         done
25385 }
25386 run_test 300g "check default striped directory for normal directory"
25387
25388 test_300h() {
25389         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25390         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25391                 skip "Need MDS version at least 2.7.55"
25392
25393         local dir
25394         local stripe_count
25395
25396         mkdir $DIR/$tdir
25397         $LFS setdirstripe -i0 -c$MDSCOUNT -H all_char $DIR/$tdir/striped_dir ||
25398                 error "set striped dir error"
25399
25400         test_300_check_default_striped_dir striped_dir $MDSCOUNT 1
25401         test_300_check_default_striped_dir striped_dir 1 0
25402         test_300_check_default_striped_dir striped_dir -1 1
25403         test_300_check_default_striped_dir striped_dir 2 -1
25404
25405         #delete default stripe information
25406         $LFS setdirstripe -d $DIR/$tdir/striped_dir ||
25407                 error "set default stripe on striped dir error"
25408
25409         mkdir -p $DIR/$tdir/striped_dir/{test1,test2,test3,test4}
25410         for dir in $(find $DIR/$tdir/striped_dir/*); do
25411                 stripe_count=$($LFS getdirstripe -c $dir)
25412                 [ $stripe_count -eq 0 ] ||
25413                         error "expect 1 get $stripe_count for $dir"
25414         done
25415 }
25416 run_test 300h "check default striped directory for striped directory"
25417
25418 test_300i() {
25419         [[ $PARALLEL == "yes" ]] && skip "skip parallel run"
25420         (( $MDSCOUNT >= 2 )) || skip_env "needs >= 2 MDTs"
25421         (( $MDS1_VERSION >= $(version_code 2.7.55) )) ||
25422                 skip "Need MDS version at least 2.7.55"
25423
25424         local stripe_count
25425         local file
25426
25427         mkdir $DIR/$tdir
25428
25429         $LFS setdirstripe -i 0 -c$MDSCOUNT -H all_char $DIR/$tdir/striped_dir ||
25430                 error "set striped dir error"
25431
25432         createmany -o $DIR/$tdir/striped_dir/f- 10 ||
25433                 error "create files under striped dir failed"
25434
25435         $LFS setdirstripe -i0 -c$MDSCOUNT -H all_char $DIR/$tdir/hashdir ||
25436                 error "set striped hashdir error"
25437
25438         $LFS setdirstripe -i0 -c$MDSCOUNT -H all_char $DIR/$tdir/hashdir/d0 ||
25439                 error "create dir0 under hash dir failed"
25440         $LFS setdirstripe -i0 -c$MDSCOUNT -H fnv_1a_64 $DIR/$tdir/hashdir/d1 ||
25441                 error "create dir1 under hash dir failed"
25442         $LFS setdirstripe -i0 -c$MDSCOUNT -H crush $DIR/$tdir/hashdir/d2 ||
25443                 error "create dir2 under hash dir failed"
25444
25445         # unfortunately, we need to umount to clear dir layout cache for now
25446         # once we fully implement dir layout, we can drop this
25447         umount_client $MOUNT || error "umount failed"
25448         mount_client $MOUNT || error "mount failed"
25449
25450         $LFS find -H fnv_1a_64,crush $DIR/$tdir/hashdir
25451         local dircnt=$($LFS find -H fnv_1a_64,crush $DIR/$tdir/hashdir | wc -l)
25452         (( $dircnt == 2 )) || error "lfs find striped dir got $dircnt != 2"
25453
25454         if (( $MDS1_VERSION > $(version_code 2.15.0) )); then
25455                 $LFS mkdir -i0 -c$MDSCOUNT -H crush2 $DIR/$tdir/hashdir/d3 ||
25456                         error "create crush2 dir $tdir/hashdir/d3 failed"
25457                 $LFS find -H crush2 $DIR/$tdir/hashdir
25458                 dircnt=$($LFS find -H crush2 $DIR/$tdir/hashdir | wc -l)
25459                 (( $dircnt == 1 )) || error "find crush2 dir got $dircnt != 1"
25460
25461                 # mkdir with an invalid hash type (hash=fail_val) from client
25462                 # should be replaced on MDS with a valid (default) hash type
25463                 #define OBD_FAIL_LMV_UNKNOWN_STRIPE     0x1901
25464                 $LCTL set_param fail_loc=0x1901 fail_val=99
25465                 $LFS mkdir -c2 $DIR/$tdir/hashdir/d99
25466
25467                 local hash=$($LFS getdirstripe -H $DIR/$tdir/hashdir/d99)
25468                 local expect=$(do_facet mds1 \
25469                         $LCTL get_param -n lod.$FSNAME-MDT0000-mdtlov.mdt_hash)
25470                 [[ $hash == $expect ]] ||
25471                         error "d99 hash '$hash' != expected hash '$expect'"
25472         fi
25473
25474         #set the stripe to be unknown hash type on read
25475         #define OBD_FAIL_LMV_UNKNOWN_STRIPE     0x1901
25476         $LCTL set_param fail_loc=0x1901 fail_val=99
25477         for ((i = 0; i < 10; i++)); do
25478                 $CHECKSTAT -t file $DIR/$tdir/striped_dir/f-$i ||
25479                         error "stat f-$i failed"
25480                 rm $DIR/$tdir/striped_dir/f-$i || error "unlink f-$i failed"
25481         done
25482
25483         touch $DIR/$tdir/striped_dir/f0 &&
25484                 error "create under striped dir with unknown hash should fail"
25485
25486         $LCTL set_param fail_loc=0
25487
25488         umount_client $MOUNT || error "umount failed"
25489         mount_client $MOUNT || error "mount failed"
25490
25491         return 0
25492 }
25493 run_test 300i "client handle unknown hash type striped directory"
25494
25495 test_300j() {
25496         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25497         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25498         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25499                 skip "Need MDS version at least 2.7.55"
25500
25501         local stripe_count
25502         local file
25503
25504         mkdir $DIR/$tdir
25505
25506         #define OBD_FAIL_SPLIT_UPDATE_REC       0x1702
25507         $LCTL set_param fail_loc=0x1702
25508         $LFS setdirstripe -i 0 -c$MDSCOUNT -H all_char $DIR/$tdir/striped_dir ||
25509                 error "set striped dir error"
25510
25511         createmany -o $DIR/$tdir/striped_dir/f- 10 ||
25512                 error "create files under striped dir failed"
25513
25514         $LCTL set_param fail_loc=0
25515
25516         rm -rf $DIR/$tdir || error "unlink striped dir fails"
25517
25518         return 0
25519 }
25520 run_test 300j "test large update record"
25521
25522 test_300k() {
25523         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25524         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25525         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25526                 skip "Need MDS version at least 2.7.55"
25527
25528         # this test needs a huge transaction
25529         local kb
25530         kb=$(do_facet $SINGLEMDS "$LCTL get_param -n \
25531              osd*.$FSNAME-MDT0000.kbytestotal")
25532         [ $kb -lt $((1024*1024)) ] && skip "MDT0 too small: $kb"
25533
25534         local stripe_count
25535         local file
25536
25537         mkdir $DIR/$tdir
25538
25539         #define OBD_FAIL_LARGE_STRIPE   0x1703
25540         $LCTL set_param fail_loc=0x1703
25541         $LFS setdirstripe -i 0 -c192 $DIR/$tdir/striped_dir ||
25542                 error "set striped dir error"
25543         $LCTL set_param fail_loc=0
25544
25545         $LFS getdirstripe $DIR/$tdir/striped_dir ||
25546                 error "getstripeddir fails"
25547         rm -rf $DIR/$tdir/striped_dir ||
25548                 error "unlink striped dir fails"
25549
25550         return 0
25551 }
25552 run_test 300k "test large striped directory"
25553
25554 test_300l() {
25555         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25556         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25557         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25558                 skip "Need MDS version at least 2.7.55"
25559
25560         local stripe_index
25561
25562         test_mkdir -p $DIR/$tdir/striped_dir
25563         chown $RUNAS_ID $DIR/$tdir/striped_dir ||
25564                         error "chown $RUNAS_ID failed"
25565         $LFS setdirstripe -i 1 -D $DIR/$tdir/striped_dir ||
25566                 error "set default striped dir failed"
25567
25568         #define OBD_FAIL_MDS_STALE_DIR_LAYOUT    0x158
25569         $LCTL set_param fail_loc=0x80000158
25570         $RUNAS mkdir $DIR/$tdir/striped_dir/test_dir || error "create dir fails"
25571
25572         stripe_index=$($LFS getdirstripe -i $DIR/$tdir/striped_dir/test_dir)
25573         [ $stripe_index -eq 1 ] ||
25574                 error "expect 1 get $stripe_index for $dir"
25575 }
25576 run_test 300l "non-root user to create dir under striped dir with stale layout"
25577
25578 test_300m() {
25579         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25580         [ $MDSCOUNT -ge 2 ] && skip_env "Only for single MDT"
25581         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25582                 skip "Need MDS version at least 2.7.55"
25583
25584         mkdir -p $DIR/$tdir/striped_dir
25585         $LFS setdirstripe -D -c 1 $DIR/$tdir/striped_dir ||
25586                 error "set default stripes dir error"
25587
25588         mkdir $DIR/$tdir/striped_dir/a || error "mkdir a fails"
25589
25590         stripe_count=$($LFS getdirstripe -c $DIR/$tdir/striped_dir/a)
25591         [ $stripe_count -eq 0 ] ||
25592                         error "expect 0 get $stripe_count for a"
25593
25594         $LFS setdirstripe -D -c 2 $DIR/$tdir/striped_dir ||
25595                 error "set default stripes dir error"
25596
25597         mkdir $DIR/$tdir/striped_dir/b || error "mkdir b fails"
25598
25599         stripe_count=$($LFS getdirstripe -c $DIR/$tdir/striped_dir/b)
25600         [ $stripe_count -eq 0 ] ||
25601                         error "expect 0 get $stripe_count for b"
25602
25603         $LFS setdirstripe -D -c1 -i2 $DIR/$tdir/striped_dir ||
25604                 error "set default stripes dir error"
25605
25606         mkdir $DIR/$tdir/striped_dir/c &&
25607                 error "default stripe_index is invalid, mkdir c should fails"
25608
25609         rm -rf $DIR/$tdir || error "rmdir fails"
25610 }
25611 run_test 300m "setstriped directory on single MDT FS"
25612
25613 cleanup_300n() {
25614         local list=$(comma_list $(mdts_nodes))
25615
25616         trap 0
25617         do_nodes $list $LCTL set_param -n mdt.*.enable_remote_dir_gid=0
25618 }
25619
25620 test_300n() {
25621         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25622         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25623         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25624                 skip "Need MDS version at least 2.7.55"
25625         remote_mds_nodsh && skip "remote MDS with nodsh"
25626
25627         local stripe_index
25628         local list=$(comma_list $(mdts_nodes))
25629
25630         trap cleanup_300n RETURN EXIT
25631         mkdir -p $DIR/$tdir
25632         chmod 777 $DIR/$tdir
25633         $RUNAS $LFS setdirstripe -i0 -c$MDSCOUNT \
25634                                 $DIR/$tdir/striped_dir > /dev/null 2>&1 &&
25635                 error "create striped dir succeeds with gid=0"
25636
25637         do_nodes $list $LCTL set_param -n mdt.*.enable_remote_dir_gid=-1
25638         $RUNAS $LFS setdirstripe -i0 -c$MDSCOUNT $DIR/$tdir/striped_dir ||
25639                 error "create striped dir fails with gid=-1"
25640
25641         do_nodes $list $LCTL set_param -n mdt.*.enable_remote_dir_gid=0
25642         $RUNAS $LFS setdirstripe -i 1 -c$MDSCOUNT -D \
25643                                 $DIR/$tdir/striped_dir > /dev/null 2>&1 &&
25644                 error "set default striped dir succeeds with gid=0"
25645
25646
25647         do_nodes $list $LCTL set_param -n mdt.*.enable_remote_dir_gid=-1
25648         $RUNAS $LFS setdirstripe -i 1 -c$MDSCOUNT -D $DIR/$tdir/striped_dir ||
25649                 error "set default striped dir fails with gid=-1"
25650
25651
25652         do_nodes $list $LCTL set_param -n mdt.*.enable_remote_dir_gid=0
25653         $RUNAS mkdir $DIR/$tdir/striped_dir/test_dir ||
25654                                         error "create test_dir fails"
25655         $RUNAS mkdir $DIR/$tdir/striped_dir/test_dir1 ||
25656                                         error "create test_dir1 fails"
25657         $RUNAS mkdir $DIR/$tdir/striped_dir/test_dir2 ||
25658                                         error "create test_dir2 fails"
25659         cleanup_300n
25660 }
25661 run_test 300n "non-root user to create dir under striped dir with default EA"
25662
25663 test_300o() {
25664         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25665         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25666         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25667                 skip "Need MDS version at least 2.7.55"
25668
25669         local numfree1
25670         local numfree2
25671
25672         mkdir -p $DIR/$tdir
25673
25674         numfree1=$(lctl get_param -n mdc.*MDT0000*.filesfree)
25675         numfree2=$(lctl get_param -n mdc.*MDT0001*.filesfree)
25676         if [ $numfree1 -lt 66000 ] || [ $numfree2 -lt 66000 ]; then
25677                 skip "not enough free inodes $numfree1 $numfree2"
25678         fi
25679
25680         numfree1=$(lctl get_param -n mdc.*MDT0000-mdc-*.kbytesfree)
25681         numfree2=$(lctl get_param -n mdc.*MDT0001-mdc-*.kbytesfree)
25682         if [ $numfree1 -lt 300000 ] || [ $numfree2 -lt 300000 ]; then
25683                 skip "not enough free space $numfree1 $numfree2"
25684         fi
25685
25686         $LFS setdirstripe -c2 $DIR/$tdir/striped_dir ||
25687                 error "setdirstripe fails"
25688
25689         createmany -d $DIR/$tdir/striped_dir/d 131000 ||
25690                 error "create dirs fails"
25691
25692         $LCTL set_param ldlm.namespaces.*mdc-*.lru_size=0
25693         ls $DIR/$tdir/striped_dir > /dev/null ||
25694                 error "ls striped dir fails"
25695         unlinkmany -d $DIR/$tdir/striped_dir/d 131000 ||
25696                 error "unlink big striped dir fails"
25697 }
25698 run_test 300o "unlink big sub stripe(> 65000 subdirs)"
25699
25700 test_300p() {
25701         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25702         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25703         remote_mds_nodsh && skip "remote MDS with nodsh"
25704
25705         mkdir_on_mdt0 $DIR/$tdir
25706
25707         #define OBD_FAIL_OUT_ENOSPC     0x1704
25708         do_facet mds2 lctl set_param fail_loc=0x80001704
25709         $LFS setdirstripe -i 0 -c2 $DIR/$tdir/bad_striped_dir > /dev/null 2>&1 \
25710                  && error "create striped directory should fail"
25711
25712         [ -e $DIR/$tdir/bad_striped_dir ] && error "striped dir exists"
25713
25714         $LFS setdirstripe -c2 $DIR/$tdir/bad_striped_dir
25715         true
25716 }
25717 run_test 300p "create striped directory without space"
25718
25719 test_300q() {
25720         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25721         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25722
25723         local fd=$(free_fd)
25724         local cmd="exec $fd<$tdir"
25725         cd $DIR
25726         $LFS mkdir -c $MDSCOUNT $tdir || error "create $tdir fails"
25727         eval $cmd
25728         cmd="exec $fd<&-"
25729         trap "eval $cmd" EXIT
25730         cd $tdir || error "cd $tdir fails"
25731         rmdir  ../$tdir || error "rmdir $tdir fails"
25732         mkdir local_dir && error "create dir succeeds"
25733         $LFS setdirstripe -i1 remote_dir && error "create remote dir succeeds"
25734         eval $cmd
25735         return 0
25736 }
25737 run_test 300q "create remote directory under orphan directory"
25738
25739 test_300r() {
25740         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25741                 skip "Need MDS version at least 2.7.55" && return
25742         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
25743
25744         mkdir $DIR/$tdir
25745
25746         $LFS setdirstripe -i 0 -c -1 $DIR/$tdir/striped_dir ||
25747                 error "set striped dir error"
25748
25749         $LFS getdirstripe $DIR/$tdir/striped_dir ||
25750                 error "getstripeddir fails"
25751
25752         local stripe_count
25753         stripe_count=$($LFS getdirstripe $DIR/$tdir/striped_dir |
25754                       awk '/lmv_stripe_count:/ { print $2 }')
25755
25756         [ $MDSCOUNT -ne $stripe_count ] &&
25757                 error "wrong stripe count $stripe_count expected $MDSCOUNT"
25758
25759         rm -rf $DIR/$tdir/striped_dir ||
25760                 error "unlink striped dir fails"
25761 }
25762 run_test 300r "test -1 striped directory"
25763
25764 test_300s_helper() {
25765         local count=$1
25766
25767         local stripe_dir=$DIR/$tdir/striped_dir.$count
25768
25769         $LFS mkdir -c $count $stripe_dir ||
25770                 error "lfs mkdir -c error"
25771
25772         $LFS getdirstripe $stripe_dir ||
25773                 error "lfs getdirstripe fails"
25774
25775         local stripe_count
25776         stripe_count=$($LFS getdirstripe $stripe_dir |
25777                       awk '/lmv_stripe_count:/ { print $2 }')
25778
25779         [ $count -ne $stripe_count ] &&
25780                 error_noexit "bad stripe count $stripe_count expected $count"
25781
25782         local dupe_stripes
25783         dupe_stripes=$($LFS getdirstripe $stripe_dir |
25784                 awk '/0x/ {count[$1] += 1}; END {
25785                         for (idx in count) {
25786                                 if (count[idx]>1) {
25787                                         print "index " idx " count " count[idx]
25788                                 }
25789                         }
25790                 }')
25791
25792         if [[ -n "$dupe_stripes" ]] ; then
25793                 lfs getdirstripe $stripe_dir
25794                 error_noexit "Dupe MDT above: $dupe_stripes "
25795         fi
25796
25797         rm -rf $stripe_dir ||
25798                 error_noexit "unlink $stripe_dir fails"
25799 }
25800
25801 test_300s() {
25802         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25803                 skip "Need MDS version at least 2.7.55" && return
25804         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
25805
25806         mkdir $DIR/$tdir
25807         for count in $(seq 2 $MDSCOUNT); do
25808                 test_300s_helper $count
25809         done
25810 }
25811 run_test 300s "test lfs mkdir -c without -i"
25812
25813 test_300t() {
25814         (( $MDS1_VERSION >= $(version_code 2.14.55) )) ||
25815                 skip "need MDS 2.14.55 or later"
25816         (( $MDSCOUNT >= 2 )) || skip "needs at least 2 MDTs"
25817
25818         local testdir="$DIR/$tdir/striped_dir"
25819         local dir1=$testdir/dir1
25820         local dir2=$testdir/dir2
25821
25822         mkdir -p $testdir
25823
25824         $LFS setdirstripe -D -c -1 --max-inherit=3 $testdir ||
25825                 error "failed to set default stripe count for $testdir"
25826
25827         mkdir $dir1
25828         local stripe_count=$($LFS getdirstripe -c $dir1)
25829
25830         (( $stripe_count == $MDSCOUNT )) || error "wrong stripe count"
25831
25832         local max_count=$((MDSCOUNT - 1))
25833         local mdts=$(comma_list $(mdts_nodes))
25834
25835         do_nodes $mdts $LCTL set_param lod.*.max_mdt_stripecount=$max_count
25836         stack_trap "do_nodes $mdts $LCTL set_param lod.*.max_mdt_stripecount=0"
25837
25838         mkdir $dir2
25839         stripe_count=$($LFS getdirstripe -c $dir2)
25840
25841         (( $stripe_count == $max_count )) || error "wrong stripe count"
25842 }
25843 run_test 300t "test max_mdt_stripecount"
25844
25845 prepare_remote_file() {
25846         mkdir $DIR/$tdir/src_dir ||
25847                 error "create remote source failed"
25848
25849         cp /etc/hosts $DIR/$tdir/src_dir/a ||
25850                  error "cp to remote source failed"
25851         touch $DIR/$tdir/src_dir/a
25852
25853         $LFS mkdir -i 1 $DIR/$tdir/tgt_dir ||
25854                 error "create remote target dir failed"
25855
25856         touch $DIR/$tdir/tgt_dir/b
25857
25858         mrename $DIR/$tdir/src_dir/a $DIR/$tdir/tgt_dir/b ||
25859                 error "rename dir cross MDT failed!"
25860
25861         $CHECKSTAT -t file $DIR/$tdir/src_dir/a &&
25862                 error "src_child still exists after rename"
25863
25864         $CHECKSTAT -t file $DIR/$tdir/tgt_dir/b ||
25865                 error "missing file(a) after rename"
25866
25867         diff /etc/hosts $DIR/$tdir/tgt_dir/b ||
25868                 error "diff after rename"
25869 }
25870
25871 test_310a() {
25872         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 4 MDTs"
25873         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25874
25875         local remote_file=$DIR/$tdir/tgt_dir/b
25876
25877         mkdir -p $DIR/$tdir
25878
25879         prepare_remote_file || error "prepare remote file failed"
25880
25881         #open-unlink file
25882         $OPENUNLINK $remote_file $remote_file ||
25883                 error "openunlink $remote_file failed"
25884         $CHECKSTAT -a $remote_file || error "$remote_file exists"
25885 }
25886 run_test 310a "open unlink remote file"
25887
25888 test_310b() {
25889         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 4 MDTs"
25890         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25891
25892         local remote_file=$DIR/$tdir/tgt_dir/b
25893
25894         mkdir -p $DIR/$tdir
25895
25896         prepare_remote_file || error "prepare remote file failed"
25897
25898         ln $remote_file $DIR/$tfile || error "link failed for remote file"
25899         $MULTIOP $DIR/$tfile Ouc || error "mulitop failed"
25900         $CHECKSTAT -t file $remote_file || error "check file failed"
25901 }
25902 run_test 310b "unlink remote file with multiple links while open"
25903
25904 test_310c() {
25905         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25906         [[ $MDSCOUNT -lt 4 ]] && skip_env "needs >= 4 MDTs"
25907
25908         local remote_file=$DIR/$tdir/tgt_dir/b
25909
25910         mkdir -p $DIR/$tdir
25911
25912         prepare_remote_file || error "prepare remote file failed"
25913
25914         ln $remote_file $DIR/$tfile || error "link failed for remote file"
25915         multiop_bg_pause $remote_file O_uc ||
25916                         error "mulitop failed for remote file"
25917         MULTIPID=$!
25918         $MULTIOP $DIR/$tfile Ouc
25919         kill -USR1 $MULTIPID
25920         wait $MULTIPID
25921 }
25922 run_test 310c "open-unlink remote file with multiple links"
25923
25924 #LU-4825
25925 test_311() {
25926         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25927         [ $OSTCOUNT -lt 2 ] && skip "needs >= 2 OSTs"
25928         [ $MDS1_VERSION -lt $(version_code 2.8.54) ] &&
25929                 skip "lustre < 2.8.54 does not contain LU-4825 fix"
25930         remote_mds_nodsh && skip "remote MDS with nodsh"
25931
25932         local old_iused=$($LFS df -i | awk '/OST0000/ { print $3; exit; }')
25933         local mdts=$(comma_list $(mdts_nodes))
25934
25935         mkdir -p $DIR/$tdir
25936         $LFS setstripe -i 0 -c 1 $DIR/$tdir
25937         createmany -o $DIR/$tdir/$tfile. 1000
25938
25939         # statfs data is not real time, let's just calculate it
25940         old_iused=$((old_iused + 1000))
25941
25942         local count=$(do_facet $SINGLEMDS "$LCTL get_param -n \
25943                         osp.*OST0000*MDT0000.create_count")
25944         local max_count=$(do_facet $SINGLEMDS "$LCTL get_param -n \
25945                                 osp.*OST0000*MDT0000.max_create_count")
25946         do_nodes $mdts "$LCTL set_param -n osp.*OST0000*.max_create_count=0"
25947
25948         $LFS setstripe -i 0 $DIR/$tdir/$tfile || error "setstripe failed"
25949         local index=$($LFS getstripe -i $DIR/$tdir/$tfile)
25950         [ $index -ne 0 ] || error "$tfile stripe index is 0"
25951
25952         unlinkmany $DIR/$tdir/$tfile. 1000
25953
25954         do_nodes $mdts "$LCTL set_param -n \
25955                         osp.*OST0000*.max_create_count=$max_count"
25956         [ $MDS1_VERSION -lt $(version_code 2.12.51) ] &&
25957                 do_nodes $mdts "$LCTL set_param -n \
25958                                 osp.*OST0000*.create_count=$count"
25959         do_nodes $mdts "$LCTL get_param osp.*OST0000*.create_count" |
25960                         grep "=0" && error "create_count is zero"
25961
25962         local new_iused
25963         for i in $(seq 120); do
25964                 new_iused=$($LFS df -i | awk '/OST0000/ { print $3; exit; }')
25965                 # system may be too busy to destroy all objs in time, use
25966                 # a somewhat small value to not fail autotest
25967                 [ $((old_iused - new_iused)) -gt 400 ] && break
25968                 sleep 1
25969         done
25970
25971         echo "waited $i sec, old Iused $old_iused, new Iused $new_iused"
25972         [ $((old_iused - new_iused)) -gt 400 ] ||
25973                 error "objs not destroyed after unlink"
25974 }
25975 run_test 311 "disable OSP precreate, and unlink should destroy objs"
25976
25977 zfs_get_objid()
25978 {
25979         local ost=$1
25980         local tf=$2
25981         local fid=($($LFS getstripe $tf | grep 0x))
25982         local seq=${fid[3]#0x}
25983         local objid=${fid[1]}
25984
25985         local vdevdir=$(dirname $(facet_vdevice $ost))
25986         local cmd="$ZDB -e -p $vdevdir -ddddd $(facet_device $ost)"
25987         local zfs_zapid=$(do_facet $ost $cmd |
25988                           grep -w "/O/$seq/d$((objid%32))" -C 5 |
25989                           awk '/Object/{getline; print $1}')
25990         local zfs_objid=$(do_facet $ost $cmd $zfs_zapid |
25991                           awk "/$objid = /"'{printf $3}')
25992
25993         echo $zfs_objid
25994 }
25995
25996 zfs_object_blksz() {
25997         local ost=$1
25998         local objid=$2
25999
26000         local vdevdir=$(dirname $(facet_vdevice $ost))
26001         local cmd="$ZDB -e -p $vdevdir -dddd $(facet_device $ost)"
26002         local blksz=$(do_facet $ost $cmd $objid |
26003                       awk '/dblk/{getline; printf $4}')
26004
26005         case "${blksz: -1}" in
26006                 k|K) blksz=$((${blksz:0:$((${#blksz} - 1))}*1024)) ;;
26007                 m|M) blksz=$((${blksz:0:$((${#blksz} - 1))}*1024*1024)) ;;
26008                 *) ;;
26009         esac
26010
26011         echo $blksz
26012 }
26013
26014 test_312() { # LU-4856
26015         remote_ost_nodsh && skip "remote OST with nodsh"
26016         [[ "$ost1_FSTYPE" == "zfs" ]] || skip "the test only applies to zfs"
26017
26018         local max_blksz=$(do_facet ost1 \
26019                           $ZFS get -p recordsize $(facet_device ost1) |
26020                           awk '!/VALUE/{print $3}')
26021         local tf=$DIR/$tfile
26022
26023         $LFS setstripe -c1 $tf
26024         local facet="ost$(($($LFS getstripe -i $tf) + 1))"
26025
26026         # Get ZFS object id
26027         local zfs_objid=$(zfs_get_objid $facet $tf)
26028         # block size change by sequential overwrite
26029         local bs
26030
26031         for ((bs=$PAGE_SIZE; bs <= max_blksz; bs *= 4)) ; do
26032                 dd if=/dev/zero of=$tf bs=$bs count=1 oflag=sync conv=notrunc
26033
26034                 local blksz=$(zfs_object_blksz $facet $zfs_objid)
26035                 [[ $blksz -eq $bs ]] || error "blksz error: $blksz, expected: $bs"
26036         done
26037         rm -f $tf
26038
26039         $LFS setstripe -c1 $tf
26040         facet="ost$(($($LFS getstripe -i $tf) + 1))"
26041
26042         # block size change by sequential append write
26043         dd if=/dev/zero of=$tf bs=$PAGE_SIZE count=1 oflag=sync conv=notrunc
26044         zfs_objid=$(zfs_get_objid $facet $tf)
26045         local count
26046
26047         for ((count = 1; count < $((max_blksz / PAGE_SIZE)); count *= 2)); do
26048                 dd if=/dev/zero of=$tf bs=$PAGE_SIZE count=$count seek=$count \
26049                         oflag=sync conv=notrunc
26050
26051                 blksz=$(zfs_object_blksz $facet $zfs_objid)
26052                 (( $blksz == 2 * count * PAGE_SIZE )) ||
26053                         error "blksz error, actual $blksz, " \
26054                                 "expected: 2 * $count * $PAGE_SIZE"
26055         done
26056         rm -f $tf
26057
26058         # random write
26059         $LFS setstripe -c1 $tf
26060         facet="ost$(($($LFS getstripe -i $tf) + 1))"
26061         zfs_objid=$(zfs_get_objid $facet $tf)
26062
26063         dd if=/dev/zero of=$tf bs=1K count=1 oflag=sync conv=notrunc
26064         blksz=$(zfs_object_blksz $facet $zfs_objid)
26065         (( blksz == PAGE_SIZE )) ||
26066                 error "blksz error: $blksz, expected: $PAGE_SIZE"
26067
26068         dd if=/dev/zero of=$tf bs=64K count=1 oflag=sync conv=notrunc seek=128
26069         blksz=$(zfs_object_blksz $facet $zfs_objid)
26070         (( blksz == 65536 )) || error "blksz error: $blksz, expected: 64k"
26071
26072         dd if=/dev/zero of=$tf bs=1M count=1 oflag=sync conv=notrunc
26073         blksz=$(zfs_object_blksz $facet $zfs_objid)
26074         (( blksz == 65536 )) || error "rewrite error: $blksz, expected: 64k"
26075 }
26076 run_test 312 "make sure ZFS adjusts its block size by write pattern"
26077
26078 test_313() {
26079         remote_ost_nodsh && skip "remote OST with nodsh"
26080
26081         local file=$DIR/$tfile
26082
26083         rm -f $file
26084         $LFS setstripe -c 1 -i 0 $file || error "setstripe failed"
26085
26086         # define OBD_FAIL_TGT_RCVD_EIO           0x720
26087         do_facet ost1 "$LCTL set_param fail_loc=0x720"
26088         dd if=/dev/zero of=$file bs=$PAGE_SIZE oflag=direct count=1 &&
26089                 error "write should failed"
26090         do_facet ost1 "$LCTL set_param fail_loc=0"
26091         rm -f $file
26092 }
26093 run_test 313 "io should fail after last_rcvd update fail"
26094
26095 test_314() {
26096         [ $OSTCOUNT -lt 2 ] && skip "needs >= 2 OSTs"
26097
26098         $LFS setstripe -c 2 -i 0 $DIR/$tfile || error "setstripe failed"
26099         do_facet ost1 "$LCTL set_param fail_loc=0x720"
26100         rm -f $DIR/$tfile
26101         wait_delete_completed
26102         do_facet ost1 "$LCTL set_param fail_loc=0"
26103 }
26104 run_test 314 "OSP shouldn't fail after last_rcvd update failure"
26105
26106 test_315() { # LU-618
26107         [ -f /proc/$$/io ] || skip_env "no IO accounting in kernel"
26108
26109         local file=$DIR/$tfile
26110         rm -f $file
26111
26112         $MULTIOP $file oO_CREAT:O_DIRECT:O_RDWR:w4063232c ||
26113                 error "multiop file write failed"
26114         $MULTIOP $file oO_RDONLY:r4063232_c &
26115         PID=$!
26116
26117         sleep 2
26118
26119         local rbytes=$(awk '/read_bytes/ { print $2 }' /proc/$PID/io)
26120         kill -USR1 $PID
26121
26122         [ $rbytes -gt 4000000 ] || error "read is not accounted ($rbytes)"
26123         rm -f $file
26124 }
26125 run_test 315 "read should be accounted"
26126
26127 test_316() {
26128         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
26129         large_xattr_enabled || skip "ea_inode feature disabled"
26130
26131         mkdir_on_mdt0 $DIR/$tdir || error "mkdir $tdir failed"
26132         mkdir $DIR/$tdir/d || error "mkdir $tdir/d failed"
26133         chown nobody $DIR/$tdir/d || error "chown $tdir/d failed"
26134         touch $DIR/$tdir/d/$tfile || error "touch $tdir/d/$tfile failed"
26135
26136         $LFS migrate -m1 $DIR/$tdir/d || error "lfs migrate -m1 failed"
26137 }
26138 run_test 316 "lfs migrate of file with large_xattr enabled"
26139
26140 test_317() {
26141         [ $MDS1_VERSION -lt $(version_code 2.11.53) ] &&
26142                 skip "Need MDS version at least 2.11.53"
26143         if [ "$ost1_FSTYPE" == "zfs" ]; then
26144                 skip "LU-10370: no implementation for ZFS"
26145         fi
26146
26147         local trunc_sz
26148         local grant_blk_size
26149
26150         grant_blk_size=$($LCTL get_param osc.$FSNAME*.import |
26151                         awk '/grant_block_size:/ { print $2; exit; }')
26152         #
26153         # Create File of size 5M. Truncate it to below size's and verify
26154         # blocks count.
26155         #
26156         dd if=/dev/zero of=$DIR/$tfile bs=5M count=1 conv=fsync ||
26157                 error "Create file $DIR/$tfile failed"
26158         stack_trap "rm -f $DIR/$tfile" EXIT
26159
26160         for trunc_sz in 2097152 4097 4000 509 0; do
26161                 $TRUNCATE $DIR/$tfile $trunc_sz ||
26162                         error "truncate $tfile to $trunc_sz failed"
26163                 local sz=$(stat --format=%s $DIR/$tfile)
26164                 local blk=$(stat --format=%b $DIR/$tfile)
26165                 local trunc_blk=$((((trunc_sz + (grant_blk_size - 1) ) /
26166                                      grant_blk_size) * 8))
26167
26168                 if [[ $blk -ne $trunc_blk ]]; then
26169                         $(which stat) $DIR/$tfile
26170                         error "Expected Block $trunc_blk got $blk for $tfile"
26171                 fi
26172
26173                 $CHECKSTAT -s $trunc_sz $DIR/$tfile ||
26174                         error "Expected Size $trunc_sz got $sz for $tfile"
26175         done
26176
26177         #
26178         # sparse file test
26179         # Create file with a hole and write actual 65536 bytes which aligned
26180         # with 4K and 64K PAGE_SIZE. Block count must be 128.
26181         #
26182         local bs=65536
26183         dd if=/dev/zero of=$DIR/$tfile bs=$bs count=1 seek=5 conv=fsync ||
26184                 error "Create file : $DIR/$tfile"
26185
26186         #
26187         # Truncate to size $trunc_sz bytes. Strip tail blocks and leave only 8
26188         # blocks. The block count must drop to 8.
26189         #
26190         trunc_sz=$(($(stat --format=%s $DIR/$tfile) -
26191                 ((bs - grant_blk_size) + 1)))
26192         $TRUNCATE $DIR/$tfile $trunc_sz ||
26193                 error "truncate $tfile to $trunc_sz failed"
26194
26195         local trunc_bsz=$((grant_blk_size / $(stat --format=%B $DIR/$tfile)))
26196         sz=$(stat --format=%s $DIR/$tfile)
26197         blk=$(stat --format=%b $DIR/$tfile)
26198
26199         if [[ $blk -ne $trunc_bsz ]]; then
26200                 $(which stat) $DIR/$tfile
26201                 error "Expected Block $trunc_bsz got $blk for $tfile"
26202         fi
26203
26204         $CHECKSTAT -s $trunc_sz $DIR/$tfile ||
26205                 error "Expected Size $trunc_sz got $sz for $tfile"
26206 }
26207 run_test 317 "Verify blocks get correctly update after truncate"
26208
26209 test_318() {
26210         local llite_name="llite.$($LFS getname $MOUNT | awk '{print $1}')"
26211         local old_max_active=$($LCTL get_param -n \
26212                             ${llite_name}.max_read_ahead_async_active \
26213                             2>/dev/null)
26214
26215         $LCTL set_param llite.*.max_read_ahead_async_active=256
26216         local max_active=$($LCTL get_param -n \
26217                            ${llite_name}.max_read_ahead_async_active \
26218                            2>/dev/null)
26219         [ $max_active -ne 256 ] && error "expected 256 but got $max_active"
26220
26221         $LCTL set_param llite.*.max_read_ahead_async_active=0 ||
26222                 error "set max_read_ahead_async_active should succeed"
26223
26224         $LCTL set_param llite.*.max_read_ahead_async_active=512
26225         max_active=$($LCTL get_param -n \
26226                      ${llite_name}.max_read_ahead_async_active 2>/dev/null)
26227         [ $max_active -eq 512 ] || error "expected 512 but got $max_active"
26228
26229         # restore @max_active
26230         [ $old_max_active -ne 0 ] && $LCTL set_param \
26231                 llite.*.max_read_ahead_async_active=$old_max_active
26232
26233         local old_threshold=$($LCTL get_param -n \
26234                 ${llite_name}.read_ahead_async_file_threshold_mb 2>/dev/null)
26235         local max_per_file_mb=$($LCTL get_param -n \
26236                 ${llite_name}.max_read_ahead_per_file_mb 2>/dev/null)
26237
26238         local invalid=$(($max_per_file_mb + 1))
26239         $LCTL set_param \
26240                 llite.*.read_ahead_async_file_threshold_mb=$invalid\
26241                         && error "set $invalid should fail"
26242
26243         local valid=$(($invalid - 1))
26244         $LCTL set_param \
26245                 llite.*.read_ahead_async_file_threshold_mb=$valid ||
26246                         error "set $valid should succeed"
26247         local threshold=$($LCTL get_param -n \
26248                 ${llite_name}.read_ahead_async_file_threshold_mb 2>/dev/null)
26249         [ $threshold -eq $valid ] || error \
26250                 "expect threshold $valid got $threshold"
26251         $LCTL set_param \
26252                 llite.*.read_ahead_async_file_threshold_mb=$old_threshold
26253 }
26254 run_test 318 "Verify async readahead tunables"
26255
26256 test_319() {
26257         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
26258
26259         local before=$(date +%s)
26260         local evict
26261         local mdir=$DIR/$tdir
26262         local file=$mdir/xxx
26263
26264         $LFS mkdir -i0 $mdir || error "mkdir $mdir fails"
26265         touch $file
26266
26267 #define OBD_FAIL_LDLM_LOCAL_CANCEL_PAUSE 0x32c
26268         $LCTL set_param fail_val=5 fail_loc=0x8000032c
26269         $LFS migrate -m1 $mdir &
26270
26271         sleep 1
26272         dd if=$file of=/dev/null
26273         wait
26274         evict=$($LCTL get_param mdc.$FSNAME-MDT*.state |
26275           awk -F"[ [,]" '/EVICTED ]$/ { if (mx<$5) {mx=$5;} } END { print mx }')
26276
26277         [ -z "$evict" ] || [[ $evict -le $before ]] || error "eviction happened"
26278 }
26279 run_test 319 "lost lease lock on migrate error"
26280
26281 test_398a() { # LU-4198
26282         local ost1_imp=$(get_osc_import_name client ost1)
26283         local imp_name=$($LCTL list_param osc.$ost1_imp | head -n1 |
26284                          cut -d'.' -f2)
26285
26286         $LFS setstripe -c 1 -i 0 $DIR/$tfile
26287         stack_trap "rm -f $DIR/$tfile"
26288         $LCTL set_param ldlm.namespaces.*.lru_size=clear
26289
26290         # request a new lock on client
26291         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
26292
26293         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 oflag=direct conv=notrunc
26294         local lock_count=$($LCTL get_param -n \
26295                            ldlm.namespaces.$imp_name.lru_size)
26296         [[ $lock_count -eq 0 ]] || error "lock should be cancelled by direct IO"
26297
26298         $LCTL set_param ldlm.namespaces.*-OST0000-osc-ffff*.lru_size=clear
26299
26300         # no lock cached, should use lockless DIO and not enqueue new lock
26301         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 oflag=direct conv=notrunc
26302         lock_count=$($LCTL get_param -n \
26303                      ldlm.namespaces.$imp_name.lru_size)
26304         [[ $lock_count -eq 0 ]] || error "no lock should be held by direct IO"
26305
26306         $LCTL set_param ldlm.namespaces.*-OST0000-osc-ffff*.lru_size=clear
26307
26308         # no lock cached, should use locked DIO append
26309         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 oflag=direct oflag=append \
26310                 conv=notrunc || error "DIO append failed"
26311         lock_count=$($LCTL get_param -n \
26312                      ldlm.namespaces.*-OST0000-osc-ffff*.lru_size)
26313         [[ $lock_count -ne 0 ]] || error "lock still must be held by DIO append"
26314 }
26315 run_test 398a "direct IO should cancel lock otherwise lockless"
26316
26317 test_398b() { # LU-4198
26318         local before=$(date +%s)
26319         local njobs=4
26320         local size=48
26321
26322         which fio || skip_env "no fio installed"
26323         $LFS setstripe -c -1 -S 1M $DIR/$tfile
26324         dd if=/dev/zero of=$DIR/$tfile bs=1M count=$size
26325
26326         # Single page, multiple pages, stripe size, 4*stripe size
26327         for bsize in $(( $PAGE_SIZE )) $(( 4*$PAGE_SIZE )) 1048576 4194304; do
26328                 echo "mix direct rw ${bsize} by fio with $njobs jobs..."
26329                 fio --name=rand-rw --rw=randrw --bs=$bsize --direct=1 \
26330                         --numjobs=$njobs --fallocate=none \
26331                         --iodepth=16 --allow_file_create=0 \
26332                         --size=$((size/njobs))M \
26333                         --filename=$DIR/$tfile &
26334                 bg_pid=$!
26335
26336                 echo "mix buffer rw ${bsize} by fio with $njobs jobs..."
26337                 fio --name=rand-rw --rw=randrw --bs=$bsize \
26338                         --numjobs=$njobs --fallocate=none \
26339                         --iodepth=16 --allow_file_create=0 \
26340                         --size=$((size/njobs))M \
26341                         --filename=$DIR/$tfile || true
26342                 wait $bg_pid
26343         done
26344
26345         evict=$(do_facet client $LCTL get_param \
26346                 osc.$FSNAME-OST*-osc-*/state |
26347             awk -F"[ [,]" '/EVICTED ]$/ { if (t<$5) {t=$5;} } END { print t }')
26348
26349         [ -z "$evict" ] || [[ $evict -le $before ]] ||
26350                 (do_facet client $LCTL get_param \
26351                         osc.$FSNAME-OST*-osc-*/state;
26352                     error "eviction happened: $evict before:$before")
26353
26354         rm -f $DIR/$tfile
26355 }
26356 run_test 398b "DIO and buffer IO race"
26357
26358 test_398c() { # LU-4198
26359         local ost1_imp=$(get_osc_import_name client ost1)
26360         local imp_name=$($LCTL list_param osc.$ost1_imp | head -n1 |
26361                          cut -d'.' -f2)
26362
26363         which fio || skip_env "no fio installed"
26364
26365         saved_debug=$($LCTL get_param -n debug)
26366         $LCTL set_param debug=0
26367
26368         local size=$(lctl get_param -n osc.$FSNAME-OST0000*.kbytesavail | head -1)
26369         ((size /= 1024)) # by megabytes
26370         ((size /= 2)) # write half of the OST at most
26371         [ $size -gt 40 ] && size=40 #reduce test time anyway
26372
26373         $LFS setstripe -c 1 $DIR/$tfile
26374
26375         # it seems like ldiskfs reserves more space than necessary if the
26376         # writing blocks are not mapped, so it extends the file firstly
26377         dd if=/dev/zero of=$DIR/$tfile bs=1M count=$size && sync
26378         cancel_lru_locks osc
26379
26380         # clear and verify rpc_stats later
26381         $LCTL set_param osc.${FSNAME}-OST0000-osc-ffff*.rpc_stats=clear
26382
26383         local njobs=4
26384         echo "writing ${size}M to OST0 by fio with $njobs jobs..."
26385         fio --name=rand-write --rw=randwrite --bs=$PAGE_SIZE --direct=1 \
26386                 --numjobs=$njobs --fallocate=none --ioengine=libaio \
26387                 --iodepth=16 --allow_file_create=0 --size=$((size/njobs))M \
26388                 --filename=$DIR/$tfile
26389         [ $? -eq 0 ] || error "fio write error"
26390
26391         [ $($LCTL get_param -n ldlm.namespaces.$imp_name.lock_count) -eq 0 ] ||
26392                 error "Locks were requested while doing AIO"
26393
26394         # get the percentage of 1-page I/O
26395         pct=$($LCTL get_param osc.${imp_name}.rpc_stats |
26396                 grep -A 1 'pages per rpc' | grep -v 'pages per rpc' |
26397                 awk '{print $7}')
26398         [ $pct -le 50 ] || error "$pct% of I/O are 1-page"
26399
26400         echo "mix rw ${size}M to OST0 by fio with $njobs jobs..."
26401         fio --name=rand-rw --rw=randrw --bs=$PAGE_SIZE --direct=1 \
26402                 --numjobs=$njobs --fallocate=none --ioengine=libaio \
26403                 --iodepth=16 --allow_file_create=0 --size=$((size/njobs))M \
26404                 --filename=$DIR/$tfile
26405         [ $? -eq 0 ] || error "fio mixed read write error"
26406
26407         echo "AIO with large block size ${size}M"
26408         fio --name=rand-rw --rw=randrw --bs=${size}M --direct=1 \
26409                 --numjobs=1 --fallocate=none --ioengine=libaio \
26410                 --iodepth=16 --allow_file_create=0 --size=${size}M \
26411                 --filename=$DIR/$tfile
26412         [ $? -eq 0 ] || error "fio large block size failed"
26413
26414         rm -f $DIR/$tfile
26415         $LCTL set_param debug="$saved_debug"
26416 }
26417 run_test 398c "run fio to test AIO"
26418
26419 test_398d() { #  LU-13846
26420         which aiocp || skip_env "no aiocp installed"
26421         local aio_file=$DIR/$tfile.aio
26422
26423         $LFS setstripe -c -1 -S 1M $DIR/$tfile $aio_file
26424
26425         dd if=/dev/urandom of=$DIR/$tfile bs=1M count=64
26426         aiocp -a $PAGE_SIZE -b 64M -s 64M -f O_DIRECT $DIR/$tfile $aio_file
26427         stack_trap "rm -f $DIR/$tfile $aio_file"
26428
26429         diff $DIR/$tfile $aio_file || error "file diff after aiocp"
26430
26431         # make sure we don't crash and fail properly
26432         aiocp -a 512 -b 64M -s 64M -f O_DIRECT $DIR/$tfile $aio_file &&
26433                 error "aio not aligned with PAGE SIZE should fail"
26434
26435         rm -f $DIR/$tfile $aio_file
26436 }
26437 run_test 398d "run aiocp to verify block size > stripe size"
26438
26439 test_398e() {
26440         dd if=/dev/zero of=$DIR/$tfile bs=1234 count=1
26441         touch $DIR/$tfile.new
26442         dd if=$DIR/$tfile of=$DIR/$tfile.new bs=1M count=1 oflag=direct
26443 }
26444 run_test 398e "O_Direct open cleared by fcntl doesn't cause hang"
26445
26446 test_398f() { #  LU-14687
26447         which aiocp || skip_env "no aiocp installed"
26448         local aio_file=$DIR/$tfile.aio
26449
26450         $LFS setstripe -c -1 -S 1M $DIR/$tfile $aio_file
26451
26452         dd if=/dev/zero of=$DIR/$tfile bs=1M count=64
26453         stack_trap "rm -f $DIR/$tfile $aio_file"
26454
26455         #define OBD_FAIL_LLITE_PAGE_ALLOC 0x1418
26456         $LCTL set_param fail_loc=0x1418
26457         # make sure we don't crash and fail properly
26458         aiocp -b 64M -s 64M -f O_DIRECT $DIR/$tfile $aio_file &&
26459                 error "aio with page allocation failure succeeded"
26460         $LCTL set_param fail_loc=0
26461         diff $DIR/$tfile $aio_file
26462         [[ $? != 0 ]] || error "no diff after failed aiocp"
26463 }
26464 run_test 398f "verify aio handles ll_direct_rw_pages errors correctly"
26465
26466 # NB: To get the parallel DIO behavior in LU-13798, there must be > 1
26467 # stripe and i/o size must be > stripe size
26468 # Old style synchronous DIO waits after submitting each chunk, resulting in a
26469 # single RPC in flight.  This test shows async DIO submission is working by
26470 # showing multiple RPCs in flight.
26471 test_398g() { #  LU-13798
26472         $LFS setstripe -o 0,0 -S 1M $DIR/$tfile
26473
26474         # We need to do some i/o first to acquire enough grant to put our RPCs
26475         # in flight; otherwise a new connection may not have enough grant
26476         # available
26477         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=1 oflag=direct ||
26478                 error "parallel dio failed"
26479         stack_trap "rm -f $DIR/$tfile"
26480
26481         # Reduce RPC size to 1M to avoid combination in to larger RPCs
26482         local pages_per_rpc=$($LCTL get_param osc.*-OST0000-*.max_pages_per_rpc)
26483         $LCTL set_param osc.*-OST0000-*.max_pages_per_rpc=1M
26484         stack_trap "$LCTL set_param -n $pages_per_rpc"
26485
26486         # Recreate file so it's empty
26487         rm -f $DIR/$tfile
26488         $LFS setstripe -o 0,0 -S 1M $DIR/$tfile
26489         #Pause rpc completion to guarantee we see multiple rpcs in flight
26490         #define OBD_FAIL_OST_BRW_PAUSE_BULK
26491         do_facet ost1 $LCTL set_param fail_loc=0x214 fail_val=2
26492         stack_trap "do_facet ost1 $LCTL set_param fail_loc=0"
26493
26494         # Clear rpc stats
26495         $LCTL set_param osc.*.rpc_stats=c
26496
26497         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=1 oflag=direct ||
26498                 error "parallel dio failed"
26499         stack_trap "rm -f $DIR/$tfile"
26500
26501         $LCTL get_param osc.*-OST0000-*.rpc_stats
26502         pct=$($LCTL get_param osc.*-OST0000-*.rpc_stats |
26503                 grep -A 8 'rpcs in flight' | grep -v 'rpcs in flight' |
26504                 grep "8:" | awk '{print $8}')
26505         # We look at the "8 rpcs in flight" field, and verify A) it is present
26506         # and B) it includes all RPCs.  This proves we had 8 RPCs in flight,
26507         # as expected for an 8M DIO to a file with 1M stripes.
26508         [ $pct -eq 100 ] || error "we should see 8 RPCs in flight"
26509
26510         # Verify turning off parallel dio works as expected
26511         # Clear rpc stats
26512         $LCTL set_param osc.*.rpc_stats=c
26513         $LCTL set_param llite.*.parallel_dio=0
26514         stack_trap '$LCTL set_param llite.*.parallel_dio=1'
26515
26516         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=1 oflag=direct ||
26517                 error "dio with parallel dio disabled failed"
26518
26519         # Ideally, we would see only one RPC in flight here, but there is an
26520         # unavoidable race between i/o completion and RPC in flight counting,
26521         # so while only 1 i/o is in flight at a time, the RPC in flight counter
26522         # will sometimes exceed 1 (3 or 4 is not rare on VM testing).
26523         # So instead we just verify it's always < 8.
26524         $LCTL get_param osc.*-OST0000-*.rpc_stats
26525         ret=$($LCTL get_param osc.*-OST0000-*.rpc_stats |
26526                 grep -A 8 'rpcs in flight' | grep -v 'rpcs in flight' |
26527                 grep '^$' -B1 | grep . | awk '{print $1}')
26528         [ $ret != "8:" ] ||
26529                 error "we should see fewer than 8 RPCs in flight (saw $ret)"
26530 }
26531 run_test 398g "verify parallel dio async RPC submission"
26532
26533 test_398h() { #  LU-13798
26534         local dio_file=$DIR/$tfile.dio
26535
26536         $LFS setstripe -C 2 -S 1M $DIR/$tfile $dio_file
26537
26538         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct
26539         stack_trap "rm -f $DIR/$tfile $dio_file"
26540
26541         dd if=$DIR/$tfile of=$dio_file bs=8M count=8 iflag=direct oflag=direct ||
26542                 error "parallel dio failed"
26543         diff $DIR/$tfile $dio_file
26544         [[ $? == 0 ]] || error "file diff after aiocp"
26545 }
26546 run_test 398h "verify correctness of read & write with i/o size >> stripe size"
26547
26548 test_398i() { #  LU-13798
26549         local dio_file=$DIR/$tfile.dio
26550
26551         $LFS setstripe -C 2 -S 1M $DIR/$tfile $dio_file
26552
26553         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct
26554         stack_trap "rm -f $DIR/$tfile $dio_file"
26555
26556         #define OBD_FAIL_LLITE_PAGE_ALLOC 0x1418
26557         $LCTL set_param fail_loc=0x1418
26558         # make sure we don't crash and fail properly
26559         dd if=$DIR/$tfile of=$dio_file bs=8M count=8 iflag=direct oflag=direct &&
26560                 error "parallel dio page allocation failure succeeded"
26561         diff $DIR/$tfile $dio_file
26562         [[ $? != 0 ]] || error "no diff after failed aiocp"
26563 }
26564 run_test 398i "verify parallel dio handles ll_direct_rw_pages errors correctly"
26565
26566 test_398j() { #  LU-13798
26567         # Stripe size > RPC size but less than i/o size tests split across
26568         # stripes and RPCs for individual i/o op
26569         $LFS setstripe -o 0,0 -S 4M $DIR/$tfile $DIR/$tfile.2
26570
26571         # Reduce RPC size to 1M to guarantee split to multiple RPCs per stripe
26572         local pages_per_rpc=$($LCTL get_param osc.*-OST0000-*.max_pages_per_rpc)
26573         $LCTL set_param osc.*-OST0000-*.max_pages_per_rpc=1M
26574         stack_trap "$LCTL set_param -n $pages_per_rpc"
26575
26576         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct ||
26577                 error "parallel dio write failed"
26578         stack_trap "rm -f $DIR/$tfile $DIR/$tfile.2"
26579
26580         dd if=$DIR/$tfile of=$DIR/$tfile.2 bs=8M count=8 iflag=direct ||
26581                 error "parallel dio read failed"
26582         diff $DIR/$tfile $DIR/$tfile.2
26583         [[ $? == 0 ]] || error "file diff after parallel dio read"
26584 }
26585 run_test 398j "test parallel dio where stripe size > rpc_size"
26586
26587 test_398k() { #  LU-13798
26588         wait_delete_completed
26589         wait_mds_ost_sync
26590
26591         # 4 stripe file; we will cause out of space on OST0
26592         $LFS setstripe -o 0,1,0,1 -S 1M $DIR/$tfile
26593
26594         # Fill OST0 (if it's not too large)
26595         ORIGFREE=$($LCTL get_param -n lov.$FSNAME-clilov-*.kbytesavail |
26596                    head -n1)
26597         if [[ $ORIGFREE -gt $MAXFREE ]]; then
26598                 skip "$ORIGFREE > $MAXFREE skipping out-of-space test on OST0"
26599         fi
26600         $LFS setstripe -i 0 -c 1 $DIR/$tfile.1
26601         dd if=/dev/zero of=$DIR/$tfile.1 bs=1024 count=$MAXFREE &&
26602                 error "dd should fill OST0"
26603         stack_trap "rm -f $DIR/$tfile.1"
26604
26605         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct
26606         err=$?
26607
26608         ls -la $DIR/$tfile
26609         $CHECKSTAT -t file -s 0 $DIR/$tfile ||
26610                 error "file is not 0 bytes in size"
26611
26612         # dd above should not succeed, but don't error until here so we can
26613         # get debug info above
26614         [[ $err != 0 ]] ||
26615                 error "parallel dio write with enospc succeeded"
26616         stack_trap "rm -f $DIR/$tfile"
26617 }
26618 run_test 398k "test enospc on first stripe"
26619
26620 test_398l() { #  LU-13798
26621         wait_delete_completed
26622         wait_mds_ost_sync
26623
26624         # 4 stripe file; we will cause out of space on OST0
26625         # Note the 1M stripe size and the > 1M i/o size mean this ENOSPC
26626         # happens on the second i/o chunk we issue
26627         $LFS setstripe -o 1,0,1,0 -S 1M $DIR/$tfile $DIR/$tfile.2
26628
26629         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=2 oflag=direct
26630         stack_trap "rm -f $DIR/$tfile"
26631
26632         # Fill OST0 (if it's not too large)
26633         ORIGFREE=$($LCTL get_param -n lov.$FSNAME-clilov-*.kbytesavail |
26634                    head -n1)
26635         if [[ $ORIGFREE -gt $MAXFREE ]]; then
26636                 skip "$ORIGFREE > $MAXFREE skipping out-of-space test on OST0"
26637         fi
26638         $LFS setstripe -i 0 -c 1 $DIR/$tfile.1
26639         dd if=/dev/zero of=$DIR/$tfile.1 bs=1024 count=$MAXFREE &&
26640                 error "dd should fill OST0"
26641         stack_trap "rm -f $DIR/$tfile.1"
26642
26643         dd if=$DIR/$tfile of=$DIR/$tfile.2 bs=8M count=8 oflag=direct
26644         err=$?
26645         stack_trap "rm -f $DIR/$tfile.2"
26646
26647         # Check that short write completed as expected
26648         ls -la $DIR/$tfile.2
26649         $CHECKSTAT -t file -s 1048576 $DIR/$tfile.2 ||
26650                 error "file is not 1M in size"
26651
26652         # dd above should not succeed, but don't error until here so we can
26653         # get debug info above
26654         [[ $err != 0 ]] ||
26655                 error "parallel dio write with enospc succeeded"
26656
26657         # Truncate source file to same length as output file and diff them
26658         $TRUNCATE $DIR/$tfile 1048576
26659         diff $DIR/$tfile $DIR/$tfile.2
26660         [[ $? == 0 ]] || error "data incorrect after short write"
26661 }
26662 run_test 398l "test enospc on intermediate stripe/RPC"
26663
26664 test_398m() { #  LU-13798
26665         $LFS setstripe -o 0,1,0,1 -S 1M $DIR/$tfile
26666
26667         # Set up failure on OST0, the first stripe:
26668         #define OBD_FAIL_OST_BRW_WRITE_BULK     0x20e
26669         #NB: Fail val is ost # + 1, because we cannot use cfs_fail_val = 0
26670         # OST0 is on ost1, OST1 is on ost2.
26671         # So this fail_val specifies OST0
26672         do_facet ost1 $LCTL set_param fail_loc=0x20e fail_val=1
26673         stack_trap "do_facet ost1 $LCTL set_param fail_loc=0"
26674
26675         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct &&
26676                 error "parallel dio write with failure on first stripe succeeded"
26677         stack_trap "rm -f $DIR/$tfile"
26678         do_facet ost1 $LCTL set_param fail_loc=0 fail_val=0
26679
26680         # Place data in file for read
26681         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct ||
26682                 error "parallel dio write failed"
26683
26684         # Fail read on OST0, first stripe
26685         #define OBD_FAIL_OST_BRW_READ_BULK       0x20f
26686         do_facet ost1 $LCTL set_param fail_loc=0x20f fail_val=1
26687         dd if=$DIR/$tfile of=$DIR/$tfile.2 bs=8M count=8 iflag=direct &&
26688                 error "parallel dio read with error on first stripe succeeded"
26689         rm -f $DIR/$tfile.2
26690         do_facet ost1 $LCTL set_param fail_loc=0 fail_val=0
26691
26692         # Switch to testing on OST1, second stripe
26693         # Clear file contents, maintain striping
26694         echo > $DIR/$tfile
26695         # Set up failure on OST1, second stripe:
26696         do_facet ost2 $LCTL set_param fail_loc=0x20e fail_val=2
26697         stack_trap "do_facet ost2 $LCTL set_param fail_loc=0"
26698
26699         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct &&
26700                 error "parallel dio write with failure on second stripe succeeded"
26701         stack_trap "rm -f $DIR/$tfile"
26702         do_facet ost2 $LCTL set_param fail_loc=0 fail_val=0
26703
26704         # Place data in file for read
26705         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct ||
26706                 error "parallel dio write failed"
26707
26708         # Fail read on OST1, second stripe
26709         #define OBD_FAIL_OST_BRW_READ_BULK       0x20f
26710         do_facet ost2 $LCTL set_param fail_loc=0x20f fail_val=2
26711         dd if=$DIR/$tfile of=$DIR/$tfile.2 bs=8M count=8 iflag=direct &&
26712                 error "parallel dio read with error on second stripe succeeded"
26713         rm -f $DIR/$tfile.2
26714         do_facet ost2 $LCTL set_param fail_loc=0 fail_val=0
26715 }
26716 run_test 398m "test RPC failures with parallel dio"
26717
26718 # Parallel submission of DIO should not cause problems for append, but it's
26719 # important to verify.
26720 test_398n() { #  LU-13798
26721         $LFS setstripe -C 2 -S 1M $DIR/$tfile
26722
26723         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 ||
26724                 error "dd to create source file failed"
26725         stack_trap "rm -f $DIR/$tfile"
26726
26727         dd if=$DIR/$tfile of=$DIR/$tfile.1 bs=8M count=8 oflag=direct oflag=append ||
26728                 error "parallel dio write with failure on second stripe succeeded"
26729         stack_trap "rm -f $DIR/$tfile $DIR/$tfile.1"
26730         diff $DIR/$tfile $DIR/$tfile.1
26731         [[ $? == 0 ]] || error "data incorrect after append"
26732
26733 }
26734 run_test 398n "test append with parallel DIO"
26735
26736 test_398o() {
26737         directio rdwr $DIR/$tfile 0 1 1 || error "bad KMS"
26738 }
26739 run_test 398o "right kms with DIO"
26740
26741 test_398p()
26742 {
26743         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
26744         which aiocp || skip_env "no aiocp installed"
26745
26746         local stripe_size=$((1024 * 1024)) #1 MiB
26747         # Max i/o below is ~ 4 * stripe_size, so this gives ~5 i/os
26748         local file_size=$((25 * stripe_size))
26749
26750         $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.1
26751         stack_trap "rm -f $DIR/$tfile*"
26752         # Just a bit bigger than the largest size in the test set below
26753         dd if=/dev/urandom bs=$file_size count=1 of=$DIR/$tfile.1 ||
26754                 error "buffered i/o to create file failed"
26755
26756         for bs in $PAGE_SIZE $((PAGE_SIZE * 4)) $stripe_size \
26757                 $((stripe_size * 4)); do
26758
26759                 $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.2
26760
26761                 echo "bs: $bs, file_size $file_size"
26762                 aiocp -a $PAGE_SIZE -b $bs -s $file_size -f O_DIRECT \
26763                         $DIR/$tfile.1 $DIR/$tfile.2 &
26764                 pid_dio1=$!
26765                 # Buffered I/O with similar but not the same block size
26766                 dd if=$DIR/$tfile.1 bs=$((bs * 2)) of=$DIR/$tfile.2 \
26767                         conv=notrunc &
26768                 pid_bio2=$!
26769                 wait $pid_dio1
26770                 rc1=$?
26771                 wait $pid_bio2
26772                 rc2=$?
26773                 if (( rc1 != 0 )); then
26774                         error "aio copy 1 w/bsize $bs failed: $rc1"
26775                 fi
26776                 if (( rc2 != 0 )); then
26777                         error "buffered copy 2 w/bsize $bs failed: $rc2"
26778                 fi
26779
26780                 $CHECKSTAT -t file -s $file_size $DIR/$tfile.2 ||
26781                         error "size incorrect"
26782                 cmp --verbose $DIR/$tfile.1 $DIR/$tfile.2 ||
26783                         error "files differ, bsize $bs"
26784                 rm -f $DIR/$tfile.2
26785         done
26786 }
26787 run_test 398p "race aio with buffered i/o"
26788
26789 test_398q()
26790 {
26791         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
26792
26793         local stripe_size=$((1024 * 1024)) #1 MiB
26794         # Max i/o below is ~ 4 * stripe_size, so this gives ~5 i/os
26795         local file_size=$((25 * stripe_size))
26796
26797         $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.1
26798         $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.2
26799
26800         # Just a bit bigger than the largest size in the test set below
26801         dd if=/dev/urandom bs=$file_size count=1 of=$DIR/$tfile.1 ||
26802                 error "buffered i/o to create file failed"
26803
26804         for bs in $PAGE_SIZE $((PAGE_SIZE * 4)) $stripe_size \
26805                 $((stripe_size * 4)); do
26806
26807                 echo "bs: $bs, file_size $file_size"
26808                 dd if=$DIR/$tfile.1 bs=$((bs *2 )) of=$DIR/tfile.2 \
26809                         conv=notrunc oflag=direct iflag=direct &
26810                 pid_dio1=$!
26811                 # Buffered I/O with similar but not the same block size
26812                 dd if=$DIR/$tfile.1 bs=$((bs * 2)) of=$DIR/$tfile.2 \
26813                         conv=notrunc &
26814                 pid_bio2=$!
26815                 wait $pid_dio1
26816                 rc1=$?
26817                 wait $pid_bio2
26818                 rc2=$?
26819                 if (( rc1 != 0 )); then
26820                         error "dio copy 1 w/bsize $bs failed: $rc1"
26821                 fi
26822                 if (( rc2 != 0 )); then
26823                         error "buffered copy 2 w/bsize $bs failed: $rc2"
26824                 fi
26825
26826                 $CHECKSTAT -t file -s $file_size $DIR/$tfile.2 ||
26827                         error "size incorrect"
26828                 diff $DIR/$tfile.1 $DIR/$tfile.2 ||
26829                         error "files differ, bsize $bs"
26830         done
26831
26832         rm -f $DIR/$tfile*
26833 }
26834 run_test 398q "race dio with buffered i/o"
26835
26836 test_fake_rw() {
26837         local read_write=$1
26838         if [ "$read_write" = "write" ]; then
26839                 local dd_cmd="dd if=/dev/zero of=$DIR/$tfile"
26840         elif [ "$read_write" = "read" ]; then
26841                 local dd_cmd="dd of=/dev/null if=$DIR/$tfile"
26842         else
26843                 error "argument error"
26844         fi
26845
26846         # turn off debug for performance testing
26847         local saved_debug=$($LCTL get_param -n debug)
26848         $LCTL set_param debug=0
26849
26850         $LFS setstripe -c 1 -i 0 $DIR/$tfile
26851
26852         # get ost1 size - $FSNAME-OST0000
26853         local ost1_avail_size=$($LFS df $DIR | awk /${ost1_svc}/'{ print $4 }')
26854         local blocks=$((ost1_avail_size/2/1024)) # half avail space by megabytes
26855         [ $blocks -gt 1000 ] && blocks=1000 # 1G in maximum
26856
26857         if [ "$read_write" = "read" ]; then
26858                 $TRUNCATE $DIR/$tfile $(expr 1048576 \* $blocks)
26859         fi
26860
26861         local start_time=$(date +%s.%N)
26862         $dd_cmd bs=1M count=$blocks oflag=sync ||
26863                 error "real dd $read_write error"
26864         local duration=$(bc <<< "$(date +%s.%N) - $start_time")
26865
26866         if [ "$read_write" = "write" ]; then
26867                 rm -f $DIR/$tfile
26868         fi
26869
26870         # define OBD_FAIL_OST_FAKE_RW           0x238
26871         do_facet ost1 $LCTL set_param fail_loc=0x238
26872
26873         local start_time=$(date +%s.%N)
26874         $dd_cmd bs=1M count=$blocks oflag=sync ||
26875                 error "fake dd $read_write error"
26876         local duration_fake=$(bc <<< "$(date +%s.%N) - $start_time")
26877
26878         if [ "$read_write" = "write" ]; then
26879                 # verify file size
26880                 cancel_lru_locks osc
26881                 $CHECKSTAT -t file -s $((blocks * 1024 * 1024)) $DIR/$tfile ||
26882                         error "$tfile size not $blocks MB"
26883         fi
26884         do_facet ost1 $LCTL set_param fail_loc=0
26885
26886         echo "fake $read_write $duration_fake vs. normal $read_write" \
26887                 "$duration in seconds"
26888         [ $(bc <<< "$duration_fake < $duration") -eq 1 ] ||
26889                 error_not_in_vm "fake write is slower"
26890
26891         $LCTL set_param -n debug="$saved_debug"
26892         rm -f $DIR/$tfile
26893 }
26894 test_399a() { # LU-7655 for OST fake write
26895         remote_ost_nodsh && skip "remote OST with nodsh"
26896
26897         test_fake_rw write
26898 }
26899 run_test 399a "fake write should not be slower than normal write"
26900
26901 test_399b() { # LU-8726 for OST fake read
26902         remote_ost_nodsh && skip "remote OST with nodsh"
26903         if [ "$ost1_FSTYPE" != "ldiskfs" ]; then
26904                 skip_env "ldiskfs only test"
26905         fi
26906
26907         test_fake_rw read
26908 }
26909 run_test 399b "fake read should not be slower than normal read"
26910
26911 test_400a() { # LU-1606, was conf-sanity test_74
26912         if ! which $CC > /dev/null 2>&1; then
26913                 skip_env "$CC is not installed"
26914         fi
26915
26916         local extra_flags=''
26917         local out=$TMP/$tfile
26918         local prefix=/usr/include/lustre
26919         local prog
26920
26921         # Oleg removes .c files in his test rig so test if any c files exist
26922         [[ -n "$(ls -A $LUSTRE_TESTS_API_DIR)" ]] ||
26923                 skip_env "Needed .c test files are missing"
26924
26925         if ! [[ -d $prefix ]]; then
26926                 # Assume we're running in tree and fixup the include path.
26927                 extra_flags+=" -I$LUSTRE/../lnet/include/uapi"
26928                 extra_flags+=" -I$LUSTRE/include/uapi -I$LUSTRE/include"
26929                 extra_flags+=" -L$LUSTRE/utils/.libs"
26930         fi
26931
26932         for prog in $LUSTRE_TESTS_API_DIR/*.c; do
26933                 $CC -Wall -Werror $extra_flags -o $out $prog -llustreapi ||
26934                         error "client api broken"
26935         done
26936         rm -f $out
26937 }
26938 run_test 400a "Lustre client api program can compile and link"
26939
26940 test_400b() { # LU-1606, LU-5011
26941         local header
26942         local out=$TMP/$tfile
26943         local prefix=/usr/include/linux/lustre
26944
26945         # We use a hard coded prefix so that this test will not fail
26946         # when run in tree. There are headers in lustre/include/lustre/
26947         # that are not packaged (like lustre_idl.h) and have more
26948         # complicated include dependencies (like config.h and lnet/types.h).
26949         # Since this test about correct packaging we just skip them when
26950         # they don't exist (see below) rather than try to fixup cppflags.
26951
26952         if ! which $CC > /dev/null 2>&1; then
26953                 skip_env "$CC is not installed"
26954         fi
26955
26956         for header in $prefix/*.h; do
26957                 if ! [[ -f "$header" ]]; then
26958                         continue
26959                 fi
26960
26961                 if [[ "$(basename $header)" == lustre_ioctl.h ]]; then
26962                         continue # lustre_ioctl.h is internal header
26963                 fi
26964
26965                 $CC -Wall -Werror -include $header -c -x c /dev/null -o $out ||
26966                         error "cannot compile '$header'"
26967         done
26968         rm -f $out
26969 }
26970 run_test 400b "packaged headers can be compiled"
26971
26972 test_401a() { #LU-7437
26973         local printf_arg=$(find -printf 2>&1 | grep "unrecognized:")
26974         [ -n "$printf_arg" ] && skip_env "find does not support -printf"
26975
26976         #count the number of parameters by "list_param -R"
26977         local params=$($LCTL list_param -R '*' 2>/dev/null | wc -l)
26978         #count the number of parameters by listing proc files
26979         local proc_dirs=$(eval \ls -d $proc_regexp 2>/dev/null)
26980         echo "proc_dirs='$proc_dirs'"
26981         [ -n "$proc_dirs" ] || error "no proc_dirs on $HOSTNAME"
26982         local procs=$(find -L $proc_dirs -mindepth 1 -printf '%P\n' 2>/dev/null|
26983                       sort -u | wc -l)
26984
26985         [ $params -eq $procs ] ||
26986                 error "found $params parameters vs. $procs proc files"
26987
26988         # test the list_param -D option only returns directories
26989         params=$($LCTL list_param -R -D '*' 2>/dev/null | wc -l)
26990         #count the number of parameters by listing proc directories
26991         procs=$(find -L $proc_dirs -mindepth 1 -type d -printf '%P\n' 2>/dev/null |
26992                 sort -u | wc -l)
26993
26994         [ $params -eq $procs ] ||
26995                 error "found $params parameters vs. $procs proc files"
26996 }
26997 run_test 401a "Verify if 'lctl list_param -R' can list parameters recursively"
26998
26999 test_401b() {
27000         # jobid_var may not allow arbitrary values, so use jobid_name
27001         # if available
27002         if $LCTL list_param jobid_name > /dev/null 2>&1; then
27003                 local testname=jobid_name tmp='testing%p'
27004         else
27005                 local testname=jobid_var tmp=testing
27006         fi
27007
27008         local save=$($LCTL get_param -n $testname)
27009
27010         $LCTL set_param foo=bar $testname=$tmp bar=baz &&
27011                 error "no error returned when setting bad parameters"
27012
27013         local jobid_new=$($LCTL get_param -n foe $testname baz)
27014         [[ "$jobid_new" == "$tmp" ]] || error "jobid tmp $jobid_new != $tmp"
27015
27016         $LCTL set_param -n fog=bam $testname=$save bat=fog
27017         local jobid_old=$($LCTL get_param -n foe $testname bag)
27018         [[ "$jobid_old" == "$save" ]] || error "jobid new $jobid_old != $save"
27019 }
27020 run_test 401b "Verify 'lctl {get,set}_param' continue after error"
27021
27022 test_401c() {
27023         # jobid_var may not allow arbitrary values, so use jobid_name
27024         # if available
27025         if $LCTL list_param jobid_name > /dev/null 2>&1; then
27026                 local testname=jobid_name
27027         else
27028                 local testname=jobid_var
27029         fi
27030
27031         local jobid_var_old=$($LCTL get_param -n $testname)
27032         local jobid_var_new
27033
27034         $LCTL set_param $testname= &&
27035                 error "no error returned for 'set_param a='"
27036
27037         jobid_var_new=$($LCTL get_param -n $testname)
27038         [[ "$jobid_var_old" == "$jobid_var_new" ]] ||
27039                 error "$testname was changed by setting without value"
27040
27041         $LCTL set_param $testname &&
27042                 error "no error returned for 'set_param a'"
27043
27044         jobid_var_new=$($LCTL get_param -n $testname)
27045         [[ "$jobid_var_old" == "$jobid_var_new" ]] ||
27046                 error "$testname was changed by setting without value"
27047 }
27048 run_test 401c "Verify 'lctl set_param' without value fails in either format."
27049
27050 test_401d() {
27051         # jobid_var may not allow arbitrary values, so use jobid_name
27052         # if available
27053         if $LCTL list_param jobid_name > /dev/null 2>&1; then
27054                 local testname=jobid_name new_value='foo=bar%p'
27055         else
27056                 local testname=jobid_var new_valuie=foo=bar
27057         fi
27058
27059         local jobid_var_old=$($LCTL get_param -n $testname)
27060         local jobid_var_new
27061
27062         $LCTL set_param $testname=$new_value ||
27063                 error "'set_param a=b' did not accept a value containing '='"
27064
27065         jobid_var_new=$($LCTL get_param -n $testname)
27066         [[ "$jobid_var_new" == "$new_value" ]] ||
27067                 error "'set_param a=b' failed on a value containing '='"
27068
27069         # Reset the $testname to test the other format
27070         $LCTL set_param $testname=$jobid_var_old
27071         jobid_var_new=$($LCTL get_param -n $testname)
27072         [[ "$jobid_var_new" == "$jobid_var_old" ]] ||
27073                 error "failed to reset $testname"
27074
27075         $LCTL set_param $testname $new_value ||
27076                 error "'set_param a b' did not accept a value containing '='"
27077
27078         jobid_var_new=$($LCTL get_param -n $testname)
27079         [[ "$jobid_var_new" == "$new_value" ]] ||
27080                 error "'set_param a b' failed on a value containing '='"
27081
27082         $LCTL set_param $testname $jobid_var_old
27083         jobid_var_new=$($LCTL get_param -n $testname)
27084         [[ "$jobid_var_new" == "$jobid_var_old" ]] ||
27085                 error "failed to reset $testname"
27086 }
27087 run_test 401d "Verify 'lctl set_param' accepts values containing '='"
27088
27089 test_401e() { # LU-14779
27090         $LCTL list_param -R "ldlm.namespaces.MGC*" ||
27091                 error "lctl list_param MGC* failed"
27092         $LCTL get_param "ldlm.namespaces.MGC*" || error "lctl get_param failed"
27093         $LCTL get_param "ldlm.namespaces.MGC*.lru_size" ||
27094                 error "lctl get_param lru_size failed"
27095 }
27096 run_test 401e "verify 'lctl get_param' works with NID in parameter"
27097
27098 test_402() {
27099         [[ $MDS1_VERSION -ge $(version_code 2.7.66) ]] ||
27100         [[ $MDS1_VERSION -ge $(version_code 2.7.18.4) &&
27101                 $MDS1_VERSION -lt $(version_code 2.7.50) ]] ||
27102         [[ $MDS1_VERSION -ge $(version_code 2.7.2) &&
27103                 $MDS1_VERSION -lt $(version_code 2.7.11) ]] ||
27104                 skip "Need MDS version 2.7.2+ or 2.7.18.4+ or 2.7.66+"
27105         remote_mds_nodsh && skip "remote MDS with nodsh"
27106
27107         $LFS setdirstripe -i 0 $DIR/$tdir || error "setdirstripe -i 0 failed"
27108 #define OBD_FAIL_MDS_FLD_LOOKUP 0x15c
27109         do_facet mds1 "lctl set_param fail_loc=0x8000015c"
27110         touch $DIR/$tdir/$tfile && error "touch should fail with ENOENT" ||
27111                 echo "Touch failed - OK"
27112 }
27113 run_test 402 "Return ENOENT to lod_generate_and_set_lovea"
27114
27115 test_403() {
27116         local file1=$DIR/$tfile.1
27117         local file2=$DIR/$tfile.2
27118         local tfile=$TMP/$tfile
27119
27120         rm -f $file1 $file2 $tfile
27121
27122         touch $file1
27123         ln $file1 $file2
27124
27125         # 30 sec OBD_TIMEOUT in ll_getattr()
27126         # right before populating st_nlink
27127         $LCTL set_param fail_loc=0x80001409
27128         stat -c %h $file1 > $tfile &
27129
27130         # create an alias, drop all locks and reclaim the dentry
27131         < $file2
27132         cancel_lru_locks mdc
27133         cancel_lru_locks osc
27134         sysctl -w vm.drop_caches=2
27135
27136         wait
27137
27138         [ $(cat $tfile) -gt 0 ] || error "wrong nlink count: $(cat $tfile)"
27139
27140         rm -f $tfile $file1 $file2
27141 }
27142 run_test 403 "i_nlink should not drop to zero due to aliasing"
27143
27144 test_404() { # LU-6601
27145         [[ $MDS1_VERSION -ge $(version_code 2.8.53) ]] ||
27146                 skip "Need server version newer than 2.8.52"
27147         remote_mds_nodsh && skip "remote MDS with nodsh"
27148
27149         local mosps=$(do_facet $SINGLEMDS $LCTL dl |
27150                 awk '/osp .*-osc-MDT/ { print $4}')
27151
27152         local osp
27153         for osp in $mosps; do
27154                 echo "Deactivate: " $osp
27155                 do_facet $SINGLEMDS $LCTL --device %$osp deactivate
27156                 local stat=$(do_facet $SINGLEMDS $LCTL dl |
27157                         awk -vp=$osp '$4 == p { print $2 }')
27158                 [ $stat = IN ] || {
27159                         do_facet $SINGLEMDS $LCTL dl | grep -w $osp
27160                         error "deactivate error"
27161                 }
27162                 echo "Activate: " $osp
27163                 do_facet $SINGLEMDS $LCTL --device %$osp activate
27164                 local stat=$(do_facet $SINGLEMDS $LCTL dl |
27165                         awk -vp=$osp '$4 == p { print $2 }')
27166                 [ $stat = UP ] || {
27167                         do_facet $SINGLEMDS $LCTL dl | grep -w $osp
27168                         error "activate error"
27169                 }
27170         done
27171 }
27172 run_test 404 "validate manual {de}activated works properly for OSPs"
27173
27174 test_405() {
27175         [ -n "$FILESET" ] && skip "Not functional for FILESET set"
27176         [ $MDS1_VERSION -lt $(version_code 2.6.92) ] ||
27177                 [ $CLIENT_VERSION -lt $(version_code 2.6.99) ] &&
27178                         skip "Layout swap lock is not supported"
27179
27180         check_swap_layouts_support
27181         check_swap_layout_no_dom $DIR
27182
27183         test_mkdir $DIR/$tdir
27184         swap_lock_test -d $DIR/$tdir ||
27185                 error "One layout swap locked test failed"
27186 }
27187 run_test 405 "Various layout swap lock tests"
27188
27189 test_406() {
27190         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
27191         [ $OSTCOUNT -lt 2 ] && skip_env "needs >= 2 OSTs"
27192         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
27193         [ $PARALLEL == "yes" ] && skip "skip parallel run"
27194         [ $MDS1_VERSION -lt $(version_code 2.8.50) ] &&
27195                 skip "Need MDS version at least 2.8.50"
27196
27197         local def_stripe_size=$($LFS getstripe -S $MOUNT)
27198         local test_pool=$TESTNAME
27199
27200         pool_add $test_pool || error "pool_add failed"
27201         pool_add_targets $test_pool 0 $(($OSTCOUNT - 1)) 1 ||
27202                 error "pool_add_targets failed"
27203
27204         save_layout_restore_at_exit $MOUNT
27205
27206         # parent set default stripe count only, child will stripe from both
27207         # parent and fs default
27208         $LFS setstripe -c 1 -i 1 -S $((def_stripe_size * 2)) -p $test_pool $MOUNT ||
27209                 error "setstripe $MOUNT failed"
27210         $LFS mkdir -c $MDSCOUNT $DIR/$tdir || error "mkdir $tdir failed"
27211         $LFS setstripe -c $OSTCOUNT $DIR/$tdir || error "setstripe $tdir failed"
27212         for i in $(seq 10); do
27213                 local f=$DIR/$tdir/$tfile.$i
27214                 touch $f || error "touch failed"
27215                 local count=$($LFS getstripe -c $f)
27216                 [ $count -eq $OSTCOUNT ] ||
27217                         error "$f stripe count $count != $OSTCOUNT"
27218                 local offset=$($LFS getstripe -i $f)
27219                 [ $offset -eq 1 ] || error "$f stripe offset $offset != 1"
27220                 local size=$($LFS getstripe -S $f)
27221                 [ $size -eq $((def_stripe_size * 2)) ] ||
27222                         error "$f stripe size $size != $((def_stripe_size * 2))"
27223                 local pool=$($LFS getstripe -p $f)
27224                 [ $pool == $test_pool ] || error "$f pool $pool != $test_pool"
27225         done
27226
27227         # change fs default striping, delete parent default striping, now child
27228         # will stripe from new fs default striping only
27229         $LFS setstripe -c 1 -S $def_stripe_size -i 0 $MOUNT ||
27230                 error "change $MOUNT default stripe failed"
27231         $LFS setstripe -c 0 $DIR/$tdir ||
27232                 error "delete $tdir default stripe failed"
27233         for i in $(seq 11 20); do
27234                 local f=$DIR/$tdir/$tfile.$i
27235                 touch $f || error "touch $f failed"
27236                 local count=$($LFS getstripe -c $f)
27237                 [ $count -eq 1 ] || error "$f stripe count $count != 1"
27238                 local offset=$($LFS getstripe -i $f)
27239                 [ $offset -eq 0 ] || error "$f stripe offset $offset != 0"
27240                 local size=$($LFS getstripe -S $f)
27241                 [ $size -eq $def_stripe_size ] ||
27242                         error "$f stripe size $size != $def_stripe_size"
27243                 local pool=$($LFS getstripe -p $f)
27244                 [ $pool == $test_pool ] || error "$f pool $pool isn't set"
27245         done
27246
27247         unlinkmany $DIR/$tdir/$tfile. 1 20
27248
27249         local f=$DIR/$tdir/$tfile
27250         pool_remove_all_targets $test_pool $f
27251         pool_remove $test_pool $f
27252 }
27253 run_test 406 "DNE support fs default striping"
27254
27255 test_407() {
27256         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
27257         [[ $MDS1_VERSION -lt $(version_code 2.8.55) ]] &&
27258                 skip "Need MDS version at least 2.8.55"
27259         remote_mds_nodsh && skip "remote MDS with nodsh"
27260
27261         $LFS mkdir -i 0 -c 1 $DIR/$tdir.0 ||
27262                 error "$LFS mkdir -i 0 -c 1 $tdir.0 failed"
27263         $LFS mkdir -i 1 -c 1 $DIR/$tdir.1 ||
27264                 error "$LFS mkdir -i 1 -c 1 $tdir.1 failed"
27265         touch $DIR/$tdir.0/$tfile.0 || error "touch $tdir.0/$tfile.0 failed"
27266
27267         #define OBD_FAIL_DT_TXN_STOP    0x2019
27268         for idx in $(seq $MDSCOUNT); do
27269                 do_facet mds$idx "lctl set_param fail_loc=0x2019"
27270         done
27271         $LFS mkdir -c 2 $DIR/$tdir && error "$LFS mkdir -c 2 $tdir should fail"
27272         mv $DIR/$tdir.0/$tfile.0 $DIR/$tdir.1/$tfile.1 &&
27273                 error "mv $tdir.0/$tfile.0 $tdir.1/$tfile.1 should fail"
27274         true
27275 }
27276 run_test 407 "transaction fail should cause operation fail"
27277
27278 test_408() {
27279         dd if=/dev/zero of=$DIR/$tfile bs=$PAGE_SIZE count=1 oflag=direct
27280
27281         #define OBD_FAIL_OSC_BRW_PREP_REQ2        0x40a
27282         lctl set_param fail_loc=0x8000040a
27283         # let ll_prepare_partial_page() fail
27284         dd if=/dev/zero of=$DIR/$tfile bs=2048 count=1 conv=notrunc || true
27285
27286         rm -f $DIR/$tfile
27287
27288         # create at least 100 unused inodes so that
27289         # shrink_icache_memory(0) should not return 0
27290         touch $DIR/$tfile-{0..100}
27291         rm -f $DIR/$tfile-{0..100}
27292         sync
27293
27294         echo 2 > /proc/sys/vm/drop_caches
27295 }
27296 run_test 408 "drop_caches should not hang due to page leaks"
27297
27298 test_409()
27299 {
27300         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
27301
27302         mkdir -p $DIR/$tdir || error "(0) Fail to mkdir"
27303         $LFS mkdir -i 1 -c 2 $DIR/$tdir/foo || error "(1) Fail to mkdir"
27304         touch $DIR/$tdir/guard || error "(2) Fail to create"
27305
27306         local PREFIX=$(str_repeat 'A' 128)
27307         echo "Create 1K hard links start at $(date)"
27308         createmany -l $DIR/$tdir/guard $DIR/$tdir/foo/${PREFIX}_ 1000 ||
27309                 error "(3) Fail to hard link"
27310
27311         echo "Links count should be right although linkEA overflow"
27312         stat $DIR/$tdir/guard || error "(4) Fail to stat"
27313         local linkcount=$(stat --format=%h $DIR/$tdir/guard)
27314         [ $linkcount -eq 1001 ] ||
27315                 error "(5) Unexpected hard links count: $linkcount"
27316
27317         echo "List all links start at $(date)"
27318         ls -l $DIR/$tdir/foo > /dev/null ||
27319                 error "(6) Fail to list $DIR/$tdir/foo"
27320
27321         echo "Unlink hard links start at $(date)"
27322         unlinkmany $DIR/$tdir/foo/${PREFIX}_ 1000 ||
27323                 error "(7) Fail to unlink"
27324         echo "Unlink hard links finished at $(date)"
27325 }
27326 run_test 409 "Large amount of cross-MDTs hard links on the same file"
27327
27328 test_410()
27329 {
27330         [[ $CLIENT_VERSION -lt $(version_code 2.9.59) ]] &&
27331                 skip "Need client version at least 2.9.59"
27332         [ -f $LUSTRE/tests/kernel/kinode.ko ] ||
27333                 skip "Need MODULES build"
27334
27335         # Create a file, and stat it from the kernel
27336         local testfile=$DIR/$tfile
27337         touch $testfile
27338
27339         local run_id=$RANDOM
27340         local my_ino=$(stat --format "%i" $testfile)
27341
27342         # Try to insert the module. This will always fail as the
27343         # module is designed to not be inserted.
27344         insmod $LUSTRE/tests/kernel/kinode.ko run_id=$run_id fname=$testfile \
27345             &> /dev/null
27346
27347         # Anything but success is a test failure
27348         dmesg | grep -q \
27349             "lustre_kinode_$run_id: inode numbers are identical: $my_ino" ||
27350             error "no inode match"
27351 }
27352 run_test 410 "Test inode number returned from kernel thread"
27353
27354 cleanup_test411_cgroup() {
27355         trap 0
27356         rmdir "$1"
27357 }
27358
27359 test_411() {
27360         local cg_basedir=/sys/fs/cgroup/memory
27361         # LU-9966
27362         test -f "$cg_basedir/memory.kmem.limit_in_bytes" ||
27363                 skip "no setup for cgroup"
27364
27365         dd if=/dev/zero of=$DIR/$tfile bs=1M count=100 conv=fsync ||
27366                 error "test file creation failed"
27367         cancel_lru_locks osc
27368
27369         # Create a very small memory cgroup to force a slab allocation error
27370         local cgdir=$cg_basedir/osc_slab_alloc
27371         mkdir $cgdir || error "cgroup mkdir '$cgdir' failed"
27372         trap "cleanup_test411_cgroup $cgdir" EXIT
27373         echo 2M > $cgdir/memory.kmem.limit_in_bytes
27374         echo 1M > $cgdir/memory.limit_in_bytes
27375
27376         # Should not LBUG, just be killed by oom-killer
27377         # dd will return 0 even allocation failure in some environment.
27378         # So don't check return value
27379         bash -c "echo \$$ > $cgdir/tasks && dd if=$DIR/$tfile of=/dev/null"
27380         cleanup_test411_cgroup $cgdir
27381
27382         return 0
27383 }
27384 run_test 411 "Slab allocation error with cgroup does not LBUG"
27385
27386 test_412() {
27387         (( $MDSCOUNT > 1 )) || skip_env "needs >= 2 MDTs"
27388         (( $MDS1_VERSION >= $(version_code 2.10.55) )) ||
27389                 skip "Need server version at least 2.10.55"
27390
27391         $LFS mkdir -i $((MDSCOUNT - 1)),$((MDSCOUNT - 2)) $DIR/$tdir ||
27392                 error "mkdir failed"
27393         $LFS getdirstripe $DIR/$tdir
27394         local stripe_index=$($LFS getdirstripe -i $DIR/$tdir)
27395         [ $stripe_index -eq $((MDSCOUNT - 1)) ] ||
27396                 error "expect $((MDSCOUT - 1)) get $stripe_index"
27397         local stripe_count=$($LFS getdirstripe -T $DIR/$tdir)
27398         [ $stripe_count -eq 2 ] ||
27399                 error "expect 2 get $stripe_count"
27400
27401         (( $MDS1_VERSION >= $(version_code 2.14.55) )) || return 0
27402
27403         local index
27404         local index2
27405
27406         # subdirs should be on the same MDT as parent
27407         for i in $(seq 0 $((MDSCOUNT - 1))); do
27408                 $LFS mkdir -i $i $DIR/$tdir/mdt$i || error "mkdir mdt$i failed"
27409                 mkdir $DIR/$tdir/mdt$i/sub || error "mkdir sub failed"
27410                 index=$($LFS getstripe -m $DIR/$tdir/mdt$i/sub)
27411                 (( index == i )) || error "mdt$i/sub on MDT$index"
27412         done
27413
27414         # stripe offset -1, ditto
27415         for i in {1..10}; do
27416                 $LFS mkdir -i -1 $DIR/$tdir/qos$i || error "mkdir qos$i failed"
27417                 index=$($LFS getstripe -m $DIR/$tdir/qos$i)
27418                 mkdir $DIR/$tdir/qos$i/sub || error "mkdir sub failed"
27419                 index2=$($LFS getstripe -m $DIR/$tdir/qos$i/sub)
27420                 (( index == index2 )) ||
27421                         error "qos$i on MDT$index, sub on MDT$index2"
27422         done
27423
27424         local testdir=$DIR/$tdir/inherit
27425
27426         $LFS mkdir -i 1 --max-inherit=3 $testdir || error "mkdir inherit failed"
27427         # inherit 2 levels
27428         for i in 1 2; do
27429                 testdir=$testdir/s$i
27430                 mkdir $testdir || error "mkdir $testdir failed"
27431                 index=$($LFS getstripe -m $testdir)
27432                 (( index == 1 )) ||
27433                         error "$testdir on MDT$index"
27434         done
27435
27436         # not inherit any more
27437         testdir=$testdir/s3
27438         mkdir $testdir || error "mkdir $testdir failed"
27439         getfattr -d -m dmv $testdir | grep dmv &&
27440                 error "default LMV set on $testdir" || true
27441 }
27442 run_test 412 "mkdir on specific MDTs"
27443
27444 TEST413_COUNT=${TEST413_COUNT:-200}
27445
27446 #
27447 # set_maxage() is used by test_413 only.
27448 # This is a helper function to set maxage. Does not return any value.
27449 # Input: maxage to set
27450 #
27451 set_maxage() {
27452         local lmv_qos_maxage
27453         local lod_qos_maxage
27454         local new_maxage=$1
27455
27456         lmv_qos_maxage=$($LCTL get_param -n lmv.*.qos_maxage)
27457         $LCTL set_param lmv.*.qos_maxage=$new_maxage
27458         stack_trap "$LCTL set_param \
27459                 lmv.*.qos_maxage=$lmv_qos_maxage > /dev/null"
27460         lod_qos_maxage=$(do_facet mds1 $LCTL get_param -n \
27461                 lod.$FSNAME-MDT0000-mdtlov.qos_maxage | awk '{ print $1 }')
27462         do_nodes $(comma_list $(mdts_nodes)) $LCTL set_param \
27463                 lod.*.mdt_qos_maxage=$new_maxage
27464         stack_trap "do_nodes $(comma_list $(mdts_nodes)) $LCTL set_param \
27465                 lod.*.mdt_qos_maxage=$lod_qos_maxage > /dev/null"
27466 }
27467
27468 generate_uneven_mdts() {
27469         local threshold=$1
27470         local ffree
27471         local bavail
27472         local max
27473         local min
27474         local max_index
27475         local min_index
27476         local tmp
27477         local i
27478
27479         echo
27480         echo "Check for uneven MDTs: "
27481
27482         ffree=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.filesfree))
27483         bavail=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.kbytesavail))
27484         bsize=$(lctl get_param -n mdc.*MDT0000*.blocksize)
27485
27486         max=$(((${ffree[0]} >> 8) * (${bavail[0]} * bsize >> 16)))
27487         min=$(((${ffree[0]} >> 8) * (${bavail[0]} * bsize >> 16)))
27488         max_index=0
27489         min_index=0
27490         for ((i = 1; i < ${#ffree[@]}; i++)); do
27491                 tmp=$(((${ffree[i]} >> 8) * (${bavail[i]} * bsize >> 16)))
27492                 if [ $tmp -gt $max ]; then
27493                         max=$tmp
27494                         max_index=$i
27495                 fi
27496                 if [ $tmp -lt $min ]; then
27497                         min=$tmp
27498                         min_index=$i
27499                 fi
27500         done
27501
27502         (( min > 0 )) || skip "low space on MDT$min_index"
27503         (( ${ffree[min_index]} > 0 )) ||
27504                 skip "no free files on MDT$min_index"
27505         (( ${ffree[min_index]} < 10000000 )) ||
27506                 skip "too many free files on MDT$min_index"
27507
27508         # Check if we need to generate uneven MDTs
27509         local diff=$(((max - min) * 100 / min))
27510         local testdirp=$DIR/$tdir-fillmdt # parent fill folder
27511         local testdir # individual folder within $testdirp
27512         local start
27513         local cmd
27514
27515         # fallocate is faster to consume space on MDT, if available
27516         if check_fallocate_supported mds$((min_index + 1)); then
27517                 cmd="fallocate -l 128K "
27518         else
27519                 cmd="dd if=/dev/zero bs=128K count=1 of="
27520         fi
27521
27522         echo "using cmd $cmd"
27523         for (( i = 0; diff < threshold; i++ )); do
27524                 testdir=${testdirp}/$i
27525                 [ -d $testdir ] && continue
27526
27527                 (( i % 10 > 0 )) || { $LFS df; $LFS df -i; }
27528
27529                 mkdir -p $testdirp
27530                 # generate uneven MDTs, create till $threshold% diff
27531                 echo -n "weight diff=$diff% must be > $threshold% ..."
27532                 echo "Fill MDT$min_index with $TEST413_COUNT files: loop $i"
27533                 $LFS mkdir -i $min_index $testdir ||
27534                         error "mkdir $testdir failed"
27535                 $LFS setstripe -E 1M -L mdt $testdir ||
27536                         error "setstripe $testdir failed"
27537                 start=$SECONDS
27538                 for (( f = 0; f < TEST413_COUNT; f++ )); do
27539                         $cmd$testdir/f.$f &> /dev/null || error "$cmd $f failed"
27540                 done
27541                 sync; sleep 1; sync
27542
27543                 # wait for QOS to update
27544                 (( SECONDS < start + 2 )) && sleep $((start + 2 - SECONDS))
27545
27546                 ffree=($(lctl get_param -n mdc.*[mM][dD][cC]-*.filesfree))
27547                 bavail=($(lctl get_param -n mdc.*[mM][dD][cC]-*.kbytesavail))
27548                 max=$(((${ffree[max_index]} >> 8) *
27549                         (${bavail[max_index]} * bsize >> 16)))
27550                 min=$(((${ffree[min_index]} >> 8) *
27551                         (${bavail[min_index]} * bsize >> 16)))
27552                 (( min > 0 )) || skip "low space on MDT$min_index"
27553                 diff=$(((max - min) * 100 / min))
27554         done
27555
27556         echo "MDT filesfree available: ${ffree[*]}"
27557         echo "MDT blocks available: ${bavail[*]}"
27558         echo "weight diff=$diff%"
27559 }
27560
27561 test_qos_mkdir() {
27562         local mkdir_cmd=$1
27563         local stripe_count=$2
27564         local mdts=$(comma_list $(mdts_nodes))
27565
27566         local testdir
27567         local lmv_qos_prio_free
27568         local lmv_qos_threshold_rr
27569         local lod_qos_prio_free
27570         local lod_qos_threshold_rr
27571         local total
27572         local count
27573         local i
27574
27575         # @total is total directories created if it's testing plain
27576         # directories, otherwise it's total stripe object count for
27577         # striped directories test.
27578         # remote/striped directory unlinking is slow on zfs and may
27579         # timeout, test with fewer directories
27580         [ "$mds1_FSTYPE" = "zfs" ] && total=120 || total=240
27581
27582         lmv_qos_prio_free=$($LCTL get_param -n lmv.*.qos_prio_free | head -n1)
27583         lmv_qos_prio_free=${lmv_qos_prio_free%%%}
27584         lmv_qos_threshold_rr=$($LCTL get_param -n lmv.*.qos_threshold_rr |
27585                 head -n1)
27586         lmv_qos_threshold_rr=${lmv_qos_threshold_rr%%%}
27587         stack_trap "$LCTL set_param \
27588                 lmv.*.qos_prio_free=$lmv_qos_prio_free > /dev/null"
27589         stack_trap "$LCTL set_param \
27590                 lmv.*.qos_threshold_rr=$lmv_qos_threshold_rr > /dev/null"
27591
27592         lod_qos_prio_free=$(do_facet mds1 $LCTL get_param -n \
27593                 lod.$FSNAME-MDT0000-mdtlov.mdt_qos_prio_free | head -n1)
27594         lod_qos_prio_free=${lod_qos_prio_free%%%}
27595         lod_qos_threshold_rr=$(do_facet mds1 $LCTL get_param -n \
27596                 lod.$FSNAME-MDT0000-mdtlov.mdt_qos_threshold_rr | head -n1)
27597         lod_qos_threshold_rr=${lod_qos_threshold_rr%%%}
27598         stack_trap "do_nodes $mdts $LCTL set_param \
27599                 lod.*.mdt_qos_prio_free=$lod_qos_prio_free > /dev/null"
27600         stack_trap "do_nodes $mdts $LCTL set_param \
27601                 lod.*.mdt_qos_threshold_rr=$lod_qos_threshold_rr > /dev/null"
27602
27603         $LCTL set_param lmv.*.qos_threshold_rr=100 > /dev/null
27604         do_nodes $mdts $LCTL set_param lod.*.mdt_qos_threshold_rr=100 > /dev/null
27605
27606         testdir=$DIR/$tdir-s$stripe_count/rr
27607
27608         local stripe_index=$($LFS getstripe -m $testdir)
27609         local test_mkdir_rr=true
27610
27611         getfattr -d -m dmv -e hex $testdir | grep dmv
27612         if (( $? == 0 && $MDS1_VERSION >= $(version_code 2.14.51) )); then
27613                 echo "defstripe: '$($LFS getdirstripe -D $testdir)'"
27614                 (( $($LFS getdirstripe -D --max-inherit-rr $testdir) == 0 )) &&
27615                         test_mkdir_rr=false
27616         fi
27617
27618         echo
27619         $test_mkdir_rr &&
27620                 echo "Mkdir (stripe_count $stripe_count) roundrobin:" ||
27621                 echo "Mkdir (stripe_count $stripe_count) on stripe $stripe_index"
27622
27623         stack_trap "unlinkmany -d $testdir/subdir $((total / stripe_count))"
27624         for (( i = 0; i < total / stripe_count; i++ )); do
27625                 eval $mkdir_cmd $testdir/subdir$i ||
27626                         error "$mkdir_cmd subdir$i failed"
27627         done
27628
27629         for (( i = 0; i < $MDSCOUNT; i++ )); do
27630                 count=$($LFS getdirstripe -i $testdir/* | grep -c "^$i$")
27631                 echo "$count directories created on MDT$i"
27632                 if $test_mkdir_rr; then
27633                         (( count == total / stripe_count / MDSCOUNT )) ||
27634                                 error "subdirs are not evenly distributed"
27635                 elif (( i == stripe_index )); then
27636                         (( count == total / stripe_count )) ||
27637                                 error "$count subdirs created on MDT$i"
27638                 else
27639                         (( count == 0 )) ||
27640                                 error "$count subdirs created on MDT$i"
27641                 fi
27642
27643                 if $test_mkdir_rr && [ $stripe_count -gt 1 ]; then
27644                         count=$($LFS getdirstripe $testdir/* |
27645                                 grep -c -P "^\s+$i\t")
27646                         echo "$count stripes created on MDT$i"
27647                         # deviation should < 5% of average
27648                         delta=$((count - total / MDSCOUNT))
27649                         (( ${delta#-} <= total / MDSCOUNT / 20 )) ||
27650                                 error "stripes are not evenly distributed"
27651                 fi
27652         done
27653
27654         echo
27655         echo "Check for uneven MDTs: "
27656
27657         local ffree
27658         local bavail
27659         local max
27660         local min
27661         local max_index
27662         local min_index
27663         local tmp
27664
27665         ffree=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.filesfree))
27666         bavail=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.kbytesavail))
27667         bsize=$(lctl get_param -n mdc.*MDT0000*.blocksize)
27668
27669         max=$(((${ffree[0]} >> 8) * (${bavail[0]} * bsize >> 16)))
27670         min=$(((${ffree[0]} >> 8) * (${bavail[0]} * bsize >> 16)))
27671         max_index=0
27672         min_index=0
27673         for ((i = 1; i < ${#ffree[@]}; i++)); do
27674                 tmp=$(((${ffree[i]} >> 8) * (${bavail[i]} * bsize >> 16)))
27675                 if [ $tmp -gt $max ]; then
27676                         max=$tmp
27677                         max_index=$i
27678                 fi
27679                 if [ $tmp -lt $min ]; then
27680                         min=$tmp
27681                         min_index=$i
27682                 fi
27683         done
27684         echo "stripe_count=$stripe_count min_idx=$min_index max_idx=$max_index"
27685
27686         (( min > 0 )) || skip "low space on MDT$min_index"
27687         (( ${ffree[min_index]} < 10000000 )) ||
27688                 skip "too many free files on MDT$min_index"
27689
27690         generate_uneven_mdts 120
27691
27692         echo "MDT filesfree available: ${ffree[*]}"
27693         echo "MDT blocks available: ${bavail[*]}"
27694         echo "weight diff=$(((max - min) * 100 / min))%"
27695         echo
27696         echo "Mkdir (stripe_count $stripe_count) with balanced space usage:"
27697
27698         $LCTL set_param lmv.*.qos_threshold_rr=0 > /dev/null
27699         $LCTL set_param lmv.*.qos_prio_free=100 > /dev/null
27700         do_nodes $mdts $LCTL set_param lod.*.mdt_qos_threshold_rr=0 > /dev/null
27701         do_nodes $mdts $LCTL set_param lod.*.mdt_qos_prio_free=100 > /dev/null
27702         # decrease statfs age, so that it can be updated in time
27703         $LCTL set_param lmv.*.qos_maxage=1 > /dev/null
27704         do_nodes $mdts $LCTL set_param lod.*.mdt_qos_maxage=1 > /dev/null
27705
27706         sleep 1
27707
27708         testdir=$DIR/$tdir-s$stripe_count/qos
27709
27710         stack_trap "unlinkmany -d $testdir/subdir $((total / stripe_count))"
27711         for (( i = 0; i < total / stripe_count; i++ )); do
27712                 eval $mkdir_cmd $testdir/subdir$i ||
27713                         error "$mkdir_cmd subdir$i failed"
27714         done
27715
27716         max=0
27717         for (( i = 0; i < $MDSCOUNT; i++ )); do
27718                 count=$($LFS getdirstripe -i $testdir/* | grep -c "^$i$")
27719                 (( count > max )) && max=$count
27720                 echo "$count directories created on MDT$i : curmax=$max"
27721         done
27722
27723         min=$($LFS getdirstripe -i $testdir/* | grep -c "^$min_index$")
27724
27725         # D-value should > 10% of average
27726         (( max - min > total / stripe_count / MDSCOUNT / 10 )) ||
27727                 error "subdirs shouldn't be evenly distributed: $max - $min <= $((total / stripe_count / MDSCOUNT / 10))"
27728
27729         # ditto for stripes
27730         if (( stripe_count > 1 )); then
27731                 max=0
27732                 for (( i = 0; i < $MDSCOUNT; i++ )); do
27733                         count=$($LFS getdirstripe $testdir/* |
27734                                 grep -c -P "^\s+$i\t")
27735                         (( count > max )) && max=$count
27736                         echo "$count stripes created on MDT$i"
27737                 done
27738
27739                 min=$($LFS getdirstripe $testdir/* |
27740                         grep -c -P "^\s+$min_index\t")
27741                 (( max - min > total / MDSCOUNT / 10 )) ||
27742                         error "stripes shouldn't be evenly distributed: $max - $min <= $((total / MDSCOUNT / 10))"
27743         fi
27744 }
27745
27746 most_full_mdt() {
27747         local ffree
27748         local bavail
27749         local bsize
27750         local min
27751         local min_index
27752         local tmp
27753
27754         ffree=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.filesfree))
27755         bavail=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.kbytesavail))
27756         bsize=$(lctl get_param -n mdc.*MDT0000*.blocksize)
27757
27758         min=$(((${ffree[0]} >> 8) * (${bavail[0]} * bsize >> 16)))
27759         min_index=0
27760         for ((i = 1; i < ${#ffree[@]}; i++)); do
27761                 tmp=$(((${ffree[i]} >> 8) * (${bavail[i]} * bsize >> 16)))
27762                 (( tmp < min )) && min=$tmp && min_index=$i
27763         done
27764
27765         echo -n $min_index
27766 }
27767
27768 test_413a() {
27769         [ $MDSCOUNT -lt 2 ] &&
27770                 skip "We need at least 2 MDTs for this test"
27771
27772         [ $MDS1_VERSION -lt $(version_code 2.12.52) ] &&
27773                 skip "Need server version at least 2.12.52"
27774
27775         local stripe_max=$((MDSCOUNT - 1))
27776         local stripe_count
27777
27778         # let caller set maxage for latest result
27779         set_maxage 1
27780
27781         # fill MDT unevenly
27782         generate_uneven_mdts 120
27783
27784         # test 4-stripe directory at most, otherwise it's too slow
27785         # We are being very defensive. Although Autotest uses 4 MDTs.
27786         # We make sure stripe_max does not go over 4.
27787         (( stripe_max > 4 )) && stripe_max=4
27788         # unlinking striped directory is slow on zfs, and may timeout, only test
27789         # plain directory
27790         [ "$mds1_FSTYPE" == "zfs" ] && stripe_max=1
27791         for stripe_count in $(seq 1 $stripe_max); do
27792                 mkdir $DIR/$tdir-s$stripe_count || error "mkdir failed"
27793                 mkdir $DIR/$tdir-s$stripe_count/rr || error "mkdir failed"
27794                 $LFS mkdir -i $(most_full_mdt) $DIR/$tdir-s$stripe_count/qos ||
27795                         error "mkdir failed"
27796                 test_qos_mkdir "$LFS mkdir -i -1 -c $stripe_count" $stripe_count
27797         done
27798 }
27799 run_test 413a "QoS mkdir with 'lfs mkdir -i -1'"
27800
27801 test_413b() {
27802         [ $MDSCOUNT -lt 2 ] &&
27803                 skip "We need at least 2 MDTs for this test"
27804
27805         [ $MDS1_VERSION -lt $(version_code 2.12.52) ] &&
27806                 skip "Need server version at least 2.12.52"
27807
27808         local stripe_max=$((MDSCOUNT - 1))
27809         local testdir
27810         local stripe_count
27811
27812         # let caller set maxage for latest result
27813         set_maxage 1
27814
27815         # fill MDT unevenly
27816         generate_uneven_mdts 120
27817
27818         # test 4-stripe directory at most, otherwise it's too slow
27819         # We are being very defensive. Although Autotest uses 4 MDTs.
27820         # We make sure stripe_max does not go over 4.
27821         (( stripe_max > 4 )) && stripe_max=4
27822         [ "$mds1_FSTYPE" == "zfs" ] && stripe_max=1
27823         for stripe_count in $(seq 1 $stripe_max); do
27824                 testdir=$DIR/$tdir-s$stripe_count
27825                 mkdir $testdir || error "mkdir $testdir failed"
27826                 mkdir $testdir/rr || error "mkdir rr failed"
27827                 $LFS mkdir -i $(most_full_mdt) $testdir/qos ||
27828                         error "mkdir qos failed"
27829                 $LFS setdirstripe -D -c $stripe_count --max-inherit-rr 2 \
27830                         $testdir/rr || error "setdirstripe rr failed"
27831                 $LFS setdirstripe -D -c $stripe_count $testdir/qos ||
27832                         error "setdirstripe failed"
27833                 test_qos_mkdir "mkdir" $stripe_count
27834         done
27835 }
27836 run_test 413b "QoS mkdir under dir whose default LMV starting MDT offset is -1"
27837
27838 test_413c() {
27839         (( $MDSCOUNT >= 2 )) ||
27840                 skip "We need at least 2 MDTs for this test"
27841
27842         (( $MDS1_VERSION >= $(version_code 2.14.51) )) ||
27843                 skip "Need server version at least 2.14.51"
27844
27845         local testdir
27846         local inherit
27847         local inherit_rr
27848         local lmv_qos_maxage
27849         local lod_qos_maxage
27850
27851         # let caller set maxage for latest result
27852         lmv_qos_maxage=$($LCTL get_param -n lmv.*.qos_maxage)
27853         $LCTL set_param lmv.*.qos_maxage=1
27854         stack_trap "$LCTL set_param \
27855                 lmv.*.qos_maxage=$lmv_qos_maxage > /dev/null" RETURN
27856         lod_qos_maxage=$(do_facet mds1 $LCTL get_param -n \
27857                 lod.$FSNAME-MDT0000-mdtlov.qos_maxage | awk '{ print $1 }')
27858         do_nodes $(comma_list $(mdts_nodes)) $LCTL set_param \
27859                 lod.*.mdt_qos_maxage=1
27860         stack_trap "do_nodes $(comma_list $(mdts_nodes)) $LCTL set_param \
27861                 lod.*.mdt_qos_maxage=$lod_qos_maxage > /dev/null" RETURN
27862
27863         # fill MDT unevenly
27864         generate_uneven_mdts 120
27865
27866         testdir=$DIR/${tdir}-s1
27867         mkdir $testdir || error "mkdir $testdir failed"
27868         mkdir $testdir/rr || error "mkdir rr failed"
27869         $LFS mkdir -i $(most_full_mdt) $testdir/qos || error "mkdir qos failed"
27870         # default max_inherit is -1, default max_inherit_rr is 0
27871         $LFS setdirstripe -D -c 1 $testdir/rr ||
27872                 error "setdirstripe rr failed"
27873         $LFS setdirstripe -D -c 1 -i -1 -X 2 --max-inherit-rr 1 $testdir/qos ||
27874                 error "setdirstripe qos failed"
27875         test_qos_mkdir "mkdir" 1
27876
27877         mkdir $testdir/rr/level1 || error "mkdir rr/level1 failed"
27878         inherit=$($LFS getdirstripe -D -X $testdir/rr/level1)
27879         (( $inherit == -1 )) || error "rr/level1 inherit $inherit != -1"
27880         inherit_rr=$($LFS getdirstripe -D --max-inherit-rr $testdir/rr/level1)
27881         (( $inherit_rr == 0 )) || error "rr/level1 inherit-rr $inherit_rr != 0"
27882
27883         mkdir $testdir/qos/level1 || error "mkdir qos/level1 failed"
27884         inherit=$($LFS getdirstripe -D -X $testdir/qos/level1)
27885         (( $inherit == 1 )) || error "qos/level1 inherit $inherit != 1"
27886         inherit_rr=$($LFS getdirstripe -D --max-inherit-rr $testdir/qos/level1)
27887         (( $inherit_rr == 0 )) || error "qos/level1 inherit-rr $inherit_rr != 0"
27888         mkdir $testdir/qos/level1/level2 || error "mkdir level2 failed"
27889         getfattr -d -m dmv -e hex $testdir/qos/level1/level2 | grep dmv &&
27890                 error "level2 shouldn't have default LMV" || true
27891 }
27892 run_test 413c "mkdir with default LMV max inherit rr"
27893
27894 test_413d() {
27895         (( MDSCOUNT >= 2 )) ||
27896                 skip "We need at least 2 MDTs for this test"
27897
27898         (( MDS1_VERSION >= $(version_code 2.14.51) )) ||
27899                 skip "Need server version at least 2.14.51"
27900
27901         local lmv_qos_threshold_rr
27902
27903         lmv_qos_threshold_rr=$($LCTL get_param -n lmv.*.qos_threshold_rr |
27904                 head -n1)
27905         stack_trap "$LCTL set_param \
27906                 lmv.*.qos_threshold_rr=$lmv_qos_threshold_rr > /dev/null" EXIT
27907
27908         $LCTL set_param lmv.*.qos_threshold_rr=100 > /dev/null
27909         mkdir -p $DIR/$tdir || error "mkdir $tdir failed"
27910         getfattr -d -m dmv -e hex $DIR/$tdir | grep dmv &&
27911                 error "$tdir shouldn't have default LMV"
27912         createmany -d $DIR/$tdir/sub $((100 * MDSCOUNT)) ||
27913                 error "mkdir sub failed"
27914
27915         local count=$($LFS getstripe -m $DIR/$tdir/* | grep -c ^0)
27916
27917         (( count == 100 )) || error "$count subdirs on MDT0"
27918 }
27919 run_test 413d "inherit ROOT default LMV"
27920
27921 test_413e() {
27922         (( MDSCOUNT >= 2 )) ||
27923                 skip "We need at least 2 MDTs for this test"
27924         (( MDS1_VERSION >= $(version_code 2.14.55) )) ||
27925                 skip "Need server version at least 2.14.55"
27926
27927         local testdir=$DIR/$tdir
27928         local tmpfile=$TMP/temp.setdirstripe.stderr.$$
27929         local max_inherit
27930         local sub_max_inherit
27931
27932         mkdir -p $testdir || error "failed to create $testdir"
27933
27934         # set default max-inherit to -1 if stripe count is 0 or 1
27935         $LFS setdirstripe -D -c 1 $testdir ||
27936                 error "failed to set default LMV"
27937         max_inherit=$($LFS getdirstripe -D --max-inherit $testdir)
27938         (( max_inherit == -1 )) ||
27939                 error "wrong max_inherit value $max_inherit"
27940
27941         # set default max_inherit to a fixed value if stripe count is not 0 or 1
27942         $LFS setdirstripe -D -c -1 $testdir ||
27943                 error "failed to set default LMV"
27944         max_inherit=$($LFS getdirstripe -D --max-inherit $testdir)
27945         (( max_inherit > 0 )) ||
27946                 error "wrong max_inherit value $max_inherit"
27947
27948         # and the subdir will decrease the max_inherit by 1
27949         mkdir -p $testdir/subdir-1 || error "failed to make subdir"
27950         sub_max_inherit=$($LFS getdirstripe -D --max-inherit $testdir/subdir-1)
27951         (( sub_max_inherit == max_inherit - 1)) ||
27952                 error "wrong max-inherit of subdir $sub_max_inherit"
27953
27954         # check specified --max-inherit and warning message
27955         stack_trap "rm -f $tmpfile"
27956         $LFS setdirstripe -D -c 2 --max-inherit=-1 $testdir 2> $tmpfile ||
27957                 error "failed to set default LMV"
27958         max_inherit=$($LFS getdirstripe -D --max-inherit $testdir)
27959         (( max_inherit == -1 )) ||
27960                 error "wrong max_inherit value $max_inherit"
27961
27962         # check the warning messages
27963         if ! [[ $(cat $tmpfile) =~ "max-inherit=" ]]; then
27964                 error "failed to detect warning string"
27965         fi
27966 }
27967 run_test 413e "check default max-inherit value"
27968
27969 test_fs_dmv_inherit()
27970 {
27971         local testdir=$DIR/$tdir
27972
27973         local count
27974         local inherit
27975         local inherit_rr
27976
27977         for i in 1 2; do
27978                 mkdir $testdir || error "mkdir $testdir failed"
27979                 count=$($LFS getdirstripe -D -c $testdir)
27980                 (( count == 1 )) ||
27981                         error "$testdir default LMV count mismatch $count != 1"
27982                 inherit=$($LFS getdirstripe -D -X $testdir)
27983                 (( inherit == 3 - i )) ||
27984                         error "$testdir default LMV max-inherit $inherit != $((3 - i))"
27985                 inherit_rr=$($LFS getdirstripe -D --max-inherit-rr $testdir)
27986                 (( inherit_rr == 3 - i )) ||
27987                         error "$testdir default LMV max-inherit-rr $inherit_rr != $((3 - i))"
27988                 testdir=$testdir/sub
27989         done
27990
27991         mkdir $testdir || error "mkdir $testdir failed"
27992         count=$($LFS getdirstripe -D -c $testdir)
27993         (( count == 0 )) ||
27994                 error "$testdir default LMV count not zero: $count"
27995 }
27996
27997 test_413f() {
27998         (( MDSCOUNT >= 2 )) || skip "We need at least 2 MDTs for this test"
27999
28000         (( MDS1_VERSION >= $(version_code 2.14.55) )) ||
28001                 skip "Need server version at least 2.14.55"
28002
28003         getfattr -d -m trusted.dmv --absolute-names $DIR > $TMP/dmv.ea ||
28004                 error "dump $DIR default LMV failed"
28005         stack_trap "setfattr --restore=$TMP/dmv.ea"
28006
28007         $LFS setdirstripe -D -i -1 -c 1 -X 3 --max-inherit-rr 3 $DIR ||
28008                 error "set $DIR default LMV failed"
28009
28010         test_fs_dmv_inherit
28011 }
28012 run_test 413f "lfs getdirstripe -D list ROOT default LMV if it's not set on dir"
28013
28014 test_413g() {
28015         (( MDSCOUNT >= 2 )) || skip "We need at least 2 MDTs for this test"
28016
28017         mkdir -p $DIR/$tdir/l2/l3/l4 || error "mkdir $tdir/l1/l2/l3 failed"
28018         getfattr -d -m trusted.dmv --absolute-names $DIR > $TMP/dmv.ea ||
28019                 error "dump $DIR default LMV failed"
28020         stack_trap "setfattr --restore=$TMP/dmv.ea"
28021
28022         $LFS setdirstripe -D -i -1 -c 1 -X 3 --max-inherit-rr 3 $DIR ||
28023                 error "set $DIR default LMV failed"
28024
28025         FILESET="$FILESET/$tdir/l2/l3/l4" mount_client $MOUNT2 ||
28026                 error "mount $MOUNT2 failed"
28027         stack_trap "umount_client $MOUNT2"
28028
28029         local saved_DIR=$DIR
28030
28031         export DIR=$MOUNT2
28032
28033         stack_trap "export DIR=$saved_DIR"
28034
28035         # first check filesystem-wide default LMV inheritance
28036         test_fs_dmv_inherit || error "incorrect fs default LMV inheritance"
28037
28038         # then check subdirs are spread to all MDTs
28039         createmany -d $DIR/s $((MDSCOUNT * 100)) || error "createmany failed"
28040
28041         local count=$($LFS getstripe -m $DIR/s* | sort -u | wc -l)
28042
28043         (( $count == $MDSCOUNT )) || error "dirs are spread to $count MDTs"
28044 }
28045 run_test 413g "enforce ROOT default LMV on subdir mount"
28046
28047 test_413h() {
28048         (( MDSCOUNT >= 2 )) ||
28049                 skip "We need at least 2 MDTs for this test"
28050
28051         (( MDS1_VERSION >= $(version_code 2.15.50.6) )) ||
28052                 skip "Need server version at least 2.15.50.6"
28053
28054         local lmv_qos_maxage=$($LCTL get_param -n lmv.*.qos_maxage)
28055
28056         stack_trap "$LCTL set_param \
28057                 lmv.*.qos_maxage=$lmv_qos_maxage > /dev/null"
28058         $LCTL set_param lmv.*.qos_maxage=1
28059
28060         local depth=5
28061         local rr_depth=4
28062         local dir=$DIR/$tdir/l1/l2/l3/l4/l5
28063         local count=$((MDSCOUNT * 20))
28064
28065         generate_uneven_mdts 50
28066
28067         mkdir -p $dir || error "mkdir $dir failed"
28068         stack_trap "rm -rf $dir"
28069         $LFS setdirstripe -D -c 1 -i -1 --max-inherit=$depth \
28070                 --max-inherit-rr=$rr_depth $dir
28071
28072         for ((d=0; d < depth + 2; d++)); do
28073                 log "dir=$dir:"
28074                 for ((sub=0; sub < count; sub++)); do
28075                         mkdir $dir/d$sub
28076                 done
28077                 $LFS getdirstripe -i $dir/d* | sort | uniq -c | sort -nr
28078                 local num=($($LFS getdirstripe -i $dir/d* | sort | uniq -c))
28079                 # subdirs within $rr_depth should be created round-robin
28080                 if (( d < rr_depth )); then
28081                         (( ${num[0]} != count )) ||
28082                                 error "all objects created on MDT ${num[1]}"
28083                 fi
28084
28085                 dir=$dir/d0
28086         done
28087 }
28088 run_test 413h "don't stick to parent for round-robin dirs"
28089
28090 test_413i() {
28091         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
28092
28093         (( MDS1_VERSION >= $(version_code 2.14.55) )) ||
28094                 skip "Need server version at least 2.14.55"
28095
28096         getfattr -d -m trusted.dmv --absolute-names $DIR > $TMP/dmv.ea ||
28097                 error "dump $DIR default LMV failed"
28098         stack_trap "setfattr --restore=$TMP/dmv.ea"
28099
28100         local testdir=$DIR/$tdir
28101         local def_max_rr=1
28102         local def_max=3
28103         local count
28104
28105         $LFS setdirstripe -D -i-1 -c1 --max-inherit=$def_max \
28106                 --max-inherit-rr=$def_max_rr $DIR ||
28107                 error "set $DIR default LMV failed"
28108
28109         for i in $(seq 2 3); do
28110                 def_max=$((def_max - 1))
28111                 (( def_max_rr == 0 )) || def_max_rr=$((def_max_rr - 1))
28112
28113                 mkdir $testdir
28114                 # RR is decremented and keeps zeroed once exhausted
28115                 count=$($LFS getdirstripe -D --max-inherit-rr $testdir)
28116                 (( count == def_max_rr )) ||
28117                         error_noexit "$testdir: max-inherit-rr $count != $def_max_rr"
28118
28119                 # max-inherit is decremented
28120                 count=$($LFS getdirstripe -D --max-inherit $testdir)
28121                 (( count == def_max )) ||
28122                         error_noexit "$testdir: max-inherit $count != $def_max"
28123
28124                 testdir=$testdir/d$i
28125         done
28126
28127         # d3 is the last inherited from ROOT, no inheritance anymore
28128         # i.e. no the default layout anymore
28129         mkdir -p $testdir/d4/d5
28130         count=$($LFS getdirstripe -D --max-inherit $testdir)
28131         (( count == -1 )) ||
28132                 error_noexit "$testdir: max-inherit $count != -1"
28133
28134         local p_count=$($LFS getdirstripe -i $testdir)
28135
28136         for i in $(seq 4 5); do
28137                 testdir=$testdir/d$i
28138
28139                 # the root default layout is not applied once exhausted
28140                 count=$($LFS getdirstripe -i $testdir)
28141                 (( count == p_count )) ||
28142                         error_noexit "$testdir: stripe-offset $count != parent offset $p_count"
28143         done
28144
28145         $LFS setdirstripe -i 0 $DIR/d2
28146         count=$($LFS getdirstripe -D --max-inherit $DIR/d2)
28147         (( count == -1 )) ||
28148                 error_noexit "$DIR/d2: max-inherit non-striped default $count != -1"
28149 }
28150 run_test 413i "check default layout inheritance"
28151
28152 test_413z() {
28153         local pids=""
28154         local subdir
28155         local pid
28156
28157         for subdir in $(\ls -1 -d $DIR/d413*-fillmdt/*); do
28158                 unlinkmany $subdir/f. $TEST413_COUNT &
28159                 pids="$pids $!"
28160         done
28161
28162         for pid in $pids; do
28163                 wait $pid
28164         done
28165
28166         true
28167 }
28168 run_test 413z "413 test cleanup"
28169
28170 test_414() {
28171 #define OBD_FAIL_PTLRPC_BULK_ATTACH      0x521
28172         $LCTL set_param fail_loc=0x80000521
28173         dd if=/dev/zero of=$DIR/$tfile bs=2M count=1 oflag=sync
28174         rm -f $DIR/$tfile
28175 }
28176 run_test 414 "simulate ENOMEM in ptlrpc_register_bulk()"
28177
28178 test_415() {
28179         [[ $PARALLEL == "yes" ]] && skip "skip parallel run"
28180         (( $MDS1_VERSION >= $(version_code 2.11.52) )) ||
28181                 skip "Need server version at least 2.11.52"
28182
28183         # LU-11102
28184         local total=500
28185         local max=120
28186
28187         # this test may be slow on ZFS
28188         [[ "$mds1_FSTYPE" == "zfs" ]] && total=50
28189
28190         # though this test is designed for striped directory, let's test normal
28191         # directory too since lock is always saved as CoS lock.
28192         test_mkdir $DIR/$tdir || error "mkdir $tdir"
28193         createmany -o $DIR/$tdir/$tfile. $total || error "createmany"
28194         stack_trap "unlinkmany $DIR/$tdir/$tfile. $total || true"
28195         # if looping with ONLY_REPEAT, wait for previous deletions to finish
28196         wait_delete_completed_mds
28197
28198         # run a loop without concurrent touch to measure rename duration.
28199         # only for test debug/robustness, NOT part of COS functional test.
28200         local start_time=$SECONDS
28201         for ((i = 0; i < total; i++)); do
28202                 mrename $DIR/$tdir/$tfile.$i $DIR/$tdir/$tfile-new.$i \
28203                         > /dev/null
28204         done
28205         local baseline=$((SECONDS - start_time))
28206         echo "rename $total files without 'touch' took $baseline sec"
28207
28208         (
28209                 while true; do
28210                         touch $DIR/$tdir
28211                 done
28212         ) &
28213         local setattr_pid=$!
28214
28215         # rename files back to original name so unlinkmany works
28216         start_time=$SECONDS
28217         for ((i = 0; i < total; i++)); do
28218                 mrename $DIR/$tdir/$tfile-new.$i $DIR/$tdir/$tfile.$i\
28219                         > /dev/null
28220         done
28221         local duration=$((SECONDS - start_time))
28222
28223         kill -9 $setattr_pid
28224
28225         echo "rename $total files with 'touch' took $duration sec"
28226         (( max > 2 * baseline )) || max=$((2 * baseline + 5))
28227         (( duration <= max )) ||
28228                 error_not_in_vm "rename took $duration > $max sec"
28229 }
28230 run_test 415 "lock revoke is not missing"
28231
28232 test_416() {
28233         [ $MDS1_VERSION -lt $(version_code 2.11.55) ] &&
28234                 skip "Need server version at least 2.11.55"
28235
28236         # define OBD_FAIL_OSD_TXN_START    0x19a
28237         do_facet mds1 lctl set_param fail_loc=0x19a
28238
28239         lfs mkdir -c $MDSCOUNT $DIR/$tdir
28240
28241         true
28242 }
28243 run_test 416 "transaction start failure won't cause system hung"
28244
28245 cleanup_417() {
28246         trap 0
28247         do_nodes $(comma_list $(mdts_nodes)) \
28248                 "$LCTL set_param -n mdt.*MDT*.enable_dir_migration=1"
28249         do_nodes $(comma_list $(mdts_nodes)) \
28250                 "$LCTL set_param -n mdt.*MDT*.enable_remote_dir=1"
28251         do_nodes $(comma_list $(mdts_nodes)) \
28252                 "$LCTL set_param -n mdt.*MDT*.enable_striped_dir=1"
28253 }
28254
28255 test_417() {
28256         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
28257         [[ $MDS1_VERSION -lt $(version_code 2.11.56) ]] &&
28258                 skip "Need MDS version at least 2.11.56"
28259
28260         trap cleanup_417 RETURN EXIT
28261
28262         $LFS mkdir -i 1 $DIR/$tdir.1 || error "create remote dir $tdir.1 failed"
28263         do_nodes $(comma_list $(mdts_nodes)) \
28264                 "$LCTL set_param -n mdt.*MDT*.enable_dir_migration=0"
28265         $LFS migrate -m 0 $DIR/$tdir.1 &&
28266                 error "migrate dir $tdir.1 should fail"
28267
28268         do_nodes $(comma_list $(mdts_nodes)) \
28269                 "$LCTL set_param -n mdt.*MDT*.enable_remote_dir=0"
28270         $LFS mkdir -i 1 $DIR/$tdir.2 &&
28271                 error "create remote dir $tdir.2 should fail"
28272
28273         do_nodes $(comma_list $(mdts_nodes)) \
28274                 "$LCTL set_param -n mdt.*MDT*.enable_striped_dir=0"
28275         $LFS mkdir -c 2 $DIR/$tdir.3 &&
28276                 error "create striped dir $tdir.3 should fail"
28277         true
28278 }
28279 run_test 417 "disable remote dir, striped dir and dir migration"
28280
28281 # Checks that the outputs of df [-i] and lfs df [-i] match
28282 #
28283 # usage: check_lfs_df <blocks | inodes> <mountpoint>
28284 check_lfs_df() {
28285         local dir=$2
28286         local inodes
28287         local df_out
28288         local lfs_df_out
28289         local count
28290         local passed=false
28291
28292         # blocks or inodes
28293         [ "$1" == "blocks" ] && inodes= || inodes="-i"
28294
28295         for count in {1..100}; do
28296                 do_nodes "$CLIENTS" \
28297                         $LCTL set_param ldlm.namespaces.*.lru_size=clear
28298                 sync; sleep 0.2
28299
28300                 # read the lines of interest
28301                 df_out=($(df -P $inodes $dir | tail -n +2)) ||
28302                         error "df $inodes $dir | tail -n +2 failed"
28303                 lfs_df_out=($($LFS df $inodes $dir | grep summary:)) ||
28304                         error "lfs df $inodes $dir | grep summary: failed"
28305
28306                 # skip first substrings of each output as they are different
28307                 # "<NID>:/<fsname>" for df, "filesystem_summary:" for lfs df
28308                 # compare the two outputs
28309                 passed=true
28310                 #  skip "available" on MDT until LU-13997 is fixed.
28311                 #for i in {1..5}; do
28312                 for i in 1 2 4 5; do
28313                         [ "${df_out[i]}" != "${lfs_df_out[i]}" ] && passed=false
28314                 done
28315                 $passed && break
28316         done
28317
28318         if ! $passed; then
28319                 df -P $inodes $dir
28320                 echo
28321                 lfs df $inodes $dir
28322                 error "df and lfs df $1 output mismatch: "      \
28323                       "df ${inodes}: ${df_out[*]}, "            \
28324                       "lfs df ${inodes}: ${lfs_df_out[*]}"
28325         fi
28326 }
28327
28328 test_418() {
28329         [ $PARALLEL == "yes" ] && skip "skip parallel run"
28330
28331         local dir=$DIR/$tdir
28332         local numfiles=$((RANDOM % 4096 + 2))
28333         local numblocks=$((RANDOM % 256 + 1))
28334
28335         wait_delete_completed
28336         test_mkdir $dir
28337
28338         # check block output
28339         check_lfs_df blocks $dir
28340         # check inode output
28341         check_lfs_df inodes $dir
28342
28343         # create a single file and retest
28344         echo "Creating a single file and testing"
28345         createmany -o $dir/$tfile- 1 &>/dev/null ||
28346                 error "creating 1 file in $dir failed"
28347         check_lfs_df blocks $dir
28348         check_lfs_df inodes $dir
28349
28350         # create a random number of files
28351         echo "Creating $((numfiles - 1)) files and testing"
28352         createmany -o $dir/$tfile- 1 $((numfiles - 1)) &>/dev/null ||
28353                 error "creating $((numfiles - 1)) files in $dir failed"
28354
28355         # write a random number of blocks to the first test file
28356         echo "Writing $numblocks 4K blocks and testing"
28357         dd if=/dev/urandom of=$dir/${tfile}-0 bs=4K conv=fsync \
28358                 count=$numblocks &>/dev/null ||
28359                 error "dd to $dir/${tfile}-0 failed"
28360
28361         # retest
28362         check_lfs_df blocks $dir
28363         check_lfs_df inodes $dir
28364
28365         unlinkmany $dir/$tfile- $numfiles &>/dev/null ||
28366                 error "unlinking $numfiles files in $dir failed"
28367 }
28368 run_test 418 "df and lfs df outputs match"
28369
28370 test_419()
28371 {
28372         local dir=$DIR/$tdir
28373
28374         mkdir -p $dir
28375         touch $dir/file
28376
28377         cancel_lru_locks mdc
28378
28379         #OBD_FAIL_LLITE_OPEN_BY_NAME    0x1410
28380         $LCTL set_param fail_loc=0x1410
28381         cat $dir/file
28382         $LCTL set_param fail_loc=0
28383         rm -rf $dir
28384 }
28385 run_test 419 "Verify open file by name doesn't crash kernel"
28386
28387 test_420()
28388 {
28389         [[ $MDS1_VERSION -ge $(version_code 2.12.53) ]] ||
28390                 skip "Need MDS version at least 2.12.53"
28391
28392         local SAVE_UMASK=$(umask)
28393         local dir=$DIR/$tdir
28394         local uname=$(getent passwd $RUNAS_ID | cut -d: -f1)
28395
28396         mkdir -p $dir
28397         umask 0000
28398         mkdir -m03777 $dir/testdir
28399         ls -dn $dir/testdir
28400         # Need to remove trailing '.' when SELinux is enabled
28401         local dirperms=$(ls -dn $dir/testdir |
28402                          awk '{ sub(/\.$/, "", $1); print $1}')
28403         [ $dirperms == "drwxrwsrwt" ] ||
28404                 error "incorrect perms on $dir/testdir"
28405
28406         su - $uname -c "PATH=$LUSTRE/tests:\$PATH; \
28407                 openfile -f O_RDONLY:O_CREAT -m 02755 $dir/testdir/testfile"
28408         ls -n $dir/testdir/testfile
28409         local fileperms=$(ls -n $dir/testdir/testfile |
28410                           awk '{ sub(/\.$/, "", $1); print $1}')
28411         [ $fileperms == "-rwxr-xr-x" ] ||
28412                 error "incorrect perms on $dir/testdir/testfile"
28413
28414         umask $SAVE_UMASK
28415 }
28416 run_test 420 "clear SGID bit on non-directories for non-members"
28417
28418 test_421a() {
28419         local cnt
28420         local fid1
28421         local fid2
28422
28423         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
28424                 skip "Need MDS version at least 2.12.54"
28425
28426         test_mkdir $DIR/$tdir
28427         createmany -o $DIR/$tdir/f 3
28428         cnt=$(ls -1 $DIR/$tdir | wc -l)
28429         [ $cnt != 3 ] && error "unexpected #files: $cnt"
28430
28431         fid1=$(lfs path2fid $DIR/$tdir/f1)
28432         fid2=$(lfs path2fid $DIR/$tdir/f2)
28433         $LFS rmfid $DIR $fid1 $fid2 || error "rmfid failed"
28434
28435         stat $DIR/$tdir/f1 && error "f1 still visible on the client"
28436         stat $DIR/$tdir/f2 && error "f2 still visible on the client"
28437
28438         cnt=$(ls -1 $DIR/$tdir | wc -l)
28439         [ $cnt == 1 ] || error "unexpected #files after: $cnt"
28440
28441         rm -f $DIR/$tdir/f3 || error "can't remove f3"
28442         createmany -o $DIR/$tdir/f 3
28443         cnt=$(ls -1 $DIR/$tdir | wc -l)
28444         [ $cnt != 3 ] && error "unexpected #files: $cnt"
28445
28446         fid1=$(lfs path2fid $DIR/$tdir/f1)
28447         fid2=$(lfs path2fid $DIR/$tdir/f2)
28448         echo "remove using fsname $FSNAME"
28449         $LFS rmfid $FSNAME $fid1 $fid2 || error "rmfid with fsname failed"
28450
28451         cnt=$(ls -1 $DIR/$tdir | wc -l)
28452         [ $cnt == 1 ] || error "unexpected #files after: $cnt"
28453 }
28454 run_test 421a "simple rm by fid"
28455
28456 test_421b() {
28457         local cnt
28458         local FID1
28459         local FID2
28460
28461         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
28462                 skip "Need MDS version at least 2.12.54"
28463
28464         test_mkdir $DIR/$tdir
28465         createmany -o $DIR/$tdir/f 3
28466         multiop_bg_pause $DIR/$tdir/f1 o_c || error "multiop failed to start"
28467         MULTIPID=$!
28468
28469         FID1=$(lfs path2fid $DIR/$tdir/f1)
28470         FID2=$(lfs path2fid $DIR/$tdir/f2)
28471         $LFS rmfid $DIR $FID1 $FID2 && error "rmfid didn't fail"
28472
28473         kill -USR1 $MULTIPID
28474         wait
28475
28476         cnt=$(ls $DIR/$tdir | wc -l)
28477         [ $cnt == 2 ] || error "unexpected #files after: $cnt"
28478 }
28479 run_test 421b "rm by fid on open file"
28480
28481 test_421c() {
28482         local cnt
28483         local FIDS
28484
28485         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
28486                 skip "Need MDS version at least 2.12.54"
28487
28488         test_mkdir $DIR/$tdir
28489         createmany -o $DIR/$tdir/f 3
28490         touch $DIR/$tdir/$tfile
28491         createmany -l$DIR/$tdir/$tfile $DIR/$tdir/h 180
28492         cnt=$(ls -1 $DIR/$tdir | wc -l)
28493         [ $cnt != 184 ] && error "unexpected #files: $cnt"
28494
28495         FID1=$(lfs path2fid $DIR/$tdir/$tfile)
28496         $LFS rmfid $DIR $FID1 || error "rmfid failed"
28497
28498         cnt=$(ls $DIR/$tdir | wc -l)
28499         [ $cnt == 3 ] || error "unexpected #files after: $cnt"
28500 }
28501 run_test 421c "rm by fid against hardlinked files"
28502
28503 test_421d() {
28504         local cnt
28505         local FIDS
28506
28507         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
28508                 skip "Need MDS version at least 2.12.54"
28509
28510         test_mkdir $DIR/$tdir
28511         createmany -o $DIR/$tdir/f 4097
28512         cnt=$(ls -1 $DIR/$tdir | wc -l)
28513         [ $cnt != 4097 ] && error "unexpected #files: $cnt"
28514
28515         FIDS=$(lfs path2fid $DIR/$tdir/f* | sed "s/[/][^:]*://g")
28516         $LFS rmfid $DIR $FIDS || error "rmfid failed"
28517
28518         cnt=$(ls $DIR/$tdir | wc -l)
28519         rm -rf $DIR/$tdir
28520         [ $cnt == 0 ] || error "unexpected #files after: $cnt"
28521 }
28522 run_test 421d "rmfid en masse"
28523
28524 test_421e() {
28525         local cnt
28526         local FID
28527
28528         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
28529         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
28530                 skip "Need MDS version at least 2.12.54"
28531
28532         mkdir -p $DIR/$tdir
28533         $LFS setdirstripe -c$MDSCOUNT $DIR/$tdir/striped_dir
28534         createmany -o $DIR/$tdir/striped_dir/f 512
28535         cnt=$(ls -1 $DIR/$tdir/striped_dir | wc -l)
28536         [ $cnt != 512 ] && error "unexpected #files: $cnt"
28537
28538         FIDS=$(lfs path2fid $DIR/$tdir/striped_dir/f* |
28539                 sed "s/[/][^:]*://g")
28540         $LFS rmfid $DIR $FIDS || error "rmfid failed"
28541
28542         cnt=$(ls $DIR/$tdir/striped_dir | wc -l)
28543         rm -rf $DIR/$tdir
28544         [ $cnt == 0 ] || error "unexpected #files after: $cnt"
28545 }
28546 run_test 421e "rmfid in DNE"
28547
28548 test_421f() {
28549         local cnt
28550         local FID
28551
28552         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
28553                 skip "Need MDS version at least 2.12.54"
28554
28555         test_mkdir $DIR/$tdir
28556         touch $DIR/$tdir/f
28557         cnt=$(ls -1 $DIR/$tdir | wc -l)
28558         [ $cnt != 1 ] && error "unexpected #files: $cnt"
28559
28560         FID=$(lfs path2fid $DIR/$tdir/f)
28561         $RUNAS $LFS rmfid $DIR $FID && error "rmfid didn't fail (1)"
28562         # rmfid should fail
28563         cnt=$(ls -1 $DIR/$tdir | wc -l)
28564         [ $cnt != 1 ] && error "unexpected #files after (2): $cnt"
28565
28566         chmod a+rw $DIR/$tdir
28567         ls -la $DIR/$tdir
28568         $RUNAS $LFS rmfid $DIR $FID && error "rmfid didn't fail (2)"
28569         # rmfid should fail
28570         cnt=$(ls -1 $DIR/$tdir | wc -l)
28571         [ $cnt != 1 ] && error "unexpected #files after (3): $cnt"
28572
28573         rm -f $DIR/$tdir/f
28574         $RUNAS touch $DIR/$tdir/f
28575         FID=$(lfs path2fid $DIR/$tdir/f)
28576         echo "rmfid as root"
28577         $LFS rmfid $DIR $FID || error "rmfid as root failed"
28578         cnt=$(ls -1 $DIR/$tdir | wc -l)
28579         [ $cnt == 0 ] || error "unexpected #files after (4): $cnt"
28580
28581         rm -f $DIR/$tdir/f
28582         $RUNAS touch $DIR/$tdir/f
28583         cnt=$(ls -1 $DIR/$tdir | wc -l)
28584         [ $cnt != 1 ] && error "unexpected #files (4): $cnt"
28585         FID=$(lfs path2fid $DIR/$tdir/f)
28586         # rmfid w/o user_fid2path mount option should fail
28587         $RUNAS $LFS rmfid $DIR $FID && error "rmfid didn't fail(3)"
28588         cnt=$(ls -1 $DIR/$tdir | wc -l)
28589         [ $cnt == 1 ] || error "unexpected #files after (5): $cnt"
28590
28591         tmpdir=$(mktemp -d /tmp/lustre-XXXXXX)
28592         stack_trap "rmdir $tmpdir"
28593         mount_client $tmpdir "$MOUNT_OPTS,user_fid2path" ||
28594                 error "failed to mount client'"
28595         stack_trap "umount_client $tmpdir"
28596
28597         $RUNAS $LFS rmfid $tmpdir $FID || error "rmfid failed"
28598         # rmfid should succeed
28599         cnt=$(ls -1 $tmpdir/$tdir | wc -l)
28600         [ $cnt == 0 ] || error "unexpected #files after (6): $cnt"
28601
28602         # rmfid shouldn't allow to remove files due to dir's permission
28603         chmod a+rwx $tmpdir/$tdir
28604         touch $tmpdir/$tdir/f
28605         ls -la $tmpdir/$tdir
28606         FID=$(lfs path2fid $tmpdir/$tdir/f)
28607         $RUNAS $LFS rmfid $tmpdir $FID && error "rmfid didn't fail"
28608         return 0
28609 }
28610 run_test 421f "rmfid checks permissions"
28611
28612 test_421g() {
28613         local cnt
28614         local FIDS
28615
28616         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
28617         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
28618                 skip "Need MDS version at least 2.12.54"
28619
28620         mkdir -p $DIR/$tdir
28621         $LFS setdirstripe -c$MDSCOUNT $DIR/$tdir/striped_dir
28622         createmany -o $DIR/$tdir/striped_dir/f 512
28623         cnt=$(ls -1 $DIR/$tdir/striped_dir | wc -l)
28624         [ $cnt != 512 ] && error "unexpected #files: $cnt"
28625
28626         FIDS=$(lfs path2fid $DIR/$tdir/striped_dir/f* |
28627                 sed "s/[/][^:]*://g")
28628
28629         rm -f $DIR/$tdir/striped_dir/f1*
28630         cnt=$(ls -1 $DIR/$tdir/striped_dir | wc -l)
28631         removed=$((512 - cnt))
28632
28633         # few files have been just removed, so we expect
28634         # rmfid to fail on their fids
28635         errors=$($LFS rmfid $DIR $FIDS 2>&1 | wc -l)
28636         [ $removed != $errors ] && error "$errors != $removed"
28637
28638         cnt=$(ls $DIR/$tdir/striped_dir | wc -l)
28639         rm -rf $DIR/$tdir
28640         [ $cnt == 0 ] || error "unexpected #files after: $cnt"
28641 }
28642 run_test 421g "rmfid to return errors properly"
28643
28644 test_421h() {
28645         local mount_other
28646         local mount_ret
28647         local rmfid_ret
28648         local old_fid
28649         local fidA
28650         local fidB
28651         local fidC
28652         local fidD
28653
28654         (( MDS1_VERSION >= $(version_code 2.15.53) )) ||
28655                 skip "Need MDS version at least 2.15.53"
28656
28657         test_mkdir $DIR/$tdir
28658         test_mkdir $DIR/$tdir/subdir
28659         touch $DIR/$tdir/subdir/file0
28660         old_fid=$(lfs path2fid $DIR/$tdir/subdir/file0 | sed "s/[/][^:]*://g")
28661         echo File $DIR/$tdir/subdir/file0 FID $old_fid
28662         rm -f $DIR/$tdir/subdir/file0
28663         touch $DIR/$tdir/subdir/fileA
28664         fidA=$(lfs path2fid $DIR/$tdir/subdir/fileA | sed "s/[/][^:]*://g")
28665         echo File $DIR/$tdir/subdir/fileA FID $fidA
28666         touch $DIR/$tdir/subdir/fileB
28667         fidB=$(lfs path2fid $DIR/$tdir/subdir/fileB | sed "s/[/][^:]*://g")
28668         echo File $DIR/$tdir/subdir/fileB FID $fidB
28669         ln $DIR/$tdir/subdir/fileB $DIR/$tdir/subdir/fileB_hl
28670         touch $DIR/$tdir/subdir/fileC
28671         fidC=$(lfs path2fid $DIR/$tdir/subdir/fileC | sed "s/[/][^:]*://g")
28672         echo File $DIR/$tdir/subdir/fileC FID $fidC
28673         ln $DIR/$tdir/subdir/fileC $DIR/$tdir/fileC
28674         touch $DIR/$tdir/fileD
28675         fidD=$(lfs path2fid $DIR/$tdir/fileD | sed "s/[/][^:]*://g")
28676         echo File $DIR/$tdir/fileD FID $fidD
28677
28678         # mount another client mount point with subdirectory mount
28679         export FILESET=/$tdir/subdir
28680         mount_other=${MOUNT}_other
28681         mount_client $mount_other ${MOUNT_OPTS}
28682         mount_ret=$?
28683         export FILESET=""
28684         (( mount_ret == 0 )) || error "mount $mount_other failed"
28685
28686         echo Removing FIDs:
28687         echo $LFS rmfid $mount_other $old_fid $fidA $fidD $fidB $fidC
28688         $LFS rmfid $mount_other $old_fid $fidA $fidD $fidB $fidC
28689         rmfid_ret=$?
28690
28691         umount_client $mount_other || error "umount $mount_other failed"
28692
28693         (( rmfid_ret != 0 )) || error "rmfid should have failed"
28694
28695         # fileA should have been deleted
28696         stat $DIR/$tdir/subdir/fileA && error "fileA not deleted"
28697
28698         # fileB should have been deleted
28699         stat $DIR/$tdir/subdir/fileB && error "fileB not deleted"
28700
28701         # fileC should not have been deleted, fid also exists outside of fileset
28702         stat $DIR/$tdir/subdir/fileC || error "fileC deleted"
28703
28704         # fileD should not have been deleted, it exists outside of fileset
28705         stat $DIR/$tdir/fileD || error "fileD deleted"
28706 }
28707 run_test 421h "rmfid with fileset mount"
28708
28709 test_422() {
28710         test_mkdir -i 0 -c 1 -p $DIR/$tdir/d1
28711         test_mkdir -i 0 -c 1 -p $DIR/$tdir/d2
28712         test_mkdir -i 0 -c 1 -p $DIR/$tdir/d3
28713         dd if=/dev/zero of=$DIR/$tdir/d1/file1 bs=1k count=1
28714         dd if=/dev/zero of=$DIR/$tdir/d2/file1 bs=1k count=1
28715
28716         local amc=$(at_max_get client)
28717         local amo=$(at_max_get mds1)
28718         local timeout=`lctl get_param -n timeout`
28719
28720         at_max_set 0 client
28721         at_max_set 0 mds1
28722
28723 #define OBD_FAIL_PTLRPC_PAUSE_REQ        0x50a
28724         do_facet mds1 $LCTL set_param fail_loc=0x8000050a \
28725                         fail_val=$(((2*timeout + 10)*1000))
28726         touch $DIR/$tdir/d3/file &
28727         sleep 2
28728 #define OBD_FAIL_TGT_REPLY_DATA_RACE     0x722
28729         do_facet mds1 $LCTL set_param fail_loc=0x80000722 \
28730                         fail_val=$((2*timeout + 5))
28731         mv $DIR/$tdir/d1/file1 $DIR/$tdir/d1/file2 &
28732         local pid=$!
28733         sleep 1
28734         kill -9 $pid
28735         sleep $((2 * timeout))
28736         echo kill $pid
28737         kill -9 $pid
28738         lctl mark touch
28739         touch $DIR/$tdir/d2/file3
28740         touch $DIR/$tdir/d2/file4
28741         touch $DIR/$tdir/d2/file5
28742
28743         wait
28744         at_max_set $amc client
28745         at_max_set $amo mds1
28746
28747         # LU-12838 - verify the ptlrpc thread watchdog is not always throttled
28748         do_facet mds1 "dmesg | grep 'Dumping the stack trace for debugging'" ||
28749                 error "Watchdog is always throttled"
28750 }
28751 run_test 422 "kill a process with RPC in progress"
28752
28753 stat_test() {
28754     df -h $MOUNT &
28755     df -h $MOUNT &
28756     df -h $MOUNT &
28757     df -h $MOUNT &
28758     df -h $MOUNT &
28759     df -h $MOUNT &
28760 }
28761
28762 test_423() {
28763     local _stats
28764     # ensure statfs cache is expired
28765     sleep 2;
28766
28767     _stats=$(stat_test | grep $MOUNT | sort -u | wc -l)
28768     [[ ${_stats} -ne 1 ]] && error "statfs wrong"
28769
28770     return 0
28771 }
28772 run_test 423 "statfs should return a right data"
28773
28774 test_424() {
28775 #define OBD_FAIL_PTLRPC_BULK_REPLY_ATTACH      0x522 | CFS_FAIL_ONCE
28776         $LCTL set_param fail_loc=0x80000522
28777         dd if=/dev/zero of=$DIR/$tfile bs=2M count=1 oflag=sync
28778         rm -f $DIR/$tfile
28779 }
28780 run_test 424 "simulate ENOMEM in ptl_send_rpc bulk reply ME attach"
28781
28782 test_425() {
28783         test_mkdir -c -1 $DIR/$tdir
28784         $LFS setstripe -c -1 $DIR/$tdir
28785
28786         lru_resize_disable "" 100
28787         stack_trap "lru_resize_enable" EXIT
28788
28789         sleep 5
28790
28791         for i in $(seq $((MDSCOUNT * 125))); do
28792                 local t=$DIR/$tdir/$tfile_$i
28793
28794                 dd if=/dev/zero of=$t bs=4K count=1 > /dev/null 2>&1 ||
28795                         error_noexit "Create file $t"
28796         done
28797         stack_trap "rm -rf $DIR/$tdir" EXIT
28798
28799         for oscparam in $($LCTL list_param ldlm.namespaces.*osc-[-0-9a-f]*); do
28800                 local lru_size=$($LCTL get_param -n $oscparam.lru_size)
28801                 local lock_count=$($LCTL get_param -n $oscparam.lock_count)
28802
28803                 [ $lock_count -le $lru_size ] ||
28804                         error "osc lock count $lock_count > lru size $lru_size"
28805         done
28806
28807         for mdcparam in $($LCTL list_param ldlm.namespaces.*mdc-*); do
28808                 local lru_size=$($LCTL get_param -n $mdcparam.lru_size)
28809                 local lock_count=$($LCTL get_param -n $mdcparam.lock_count)
28810
28811                 [ $lock_count -le $lru_size ] ||
28812                         error "mdc lock count $lock_count > lru size $lru_size"
28813         done
28814 }
28815 run_test 425 "lock count should not exceed lru size"
28816
28817 test_426() {
28818         splice-test -r $DIR/$tfile
28819         splice-test -rd $DIR/$tfile
28820         splice-test $DIR/$tfile
28821         splice-test -d $DIR/$tfile
28822 }
28823 run_test 426 "splice test on Lustre"
28824
28825 test_427() {
28826         [ $MDSCOUNT -ge 2 ] || skip "needs >= 2 MDTs"
28827         (( $MDS1_VERSION >= $(version_code 2.12.4) )) ||
28828                 skip "Need MDS version at least 2.12.4"
28829         local log
28830
28831         mkdir $DIR/$tdir
28832         mkdir $DIR/$tdir/1
28833         mkdir $DIR/$tdir/2
28834         test_mkdir -c $MDSCOUNT -i 1 $DIR/$tdir/1/dir
28835         test_mkdir -c $MDSCOUNT -i 1 $DIR/$tdir/2/dir2
28836
28837         $LFS getdirstripe $DIR/$tdir/1/dir
28838
28839         #first setfattr for creating updatelog
28840         setfattr -n user.attr0 -v "some text" $DIR/$tdir/1/dir
28841
28842 #define OBD_FAIL_OUT_OBJECT_MISS        0x1708
28843         do_nodes $(comma_list $(mdts_nodes)) $LCTL set_param fail_loc=0x80001708
28844         setfattr -n user.attr1 -v "some text" $DIR/$tdir/1/dir &
28845         setfattr -n user.attr2 -v "another attr"  $DIR/$tdir/2/dir2 &
28846
28847         sleep 2
28848         fail mds2
28849         wait_recovery_complete mds2 $((2*TIMEOUT))
28850
28851         log=$(do_facet mds1 dmesg | tac | sed "/${TESTNAME//_/ }/,$ d")
28852         echo $log | grep "get update log failed" &&
28853                 error "update log corruption is detected" || true
28854 }
28855 run_test 427 "Failed DNE2 update request shouldn't corrupt updatelog"
28856
28857 test_428() {
28858         [ $PARALLEL == "yes" ] && skip "skip parallel run"
28859         local max_cached_mb=$($LCTL get_param llite.*.max_cached_mb |
28860                               awk '/^max_cached_mb/ { print $2 }')
28861         stack_trap "$LCTL set_param -n llite.*.max_cached_mb=$max_cached_mb"
28862
28863         $LCTL set_param -n llite.*.max_cached_mb=64
28864
28865         mkdir $DIR/$tdir
28866         $LFS setstripe -c 1 $DIR/$tdir
28867         eval touch $DIR/$tdir/$tfile.{1..$OSTCOUNT}
28868         stack_trap "rm -f $DIR/$tdir/$tfile.*"
28869         #test write
28870         for f in $(seq 4); do
28871                 dd if=/dev/zero of=$DIR/$tdir/$tfile.$f bs=128M count=1 &
28872         done
28873         wait
28874
28875         cancel_lru_locks osc
28876         # Test read
28877         for f in $(seq 4); do
28878                 dd if=$DIR/$tdir/$tfile.$f of=/dev/null bs=128M count=1 &
28879         done
28880         wait
28881 }
28882 run_test 428 "large block size IO should not hang"
28883
28884 test_429() { # LU-7915 / LU-10948
28885         local ll_opencache_threshold_count="llite.*.opencache_threshold_count"
28886         local testfile=$DIR/$tfile
28887         local mdc_rpcstats="mdc.$FSNAME-MDT0000-*.stats"
28888         local new_flag=1
28889         local first_rpc
28890         local second_rpc
28891         local third_rpc
28892
28893         $LCTL get_param $ll_opencache_threshold_count ||
28894                 skip "client does not have opencache parameter"
28895
28896         set_opencache $new_flag
28897         stack_trap "restore_opencache"
28898         [ $($LCTL get_param -n $ll_opencache_threshold_count) == $new_flag ] ||
28899                 error "enable opencache failed"
28900         touch $testfile
28901         # drop MDC DLM locks
28902         cancel_lru_locks mdc
28903         # clear MDC RPC stats counters
28904         $LCTL set_param $mdc_rpcstats=clear
28905
28906         # According to the current implementation, we need to run 3 times
28907         # open & close file to verify if opencache is enabled correctly.
28908         # 1st, RPCs are sent for lookup/open and open handle is released on
28909         #      close finally.
28910         # 2nd, RPC is sent for open, MDS_OPEN_LOCK is fetched automatically,
28911         #      so open handle won't be released thereafter.
28912         # 3rd, No RPC is sent out.
28913         $MULTIOP $testfile oc || error "multiop failed"
28914         first_rpc=$(calc_stats $mdc_rpcstats ldlm_ibits_enqueue)
28915         echo "1st: $first_rpc RPCs in flight"
28916
28917         $MULTIOP $testfile oc || error "multiop failed"
28918         second_rpc=$(calc_stats $mdc_rpcstats ldlm_ibits_enqueue)
28919         echo "2nd: $second_rpc RPCs in flight"
28920
28921         $MULTIOP $testfile oc || error "multiop failed"
28922         third_rpc=$(calc_stats $mdc_rpcstats ldlm_ibits_enqueue)
28923         echo "3rd: $third_rpc RPCs in flight"
28924
28925         #verify no MDC RPC is sent
28926         [[ $second_rpc == $third_rpc ]] || error "MDC RPC is still sent"
28927 }
28928 run_test 429 "verify if opencache flag on client side does work"
28929
28930 lseek_test_430() {
28931         local offset
28932         local file=$1
28933
28934         # data at [200K, 400K)
28935         dd if=/dev/urandom of=$file bs=256K count=1 seek=1 ||
28936                 error "256K->512K dd fails"
28937         # data at [2M, 3M)
28938         dd if=/dev/urandom of=$file bs=1M count=1 seek=2 ||
28939                 error "2M->3M dd fails"
28940         # data at [4M, 5M)
28941         dd if=/dev/urandom of=$file bs=1M count=1 seek=4 ||
28942                 error "4M->5M dd fails"
28943         echo "Data at 256K...512K, 2M...3M and 4M...5M"
28944         # start at first component hole #1
28945         printf "Seeking hole from 1000 ... "
28946         offset=$(lseek_test -l 1000 $file)
28947         echo $offset
28948         [[ $offset == 1000 ]] || error "offset $offset != 1000"
28949         printf "Seeking data from 1000 ... "
28950         offset=$(lseek_test -d 1000 $file)
28951         echo $offset
28952         [[ $offset == 262144 ]] || error "offset $offset != 262144"
28953
28954         # start at first component data block
28955         printf "Seeking hole from 300000 ... "
28956         offset=$(lseek_test -l 300000 $file)
28957         echo $offset
28958         [[ $offset == 524288 ]] || error "offset $offset != 524288"
28959         printf "Seeking data from 300000 ... "
28960         offset=$(lseek_test -d 300000 $file)
28961         echo $offset
28962         [[ $offset == 300000 ]] || error "offset $offset != 300000"
28963
28964         # start at the first component but beyond end of object size
28965         printf "Seeking hole from 1000000 ... "
28966         offset=$(lseek_test -l 1000000 $file)
28967         echo $offset
28968         [[ $offset == 1000000 ]] || error "offset $offset != 1000000"
28969         printf "Seeking data from 1000000 ... "
28970         offset=$(lseek_test -d 1000000 $file)
28971         echo $offset
28972         [[ $offset == 2097152 ]] || error "offset $offset != 2097152"
28973
28974         # start at second component stripe 2 (empty file)
28975         printf "Seeking hole from 1500000 ... "
28976         offset=$(lseek_test -l 1500000 $file)
28977         echo $offset
28978         [[ $offset == 1500000 ]] || error "offset $offset != 1500000"
28979         printf "Seeking data from 1500000 ... "
28980         offset=$(lseek_test -d 1500000 $file)
28981         echo $offset
28982         [[ $offset == 2097152 ]] || error "offset $offset != 2097152"
28983
28984         # start at second component stripe 1 (all data)
28985         printf "Seeking hole from 3000000 ... "
28986         offset=$(lseek_test -l 3000000 $file)
28987         echo $offset
28988         [[ $offset == 3145728 ]] || error "offset $offset != 3145728"
28989         printf "Seeking data from 3000000 ... "
28990         offset=$(lseek_test -d 3000000 $file)
28991         echo $offset
28992         [[ $offset == 3000000 ]] || error "offset $offset != 3000000"
28993
28994         dd if=/dev/urandom of=$file bs=640K count=1 seek=1 ||
28995                 error "2nd dd fails"
28996         echo "Add data block at 640K...1280K"
28997
28998         # start at before new data block, in hole
28999         printf "Seeking hole from 600000 ... "
29000         offset=$(lseek_test -l 600000 $file)
29001         echo $offset
29002         [[ $offset == 600000 ]] || error "offset $offset != 600000"
29003         printf "Seeking data from 600000 ... "
29004         offset=$(lseek_test -d 600000 $file)
29005         echo $offset
29006         [[ $offset == 655360 ]] || error "offset $offset != 655360"
29007
29008         # start at the first component new data block
29009         printf "Seeking hole from 1000000 ... "
29010         offset=$(lseek_test -l 1000000 $file)
29011         echo $offset
29012         [[ $offset == 1310720 ]] || error "offset $offset != 1310720"
29013         printf "Seeking data from 1000000 ... "
29014         offset=$(lseek_test -d 1000000 $file)
29015         echo $offset
29016         [[ $offset == 1000000 ]] || error "offset $offset != 1000000"
29017
29018         # start at second component stripe 2, new data
29019         printf "Seeking hole from 1200000 ... "
29020         offset=$(lseek_test -l 1200000 $file)
29021         echo $offset
29022         [[ $offset == 1310720 ]] || error "offset $offset != 1310720"
29023         printf "Seeking data from 1200000 ... "
29024         offset=$(lseek_test -d 1200000 $file)
29025         echo $offset
29026         [[ $offset == 1200000 ]] || error "offset $offset != 1200000"
29027
29028         # start beyond file end
29029         printf "Using offset > filesize ... "
29030         lseek_test -l 4000000 $file && error "lseek should fail"
29031         printf "Using offset > filesize ... "
29032         lseek_test -d 4000000 $file && error "lseek should fail"
29033
29034         printf "Done\n\n"
29035 }
29036
29037 test_430a() {
29038         $LCTL get_param mdc.*.import | grep -q 'connect_flags:.*seek' ||
29039                 skip "MDT does not support SEEK_HOLE"
29040
29041         $LCTL get_param osc.*.import | grep -q 'connect_flags:.*seek' ||
29042                 skip "OST does not support SEEK_HOLE"
29043
29044         local file=$DIR/$tdir/$tfile
29045
29046         mkdir -p $DIR/$tdir
29047
29048         $LFS setstripe -E 1M -L mdt -E eof -c2 $file
29049         # OST stripe #1 will have continuous data at [1M, 3M)
29050         # OST stripe #2 is empty
29051         echo "Component #1: 1M DoM, component #2: EOF, 2 stripes 1M"
29052         lseek_test_430 $file
29053         rm $file
29054         $LFS setstripe -E 1M -c2 -S 64K -E 10M -c2 -S 1M $file
29055         echo "Component #1: 1M, 2 stripes 64K, component #2: EOF, 2 stripes 1M"
29056         lseek_test_430 $file
29057         rm $file
29058         $LFS setstripe -c2 -S 512K $file
29059         echo "Two stripes, stripe size 512K"
29060         lseek_test_430 $file
29061         rm $file
29062         # FLR with stale mirror
29063         $LFS setstripe -N -E 512K -c1 -S 64K -E eof -c2 -S 512K \
29064                        -N -c2 -S 1M $file
29065         echo "Mirrored file:"
29066         echo "Component #1: 512K, stripe 64K, component #2: EOF, 2 stripes 512K"
29067         echo "Plain 2 stripes 1M"
29068         lseek_test_430 $file
29069         rm $file
29070 }
29071 run_test 430a "lseek: SEEK_DATA/SEEK_HOLE basic functionality"
29072
29073 test_430b() {
29074         $LCTL get_param osc.*.import | grep -q 'connect_flags:.*seek' ||
29075                 skip "OST does not support SEEK_HOLE"
29076
29077         local offset
29078         local file=$DIR/$tdir/$tfile
29079
29080         mkdir -p $DIR/$tdir
29081         # Empty layout lseek should fail
29082         $MCREATE $file
29083         # seek from 0
29084         printf "Seeking hole from 0 ... "
29085         lseek_test -l 0 $file && error "lseek should fail"
29086         printf "Seeking data from 0 ... "
29087         lseek_test -d 0 $file && error "lseek should fail"
29088         rm $file
29089
29090         # 1M-hole file
29091         $LFS setstripe -E 1M -c2 -E eof $file
29092         $TRUNCATE $file 1048576
29093         printf "Seeking hole from 1000000 ... "
29094         offset=$(lseek_test -l 1000000 $file)
29095         echo $offset
29096         [[ $offset == 1000000 ]] || error "offset $offset != 1000000"
29097         printf "Seeking data from 1000000 ... "
29098         lseek_test -d 1000000 $file && error "lseek should fail"
29099         rm $file
29100
29101         # full component followed by non-inited one
29102         $LFS setstripe -E 1M -c2 -E eof $file
29103         dd if=/dev/urandom of=$file bs=1M count=1
29104         printf "Seeking hole from 1000000 ... "
29105         offset=$(lseek_test -l 1000000 $file)
29106         echo $offset
29107         [[ $offset == 1048576 ]] || error "offset $offset != 1048576"
29108         printf "Seeking hole from 1048576 ... "
29109         lseek_test -l 1048576 $file && error "lseek should fail"
29110         # init second component and truncate back
29111         echo "123" >> $file
29112         $TRUNCATE $file 1048576
29113         printf "Seeking hole from 1000000 ... "
29114         offset=$(lseek_test -l 1000000 $file)
29115         echo $offset
29116         [[ $offset == 1048576 ]] || error "offset $offset != 1048576"
29117         printf "Seeking hole from 1048576 ... "
29118         lseek_test -l 1048576 $file && error "lseek should fail"
29119         # boundary checks for big values
29120         dd if=/dev/urandom of=$file.10g bs=1 count=1 seek=10G
29121         offset=$(lseek_test -d 0 $file.10g)
29122         [[ $offset == 10737418240 ]] || error "offset $offset != 10737418240"
29123         dd if=/dev/urandom of=$file.100g bs=1 count=1 seek=100G
29124         offset=$(lseek_test -d 0 $file.100g)
29125         [[ $offset == 107374182400 ]] || error "offset $offset != 107374182400"
29126         return 0
29127 }
29128 run_test 430b "lseek: SEEK_DATA/SEEK_HOLE special cases"
29129
29130 test_430c() {
29131         $LCTL get_param osc.*.import | grep -q 'connect_flags:.*seek' ||
29132                 skip "OST does not support SEEK_HOLE"
29133
29134         local file=$DIR/$tdir/$tfile
29135         local start
29136
29137         mkdir -p $DIR/$tdir
29138         stack_trap "rm -f $file $file.tmp"
29139         dd if=/dev/urandom of=$file bs=1k count=1 seek=5M || error "dd failed"
29140
29141         # cp version 8.33+ prefers lseek over fiemap
29142         local ver=$(cp --version | awk '{ print $4; exit; }')
29143
29144         echo "cp $ver installed"
29145         if (( $(version_code $ver) >= $(version_code 8.33) )); then
29146                 start=$SECONDS
29147                 time cp -v $file $file.tmp || error "cp $file failed"
29148                 (( SECONDS - start < 5 )) || {
29149                         strace cp $file $file.tmp |&
29150                                 grep -E "open|read|seek|FIEMAP" |
29151                                 grep -A 100 $file
29152                         error "cp: too long runtime $((SECONDS - start))"
29153                 }
29154         else
29155                 echo "cp test skipped due to $ver < 8.33"
29156         fi
29157
29158         # tar version 1.29+ supports SEEK_HOLE/DATA
29159         ver=$(tar --version | awk '{ print $4; exit; }')
29160         echo "tar $ver installed"
29161         if (( $(version_code $ver) >= $(version_code 1.29) )); then
29162                 start=$SECONDS
29163                 time tar cvf $file.tmp --sparse $file || error "tar $file error"
29164                 (( SECONDS - start < 5 )) || {
29165                         strace tar cf $file.tmp --sparse $file |&
29166                                 grep -E "open|read|seek|FIEMAP" |
29167                                 grep -A 100 $file
29168                         error "tar: too long runtime $((SECONDS - start))"
29169                 }
29170         else
29171                 echo "tar test skipped due to $ver < 1.29"
29172         fi
29173 }
29174 run_test 430c "lseek: external tools check"
29175
29176 test_431() { # LU-14187
29177         local file=$DIR/$tdir/$tfile
29178
29179         mkdir -p $DIR/$tdir
29180         $LFS setstripe -c 1 -i 0 $file || error "lfs setstripe failed"
29181         dd if=/dev/urandom of=$file bs=4k count=1
29182         dd if=/dev/urandom of=$file bs=4k count=1 seek=10 conv=notrunc
29183         dd if=/dev/urandom of=$file bs=4k count=1 seek=12 conv=notrunc
29184         #define OBD_FAIL_OST_RESTART_IO 0x251
29185         do_facet ost1 "$LCTL set_param fail_loc=0x251"
29186         $LFS setstripe -c 1 -i 0 $file.0 || error "lfs setstripe failed"
29187         cp $file $file.0
29188         cancel_lru_locks
29189         sync_all_data
29190         echo 3 > /proc/sys/vm/drop_caches
29191         diff  $file $file.0 || error "data diff"
29192 }
29193 run_test 431 "Restart transaction for IO"
29194
29195 cleanup_test_432() {
29196         do_facet mgs $LCTL nodemap_activate 0
29197         wait_nm_sync active
29198 }
29199
29200 test_432() {
29201         local tmpdir=$TMP/dir432
29202
29203         (( $MDS1_VERSION >= $(version_code 2.14.52) )) ||
29204                 skip "Need MDS version at least 2.14.52"
29205
29206         stack_trap cleanup_test_432 EXIT
29207         mkdir $DIR/$tdir
29208         mkdir $tmpdir
29209
29210         do_facet mgs $LCTL nodemap_activate 1
29211         wait_nm_sync active
29212         do_facet mgs $LCTL nodemap_modify --name default \
29213                 --property admin --value 1
29214         do_facet mgs $LCTL nodemap_modify --name default \
29215                 --property trusted --value 1
29216         cancel_lru_locks mdc
29217         wait_nm_sync default admin_nodemap
29218         wait_nm_sync default trusted_nodemap
29219
29220         if [ $(mv $tmpdir $DIR/$tdir/ 2>&1 |
29221                grep -ci "Operation not permitted") -ne 0 ]; then
29222                 error "mv $tmpdir $DIR/$tdir/ hits 'Operation not permitted'"
29223         fi
29224 }
29225 run_test 432 "mv dir from outside Lustre"
29226
29227 test_433() {
29228         [ $PARALLEL == "yes" ] && skip "skip parallel run"
29229
29230         [[ -n "$($LCTL list_param llite.*.inode_cache 2>/dev/null)" ]] ||
29231                 skip "inode cache not supported"
29232
29233         $LCTL set_param llite.*.inode_cache=0
29234         stack_trap "$LCTL set_param llite.*.inode_cache=1"
29235
29236         local count=256
29237         local before
29238         local after
29239
29240         cancel_lru_locks mdc
29241         test_mkdir $DIR/$tdir || error "mkdir $tdir"
29242         createmany -m $DIR/$tdir/f $count
29243         createmany -d $DIR/$tdir/d $count
29244         ls -l $DIR/$tdir > /dev/null
29245         stack_trap "rm -rf $DIR/$tdir"
29246
29247         before=$(num_objects)
29248         cancel_lru_locks mdc
29249         after=$(num_objects)
29250
29251         # sometimes even @before is less than 2 * count
29252         while (( before - after < count )); do
29253                 sleep 1
29254                 after=$(num_objects)
29255                 wait=$((wait + 1))
29256                 (( wait % 5 == 0 )) && echo "wait $wait seconds objects: $after"
29257                 if (( wait > 60 )); then
29258                         error "inode slab grew from $before to $after"
29259                 fi
29260         done
29261
29262         echo "lustre_inode_cache $before objs before lock cancel, $after after"
29263 }
29264 run_test 433 "ldlm lock cancel releases dentries and inodes"
29265
29266 test_434() {
29267         local file
29268         local getxattr_count
29269         local mdc_stat_param="mdc.$FSNAME-MDT0000*.md_stats"
29270         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
29271
29272         [[ $(getenforce) == "Disabled" ]] ||
29273                 skip "lsm selinux module have to be disabled for this test"
29274
29275         test_mkdir -i 0 -c1 $DIR/$tdir/ ||
29276                 error "fail to create $DIR/$tdir/ on MDT0000"
29277
29278         touch $DIR/$tdir/$tfile-{001..100}
29279
29280         # disable the xattr cache
29281         save_lustre_params client "llite.*.xattr_cache" > $p
29282         lctl set_param llite.*.xattr_cache=0
29283         stack_trap "restore_lustre_params < $p; rm -f $p" EXIT
29284
29285         # clear clients mdc stats
29286         clear_stats $mdc_stat_param ||
29287                 error "fail to clear stats on mdc MDT0000"
29288
29289         for file in $DIR/$tdir/$tfile-{001..100}; do
29290                 getfattr -n security.selinux $file |&
29291                         grep -q "Operation not supported" ||
29292                         error "getxattr on security.selinux should return EOPNOTSUPP"
29293         done
29294
29295         getxattr_count=$(calc_stats $mdc_stat_param "getxattr")
29296         (( getxattr_count < 100 )) ||
29297                 error "client sent $getxattr_count getxattr RPCs to the MDS"
29298 }
29299 run_test 434 "Client should not send RPCs for security.selinux with SElinux disabled"
29300
29301 test_440() {
29302         if [[ -f $LUSTRE/scripts/bash-completion/lustre ]]; then
29303                 source $LUSTRE/scripts/bash-completion/lustre
29304         elif [[ -f /usr/share/bash-completion/completions/lustre ]]; then
29305                 source /usr/share/bash-completion/completions/lustre
29306         else
29307                 skip "bash completion scripts not found"
29308         fi
29309
29310         local lctl_completions
29311         local lfs_completions
29312
29313         lctl_completions=$(_lustre_cmds lctl)
29314         if [[ ! $lctl_completions =~ "get_param" ]]; then
29315                 error "lctl bash completion failed"
29316         fi
29317
29318         lfs_completions=$(_lustre_cmds lfs)
29319         if [[ ! $lfs_completions =~ "setstripe" ]]; then
29320                 error "lfs bash completion failed"
29321         fi
29322 }
29323 run_test 440 "bash completion for lfs, lctl"
29324
29325 prep_801() {
29326         [[ $MDS1_VERSION -lt $(version_code 2.9.55) ]] ||
29327         [[ $OST1_VERSION -lt $(version_code 2.9.55) ]] &&
29328                 skip "Need server version at least 2.9.55"
29329
29330         start_full_debug_logging
29331 }
29332
29333 post_801() {
29334         stop_full_debug_logging
29335 }
29336
29337 barrier_stat() {
29338         if [ $MGS_VERSION -le $(version_code 2.10.0) ]; then
29339                 local st=$(do_facet mgs $LCTL barrier_stat $FSNAME |
29340                            awk '/The barrier for/ { print $7 }')
29341                 echo $st
29342         else
29343                 local st=$(do_facet mgs $LCTL barrier_stat -s $FSNAME)
29344                 echo \'$st\'
29345         fi
29346 }
29347
29348 barrier_expired() {
29349         local expired
29350
29351         if [ $MGS_VERSION -le $(version_code 2.10.0) ]; then
29352                 expired=$(do_facet mgs $LCTL barrier_stat $FSNAME |
29353                           awk '/will be expired/ { print $7 }')
29354         else
29355                 expired=$(do_facet mgs $LCTL barrier_stat -t $FSNAME)
29356         fi
29357
29358         echo $expired
29359 }
29360
29361 test_801a() {
29362         prep_801
29363
29364         echo "Start barrier_freeze at: $(date)"
29365         #define OBD_FAIL_BARRIER_DELAY          0x2202
29366         do_facet mgs $LCTL set_param fail_val=5 fail_loc=0x2202
29367         # Do not reduce barrier time - See LU-11873
29368         do_facet mgs $LCTL barrier_freeze $FSNAME 20 &
29369
29370         sleep 2
29371         local b_status=$(barrier_stat)
29372         echo "Got barrier status at: $(date)"
29373         [ "$b_status" = "'freezing_p1'" ] ||
29374                 error "(1) unexpected barrier status $b_status"
29375
29376         do_facet mgs $LCTL set_param fail_val=0 fail_loc=0
29377         wait
29378         b_status=$(barrier_stat)
29379         [ "$b_status" = "'frozen'" ] ||
29380                 error "(2) unexpected barrier status $b_status"
29381
29382         local expired=$(barrier_expired)
29383         echo "sleep $((expired + 3)) seconds, then the barrier will be expired"
29384         sleep $((expired + 3))
29385
29386         b_status=$(barrier_stat)
29387         [ "$b_status" = "'expired'" ] ||
29388                 error "(3) unexpected barrier status $b_status"
29389
29390         # Do not reduce barrier time - See LU-11873
29391         do_facet mgs $LCTL barrier_freeze $FSNAME 20 ||
29392                 error "(4) fail to freeze barrier"
29393
29394         b_status=$(barrier_stat)
29395         [ "$b_status" = "'frozen'" ] ||
29396                 error "(5) unexpected barrier status $b_status"
29397
29398         echo "Start barrier_thaw at: $(date)"
29399         #define OBD_FAIL_BARRIER_DELAY          0x2202
29400         do_facet mgs $LCTL set_param fail_val=5 fail_loc=0x2202
29401         do_facet mgs $LCTL barrier_thaw $FSNAME &
29402
29403         sleep 2
29404         b_status=$(barrier_stat)
29405         echo "Got barrier status at: $(date)"
29406         [ "$b_status" = "'thawing'" ] ||
29407                 error "(6) unexpected barrier status $b_status"
29408
29409         do_facet mgs $LCTL set_param fail_val=0 fail_loc=0
29410         wait
29411         b_status=$(barrier_stat)
29412         [ "$b_status" = "'thawed'" ] ||
29413                 error "(7) unexpected barrier status $b_status"
29414
29415         #define OBD_FAIL_BARRIER_FAILURE        0x2203
29416         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x2203
29417         do_facet mgs $LCTL barrier_freeze $FSNAME
29418
29419         b_status=$(barrier_stat)
29420         [ "$b_status" = "'failed'" ] ||
29421                 error "(8) unexpected barrier status $b_status"
29422
29423         do_facet $SINGLEMDS $LCTL set_param fail_loc=0
29424         do_facet mgs $LCTL barrier_thaw $FSNAME
29425
29426         post_801
29427 }
29428 run_test 801a "write barrier user interfaces and stat machine"
29429
29430 test_801b() {
29431         prep_801
29432
29433         mkdir $DIR/$tdir || error "(1) fail to mkdir"
29434         createmany -d $DIR/$tdir/d 6 || error "(2) fail to mkdir"
29435         touch $DIR/$tdir/d2/f10 || error "(3) fail to touch"
29436         touch $DIR/$tdir/d3/f11 || error "(4) fail to touch"
29437         touch $DIR/$tdir/d4/f12 || error "(5) fail to touch"
29438
29439         cancel_lru_locks mdc
29440
29441         # 180 seconds should be long enough
29442         do_facet mgs $LCTL barrier_freeze $FSNAME 180
29443
29444         local b_status=$(barrier_stat)
29445         [ "$b_status" = "'frozen'" ] ||
29446                 error "(6) unexpected barrier status $b_status"
29447
29448         mkdir $DIR/$tdir/d0/d10 &
29449         mkdir_pid=$!
29450
29451         touch $DIR/$tdir/d1/f13 &
29452         touch_pid=$!
29453
29454         ln $DIR/$tdir/d2/f10 $DIR/$tdir/d2/f14 &
29455         ln_pid=$!
29456
29457         mv $DIR/$tdir/d3/f11 $DIR/$tdir/d3/f15 &
29458         mv_pid=$!
29459
29460         rm -f $DIR/$tdir/d4/f12 &
29461         rm_pid=$!
29462
29463         stat $DIR/$tdir/d5 || error "(7) stat should succeed"
29464
29465         # To guarantee taht the 'stat' is not blocked
29466         b_status=$(barrier_stat)
29467         [ "$b_status" = "'frozen'" ] ||
29468                 error "(8) unexpected barrier status $b_status"
29469
29470         # let above commands to run at background
29471         sleep 5
29472
29473         ps -p $mkdir_pid || error "(9) mkdir should be blocked"
29474         ps -p $touch_pid || error "(10) touch should be blocked"
29475         ps -p $ln_pid || error "(11) link should be blocked"
29476         ps -p $mv_pid || error "(12) rename should be blocked"
29477         ps -p $rm_pid || error "(13) unlink should be blocked"
29478
29479         b_status=$(barrier_stat)
29480         [ "$b_status" = "'frozen'" ] ||
29481                 error "(14) unexpected barrier status $b_status"
29482
29483         do_facet mgs $LCTL barrier_thaw $FSNAME
29484         b_status=$(barrier_stat)
29485         [ "$b_status" = "'thawed'" ] ||
29486                 error "(15) unexpected barrier status $b_status"
29487
29488         wait $mkdir_pid || error "(16) mkdir should succeed"
29489         wait $touch_pid || error "(17) touch should succeed"
29490         wait $ln_pid || error "(18) link should succeed"
29491         wait $mv_pid || error "(19) rename should succeed"
29492         wait $rm_pid || error "(20) unlink should succeed"
29493
29494         post_801
29495 }
29496 run_test 801b "modification will be blocked by write barrier"
29497
29498 test_801c() {
29499         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
29500
29501         prep_801
29502
29503         stop mds2 || error "(1) Fail to stop mds2"
29504
29505         do_facet mgs $LCTL barrier_freeze $FSNAME 30
29506
29507         local b_status=$(barrier_stat)
29508         [ "$b_status" = "'expired'" ] || [ "$b_status" = "'failed'" ] || {
29509                 do_facet mgs $LCTL barrier_thaw $FSNAME
29510                 error "(2) unexpected barrier status $b_status"
29511         }
29512
29513         do_facet mgs $LCTL barrier_rescan $FSNAME ||
29514                 error "(3) Fail to rescan barrier bitmap"
29515
29516         # Do not reduce barrier time - See LU-11873
29517         do_facet mgs $LCTL barrier_freeze $FSNAME 20
29518
29519         b_status=$(barrier_stat)
29520         [ "$b_status" = "'frozen'" ] ||
29521                 error "(4) unexpected barrier status $b_status"
29522
29523         do_facet mgs $LCTL barrier_thaw $FSNAME
29524         b_status=$(barrier_stat)
29525         [ "$b_status" = "'thawed'" ] ||
29526                 error "(5) unexpected barrier status $b_status"
29527
29528         local devname=$(mdsdevname 2)
29529
29530         start mds2 $devname $MDS_MOUNT_OPTS || error "(6) Fail to start mds2"
29531
29532         do_facet mgs $LCTL barrier_rescan $FSNAME ||
29533                 error "(7) Fail to rescan barrier bitmap"
29534
29535         post_801
29536 }
29537 run_test 801c "rescan barrier bitmap"
29538
29539 test_802b() {
29540         [ $PARALLEL == "yes" ] && skip "skip parallel run"
29541         remote_mds_nodsh && skip "remote MDS with nodsh"
29542
29543         do_facet $SINGLEMDS $LCTL get_param mdt.*.readonly ||
29544                 skip "readonly option not available"
29545
29546         $LFS mkdir -i 0 -c 1 $DIR/$tdir || error "(1) fail to mkdir"
29547
29548         cp $LUSTRE/tests/test-framework.sh $DIR/$tdir/ ||
29549                 error "(2) Fail to copy"
29550
29551         # write back all cached data before setting MDT to readonly
29552         cancel_lru_locks
29553         sync_all_data
29554
29555         do_facet $SINGLEMDS $LCTL set_param mdt.*.readonly=1
29556         stack_trap "do_facet $SINGLEMDS $LCTL set_param mdt.*.readonly=0" EXIT
29557
29558         echo "Modify should be refused"
29559         touch $DIR/$tdir/guard && error "(6) Touch should fail under ro mode"
29560
29561         echo "Read should be allowed"
29562         diff $LUSTRE/tests/test-framework.sh $DIR/$tdir/test-framework.sh ||
29563                 error "(7) Read should succeed under ro mode"
29564
29565         # disable readonly
29566         do_facet $SINGLEMDS $LCTL set_param mdt.*.readonly=0
29567 }
29568 run_test 802b "be able to set MDTs to readonly"
29569
29570 test_803a() {
29571         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
29572         [ $MDS1_VERSION -lt $(version_code 2.10.54) ] &&
29573                 skip "MDS needs to be newer than 2.10.54"
29574
29575         mkdir_on_mdt0 $DIR/$tdir
29576         # Create some objects on all MDTs to trigger related logs objects
29577         for idx in $(seq $MDSCOUNT); do
29578                 $LFS mkdir -c $MDSCOUNT -i $((idx % $MDSCOUNT)) \
29579                         $DIR/$tdir/dir${idx} ||
29580                         error "Fail to create $DIR/$tdir/dir${idx}"
29581         done
29582
29583         wait_delete_completed # ensure old test cleanups are finished
29584         sleep 3
29585         echo "before create:"
29586         $LFS df -i $MOUNT
29587         local before_used=$($LFS df -i | grep MDT0000_UUID | awk '{print $3}')
29588
29589         for i in {1..10}; do
29590                 $LFS mkdir -c 1 -i 1 $DIR/$tdir/foo$i ||
29591                         error "Fail to create $DIR/$tdir/foo$i"
29592         done
29593
29594         # sync ZFS-on-MDS to refresh statfs data
29595         wait_zfs_commit mds1
29596         sleep 3
29597         echo "after create:"
29598         $LFS df -i $MOUNT
29599         local after_used=$($LFS df -i | grep MDT0000_UUID | awk '{print $3}')
29600
29601         # allow for an llog to be cleaned up during the test
29602         [ $after_used -ge $((before_used + 10 - 1)) ] ||
29603                 error "before ($before_used) + 10 > after ($after_used)"
29604
29605         for i in {1..10}; do
29606                 rm -rf $DIR/$tdir/foo$i ||
29607                         error "Fail to remove $DIR/$tdir/foo$i"
29608         done
29609
29610         # sync ZFS-on-MDS to refresh statfs data
29611         wait_zfs_commit mds1
29612         wait_delete_completed
29613         sleep 3 # avoid MDT return cached statfs
29614         echo "after unlink:"
29615         $LFS df -i $MOUNT
29616         after_used=$($LFS df -i | grep MDT0000_UUID | awk '{print $3}')
29617
29618         # allow for an llog to be created during the test
29619         [ $after_used -le $((before_used + 1)) ] ||
29620                 error "after ($after_used) > before ($before_used) + 1"
29621 }
29622 run_test 803a "verify agent object for remote object"
29623
29624 test_803b() {
29625         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
29626         [ $MDS1_VERSION -lt $(version_code 2.13.56) ] &&
29627                 skip "MDS needs to be newer than 2.13.56"
29628         [ $PARALLEL == "yes" ] && skip "skip parallel run"
29629
29630         for i in $(seq 0 $((MDSCOUNT - 1))); do
29631                 $LFS mkdir -i $i $DIR/$tdir.$i || error "mkdir $tdir.$i"
29632         done
29633
29634         local before=0
29635         local after=0
29636
29637         local tmp
29638
29639         stat $DIR/$tdir.* >/dev/null || error "stat $tdir.*"
29640         for i in $(seq 0 $((MDSCOUNT - 1))); do
29641                 tmp=$(do_facet mds$i $LCTL get_param mdt.*-MDT000$i.md_stats |
29642                         awk '/getattr/ { print $2 }')
29643                 before=$((before + tmp))
29644         done
29645         stat $DIR/$tdir.* >/dev/null || error "stat $tdir.*"
29646         for i in $(seq 0 $((MDSCOUNT - 1))); do
29647                 tmp=$(do_facet mds$i $LCTL get_param mdt.*-MDT000$i.md_stats |
29648                         awk '/getattr/ { print $2 }')
29649                 after=$((after + tmp))
29650         done
29651
29652         [ $before -eq $after ] || error "getattr count $before != $after"
29653 }
29654 run_test 803b "remote object can getattr from cache"
29655
29656 test_804() {
29657         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
29658         [ $MDS1_VERSION -lt $(version_code 2.10.54) ] &&
29659                 skip "MDS needs to be newer than 2.10.54"
29660         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
29661
29662         mkdir -p $DIR/$tdir
29663         $LFS mkdir -c 1 -i 1 $DIR/$tdir/dir0 ||
29664                 error "Fail to create $DIR/$tdir/dir0"
29665
29666         local fid=$($LFS path2fid $DIR/$tdir/dir0)
29667         local dev=$(mdsdevname 2)
29668
29669         do_facet mds2 "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
29670                 grep ${fid} || error "NOT found agent entry for dir0"
29671
29672         $LFS mkdir -c $MDSCOUNT -i 0 $DIR/$tdir/dir1 ||
29673                 error "Fail to create $DIR/$tdir/dir1"
29674
29675         touch $DIR/$tdir/dir1/foo0 ||
29676                 error "Fail to create $DIR/$tdir/dir1/foo0"
29677         fid=$($LFS path2fid $DIR/$tdir/dir1/foo0)
29678         local rc=0
29679
29680         for idx in $(seq $MDSCOUNT); do
29681                 dev=$(mdsdevname $idx)
29682                 do_facet mds${idx} \
29683                         "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
29684                         grep ${fid} && rc=$idx
29685         done
29686
29687         mv $DIR/$tdir/dir1/foo0 $DIR/$tdir/dir1/foo1 ||
29688                 error "Fail to rename foo0 to foo1"
29689         if [ $rc -eq 0 ]; then
29690                 for idx in $(seq $MDSCOUNT); do
29691                         dev=$(mdsdevname $idx)
29692                         do_facet mds${idx} \
29693                         "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
29694                         grep ${fid} && rc=$idx
29695                 done
29696         fi
29697
29698         mv $DIR/$tdir/dir1/foo1 $DIR/$tdir/dir1/foo2 ||
29699                 error "Fail to rename foo1 to foo2"
29700         if [ $rc -eq 0 ]; then
29701                 for idx in $(seq $MDSCOUNT); do
29702                         dev=$(mdsdevname $idx)
29703                         do_facet mds${idx} \
29704                         "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
29705                         grep ${fid} && rc=$idx
29706                 done
29707         fi
29708
29709         [ $rc -ne 0 ] || error "NOT found agent entry for foo"
29710
29711         ln $DIR/$tdir/dir1/foo2 $DIR/$tdir/dir0/guard ||
29712                 error "Fail to link to $DIR/$tdir/dir1/foo2"
29713         mv $DIR/$tdir/dir1/foo2 $DIR/$tdir/dir1/foo0 ||
29714                 error "Fail to rename foo2 to foo0"
29715         unlink $DIR/$tdir/dir1/foo0 ||
29716                 error "Fail to unlink $DIR/$tdir/dir1/foo0"
29717         rm -rf $DIR/$tdir/dir0 ||
29718                 error "Fail to rm $DIR/$tdir/dir0"
29719
29720         for idx in $(seq $MDSCOUNT); do
29721                 rc=0
29722
29723                 stop mds${idx}
29724                 dev=$(mdsdevname $idx)
29725                 run_e2fsck $(facet_active_host mds$idx) $dev -n ||
29726                         rc=$?
29727                 start mds${idx} $dev $MDS_MOUNT_OPTS ||
29728                         error "mount mds$idx failed"
29729                 df $MOUNT > /dev/null 2>&1
29730
29731                 # e2fsck should not return error
29732                 [ $rc -eq 0 ] ||
29733                         error "e2fsck detected error on MDT${idx}: rc=$rc"
29734         done
29735 }
29736 run_test 804 "verify agent entry for remote entry"
29737
29738 cleanup_805() {
29739         do_facet $SINGLEMDS zfs set quota=$old $fsset
29740         unlinkmany $DIR/$tdir/f- 1000000
29741         trap 0
29742 }
29743
29744 test_805() {
29745         local zfs_version=$(do_facet mds1 cat /sys/module/zfs/version)
29746         [ "$mds1_FSTYPE" != "zfs" ] && skip "ZFS specific test"
29747         [ $(version_code $zfs_version) -lt $(version_code 0.7.2) ] &&
29748                 skip "netfree not implemented before 0.7"
29749         [[ $MDS1_VERSION -ge $(version_code 2.10.57) ]] ||
29750                 skip "Need MDS version at least 2.10.57"
29751
29752         local fsset
29753         local freekb
29754         local usedkb
29755         local old
29756         local quota
29757         local pref="osd-zfs.$FSNAME-MDT0000."
29758
29759         # limit available space on MDS dataset to meet nospace issue
29760         # quickly. then ZFS 0.7.2 can use reserved space if asked
29761         # properly (using netfree flag in osd_declare_destroy()
29762         fsset=$(do_facet $SINGLEMDS lctl get_param -n $pref.mntdev)
29763         old=$(do_facet $SINGLEMDS zfs get -H quota $fsset | \
29764                 gawk '{print $3}')
29765         freekb=$(do_facet $SINGLEMDS lctl get_param -n $pref.kbytesfree)
29766         usedkb=$(do_facet $SINGLEMDS lctl get_param -n $pref.kbytestotal)
29767         let "usedkb=usedkb-freekb"
29768         let "freekb=freekb/2"
29769         if let "freekb > 5000"; then
29770                 let "freekb=5000"
29771         fi
29772         do_facet $SINGLEMDS zfs set quota=$(((usedkb+freekb)*1024)) $fsset
29773         trap cleanup_805 EXIT
29774         mkdir_on_mdt0 $DIR/$tdir
29775         $LFS setstripe -E 1M -c2 -E 4M -c2 -E -1 -c2 $DIR/$tdir ||
29776                 error "Can't set PFL layout"
29777         createmany -m $DIR/$tdir/f- 1000000 && error "ENOSPC wasn't met"
29778         rm -rf $DIR/$tdir || error "not able to remove"
29779         do_facet $SINGLEMDS zfs set quota=$old $fsset
29780         trap 0
29781 }
29782 run_test 805 "ZFS can remove from full fs"
29783
29784 # Size-on-MDS test
29785 check_lsom_data()
29786 {
29787         local file=$1
29788         local expect=$(stat -c %s $file)
29789
29790         check_lsom_size $1 $expect
29791
29792         local blocks=$($LFS getsom -b $file)
29793         expect=$(stat -c %b $file)
29794         [[ $blocks == $expect ]] ||
29795                 error "$file expected blocks: $expect, got: $blocks"
29796 }
29797
29798 check_lsom_size()
29799 {
29800         local size
29801         local expect=$2
29802
29803         cancel_lru_locks mdc
29804
29805         size=$($LFS getsom -s $1)
29806         [[ $size == $expect ]] ||
29807                 error "$file expected size: $expect, got: $size"
29808 }
29809
29810 test_806() {
29811         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
29812                 skip "Need MDS version at least 2.11.52"
29813
29814         local bs=1048576
29815
29816         $LFS setstripe -c-1 $DIR/$tfile || error "setstripe $tfile failed"
29817
29818         disable_opencache
29819         stack_trap "restore_opencache"
29820
29821         # single-threaded write
29822         echo "Test SOM for single-threaded write"
29823         dd if=/dev/zero of=$DIR/$tfile bs=$bs count=1 ||
29824                 error "write $tfile failed"
29825         check_lsom_size $DIR/$tfile $bs
29826
29827         local num=32
29828         local size=$(($num * $bs))
29829         local offset=0
29830         local i
29831
29832         echo "Test SOM for single client multi-threaded($num) write"
29833         $TRUNCATE $DIR/$tfile 0
29834         for ((i = 0; i < $num; i++)); do
29835                 $MULTIOP $DIR/$tfile Oz${offset}w${bs}c &
29836                 local pids[$i]=$!
29837                 offset=$((offset + $bs))
29838         done
29839         for (( i=0; i < $num; i++ )); do
29840                 wait ${pids[$i]}
29841         done
29842         check_lsom_size $DIR/$tfile $size
29843
29844         $TRUNCATE $DIR/$tfile 0
29845         for ((i = 0; i < $num; i++)); do
29846                 offset=$((offset - $bs))
29847                 $MULTIOP $DIR/$tfile Oz${offset}w${bs}c &
29848                 local pids[$i]=$!
29849         done
29850         for (( i=0; i < $num; i++ )); do
29851                 wait ${pids[$i]}
29852         done
29853         check_lsom_size $DIR/$tfile $size
29854
29855         # multi-client writes
29856         num=$(get_node_count ${CLIENTS//,/ })
29857         size=$(($num * $bs))
29858         offset=0
29859         i=0
29860
29861         echo "Test SOM for multi-client ($num) writes"
29862         $TRUNCATE $DIR/$tfile 0
29863         for client in ${CLIENTS//,/ }; do
29864                 do_node $client $MULTIOP $DIR/$tfile Oz${offset}w${bs}c &
29865                 local pids[$i]=$!
29866                 i=$((i + 1))
29867                 offset=$((offset + $bs))
29868         done
29869         for (( i=0; i < $num; i++ )); do
29870                 wait ${pids[$i]}
29871         done
29872         check_lsom_size $DIR/$tfile $offset
29873
29874         i=0
29875         $TRUNCATE $DIR/$tfile 0
29876         for client in ${CLIENTS//,/ }; do
29877                 offset=$((offset - $bs))
29878                 do_node $client $MULTIOP $DIR/$tfile Oz${offset}w${bs}c &
29879                 local pids[$i]=$!
29880                 i=$((i + 1))
29881         done
29882         for (( i=0; i < $num; i++ )); do
29883                 wait ${pids[$i]}
29884         done
29885         check_lsom_size $DIR/$tfile $size
29886
29887         # verify SOM blocks count
29888         echo "Verify SOM block count"
29889         $TRUNCATE $DIR/$tfile 0
29890         $MULTIOP $DIR/$tfile oO_TRUNC:O_RDWR:w$((bs))YSc ||
29891                 error "failed to write file $tfile with fdatasync and fstat"
29892         check_lsom_data $DIR/$tfile
29893
29894         $TRUNCATE $DIR/$tfile 0
29895         $MULTIOP $DIR/$tfile oO_TRUNC:O_RDWR:w$((bs * 2))Yc ||
29896                 error "failed to write file $tfile with fdatasync"
29897         check_lsom_data $DIR/$tfile
29898
29899         $TRUNCATE $DIR/$tfile 0
29900         $MULTIOP $DIR/$tfile oO_TRUNC:O_RDWR:O_SYNC:w$((bs * 3))c ||
29901                 error "failed to write file $tfile with sync IO"
29902         check_lsom_data $DIR/$tfile
29903
29904         # verify truncate
29905         echo "Test SOM for truncate"
29906         # use ftruncate to sync blocks on close request
29907         $MULTIOP $DIR/$tfile oO_WRONLY:T16384c
29908         check_lsom_size $DIR/$tfile 16384
29909         check_lsom_data $DIR/$tfile
29910
29911         $TRUNCATE $DIR/$tfile 1234
29912         check_lsom_size $DIR/$tfile 1234
29913         # sync blocks on the MDT
29914         $MULTIOP $DIR/$tfile oc
29915         check_lsom_data $DIR/$tfile
29916 }
29917 run_test 806 "Verify Lazy Size on MDS"
29918
29919 test_807() {
29920         [ -n "$FILESET" ] && skip "Not functional for FILESET set"
29921         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
29922                 skip "Need MDS version at least 2.11.52"
29923
29924         # Registration step
29925         changelog_register || error "changelog_register failed"
29926         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
29927         changelog_users $SINGLEMDS | grep -q $cl_user ||
29928                 error "User $cl_user not found in changelog_users"
29929
29930         rm -rf $DIR/$tdir || error "rm $tdir failed"
29931         mkdir_on_mdt0 $DIR/$tdir || error "mkdir $tdir failed"
29932         touch $DIR/$tdir/trunc || error "touch $tdir/trunc failed"
29933         $TRUNCATE $DIR/$tdir/trunc 1024 || error "truncate $tdir/trunc failed"
29934         $TRUNCATE $DIR/$tdir/trunc 1048576 ||
29935                 error "truncate $tdir/trunc failed"
29936
29937         local bs=1048576
29938         echo "Test SOM for single-threaded write with fsync"
29939         dd if=/dev/zero of=$DIR/$tdir/single_dd bs=$bs count=1 ||
29940                 error "write $tfile failed"
29941         sync;sync;sync
29942
29943         # multi-client wirtes
29944         local num=$(get_node_count ${CLIENTS//,/ })
29945         local offset=0
29946         local i=0
29947
29948         echo "Test SOM for multi-client ($num) writes"
29949         touch $DIR/$tfile || error "touch $tfile failed"
29950         $TRUNCATE $DIR/$tfile 0
29951         for client in ${CLIENTS//,/ }; do
29952                 do_node $client $MULTIOP $DIR/$tfile Oz${offset}w${bs}c &
29953                 local pids[$i]=$!
29954                 i=$((i + 1))
29955                 offset=$((offset + $bs))
29956         done
29957         for (( i=0; i < $num; i++ )); do
29958                 wait ${pids[$i]}
29959         done
29960
29961         do_rpc_nodes "$CLIENTS" cancel_lru_locks osc
29962         do_nodes "$CLIENTS" "sync ; sleep 5 ; sync"
29963         $LSOM_SYNC -u $cl_user -m $FSNAME-MDT0000 $MOUNT
29964         check_lsom_data $DIR/$tdir/trunc
29965         check_lsom_data $DIR/$tdir/single_dd
29966         check_lsom_data $DIR/$tfile
29967
29968         rm -rf $DIR/$tdir
29969         # Deregistration step
29970         changelog_deregister || error "changelog_deregister failed"
29971 }
29972 run_test 807 "verify LSOM syncing tool"
29973
29974 check_som_nologged()
29975 {
29976         local lines=$($LFS changelog $FSNAME-MDT0000 |
29977                 grep 'x=trusted.som' | wc -l)
29978         [ $lines -ne 0 ] && error "trusted.som xattr is logged in Changelogs"
29979 }
29980
29981 test_808() {
29982         [ $MDS1_VERSION -lt $(version_code 2.11.55) ] &&
29983                 skip "Need MDS version at least 2.11.55"
29984
29985         # Registration step
29986         changelog_register || error "changelog_register failed"
29987
29988         touch $DIR/$tfile || error "touch $tfile failed"
29989         check_som_nologged
29990
29991         dd if=/dev/zero of=$DIR/$tfile bs=1048576 count=1 ||
29992                 error "write $tfile failed"
29993         check_som_nologged
29994
29995         $TRUNCATE $DIR/$tfile 1234
29996         check_som_nologged
29997
29998         $TRUNCATE $DIR/$tfile 1048576
29999         check_som_nologged
30000
30001         # Deregistration step
30002         changelog_deregister || error "changelog_deregister failed"
30003 }
30004 run_test 808 "Check trusted.som xattr not logged in Changelogs"
30005
30006 check_som_nodata()
30007 {
30008         $LFS getsom $1
30009         [[ $? -eq 61 ]] || error "DoM-only file $1 has SOM xattr"
30010 }
30011
30012 test_809() {
30013         [ $MDS1_VERSION -lt $(version_code 2.11.56) ] &&
30014                 skip "Need MDS version at least 2.11.56"
30015
30016         $LFS setstripe -E 1M -L mdt $DIR/$tfile ||
30017                 error "failed to create DoM-only file $DIR/$tfile"
30018         touch $DIR/$tfile || error "touch $tfile failed"
30019         check_som_nodata $DIR/$tfile
30020
30021         dd if=/dev/zero of=$DIR/$tfile bs=2048 count=1 ||
30022                 error "write $tfile failed"
30023         check_som_nodata $DIR/$tfile
30024
30025         $TRUNCATE $DIR/$tfile 1234
30026         check_som_nodata $DIR/$tfile
30027
30028         $TRUNCATE $DIR/$tfile 4097
30029         check_som_nodata $DIR/$file
30030 }
30031 run_test 809 "Verify no SOM xattr store for DoM-only files"
30032
30033 test_810() {
30034         [ $PARALLEL == "yes" ] && skip "skip parallel run"
30035         $GSS && skip_env "could not run with gss"
30036         [[ $OST1_VERSION -gt $(version_code 2.12.58) ]] ||
30037                 skip "OST < 2.12.58 doesn't align checksum"
30038
30039         set_checksums 1
30040         stack_trap "set_checksums $ORIG_CSUM" EXIT
30041         stack_trap "set_checksum_type $ORIG_CSUM_TYPE" EXIT
30042
30043         local csum
30044         local before
30045         local after
30046         for csum in $CKSUM_TYPES; do
30047                 #define OBD_FAIL_OSC_NO_GRANT   0x411
30048                 $LCTL set_param osc.*.checksum_type=$csum fail_loc=0x411
30049                 for i in "10240 0" "10000 0" "4000 1" "500 1"; do
30050                         eval set -- $i
30051                         dd if=/dev/urandom of=$DIR/$tfile bs=$1 count=2 seek=$2
30052                         before=$(md5sum $DIR/$tfile)
30053                         $LCTL set_param ldlm.namespaces.*osc*.lru_size=clear
30054                         after=$(md5sum $DIR/$tfile)
30055                         [ "$before" == "$after" ] ||
30056                                 error "$csum: $before != $after bs=$1 seek=$2"
30057                 done
30058         done
30059 }
30060 run_test 810 "partial page writes on ZFS (LU-11663)"
30061
30062 test_812a() {
30063         [ $OST1_VERSION -lt $(version_code 2.12.51) ] &&
30064                 skip "OST < 2.12.51 doesn't support this fail_loc"
30065
30066         $LFS setstripe -c 1 -i 0 $DIR/$tfile
30067         # ensure ost1 is connected
30068         stat $DIR/$tfile >/dev/null || error "can't stat"
30069         wait_osc_import_state client ost1 FULL
30070         # no locks, no reqs to let the connection idle
30071         cancel_lru_locks osc
30072
30073         # delay OST_DISCONNECT on OST1 to put OSC into intermediate state
30074 #define OBD_FAIL_OST_DISCONNECT_DELAY    0x245
30075         do_facet ost1 "$LCTL set_param fail_loc=0x245 fail_val=8"
30076         wait_osc_import_state client ost1 CONNECTING
30077         do_facet ost1 "$LCTL set_param fail_loc=0 fail_val=0"
30078
30079         stat $DIR/$tfile >/dev/null || error "can't stat file"
30080 }
30081 run_test 812a "do not drop reqs generated when imp is going to idle (LU-11951)"
30082
30083 test_812b() { # LU-12378
30084         [ $OST1_VERSION -lt $(version_code 2.12.51) ] &&
30085                 skip "OST < 2.12.51 doesn't support this fail_loc"
30086
30087         $LFS setstripe -c 1 -i 0 $DIR/$tfile || error "setstripe failed"
30088         # ensure ost1 is connected
30089         stat $DIR/$tfile >/dev/null || error "can't stat"
30090         wait_osc_import_state client ost1 FULL
30091         # no locks, no reqs to let the connection idle
30092         cancel_lru_locks osc
30093
30094         # delay OST_DISCONNECT on OST1 to put OSC into intermediate state
30095 #define OBD_FAIL_OST_DISCONNECT_DELAY    0x245
30096         do_facet ost1 "$LCTL set_param fail_loc=0x245 fail_val=8"
30097         wait_osc_import_state client ost1 CONNECTING
30098         do_facet ost1 "$LCTL set_param fail_loc=0 fail_val=0"
30099
30100         $LFS quota -u 0 $DIR/ || error "lfs quota should succeed"
30101         wait_osc_import_state client ost1 IDLE
30102 }
30103 run_test 812b "do not drop no resend request for idle connect"
30104
30105 test_812c() {
30106         local old
30107
30108         old=$($LCTL get_param -n osc.*.idle_timeout | head -n 1)
30109
30110         $LFS setstripe -c 1 -o 0 $DIR/$tfile
30111         $LFS getstripe $DIR/$tfile
30112         $LCTL set_param osc.*.idle_timeout=10
30113         stack_trap "$LCTL set_param osc.*.idle_timeout=$old" EXIT
30114         # ensure ost1 is connected
30115         stat $DIR/$tfile >/dev/null || error "can't stat"
30116         wait_osc_import_state client ost1 FULL
30117         # no locks, no reqs to let the connection idle
30118         cancel_lru_locks osc
30119
30120 #define OBD_FAIL_PTLRPC_IDLE_RACE        0x533
30121         $LCTL set_param fail_loc=0x80000533
30122         sleep 15
30123         dd if=/dev/zero of=$DIR/$tfile count=1 conv=sync || error "dd failed"
30124 }
30125 run_test 812c "idle import vs lock enqueue race"
30126
30127 test_813() {
30128         local file_heat_sav=$($LCTL get_param -n llite.*.file_heat 2>/dev/null)
30129         [ -z "$file_heat_sav" ] && skip "no file heat support"
30130
30131         local readsample
30132         local writesample
30133         local readbyte
30134         local writebyte
30135         local readsample1
30136         local writesample1
30137         local readbyte1
30138         local writebyte1
30139
30140         local period_second=$($LCTL get_param -n llite.*.heat_period_second)
30141         local decay_pct=$($LCTL get_param -n llite.*.heat_decay_percentage)
30142
30143         $LCTL set_param -n llite.*.file_heat=1
30144         echo "Turn on file heat"
30145         echo "Period second: $period_second, Decay percentage: $decay_pct"
30146
30147         echo "QQQQ" > $DIR/$tfile
30148         echo "QQQQ" > $DIR/$tfile
30149         echo "QQQQ" > $DIR/$tfile
30150         cat $DIR/$tfile > /dev/null
30151         cat $DIR/$tfile > /dev/null
30152         cat $DIR/$tfile > /dev/null
30153         cat $DIR/$tfile > /dev/null
30154
30155         local out=$($LFS heat_get $DIR/$tfile)
30156
30157         $LFS heat_get $DIR/$tfile
30158         readsample=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
30159         writesample=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
30160         readbyte=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
30161         writebyte=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
30162
30163         [ $readsample -le 4 ] || error "read sample ($readsample) is wrong"
30164         [ $writesample -le 3 ] || error "write sample ($writesample) is wrong"
30165         [ $readbyte -le 20 ] || error "read bytes ($readbyte) is wrong"
30166         [ $writebyte -le 15 ] || error "write bytes ($writebyte) is wrong"
30167
30168         sleep $((period_second + 3))
30169         echo "Sleep $((period_second + 3)) seconds..."
30170         # The recursion formula to calculate the heat of the file f is as
30171         # follow:
30172         # Hi+1(f) = (1-P)*Hi(f)+ P*Ci
30173         # Where Hi is the heat value in the period between time points i*I and
30174         # (i+1)*I; Ci is the access count in the period; the symbol P refers
30175         # to the weight of Ci.
30176         out=$($LFS heat_get $DIR/$tfile)
30177         $LFS heat_get $DIR/$tfile
30178         readsample=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
30179         writesample=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
30180         readbyte=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
30181         writebyte=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
30182
30183         [ $(bc <<< "$readsample <= 4 * $decay_pct / 100") -eq 1 ] ||
30184                 error "read sample ($readsample) is wrong"
30185         [ $(bc <<< "$writesample <= 3 * $decay_pct / 100") -eq 1 ] ||
30186                 error "write sample ($writesample) is wrong"
30187         [ $(bc <<< "$readbyte <= 20 * $decay_pct / 100") -eq 1 ] ||
30188                 error "read bytes ($readbyte) is wrong"
30189         [ $(bc <<< "$writebyte <= 15 * $decay_pct / 100") -eq 1 ] ||
30190                 error "write bytes ($writebyte) is wrong"
30191
30192         echo "QQQQ" > $DIR/$tfile
30193         echo "QQQQ" > $DIR/$tfile
30194         echo "QQQQ" > $DIR/$tfile
30195         cat $DIR/$tfile > /dev/null
30196         cat $DIR/$tfile > /dev/null
30197         cat $DIR/$tfile > /dev/null
30198         cat $DIR/$tfile > /dev/null
30199
30200         sleep $((period_second + 3))
30201         echo "Sleep $((period_second + 3)) seconds..."
30202
30203         out=$($LFS heat_get $DIR/$tfile)
30204         $LFS heat_get $DIR/$tfile
30205         readsample1=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
30206         writesample1=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
30207         readbyte1=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
30208         writebyte1=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
30209
30210         [ $(bc <<< "$readsample1 <= ($readsample * (100 - $decay_pct) + \
30211                 4 * $decay_pct) / 100") -eq 1 ] ||
30212                 error "read sample ($readsample1) is wrong"
30213         [ $(bc <<< "$writesample1 <= ($writesample * (100 - $decay_pct) + \
30214                 3 * $decay_pct) / 100") -eq 1 ] ||
30215                 error "write sample ($writesample1) is wrong"
30216         [ $(bc <<< "$readbyte1 <= ($readbyte * (100 - $decay_pct) + \
30217                 20 * $decay_pct) / 100") -eq 1 ] ||
30218                 error "read bytes ($readbyte1) is wrong"
30219         [ $(bc <<< "$writebyte1 <= ($writebyte * (100 - $decay_pct) + \
30220                 15 * $decay_pct) / 100") -eq 1 ] ||
30221                 error "write bytes ($writebyte1) is wrong"
30222
30223         echo "Turn off file heat for the file $DIR/$tfile"
30224         $LFS heat_set -o $DIR/$tfile
30225
30226         echo "QQQQ" > $DIR/$tfile
30227         echo "QQQQ" > $DIR/$tfile
30228         echo "QQQQ" > $DIR/$tfile
30229         cat $DIR/$tfile > /dev/null
30230         cat $DIR/$tfile > /dev/null
30231         cat $DIR/$tfile > /dev/null
30232         cat $DIR/$tfile > /dev/null
30233
30234         out=$($LFS heat_get $DIR/$tfile)
30235         $LFS heat_get $DIR/$tfile
30236         readsample=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
30237         writesample=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
30238         readbyte=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
30239         writebyte=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
30240
30241         [ $readsample -eq 0 ] || error "read sample ($readsample) is wrong"
30242         [ $writesample -eq 0 ] || error "write sample ($writesample) is wrong"
30243         [ $readbyte -eq 0 ] || error "read bytes ($readbyte) is wrong"
30244         [ $writebyte -eq 0 ] || error "write bytes ($writebyte) is wrong"
30245
30246         echo "Trun on file heat for the file $DIR/$tfile"
30247         $LFS heat_set -O $DIR/$tfile
30248
30249         echo "QQQQ" > $DIR/$tfile
30250         echo "QQQQ" > $DIR/$tfile
30251         echo "QQQQ" > $DIR/$tfile
30252         cat $DIR/$tfile > /dev/null
30253         cat $DIR/$tfile > /dev/null
30254         cat $DIR/$tfile > /dev/null
30255         cat $DIR/$tfile > /dev/null
30256
30257         out=$($LFS heat_get $DIR/$tfile)
30258         $LFS heat_get $DIR/$tfile
30259         readsample=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
30260         writesample=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
30261         readbyte=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
30262         writebyte=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
30263
30264         [ $readsample -gt 0 ] || error "read sample ($readsample) is wrong"
30265         [ $writesample -gt 0 ] || error "write sample ($writesample) is wrong"
30266         [ $readbyte -gt 0 ] || error "read bytes ($readbyte) is wrong"
30267         [ $writebyte -gt 0 ] || error "write bytes ($writebyte) is wrong"
30268
30269         $LFS heat_set -c $DIR/$tfile
30270         $LCTL set_param -n llite.*.file_heat=0
30271         echo "Turn off file heat support for the Lustre filesystem"
30272
30273         echo "QQQQ" > $DIR/$tfile
30274         echo "QQQQ" > $DIR/$tfile
30275         echo "QQQQ" > $DIR/$tfile
30276         cat $DIR/$tfile > /dev/null
30277         cat $DIR/$tfile > /dev/null
30278         cat $DIR/$tfile > /dev/null
30279         cat $DIR/$tfile > /dev/null
30280
30281         out=$($LFS heat_get $DIR/$tfile)
30282         $LFS heat_get $DIR/$tfile
30283         readsample=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
30284         writesample=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
30285         readbyte=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
30286         writebyte=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
30287
30288         [ $readsample -eq 0 ] || error "read sample ($readsample) is wrong"
30289         [ $writesample -eq 0 ] || error "write sample ($writesample) is wrong"
30290         [ $readbyte -eq 0 ] || error "read bytes ($readbyte) is wrong"
30291         [ $writebyte -eq 0 ] || error "write bytes ($writebyte) is wrong"
30292
30293         $LCTL set_param -n llite.*.file_heat=$file_heat_sav
30294         rm -f $DIR/$tfile
30295 }
30296 run_test 813 "File heat verfication"
30297
30298 test_814()
30299 {
30300         dd of=$DIR/$tfile seek=128 bs=1k < /dev/null
30301         echo -n y >> $DIR/$tfile
30302         cp --sparse=always $DIR/$tfile $DIR/${tfile}.cp || error "copy failed"
30303         diff $DIR/$tfile $DIR/${tfile}.cp || error "files should be same"
30304 }
30305 run_test 814 "sparse cp works as expected (LU-12361)"
30306
30307 test_815()
30308 {
30309         writeme -b 100 $DIR/$tfile || error "write 100 bytes failed"
30310         writeme -b 0 $DIR/$tfile || error "write 0 byte failed"
30311 }
30312 run_test 815 "zero byte tiny write doesn't hang (LU-12382)"
30313
30314 test_816() {
30315         local ost1_imp=$(get_osc_import_name client ost1)
30316         local imp_name=$($LCTL list_param osc.$ost1_imp | head -n1 |
30317                          cut -d'.' -f2)
30318
30319         $LFS setstripe -c 1 -i 0 $DIR/$tfile
30320         # ensure ost1 is connected
30321
30322         stat $DIR/$tfile >/dev/null || error "can't stat"
30323         wait_osc_import_state client ost1 FULL
30324         # no locks, no reqs to let the connection idle
30325         cancel_lru_locks osc
30326         lru_resize_disable osc
30327         local before
30328         local now
30329         before=$($LCTL get_param -n \
30330                  ldlm.namespaces.$imp_name.lru_size)
30331
30332         wait_osc_import_state client ost1 IDLE
30333         dd if=/dev/null of=$DIR/$tfile bs=1k count=1 conv=sync
30334         now=$($LCTL get_param -n \
30335               ldlm.namespaces.$imp_name.lru_size)
30336         [ $before == $now ] || error "lru_size changed $before != $now"
30337 }
30338 run_test 816 "do not reset lru_resize on idle reconnect"
30339
30340 cleanup_817() {
30341         umount $tmpdir
30342         exportfs -u localhost:$DIR/nfsexp
30343         rm -rf $DIR/nfsexp
30344 }
30345
30346 test_817() {
30347         systemctl restart nfs-server.service || skip "failed to restart nfsd"
30348
30349         mkdir -p $DIR/nfsexp
30350         exportfs -orw,no_root_squash localhost:$DIR/nfsexp ||
30351                 error "failed to export nfs"
30352
30353         tmpdir=$(mktemp -d /tmp/nfs-XXXXXX)
30354         stack_trap cleanup_817 EXIT
30355
30356         mount -t nfs -orw localhost:$DIR/nfsexp $tmpdir ||
30357                 error "failed to mount nfs to $tmpdir"
30358
30359         cp /bin/true $tmpdir
30360         $DIR/nfsexp/true || error "failed to execute 'true' command"
30361 }
30362 run_test 817 "nfsd won't cache write lock for exec file"
30363
30364 test_818() {
30365         test_mkdir -i0 -c1 $DIR/$tdir
30366         $LFS setstripe -c1 -i0 $DIR/$tdir/$tfile
30367         $LFS setstripe -c1 -i1 $DIR/$tdir/$tfile
30368         stop $SINGLEMDS
30369
30370         # restore osp-syn threads
30371         stack_trap "fail $SINGLEMDS"
30372
30373         #define OBD_FAIL_OSP_CANT_PROCESS_LLOG          0x2105
30374         do_facet $SINGLEMDS lctl set_param fail_loc=0x80002105
30375         start $SINGLEMDS $(mdsdevname ${SINGLEMDS//mds/}) $MDS_MOUNT_OPTS ||
30376                 error "start $SINGLEMDS failed"
30377         rm -rf $DIR/$tdir
30378
30379         local testid=$(echo $TESTNAME | tr '_' ' ')
30380
30381         do_facet mds1 dmesg | tac | sed "/$testid/,$ d" |
30382                 grep "run LFSCK" || error "run LFSCK is not suggested"
30383 }
30384 run_test 818 "unlink with failed llog"
30385
30386 test_819a() {
30387         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
30388         cancel_lru_locks osc
30389         #define OBD_FAIL_OST_2BIG_NIOBUF                0x248
30390         do_facet $SINGLEMDS lctl set_param fail_loc=0x80000248
30391         dd if=$DIR/$tfile of=/dev/null bs=1M count=1
30392         rm -f $TDIR/$tfile
30393 }
30394 run_test 819a "too big niobuf in read"
30395
30396 test_819b() {
30397         #define OBD_FAIL_OST_2BIG_NIOBUF                0x248
30398         do_facet $SINGLEMDS lctl set_param fail_loc=0x80000248
30399         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
30400         cancel_lru_locks osc
30401         sleep 1
30402         rm -f $TDIR/$tfile
30403 }
30404 run_test 819b "too big niobuf in write"
30405
30406
30407 function test_820_start_ost() {
30408         sleep 5
30409
30410         for num in $(seq $OSTCOUNT); do
30411                 start ost$num $(ostdevname $num) $OST_MOUNT_OPTS
30412         done
30413 }
30414
30415 test_820() {
30416         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
30417
30418         mkdir $DIR/$tdir
30419         umount_client $MOUNT || error "umount failed"
30420         for num in $(seq $OSTCOUNT); do
30421                 stop ost$num
30422         done
30423
30424         # mount client with no active OSTs
30425         # so that the client can't initialize max LOV EA size
30426         # from OSC notifications
30427         mount_client $MOUNT || error "mount failed"
30428         # delay OST starting to keep this 0 max EA size for a while
30429         test_820_start_ost &
30430
30431         # create a directory on MDS2
30432         test_mkdir -i 1 -c1 $DIR/$tdir/mds2 ||
30433                 error "Failed to create directory"
30434         # open intent should update default EA size
30435         # see mdc_update_max_ea_from_body()
30436         # notice this is the very first RPC to MDS2
30437         out=$(cp /etc/services $DIR/$tdir/mds2 2>&1)
30438         ret=$?
30439         echo $out
30440         # With SSK, this situation can lead to -EPERM being returned.
30441         # In that case, simply retry.
30442         if [ $ret -ne 0 ] && $SHARED_KEY; then
30443                 if echo "$out" | grep -q "not permitted"; then
30444                         cp /etc/services $DIR/$tdir/mds2
30445                         ret=$?
30446                 fi
30447         fi
30448         [ $ret -eq 0 ] || error "Failed to copy files to mds$n"
30449 }
30450 run_test 820 "update max EA from open intent"
30451
30452 test_823() {
30453         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
30454         local OST_MAX_PRECREATE=20000
30455
30456         (( $MDS1_VERSION >= $(version_code 2.14.56) )) ||
30457                 skip "Need MDS version at least 2.14.56"
30458
30459         save_lustre_params mds1 \
30460                 "osp.$FSNAME-OST*-osc-MDT0000.max_create_count" > $p
30461         do_facet $SINGLEMDS "$LCTL set_param -n \
30462                 osp.$FSNAME-OST*MDT0000.max_create_count=0"
30463         do_facet $SINGLEMDS "$LCTL set_param -n \
30464                 osp.$FSNAME-OST0000*MDT0000.max_create_count=$OST_MAX_PRECREATE"
30465
30466         stack_trap "restore_lustre_params < $p; rm $p"
30467
30468         do_facet $SINGLEMDS "$LCTL set_param -n \
30469                 osp.$FSNAME-OST*-osc-MDT*.create_count=100200"
30470
30471         local count=$(do_facet $SINGLEMDS "$LCTL get_param -n \
30472                       osp.$FSNAME-OST0000*MDT0000.create_count")
30473         local max=$(do_facet $SINGLEMDS "$LCTL get_param -n \
30474                     osp.$FSNAME-OST0000*MDT0000.max_create_count")
30475         local expect_count=$(((($max/2)/256) * 256))
30476
30477         log "setting create_count to 100200:"
30478         log " -result- count: $count with max: $max, expecting: $expect_count"
30479
30480         [[ $count -eq expect_count ]] ||
30481                 error "Create count not set to max precreate."
30482 }
30483 run_test 823 "Setting create_count > OST_MAX_PRECREATE is lowered to maximum"
30484
30485 test_831() {
30486         [[ $MDS1_VERSION -lt $(version_code 2.14.56) ]] &&
30487                 skip "Need MDS version 2.14.56"
30488
30489         local sync_changes=$(do_facet $SINGLEMDS \
30490                 $LCTL get_param -n osp.$FSNAME-OST0000-osc-MDT0000.sync_changes)
30491
30492         [ "$sync_changes" -gt 100 ] &&
30493                 skip "Sync changes $sync_changes > 100 already"
30494
30495         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
30496
30497         $LFS mkdir -i 0 $DIR/$tdir
30498         $LFS setstripe -c 1 -i 0 $DIR/$tdir
30499
30500         save_lustre_params mds1 \
30501                 "osp.$FSNAME-OST*-osc-MDT0000.max_sync_changes" > $p
30502         save_lustre_params mds1 \
30503                 "osp.$FSNAME-OST*-osc-MDT0000.max_rpcs_in_progress" >> $p
30504
30505         do_facet mds1 "$LCTL set_param -n \
30506                 osp.$FSNAME-OST*-osc-MDT0000.max_sync_changes=100 \
30507                 osp.$FSNAME-OST*-osc-MDT0000.max_rpcs_in_progress=128"
30508         stack_trap "restore_lustre_params < $p" EXIT
30509
30510         createmany -o $DIR/$tdir/f- 1000
30511         unlinkmany $DIR/$tdir/f- 1000 &
30512         local UNLINK_PID=$!
30513
30514         while sleep 1; do
30515                 sync_changes=$(do_facet mds1 \
30516                 $LCTL get_param -n osp.$FSNAME-OST0000-osc-MDT0000.sync_changes)
30517                 # the check in the code is racy, fail the test
30518                 # if the value above the limit by 10.
30519                 [ $sync_changes -gt 110 ] && {
30520                         kill -2 $UNLINK_PID
30521                         wait
30522                         error "osp changes throttling failed, $sync_changes>110"
30523                 }
30524                 kill -0 $UNLINK_PID 2> /dev/null || break
30525         done
30526         wait
30527 }
30528 run_test 831 "throttling unlink/setattr queuing on OSP"
30529
30530 test_832() {
30531         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
30532         (( $MDS1_VERSION >= $(version_code 2.15.52) )) ||
30533                 skip "Need MDS version 2.15.52+"
30534         is_rmentry_supported || skip "rm_entry not supported"
30535
30536         mkdir_on_mdt0 $DIR/$tdir || error "mkdir $tdir failed"
30537         mkdir $DIR/$tdir/local_dir || error "mkdir local_dir failed"
30538         mkdir_on_mdt -i 1 $DIR/$tdir/remote_dir ||
30539                 error "mkdir remote_dir failed"
30540         $LFS mkdir -c $MDSCOUNT $DIR/$tdir/striped_dir ||
30541                 error "mkdir striped_dir failed"
30542         touch $DIR/$tdir/file || error "touch file failed"
30543         $LFS rm_entry $DIR/$tdir/* || error "lfs rm_entry $tdir/* failed"
30544         [ -z "$(ls -A $DIR/$tdir)" ] || error "$tdir not empty"
30545 }
30546 run_test 832 "lfs rm_entry"
30547
30548 test_833() {
30549         local file=$DIR/$tfile
30550
30551         stack_trap "rm -f $file" EXIT
30552         dd if=/dev/zero of=$file bs=1M count=50 || error "Write $file failed"
30553
30554         local wpid
30555         local rpid
30556         local rpid2
30557
30558         # Buffered I/O write
30559         (
30560                 while [ ! -e $DIR/sanity.833.lck ]; do
30561                         dd if=/dev/zero of=$file bs=1M count=50 conv=notrunc ||
30562                                 error "failed to write $file"
30563                         sleep 0.$((RANDOM % 4 + 1))
30564                 done
30565         )&
30566         wpid=$!
30567
30568         # Buffered I/O read
30569         (
30570                 while [ ! -e $DIR/sanity.833.lck ]; do
30571                         dd if=$file of=/dev/null bs=1M count=50 ||
30572                                 error "failed to read $file"
30573                         sleep 0.$((RANDOM % 4 + 1))
30574                 done
30575         )&
30576         rpid=$!
30577
30578         # Direct I/O read
30579         (
30580                 while [ ! -e $DIR/sanity.833.lck ]; do
30581                         dd if=$file of=/dev/null bs=1M count=50 iflag=direct ||
30582                                 error "failed to read $file in direct I/O mode"
30583                         sleep 0.$((RANDOM % 4 + 1))
30584                 done
30585         )&
30586         rpid2=$!
30587
30588         sleep 30
30589         touch $DIR/sanity.833.lck
30590         wait $wpid || error "$?: buffered write failed"
30591         wait $rpid || error "$?: buffered read failed"
30592         wait $rpid2 || error "$?: direct read failed"
30593 }
30594 run_test 833 "Mixed buffered/direct read and write should not return -EIO"
30595
30596 #
30597 # tests that do cleanup/setup should be run at the end
30598 #
30599
30600 test_900() {
30601         [ $PARALLEL == "yes" ] && skip "skip parallel run"
30602         local ls
30603
30604         #define OBD_FAIL_MGC_PAUSE_PROCESS_LOG   0x903
30605         $LCTL set_param fail_loc=0x903
30606
30607         cancel_lru_locks MGC
30608
30609         FAIL_ON_ERROR=true cleanup
30610         FAIL_ON_ERROR=true setup
30611 }
30612 run_test 900 "umount should not race with any mgc requeue thread"
30613
30614 # LUS-6253/LU-11185
30615 test_901() {
30616         local old
30617         local count
30618         local oldc
30619         local newc
30620         local olds
30621         local news
30622         [ $PARALLEL == "yes" ] && skip "skip parallel run"
30623
30624         # some get_param have a bug to handle dot in param name
30625         cancel_lru_locks MGC
30626         old=$(mount -t lustre | wc -l)
30627         # 1 config+sptlrpc
30628         # 2 params
30629         # 3 nodemap
30630         # 4 IR
30631         old=$((old * 4))
30632         oldc=0
30633         count=0
30634         while [ $old -ne $oldc ]; do
30635                 oldc=$($LCTL get_param -n 'ldlm.namespaces.MGC*.lock_count')
30636                 sleep 1
30637                 ((count++))
30638                 if [ $count -ge $TIMEOUT ]; then
30639                         error "too large timeout"
30640                 fi
30641         done
30642         umount_client $MOUNT || error "umount failed"
30643         mount_client $MOUNT || error "mount failed"
30644         cancel_lru_locks MGC
30645         newc=$($LCTL get_param -n 'ldlm.namespaces.MGC*.lock_count')
30646
30647         [ $oldc -lt $newc ] && error "mgc lock leak ($oldc != $newc)"
30648
30649         return 0
30650 }
30651 run_test 901 "don't leak a mgc lock on client umount"
30652
30653 # LU-13377
30654 test_902() {
30655         [ $CLIENT_VERSION -lt $(version_code 2.13.52) ] &&
30656                 skip "client does not have LU-13377 fix"
30657         #define OBD_FAIL_LLITE_SHORT_COMMIT 0x1415
30658         $LCTL set_param fail_loc=0x1415
30659         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
30660         cancel_lru_locks osc
30661         rm -f $DIR/$tfile
30662 }
30663 run_test 902 "test short write doesn't hang lustre"
30664
30665 # LU-14711
30666 test_903() {
30667         $LFS setstripe -i 0 -c 1 $DIR/$tfile $DIR/${tfile}-2
30668         echo "blah" > $DIR/${tfile}-2
30669         dd if=/dev/zero of=$DIR/$tfile bs=1M count=6 conv=fsync
30670         #define OBD_FAIL_OSC_SLOW_PAGE_EVICT 0x417
30671         $LCTL set_param fail_loc=0x417 fail_val=20
30672
30673         mv $DIR/${tfile}-2 $DIR/$tfile # Destroys the big object
30674         sleep 1 # To start the destroy
30675         wait_destroy_complete 150 || error "Destroy taking too long"
30676         cat $DIR/$tfile > /dev/null || error "Evicted"
30677 }
30678 run_test 903 "Test long page discard does not cause evictions"
30679
30680 test_904() {
30681         [ "$mds1_FSTYPE" == "ldiskfs" ] || skip "ldiskfs only test"
30682         do_facet mds1 $DEBUGFS -R features $(mdsdevname 1) |
30683                 grep -q project || skip "skip project quota not supported"
30684
30685         local testfile="$DIR/$tdir/$tfile"
30686         local xattr="trusted.projid"
30687         local projid
30688         local mdts=$(comma_list $(mdts_nodes))
30689         local saved=$(do_facet mds1 $LCTL get_param -n \
30690                 osd-ldiskfs.*MDT0000.enable_projid_xattr)
30691
30692         do_nodes $mdts $LCTL set_param osd-ldiskfs.*MDT*.enable_projid_xattr=0
30693         stack_trap "do_nodes $mdts $LCTL set_param \
30694                 osd-ldiskfs.*MDT*.enable_projid_xattr=$saved"
30695
30696         mkdir -p $DIR/$tdir
30697         touch $testfile
30698         #hide projid xattr on server
30699         $LFS project -p 1 $testfile ||
30700                 error "set $testfile project id failed"
30701         getfattr -m - $testfile | grep $xattr &&
30702                 error "do not show trusted.projid when disabled on server"
30703         do_nodes $mdts $LCTL set_param osd-ldiskfs.*MDT*.enable_projid_xattr=1
30704         #should be hidden when projid is 0
30705         $LFS project -p 0 $testfile ||
30706                 error "set $testfile project id failed"
30707         getfattr -m - $testfile | grep $xattr &&
30708                 error "do not show trusted.projid with project ID 0"
30709
30710         #still can getxattr explicitly
30711         projid=$(getfattr -n $xattr $testfile |
30712                 sed -n 's/^trusted\.projid="\(.*\)"/\1/p')
30713         [ $projid == "0" ] ||
30714                 error "projid expected 0 not $projid"
30715
30716         #set the projid via setxattr
30717         setfattr -n $xattr -v "1000" $testfile ||
30718                 error "setattr failed with $?"
30719         projid=($($LFS project $testfile))
30720         [ ${projid[0]} == "1000" ] ||
30721                 error "projid expected 1000 not $projid"
30722
30723         #check the new projid via getxattr
30724         $LFS project -p 1001 $testfile ||
30725                 error "set $testfile project id failed"
30726         getfattr -m - $testfile | grep $xattr ||
30727                 error "should show trusted.projid when project ID != 0"
30728         projid=$(getfattr -n $xattr $testfile |
30729                 sed -n 's/^trusted\.projid="\(.*\)"/\1/p')
30730         [ $projid == "1001" ] ||
30731                 error "projid expected 1001 not $projid"
30732
30733         #try to set invalid projid
30734         setfattr -n $xattr -v "4294967295" $testfile &&
30735                 error "set invalid projid should fail"
30736
30737         #remove the xattr means setting projid to 0
30738         setfattr -x $xattr $testfile ||
30739                 error "setfattr failed with $?"
30740         projid=($($LFS project $testfile))
30741         [ ${projid[0]} == "0" ] ||
30742                 error "projid expected 0 not $projid"
30743
30744         #should be hidden when parent has inherit flag and same projid
30745         $LFS project -srp 1002 $DIR/$tdir ||
30746                 error "set $tdir project id failed"
30747         getfattr -m - $testfile | grep $xattr &&
30748                 error "do not show trusted.projid with inherit flag"
30749
30750         #still can getxattr explicitly
30751         projid=$(getfattr -n $xattr $testfile |
30752                 sed -n 's/^trusted\.projid="\(.*\)"/\1/p')
30753         [ $projid == "1002" ] ||
30754                 error "projid expected 1002 not $projid"
30755 }
30756 run_test 904 "virtual project ID xattr"
30757
30758 # LU-8582
30759 test_905() {
30760         (( $OST1_VERSION >= $(version_code 2.15.50.220) )) ||
30761                 skip "need OST version >= 2.15.50.220 for fail_loc"
30762
30763         remote_ost_nodsh && skip "remote OST with nodsh"
30764         $LFS setstripe -c -1 -i 0 $DIR/$tfile || error "setstripe failed"
30765
30766         $LFS ladvise -a willread $DIR/$tfile || error "ladvise does not work"
30767
30768         #define OBD_FAIL_OST_OPCODE 0x253
30769         # OST_LADVISE = 21
30770         do_facet ost1 "$LCTL set_param fail_val=21 fail_loc=0x0253"
30771         $LFS ladvise -a willread $DIR/$tfile &&
30772                 error "unexpected success of ladvise with fault injection"
30773         $LFS ladvise -a willread $DIR/$tfile |&
30774                 grep -q "Operation not supported"
30775         (( $? == 0 )) || error "unexpected stderr of ladvise with fault injection"
30776 }
30777 run_test 905 "bad or new opcode should not stuck client"
30778
30779 test_906() {
30780         grep -q io_uring_setup /proc/kallsyms ||
30781                 skip "Client OS does not support io_uring I/O engine"
30782         io_uring_probe || skip "kernel does not support io_uring fully"
30783         which fio || skip_env "no fio installed"
30784         fio --enghelp | grep -q io_uring ||
30785                 skip_env "fio does not support io_uring I/O engine"
30786
30787         local file=$DIR/$tfile
30788         local ioengine="io_uring"
30789         local numjobs=2
30790         local size=50M
30791
30792         fio --name=seqwrite --ioengine=$ioengine        \
30793                 --bs=$PAGE_SIZE --direct=1 --numjobs=$numjobs   \
30794                 --iodepth=64 --size=$size --filename=$file --rw=write ||
30795                 error "fio seqwrite $file failed"
30796
30797         fio --name=seqread --ioengine=$ioengine \
30798                 --bs=$PAGE_SIZE --direct=1 --numjobs=$numjobs   \
30799                 --iodepth=64 --size=$size --filename=$file --rw=read ||
30800                 error "fio seqread $file failed"
30801
30802         rm -f $file || error "rm -f $file failed"
30803 }
30804 run_test 906 "Simple test for io_uring I/O engine via fio"
30805
30806 complete_test $SECONDS
30807 [ -f $EXT2_DEV ] && rm $EXT2_DEV || true
30808 check_and_cleanup_lustre
30809 if [ "$I_MOUNTED" != "yes" ]; then
30810         lctl set_param debug="$OLDDEBUG" 2> /dev/null || true
30811 fi
30812 exit_status