Whamcloud - gitweb
aa2e05d589dd897c7925762366c59bd6d86dd527
[fs/lustre-release.git] / lustre / tests / sanity.sh
1 #!/bin/bash
2 #
3 # Run select tests by setting ONLY, or as arguments to the script.
4 # Skip specific tests by setting EXCEPT.
5 #
6 # e.g. ONLY="22 23" or ONLY="`seq 32 39`" or EXCEPT="31"
7 set -e
8
9 ONLY=${ONLY:-"$*"}
10
11 # Check Grants after these tests
12 GRANT_CHECK_LIST="$GRANT_CHECK_LIST 42a 42b 42c 42d 42e 63a 63b 64a 64b 64c 64d"
13
14 OSC=${OSC:-"osc"}
15
16 CC=${CC:-cc}
17 CREATETEST=${CREATETEST:-createtest}
18 LVERIFY=${LVERIFY:-ll_dirstripe_verify}
19 OPENFILE=${OPENFILE:-openfile}
20 OPENUNLINK=${OPENUNLINK:-openunlink}
21 READS=${READS:-"reads"}
22 MUNLINK=${MUNLINK:-munlink}
23 SOCKETSERVER=${SOCKETSERVER:-socketserver}
24 SOCKETCLIENT=${SOCKETCLIENT:-socketclient}
25 MEMHOG=${MEMHOG:-memhog}
26 DIRECTIO=${DIRECTIO:-directio}
27 ACCEPTOR_PORT=${ACCEPTOR_PORT:-988}
28 DEF_STRIPE_COUNT=-1
29 CHECK_GRANT=${CHECK_GRANT:-"yes"}
30 GRANT_CHECK_LIST=${GRANT_CHECK_LIST:-""}
31
32 TRACE=${TRACE:-""}
33 LUSTRE=${LUSTRE:-$(dirname $0)/..}
34 LUSTRE_TESTS_API_DIR=${LUSTRE_TESTS_API_DIR:-${LUSTRE}/tests/clientapi}
35 . $LUSTRE/tests/test-framework.sh
36 init_test_env "$@"
37
38 init_logging
39
40 ALWAYS_EXCEPT="$SANITY_EXCEPT "
41 always_except LU-9693  42a 42c
42 always_except LU-6493  42b
43 always_except LU-16515 118c 118d
44 always_except LU-8411  407
45
46 if $SHARED_KEY; then
47         always_except LU-14181 64e 64f
48 fi
49
50 # skip the grant tests for ARM until they are fixed
51 if [[ $(uname -m) = aarch64 ]]; then
52         always_except LU-11671 45
53 fi
54
55 # skip nfs tests on kernels >= 4.12.0 until they are fixed
56 if [ $LINUX_VERSION_CODE -ge $(version_code 4.12.0) ]; then
57         always_except LU-12661 817
58 fi
59 # skip cgroup tests on RHEL8.1 kernels until they are fixed
60 if (( $LINUX_VERSION_CODE >= $(version_code 4.18.0) &&
61       $LINUX_VERSION_CODE <  $(version_code 5.4.0) )); then
62         always_except LU-13063 411
63 fi
64
65 # skip basic ops on file with foreign LOV tests on 5.16.0+ kernels
66 # until the filemap_read() issue is fixed
67 if (( $LINUX_VERSION_CODE >= $(version_code 5.16.0) )); then
68         always_except LU-16101 27J
69 fi
70
71 #                                  5              12     8   12  15   (min)"
72 [[ "$SLOW" = "no" ]] && EXCEPT_SLOW="27m 60i 64b 68 71 135 136 230d 300o"
73
74 if [[ "$mds1_FSTYPE" == "zfs" ]]; then
75         #                                               13    (min)"
76         [[ "$SLOW" == "no" ]] && EXCEPT_SLOW="$EXCEPT_SLOW 51b"
77 fi
78
79 if [[ "$ost1_FSTYPE" = "zfs" ]]; then
80         always_except LU-1941 130b 130c 130d 130e 130f 130g
81         always_except LU-9054 312
82 fi
83
84 proc_regexp="/{proc,sys}/{fs,sys,kernel/debug}/{lustre,lnet}/"
85
86 # Get the SLES distro version
87 #
88 # Returns a version string that should only be used in comparing
89 # strings returned by version_code()
90 sles_version_code()
91 {
92         local version=$(grep VERSION_ID /etc/os-release | cut -d'"' -f2)
93
94         # All SuSE Linux versions have one decimal. version_code expects two
95         local sles_version=$version.0
96         version_code $sles_version
97 }
98
99 # Check if we are running on Ubuntu or SLES so we can make decisions on
100 # what tests to run
101 if [ -r /etc/SuSE-release ] || [ -r /etc/SUSE-brand ]; then
102         sles_version=$(sles_version_code)
103         [ $sles_version -lt $(version_code 11.4.0) ] &&
104                 always_except LU-4341 170
105
106         [ $sles_version -lt $(version_code 12.0.0) ] &&
107                 always_except LU-3703 234
108
109         [ $sles_version -ge $(version_code 15.4.0) ] &&
110                 always_except LU-16101 27J
111 elif [ -r /etc/os-release ]; then
112         if grep -qi ubuntu /etc/os-release; then
113                 ubuntu_version=$(version_code $(sed -n -e 's/"//g' \
114                                                 -e 's/^VERSION=//p' \
115                                                 /etc/os-release |
116                                                 awk '{ print $1 }'))
117
118                 if [[ $ubuntu_version -gt $(version_code 16.0.0) ]]; then
119                         always_except LU-10366 410
120                 fi
121         fi
122 fi
123
124 build_test_filter
125 FAIL_ON_ERROR=false
126
127 cleanup() {
128         echo -n "cln.."
129         pgrep ll_sa > /dev/null && { echo "There are ll_sa thread not exit!"; exit 20; }
130         cleanupall ${FORCE} $* || { echo "FAILed to clean up"; exit 20; }
131 }
132 setup() {
133         echo -n "mnt.."
134         load_modules
135         setupall || exit 10
136         echo "done"
137 }
138
139 check_swap_layouts_support()
140 {
141         $LCTL get_param -n llite.*.sbi_flags | grep -q layout ||
142                 skip "Does not support layout lock."
143 }
144
145 check_swap_layout_no_dom()
146 {
147         local FOLDER=$1
148         local SUPP=$(lfs getstripe $FOLDER | grep "pattern:       mdt" | wc -l)
149         [ $SUPP -eq 0 ] || skip "layout swap does not support DOM files so far"
150 }
151
152 check_and_setup_lustre
153 DIR=${DIR:-$MOUNT}
154 assert_DIR
155
156 MAXFREE=${MAXFREE:-$((300000 * $OSTCOUNT))}
157
158 [ -f $DIR/d52a/foo ] && chattr -a $DIR/d52a/foo
159 [ -f $DIR/d52b/foo ] && chattr -i $DIR/d52b/foo
160 rm -rf $DIR/[Rdfs][0-9]*
161
162 # $RUNAS_ID may get set incorrectly somewhere else
163 [ $UID -eq 0 -a $RUNAS_ID -eq 0 ] &&
164         error "\$RUNAS_ID set to 0, but \$UID is also 0!"
165
166 check_runas_id $RUNAS_ID $RUNAS_GID $RUNAS
167
168 if [ "${ONLY}" = "MOUNT" ] ; then
169         echo "Lustre is up, please go on"
170         exit
171 fi
172
173 echo "preparing for tests involving mounts"
174 EXT2_DEV=${EXT2_DEV:-$TMP/SANITY.LOOP}
175 touch $EXT2_DEV
176 mke2fs -j -F $EXT2_DEV 8000 > /dev/null
177 echo # add a newline after mke2fs.
178
179 umask 077
180
181 OLDDEBUG=$(lctl get_param -n debug 2> /dev/null)
182
183 # ensure all internal functions know we want full debug
184 export PTLDEBUG=all
185 lctl set_param debug=$PTLDEBUG 2> /dev/null || true
186
187 test_0a() {
188         touch $DIR/$tfile
189         $CHECKSTAT -t file $DIR/$tfile || error "$tfile is not a file"
190         rm $DIR/$tfile
191         $CHECKSTAT -a $DIR/$tfile || error "$tfile was not removed"
192 }
193 run_test 0a "touch; rm ====================="
194
195 test_0b() {
196         chmod 0755 $DIR || error "chmod 0755 $DIR failed"
197         $CHECKSTAT -p 0755 $DIR || error "$DIR permission is not 0755"
198 }
199 run_test 0b "chmod 0755 $DIR ============================="
200
201 test_0c() {
202         $LCTL get_param mdc.*.import | grep "state: FULL" ||
203                 error "import not FULL"
204         $LCTL get_param mdc.*.import | grep "target: $FSNAME-MDT" ||
205                 error "bad target"
206 }
207 run_test 0c "check import proc"
208
209 test_0d() { # LU-3397
210         [ $MGS_VERSION -lt $(version_code 2.10.57) ] &&
211                 skip "proc exports not supported before 2.10.57"
212
213         local mgs_exp="mgs.MGS.exports"
214         local client_uuid=$($LCTL get_param -n mgc.*.uuid)
215         local exp_client_nid
216         local exp_client_version
217         local exp_val
218         local imp_val
219         local temp_imp=$DIR/$tfile.import
220         local temp_exp=$DIR/$tfile.export
221
222         # save mgc import file to $temp_imp
223         $LCTL get_param mgc.*.import | tee $temp_imp
224         # Check if client uuid is found in MGS export
225         for exp_client_nid in $(do_facet mgs $LCTL get_param -N $mgs_exp.*); do
226                 [ $(do_facet mgs $LCTL get_param -n $exp_client_nid.uuid) == \
227                         $client_uuid ] &&
228                         break;
229         done
230         # save mgs export file to $temp_exp
231         do_facet mgs $LCTL get_param $exp_client_nid.export | tee $temp_exp
232
233         # Compare the value of field "connect_flags"
234         imp_val=$(grep "connect_flags" $temp_imp)
235         exp_val=$(grep "connect_flags" $temp_exp)
236         [ "$exp_val" == "$imp_val" ] ||
237                 error "export flags '$exp_val' != import flags '$imp_val'"
238
239         # Compare client versions.  Only compare top-3 fields for compatibility
240         exp_client_version=$(awk '/target_version:/ { print $2 }' $temp_exp)
241         exp_val=$(version_code $(cut -d. -f1,2,3 <<<$exp_client_version))
242         imp_val=$(version_code $(lustre_build_version client | cut -d. -f1,2,3))
243         [ "$exp_val" == "$imp_val" ] ||
244                 error "exp version '$exp_client_version'($exp_val) != " \
245                         "'$(lustre_build_version client)'($imp_val)"
246 }
247 run_test 0d "check export proc ============================="
248
249 test_0e() { # LU-13417
250         (( $MDSCOUNT > 1 )) ||
251                 skip "We need at least 2 MDTs for this test"
252
253         (( $MDS1_VERSION >= $(version_code 2.14.51) )) ||
254                 skip "Need server version at least 2.14.51"
255
256         local default_lmv_count=$($LFS getdirstripe -D -c $MOUNT)
257         local default_lmv_index=$($LFS getdirstripe -D -i $MOUNT)
258
259         [ $default_lmv_count -eq 1 ] ||
260                 error "$MOUNT default stripe count $default_lmv_count"
261
262         [ $default_lmv_index -eq -1 ] ||
263                 error "$MOUNT default stripe index $default_lmv_index"
264
265         mkdir $MOUNT/$tdir.1 || error "mkdir $MOUNT/$tdir.1 failed"
266         mkdir $MOUNT/$tdir.2 || error "mkdir $MOUNT/$tdir.2 failed"
267
268         local mdt_index1=$($LFS getdirstripe -i $MOUNT/$tdir.1)
269         local mdt_index2=$($LFS getdirstripe -i $MOUNT/$tdir.2)
270
271         [ $mdt_index1 -eq $mdt_index2 ] &&
272                 error "directories are on the same MDT $mdt_index1=$mdt_index2"
273
274         rmdir $MOUNT/$tdir.1 $MOUNT/$tdir.2
275 }
276 run_test 0e "Enable DNE MDT balancing for mkdir in the ROOT"
277
278 test_1() {
279         test_mkdir $DIR/$tdir
280         test_mkdir $DIR/$tdir/d2
281         mkdir $DIR/$tdir/d2 && error "we expect EEXIST, but not returned"
282         $CHECKSTAT -t dir $DIR/$tdir/d2 || error "$tdir/d2 is not a dir"
283         rmdir $DIR/$tdir/d2
284         rmdir $DIR/$tdir
285         $CHECKSTAT -a $DIR/$tdir || error "$tdir was not removed"
286 }
287 run_test 1 "mkdir; remkdir; rmdir"
288
289 test_2() {
290         test_mkdir $DIR/$tdir
291         touch $DIR/$tdir/$tfile || error "touch $tdir/$tfile failed"
292         $CHECKSTAT -t file $DIR/$tdir/$tfile || error "$tdir/$tfile not a file"
293         rm -r $DIR/$tdir
294         $CHECKSTAT -a $DIR/$tdir/$tfile || error "$tdir/$file is not removed"
295 }
296 run_test 2 "mkdir; touch; rmdir; check file"
297
298 test_3() {
299         test_mkdir $DIR/$tdir
300         $CHECKSTAT -t dir $DIR/$tdir || error "$tdir is not a directory"
301         touch $DIR/$tdir/$tfile
302         $CHECKSTAT -t file $DIR/$tdir/$tfile || error "$tdir/$tfile not a file"
303         rm -r $DIR/$tdir
304         $CHECKSTAT -a $DIR/$tdir || error "$tdir is not removed"
305 }
306 run_test 3 "mkdir; touch; rmdir; check dir"
307
308 # LU-4471 - failed rmdir on remote directories still removes directory on MDT0
309 test_4() {
310         test_mkdir -i 1 $DIR/$tdir
311
312         touch $DIR/$tdir/$tfile ||
313                 error "Create file under remote directory failed"
314
315         rmdir $DIR/$tdir &&
316                 error "Expect error removing in-use dir $DIR/$tdir"
317
318         test -d $DIR/$tdir || error "Remote directory disappeared"
319
320         rm -rf $DIR/$tdir || error "remove remote dir error"
321 }
322 run_test 4 "mkdir; touch dir/file; rmdir; checkdir (expect error)"
323
324 test_5() {
325         test_mkdir $DIR/$tdir
326         test_mkdir $DIR/$tdir/d2
327         chmod 0707 $DIR/$tdir/d2 || error "chmod 0707 $tdir/d2 failed"
328         $CHECKSTAT -t dir -p 0707 $DIR/$tdir/d2 || error "$tdir/d2 not mode 707"
329         $CHECKSTAT -t dir $DIR/$tdir/d2 || error "$tdir/d2 is not a directory"
330 }
331 run_test 5 "mkdir .../d5 .../d5/d2; chmod .../d5/d2"
332
333 test_6a() {
334         touch $DIR/$tfile || error "touch $DIR/$tfile failed"
335         chmod 0666 $DIR/$tfile || error "chmod 0666 $tfile failed"
336         $CHECKSTAT -t file -p 0666 -u \#$UID $DIR/$tfile ||
337                 error "$tfile does not have perm 0666 or UID $UID"
338         $RUNAS chmod 0444 $DIR/$tfile && error "chmod $tfile worked on UID $UID"
339         $CHECKSTAT -t file -p 0666 -u \#$UID $DIR/$tfile ||
340                 error "$tfile should be 0666 and owned by UID $UID"
341 }
342 run_test 6a "touch f6a; chmod f6a; $RUNAS chmod f6a (should return error) =="
343
344 test_6c() {
345         [ $RUNAS_ID -eq $UID ] && skip_env "RUNAS_ID = UID = $UID"
346
347         touch $DIR/$tfile
348         chown $RUNAS_ID $DIR/$tfile || error "chown $RUNAS_ID $file failed"
349         $CHECKSTAT -t file -u \#$RUNAS_ID $DIR/$tfile ||
350                 error "$tfile should be owned by UID $RUNAS_ID"
351         $RUNAS chown $UID $DIR/$tfile && error "chown $UID $file succeeded"
352         $CHECKSTAT -t file -u \#$RUNAS_ID $DIR/$tfile ||
353                 error "$tfile should be owned by UID $RUNAS_ID"
354 }
355 run_test 6c "touch f6c; chown f6c; $RUNAS chown f6c (should return error) =="
356
357 test_6e() {
358         [ $RUNAS_ID -eq $UID ] && skip_env "RUNAS_ID = UID = $UID"
359
360         touch $DIR/$tfile
361         chgrp $RUNAS_ID $DIR/$tfile || error "chgrp $RUNAS_ID $file failed"
362         $CHECKSTAT -t file -u \#$UID -g \#$RUNAS_ID $DIR/$tfile ||
363                 error "$tfile should be owned by GID $UID"
364         $RUNAS chgrp $UID $DIR/$tfile && error "chgrp $UID $file succeeded"
365         $CHECKSTAT -t file -u \#$UID -g \#$RUNAS_ID $DIR/$tfile ||
366                 error "$tfile should be owned by UID $UID and GID $RUNAS_ID"
367 }
368 run_test 6e "touch+chgrp $tfile; $RUNAS chgrp $tfile (should return error)"
369
370 test_6g() {
371         [ $RUNAS_ID -eq $UID ] && skip_env "RUNAS_ID = UID = $UID"
372
373         test_mkdir $DIR/$tdir
374         chmod 777 $DIR/$tdir || error "chmod 0777 $tdir failed"
375         $RUNAS mkdir $DIR/$tdir/d || error "mkdir $tdir/d failed"
376         chmod g+s $DIR/$tdir/d || error "chmod g+s $tdir/d failed"
377         test_mkdir $DIR/$tdir/d/subdir
378         $CHECKSTAT -g \#$RUNAS_GID $DIR/$tdir/d/subdir ||
379                 error "$tdir/d/subdir should be GID $RUNAS_GID"
380         if [[ $MDSCOUNT -gt 1 ]]; then
381                 # check remote dir sgid inherite
382                 $LFS mkdir -i 0 $DIR/$tdir.local ||
383                         error "mkdir $tdir.local failed"
384                 chmod g+s $DIR/$tdir.local ||
385                         error "chmod $tdir.local failed"
386                 chgrp $RUNAS_GID $DIR/$tdir.local ||
387                         error "chgrp $tdir.local failed"
388                 $LFS mkdir -i 1 $DIR/$tdir.local/$tdir.remote ||
389                         error "mkdir $tdir.remote failed"
390                 $CHECKSTAT -g \#$RUNAS_GID $DIR/$tdir.local/$tdir.remote ||
391                         error "$tdir.remote should be owned by $UID.$RUNAS_ID"
392                 $CHECKSTAT -p 02755 $DIR/$tdir.local/$tdir.remote ||
393                         error "$tdir.remote should be mode 02755"
394         fi
395 }
396 run_test 6g "verify new dir in sgid dir inherits group"
397
398 test_6h() { # bug 7331
399         [ $RUNAS_ID -eq $UID ] && skip_env "RUNAS_ID = UID = $UID"
400
401         touch $DIR/$tfile || error "touch failed"
402         chown $RUNAS_ID:$RUNAS_GID $DIR/$tfile || error "initial chown failed"
403         $RUNAS -G$RUNAS_GID chown $RUNAS_ID:0 $DIR/$tfile &&
404                 error "chown $RUNAS_ID:0 $tfile worked as GID $RUNAS_GID"
405         $CHECKSTAT -t file -u \#$RUNAS_ID -g \#$RUNAS_GID $DIR/$tfile ||
406                 error "$tdir/$tfile should be UID $RUNAS_UID GID $RUNAS_GID"
407 }
408 run_test 6h "$RUNAS chown RUNAS_ID.0 .../$tfile (should return error)"
409
410 test_7a() {
411         test_mkdir $DIR/$tdir
412         $MCREATE $DIR/$tdir/$tfile
413         chmod 0666 $DIR/$tdir/$tfile
414         $CHECKSTAT -t file -p 0666 $DIR/$tdir/$tfile ||
415                 error "$tdir/$tfile should be mode 0666"
416 }
417 run_test 7a "mkdir .../d7; mcreate .../d7/f; chmod .../d7/f ===="
418
419 test_7b() {
420         if [ ! -d $DIR/$tdir ]; then
421                 test_mkdir $DIR/$tdir
422         fi
423         $MCREATE $DIR/$tdir/$tfile
424         echo -n foo > $DIR/$tdir/$tfile
425         [ "$(cat $DIR/$tdir/$tfile)" = "foo" ] || error "$tdir/$tfile not 'foo'"
426         $CHECKSTAT -t file -s 3 $DIR/$tdir/$tfile || error "$tfile size not 3"
427 }
428 run_test 7b "mkdir .../d7; mcreate d7/f2; echo foo > d7/f2 ====="
429
430 test_8() {
431         test_mkdir $DIR/$tdir
432         touch $DIR/$tdir/$tfile
433         chmod 0666 $DIR/$tdir/$tfile
434         $CHECKSTAT -t file -p 0666 $DIR/$tdir/$tfile ||
435                 error "$tfile mode not 0666"
436 }
437 run_test 8 "mkdir .../d8; touch .../d8/f; chmod .../d8/f ======="
438
439 test_9() {
440         test_mkdir $DIR/$tdir
441         test_mkdir $DIR/$tdir/d2
442         test_mkdir $DIR/$tdir/d2/d3
443         $CHECKSTAT -t dir $DIR/$tdir/d2/d3 || error "$tdir/d2/d3 not a dir"
444 }
445 run_test 9 "mkdir .../d9 .../d9/d2 .../d9/d2/d3 ================"
446
447 test_10() {
448         test_mkdir $DIR/$tdir
449         test_mkdir $DIR/$tdir/d2
450         touch $DIR/$tdir/d2/$tfile
451         $CHECKSTAT -t file $DIR/$tdir/d2/$tfile ||
452                 error "$tdir/d2/$tfile not a file"
453 }
454 run_test 10 "mkdir .../d10 .../d10/d2; touch .../d10/d2/f ======"
455
456 test_11() {
457         test_mkdir $DIR/$tdir
458         test_mkdir $DIR/$tdir/d2
459         chmod 0666 $DIR/$tdir/d2
460         chmod 0705 $DIR/$tdir/d2
461         $CHECKSTAT -t dir -p 0705 $DIR/$tdir/d2 ||
462                 error "$tdir/d2 mode not 0705"
463 }
464 run_test 11 "mkdir .../d11 d11/d2; chmod .../d11/d2 ============"
465
466 test_12() {
467         test_mkdir $DIR/$tdir
468         touch $DIR/$tdir/$tfile
469         chmod 0666 $DIR/$tdir/$tfile
470         chmod 0654 $DIR/$tdir/$tfile
471         $CHECKSTAT -t file -p 0654 $DIR/$tdir/$tfile ||
472                 error "$tdir/d2 mode not 0654"
473 }
474 run_test 12 "touch .../d12/f; chmod .../d12/f .../d12/f ========"
475
476 test_13() {
477         test_mkdir $DIR/$tdir
478         dd if=/dev/zero of=$DIR/$tdir/$tfile count=10
479         >  $DIR/$tdir/$tfile
480         $CHECKSTAT -t file -s 0 $DIR/$tdir/$tfile ||
481                 error "$tdir/$tfile size not 0 after truncate"
482 }
483 run_test 13 "creat .../d13/f; dd .../d13/f; > .../d13/f ========"
484
485 test_14() {
486         test_mkdir $DIR/$tdir
487         touch $DIR/$tdir/$tfile
488         rm $DIR/$tdir/$tfile
489         $CHECKSTAT -a $DIR/$tdir/$tfile || error "$tdir/$tfile not removed"
490 }
491 run_test 14 "touch .../d14/f; rm .../d14/f; rm .../d14/f ======="
492
493 test_15() {
494         test_mkdir $DIR/$tdir
495         touch $DIR/$tdir/$tfile
496         mv $DIR/$tdir/$tfile $DIR/$tdir/${tfile}_2
497         $CHECKSTAT -t file $DIR/$tdir/${tfile}_2 ||
498                 error "$tdir/${tfile_2} not a file after rename"
499         rm $DIR/$tdir/${tfile}_2 || error "unlink failed after rename"
500 }
501 run_test 15 "touch .../d15/f; mv .../d15/f .../d15/f2 =========="
502
503 test_16() {
504         test_mkdir $DIR/$tdir
505         touch $DIR/$tdir/$tfile
506         rm -rf $DIR/$tdir/$tfile
507         $CHECKSTAT -a $DIR/$tdir/$tfile || error "$tdir/$tfile not removed"
508 }
509 run_test 16 "touch .../d16/f; rm -rf .../d16/f"
510
511 test_17a() {
512         test_mkdir $DIR/$tdir
513         touch $DIR/$tdir/$tfile
514         ln -s $DIR/$tdir/$tfile $DIR/$tdir/l-exist
515         ls -l $DIR/$tdir
516         $CHECKSTAT -l $DIR/$tdir/$tfile $DIR/$tdir/l-exist ||
517                 error "$tdir/l-exist not a symlink"
518         $CHECKSTAT -f -t f $DIR/$tdir/l-exist ||
519                 error "$tdir/l-exist not referencing a file"
520         rm -f $DIR/$tdir/l-exist
521         $CHECKSTAT -a $DIR/$tdir/l-exist || error "$tdir/l-exist not removed"
522 }
523 run_test 17a "symlinks: create, remove (real)"
524
525 test_17b() {
526         test_mkdir $DIR/$tdir
527         ln -s no-such-file $DIR/$tdir/l-dangle
528         ls -l $DIR/$tdir
529         $CHECKSTAT -l no-such-file $DIR/$tdir/l-dangle ||
530                 error "$tdir/l-dangle not referencing no-such-file"
531         $CHECKSTAT -fa $DIR/$tdir/l-dangle ||
532                 error "$tdir/l-dangle not referencing non-existent file"
533         rm -f $DIR/$tdir/l-dangle
534         $CHECKSTAT -a $DIR/$tdir/l-dangle || error "$tdir/l-dangle not removed"
535 }
536 run_test 17b "symlinks: create, remove (dangling)"
537
538 test_17c() { # bug 3440 - don't save failed open RPC for replay
539         test_mkdir $DIR/$tdir
540         ln -s foo $DIR/$tdir/$tfile
541         cat $DIR/$tdir/$tfile && error "opened non-existent symlink" || true
542 }
543 run_test 17c "symlinks: open dangling (should return error)"
544
545 test_17d() {
546         test_mkdir $DIR/$tdir
547         ln -s foo $DIR/$tdir/$tfile
548         touch $DIR/$tdir/$tfile || error "creating to new symlink"
549 }
550 run_test 17d "symlinks: create dangling"
551
552 test_17e() {
553         test_mkdir $DIR/$tdir
554         local foo=$DIR/$tdir/$tfile
555         ln -s $foo $foo || error "create symlink failed"
556         ls -l $foo || error "ls -l failed"
557         ls $foo && error "ls not failed" || true
558 }
559 run_test 17e "symlinks: create recursive symlink (should return error)"
560
561 test_17f() {
562         test_mkdir $DIR/$tdir
563         ln -s 1234567890/2234567890/3234567890/4234567890 $DIR/$tdir/111
564         ln -s 1234567890/2234567890/3234567890/4234567890/5234567890/6234567890 $DIR/$tdir/222
565         ln -s 1234567890/2234567890/3234567890/4234567890/5234567890/6234567890/7234567890/8234567890 $DIR/$tdir/333
566         ln -s 1234567890/2234567890/3234567890/4234567890/5234567890/6234567890/7234567890/8234567890/9234567890/a234567890/b234567890 $DIR/$tdir/444
567         ln -s 1234567890/2234567890/3234567890/4234567890/5234567890/6234567890/7234567890/8234567890/9234567890/a234567890/b234567890/c234567890/d234567890/f234567890 $DIR/$tdir/555
568         ln -s 1234567890/2234567890/3234567890/4234567890/5234567890/6234567890/7234567890/8234567890/9234567890/a234567890/b234567890/c234567890/d234567890/f234567890/aaaaaaaaaa/bbbbbbbbbb/cccccccccc/dddddddddd/eeeeeeeeee/ffffffffff/ $DIR/$tdir/666
569         ls -l  $DIR/$tdir
570 }
571 run_test 17f "symlinks: long and very long symlink name"
572
573 # str_repeat(S, N) generate a string that is string S repeated N times
574 str_repeat() {
575         local s=$1
576         local n=$2
577         local ret=''
578         while [ $((n -= 1)) -ge 0 ]; do
579                 ret=$ret$s
580         done
581         echo $ret
582 }
583
584 # Long symlinks and LU-2241
585 test_17g() {
586         test_mkdir $DIR/$tdir
587         local TESTS="59 60 61 4094 4095"
588
589         # Fix for inode size boundary in 2.1.4
590         [ $MDS1_VERSION -lt $(version_code 2.1.4) ] &&
591                 TESTS="4094 4095"
592
593         # Patch not applied to 2.2 or 2.3 branches
594         [ $MDS1_VERSION -ge $(version_code 2.2.0) ] &&
595         [ $MDS1_VERSION -le $(version_code 2.3.55) ] &&
596                 TESTS="4094 4095"
597
598         for i in $TESTS; do
599                 local SYMNAME=$(str_repeat 'x' $i)
600                 ln -s $SYMNAME $DIR/$tdir/f$i || error "failed $i-char symlink"
601                 readlink $DIR/$tdir/f$i || error "failed $i-char readlink"
602         done
603 }
604 run_test 17g "symlinks: really long symlink name and inode boundaries"
605
606 test_17h() { #bug 17378
607         [ $PARALLEL == "yes" ] && skip "skip parallel run"
608         remote_mds_nodsh && skip "remote MDS with nodsh"
609
610         local mdt_idx
611
612         test_mkdir $DIR/$tdir
613         mdt_idx=$($LFS getdirstripe -i $DIR/$tdir)
614         $LFS setstripe -c -1 $DIR/$tdir
615         #define OBD_FAIL_MDS_LOV_PREP_CREATE 0x141
616         do_facet mds$((mdt_idx + 1)) lctl set_param fail_loc=0x80000141
617         touch $DIR/$tdir/$tfile || true
618 }
619 run_test 17h "create objects: lov_free_memmd() doesn't lbug"
620
621 test_17i() { #bug 20018
622         [ $PARALLEL == "yes" ] && skip "skip parallel run"
623         remote_mds_nodsh && skip "remote MDS with nodsh"
624
625         local foo=$DIR/$tdir/$tfile
626         local mdt_idx
627
628         test_mkdir -c1 $DIR/$tdir
629         mdt_idx=$($LFS getdirstripe -i $DIR/$tdir)
630         ln -s $foo $foo || error "create symlink failed"
631 #define OBD_FAIL_MDS_READLINK_EPROTO     0x143
632         do_facet mds$((mdt_idx + 1)) lctl set_param fail_loc=0x80000143
633         ls -l $foo && error "error not detected"
634         return 0
635 }
636 run_test 17i "don't panic on short symlink (should return error)"
637
638 test_17k() { #bug 22301
639         [ $PARALLEL == "yes" ] && skip "skip parallel run"
640         [[ -z "$(which rsync 2>/dev/null)" ]] &&
641                 skip "no rsync command"
642         rsync --help | grep -q xattr ||
643                 skip_env "$(rsync --version | head -n1) does not support xattrs"
644         test_mkdir $DIR/$tdir
645         test_mkdir $DIR/$tdir.new
646         touch $DIR/$tdir/$tfile
647         ln -s $DIR/$tdir/$tfile $DIR/$tdir/$tfile.lnk
648         rsync -av -X $DIR/$tdir/ $DIR/$tdir.new ||
649                 error "rsync failed with xattrs enabled"
650 }
651 run_test 17k "symlinks: rsync with xattrs enabled"
652
653 test_17l() { # LU-279
654         [[ -z "$(which getfattr 2>/dev/null)" ]] &&
655                 skip "no getfattr command"
656
657         test_mkdir $DIR/$tdir
658         touch $DIR/$tdir/$tfile
659         ln -s $DIR/$tdir/$tfile $DIR/$tdir/$tfile.lnk
660         for path in "$DIR/$tdir" "$DIR/$tdir/$tfile" "$DIR/$tdir/$tfile.lnk"; do
661                 # -h to not follow symlinks. -m '' to list all the xattrs.
662                 # grep to remove first line: '# file: $path'.
663                 for xattr in `getfattr -hm '' $path 2>/dev/null | grep -v '^#'`;
664                 do
665                         lgetxattr_size_check $path $xattr ||
666                                 error "lgetxattr_size_check $path $xattr failed"
667                 done
668         done
669 }
670 run_test 17l "Ensure lgetxattr's returned xattr size is consistent"
671
672 # LU-1540
673 test_17m() {
674         [ $PARALLEL == "yes" ] && skip "skip parallel run"
675         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
676         remote_mds_nodsh && skip "remote MDS with nodsh"
677         [ $MDS1_VERSION -ge $(version_code 2.2.0) ] &&
678         [ $MDS1_VERSION -le $(version_code 2.2.93) ] &&
679                 skip "MDS 2.2.0-2.2.93 do not NUL-terminate symlinks"
680
681         local short_sym="0123456789"
682         local wdir=$DIR/$tdir
683         local i
684
685         test_mkdir $wdir
686         long_sym=$short_sym
687         # create a long symlink file
688         for ((i = 0; i < 4; ++i)); do
689                 long_sym=${long_sym}${long_sym}
690         done
691
692         echo "create 512 short and long symlink files under $wdir"
693         for ((i = 0; i < 256; ++i)); do
694                 ln -sf ${long_sym}"a5a5" $wdir/long-$i
695                 ln -sf ${short_sym}"a5a5" $wdir/short-$i
696         done
697
698         echo "erase them"
699         rm -f $wdir/*
700         sync
701         wait_delete_completed
702
703         echo "recreate the 512 symlink files with a shorter string"
704         for ((i = 0; i < 512; ++i)); do
705                 # rewrite the symlink file with a shorter string
706                 ln -sf ${long_sym} $wdir/long-$i || error "long_sym failed"
707                 ln -sf ${short_sym} $wdir/short-$i || error "short_sym failed"
708         done
709
710         local mds_index=$(($($LFS getstripe -m $wdir) + 1))
711
712         echo "stop and checking mds${mds_index}:"
713         # e2fsck should not return error
714         stop mds${mds_index}
715         local devname=$(mdsdevname $mds_index)
716         run_e2fsck $(facet_active_host mds${mds_index}) $devname -n
717         rc=$?
718
719         start mds${mds_index} $devname $MDS_MOUNT_OPTS ||
720                 error "start mds${mds_index} failed"
721         df $MOUNT > /dev/null 2>&1
722         [ $rc -eq 0 ] ||
723                 error "e2fsck detected error for short/long symlink: rc=$rc"
724         rm -f $wdir/*
725 }
726 run_test 17m "run e2fsck against MDT which contains short/long symlink"
727
728 check_fs_consistency_17n() {
729         local mdt_index
730         local rc=0
731
732         # create/unlink in 17n only change 2 MDTs(MDT1/MDT2),
733         # so it only check MDT1/MDT2 instead of all of MDTs.
734         for mdt_index in 1 2; do
735                 # e2fsck should not return error
736                 stop mds${mdt_index}
737                 local devname=$(mdsdevname $mdt_index)
738                 run_e2fsck $(facet_active_host mds$mdt_index) $devname -n ||
739                         rc=$((rc + $?))
740
741                 start mds${mdt_index} $devname $MDS_MOUNT_OPTS ||
742                         error "mount mds$mdt_index failed"
743                 df $MOUNT > /dev/null 2>&1
744         done
745         return $rc
746 }
747
748 test_17n() {
749         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
750         [ $PARALLEL == "yes" ] && skip "skip parallel run"
751         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
752         remote_mds_nodsh && skip "remote MDS with nodsh"
753         [ $MDS1_VERSION -ge $(version_code 2.2.0) ] &&
754         [ $MDS1_VERSION -le $(version_code 2.2.93) ] &&
755                 skip "MDS 2.2.0-2.2.93 do not NUL-terminate symlinks"
756
757         local i
758
759         test_mkdir $DIR/$tdir
760         for ((i=0; i<10; i++)); do
761                 $LFS mkdir -i1 -c2 $DIR/$tdir/remote_dir_${i} ||
762                         error "create remote dir error $i"
763                 createmany -o $DIR/$tdir/remote_dir_${i}/f 10 ||
764                         error "create files under remote dir failed $i"
765         done
766
767         check_fs_consistency_17n ||
768                 error "e2fsck report error after create files under remote dir"
769
770         for ((i = 0; i < 10; i++)); do
771                 rm -rf $DIR/$tdir/remote_dir_${i} ||
772                         error "destroy remote dir error $i"
773         done
774
775         check_fs_consistency_17n ||
776                 error "e2fsck report error after unlink files under remote dir"
777
778         [ $MDS1_VERSION -lt $(version_code 2.4.50) ] &&
779                 skip "lustre < 2.4.50 does not support migrate mv"
780
781         for ((i = 0; i < 10; i++)); do
782                 mkdir -p $DIR/$tdir/remote_dir_${i}
783                 createmany -o $DIR/$tdir/remote_dir_${i}/f 10 ||
784                         error "create files under remote dir failed $i"
785                 $LFS migrate --mdt-index 1 $DIR/$tdir/remote_dir_${i} ||
786                         error "migrate remote dir error $i"
787         done
788         check_fs_consistency_17n || error "e2fsck report error after migration"
789
790         for ((i = 0; i < 10; i++)); do
791                 rm -rf $DIR/$tdir/remote_dir_${i} ||
792                         error "destroy remote dir error $i"
793         done
794
795         check_fs_consistency_17n || error "e2fsck report error after unlink"
796 }
797 run_test 17n "run e2fsck against master/slave MDT which contains remote dir"
798
799 test_17o() {
800         remote_mds_nodsh && skip "remote MDS with nodsh"
801         [ $MDS1_VERSION -lt $(version_code 2.3.64) ] &&
802                 skip "Need MDS version at least 2.3.64"
803
804         local wdir=$DIR/${tdir}o
805         local mdt_index
806         local rc=0
807
808         test_mkdir $wdir
809         touch $wdir/$tfile
810         mdt_index=$($LFS getstripe -m $wdir/$tfile)
811         mdt_index=$((mdt_index + 1))
812
813         cancel_lru_locks mdc
814         #fail mds will wait the failover finish then set
815         #following fail_loc to avoid interfer the recovery process.
816         fail mds${mdt_index}
817
818         #define OBD_FAIL_OSD_LMA_INCOMPAT 0x194
819         do_facet mds${mdt_index} lctl set_param fail_loc=0x194
820         ls -l $wdir/$tfile && rc=1
821         do_facet mds${mdt_index} lctl set_param fail_loc=0
822         [[ $rc -eq 0 ]] || error "stat file should fail"
823 }
824 run_test 17o "stat file with incompat LMA feature"
825
826 test_18() {
827         touch $DIR/$tfile || error "Failed to touch $DIR/$tfile: $?"
828         ls $DIR || error "Failed to ls $DIR: $?"
829 }
830 run_test 18 "touch .../f ; ls ... =============================="
831
832 test_19a() {
833         touch $DIR/$tfile
834         ls -l $DIR
835         rm $DIR/$tfile
836         $CHECKSTAT -a $DIR/$tfile || error "$tfile was not removed"
837 }
838 run_test 19a "touch .../f19 ; ls -l ... ; rm .../f19 ==========="
839
840 test_19b() {
841         ls -l $DIR/$tfile && error "ls -l $tfile failed"|| true
842 }
843 run_test 19b "ls -l .../f19 (should return error) =============="
844
845 test_19c() {
846         [ $RUNAS_ID -eq $UID ] &&
847                 skip_env "RUNAS_ID = UID = $UID -- skipping"
848
849         $RUNAS touch $DIR/$tfile && error "create non-root file failed" || true
850 }
851 run_test 19c "$RUNAS touch .../f19 (should return error) =="
852
853 test_19d() {
854         cat $DIR/f19 && error || true
855 }
856 run_test 19d "cat .../f19 (should return error) =============="
857
858 test_20() {
859         touch $DIR/$tfile
860         rm $DIR/$tfile
861         touch $DIR/$tfile
862         rm $DIR/$tfile
863         touch $DIR/$tfile
864         rm $DIR/$tfile
865         $CHECKSTAT -a $DIR/$tfile || error "$tfile was not removed"
866 }
867 run_test 20 "touch .../f ; ls -l ..."
868
869 test_21() {
870         test_mkdir $DIR/$tdir
871         [ -f $DIR/$tdir/dangle ] && rm -f $DIR/$tdir/dangle
872         ln -s dangle $DIR/$tdir/link
873         echo foo >> $DIR/$tdir/link
874         cat $DIR/$tdir/dangle
875         $CHECKSTAT -t link $DIR/$tdir/link || error "$tdir/link not a link"
876         $CHECKSTAT -f -t file $DIR/$tdir/link ||
877                 error "$tdir/link not linked to a file"
878 }
879 run_test 21 "write to dangling link"
880
881 test_22() {
882         local wdir=$DIR/$tdir
883         test_mkdir $wdir
884         chown $RUNAS_ID:$RUNAS_GID $wdir
885         (cd $wdir || error "cd $wdir failed";
886                 $RUNAS tar cf - /etc/hosts /etc/sysconfig/network |
887                 $RUNAS tar xf -)
888         ls -lR $wdir/etc || error "ls -lR $wdir/etc failed"
889         $CHECKSTAT -t dir $wdir/etc || error "checkstat -t dir failed"
890         $CHECKSTAT -u \#$RUNAS_ID -g \#$RUNAS_GID $wdir/etc ||
891                 error "checkstat -u failed"
892 }
893 run_test 22 "unpack tar archive as non-root user"
894
895 # was test_23
896 test_23a() {
897         test_mkdir $DIR/$tdir
898         local file=$DIR/$tdir/$tfile
899
900         openfile -f O_CREAT:O_EXCL $file || error "$file create failed"
901         openfile -f O_CREAT:O_EXCL $file &&
902                 error "$file recreate succeeded" || true
903 }
904 run_test 23a "O_CREAT|O_EXCL in subdir"
905
906 test_23b() { # bug 18988
907         test_mkdir $DIR/$tdir
908         local file=$DIR/$tdir/$tfile
909
910         rm -f $file
911         echo foo > $file || error "write filed"
912         echo bar >> $file || error "append filed"
913         $CHECKSTAT -s 8 $file || error "wrong size"
914         rm $file
915 }
916 run_test 23b "O_APPEND check"
917
918 # LU-9409, size with O_APPEND and tiny writes
919 test_23c() {
920         local file=$DIR/$tfile
921
922         # single dd
923         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=8 count=800
924         $CHECKSTAT -s 6400 $file || error "wrong size, expected 6400"
925         rm -f $file
926
927         # racing tiny writes
928         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=8 count=800 &
929         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=8 count=800 &
930         wait
931         $CHECKSTAT -s 12800 $file || error "wrong size, expected 12800"
932         rm -f $file
933
934         #racing tiny & normal writes
935         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=4096 count=4 &
936         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=8 count=100 &
937         wait
938         $CHECKSTAT -s 17184 $file || error "wrong size, expected 17184"
939         rm -f $file
940
941         #racing tiny & normal writes 2, ugly numbers
942         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=4099 count=11 &
943         dd conv=notrunc oflag=append if=/dev/zero of=$file bs=17 count=173 &
944         wait
945         $CHECKSTAT -s 48030 $file || error "wrong size, expected 48030"
946         rm -f $file
947 }
948 run_test 23c "O_APPEND size checks for tiny writes"
949
950 # LU-11069 file offset is correct after appending writes
951 test_23d() {
952         local file=$DIR/$tfile
953         local offset
954
955         echo CentaurHauls > $file
956         offset=$($MULTIOP $file oO_WRONLY:O_APPEND:w13Zp)
957         if ((offset != 26)); then
958                 error "wrong offset, expected 26, got '$offset'"
959         fi
960 }
961 run_test 23d "file offset is correct after appending writes"
962
963 # rename sanity
964 test_24a() {
965         echo '-- same directory rename'
966         test_mkdir $DIR/$tdir
967         touch $DIR/$tdir/$tfile.1
968         mv $DIR/$tdir/$tfile.1 $DIR/$tdir/$tfile.2
969         $CHECKSTAT -t file $DIR/$tdir/$tfile.2 || error "$tfile.2 not a file"
970 }
971 run_test 24a "rename file to non-existent target"
972
973 test_24b() {
974         test_mkdir $DIR/$tdir
975         touch $DIR/$tdir/$tfile.{1,2}
976         mv $DIR/$tdir/$tfile.1 $DIR/$tdir/$tfile.2
977         $CHECKSTAT -a $DIR/$tdir/$tfile.1 || error "$tfile.1 exists"
978         $CHECKSTAT -t file $DIR/$tdir/$tfile.2 || error "$tfile.2 not a file"
979 }
980 run_test 24b "rename file to existing target"
981
982 test_24c() {
983         test_mkdir $DIR/$tdir
984         test_mkdir $DIR/$tdir/d$testnum.1
985         mv $DIR/$tdir/d$testnum.1 $DIR/$tdir/d$testnum.2
986         $CHECKSTAT -a $DIR/$tdir/d$testnum.1 || error "d$testnum.1 exists"
987         $CHECKSTAT -t dir $DIR/$tdir/d$testnum.2 || error "d$testnum.2 not dir"
988 }
989 run_test 24c "rename directory to non-existent target"
990
991 test_24d() {
992         test_mkdir -c1 $DIR/$tdir
993         test_mkdir -c1 $DIR/$tdir/d$testnum.1
994         test_mkdir -c1 $DIR/$tdir/d$testnum.2
995         mrename $DIR/$tdir/d$testnum.1 $DIR/$tdir/d$testnum.2
996         $CHECKSTAT -a $DIR/$tdir/d$testnum.1 || error "d$testnum.1 exists"
997         $CHECKSTAT -t dir $DIR/$tdir/d$testnum.2 || error "d$testnum.2 not dir"
998 }
999 run_test 24d "rename directory to existing target"
1000
1001 test_24e() {
1002         echo '-- cross directory renames --'
1003         test_mkdir $DIR/R5a
1004         test_mkdir $DIR/R5b
1005         touch $DIR/R5a/f
1006         mv $DIR/R5a/f $DIR/R5b/g
1007         $CHECKSTAT -a $DIR/R5a/f || error "$DIR/R5a/f exists"
1008         $CHECKSTAT -t file $DIR/R5b/g || error "$DIR/R5b/g not file type"
1009 }
1010 run_test 24e "touch .../R5a/f; rename .../R5a/f .../R5b/g ======"
1011
1012 test_24f() {
1013         test_mkdir $DIR/R6a
1014         test_mkdir $DIR/R6b
1015         touch $DIR/R6a/f $DIR/R6b/g
1016         mv $DIR/R6a/f $DIR/R6b/g
1017         $CHECKSTAT -a $DIR/R6a/f || error "$DIR/R6a/f exists"
1018         $CHECKSTAT -t file $DIR/R6b/g || error "$DIR/R6b/g not file type"
1019 }
1020 run_test 24f "touch .../R6a/f R6b/g; mv .../R6a/f .../R6b/g ===="
1021
1022 test_24g() {
1023         test_mkdir $DIR/R7a
1024         test_mkdir $DIR/R7b
1025         test_mkdir $DIR/R7a/d
1026         mv $DIR/R7a/d $DIR/R7b/e
1027         $CHECKSTAT -a $DIR/R7a/d || error "$DIR/R7a/d exists"
1028         $CHECKSTAT -t dir $DIR/R7b/e || error "$DIR/R7b/e not dir type"
1029 }
1030 run_test 24g "mkdir .../R7{a,b}/d; mv .../R7a/d .../R7b/e ======"
1031
1032 test_24h() {
1033         test_mkdir -c1 $DIR/R8a
1034         test_mkdir -c1 $DIR/R8b
1035         test_mkdir -c1 $DIR/R8a/d
1036         test_mkdir -c1 $DIR/R8b/e
1037         mrename $DIR/R8a/d $DIR/R8b/e
1038         $CHECKSTAT -a $DIR/R8a/d || error "$DIR/R8a/d exists"
1039         $CHECKSTAT -t dir $DIR/R8b/e || error "$DIR/R8b/e not dir type"
1040 }
1041 run_test 24h "mkdir .../R8{a,b}/{d,e}; rename .../R8a/d .../R8b/e"
1042
1043 test_24i() {
1044         echo "-- rename error cases"
1045         test_mkdir $DIR/R9
1046         test_mkdir $DIR/R9/a
1047         touch $DIR/R9/f
1048         mrename $DIR/R9/f $DIR/R9/a
1049         $CHECKSTAT -t file $DIR/R9/f || error "$DIR/R9/f not file type"
1050         $CHECKSTAT -t dir  $DIR/R9/a || error "$DIR/R9/a not dir type"
1051         $CHECKSTAT -a $DIR/R9/a/f || error "$DIR/R9/a/f exists"
1052 }
1053 run_test 24i "rename file to dir error: touch f ; mkdir a ; rename f a"
1054
1055 test_24j() {
1056         test_mkdir $DIR/R10
1057         mrename $DIR/R10/f $DIR/R10/g
1058         $CHECKSTAT -t dir $DIR/R10 || error "$DIR/R10 not dir type"
1059         $CHECKSTAT -a $DIR/R10/f || error "$DIR/R10/f exists"
1060         $CHECKSTAT -a $DIR/R10/g || error "$DIR/R10/g exists"
1061 }
1062 run_test 24j "source does not exist ============================"
1063
1064 test_24k() {
1065         test_mkdir $DIR/R11a
1066         test_mkdir $DIR/R11a/d
1067         touch $DIR/R11a/f
1068         mv $DIR/R11a/f $DIR/R11a/d
1069         $CHECKSTAT -a $DIR/R11a/f || error "$DIR/R11a/f exists"
1070         $CHECKSTAT -t file $DIR/R11a/d/f || error "$DIR/R11a/d/f not file type"
1071 }
1072 run_test 24k "touch .../R11a/f; mv .../R11a/f .../R11a/d ======="
1073
1074 # bug 2429 - rename foo foo foo creates invalid file
1075 test_24l() {
1076         f="$DIR/f24l"
1077         $MULTIOP $f OcNs || error "rename of ${f} to itself failed"
1078 }
1079 run_test 24l "Renaming a file to itself ========================"
1080
1081 test_24m() {
1082         f="$DIR/f24m"
1083         $MULTIOP $f OcLN ${f}2 ${f}2 || error "link ${f}2 ${f}2 failed"
1084         # on ext3 this does not remove either the source or target files
1085         # though the "expected" operation would be to remove the source
1086         $CHECKSTAT -t file ${f} || error "${f} missing"
1087         $CHECKSTAT -t file ${f}2 || error "${f}2 missing"
1088 }
1089 run_test 24m "Renaming a file to a hard link to itself ========="
1090
1091 test_24n() {
1092     f="$DIR/f24n"
1093     # this stats the old file after it was renamed, so it should fail
1094     touch ${f}
1095     $CHECKSTAT ${f} || error "${f} missing"
1096     mv ${f} ${f}.rename
1097     $CHECKSTAT ${f}.rename || error "${f}.rename missing"
1098     $CHECKSTAT -a ${f} || error "${f} exists"
1099 }
1100 run_test 24n "Statting the old file after renaming (Posix rename 2)"
1101
1102 test_24o() {
1103         test_mkdir $DIR/$tdir
1104         rename_many -s random -v -n 10 $DIR/$tdir
1105 }
1106 run_test 24o "rename of files during htree split"
1107
1108 test_24p() {
1109         test_mkdir $DIR/R12a
1110         test_mkdir $DIR/R12b
1111         DIRINO=`ls -lid $DIR/R12a | awk '{ print $1 }'`
1112         mrename $DIR/R12a $DIR/R12b
1113         $CHECKSTAT -a $DIR/R12a || error "$DIR/R12a exists"
1114         $CHECKSTAT -t dir $DIR/R12b || error "$DIR/R12b not dir type"
1115         DIRINO2=`ls -lid $DIR/R12b | awk '{ print $1 }'`
1116         [ "$DIRINO" = "$DIRINO2" ] || error "R12a $DIRINO != R12b $DIRINO2"
1117 }
1118 run_test 24p "mkdir .../R12{a,b}; rename .../R12a .../R12b"
1119
1120 cleanup_multiop_pause() {
1121         trap 0
1122         kill -USR1 $MULTIPID
1123 }
1124
1125 test_24q() {
1126         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1127
1128         test_mkdir $DIR/R13a
1129         test_mkdir $DIR/R13b
1130         local DIRINO=$(ls -lid $DIR/R13a | awk '{ print $1 }')
1131         multiop_bg_pause $DIR/R13b D_c || error "multiop failed to start"
1132         MULTIPID=$!
1133
1134         trap cleanup_multiop_pause EXIT
1135         mrename $DIR/R13a $DIR/R13b
1136         $CHECKSTAT -a $DIR/R13a || error "R13a still exists"
1137         $CHECKSTAT -t dir $DIR/R13b || error "R13b does not exist"
1138         local DIRINO2=$(ls -lid $DIR/R13b | awk '{ print $1 }')
1139         [ "$DIRINO" = "$DIRINO2" ] || error "R13a $DIRINO != R13b $DIRINO2"
1140         cleanup_multiop_pause
1141         wait $MULTIPID || error "multiop close failed"
1142 }
1143 run_test 24q "mkdir .../R13{a,b}; open R13b rename R13a R13b ==="
1144
1145 test_24r() { #bug 3789
1146         test_mkdir $DIR/R14a
1147         test_mkdir $DIR/R14a/b
1148         mrename $DIR/R14a $DIR/R14a/b && error "rename to subdir worked!"
1149         $CHECKSTAT -t dir $DIR/R14a || error "$DIR/R14a missing"
1150         $CHECKSTAT -t dir $DIR/R14a/b || error "$DIR/R14a/b missing"
1151 }
1152 run_test 24r "mkdir .../R14a/b; rename .../R14a .../R14a/b ====="
1153
1154 test_24s() {
1155         test_mkdir $DIR/R15a
1156         test_mkdir $DIR/R15a/b
1157         test_mkdir $DIR/R15a/b/c
1158         mrename $DIR/R15a $DIR/R15a/b/c && error "rename to sub-subdir worked!"
1159         $CHECKSTAT -t dir $DIR/R15a || error "$DIR/R15a missing"
1160         $CHECKSTAT -t dir $DIR/R15a/b/c || error "$DIR/R15a/b/c missing"
1161 }
1162 run_test 24s "mkdir .../R15a/b/c; rename .../R15a .../R15a/b/c ="
1163
1164 test_24t() {
1165         test_mkdir $DIR/R16a
1166         test_mkdir $DIR/R16a/b
1167         test_mkdir $DIR/R16a/b/c
1168         mrename $DIR/R16a/b/c $DIR/R16a && error "rename to sub-subdir worked!"
1169         $CHECKSTAT -t dir $DIR/R16a || error "$DIR/R16a missing"
1170         $CHECKSTAT -t dir $DIR/R16a/b/c || error "$DIR/R16a/b/c missing"
1171 }
1172 run_test 24t "mkdir .../R16a/b/c; rename .../R16a/b/c .../R16a ="
1173
1174 test_24u() { # bug12192
1175         $MULTIOP $DIR/$tfile C2w$((2048 * 1024))c || error "multiop failed"
1176         $CHECKSTAT -s $((2048 * 1024)) $DIR/$tfile || error "wrong file size"
1177 }
1178 run_test 24u "create stripe file"
1179
1180 simple_cleanup_common() {
1181         local createmany=$1
1182         local rc=0
1183
1184         [[ -z "$DIR" || -z "$tdir" || ! -d "$DIR/$tdir" ]] && return 0
1185
1186         local start=$SECONDS
1187
1188         [[ -n "$createmany" ]] && unlinkmany $DIR/$tdir/$tfile $createmany
1189         rm -rf $DIR/$tdir || error "cleanup $DIR/$tdir failed"
1190         rc=$?
1191         wait_delete_completed
1192         echo "cleanup time $((SECONDS - start))"
1193         return $rc
1194 }
1195
1196 max_pages_per_rpc() {
1197         local mdtname="$(printf "MDT%04x" ${1:-0})"
1198         $LCTL get_param -n mdc.*$mdtname*.max_pages_per_rpc
1199 }
1200
1201 test_24v() {
1202         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1203
1204         local nrfiles=${COUNT:-100000}
1205         local fname="$DIR/$tdir/$tfile"
1206
1207         # Performance issue on ZFS see LU-4072 (c.f. LU-2887)
1208         [ "$mds1_FSTYPE" = "zfs" ] && nrfiles=${COUNT:-10000}
1209
1210         test_mkdir "$(dirname $fname)"
1211         # assume MDT0000 has the fewest inodes
1212         local stripes=$($LFS getdirstripe -c $(dirname $fname))
1213         local free_inodes=$(($(mdt_free_inodes 0) * ${stripes/#0/1}))
1214         [[ $free_inodes -lt $nrfiles ]] && nrfiles=$free_inodes
1215
1216         stack_trap "simple_cleanup_common $nrfiles"
1217
1218         createmany -m "$fname" $nrfiles
1219
1220         cancel_lru_locks mdc
1221         lctl set_param mdc.*.stats clear
1222
1223         # was previously test_24D: LU-6101
1224         # readdir() returns correct number of entries after cursor reload
1225         local num_ls=$(ls $DIR/$tdir | wc -l)
1226         local num_uniq=$(ls $DIR/$tdir | sort -u | wc -l)
1227         local num_all=$(ls -a $DIR/$tdir | wc -l)
1228         if [ $num_ls -ne $nrfiles ] || [ $num_uniq -ne $nrfiles ] ||
1229                 [ $num_all -ne $((nrfiles + 2)) ]; then
1230                         error "Expected $nrfiles files, got $num_ls " \
1231                                 "($num_uniq unique $num_all .&..)"
1232         fi
1233         # LU-5 large readdir
1234         # dirent_size = 32 bytes for sizeof(struct lu_dirent) +
1235         #               N bytes for name (len($nrfiles) rounded to 8 bytes) +
1236         #               8 bytes for luda_type (4 bytes rounded to 8 bytes)
1237         # take into account of overhead in lu_dirpage header and end mark in
1238         # each page, plus one in rpc_num calculation.
1239         local dirent_size=$((32 + (${#tfile} | 7) + 1 + 8))
1240         local page_entries=$(((PAGE_SIZE - 24) / dirent_size))
1241         local mdt_idx=$($LFS getdirstripe -i $(dirname $fname))
1242         local rpc_pages=$(max_pages_per_rpc $mdt_idx)
1243         local rpc_max=$((nrfiles / (page_entries * rpc_pages) + stripes))
1244         local mds_readpage=$(calc_stats mdc.*.stats mds_readpage)
1245         echo "readpages: $mds_readpage rpc_max: $rpc_max-2/+1"
1246         (( $mds_readpage >= $rpc_max - 2 && $mds_readpage <= $rpc_max + 1)) ||
1247                 error "large readdir doesn't take effect: " \
1248                       "$mds_readpage should be about $rpc_max"
1249 }
1250 run_test 24v "list large directory (test hash collision, b=17560)"
1251
1252 test_24w() { # bug21506
1253         SZ1=234852
1254         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 seek=4096 || return 1
1255         dd if=/dev/zero bs=$SZ1 count=1 >> $DIR/$tfile || return 2
1256         dd if=$DIR/$tfile of=$DIR/${tfile}_left bs=1M skip=4097 || return 3
1257         SZ2=`ls -l $DIR/${tfile}_left | awk '{print $5}'`
1258         [[ "$SZ1" -eq "$SZ2" ]] ||
1259                 error "Error reading at the end of the file $tfile"
1260 }
1261 run_test 24w "Reading a file larger than 4Gb"
1262
1263 test_24x() {
1264         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
1265         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1266         [[ $MDS1_VERSION -lt $(version_code 2.7.56) ]] &&
1267                 skip "Need MDS version at least 2.7.56"
1268
1269         local MDTIDX=1
1270         local remote_dir=$DIR/$tdir/remote_dir
1271
1272         test_mkdir $DIR/$tdir
1273         $LFS mkdir -i $MDTIDX $remote_dir ||
1274                 error "create remote directory failed"
1275
1276         test_mkdir $DIR/$tdir/src_dir
1277         touch $DIR/$tdir/src_file
1278         test_mkdir $remote_dir/tgt_dir
1279         touch $remote_dir/tgt_file
1280
1281         mrename $DIR/$tdir/src_dir $remote_dir/tgt_dir ||
1282                 error "rename dir cross MDT failed!"
1283
1284         mrename $DIR/$tdir/src_file $remote_dir/tgt_file ||
1285                 error "rename file cross MDT failed!"
1286
1287         touch $DIR/$tdir/ln_file
1288         ln $DIR/$tdir/ln_file $remote_dir/ln_name ||
1289                 error "ln file cross MDT failed"
1290
1291         rm -rf $DIR/$tdir || error "Can not delete directories"
1292 }
1293 run_test 24x "cross MDT rename/link"
1294
1295 test_24y() {
1296         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
1297         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1298
1299         local remote_dir=$DIR/$tdir/remote_dir
1300         local mdtidx=1
1301
1302         test_mkdir $DIR/$tdir
1303         $LFS mkdir -i $mdtidx $remote_dir ||
1304                 error "create remote directory failed"
1305
1306         test_mkdir $remote_dir/src_dir
1307         touch $remote_dir/src_file
1308         test_mkdir $remote_dir/tgt_dir
1309         touch $remote_dir/tgt_file
1310
1311         mrename $remote_dir/src_dir $remote_dir/tgt_dir ||
1312                 error "rename subdir in the same remote dir failed!"
1313
1314         mrename $remote_dir/src_file $remote_dir/tgt_file ||
1315                 error "rename files in the same remote dir failed!"
1316
1317         ln $remote_dir/tgt_file $remote_dir/tgt_file1 ||
1318                 error "link files in the same remote dir failed!"
1319
1320         rm -rf $DIR/$tdir || error "Can not delete directories"
1321 }
1322 run_test 24y "rename/link on the same dir should succeed"
1323
1324 test_24z() {
1325         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
1326         [[ $MDS1_VERSION -lt $(version_code 2.12.51) ]] &&
1327                 skip "Need MDS version at least 2.12.51"
1328
1329         local index
1330
1331         for index in 0 1; do
1332                 $LFS mkdir -i $index $DIR/$tdir.$index || error "mkdir failed"
1333                 touch $DIR/$tdir.0/$tfile.$index || error "touch failed"
1334         done
1335
1336         mv $DIR/$tdir.0/$tfile.0 $DIR/$tdir.1 || error "mv $tfile.0 failed"
1337
1338         index=$($LFS getstripe -m $DIR/$tdir.1/$tfile.0)
1339         [ $index -eq 0 ] || error "$tfile.0 is on MDT$index"
1340
1341         local mdts=$(comma_list $(mdts_nodes))
1342
1343         do_nodes $mdts $LCTL set_param mdt.*.enable_remote_rename=0
1344         stack_trap "do_nodes $mdts $LCTL \
1345                 set_param mdt.*.enable_remote_rename=1" EXIT
1346
1347         mv $DIR/$tdir.0/$tfile.1 $DIR/$tdir.1 || error "mv $tfile.1 failed"
1348
1349         index=$($LFS getstripe -m $DIR/$tdir.1/$tfile.1)
1350         [ $index -eq 1 ] || error "$tfile.1 is on MDT$index"
1351 }
1352 run_test 24z "cross-MDT rename is done as cp"
1353
1354 test_24A() { # LU-3182
1355         local NFILES=5000
1356
1357         test_mkdir $DIR/$tdir
1358         stack_trap "simple_cleanup_common $NFILES"
1359         createmany -m $DIR/$tdir/$tfile $NFILES
1360         local t=$(ls $DIR/$tdir | wc -l)
1361         local u=$(ls $DIR/$tdir | sort -u | wc -l)
1362         local v=$(ls -ai $DIR/$tdir | sort -u | wc -l)
1363
1364         (( $t == $NFILES && $u == $NFILES && $v == NFILES + 2 )) ||
1365                 error "Expected $NFILES files, got $t ($u unique $v .&..)"
1366 }
1367 run_test 24A "readdir() returns correct number of entries."
1368
1369 test_24B() { # LU-4805
1370         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
1371
1372         local count
1373
1374         test_mkdir $DIR/$tdir
1375         $LFS setdirstripe -i0 -c$MDSCOUNT $DIR/$tdir/striped_dir/ ||
1376                 error "create striped dir failed"
1377
1378         count=$(ls -ai $DIR/$tdir/striped_dir | wc -l)
1379         [ $count -eq 2 ] || error "Expected 2, got $count"
1380
1381         touch $DIR/$tdir/striped_dir/a
1382
1383         count=$(ls -ai $DIR/$tdir/striped_dir | wc -l)
1384         [ $count -eq 3 ] || error "Expected 3, got $count"
1385
1386         touch $DIR/$tdir/striped_dir/.f
1387
1388         count=$(ls -ai $DIR/$tdir/striped_dir | wc -l)
1389         [ $count -eq 4 ] || error "Expected 4, got $count"
1390
1391         rm -rf $DIR/$tdir || error "Can not delete directories"
1392 }
1393 run_test 24B "readdir for striped dir return correct number of entries"
1394
1395 test_24C() {
1396         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
1397
1398         mkdir $DIR/$tdir
1399         mkdir $DIR/$tdir/d0
1400         mkdir $DIR/$tdir/d1
1401
1402         $LFS setdirstripe -i0 -c$MDSCOUNT $DIR/$tdir/d0/striped_dir ||
1403                 error "create striped dir failed"
1404
1405         cd $DIR/$tdir/d0/striped_dir
1406
1407         local d0_ino=$(ls -i -l -a $DIR/$tdir | grep "d0" | awk '{print $1}')
1408         local d1_ino=$(ls -i -l -a $DIR/$tdir | grep "d1" | awk '{print $1}')
1409         local parent_ino=$(ls -i -l -a | grep "\.\." | awk '{print $1}')
1410
1411         [ "$d0_ino" = "$parent_ino" ] ||
1412                 error ".. wrong, expect $d0_ino, get $parent_ino"
1413
1414         mv $DIR/$tdir/d0/striped_dir $DIR/$tdir/d1/ ||
1415                 error "mv striped dir failed"
1416
1417         parent_ino=$(ls -i -l -a | grep "\.\." | awk '{print $1}')
1418
1419         [ "$d1_ino" = "$parent_ino" ] ||
1420                 error ".. wrong after mv, expect $d1_ino, get $parent_ino"
1421 }
1422 run_test 24C "check .. in striped dir"
1423
1424 test_24E() {
1425         [[ $MDSCOUNT -lt 4 ]] && skip_env "needs >= 4 MDTs"
1426         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1427
1428         mkdir -p $DIR/$tdir
1429         mkdir $DIR/$tdir/src_dir
1430         $LFS mkdir -i 1 $DIR/$tdir/src_dir/src_child ||
1431                 error "create remote source failed"
1432
1433         touch $DIR/$tdir/src_dir/src_child/a
1434
1435         $LFS mkdir -i 2 $DIR/$tdir/tgt_dir ||
1436                 error "create remote target dir failed"
1437
1438         $LFS mkdir -i 3 $DIR/$tdir/tgt_dir/tgt_child ||
1439                 error "create remote target child failed"
1440
1441         mrename $DIR/$tdir/src_dir/src_child $DIR/$tdir/tgt_dir/tgt_child ||
1442                 error "rename dir cross MDT failed!"
1443
1444         find $DIR/$tdir
1445
1446         $CHECKSTAT -t dir $DIR/$tdir/src_dir/src_child &&
1447                 error "src_child still exists after rename"
1448
1449         $CHECKSTAT -t file $DIR/$tdir/tgt_dir/tgt_child/a ||
1450                 error "missing file(a) after rename"
1451
1452         rm -rf $DIR/$tdir || error "Can not delete directories"
1453 }
1454 run_test 24E "cross MDT rename/link"
1455
1456 test_24F () {
1457         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return 0
1458
1459         local repeats=1000
1460         [ "$SLOW" = "no" ] && repeats=100
1461
1462         mkdir -p $DIR/$tdir
1463
1464         echo "$repeats repeats"
1465         for ((i = 0; i < repeats; i++)); do
1466                 $LFS mkdir -i0 -c2 $DIR/$tdir/test || error "mkdir fails"
1467                 touch $DIR/$tdir/test/a || error "touch fails"
1468                 mkdir $DIR/$tdir/test/b || error "mkdir fails"
1469                 rm -rf $DIR/$tdir/test || error "rmdir fails"
1470         done
1471
1472         true
1473 }
1474 run_test 24F "hash order vs readdir (LU-11330)"
1475
1476 test_24G () {
1477         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
1478
1479         local ino1
1480         local ino2
1481
1482         $LFS mkdir -i 0 $DIR/$tdir-0 || error "mkdir $tdir-0"
1483         $LFS mkdir -i 1 $DIR/$tdir-1 || error "mkdir $tdir-1"
1484         touch $DIR/$tdir-0/f1 || error "touch f1"
1485         ln -s $DIR/$tdir-0/f1 $DIR/$tdir-0/s1 || error "ln s1"
1486         ino1=$(stat -c%i $DIR/$tdir-0/s1)
1487         mv $DIR/$tdir-0/s1 $DIR/$tdir-1 || error "mv s1"
1488         ino2=$(stat -c%i $DIR/$tdir-1/s1)
1489         [ $ino1 -ne $ino2 ] || error "s1 should be migrated"
1490 }
1491 run_test 24G "migrate symlink in rename"
1492
1493 test_24H() {
1494         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
1495         [[ $(hostname) != $(facet_active_host mds2) ]] ||
1496                 skip "MDT1 should be on another node"
1497
1498         test_mkdir -i 1 -c 1 $DIR/$tdir
1499 #define OBD_FAIL_FLD_QUERY_REQ           0x1103
1500         do_facet mds2 $LCTL set_param fail_loc=0x80001103
1501         touch $DIR/$tdir/$tfile || error "touch failed"
1502 }
1503 run_test 24H "repeat FLD_QUERY rpc"
1504
1505 test_25a() {
1506         echo '== symlink sanity ============================================='
1507
1508         test_mkdir $DIR/d25
1509         ln -s d25 $DIR/s25
1510         touch $DIR/s25/foo ||
1511                 error "File creation in symlinked directory failed"
1512 }
1513 run_test 25a "create file in symlinked directory ==============="
1514
1515 test_25b() {
1516         [ ! -d $DIR/d25 ] && test_25a
1517         $CHECKSTAT -t file $DIR/s25/foo || error "$DIR/s25/foo not file type"
1518 }
1519 run_test 25b "lookup file in symlinked directory ==============="
1520
1521 test_26a() {
1522         test_mkdir $DIR/d26
1523         test_mkdir $DIR/d26/d26-2
1524         ln -s d26/d26-2 $DIR/s26
1525         touch $DIR/s26/foo || error "File creation failed"
1526 }
1527 run_test 26a "multiple component symlink ======================="
1528
1529 test_26b() {
1530         test_mkdir -p $DIR/$tdir/d26-2
1531         ln -s $tdir/d26-2/foo $DIR/s26-2
1532         touch $DIR/s26-2 || error "File creation failed"
1533 }
1534 run_test 26b "multiple component symlink at end of lookup ======"
1535
1536 test_26c() {
1537         test_mkdir $DIR/d26.2
1538         touch $DIR/d26.2/foo
1539         ln -s d26.2 $DIR/s26.2-1
1540         ln -s s26.2-1 $DIR/s26.2-2
1541         ln -s s26.2-2 $DIR/s26.2-3
1542         chmod 0666 $DIR/s26.2-3/foo
1543 }
1544 run_test 26c "chain of symlinks"
1545
1546 # recursive symlinks (bug 439)
1547 test_26d() {
1548         ln -s d26-3/foo $DIR/d26-3
1549 }
1550 run_test 26d "create multiple component recursive symlink"
1551
1552 test_26e() {
1553         [ ! -h $DIR/d26-3 ] && test_26d
1554         rm $DIR/d26-3
1555 }
1556 run_test 26e "unlink multiple component recursive symlink"
1557
1558 # recursive symlinks (bug 7022)
1559 test_26f() {
1560         test_mkdir $DIR/$tdir
1561         test_mkdir $DIR/$tdir/$tfile
1562         cd $DIR/$tdir/$tfile           || error "cd $DIR/$tdir/$tfile failed"
1563         test_mkdir -p lndir/bar1
1564         test_mkdir $DIR/$tdir/$tfile/$tfile
1565         cd $tfile                || error "cd $tfile failed"
1566         ln -s .. dotdot          || error "ln dotdot failed"
1567         ln -s dotdot/lndir lndir || error "ln lndir failed"
1568         cd $DIR/$tdir                 || error "cd $DIR/$tdir failed"
1569         output=`ls $tfile/$tfile/lndir/bar1`
1570         [ "$output" = bar1 ] && error "unexpected output"
1571         rm -r $tfile             || error "rm $tfile failed"
1572         $CHECKSTAT -a $DIR/$tfile || error "$tfile not gone"
1573 }
1574 run_test 26f "rm -r of a directory which has recursive symlink"
1575
1576 test_27a() {
1577         test_mkdir $DIR/$tdir
1578         $LFS getstripe $DIR/$tdir
1579         $LFS setstripe -c 1 $DIR/$tdir/$tfile || error "setstripe failed"
1580         $CHECKSTAT -t file $DIR/$tdir/$tfile || error "checkstat failed"
1581         cp /etc/hosts $DIR/$tdir/$tfile || error "Can't copy to one stripe file"
1582 }
1583 run_test 27a "one stripe file"
1584
1585 test_27b() {
1586         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1587
1588         test_mkdir $DIR/$tdir
1589         $LFS setstripe -c 2 $DIR/$tdir/$tfile || error "setstripe failed"
1590         $LFS getstripe -c $DIR/$tdir/$tfile
1591         [ $($LFS getstripe -c $DIR/$tdir/$tfile) -eq 2 ] ||
1592                 error "two-stripe file doesn't have two stripes"
1593
1594         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=4k count=4 || error "dd failed"
1595 }
1596 run_test 27b "create and write to two stripe file"
1597
1598 # 27c family tests specific striping, setstripe -o
1599 test_27ca() {
1600         [[ $OSTCOUNT -lt 2 ]] && skip_env "skipping 2-stripe test"
1601         test_mkdir -p $DIR/$tdir
1602         local osts="1"
1603
1604         $LFS setstripe -o $osts $DIR/$tdir/$tfile  || error "setstripe failed"
1605         $LFS getstripe -i $DIR/$tdir/$tfile
1606         [ $($LFS getstripe -i $DIR/$tdir/$tfile ) -eq $osts ] ||
1607                 error "stripe not on specified OST"
1608
1609         dd if=/dev/zero of=$DIR/$tdir/$tfile  bs=1M count=4 || error "dd failed"
1610 }
1611 run_test 27ca "one stripe on specified OST"
1612
1613 test_27cb() {
1614         [[ $OSTCOUNT -lt 2 ]] && skip_env "skipping 2-stripe test"
1615         test_mkdir -p $DIR/$tdir
1616         local osts="1,0"
1617         $LFS setstripe -o $osts $DIR/$tdir/$tfile || error "setstripe failed"
1618         local getstripe=$($LFS getstripe $DIR/$tdir/$tfile)
1619         echo "$getstripe"
1620
1621         # Strip getstripe output to a space separated list of OSTs
1622         local getstripe_osts=$(echo "$getstripe" | sed -e '1,/obdidx/d' |\
1623                 awk '{print $1}' | tr '\n' ' ' | sed -e 's/[[:space:]]*$//')
1624         [ "$getstripe_osts" = "${osts//,/ }" ] ||
1625                 error "stripes not on specified OSTs"
1626
1627         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 || error "dd failed"
1628 }
1629 run_test 27cb "two stripes on specified OSTs"
1630
1631 test_27cc() {
1632         [[ $OSTCOUNT -lt 2 ]] && skip_env "skipping 2-stripe test"
1633         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
1634                 skip "server does not support overstriping"
1635
1636         test_mkdir -p $DIR/$tdir
1637         local osts="0,0"
1638         $LFS setstripe -o $osts $DIR/$tdir/$tfile || error "setstripe failed"
1639         local getstripe=$($LFS getstripe $DIR/$tdir/$tfile)
1640         echo "$getstripe"
1641
1642         # Strip getstripe output to a space separated list of OSTs
1643         local getstripe_osts=$(echo "$getstripe" | sed -e '1,/obdidx/d' |\
1644                 awk '{print $1}' | tr '\n' ' ' | sed -e 's/[[:space:]]*$//')
1645         [ "$getstripe_osts" = "${osts//,/ }" ] ||
1646                 error "stripes not on specified OSTs"
1647
1648         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 || error "dd failed"
1649 }
1650 run_test 27cc "two stripes on the same OST"
1651
1652 test_27cd() {
1653         [[ $OSTCOUNT -lt 2 ]] && skip_env "skipping 2-stripe test"
1654         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
1655                 skip "server does not support overstriping"
1656         test_mkdir -p $DIR/$tdir
1657         local osts="0,1,1,0"
1658         $LFS setstripe -o $osts $DIR/$tdir/$tfile || error "setstripe failed"
1659         local getstripe=$($LFS getstripe $DIR/$tdir/$tfile)
1660         echo "$getstripe"
1661
1662         # Strip getstripe output to a space separated list of OSTs
1663         local getstripe_osts=$(echo "$getstripe" | sed -e '1,/obdidx/d' |\
1664                 awk '{print $1}' | tr '\n' ' ' | sed -e 's/[[:space:]]*$//')
1665         [ "$getstripe_osts" = "${osts//,/ }" ] ||
1666                 error "stripes not on specified OSTs"
1667
1668         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 || error "dd failed"
1669 }
1670 run_test 27cd "four stripes on two OSTs"
1671
1672 test_27ce() {
1673         [[ $OSTCOUNT -ge $(($LOV_MAX_STRIPE_COUNT / 2)) ]] &&
1674                 skip_env "too many osts, skipping"
1675         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
1676                 skip "server does not support overstriping"
1677         # We do one more stripe than we have OSTs
1678         [ $OSTCOUNT -lt 159 ] || large_xattr_enabled ||
1679                 skip_env "ea_inode feature disabled"
1680
1681         test_mkdir -p $DIR/$tdir
1682         local osts=""
1683         for i in $(seq 0 $OSTCOUNT);
1684         do
1685                 osts=$osts"0"
1686                 if [ $i -ne $OSTCOUNT ]; then
1687                         osts=$osts","
1688                 fi
1689         done
1690         $LFS setstripe -o $osts $DIR/$tdir/$tfile || error "setstripe failed"
1691         local getstripe=$($LFS getstripe $DIR/$tdir/$tfile)
1692         echo "$getstripe"
1693
1694         # Strip getstripe output to a space separated list of OSTs
1695         local getstripe_osts=$(echo "$getstripe" | sed -e '1,/obdidx/d' |\
1696                 awk '{print $1}' | tr '\n' ' ' | sed -e 's/[[:space:]]*$//')
1697         [ "$getstripe_osts" = "${osts//,/ }" ] ||
1698                 error "stripes not on specified OSTs"
1699
1700         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 || error "dd failed"
1701 }
1702 run_test 27ce "more stripes than OSTs with -o"
1703
1704 test_27cf() {
1705         local osp_proc="osp.$FSNAME-OST0000-osc-MDT000*.active"
1706         local pid=0
1707
1708         test_mkdir -p $DIR/$tdir || error "failed to mkdir $DIR/$tdir"
1709         do_facet $SINGLEMDS "$LCTL set_param -n $osp_proc=0"
1710         stack_trap "do_facet $SINGLEMDS $LCTL set_param -n $osp_proc=1" EXIT
1711         wait_update_facet $SINGLEMDS "$LCTL get_param -n $osp_proc | grep 1" ||
1712                 error "failed to set $osp_proc=0"
1713
1714         $LFS setstripe -o 0 $DIR/$tdir/$tfile &
1715         pid=$!
1716         sleep 1
1717         do_facet $SINGLEMDS "$LCTL set_param -n $osp_proc=1"
1718         wait_update_facet $SINGLEMDS "$LCTL get_param -n $osp_proc | grep 0" ||
1719                 error "failed to set $osp_proc=1"
1720         wait $pid
1721         [[ $pid -ne 0 ]] ||
1722                 error "should return error due to $osp_proc=0"
1723 }
1724 run_test 27cf "'setstripe -o' on inactive OSTs should return error"
1725
1726 test_27cg() {
1727         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
1728                 skip "server does not support overstriping"
1729         [[ $mds1_FSTYPE != "ldiskfs" ]] && skip_env "ldiskfs only test"
1730         large_xattr_enabled || skip_env "ea_inode feature disabled"
1731
1732         local osts="0"
1733
1734         for ((i=1;i<1000;i++)); do
1735                 osts+=",$((i % OSTCOUNT))"
1736         done
1737
1738         local mdts=$(comma_list $(mdts_nodes))
1739         local before=$(do_nodes $mdts \
1740                 "$LCTL get_param -n osd-ldiskfs.*MDT*.stats" |
1741                 awk '/many credits/{print $3}' |
1742                 calc_sum)
1743
1744         $LFS setstripe -o $osts $DIR/$tfile || error "setstripe failed"
1745         $LFS getstripe $DIR/$tfile | grep stripe
1746
1747         rm -f $DIR/$tfile || error "can't unlink"
1748
1749         after=$(do_nodes $mdts \
1750                 "$LCTL get_param -n osd-ldiskfs.*MDT*.stats" |
1751                 awk '/many credits/{print $3}' |
1752                 calc_sum)
1753
1754         (( before == after )) ||
1755                 error "too many credits happened: $after > $before"
1756 }
1757 run_test 27cg "1000 shouldn't cause too many credits"
1758
1759 test_27d() {
1760         test_mkdir $DIR/$tdir
1761         $LFS setstripe -c 0 -i -1 -S 0 $DIR/$tdir/$tfile ||
1762                 error "setstripe failed"
1763         $CHECKSTAT -t file $DIR/$tdir/$tfile || error "checkstat failed"
1764         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=4k count=4 || error "dd failed"
1765 }
1766 run_test 27d "create file with default settings"
1767
1768 test_27e() {
1769         # LU-5839 adds check for existed layout before setting it
1770         [[ $MDS1_VERSION -lt $(version_code 2.7.56) ]] &&
1771                 skip "Need MDS version at least 2.7.56"
1772
1773         test_mkdir $DIR/$tdir
1774         $LFS setstripe -c 2 $DIR/$tdir/$tfile || error "setstripe failed"
1775         $LFS setstripe -c 2 $DIR/$tdir/$tfile && error "setstripe worked twice"
1776         $CHECKSTAT -t file $DIR/$tdir/$tfile || error "checkstat failed"
1777 }
1778 run_test 27e "setstripe existing file (should return error)"
1779
1780 test_27f() {
1781         test_mkdir $DIR/$tdir
1782         $LFS setstripe -S 100 -i 0 -c 1 $DIR/$tdir/$tfile &&
1783                 error "$LFS setstripe $DIR/$tdir/$tfile failed"
1784         $CHECKSTAT -t file $DIR/$tdir/$tfile &&
1785                 error "$CHECKSTAT -t file $DIR/$tdir/$tfile should fail"
1786         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=4k count=4 || error "dd failed"
1787         $LFS getstripe $DIR/$tdir/$tfile || error "$LFS getstripe failed"
1788 }
1789 run_test 27f "setstripe with bad stripe size (should return error)"
1790
1791 test_27g() {
1792         test_mkdir $DIR/$tdir
1793         $MCREATE $DIR/$tdir/$tfile || error "mcreate failed"
1794         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "no stripe info" ||
1795                 error "$DIR/$tdir/$tfile has object"
1796 }
1797 run_test 27g "$LFS getstripe with no objects"
1798
1799 test_27ga() {
1800         test_mkdir $DIR/$tdir
1801         touch $DIR/$tdir/$tfile || error "touch failed"
1802         ln -s bogus $DIR/$tdir/$tfile.2 || error "ln failed"
1803         $LFS getstripe -m $DIR/$tdir/$tfile $DIR/$tdir/$tfile.2
1804         local rc=$?
1805         (( rc == 2 )) || error "getstripe did not return ENOENT"
1806 }
1807 run_test 27ga "$LFS getstripe with missing file (should return error)"
1808
1809 test_27i() {
1810         test_mkdir $DIR/$tdir
1811         touch $DIR/$tdir/$tfile || error "touch failed"
1812         [[ $($LFS getstripe -c $DIR/$tdir/$tfile) -gt 0 ]] ||
1813                 error "missing objects"
1814 }
1815 run_test 27i "$LFS getstripe with some objects"
1816
1817 test_27j() {
1818         test_mkdir $DIR/$tdir
1819         $LFS setstripe -i $OSTCOUNT $DIR/$tdir/$tfile &&
1820                 error "setstripe failed" || true
1821 }
1822 run_test 27j "setstripe with bad stripe offset (should return error)"
1823
1824 test_27k() { # bug 2844
1825         test_mkdir $DIR/$tdir
1826         local file=$DIR/$tdir/$tfile
1827         local ll_max_blksize=$((4 * 1024 * 1024))
1828         $LFS setstripe -S 67108864 $file || error "setstripe failed"
1829         local blksize=$(stat $file | awk '/IO Block:/ { print $7 }')
1830         [ $blksize -le $ll_max_blksize ] || error "1:$blksize > $ll_max_blksize"
1831         dd if=/dev/zero of=$file bs=4k count=1
1832         blksize=$(stat $file | awk '/IO Block:/ { print $7 }')
1833         [ $blksize -le $ll_max_blksize ] || error "2:$blksize > $ll_max_blksize"
1834 }
1835 run_test 27k "limit i_blksize for broken user apps"
1836
1837 test_27l() {
1838         mcreate $DIR/$tfile || error "creating file"
1839         $RUNAS $LFS setstripe -c 1 $DIR/$tfile &&
1840                 error "setstripe should have failed" || true
1841 }
1842 run_test 27l "check setstripe permissions (should return error)"
1843
1844 test_27m() {
1845         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1846
1847         [ -n "$RCLIENTS" -o -n "$MOUNT_2" ] &&
1848                 skip_env "multiple clients -- skipping"
1849
1850         ORIGFREE=$($LCTL get_param -n lov.$FSNAME-clilov-*.kbytesavail |
1851                    head -n1)
1852         if [[ $ORIGFREE -gt $MAXFREE ]]; then
1853                 skip "$ORIGFREE > $MAXFREE skipping out-of-space test on OST0"
1854         fi
1855         stack_trap simple_cleanup_common
1856         test_mkdir $DIR/$tdir
1857         $LFS setstripe -i 0 -c 1 $DIR/$tdir/$tfile.1
1858         dd if=/dev/zero of=$DIR/$tdir/$tfile.1 bs=1024 count=$MAXFREE &&
1859                 error "dd should fill OST0"
1860         i=2
1861         while $LFS setstripe -i 0 -c 1 $DIR/$tdir/$tfile.$i; do
1862                 i=$((i + 1))
1863                 [ $i -gt 256 ] && break
1864         done
1865         i=$((i + 1))
1866         touch $DIR/$tdir/$tfile.$i
1867         [ $($LFS getstripe $DIR/$tdir/$tfile.$i | grep -A 10 obdidx |
1868             awk '{print $1}'| grep -w "0") ] &&
1869                 error "OST0 was full but new created file still use it"
1870         i=$((i + 1))
1871         touch $DIR/$tdir/$tfile.$i
1872         [ $($LFS getstripe $DIR/$tdir/$tfile.$i | grep -A 10 obdidx |
1873             awk '{print $1}'| grep -w "0") ] &&
1874                 error "OST0 was full but new created file still use it" || true
1875 }
1876 run_test 27m "create file while OST0 was full"
1877
1878 # OSCs keep a NOSPC flag that will be reset after ~5s (qos_maxage)
1879 # if the OST isn't full anymore.
1880 reset_enospc() {
1881         local ostidx=${1:-""}
1882         local delay
1883         local ready
1884         local get_prealloc
1885
1886         local list=$(comma_list $(osts_nodes))
1887         [ "$ostidx" ] && list=$(facet_host ost$((ostidx + 1)))
1888
1889         do_nodes $list lctl set_param fail_loc=0
1890         wait_delete_completed   # initiate all OST_DESTROYs from MDS to OST
1891         delay=$(do_facet $SINGLEMDS lctl get_param -n lov.*.qos_maxage |
1892                 awk '{print $1 * 2;exit;}')
1893         get_prealloc="$LCTL get_param -n osc.*MDT*.prealloc_status |
1894                         grep -v \"^0$\""
1895         wait_update_facet $SINGLEMDS "$get_prealloc" "" $delay
1896 }
1897
1898 test_27n() {
1899         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1900         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1901         remote_mds_nodsh && skip "remote MDS with nodsh"
1902         remote_ost_nodsh && skip "remote OST with nodsh"
1903
1904         reset_enospc
1905         rm -f $DIR/$tdir/$tfile
1906         exhaust_precreations 0 0x80000215
1907         $LFS setstripe -c -1 $DIR/$tdir || error "setstripe failed"
1908         touch $DIR/$tdir/$tfile || error "touch failed"
1909         $LFS getstripe $DIR/$tdir/$tfile
1910         reset_enospc
1911 }
1912 run_test 27n "create file with some full OSTs"
1913
1914 test_27o() {
1915         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1916         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1917         remote_mds_nodsh && skip "remote MDS with nodsh"
1918         remote_ost_nodsh && skip "remote OST with nodsh"
1919
1920         reset_enospc
1921         rm -f $DIR/$tdir/$tfile
1922         exhaust_all_precreations 0x215
1923
1924         touch $DIR/$tdir/$tfile && error "able to create $DIR/$tdir/$tfile"
1925
1926         reset_enospc
1927         rm -rf $DIR/$tdir/*
1928 }
1929 run_test 27o "create file with all full OSTs (should error)"
1930
1931 function create_and_checktime() {
1932         local fname=$1
1933         local loops=$2
1934         local i
1935
1936         for ((i=0; i < $loops; i++)); do
1937                 local start=$SECONDS
1938                 multiop $fname-$i Oc
1939                 ((SECONDS-start < TIMEOUT)) ||
1940                         error "creation took " $((SECONDS-$start)) && return 1
1941         done
1942 }
1943
1944 test_27oo() {
1945         local mdts=$(comma_list $(mdts_nodes))
1946
1947         [ $MDS1_VERSION -lt $(version_code 2.13.57) ] &&
1948                 skip "Need MDS version at least 2.13.57"
1949
1950         local f0=$DIR/${tfile}-0
1951         local f1=$DIR/${tfile}-1
1952
1953         wait_delete_completed
1954
1955         # refill precreated objects
1956         $LFS setstripe -i0 -c1 $f0
1957
1958         saved=$(do_facet mds1 $LCTL get_param -n lov.*0000*.qos_threshold_rr)
1959         # force QoS allocation policy
1960         do_nodes $mdts $LCTL set_param lov.*.qos_threshold_rr=0%
1961         stack_trap "do_nodes $mdts $LCTL set_param \
1962                 lov.*.qos_threshold_rr=$saved" EXIT
1963         sleep_maxage
1964
1965         # one OST is unavailable, but still have few objects preallocated
1966         stop ost1
1967         stack_trap "start ost1 $(ostdevname 1) $OST_MOUNT_OPTS; \
1968                 rm -rf $f1 $DIR/$tdir*" EXIT
1969
1970         for ((i=0; i < 7; i++)); do
1971                 mkdir $DIR/$tdir$i || error "can't create dir"
1972                 $LFS setstripe -c$((OSTCOUNT-1)) $DIR/$tdir$i ||
1973                         error "can't set striping"
1974         done
1975         for ((i=0; i < 7; i++)); do
1976                 create_and_checktime $DIR/$tdir$i/$tfile 100 &
1977         done
1978         wait
1979 }
1980 run_test 27oo "don't let few threads to reserve too many objects"
1981
1982 test_27p() {
1983         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
1984         [ $PARALLEL == "yes" ] && skip "skip parallel run"
1985         remote_mds_nodsh && skip "remote MDS with nodsh"
1986         remote_ost_nodsh && skip "remote OST with nodsh"
1987
1988         reset_enospc
1989         rm -f $DIR/$tdir/$tfile
1990         test_mkdir $DIR/$tdir
1991
1992         $MCREATE $DIR/$tdir/$tfile || error "mcreate failed"
1993         $TRUNCATE $DIR/$tdir/$tfile 80000000 || error "truncate failed"
1994         $CHECKSTAT -s 80000000 $DIR/$tdir/$tfile || error "checkstat failed"
1995
1996         exhaust_precreations 0 0x80000215
1997         echo foo >> $DIR/$tdir/$tfile || error "append failed"
1998         $CHECKSTAT -s 80000004 $DIR/$tdir/$tfile || error "checkstat failed"
1999         $LFS getstripe $DIR/$tdir/$tfile
2000
2001         reset_enospc
2002 }
2003 run_test 27p "append to a truncated file with some full OSTs"
2004
2005 test_27q() {
2006         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2007         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2008         remote_mds_nodsh && skip "remote MDS with nodsh"
2009         remote_ost_nodsh && skip "remote OST with nodsh"
2010
2011         reset_enospc
2012         rm -f $DIR/$tdir/$tfile
2013
2014         mkdir_on_mdt0 $DIR/$tdir
2015         $MCREATE $DIR/$tdir/$tfile || error "mcreate $DIR/$tdir/$tfile failed"
2016         $TRUNCATE $DIR/$tdir/$tfile 80000000 ||
2017                 error "truncate $DIR/$tdir/$tfile failed"
2018         $CHECKSTAT -s 80000000 $DIR/$tdir/$tfile || error "checkstat failed"
2019
2020         exhaust_all_precreations 0x215
2021
2022         echo foo >> $DIR/$tdir/$tfile && error "append succeeded"
2023         $CHECKSTAT -s 80000000 $DIR/$tdir/$tfile || error "checkstat 2 failed"
2024
2025         reset_enospc
2026 }
2027 run_test 27q "append to truncated file with all OSTs full (should error)"
2028
2029 test_27r() {
2030         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2031         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2032         remote_mds_nodsh && skip "remote MDS with nodsh"
2033         remote_ost_nodsh && skip "remote OST with nodsh"
2034
2035         reset_enospc
2036         rm -f $DIR/$tdir/$tfile
2037         exhaust_precreations 0 0x80000215
2038
2039         $LFS setstripe -i 0 -c 2 $DIR/$tdir/$tfile || error "setstripe failed"
2040
2041         reset_enospc
2042 }
2043 run_test 27r "stripe file with some full OSTs (shouldn't LBUG) ="
2044
2045 test_27s() { # bug 10725
2046         test_mkdir $DIR/$tdir
2047         local stripe_size=$((4096 * 1024 * 1024))       # 2^32
2048         local stripe_count=0
2049         [ $OSTCOUNT -eq 1 ] || stripe_count=2
2050         $LFS setstripe -S $stripe_size -c $stripe_count $DIR/$tdir &&
2051                 error "stripe width >= 2^32 succeeded" || true
2052
2053 }
2054 run_test 27s "lsm_xfersize overflow (should error) (bug 10725)"
2055
2056 test_27t() { # bug 10864
2057         WDIR=$(pwd)
2058         WLFS=$(which lfs)
2059         cd $DIR
2060         touch $tfile
2061         $WLFS getstripe $tfile
2062         cd $WDIR
2063 }
2064 run_test 27t "check that utils parse path correctly"
2065
2066 test_27u() { # bug 4900
2067         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2068         remote_mds_nodsh && skip "remote MDS with nodsh"
2069
2070         local index
2071         local list=$(comma_list $(mdts_nodes))
2072
2073 #define OBD_FAIL_MDS_OSC_PRECREATE      0x139
2074         do_nodes $list $LCTL set_param fail_loc=0x139
2075         test_mkdir -p $DIR/$tdir
2076         stack_trap "simple_cleanup_common 1000"
2077         createmany -o $DIR/$tdir/$tfile 1000
2078         do_nodes $list $LCTL set_param fail_loc=0
2079
2080         TLOG=$TMP/$tfile.getstripe
2081         $LFS getstripe $DIR/$tdir > $TLOG
2082         OBJS=$(awk -vobj=0 '($1 == 0) { obj += 1 } END { print obj; }' $TLOG)
2083         [[ $OBJS -gt 0 ]] &&
2084                 error "$OBJS objects created on OST-0. See $TLOG" ||
2085                 rm -f $TLOG
2086 }
2087 run_test 27u "skip object creation on OSC w/o objects"
2088
2089 test_27v() { # bug 4900
2090         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2091         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2092         remote_mds_nodsh && skip "remote MDS with nodsh"
2093         remote_ost_nodsh && skip "remote OST with nodsh"
2094
2095         exhaust_all_precreations 0x215
2096         reset_enospc
2097
2098         $LFS setstripe -c 1 $DIR/$tdir         # 1 stripe / file
2099
2100         touch $DIR/$tdir/$tfile
2101         #define OBD_FAIL_TGT_DELAY_PRECREATE     0x705
2102         # all except ost1
2103         for (( i=1; i < OSTCOUNT; i++ )); do
2104                 do_facet ost$i lctl set_param fail_loc=0x705
2105         done
2106         local START=`date +%s`
2107         createmany -o $DIR/$tdir/$tfile 32
2108
2109         local FINISH=`date +%s`
2110         local TIMEOUT=`lctl get_param -n timeout`
2111         local PROCESS=$((FINISH - START))
2112         [ $PROCESS -ge $((TIMEOUT / 2)) ] && \
2113                error "$FINISH - $START >= $TIMEOUT / 2"
2114         sleep $((TIMEOUT / 2 - PROCESS))
2115         reset_enospc
2116 }
2117 run_test 27v "skip object creation on slow OST"
2118
2119 test_27w() { # bug 10997
2120         test_mkdir $DIR/$tdir
2121         $LFS setstripe -S 65536 $DIR/$tdir/f0 || error "setstripe failed"
2122         [ $($LFS getstripe -S $DIR/$tdir/f0) -ne 65536 ] &&
2123                 error "stripe size $size != 65536" || true
2124         [ $($LFS getstripe -d $DIR/$tdir | grep -c "stripe_count") -eq 0 ] &&
2125                 error "$LFS getstripe -d $DIR/$tdir no 'stripe_count'" || true
2126 }
2127 run_test 27w "check $LFS setstripe -S and getstrip -d options"
2128
2129 test_27wa() {
2130         [[ $OSTCOUNT -lt 2 ]] &&
2131                 skip_env "skipping multiple stripe count/offset test"
2132
2133         test_mkdir $DIR/$tdir
2134         for i in $(seq 1 $OSTCOUNT); do
2135                 offset=$((i - 1))
2136                 $LFS setstripe -c $i -i $offset $DIR/$tdir/f$i ||
2137                         error "setstripe -c $i -i $offset failed"
2138                 count=$($LFS getstripe -c $DIR/$tdir/f$i)
2139                 index=$($LFS getstripe -i $DIR/$tdir/f$i)
2140                 [ $count -ne $i ] && error "stripe count $count != $i" || true
2141                 [ $index -ne $offset ] &&
2142                         error "stripe offset $index != $offset" || true
2143         done
2144 }
2145 run_test 27wa "check $LFS setstripe -c -i options"
2146
2147 test_27x() {
2148         remote_ost_nodsh && skip "remote OST with nodsh"
2149         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2150         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2151
2152         OFFSET=$(($OSTCOUNT - 1))
2153         OSTIDX=0
2154         local OST=$(ostname_from_index $OSTIDX)
2155
2156         test_mkdir $DIR/$tdir
2157         $LFS setstripe -c 1 $DIR/$tdir  # 1 stripe per file
2158         do_facet ost$((OSTIDX + 1)) lctl set_param -n obdfilter.$OST.degraded 1
2159         sleep_maxage
2160         createmany -o $DIR/$tdir/$tfile $OSTCOUNT
2161         for i in $(seq 0 $OFFSET); do
2162                 [ $($LFS getstripe $DIR/$tdir/$tfile$i | grep -A 10 obdidx |
2163                         awk '{print $1}' | grep -w "$OSTIDX") ] &&
2164                 error "OST0 was degraded but new created file still use it"
2165         done
2166         do_facet ost$((OSTIDX + 1)) lctl set_param -n obdfilter.$OST.degraded 0
2167 }
2168 run_test 27x "create files while OST0 is degraded"
2169
2170 test_27y() {
2171         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2172         remote_mds_nodsh && skip "remote MDS with nodsh"
2173         remote_ost_nodsh && skip "remote OST with nodsh"
2174         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2175
2176         local mdtosc=$(get_mdtosc_proc_path $SINGLEMDS $FSNAME-OST0000)
2177         local last_id=$(do_facet $SINGLEMDS lctl get_param -n \
2178                 osp.$mdtosc.prealloc_last_id)
2179         local next_id=$(do_facet $SINGLEMDS lctl get_param -n \
2180                 osp.$mdtosc.prealloc_next_id)
2181         local fcount=$((last_id - next_id))
2182         [[ $fcount -eq 0 ]] && skip "not enough space on OST0"
2183         [[ $fcount -gt $OSTCOUNT ]] && fcount=$OSTCOUNT
2184
2185         local MDS_OSCS=$(do_facet $SINGLEMDS lctl dl |
2186                          awk '/[oO][sS][cC].*md[ts]/ { print $4 }')
2187         local OST_DEACTIVE_IDX=-1
2188         local OSC
2189         local OSTIDX
2190         local OST
2191
2192         for OSC in $MDS_OSCS; do
2193                 OST=$(osc_to_ost $OSC)
2194                 OSTIDX=$(index_from_ostuuid $OST)
2195                 if [ $OST_DEACTIVE_IDX == -1 ]; then
2196                         OST_DEACTIVE_IDX=$OSTIDX
2197                 fi
2198                 if [ $OSTIDX != $OST_DEACTIVE_IDX ]; then
2199                         echo $OSC "is Deactivated:"
2200                         do_facet $SINGLEMDS lctl --device  %$OSC deactivate
2201                 fi
2202         done
2203
2204         OSTIDX=$(index_from_ostuuid $OST)
2205         test_mkdir $DIR/$tdir
2206         $LFS setstripe -c 1 $DIR/$tdir      # 1 stripe / file
2207
2208         for OSC in $MDS_OSCS; do
2209                 OST=$(osc_to_ost $OSC)
2210                 OSTIDX=$(index_from_ostuuid $OST)
2211                 if [ $OSTIDX == $OST_DEACTIVE_IDX ]; then
2212                         echo $OST "is degraded:"
2213                         do_facet ost$((OSTIDX+1)) lctl set_param -n \
2214                                                 obdfilter.$OST.degraded=1
2215                 fi
2216         done
2217
2218         sleep_maxage
2219         createmany -o $DIR/$tdir/$tfile $fcount
2220
2221         for OSC in $MDS_OSCS; do
2222                 OST=$(osc_to_ost $OSC)
2223                 OSTIDX=$(index_from_ostuuid $OST)
2224                 if [ $OSTIDX == $OST_DEACTIVE_IDX ]; then
2225                         echo $OST "is recovered from degraded:"
2226                         do_facet ost$((OSTIDX+1)) lctl set_param -n \
2227                                                 obdfilter.$OST.degraded=0
2228                 else
2229                         do_facet $SINGLEMDS lctl --device %$OSC activate
2230                 fi
2231         done
2232
2233         # all osp devices get activated, hence -1 stripe count restored
2234         local stripe_count=0
2235
2236         # sleep 2*lod_qos_maxage seconds waiting for lod qos to notice osp
2237         # devices get activated.
2238         sleep_maxage
2239         $LFS setstripe -c -1 $DIR/$tfile
2240         stripe_count=$($LFS getstripe -c $DIR/$tfile)
2241         rm -f $DIR/$tfile
2242         [ $stripe_count -ne $OSTCOUNT ] &&
2243                 error "Of $OSTCOUNT OSTs, only $stripe_count is available"
2244         return 0
2245 }
2246 run_test 27y "create files while OST0 is degraded and the rest inactive"
2247
2248 check_seq_oid()
2249 {
2250         log "check file $1"
2251
2252         lmm_count=$($LFS getstripe -c $1)
2253         lmm_seq=$($LFS getstripe -v $1 | awk '/lmm_seq/ { print $2 }')
2254         lmm_oid=$($LFS getstripe -v $1 | awk '/lmm_object_id/ { print $2 }')
2255
2256         local old_ifs="$IFS"
2257         IFS=$'[:]'
2258         fid=($($LFS path2fid $1))
2259         IFS="$old_ifs"
2260
2261         log "FID seq ${fid[1]}, oid ${fid[2]} ver ${fid[3]}"
2262         log "LOV seq $lmm_seq, oid $lmm_oid, count: $lmm_count"
2263
2264         # compare lmm_seq and lu_fid->f_seq
2265         [ $lmm_seq = ${fid[1]} ] || { error "SEQ mismatch"; return 1; }
2266         # compare lmm_object_id and lu_fid->oid
2267         [ $lmm_oid = ${fid[2]} ] || { error "OID mismatch"; return 2; }
2268
2269         # check the trusted.fid attribute of the OST objects of the file
2270         local have_obdidx=false
2271         local stripe_nr=0
2272         $LFS getstripe $1 | while read obdidx oid hex seq; do
2273                 # skip lines up to and including "obdidx"
2274                 [ -z "$obdidx" ] && break
2275                 [ "$obdidx" = "obdidx" ] && have_obdidx=true && continue
2276                 $have_obdidx || continue
2277
2278                 local ost=$((obdidx + 1))
2279                 local dev=$(ostdevname $ost)
2280                 local oid_hex
2281
2282                 log "want: stripe:$stripe_nr ost:$obdidx oid:$oid/$hex seq:$seq"
2283
2284                 seq=$(echo $seq | sed -e "s/^0x//g")
2285                 if [ $seq == 0 ] || [ $(facet_fstype ost$ost) == zfs ]; then
2286                         oid_hex=$(echo $oid)
2287                 else
2288                         oid_hex=$(echo $hex | sed -e "s/^0x//g")
2289                 fi
2290                 local obj_file="O/$seq/d$((oid %32))/$oid_hex"
2291
2292                 local ff=""
2293                 #
2294                 # Don't unmount/remount the OSTs if we don't need to do that.
2295                 # LU-2577 changes filter_fid to be smaller, so debugfs needs
2296                 # update too, until that use mount/ll_decode_filter_fid/mount.
2297                 # Re-enable when debugfs will understand new filter_fid.
2298                 #
2299                 if [ $(facet_fstype ost$ost) == ldiskfs ]; then
2300                         ff=$(do_facet ost$ost "$DEBUGFS -c -R 'stat $obj_file' \
2301                                 $dev 2>/dev/null" | grep "parent=")
2302                 fi
2303                 if [ -z "$ff" ]; then
2304                         stop ost$ost
2305                         mount_fstype ost$ost
2306                         ff=$(do_facet ost$ost $LL_DECODE_FILTER_FID \
2307                                 $(facet_mntpt ost$ost)/$obj_file)
2308                         unmount_fstype ost$ost
2309                         start ost$ost $dev $OST_MOUNT_OPTS
2310                         clients_up
2311                 fi
2312
2313                 [ -z "$ff" ] && error "$obj_file: no filter_fid info"
2314
2315                 echo "$ff" | sed -e 's#.*objid=#got: objid=#'
2316
2317                 # /mnt/O/0/d23/23: objid=23 seq=0 parent=[0x200000400:0x1e:0x1]
2318                 # fid: objid=23 seq=0 parent=[0x200000400:0x1e:0x0] stripe=1
2319                 #
2320                 # fid: parent=[0x200000400:0x1e:0x0] stripe=1 stripe_count=2 \
2321                 #       stripe_size=1048576 component_id=1 component_start=0 \
2322                 #       component_end=33554432
2323                 local ff_parent=$(sed -e 's/.*parent=.//' <<<$ff)
2324                 local ff_pseq=$(cut -d: -f1 <<<$ff_parent)
2325                 local ff_poid=$(cut -d: -f2 <<<$ff_parent)
2326                 local ff_pstripe
2327                 if grep -q 'stripe=' <<<$ff; then
2328                         ff_pstripe=$(sed -e 's/.*stripe=//' -e 's/ .*//' <<<$ff)
2329                 else
2330                         # $LL_DECODE_FILTER_FID does not print "stripe="; look
2331                         # into f_ver in this case.  See comment on ff_parent.
2332                         ff_pstripe=$(cut -d: -f3 <<<$ff_parent | sed -e 's/]//')
2333                 fi
2334
2335                 # compare lmm_seq and filter_fid->ff_parent.f_seq
2336                 [ $ff_pseq = $lmm_seq ] ||
2337                         error "FF parent SEQ $ff_pseq != $lmm_seq"
2338                 # compare lmm_object_id and filter_fid->ff_parent.f_oid
2339                 [ $ff_poid = $lmm_oid ] ||
2340                         error "FF parent OID $ff_poid != $lmm_oid"
2341                 (($ff_pstripe == $stripe_nr)) ||
2342                         error "FF stripe $ff_pstripe != $stripe_nr"
2343
2344                 stripe_nr=$((stripe_nr + 1))
2345                 [ $CLIENT_VERSION -lt $(version_code 2.9.55) ] &&
2346                         continue
2347                 if grep -q 'stripe_count=' <<<$ff; then
2348                         local ff_scnt=$(sed -e 's/.*stripe_count=//' \
2349                                             -e 's/ .*//' <<<$ff)
2350                         [ $lmm_count = $ff_scnt ] ||
2351                                 error "FF stripe count $lmm_count != $ff_scnt"
2352                 fi
2353         done
2354 }
2355
2356 test_27z() {
2357         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2358         remote_ost_nodsh && skip "remote OST with nodsh"
2359
2360         test_mkdir $DIR/$tdir
2361         $LFS setstripe -c 1 -i 0 -S 64k $DIR/$tdir/$tfile-1 ||
2362                 { error "setstripe -c -1 failed"; return 1; }
2363         # We need to send a write to every object to get parent FID info set.
2364         # This _should_ also work for setattr, but does not currently.
2365         # touch $DIR/$tdir/$tfile-1 ||
2366         dd if=/dev/zero of=$DIR/$tdir/$tfile-1 bs=1M count=1 ||
2367                 { error "dd $tfile-1 failed"; return 2; }
2368         $LFS setstripe -c -1 -i $((OSTCOUNT - 1)) -S 1M $DIR/$tdir/$tfile-2 ||
2369                 { error "setstripe -c -1 failed"; return 3; }
2370         dd if=/dev/zero of=$DIR/$tdir/$tfile-2 bs=1M count=$OSTCOUNT ||
2371                 { error "dd $tfile-2 failed"; return 4; }
2372
2373         # make sure write RPCs have been sent to OSTs
2374         sync; sleep 5; sync
2375
2376         check_seq_oid $DIR/$tdir/$tfile-1 || return 5
2377         check_seq_oid $DIR/$tdir/$tfile-2 || return 6
2378 }
2379 run_test 27z "check SEQ/OID on the MDT and OST filesystems"
2380
2381 test_27A() { # b=19102
2382         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2383
2384         save_layout_restore_at_exit $MOUNT
2385         $LFS setstripe -c 0 -i -1 -S 0 $MOUNT
2386         wait_update $HOSTNAME "$LFS getstripe -c $MOUNT | sed 's/  *//g'" "1" 20 ||
2387                 error "stripe count $($LFS getstripe -c $MOUNT) != 1"
2388         local default_size=$($LFS getstripe -S $MOUNT)
2389         local default_offset=$($LFS getstripe -i $MOUNT)
2390         local dsize=$(do_facet $SINGLEMDS \
2391                 "$LCTL get_param -n lod.$(facet_svc $SINGLEMDS)*.stripesize")
2392         [ $default_size -eq $dsize ] ||
2393                 error "stripe size $default_size != $dsize"
2394         [ $default_offset -eq -1 ] ||
2395                 error "stripe offset $default_offset != -1"
2396 }
2397 run_test 27A "check filesystem-wide default LOV EA values"
2398
2399 test_27B() { # LU-2523
2400         test_mkdir $DIR/$tdir
2401         rm -f $DIR/$tdir/f0 $DIR/$tdir/f1
2402         touch $DIR/$tdir/f0
2403         # open f1 with O_LOV_DELAY_CREATE
2404         # rename f0 onto f1
2405         # call setstripe ioctl on open file descriptor for f1
2406         # close
2407         multiop $DIR/$tdir/f1 oO_RDWR:O_CREAT:O_LOV_DELAY_CREATE:nB1c \
2408                 $DIR/$tdir/f0
2409
2410         rm -f $DIR/$tdir/f1
2411         # open f1 with O_LOV_DELAY_CREATE
2412         # unlink f1
2413         # call setstripe ioctl on open file descriptor for f1
2414         # close
2415         multiop $DIR/$tdir/f1 oO_RDWR:O_CREAT:O_LOV_DELAY_CREATE:uB1c
2416
2417         # Allow multiop to fail in imitation of NFS's busted semantics.
2418         true
2419 }
2420 run_test 27B "call setstripe on open unlinked file/rename victim"
2421
2422 # 27C family tests full striping and overstriping
2423 test_27Ca() { #LU-2871
2424         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2425
2426         declare -a ost_idx
2427         local index
2428         local found
2429         local i
2430         local j
2431
2432         test_mkdir $DIR/$tdir
2433         cd $DIR/$tdir
2434         for i in $(seq 0 $((OSTCOUNT - 1))); do
2435                 # set stripe across all OSTs starting from OST$i
2436                 $LFS setstripe -i $i -c -1 $tfile$i
2437                 # get striping information
2438                 ost_idx=($($LFS getstripe $tfile$i |
2439                          tail -n $((OSTCOUNT + 1)) | awk '{print $1}'))
2440                 echo "OST Index: ${ost_idx[*]}"
2441
2442                 # check the layout
2443                 [ ${#ost_idx[@]} -eq $OSTCOUNT ] ||
2444                         error "${#ost_idx[@]} != $OSTCOUNT"
2445
2446                 for index in $(seq 0 $((OSTCOUNT - 1))); do
2447                         found=0
2448                         for j in "${ost_idx[@]}"; do
2449                                 if [ $index -eq $j ]; then
2450                                         found=1
2451                                         break
2452                                 fi
2453                         done
2454                         [ $found = 1 ] ||
2455                                 error "Can not find $index in ${ost_idx[*]}"
2456                 done
2457         done
2458 }
2459 run_test 27Ca "check full striping across all OSTs"
2460
2461 test_27Cb() {
2462         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
2463                 skip "server does not support overstriping"
2464         [[ $OSTCOUNT -ge $(($LOV_MAX_STRIPE_COUNT / 2)) ]] &&
2465                 skip_env "too many osts, skipping"
2466
2467         test_mkdir -p $DIR/$tdir
2468         local setcount=$(($OSTCOUNT * 2))
2469         [ $setcount -lt 160 ] || large_xattr_enabled ||
2470                 skip_env "ea_inode feature disabled"
2471
2472         $LFS setstripe -C $setcount $DIR/$tdir/$tfile ||
2473                 error "setstripe failed"
2474
2475         local count=$($LFS getstripe -c $DIR/$tdir/$tfile)
2476         [ $count -eq $setcount ] ||
2477                 error "stripe count $count, should be $setcount"
2478
2479         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "overstriped" ||
2480                 error "overstriped should be set in pattern"
2481
2482         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 conv=notrunc ||
2483                 error "dd failed"
2484 }
2485 run_test 27Cb "more stripes than OSTs with -C"
2486
2487 test_27Cc() {
2488         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
2489                 skip "server does not support overstriping"
2490         [[ $OSTCOUNT -lt 2 ]] && skip_env "need > 1 OST"
2491
2492         test_mkdir -p $DIR/$tdir
2493         local setcount=$(($OSTCOUNT - 1))
2494
2495         [ $setcount -lt 160 ] || large_xattr_enabled ||
2496                 skip_env "ea_inode feature disabled"
2497
2498         $LFS setstripe -C $setcount $DIR/$tdir/$tfile ||
2499                 error "setstripe failed"
2500
2501         local count=$($LFS getstripe -c $DIR/$tdir/$tfile)
2502         [ $count -eq $setcount ] ||
2503                 error "stripe count $count, should be $setcount"
2504
2505         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "overstriped" &&
2506                 error "overstriped should not be set in pattern"
2507
2508         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 conv=notrunc ||
2509                 error "dd failed"
2510 }
2511 run_test 27Cc "fewer stripes than OSTs does not set overstriping"
2512
2513 test_27Cd() {
2514         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
2515                 skip "server does not support overstriping"
2516         [[ $OSTCOUNT -lt 2 ]] && skip_env "need > 1 OST"
2517         large_xattr_enabled || skip_env "ea_inode feature disabled"
2518
2519         force_new_seq_all
2520
2521         test_mkdir -p $DIR/$tdir
2522         local setcount=$LOV_MAX_STRIPE_COUNT
2523
2524         $LFS setstripe -C $setcount $DIR/$tdir/$tfile ||
2525                 error "setstripe failed"
2526
2527         local count=$($LFS getstripe -c $DIR/$tdir/$tfile)
2528         [ $count -eq $setcount ] ||
2529                 error "stripe count $count, should be $setcount"
2530
2531         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "overstriped" ||
2532                 error "overstriped should be set in pattern"
2533
2534         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 conv=notrunc ||
2535                 error "dd failed"
2536
2537         rm -f $DIR/$tdir/$tfile || error "Delete $tfile failed"
2538 }
2539 run_test 27Cd "test maximum stripe count"
2540
2541 test_27Ce() {
2542         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
2543                 skip "server does not support overstriping"
2544         test_mkdir -p $DIR/$tdir
2545
2546         pool_add $TESTNAME || error "Pool creation failed"
2547         pool_add_targets $TESTNAME 0 || error "pool_add_targets failed"
2548
2549         local setcount=8
2550
2551         $LFS setstripe  -C $setcount -p "$TESTNAME" $DIR/$tdir/$tfile ||
2552                 error "setstripe failed"
2553
2554         local count=$($LFS getstripe -c $DIR/$tdir/$tfile)
2555         [ $count -eq $setcount ] ||
2556                 error "stripe count $count, should be $setcount"
2557
2558         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "overstriped" ||
2559                 error "overstriped should be set in pattern"
2560
2561         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 conv=notrunc ||
2562                 error "dd failed"
2563
2564         rm -f $DIR/$tdir/$tfile || error "Delete $tfile failed"
2565 }
2566 run_test 27Ce "test pool with overstriping"
2567
2568 test_27Cf() {
2569         [[ $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ]] ||
2570                 skip "server does not support overstriping"
2571         [[ $OSTCOUNT -ge $(($LOV_MAX_STRIPE_COUNT / 2)) ]] &&
2572                 skip_env "too many osts, skipping"
2573
2574         test_mkdir -p $DIR/$tdir
2575
2576         local setcount=$(($OSTCOUNT * 2))
2577         [ $setcount -lt 160 ] || large_xattr_enabled ||
2578                 skip_env "ea_inode feature disabled"
2579
2580         $LFS setstripe  -C $setcount $DIR/$tdir/ ||
2581                 error "setstripe failed"
2582
2583         echo 1 > $DIR/$tdir/$tfile
2584
2585         local count=$($LFS getstripe -c $DIR/$tdir/$tfile)
2586         [ $count -eq $setcount ] ||
2587                 error "stripe count $count, should be $setcount"
2588
2589         $LFS getstripe $DIR/$tdir/$tfile 2>&1 | grep "overstriped" ||
2590                 error "overstriped should be set in pattern"
2591
2592         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=4 conv=notrunc ||
2593                 error "dd failed"
2594
2595         rm -f $DIR/$tdir/$tfile || error "Delete $tfile failed"
2596 }
2597 run_test 27Cf "test default inheritance with overstriping"
2598
2599 test_27Cg() {
2600         $LFS setstripe -o 0,$OSTCOUNT $DIR/$tfile
2601         [ $? -ne 0 ] || error "must be an error for not existent OST#"
2602 }
2603 run_test 27Cg "test setstripe with wrong OST idx"
2604
2605 test_27D() {
2606         [ $OSTCOUNT -lt 2 ] && skip_env "needs >= 2 OSTs"
2607         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
2608         remote_mds_nodsh && skip "remote MDS with nodsh"
2609
2610         local POOL=${POOL:-testpool}
2611         local first_ost=0
2612         local last_ost=$(($OSTCOUNT - 1))
2613         local ost_step=1
2614         local ost_list=$(seq $first_ost $ost_step $last_ost)
2615         local ost_range="$first_ost $last_ost $ost_step"
2616
2617         test_mkdir $DIR/$tdir
2618         pool_add $POOL || error "pool_add failed"
2619         pool_add_targets $POOL $ost_range || error "pool_add_targets failed"
2620
2621         local skip27D
2622         [ $MDS1_VERSION -lt $(version_code 2.8.55) ] &&
2623                 skip27D+="-s 29"
2624         [ $MDS1_VERSION -lt $(version_code 2.9.55) ] ||
2625                 [ $CLIENT_VERSION -lt $(version_code 2.9.55) ] &&
2626                         skip27D+=" -s 30,31"
2627         [[ ! $($LCTL get_param mdc.*.import) =~ connect_flags.*overstriping ||
2628           $OSTCOUNT -ge $(($LOV_MAX_STRIPE_COUNT / 2)) ]] &&
2629                 skip27D+=" -s 32,33"
2630         [[ $MDS_VERSION -lt $(version_code $SEL_VER) ]] &&
2631                 skip27D+=" -s 34"
2632         llapi_layout_test -d$DIR/$tdir -p$POOL -o$OSTCOUNT $skip27D ||
2633                 error "llapi_layout_test failed"
2634
2635         destroy_test_pools || error "destroy test pools failed"
2636 }
2637 run_test 27D "validate llapi_layout API"
2638
2639 # Verify that default_easize is increased from its initial value after
2640 # accessing a widely striped file.
2641 test_27E() {
2642         [ $OSTCOUNT -lt 2 ] && skip_env "needs >= 2 OSTs"
2643         [ $CLIENT_VERSION -lt $(version_code 2.5.57) ] &&
2644                 skip "client does not have LU-3338 fix"
2645
2646         # 72 bytes is the minimum space required to store striping
2647         # information for a file striped across one OST:
2648         # (sizeof(struct lov_user_md_v3) +
2649         #  sizeof(struct lov_user_ost_data_v1))
2650         local min_easize=72
2651         $LCTL set_param -n llite.*.default_easize $min_easize ||
2652                 error "lctl set_param failed"
2653         local easize=$($LCTL get_param -n llite.*.default_easize)
2654
2655         [ $easize -eq $min_easize ] ||
2656                 error "failed to set default_easize"
2657
2658         $LFS setstripe -c $OSTCOUNT $DIR/$tfile ||
2659                 error "setstripe failed"
2660         # In order to ensure stat() call actually talks to MDS we need to
2661         # do something drastic to this file to shake off all lock, e.g.
2662         # rename it (kills lookup lock forcing cache cleaning)
2663         mv $DIR/$tfile $DIR/${tfile}-1
2664         ls -l $DIR/${tfile}-1
2665         rm $DIR/${tfile}-1
2666
2667         easize=$($LCTL get_param -n llite.*.default_easize)
2668
2669         [ $easize -gt $min_easize ] ||
2670                 error "default_easize not updated"
2671 }
2672 run_test 27E "check that default extended attribute size properly increases"
2673
2674 test_27F() { # LU-5346/LU-7975
2675         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2676         [[ $OSTCOUNT -lt 2 ]] && skip "needs >= 2 OSTs"
2677         [[ $MDS1_VERSION -lt $(version_code 2.8.51) ]] &&
2678                 skip "Need MDS version at least 2.8.51"
2679         remote_ost_nodsh && skip "remote OST with nodsh"
2680
2681         test_mkdir $DIR/$tdir
2682         rm -f $DIR/$tdir/f0
2683         $LFS setstripe -c 2 $DIR/$tdir
2684
2685         # stop all OSTs to reproduce situation for LU-7975 ticket
2686         for num in $(seq $OSTCOUNT); do
2687                 stop ost$num
2688         done
2689
2690         # open/create f0 with O_LOV_DELAY_CREATE
2691         # truncate f0 to a non-0 size
2692         # close
2693         multiop $DIR/$tdir/f0 oO_RDWR:O_CREAT:O_LOV_DELAY_CREATE:T1050000c
2694
2695         $CHECKSTAT -s 1050000 $DIR/$tdir/f0 || error "checkstat failed"
2696         # open/write it again to force delayed layout creation
2697         cat /etc/hosts > $DIR/$tdir/f0 &
2698         catpid=$!
2699
2700         # restart OSTs
2701         for num in $(seq $OSTCOUNT); do
2702                 start ost$num $(ostdevname $num) $OST_MOUNT_OPTS ||
2703                         error "ost$num failed to start"
2704         done
2705
2706         wait $catpid || error "cat failed"
2707
2708         cmp /etc/hosts $DIR/$tdir/f0 || error "cmp failed"
2709         [[ $($LFS getstripe -c $DIR/$tdir/f0) == 2 ]] ||
2710                 error "wrong stripecount"
2711
2712 }
2713 run_test 27F "Client resend delayed layout creation with non-zero size"
2714
2715 test_27G() { #LU-10629
2716         [ $MDS1_VERSION -lt $(version_code 2.11.51) ] &&
2717                 skip "Need MDS version at least 2.11.51"
2718         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
2719         remote_mds_nodsh && skip "remote MDS with nodsh"
2720         local POOL=${POOL:-testpool}
2721         local ostrange="0 0 1"
2722
2723         test_mkdir $DIR/$tdir
2724         touch $DIR/$tdir/$tfile.nopool
2725         pool_add $POOL || error "pool_add failed"
2726         pool_add_targets $POOL $ostrange || error "pool_add_targets failed"
2727         $LFS setstripe -p $POOL $DIR/$tdir
2728
2729         local pool=$($LFS getstripe -p $DIR/$tdir)
2730
2731         [ "$pool" = "$POOL" ] || error "Striping failed got '$pool' not '$POOL'"
2732         touch $DIR/$tdir/$tfile.default
2733         $LFS setstripe -E 1M --pool $POOL -c 1 -E eof -c 1 $DIR/$tdir/$tfile.pfl
2734         $LFS find $DIR/$tdir -type f --pool $POOL
2735         local found=$($LFS find $DIR/$tdir -type f --pool $POOL | wc -l)
2736         [[ "$found" == "2" ]] ||
2737                 error "found $found != 2 files in '$DIR/$tdir' in '$POOL'"
2738
2739         $LFS setstripe -d $DIR/$tdir
2740
2741         pool=$($LFS getstripe -p -d $DIR/$tdir)
2742
2743         [[ "$pool" != "$POOL" ]] || error "$DIR/$tdir is still '$pool'"
2744 }
2745 run_test 27G "Clear OST pool from stripe"
2746
2747 test_27H() {
2748         [[ $MDS1_VERSION -le $(version_code 2.11.54) ]] &&
2749                 skip "Need MDS version newer than 2.11.54"
2750         [[ $OSTCOUNT -lt 3 ]] && skip_env "needs >= 3 OSTs"
2751         test_mkdir $DIR/$tdir
2752         $LFS setstripe -o 0 -o 2 $DIR/$tdir || error "setstripe failed"
2753         touch $DIR/$tdir/$tfile
2754         $LFS getstripe -c $DIR/$tdir/$tfile
2755         [ $($LFS getstripe -c $DIR/$tdir/$tfile) -eq 2 ] ||
2756                 error "two-stripe file doesn't have two stripes"
2757
2758         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=4k count=4 || error "dd failed"
2759         $LFS getstripe -y $DIR/$tdir/$tfile
2760         (( $($LFS getstripe -y $DIR/$tdir/$tfile |
2761              egrep -c "l_ost_idx: [02]$") == "2" )) ||
2762                 error "expected l_ost_idx: [02]$ not matched"
2763
2764         # make sure ost list has been cleared
2765         local stripesize=$($LFS getstripe -S $DIR/$tdir)
2766         $LFS setstripe -S $((stripesize * 4)) -i 1 \
2767                 -c $((OSTCOUNT - 1)) $DIR/$tdir || error "setstripe"
2768         touch $DIR/$tdir/f3
2769         $LVERIFY $DIR/$tdir $DIR/$tdir/f3 || error "lverify failed"
2770 }
2771 run_test 27H "Set specific OSTs stripe"
2772
2773 test_27I() {
2774         [ $PARALLEL == "yes" ] && skip "skip parallel run"
2775         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
2776         [[ $MDS1_VERSION -gt $(version_code 2.12.52) ]] ||
2777                 skip "Need MDS version newer than 2.12.52"
2778         local pool=$TESTNAME
2779         local ostrange="1 1 1"
2780
2781         save_layout_restore_at_exit $MOUNT
2782         $LFS setstripe -c 2 -i 0 $MOUNT
2783         pool_add $pool || error "pool_add failed"
2784         pool_add_targets $pool $ostrange ||
2785                 error "pool_add_targets failed"
2786         test_mkdir $DIR/$tdir
2787         $LFS setstripe -p $pool $DIR/$tdir
2788         $MULTIOP $DIR/$tdir/$tfile Oc || error "multiop failed"
2789         $LFS getstripe $DIR/$tdir/$tfile
2790 }
2791 run_test 27I "check that root dir striping does not break parent dir one"
2792
2793 test_27J() {
2794         [[ $MDS1_VERSION -le $(version_code 2.12.51) ]] &&
2795                 skip "Need MDS version newer than 2.12.51"
2796
2797         test_mkdir $DIR/$tdir
2798         local uuid1=$(cat /proc/sys/kernel/random/uuid)
2799         local uuid2=$(cat /proc/sys/kernel/random/uuid)
2800
2801         # create foreign file (raw way)
2802         ! $LFS setstripe --flags 0xda08 $DIR/$tdir/$tfile ||
2803                 error "creating $tfile w/ hex flags w/o --foreign should fail"
2804
2805         ! $LFS setstripe --foreign --flags foo \
2806                 --xattr ${uuid1}@${uuid2} $DIR/$tdir/$tfile ||
2807                         error "creating $tfile with '--flags foo' should fail"
2808
2809         ! $LFS setstripe --foreign --flags 0xffffffff \
2810                 --xattr ${uuid1}@${uuid2} $DIR/$tdir/$tfile ||
2811                         error "creating $tfile w/ 0xffffffff flags should fail"
2812
2813         create_foreign_file -f $DIR/$tdir/$tfile -x "${uuid1}@${uuid2}" \
2814                 -t 1 -F 0xda08 || error "create_foreign_file failed"
2815
2816         # verify foreign file (raw way)
2817         parse_foreign_file -f $DIR/$tdir/$tfile |
2818                 grep "lov_foreign_magic: 0x0BD70BD0" ||
2819                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign magic"
2820         parse_foreign_file -f $DIR/$tdir/$tfile | grep "lov_xattr_size: 89" ||
2821                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign size"
2822         parse_foreign_file -f $DIR/$tdir/$tfile |
2823                 grep "lov_foreign_size: 73" ||
2824                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign size"
2825         parse_foreign_file -f $DIR/$tdir/$tfile |
2826                 grep "lov_foreign_type: 1" ||
2827                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign type"
2828         parse_foreign_file -f $DIR/$tdir/$tfile |
2829                 grep "lov_foreign_flags: 0x0000DA08" ||
2830                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign flags"
2831         local lov=$(parse_foreign_file -f $DIR/$tdir/$tfile |
2832                 grep "lov_foreign_value: 0x" |
2833                 sed -e 's/lov_foreign_value: 0x//')
2834         local lov2=$(echo -n "${uuid1}@${uuid2}" | od -A n -t x1 -w160)
2835         [[ $lov = ${lov2// /} ]] ||
2836                 error "$DIR/$tdir/$tfile: invalid LOV EA foreign value"
2837
2838         # create foreign file (lfs + API)
2839         $LFS setstripe --foreign=none --flags 0xda08 \
2840                 -x "${uuid1}@${uuid2}" $DIR/$tdir/${tfile}2 ||
2841                 error "$DIR/$tdir/${tfile}2: create failed"
2842
2843         $LFS getstripe -v $DIR/$tdir/${tfile}2 |
2844                 grep "lfm_magic:.*0x0BD70BD0" ||
2845                 error "$DIR/$tdir/${tfile}2: invalid LOV EA foreign magic"
2846         # lfm_length is LOV EA size - sizeof(lfm_magic) - sizeof(lfm_length)
2847         $LFS getstripe -v $DIR/$tdir/${tfile}2 | grep "lfm_length:.*73" ||
2848                 error "$DIR/$tdir/${tfile}2: invalid LOV EA foreign size"
2849         $LFS getstripe -v $DIR/$tdir/${tfile}2 | grep "lfm_type:.*none" ||
2850                 error "$DIR/$tdir/${tfile}2: invalid LOV EA foreign type"
2851         $LFS getstripe -v $DIR/$tdir/${tfile}2 |
2852                 grep "lfm_flags:.*0x0000DA08" ||
2853                 error "$DIR/$tdir/${tfile}2: invalid LOV EA foreign flags"
2854         $LFS getstripe $DIR/$tdir/${tfile}2 |
2855                 grep "lfm_value:.*${uuid1}@${uuid2}" ||
2856                 error "$DIR/$tdir/${tfile}2: invalid LOV EA foreign value"
2857
2858         # modify striping should fail
2859         $LFS setstripe -c 2 $DIR/$tdir/$tfile &&
2860                 error "$DIR/$tdir/$tfile: setstripe should fail"
2861         $LFS setstripe -c 2 $DIR/$tdir/${tfile}2 &&
2862                 error "$DIR/$tdir/${tfile}2: setstripe should fail"
2863
2864         # R/W should fail
2865         cat $DIR/$tdir/$tfile && error "$DIR/$tdir/$tfile: read should fail"
2866         cat $DIR/$tdir/${tfile}2 &&
2867                 error "$DIR/$tdir/${tfile}2: read should fail"
2868         cat /etc/passwd > $DIR/$tdir/$tfile &&
2869                 error "$DIR/$tdir/$tfile: write should fail"
2870         cat /etc/passwd > $DIR/$tdir/${tfile}2 &&
2871                 error "$DIR/$tdir/${tfile}2: write should fail"
2872
2873         # chmod should work
2874         chmod 222 $DIR/$tdir/$tfile ||
2875                 error "$DIR/$tdir/$tfile: chmod failed"
2876         chmod 222 $DIR/$tdir/${tfile}2 ||
2877                 error "$DIR/$tdir/${tfile}2: chmod failed"
2878
2879         # chown should work
2880         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/$tfile ||
2881                 error "$DIR/$tdir/$tfile: chown failed"
2882         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/${tfile}2 ||
2883                 error "$DIR/$tdir/${tfile}2: chown failed"
2884
2885         # rename should work
2886         mv $DIR/$tdir/$tfile $DIR/$tdir/${tfile}.new ||
2887                 error "$DIR/$tdir/$tfile: rename of foreign file has failed"
2888         mv $DIR/$tdir/${tfile}2 $DIR/$tdir/${tfile}2.new ||
2889                 error "$DIR/$tdir/${tfile}2: rename of foreign file has failed"
2890
2891         #remove foreign file
2892         rm $DIR/$tdir/${tfile}.new ||
2893                 error "$DIR/$tdir/${tfile}.new: remove of foreign file has failed"
2894         rm $DIR/$tdir/${tfile}2.new ||
2895                 error "$DIR/$tdir/${tfile}2.new: remove of foreign file has failed"
2896 }
2897 run_test 27J "basic ops on file with foreign LOV"
2898
2899 test_27K() {
2900         [[ $MDS1_VERSION -le $(version_code 2.12.49) ]] &&
2901                 skip "Need MDS version newer than 2.12.49"
2902
2903         test_mkdir $DIR/$tdir
2904         local uuid1=$(cat /proc/sys/kernel/random/uuid)
2905         local uuid2=$(cat /proc/sys/kernel/random/uuid)
2906
2907         # create foreign dir (raw way)
2908         ! $LFS setdirstripe --flags 0xda08 $DIR/$tdir/$tdir ||
2909                 error "creating $tdir w/ hex flags w/o --foreign should fail"
2910
2911         ! $LFS setdirstripe --foreign --flags foo \
2912                 --xattr ${uuid1}@${uuid2} $DIR/$tdir/$tdir ||
2913                         error "creating $tdir with '--flags foo' should fail"
2914
2915         ! $LFS setdirstripe --foreign --flags 0xffffffff \
2916                 --xattr ${uuid1}@${uuid2} $DIR/$tdir/$tdir ||
2917                         error "creating $tdir w/ 0xffffffff flags should fail"
2918
2919         create_foreign_dir -d $DIR/$tdir/$tdir -x "${uuid1}@${uuid2}" -t 1 ||
2920                 error "create_foreign_dir FAILED"
2921
2922         # verify foreign dir (raw way)
2923         parse_foreign_dir -d $DIR/$tdir/$tdir |
2924                 grep "lmv_foreign_magic:.*0xcd50cd0" ||
2925                 error "$DIR/$tdir/$tfile: invalid LMV EA magic"
2926         parse_foreign_dir -d $DIR/$tdir/$tdir | grep "lmv_xattr_size:.*89$" ||
2927                 error "$DIR/$tdir/$tdir: invalid LMV EA size"
2928         parse_foreign_dir -d $DIR/$tdir/$tdir | grep "lmv_foreign_type: 1$" ||
2929                 error "$DIR/$tdir/$tdir: invalid LMV EA type"
2930         parse_foreign_dir -d $DIR/$tdir/$tdir |
2931                 grep "lmv_foreign_flags: 55813$" ||
2932                 error "$DIR/$tdir/$tdir: invalid LMV EA flags"
2933         local lmv=$(parse_foreign_dir -d $DIR/$tdir/$tdir |
2934                 grep "lmv_foreign_value: 0x" |
2935                 sed 's/lmv_foreign_value: 0x//')
2936         local lmv2=$(echo -n "${uuid1}@${uuid2}" | od -A n -t x1 -w160 |
2937                 sed 's/ //g')
2938         [[ $lmv == $lmv2 ]] || error "$DIR/$tdir/$tdir: invalid LMV EA value"
2939
2940         # create foreign dir (lfs + API)
2941         $LFS mkdir --foreign=none --xattr="${uuid1}@${uuid2}" --flags=0xda05 \
2942                 $DIR/$tdir/${tdir}2 ||
2943                 error "$DIR/$tdir/${tdir}2: create failed"
2944
2945         $LFS getdirstripe -v $DIR/$tdir/${tdir}2
2946
2947         $LFS getdirstripe -v $DIR/$tdir/${tdir}2 |
2948                 grep "lfm_magic:.*0x0CD50CD0" ||
2949                 error "$DIR/$tdir/${tdir}2: invalid LMV EA magic"
2950         # lfm_length is LMV EA size - sizeof(lfm_magic) - sizeof(lfm_length)
2951         # - sizeof(lfm_type) - sizeof(lfm_flags)
2952         $LFS getdirstripe -v $DIR/$tdir/${tdir}2 | grep "lfm_length:.*73" ||
2953                 error "$DIR/$tdir/${tdir}2: invalid LMV EA size"
2954         $LFS getdirstripe -v $DIR/$tdir/${tdir}2 | grep "lfm_type:.*none" ||
2955                 error "$DIR/$tdir/${tdir}2: invalid LMV EA type"
2956         $LFS getdirstripe -v $DIR/$tdir/${tdir}2 |
2957                 grep "lfm_flags:.*0x0000DA05" ||
2958                 error "$DIR/$tdir/${tdir}2: invalid LMV EA flags"
2959         $LFS getdirstripe $DIR/$tdir/${tdir}2 |
2960                 grep "lfm_value.*${uuid1}@${uuid2}" ||
2961                 error "$DIR/$tdir/${tdir}2: invalid LMV EA value"
2962
2963         # file create in dir should fail
2964         touch $DIR/$tdir/$tdir/$tfile && error "$DIR/$tdir: file create should fail"
2965         touch $DIR/$tdir/${tdir}2/$tfile &&
2966                 error "$DIR/${tdir}2: file create should fail"
2967
2968         # chmod should work
2969         chmod 777 $DIR/$tdir/$tdir ||
2970                 error "$DIR/$tdir: chmod failed"
2971         chmod 777 $DIR/$tdir/${tdir}2 ||
2972                 error "$DIR/${tdir}2: chmod failed"
2973
2974         # chown should work
2975         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/$tdir ||
2976                 error "$DIR/$tdir: chown failed"
2977         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/${tdir}2 ||
2978                 error "$DIR/${tdir}2: chown failed"
2979
2980         # rename should work
2981         mv $DIR/$tdir/$tdir $DIR/$tdir/${tdir}.new ||
2982                 error "$DIR/$tdir/$tdir: rename of foreign dir has failed"
2983         mv $DIR/$tdir/${tdir}2 $DIR/$tdir/${tdir}2.new ||
2984                 error "$DIR/$tdir/${tdir}2: rename of foreign dir has failed"
2985
2986         #remove foreign dir
2987         rmdir $DIR/$tdir/${tdir}.new ||
2988                 error "$DIR/$tdir/${tdir}.new: remove of foreign dir has failed"
2989         rmdir $DIR/$tdir/${tdir}2.new ||
2990                 error "$DIR/$tdir/${tdir}2.new: remove of foreign dir has failed"
2991 }
2992 run_test 27K "basic ops on dir with foreign LMV"
2993
2994 test_27L() {
2995         remote_mds_nodsh && skip "remote MDS with nodsh"
2996
2997         local POOL=${POOL:-$TESTNAME}
2998
2999         pool_add $POOL || error "pool_add failed"
3000
3001         lfs pool_list $MOUNT | grep -Fx "${FSNAME}.${POOL}" ||
3002                  error "pool_list does not contain ${FSNAME}.${POOL}:" \
3003                        "$(lfs pool_list $MOUNT | grep -F "${POOL}")"
3004 }
3005 run_test 27L "lfs pool_list gives correct pool name"
3006
3007 test_27M() {
3008         [[ $(lustre_version_code $SINGLEMDS) -lt $(version_code 2.12.57) ]] &&
3009                 skip "Need MDS version >= than 2.12.57"
3010         remote_mds_nodsh && skip "remote MDS with nodsh"
3011         [[ $OSTCOUNT -lt 2 ]] && skip_env "need > 1 OST"
3012
3013         # Set default striping on directory
3014         local setcount=4
3015         local stripe_opt
3016         local mdts=$(comma_list $(mdts_nodes))
3017
3018         # if we run against a 2.12 server which lacks overstring support
3019         # then the connect_flag will not report overstriping, even if client
3020         # is 2.14+
3021         if [[ $($LCTL get_param mdc.*.connect_flags) =~ overstriping ]]; then
3022                 stripe_opt="-C $setcount"
3023         elif (( $OSTCOUNT >= $setcount )); then
3024                 stripe_opt="-c $setcount"
3025         else
3026                 skip "server does not support overstriping"
3027         fi
3028
3029         test_mkdir $DIR/$tdir
3030
3031         # Validate existing append_* params and ensure restore
3032         local pool=$(do_facet mds1 $LCTL get_param -n mdd.$FSNAME-MDT0000.append_pool)
3033         [[ "$pool" == "" ]] || error "expected append_pool == '', got '$pool'"
3034         stack_trap "do_nodes $mdts $LCTL set_param mdd.*.append_pool=none"
3035
3036         local orig_count=$(do_facet mds1 $LCTL get_param -n mdd.$FSNAME-MDT0000.append_stripe_count)
3037         ((orig_count == 1)) || error "expected append_stripe_count == 1, got $orig_count"
3038         stack_trap "do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=1"
3039
3040         $LFS setstripe $stripe_opt $DIR/$tdir
3041
3042         echo 1 > $DIR/$tdir/${tfile}.1
3043         local count=$($LFS getstripe -c $DIR/$tdir/${tfile}.1)
3044         [ $count -eq $setcount ] ||
3045                 error "(1) stripe count $count, should be $setcount"
3046
3047         local appendcount=$orig_count
3048         echo 1 >> $DIR/$tdir/${tfile}.2_append
3049         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.2_append)
3050         [ $count -eq $appendcount ] ||
3051                 error "(2)stripe count $count, should be $appendcount for append"
3052
3053         # Disable O_APPEND striping, verify it works
3054         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=0
3055
3056         # Should now get the default striping, which is 4
3057         setcount=4
3058         echo 1 >> $DIR/$tdir/${tfile}.3_append
3059         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.3_append)
3060         [ $count -eq $setcount ] ||
3061                 error "(3) stripe count $count, should be $setcount"
3062
3063         # Try changing the stripe count for append files
3064         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=2
3065
3066         # Append striping is now 2 (directory default is still 4)
3067         appendcount=2
3068         echo 1 >> $DIR/$tdir/${tfile}.4_append
3069         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.4_append)
3070         [ $count -eq $appendcount ] ||
3071                 error "(4) stripe count $count, should be $appendcount for append"
3072
3073         # Test append stripe count of -1
3074         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=-1
3075         appendcount=$OSTCOUNT
3076         echo 1 >> $DIR/$tdir/${tfile}.5
3077         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.5)
3078         [ $count -eq $appendcount ] ||
3079                 error "(5) stripe count $count, should be $appendcount for append"
3080
3081         # Set append striping back to default of 1
3082         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=1
3083
3084         # Try a new default striping, PFL + DOM
3085         $LFS setstripe -L mdt -E 1M -E -1 -c 2 $DIR/$tdir
3086
3087         # Create normal DOM file, DOM returns stripe count == 0
3088         setcount=0
3089         touch $DIR/$tdir/${tfile}.6
3090         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.6)
3091         [ $count -eq $setcount ] ||
3092                 error "(6) stripe count $count, should be $setcount"
3093
3094         # Show
3095         appendcount=1
3096         echo 1 >> $DIR/$tdir/${tfile}.7_append
3097         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.7_append)
3098         [ $count -eq $appendcount ] ||
3099                 error "(7) stripe count $count, should be $appendcount for append"
3100
3101         # Clean up DOM layout
3102         $LFS setstripe -d $DIR/$tdir
3103
3104         save_layout_restore_at_exit $MOUNT
3105         # Now test that append striping works when layout is from root
3106         $LFS setstripe -c 2 $MOUNT
3107         # Make a special directory for this
3108         mkdir $DIR/${tdir}/${tdir}.2
3109
3110         # Verify for normal file
3111         setcount=2
3112         echo 1 > $DIR/${tdir}/${tdir}.2/${tfile}.8
3113         count=$($LFS getstripe -c $DIR/$tdir/${tdir}.2/${tfile}.8)
3114         [ $count -eq $setcount ] ||
3115                 error "(8) stripe count $count, should be $setcount"
3116
3117         appendcount=1
3118         echo 1 >> $DIR/${tdir}/${tdir}.2/${tfile}.9_append
3119         count=$($LFS getstripe -c $DIR/${tdir}/${tdir}.2/${tfile}.9_append)
3120         [ $count -eq $appendcount ] ||
3121                 error "(9) stripe count $count, should be $appendcount for append"
3122
3123         # Now test O_APPEND striping with pools
3124         pool_add $TESTNAME || error "pool creation failed"
3125         pool_add_targets $TESTNAME 0 1 || error "Pool add targets failed"
3126         do_nodes $mdts $LCTL set_param mdd.*.append_pool="$TESTNAME"
3127
3128         echo 1 >> $DIR/$tdir/${tfile}.10_append
3129
3130         pool=$($LFS getstripe -p $DIR/$tdir/${tfile}.10_append)
3131         [ "$pool" = "$TESTNAME" ] || error "(10) incorrect pool: $pool"
3132
3133         # Check that count is still correct
3134         appendcount=1
3135         echo 1 >> $DIR/$tdir/${tfile}.11_append
3136         count=$($LFS getstripe -c $DIR/$tdir/${tfile}.11_append)
3137         [ $count -eq $appendcount ] ||
3138                 error "(11) stripe count $count, should be $appendcount for append"
3139
3140         # Disable O_APPEND stripe count, verify pool works separately
3141         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=0
3142
3143         echo 1 >> $DIR/$tdir/${tfile}.12_append
3144
3145         pool=$($LFS getstripe -p $DIR/$tdir/${tfile}.12_append)
3146         [ "$pool" = "$TESTNAME" ] || error "(12) incorrect pool: $pool"
3147
3148         # Remove pool setting, verify it's not applied
3149         do_nodes $mdts $LCTL set_param mdd.*.append_pool='none'
3150
3151         echo 1 >> $DIR/$tdir/${tfile}.13_append
3152
3153         pool=$($LFS getstripe -p $DIR/$tdir/${tfile}.13_append)
3154         [ "$pool" = "" ] || error "(13) pool found: $pool"
3155 }
3156 run_test 27M "test O_APPEND striping"
3157
3158 test_27N() {
3159         combined_mgs_mds && skip "needs separate MGS/MDT"
3160
3161         pool_add $TESTNAME || error "pool_add failed"
3162         do_facet mgs "$LCTL pool_list $FSNAME" |
3163                 grep -Fx "${FSNAME}.${TESTNAME}" ||
3164                 error "lctl pool_list on MGS failed"
3165 }
3166 run_test 27N "lctl pool_list on separate MGS gives correct pool name"
3167
3168 clean_foreign_symlink() {
3169         trap 0
3170         lctl set_param llite/$FSNAME-*/foreign_symlink_enable=0
3171         for i in $DIR/$tdir/* ; do
3172                 $LFS unlink_foreign $i || true
3173         done
3174 }
3175
3176 test_27O() {
3177         [[ $(lustre_version_code $SINGLEMDS) -le $(version_code 2.12.51) ]] &&
3178                 skip "Need MDS version newer than 2.12.51"
3179
3180         test_mkdir $DIR/$tdir
3181         local uuid1=$(cat /proc/sys/kernel/random/uuid)
3182         local uuid2=$(cat /proc/sys/kernel/random/uuid)
3183
3184         trap clean_foreign_symlink EXIT
3185
3186         # enable foreign_symlink behaviour
3187         $LCTL set_param llite/$FSNAME-*/foreign_symlink_enable=1
3188
3189         # foreign symlink LOV format is a partial path by default
3190
3191         # create foreign file (lfs + API)
3192         $LFS setstripe --foreign=symlink --flags 0xda05 \
3193                 -x "${uuid1}/${uuid2}" --mode 0600 $DIR/$tdir/${tfile} ||
3194                 error "$DIR/$tdir/${tfile}: create failed"
3195
3196         $LFS getstripe -v $DIR/$tdir/${tfile} |
3197                 grep "lfm_magic:.*0x0BD70BD0" ||
3198                 error "$DIR/$tdir/${tfile}: invalid LOV EA foreign magic"
3199         $LFS getstripe -v $DIR/$tdir/${tfile} | grep "lfm_type:.*symlink" ||
3200                 error "$DIR/$tdir/${tfile}: invalid LOV EA foreign type"
3201         $LFS getstripe -v $DIR/$tdir/${tfile} |
3202                 grep "lfm_flags:.*0x0000DA05" ||
3203                 error "$DIR/$tdir/${tfile}: invalid LOV EA foreign flags"
3204         $LFS getstripe $DIR/$tdir/${tfile} |
3205                 grep "lfm_value:.*${uuid1}/${uuid2}" ||
3206                 error "$DIR/$tdir/${tfile}: invalid LOV EA foreign value"
3207
3208         # modify striping should fail
3209         $LFS setstripe -c 2 $DIR/$tdir/$tfile &&
3210                 error "$DIR/$tdir/$tfile: setstripe should fail"
3211
3212         # R/W should fail ("/{foreign_symlink_prefix}/${uuid1}/" missing)
3213         cat $DIR/$tdir/$tfile && error "$DIR/$tdir/$tfile: read should fail"
3214         cat /etc/passwd > $DIR/$tdir/$tfile &&
3215                 error "$DIR/$tdir/$tfile: write should fail"
3216
3217         # rename should succeed
3218         mv $DIR/$tdir/$tfile $DIR/$tdir/${tfile}.new ||
3219                 error "$DIR/$tdir/$tfile: rename has failed"
3220
3221         #remove foreign_symlink file should fail
3222         rm $DIR/$tdir/${tfile}.new &&
3223                 error "$DIR/$tdir/${tfile}.new: remove of foreign_symlink file should fail"
3224
3225         #test fake symlink
3226         mkdir /tmp/${uuid1} ||
3227                 error "/tmp/${uuid1}: mkdir has failed"
3228         echo FOOFOO > /tmp/${uuid1}/${uuid2} ||
3229                 error "/tmp/${uuid1}/${uuid2}: echo has failed"
3230         $LCTL set_param llite/$FSNAME-*/foreign_symlink_prefix=/tmp/
3231         $CHECKSTAT -t link -l /tmp/${uuid1}/${uuid2} $DIR/$tdir/${tfile}.new ||
3232                 error "$DIR/$tdir/${tfile}.new: not seen as a symlink"
3233         #read should succeed now
3234         cat $DIR/$tdir/${tfile}.new | grep FOOFOO ||
3235                 error "$DIR/$tdir/${tfile}.new: symlink resolution has failed"
3236         #write should succeed now
3237         cat /etc/passwd > $DIR/$tdir/${tfile}.new ||
3238                 error "$DIR/$tdir/${tfile}.new: write should succeed"
3239         diff /etc/passwd $DIR/$tdir/${tfile}.new ||
3240                 error "$DIR/$tdir/${tfile}.new: diff has failed"
3241         diff /etc/passwd /tmp/${uuid1}/${uuid2} ||
3242                 error "/tmp/${uuid1}/${uuid2}: diff has failed"
3243
3244         #check that getstripe still works
3245         $LFS getstripe $DIR/$tdir/${tfile}.new ||
3246                 error "$DIR/$tdir/${tfile}.new: getstripe should still work with foreign_symlink enabled"
3247
3248         # chmod should still succeed
3249         chmod 644 $DIR/$tdir/${tfile}.new ||
3250                 error "$DIR/$tdir/${tfile}.new: chmod has failed"
3251
3252         # chown should still succeed
3253         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/${tfile}.new ||
3254                 error "$DIR/$tdir/${tfile}.new: chown has failed"
3255
3256         # rename should still succeed
3257         mv $DIR/$tdir/${tfile}.new $DIR/$tdir/${tfile} ||
3258                 error "$DIR/$tdir/${tfile}.new: rename has failed"
3259
3260         #remove foreign_symlink file should still fail
3261         rm $DIR/$tdir/${tfile} &&
3262                 error "$DIR/$tdir/${tfile}: remove of foreign_symlink file should fail"
3263
3264         #use special ioctl() to unlink foreign_symlink file
3265         $LFS unlink_foreign $DIR/$tdir/${tfile} ||
3266                 error "$DIR/$tdir/$tfile: unlink/ioctl failed"
3267
3268 }
3269 run_test 27O "basic ops on foreign file of symlink type"
3270
3271 test_27P() {
3272         [[ $(lustre_version_code $SINGLEMDS) -le $(version_code 2.12.49) ]] &&
3273                 skip "Need MDS version newer than 2.12.49"
3274
3275         test_mkdir $DIR/$tdir
3276         local uuid1=$(cat /proc/sys/kernel/random/uuid)
3277         local uuid2=$(cat /proc/sys/kernel/random/uuid)
3278
3279         trap clean_foreign_symlink EXIT
3280
3281         # enable foreign_symlink behaviour
3282         $LCTL set_param llite/$FSNAME-*/foreign_symlink_enable=1
3283
3284         # foreign symlink LMV format is a partial path by default
3285
3286         # create foreign dir (lfs + API)
3287         $LFS mkdir --foreign=symlink --xattr="${uuid1}/${uuid2}" \
3288                 --flags=0xda05 --mode 0750 $DIR/$tdir/${tdir} ||
3289                 error "$DIR/$tdir/${tdir}: create failed"
3290
3291         $LFS getdirstripe -v $DIR/$tdir/${tdir}
3292
3293         $LFS getdirstripe -v $DIR/$tdir/${tdir} |
3294                 grep "lfm_magic:.*0x0CD50CD0" ||
3295                 error "$DIR/$tdir/${tdir}: invalid LMV EA magic"
3296         $LFS getdirstripe -v $DIR/$tdir/${tdir} | grep "lfm_type:.*symlink" ||
3297                 error "$DIR/$tdir/${tdir}: invalid LMV EA type"
3298         $LFS getdirstripe -v $DIR/$tdir/${tdir} |
3299                 grep "lfm_flags:.*0x0000DA05" ||
3300                 error "$DIR/$tdir/${tdir}: invalid LMV EA flags"
3301         $LFS getdirstripe $DIR/$tdir/${tdir} |
3302                 grep "lfm_value.*${uuid1}/${uuid2}" ||
3303                 error "$DIR/$tdir/${tdir}: invalid LMV EA value"
3304
3305         # file create in dir should fail
3306         # ("/{foreign_symlink_prefix}/${uuid1}/${uuid2}/" missing)
3307         touch $DIR/$tdir/$tdir/$tfile && error "$DIR/$tdir: file create should fail"
3308
3309         # rename should succeed
3310         mv $DIR/$tdir/$tdir $DIR/$tdir/${tdir}.new ||
3311                 error "$DIR/$tdir/$tdir: rename of foreign_symlink dir has failed"
3312
3313         #remove foreign_symlink dir should fail
3314         rmdir $DIR/$tdir/${tdir}.new &&
3315                 error "$DIR/$tdir/${tdir}.new: remove of foreign_symlink dir should fail"
3316
3317         #test fake symlink
3318         mkdir -p /tmp/${uuid1}/${uuid2} ||
3319                 error "/tmp/${uuid1}/${uuid2}: mkdir has failed"
3320         echo FOOFOO > /tmp/${uuid1}/${uuid2}/foo ||
3321                 error "/tmp/${uuid1}/${uuid2}/foo: echo has failed"
3322         $LCTL set_param llite/$FSNAME-*/foreign_symlink_prefix=/tmp/
3323         $CHECKSTAT -t link -l /tmp/${uuid1}/${uuid2} $DIR/$tdir/${tdir}.new ||
3324                 error "$DIR/$tdir/${tdir}.new: not seen as a symlink"
3325         cat $DIR/$tdir/${tdir}.new/foo | grep FOOFOO ||
3326                 error "$DIR/$tdir/${tdir}.new: symlink resolution has failed"
3327
3328         #check that getstripe fails now that foreign_symlink enabled
3329         $LFS getdirstripe $DIR/$tdir/${tdir}.new ||
3330                 error "$DIR/$tdir/${tdir}.new: getdirstripe should still work with foreign_symlink enabled"
3331
3332         # file create in dir should work now
3333         cp /etc/passwd $DIR/$tdir/${tdir}.new/$tfile ||
3334                 error "$DIR/$tdir/${tdir}.new/$tfile: file create should fail"
3335         diff /etc/passwd $DIR/$tdir/${tdir}.new/$tfile ||
3336                 error "$DIR/$tdir/${tdir}.new/$tfile: diff has failed"
3337         diff /etc/passwd /tmp/${uuid1}/${uuid2}/$tfile ||
3338                 error "/tmp/${uuid1}/${uuid2}/$tfile: diff has failed"
3339
3340         # chmod should still succeed
3341         chmod 755 $DIR/$tdir/${tdir}.new ||
3342                 error "$DIR/$tdir/${tdir}.new: chmod has failed"
3343
3344         # chown should still succeed
3345         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/${tdir}.new ||
3346                 error "$DIR/$tdir/${tdir}.new: chown has failed"
3347
3348         # rename should still succeed
3349         mv $DIR/$tdir/${tdir}.new $DIR/$tdir/${tdir} ||
3350                 error "$DIR/$tdir/${tdir}.new: rename of foreign_symlink dir has failed"
3351
3352         #remove foreign_symlink dir should still fail
3353         rmdir $DIR/$tdir/${tdir} &&
3354                 error "$DIR/$tdir/${tdir}: remove of foreign_symlink dir should fail"
3355
3356         #use special ioctl() to unlink foreign_symlink file
3357         $LFS unlink_foreign $DIR/$tdir/${tdir} ||
3358                 error "$DIR/$tdir/$tdir: unlink/ioctl failed"
3359
3360         #created file should still exist
3361         [[ -f /tmp/${uuid1}/${uuid2}/$tfile ]] ||
3362                 error "/tmp/${uuid1}/${uuid2}/$tfile has been removed"
3363         diff /etc/passwd /tmp/${uuid1}/${uuid2}/$tfile ||
3364                 error "/tmp/${uuid1}/${uuid2}/$tfile: diff has failed"
3365 }
3366 run_test 27P "basic ops on foreign dir of foreign_symlink type"
3367
3368 test_27Q() {
3369         rm -f $TMP/$tfile $TMP/$tfile.loop $TMP/$tfile.none $TMP/$tfile.broken
3370         stack_trap "rm -f $TMP/$tfile*"
3371
3372         test_mkdir $DIR/$tdir-1
3373         test_mkdir $DIR/$tdir-2
3374
3375         echo 'It is what it is' > $DIR/$tdir-1/$tfile
3376         lov_getstripe_old $DIR/$tdir-1/$tfile || error "$DIR/$tdir-1/$tfile: rc = $?"
3377
3378         ln -s $DIR/$tdir-1/$tfile $DIR/$tdir-2/$tfile
3379         lov_getstripe_old $DIR/$tdir-2/$tfile || error "$DIR/$tdir-2/$tfile: rc = $?"
3380
3381         ln -s $DIR/$tdir-1/$tfile $TMP/$tfile
3382         lov_getstripe_old $TMP/$tfile || error "$TMP/$tfile: rc = $?"
3383
3384         # Create some bad symlinks and ensure that we don't loop
3385         # forever or something. These should return ELOOP (40) and
3386         # ENOENT (2) but I don't want to test for that because there's
3387         # always some weirdo architecture that needs to ruin
3388         # everything by defining these error numbers differently.
3389
3390         ln -s $TMP/$tfile.loop $TMP/$tfile.loop
3391         lov_getstripe_old $TMP/$tfile.loop && error "$TMP/$tfile.loop: rc = $?"
3392
3393         ln -s $TMP/$tfile.none $TMP/$tfile.broken
3394         lov_getstripe_old $TMP/$tfile.broken && error "$TMP/$tfile.broken: rc = $?"
3395
3396         return 0
3397 }
3398 run_test 27Q "llapi_file_get_stripe() works on symlinks"
3399
3400 test_27R() {
3401         (( $MDS1_VERSION >= $(version_code 2.14.55) )) ||
3402                 skip "need MDS 2.14.55 or later"
3403         (( $OSTCOUNT >= 2 )) || skip_env "needs at least 2 OSTs"
3404
3405         local testdir="$DIR/$tdir"
3406         test_mkdir -p $testdir
3407         stack_trap "rm -rf $testdir"
3408         $LFS setstripe -c -1 $testdir || error "setstripe failed"
3409
3410         local f1="$testdir/f1"
3411         touch $f1 || error "failed to touch $f1"
3412         local count=$($LFS getstripe -c $f1)
3413         (( $count == $OSTCOUNT )) || error "wrong stripe count"
3414
3415         do_facet $SINGLEMDS $LCTL set_param lod.*.max_stripecount=-1
3416         (( $? == 34 )) || error "setting max_stripecount to -1 should fail and return ERANGE"
3417
3418         local maxcount=$(($OSTCOUNT - 1))
3419         local mdts=$(comma_list $(mdts_nodes))
3420         do_nodes $mdts $LCTL set_param lod.*.max_stripecount=$maxcount
3421         stack_trap "do_nodes $mdts $LCTL set_param lod.*.max_stripecount=0"
3422
3423         local f2="$testdir/f2"
3424         touch $f2 || error "failed to touch $f2"
3425         local count=$($LFS getstripe -c $f2)
3426         (( $count == $maxcount )) || error "wrong stripe count"
3427 }
3428 run_test 27R "test max_stripecount limitation when stripe count is set to -1"
3429
3430 test_27T() {
3431         [ $(facet_host client) == $(facet_host ost1) ] &&
3432                 skip "need ost1 and client on different nodes"
3433
3434 #define OBD_FAIL_OSC_NO_GRANT            0x411
3435         $LCTL set_param fail_loc=0x20000411 fail_val=1
3436 #define OBD_FAIL_OST_ENOSPC              0x215
3437         do_facet ost1 "$LCTL set_param fail_loc=0x80000215"
3438         $LFS setstripe -i 0 -c 1 $DIR/$tfile
3439         $MULTIOP $DIR/$tfile oO_WRONLY:P$((4 * 1024 * 1024 + 10 * 4096))c ||
3440                 error "multiop failed"
3441 }
3442 run_test 27T "no eio on close on partial write due to enosp"
3443
3444 test_27U() {
3445         local dir=$DIR/$tdir
3446         local file=$dir/$tfile
3447         local append_pool=${TESTNAME}-append
3448         local normal_pool=${TESTNAME}-normal
3449         local pool
3450         local stripe_count
3451         local stripe_count2
3452         local mdts=$(comma_list $(mdts_nodes))
3453
3454         (( $MDS1_VERSION >= $(version_code 2.15.51) )) ||
3455                 skip "Need MDS version at least 2.15.51 for append pool feature"
3456
3457         # Validate existing append_* params and ensure restore
3458         pool=$(do_facet mds1 $LCTL get_param -n mdd.$FSNAME-MDT0000.append_pool)
3459         [[ "$pool" == "" ]] || error "expected append_pool == '', got '$pool'"
3460         stack_trap "do_nodes $mdts $LCTL set_param mdd.*.append_pool=none"
3461
3462         stripe_count=$(do_facet mds1 $LCTL get_param -n mdd.$FSNAME-MDT0000.append_stripe_count)
3463         ((stripe_count == 1)) || error "expected append_stripe_count != 0, got $stripe_count"
3464         stack_trap "do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=$stripe_count"
3465
3466         pool_add $append_pool || error "pool creation failed"
3467         pool_add_targets $append_pool 0 1 || error "Pool add targets failed"
3468
3469         pool_add $normal_pool || error "pool creation failed"
3470         pool_add_targets $normal_pool 0 1 || error "Pool add targets failed"
3471
3472         test_mkdir $dir
3473         $LFS setstripe -E 1M -c 1 -p $normal_pool -E 2M -c 2 -p $normal_pool -E eof -c -1 $dir
3474
3475         echo XXX >> $file.1
3476         $LFS getstripe $file.1
3477
3478         pool=$($LFS getstripe -p $file.1)
3479         [[ "$pool" == "$normal_pool" ]] || error "got pool '$pool', expected '$normal_pool'"
3480
3481         stripe_count2=$($LFS getstripe -c $file.1)
3482         ((stripe_count2 == stripe_count)) ||
3483                 error "got stripe_count '$stripe_count2', expected '$stripe_count'"
3484
3485         do_nodes $mdts $LCTL set_param mdd.*.append_pool=$append_pool
3486
3487         echo XXX >> $file.2
3488         $LFS getstripe $file.2
3489
3490         pool=$($LFS getstripe -p $file.2)
3491         [[ "$pool" == "$append_pool" ]] || error "got pool '$pool', expected '$append_pool'"
3492
3493         do_nodes $mdts $LCTL set_param mdd.*.append_stripe_count=2
3494
3495         echo XXX >> $file.3
3496         $LFS getstripe $file.3
3497
3498         stripe_count2=$($LFS getstripe -c $file.3)
3499         ((stripe_count2 == 2)) || error "got stripe_count '$stripe_count2', expected 2"
3500 }
3501 run_test 27U "append pool and stripe count work with composite default layout"
3502
3503 # createtest also checks that device nodes are created and
3504 # then visible correctly (#2091)
3505 test_28() { # bug 2091
3506         test_mkdir $DIR/d28
3507         $CREATETEST $DIR/d28/ct || error "createtest failed"
3508 }
3509 run_test 28 "create/mknod/mkdir with bad file types ============"
3510
3511 test_29() {
3512         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3513
3514         [ $MDS1_VERSION -ge $(version_code 2.14.51) ] && {
3515                 disable_opencache
3516                 stack_trap "restore_opencache"
3517         }
3518
3519         sync; sleep 1; sync # flush out any dirty pages from previous tests
3520         cancel_lru_locks
3521         test_mkdir $DIR/d29
3522         touch $DIR/d29/foo
3523         log 'first d29'
3524         ls -l $DIR/d29
3525
3526         declare -i LOCKCOUNTORIG=0
3527         for lock_count in $(lctl get_param -n ldlm.namespaces.*mdc*.lock_count); do
3528                 let LOCKCOUNTORIG=$LOCKCOUNTORIG+$lock_count
3529         done
3530         [ $LOCKCOUNTORIG -eq 0 ] && error "No mdc lock count" && return 1
3531
3532         declare -i LOCKUNUSEDCOUNTORIG=0
3533         for unused_count in $(lctl get_param -n ldlm.namespaces.*mdc*.lock_unused_count); do
3534                 let LOCKUNUSEDCOUNTORIG=$LOCKUNUSEDCOUNTORIG+$unused_count
3535         done
3536
3537         log 'second d29'
3538         ls -l $DIR/d29
3539         log 'done'
3540
3541         declare -i LOCKCOUNTCURRENT=0
3542         for lock_count in $(lctl get_param -n ldlm.namespaces.*mdc*.lock_count); do
3543                 let LOCKCOUNTCURRENT=$LOCKCOUNTCURRENT+$lock_count
3544         done
3545
3546         declare -i LOCKUNUSEDCOUNTCURRENT=0
3547         for unused_count in $(lctl get_param -n ldlm.namespaces.*mdc*.lock_unused_count); do
3548                 let LOCKUNUSEDCOUNTCURRENT=$LOCKUNUSEDCOUNTCURRENT+$unused_count
3549         done
3550
3551         if [[ $LOCKCOUNTCURRENT -gt $LOCKCOUNTORIG ]]; then
3552                 $LCTL set_param -n ldlm.dump_namespaces ""
3553                 error "CURRENT: $LOCKCOUNTCURRENT > $LOCKCOUNTORIG"
3554                 $LCTL dk | sort -k4 -t: > $TMP/test_29.dk
3555                 log "dumped log to $TMP/test_29.dk (bug 5793)"
3556                 return 2
3557         fi
3558         if [[ $LOCKUNUSEDCOUNTCURRENT -gt $LOCKUNUSEDCOUNTORIG ]]; then
3559                 error "UNUSED: $LOCKUNUSEDCOUNTCURRENT > $LOCKUNUSEDCOUNTORIG"
3560                 $LCTL dk | sort -k4 -t: > $TMP/test_29.dk
3561                 log "dumped log to $TMP/test_29.dk (bug 5793)"
3562                 return 3
3563         fi
3564 }
3565 run_test 29 "IT_GETATTR regression  ============================"
3566
3567 test_30a() { # was test_30
3568         cp $(which ls) $DIR || cp /bin/ls $DIR
3569         $DIR/ls / || error "Can't execute binary from lustre"
3570         rm $DIR/ls
3571 }
3572 run_test 30a "execute binary from Lustre (execve) =============="
3573
3574 test_30b() {
3575         cp `which ls` $DIR || cp /bin/ls $DIR
3576         chmod go+rx $DIR/ls
3577         $RUNAS $DIR/ls / || error "Can't execute binary from lustre as non-root"
3578         rm $DIR/ls
3579 }
3580 run_test 30b "execute binary from Lustre as non-root ==========="
3581
3582 test_30c() { # b=22376
3583         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3584
3585         cp $(which ls) $DIR || cp /bin/ls $DIR
3586         chmod a-rw $DIR/ls
3587         cancel_lru_locks mdc
3588         cancel_lru_locks osc
3589         $RUNAS $DIR/ls / || error "Can't execute binary from lustre"
3590         rm -f $DIR/ls
3591 }
3592 run_test 30c "execute binary from Lustre without read perms ===="
3593
3594 test_30d() {
3595         cp $(which dd) $DIR || error "failed to copy dd to $DIR/dd"
3596
3597         for i in {1..10}; do
3598                 $DIR/dd bs=1M count=128 if=/dev/zero of=$DIR/$tfile &
3599                 local PID=$!
3600                 sleep 1
3601                 $LCTL set_param ldlm.namespaces.*MDT*.lru_size=clear
3602                 wait $PID || error "executing dd from Lustre failed"
3603                 rm -f $DIR/$tfile
3604         done
3605
3606         rm -f $DIR/dd
3607 }
3608 run_test 30d "execute binary from Lustre while clear locks"
3609
3610 test_31a() {
3611         $OPENUNLINK $DIR/f31 $DIR/f31 || error "openunlink failed"
3612         $CHECKSTAT -a $DIR/f31 || error "$DIR/f31 exists"
3613 }
3614 run_test 31a "open-unlink file =================================="
3615
3616 test_31b() {
3617         touch $DIR/f31 || error "touch $DIR/f31 failed"
3618         ln $DIR/f31 $DIR/f31b || error "ln failed"
3619         $MULTIOP $DIR/f31b Ouc || error "multiop failed"
3620         $CHECKSTAT -t file $DIR/f31 || error "$DIR/f31 not file type"
3621 }
3622 run_test 31b "unlink file with multiple links while open ======="
3623
3624 test_31c() {
3625         touch $DIR/f31 || error "touch $DIR/f31 failed"
3626         ln $DIR/f31 $DIR/f31c || error "ln failed"
3627         multiop_bg_pause $DIR/f31 O_uc ||
3628                 error "multiop_bg_pause for $DIR/f31 failed"
3629         MULTIPID=$!
3630         $MULTIOP $DIR/f31c Ouc
3631         kill -USR1 $MULTIPID
3632         wait $MULTIPID
3633 }
3634 run_test 31c "open-unlink file with multiple links ============="
3635
3636 test_31d() {
3637         opendirunlink $DIR/d31d $DIR/d31d || error "opendirunlink failed"
3638         $CHECKSTAT -a $DIR/d31d || error "$DIR/d31d exists"
3639 }
3640 run_test 31d "remove of open directory ========================="
3641
3642 test_31e() { # bug 2904
3643         openfilleddirunlink $DIR/d31e || error "openfilleddirunlink failed"
3644 }
3645 run_test 31e "remove of open non-empty directory ==============="
3646
3647 test_31f() { # bug 4554
3648         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3649
3650         set -vx
3651         test_mkdir $DIR/d31f
3652         $LFS setstripe -S 1048576 -c 1 $DIR/d31f
3653         cp /etc/hosts $DIR/d31f
3654         ls -l $DIR/d31f
3655         $LFS getstripe $DIR/d31f/hosts
3656         multiop_bg_pause $DIR/d31f D_c || return 1
3657         MULTIPID=$!
3658
3659         rm -rv $DIR/d31f || error "first of $DIR/d31f"
3660         test_mkdir $DIR/d31f
3661         $LFS setstripe -S 1048576 -c 1 $DIR/d31f
3662         cp /etc/hosts $DIR/d31f
3663         ls -l $DIR/d31f
3664         $LFS getstripe $DIR/d31f/hosts
3665         multiop_bg_pause $DIR/d31f D_c || return 1
3666         MULTIPID2=$!
3667
3668         kill -USR1 $MULTIPID || error "first opendir $MULTIPID not running"
3669         wait $MULTIPID || error "first opendir $MULTIPID failed"
3670
3671         sleep 6
3672
3673         kill -USR1 $MULTIPID2 || error "second opendir $MULTIPID not running"
3674         wait $MULTIPID2 || error "second opendir $MULTIPID2 failed"
3675         set +vx
3676 }
3677 run_test 31f "remove of open directory with open-unlink file ==="
3678
3679 test_31g() {
3680         echo "-- cross directory link --"
3681         test_mkdir -c1 $DIR/${tdir}ga
3682         test_mkdir -c1 $DIR/${tdir}gb
3683         touch $DIR/${tdir}ga/f
3684         ln $DIR/${tdir}ga/f $DIR/${tdir}gb/g
3685         $CHECKSTAT -t file $DIR/${tdir}ga/f || error "source"
3686         [ `stat -c%h $DIR/${tdir}ga/f` == '2' ] || error "source nlink"
3687         $CHECKSTAT -t file $DIR/${tdir}gb/g || error "target"
3688         [ `stat -c%h $DIR/${tdir}gb/g` == '2' ] || error "target nlink"
3689 }
3690 run_test 31g "cross directory link==============="
3691
3692 test_31h() {
3693         echo "-- cross directory link --"
3694         test_mkdir -c1 $DIR/${tdir}
3695         test_mkdir -c1 $DIR/${tdir}/dir
3696         touch $DIR/${tdir}/f
3697         ln $DIR/${tdir}/f $DIR/${tdir}/dir/g
3698         $CHECKSTAT -t file $DIR/${tdir}/f || error "source"
3699         [ `stat -c%h $DIR/${tdir}/f` == '2' ] || error "source nlink"
3700         $CHECKSTAT -t file $DIR/${tdir}/dir/g || error "target"
3701         [ `stat -c%h $DIR/${tdir}/dir/g` == '2' ] || error "target nlink"
3702 }
3703 run_test 31h "cross directory link under child==============="
3704
3705 test_31i() {
3706         echo "-- cross directory link --"
3707         test_mkdir -c1 $DIR/$tdir
3708         test_mkdir -c1 $DIR/$tdir/dir
3709         touch $DIR/$tdir/dir/f
3710         ln $DIR/$tdir/dir/f $DIR/$tdir/g
3711         $CHECKSTAT -t file $DIR/$tdir/dir/f || error "source"
3712         [ `stat -c%h $DIR/$tdir/dir/f` == '2' ] || error "source nlink"
3713         $CHECKSTAT -t file $DIR/$tdir/g || error "target"
3714         [ `stat -c%h $DIR/$tdir/g` == '2' ] || error "target nlink"
3715 }
3716 run_test 31i "cross directory link under parent==============="
3717
3718 test_31j() {
3719         test_mkdir -c1 -p $DIR/$tdir
3720         test_mkdir -c1 -p $DIR/$tdir/dir1
3721         ln $DIR/$tdir/dir1 $DIR/$tdir/dir2 && error "ln for dir"
3722         link $DIR/$tdir/dir1 $DIR/$tdir/dir3 && error "link for dir"
3723         mlink $DIR/$tdir/dir1 $DIR/$tdir/dir4 && error "mlink for dir"
3724         mlink $DIR/$tdir/dir1 $DIR/$tdir/dir1 && error "mlink to the same dir"
3725         return 0
3726 }
3727 run_test 31j "link for directory==============="
3728
3729 test_31k() {
3730         test_mkdir -c1 -p $DIR/$tdir
3731         touch $DIR/$tdir/s
3732         touch $DIR/$tdir/exist
3733         mlink $DIR/$tdir/s $DIR/$tdir/t || error "mlink"
3734         mlink $DIR/$tdir/s $DIR/$tdir/exist && error "mlink to exist file"
3735         mlink $DIR/$tdir/s $DIR/$tdir/s && error "mlink to the same file"
3736         mlink $DIR/$tdir/s $DIR/$tdir && error "mlink to parent dir"
3737         mlink $DIR/$tdir $DIR/$tdir/s && error "mlink parent dir to target"
3738         mlink $DIR/$tdir/not-exist $DIR/$tdir/foo && error "mlink non-existing to new"
3739         mlink $DIR/$tdir/not-exist $DIR/$tdir/s && error "mlink non-existing to exist"
3740         return 0
3741 }
3742 run_test 31k "link to file: the same, non-existing, dir==============="
3743
3744 test_31l() {
3745         local ln_ver=$(ln --version | awk '/coreutils/ { print $4 }')
3746
3747         (( $(version_code $ln_ver) < $(version_code 8.31) )) ||
3748         (( $(version_code $(uname -r)) >= $(version_code 5.18) )) ||
3749                 skip "need coreutils < 8.31 or kernel >= 5.18 for ln"
3750
3751         touch $DIR/$tfile || error "create failed"
3752         mkdir $DIR/$tdir || error "mkdir failed"
3753         ln $DIR/$tfile $DIR/$tdir/ || error "ln to '$tdir/' failed"
3754 }
3755 run_test 31l "link to file: target dir has trailing slash"
3756
3757 test_31m() {
3758         mkdir $DIR/d31m
3759         touch $DIR/d31m/s
3760         mkdir $DIR/d31m2
3761         touch $DIR/d31m2/exist
3762         mlink $DIR/d31m/s $DIR/d31m2/t || error "mlink"
3763         mlink $DIR/d31m/s $DIR/d31m2/exist && error "mlink to exist file"
3764         mlink $DIR/d31m/s $DIR/d31m2 && error "mlink to parent dir"
3765         mlink $DIR/d31m2 $DIR/d31m/s && error "mlink parent dir to target"
3766         mlink $DIR/d31m/not-exist $DIR/d31m2/foo && error "mlink non-existing to new"
3767         mlink $DIR/d31m/not-exist $DIR/d31m2/s && error "mlink non-existing to exist"
3768         return 0
3769 }
3770 run_test 31m "link to file: the same, non-existing, dir==============="
3771
3772 test_31n() {
3773         touch $DIR/$tfile || error "cannot create '$DIR/$tfile'"
3774         nlink=$(stat --format=%h $DIR/$tfile)
3775         [ ${nlink:--1} -eq 1 ] || error "nlink is $nlink, expected 1"
3776         local fd=$(free_fd)
3777         local cmd="exec $fd<$DIR/$tfile"
3778         eval $cmd
3779         cmd="exec $fd<&-"
3780         trap "eval $cmd" EXIT
3781         nlink=$(stat --dereference --format=%h /proc/self/fd/$fd)
3782         [ ${nlink:--1} -eq 1 ] || error "nlink is $nlink, expected 1"
3783         rm $DIR/$tfile || error "cannot remove '$DIR/$tfile'"
3784         nlink=$(stat --dereference --format=%h /proc/self/fd/$fd)
3785         [ ${nlink:--1} -eq 0 ] || error "nlink is $nlink, expected 0"
3786         eval $cmd
3787 }
3788 run_test 31n "check link count of unlinked file"
3789
3790 link_one() {
3791         local tempfile=$(mktemp $1_XXXXXX)
3792         mlink $tempfile $1 2> /dev/null &&
3793                 echo "$BASHPID: link $tempfile to $1 succeeded"
3794         munlink $tempfile
3795 }
3796
3797 test_31o() { # LU-2901
3798         test_mkdir $DIR/$tdir
3799         for LOOP in $(seq 100); do
3800                 rm -f $DIR/$tdir/$tfile*
3801                 for THREAD in $(seq 8); do
3802                         link_one $DIR/$tdir/$tfile.$LOOP &
3803                 done
3804                 wait
3805                 local LINKS=$(ls -1 $DIR/$tdir | grep -c $tfile.$LOOP)
3806                 [[ $LINKS -gt 1 ]] && ls $DIR/$tdir &&
3807                         error "$LINKS duplicate links to $tfile.$LOOP" &&
3808                         break || true
3809         done
3810 }
3811 run_test 31o "duplicate hard links with same filename"
3812
3813 test_31p() {
3814         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
3815
3816         test_mkdir $DIR/$tdir
3817         $LFS setdirstripe -i0 -c2 $DIR/$tdir/striped_dir
3818         $LFS setdirstripe -D -c2 -H all_char $DIR/$tdir/striped_dir
3819
3820         opendirunlink $DIR/$tdir/striped_dir/test1 ||
3821                 error "open unlink test1 failed"
3822         opendirunlink $DIR/$tdir/striped_dir/test2 ||
3823                 error "open unlink test2 failed"
3824
3825         $CHECKSTAT -a $DIR/$tdir/striped_dir/test1 ||
3826                 error "test1 still exists"
3827         $CHECKSTAT -a $DIR/$tdir/striped_dir/test2 ||
3828                 error "test2 still exists"
3829 }
3830 run_test 31p "remove of open striped directory"
3831
3832 test_31q() {
3833         [ $MDSCOUNT -lt 3 ] && skip_env "needs >= 3 MDTs"
3834
3835         $LFS mkdir -i 3,1 $DIR/$tdir || error "mkdir failed"
3836         index=$($LFS getdirstripe -i $DIR/$tdir)
3837         [ $index -eq 3 ] || error "first stripe index $index != 3"
3838         index=$($LFS getdirstripe $DIR/$tdir | tail -1 | awk '{print $1}')
3839         [ $index -eq 1 ] || error "second stripe index $index != 1"
3840
3841         # when "-c <stripe_count>" is set, the number of MDTs specified after
3842         # "-i" should equal to the stripe count
3843         $LFS mkdir -i 3,1 -c 3 $DIR/$tdir.2 && error "mkdir should fail" || true
3844 }
3845 run_test 31q "create striped directory on specific MDTs"
3846
3847 #LU-14949
3848 test_31r() {
3849         touch $DIR/$tfile.target
3850         touch $DIR/$tfile.source
3851
3852         #OBD_FAIL_LLITE_OPEN_DELAY 0x1419
3853         $LCTL set_param fail_loc=0x1419 fail_val=3
3854         cat $DIR/$tfile.target &
3855         CATPID=$!
3856
3857         # Guarantee open is waiting before we get here
3858         sleep 1
3859         mv $DIR/$tfile.source $DIR/$tfile.target
3860
3861         wait $CATPID
3862         RC=$?
3863         if [[ $RC -ne 0 ]]; then
3864                 error "open with cat failed, rc=$RC"
3865         fi
3866 }
3867 run_test 31r "open-rename(replace) race"
3868
3869 cleanup_test32_mount() {
3870         local rc=0
3871         trap 0
3872         local loopdev=$(losetup -a | grep $EXT2_DEV | sed -ne 's/:.*$//p')
3873         $UMOUNT $DIR/$tdir/ext2-mountpoint || rc=$?
3874         losetup -d $loopdev || true
3875         rm -rf $DIR/$tdir
3876         return $rc
3877 }
3878
3879 test_32a() {
3880         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3881
3882         echo "== more mountpoints and symlinks ================="
3883         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
3884         trap cleanup_test32_mount EXIT
3885         test_mkdir -p $DIR/$tdir/ext2-mountpoint
3886         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
3887                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
3888         $CHECKSTAT -t dir $DIR/$tdir/ext2-mountpoint/.. ||
3889                 error "$DIR/$tdir/ext2-mountpoint/.. not dir type"
3890         cleanup_test32_mount
3891 }
3892 run_test 32a "stat d32a/ext2-mountpoint/.. ====================="
3893
3894 test_32b() {
3895         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3896
3897         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
3898         trap cleanup_test32_mount EXIT
3899         test_mkdir -p $DIR/$tdir/ext2-mountpoint
3900         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
3901                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
3902         ls -al $DIR/$tdir/ext2-mountpoint/.. ||
3903                 error "Can't list $DIR/$tdir/ext2-mountpoint/.."
3904         cleanup_test32_mount
3905 }
3906 run_test 32b "open d32b/ext2-mountpoint/.. ====================="
3907
3908 test_32c() {
3909         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3910
3911         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
3912         trap cleanup_test32_mount EXIT
3913         test_mkdir -p $DIR/$tdir/ext2-mountpoint
3914         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
3915                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
3916         test_mkdir -p $DIR/$tdir/d2/test_dir
3917         $CHECKSTAT -t dir $DIR/$tdir/ext2-mountpoint/../d2/test_dir ||
3918                 error "$DIR/$tdir/ext2-mountpoint/../d2/test_dir not dir type"
3919         cleanup_test32_mount
3920 }
3921 run_test 32c "stat d32c/ext2-mountpoint/../d2/test_dir ========="
3922
3923 test_32d() {
3924         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3925
3926         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
3927         trap cleanup_test32_mount EXIT
3928         test_mkdir -p $DIR/$tdir/ext2-mountpoint
3929         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
3930                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
3931         test_mkdir -p $DIR/$tdir/d2/test_dir
3932         ls -al $DIR/$tdir/ext2-mountpoint/../d2/test_dir ||
3933                 error "Can't list $DIR/$tdir/ext2-mountpoint/../d2/test_dir"
3934         cleanup_test32_mount
3935 }
3936 run_test 32d "open d32d/ext2-mountpoint/../d2/test_dir"
3937
3938 test_32e() {
3939         rm -fr $DIR/$tdir
3940         test_mkdir -p $DIR/$tdir/tmp
3941         local tmp_dir=$DIR/$tdir/tmp
3942         ln -s $DIR/$tdir $tmp_dir/symlink11
3943         ln -s $tmp_dir/symlink11 $tmp_dir/../symlink01
3944         $CHECKSTAT -t link $DIR/$tdir/tmp/symlink11 || error "symlink11 bad"
3945         $CHECKSTAT -t link $DIR/$tdir/symlink01 || error "symlink01 bad"
3946 }
3947 run_test 32e "stat d32e/symlink->tmp/symlink->lustre-subdir"
3948
3949 test_32f() {
3950         rm -fr $DIR/$tdir
3951         test_mkdir -p $DIR/$tdir/tmp
3952         local tmp_dir=$DIR/$tdir/tmp
3953         ln -s $DIR/$tdir $tmp_dir/symlink11
3954         ln -s $tmp_dir/symlink11 $tmp_dir/../symlink01
3955         ls $DIR/$tdir/tmp/symlink11  || error "symlink11 bad"
3956         ls $DIR/$tdir/symlink01 || error "symlink01 bad"
3957 }
3958 run_test 32f "open d32f/symlink->tmp/symlink->lustre-subdir"
3959
3960 test_32g() {
3961         local tmp_dir=$DIR/$tdir/tmp
3962         test_mkdir -p $tmp_dir
3963         test_mkdir $DIR/${tdir}2
3964         ln -s $DIR/${tdir}2 $tmp_dir/symlink12
3965         ln -s $tmp_dir/symlink12 $tmp_dir/../symlink02
3966         $CHECKSTAT -t link $tmp_dir/symlink12 || error "symlink12 not a link"
3967         $CHECKSTAT -t link $DIR/$tdir/symlink02 || error "symlink02 not a link"
3968         $CHECKSTAT -t dir -f $tmp_dir/symlink12 || error "symlink12 not a dir"
3969         $CHECKSTAT -t dir -f $DIR/$tdir/symlink02 || error "symlink12 not a dir"
3970 }
3971 run_test 32g "stat d32g/symlink->tmp/symlink->lustre-subdir/${tdir}2"
3972
3973 test_32h() {
3974         rm -fr $DIR/$tdir $DIR/${tdir}2
3975         tmp_dir=$DIR/$tdir/tmp
3976         test_mkdir -p $tmp_dir
3977         test_mkdir $DIR/${tdir}2
3978         ln -s $DIR/${tdir}2 $tmp_dir/symlink12
3979         ln -s $tmp_dir/symlink12 $tmp_dir/../symlink02
3980         ls $tmp_dir/symlink12 || error "listing symlink12"
3981         ls $DIR/$tdir/symlink02  || error "listing symlink02"
3982 }
3983 run_test 32h "open d32h/symlink->tmp/symlink->lustre-subdir/${tdir}2"
3984
3985 test_32i() {
3986         [ $PARALLEL == "yes" ] && skip "skip parallel run"
3987
3988         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
3989         trap cleanup_test32_mount EXIT
3990         test_mkdir -p $DIR/$tdir/ext2-mountpoint
3991         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
3992                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
3993         touch $DIR/$tdir/test_file
3994         $CHECKSTAT -t file $DIR/$tdir/ext2-mountpoint/../test_file ||
3995                 error "$DIR/$tdir/ext2-mountpoint/../test_file not file type"
3996         cleanup_test32_mount
3997 }
3998 run_test 32i "stat d32i/ext2-mountpoint/../test_file ==========="
3999
4000 test_32j() {
4001         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4002
4003         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
4004         trap cleanup_test32_mount EXIT
4005         test_mkdir -p $DIR/$tdir/ext2-mountpoint
4006         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
4007                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
4008         touch $DIR/$tdir/test_file
4009         cat $DIR/$tdir/ext2-mountpoint/../test_file ||
4010                 error "Can't open $DIR/$tdir/ext2-mountpoint/../test_file"
4011         cleanup_test32_mount
4012 }
4013 run_test 32j "open d32j/ext2-mountpoint/../test_file ==========="
4014
4015 test_32k() {
4016         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4017
4018         rm -fr $DIR/$tdir
4019         trap cleanup_test32_mount EXIT
4020         test_mkdir -p $DIR/$tdir/ext2-mountpoint
4021         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
4022                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
4023         test_mkdir -p $DIR/$tdir/d2
4024         touch $DIR/$tdir/d2/test_file || error "touch failed"
4025         $CHECKSTAT -t file $DIR/$tdir/ext2-mountpoint/../d2/test_file ||
4026                 error "$DIR/$tdir/ext2-mountpoint/../d2/test_file not file type"
4027         cleanup_test32_mount
4028 }
4029 run_test 32k "stat d32k/ext2-mountpoint/../d2/test_file ========"
4030
4031 test_32l() {
4032         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4033
4034         rm -fr $DIR/$tdir
4035         trap cleanup_test32_mount EXIT
4036         test_mkdir -p $DIR/$tdir/ext2-mountpoint
4037         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
4038                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
4039         test_mkdir -p $DIR/$tdir/d2
4040         touch $DIR/$tdir/d2/test_file || error "touch failed"
4041         cat  $DIR/$tdir/ext2-mountpoint/../d2/test_file ||
4042                 error "Can't open $DIR/$tdir/ext2-mountpoint/../d2/test_file"
4043         cleanup_test32_mount
4044 }
4045 run_test 32l "open d32l/ext2-mountpoint/../d2/test_file ========"
4046
4047 test_32m() {
4048         rm -fr $DIR/d32m
4049         test_mkdir -p $DIR/d32m/tmp
4050         TMP_DIR=$DIR/d32m/tmp
4051         ln -s $DIR $TMP_DIR/symlink11
4052         ln -s $TMP_DIR/symlink11 $TMP_DIR/../symlink01
4053         $CHECKSTAT -t link $DIR/d32m/tmp/symlink11 ||
4054                 error "symlink11 not a link"
4055         $CHECKSTAT -t link $DIR/d32m/symlink01 ||
4056                 error "symlink01 not a link"
4057 }
4058 run_test 32m "stat d32m/symlink->tmp/symlink->lustre-root ======"
4059
4060 test_32n() {
4061         rm -fr $DIR/d32n
4062         test_mkdir -p $DIR/d32n/tmp
4063         TMP_DIR=$DIR/d32n/tmp
4064         ln -s $DIR $TMP_DIR/symlink11
4065         ln -s $TMP_DIR/symlink11 $TMP_DIR/../symlink01
4066         ls -l $DIR/d32n/tmp/symlink11  || error "listing symlink11"
4067         ls -l $DIR/d32n/symlink01 || error "listing symlink01"
4068 }
4069 run_test 32n "open d32n/symlink->tmp/symlink->lustre-root ======"
4070
4071 test_32o() {
4072         touch $DIR/$tfile
4073         test_mkdir -p $DIR/d32o/tmp
4074         TMP_DIR=$DIR/d32o/tmp
4075         ln -s $DIR/$tfile $TMP_DIR/symlink12
4076         ln -s $TMP_DIR/symlink12 $TMP_DIR/../symlink02
4077         $CHECKSTAT -t link $DIR/d32o/tmp/symlink12 ||
4078                 error "symlink12 not a link"
4079         $CHECKSTAT -t link $DIR/d32o/symlink02 || error "symlink02 not a link"
4080         $CHECKSTAT -t file -f $DIR/d32o/tmp/symlink12 ||
4081                 error "$DIR/d32o/tmp/symlink12 not file type"
4082         $CHECKSTAT -t file -f $DIR/d32o/symlink02 ||
4083                 error "$DIR/d32o/symlink02 not file type"
4084 }
4085 run_test 32o "stat d32o/symlink->tmp/symlink->lustre-root/$tfile"
4086
4087 test_32p() {
4088         log 32p_1
4089         rm -fr $DIR/d32p
4090         log 32p_2
4091         rm -f $DIR/$tfile
4092         log 32p_3
4093         touch $DIR/$tfile
4094         log 32p_4
4095         test_mkdir -p $DIR/d32p/tmp
4096         log 32p_5
4097         TMP_DIR=$DIR/d32p/tmp
4098         log 32p_6
4099         ln -s $DIR/$tfile $TMP_DIR/symlink12
4100         log 32p_7
4101         ln -s $TMP_DIR/symlink12 $TMP_DIR/../symlink02
4102         log 32p_8
4103         cat $DIR/d32p/tmp/symlink12 ||
4104                 error "Can't open $DIR/d32p/tmp/symlink12"
4105         log 32p_9
4106         cat $DIR/d32p/symlink02 || error "Can't open $DIR/d32p/symlink02"
4107         log 32p_10
4108 }
4109 run_test 32p "open d32p/symlink->tmp/symlink->lustre-root/$tfile"
4110
4111 test_32q() {
4112         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4113
4114         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
4115         trap cleanup_test32_mount EXIT
4116         test_mkdir -p $DIR/$tdir/ext2-mountpoint
4117         touch $DIR/$tdir/ext2-mountpoint/under_the_mount || error "touch failed"
4118         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
4119                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
4120         ls $DIR/$tdir/ext2-mountpoint | grep "\<under_the_mount\>" && error
4121         cleanup_test32_mount
4122 }
4123 run_test 32q "stat follows mountpoints in Lustre (should return error)"
4124
4125 test_32r() {
4126         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4127
4128         [ -e $DIR/$tdir ] && rm -fr $DIR/$tdir
4129         trap cleanup_test32_mount EXIT
4130         test_mkdir -p $DIR/$tdir/ext2-mountpoint
4131         touch $DIR/$tdir/ext2-mountpoint/under_the_mount || error "touch failed"
4132         mount -t ext2 -o loop $EXT2_DEV $DIR/$tdir/ext2-mountpoint ||
4133                 error "mount failed for $EXT2_DEV $DIR/$tdir/ext2-mountpoint"
4134         ls $DIR/$tdir/ext2-mountpoint | grep -q under_the_mount && error || true
4135         cleanup_test32_mount
4136 }
4137 run_test 32r "opendir follows mountpoints in Lustre (should return error)"
4138
4139 test_33aa() {
4140         rm -f $DIR/$tfile
4141         touch $DIR/$tfile
4142         chmod 444 $DIR/$tfile
4143         chown $RUNAS_ID $DIR/$tfile
4144         log 33_1
4145         $RUNAS $OPENFILE -f O_RDWR $DIR/$tfile && error || true
4146         log 33_2
4147 }
4148 run_test 33aa "write file with mode 444 (should return error)"
4149
4150 test_33a() {
4151         rm -fr $DIR/$tdir
4152         test_mkdir $DIR/$tdir
4153         chown $RUNAS_ID $DIR/$tdir
4154         $RUNAS $OPENFILE -f O_RDWR:O_CREAT -m 0444 $DIR/$tdir/$tfile ||
4155                 error "$RUNAS create $tdir/$tfile failed"
4156         $RUNAS $OPENFILE -f O_RDWR:O_CREAT -m 0444 $DIR/$tdir/$tfile &&
4157                 error "open RDWR" || true
4158 }
4159 run_test 33a "test open file(mode=0444) with O_RDWR (should return error)"
4160
4161 test_33b() {
4162         rm -fr $DIR/$tdir
4163         test_mkdir $DIR/$tdir
4164         chown $RUNAS_ID $DIR/$tdir
4165         $RUNAS $OPENFILE -f 1286739555 $DIR/$tdir/$tfile || true
4166 }
4167 run_test 33b "test open file with malformed flags (No panic)"
4168
4169 test_33c() {
4170         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4171         remote_ost_nodsh && skip "remote OST with nodsh"
4172
4173         local ostnum
4174         local ostname
4175         local write_bytes
4176         local all_zeros
4177
4178         all_zeros=true
4179         test_mkdir $DIR/$tdir
4180         # Read: 0, Write: 4, create/destroy: 2/0, stat: 1, punch: 0
4181
4182         sync
4183         for ostnum in $(seq $OSTCOUNT); do
4184                 # test-framework's OST numbering is one-based, while Lustre's
4185                 # is zero-based
4186                 ostname=$(printf "$FSNAME-OST%.4x" $((ostnum - 1)))
4187                 # check if at least some write_bytes stats are counted
4188                 write_bytes=$(do_facet ost$ostnum lctl get_param -n \
4189                               obdfilter.$ostname.stats |
4190                               awk '/^write_bytes/ {print $7}' )
4191                 echo "baseline_write_bytes@ost$ostnum/$ostname=$write_bytes"
4192                 if (( ${write_bytes:-0} > 0 )); then
4193                         all_zeros=false
4194                         break
4195                 fi
4196         done
4197
4198         $all_zeros || return 0
4199
4200         # Write four bytes
4201         echo foo > $DIR/$tdir/bar
4202         # Really write them
4203         sync
4204
4205         # Total up write_bytes after writing.  We'd better find non-zeros.
4206         for ostnum in $(seq $OSTCOUNT); do
4207                 ostname=$(printf "$FSNAME-OST%.4x" $((ostnum - 1)))
4208                 write_bytes=$(do_facet ost$ostnum lctl get_param -n \
4209                               obdfilter/$ostname/stats |
4210                               awk '/^write_bytes/ {print $7}' )
4211                 echo "write_bytes@ost$ostnum/$ostname=$write_bytes"
4212                 if (( ${write_bytes:-0} > 0 )); then
4213                         all_zeros=false
4214                         break
4215                 fi
4216         done
4217
4218         if $all_zeros; then
4219                 for ostnum in $(seq $OSTCOUNT); do
4220                         ostname=$(printf "$FSNAME-OST%.4x" $((ostnum - 1)))
4221                         echo "Check write_bytes is in obdfilter.*.stats:"
4222                         do_facet ost$ostnum lctl get_param -n \
4223                                 obdfilter.$ostname.stats
4224                 done
4225                 error "OST not keeping write_bytes stats (b=22312)"
4226         fi
4227 }
4228 run_test 33c "test write_bytes stats"
4229
4230 test_33d() {
4231         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
4232         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4233
4234         local MDTIDX=1
4235         local remote_dir=$DIR/$tdir/remote_dir
4236
4237         test_mkdir $DIR/$tdir
4238         $LFS mkdir -i $MDTIDX $remote_dir ||
4239                 error "create remote directory failed"
4240
4241         touch $remote_dir/$tfile
4242         chmod 444 $remote_dir/$tfile
4243         chown $RUNAS_ID $remote_dir/$tfile
4244
4245         $RUNAS $OPENFILE -f O_RDWR $DIR/$tfile && error || true
4246
4247         chown $RUNAS_ID $remote_dir
4248         $RUNAS $OPENFILE -f O_RDWR:O_CREAT -m 0444 $remote_dir/f33 ||
4249                                         error "create" || true
4250         $RUNAS $OPENFILE -f O_RDWR:O_CREAT -m 0444 $remote_dir/f33 &&
4251                                     error "open RDWR" || true
4252         $RUNAS $OPENFILE -f 1286739555 $remote_dir/f33 || true
4253 }
4254 run_test 33d "openfile with 444 modes and malformed flags under remote dir"
4255
4256 test_33e() {
4257         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
4258
4259         mkdir $DIR/$tdir
4260
4261         $LFS setdirstripe -i0 -c2 $DIR/$tdir/striped_dir
4262         $LFS setdirstripe -i1 -c2 $DIR/$tdir/striped_dir1
4263         mkdir $DIR/$tdir/local_dir
4264
4265         local s0_mode=$(stat -c%f $DIR/$tdir/striped_dir)
4266         local s1_mode=$(stat -c%f $DIR/$tdir/striped_dir1)
4267         local l_mode=$(stat -c%f $DIR/$tdir/local_dir)
4268
4269         [ "$l_mode" = "$s0_mode" -a "$l_mode" = "$s1_mode" ] ||
4270                 error "mkdir $l_mode striped0 $s0_mode striped1 $s1_mode"
4271
4272         rmdir $DIR/$tdir/* || error "rmdir failed"
4273
4274         umask 777
4275         $LFS setdirstripe -i0 -c2 $DIR/$tdir/striped_dir
4276         $LFS setdirstripe -i1 -c2 $DIR/$tdir/striped_dir1
4277         mkdir $DIR/$tdir/local_dir
4278
4279         s0_mode=$(stat -c%f $DIR/$tdir/striped_dir)
4280         s1_mode=$(stat -c%f $DIR/$tdir/striped_dir1)
4281         l_mode=$(stat -c%f $DIR/$tdir/local_dir)
4282
4283         [ "$l_mode" = "$s0_mode" -a "$l_mode" = "$s1_mode" ] ||
4284                 error "mkdir $l_mode striped0 $s0_mode striped1 $s1_mode 777"
4285
4286         rmdir $DIR/$tdir/* || error "rmdir(umask 777) failed"
4287
4288         umask 000
4289         $LFS setdirstripe -i0 -c2 $DIR/$tdir/striped_dir
4290         $LFS setdirstripe -i1 -c2 $DIR/$tdir/striped_dir1
4291         mkdir $DIR/$tdir/local_dir
4292
4293         s0_mode=$(stat -c%f $DIR/$tdir/striped_dir)
4294         s1_mode=$(stat -c%f $DIR/$tdir/striped_dir1)
4295         l_mode=$(stat -c%f $DIR/$tdir/local_dir)
4296
4297         [ "$l_mode" = "$s0_mode" -a "$l_mode" = "$s1_mode" ] ||
4298                 error "mkdir $l_mode striped0 $s0_mode striped1 $s1_mode 0"
4299 }
4300 run_test 33e "mkdir and striped directory should have same mode"
4301
4302 cleanup_33f() {
4303         trap 0
4304         do_facet $SINGLEMDS $LCTL set_param mdt.*.enable_remote_dir_gid=0
4305 }
4306
4307 test_33f() {
4308         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
4309         remote_mds_nodsh && skip "remote MDS with nodsh"
4310
4311         mkdir $DIR/$tdir
4312         chmod go+rwx $DIR/$tdir
4313         do_facet $SINGLEMDS $LCTL set_param mdt.*.enable_remote_dir_gid=-1
4314         trap cleanup_33f EXIT
4315
4316         $RUNAS lfs mkdir -i 0 -c$MDSCOUNT $DIR/$tdir/striped_dir ||
4317                 error "cannot create striped directory"
4318
4319         $RUNAS touch $DIR/$tdir/striped_dir/{0..16} ||
4320                 error "cannot create files in striped directory"
4321
4322         $RUNAS rm $DIR/$tdir/striped_dir/{0..16} ||
4323                 error "cannot remove files in striped directory"
4324
4325         $RUNAS rmdir $DIR/$tdir/striped_dir ||
4326                 error "cannot remove striped directory"
4327
4328         cleanup_33f
4329 }
4330 run_test 33f "nonroot user can create, access, and remove a striped directory"
4331
4332 test_33g() {
4333         mkdir -p $DIR/$tdir/dir2
4334
4335         local err=$($RUNAS mkdir $DIR/$tdir/dir2 2>&1)
4336         echo $err
4337         [[ $err =~ "exists" ]] || error "Not exists error"
4338 }
4339 run_test 33g "nonroot user create already existing root created file"
4340
4341 sub_33h() {
4342         local hash_type=$1
4343         local count=250
4344
4345         test_mkdir -c $MDSCOUNT -H $hash_type $DIR/$tdir ||
4346                 error "lfs mkdir -H $hash_type $tdir failed"
4347         touch $DIR/$tdir/$tfile || error "touch $tfile failed"
4348
4349         local index=$($LFS getstripe -m $DIR/$tdir/$tfile)
4350         local index2
4351         local fname
4352
4353         for fname in $DIR/$tdir/$tfile.bak \
4354                      $DIR/$tdir/$tfile.SAV \
4355                      $DIR/$tdir/$tfile.orig \
4356                      $DIR/$tdir/$tfile~; do
4357                 touch $fname || error "touch $fname failed"
4358                 index2=$($LFS getstripe -m $fname)
4359                 (( $index == $index2 )) ||
4360                         error "$fname MDT index mismatch $index != $index2"
4361         done
4362
4363         local failed=0
4364         local patterns=(".$tfile.XXXXXX" "$tfile.XXXXXXXX")
4365         local pattern
4366
4367         for pattern in ${patterns[*]}; do
4368                 echo "pattern $pattern"
4369                 fname=$DIR/$tdir/$pattern
4370                 for (( i = 0; i < $count; i++ )); do
4371                         fname=$(mktemp $DIR/$tdir/$pattern) ||
4372                                 error "mktemp $DIR/$tdir/$pattern failed"
4373                         index2=$($LFS getstripe -m $fname)
4374                         (( $index == $index2 )) && continue
4375
4376                         failed=$((failed + 1))
4377                         echo "$fname MDT index mismatch $index != $index2"
4378                 done
4379         done
4380
4381         echo "$failed/$count MDT index mismatches, expect ~2-4"
4382         (( failed < 10 )) || error "MDT index mismatch $failed/$count times"
4383
4384         local same=0
4385         local expect
4386
4387         # verify that "crush" is still broken with all files on same MDT,
4388         # crush2 should have about 1/MDSCOUNT files on each MDT, with margin
4389         [[ "$hash_type" == "crush" ]] && expect=$count ||
4390                 expect=$((count / MDSCOUNT))
4391
4392         # crush2 doesn't put all-numeric suffixes on the same MDT,
4393         # filename like $tfile.12345678 should *not* be considered temp
4394         for pattern in ${patterns[*]}; do
4395                 local base=${pattern%%X*}
4396                 local suff=${pattern#$base}
4397
4398                 echo "pattern $pattern"
4399                 for (( i = 0; i < $count; i++ )); do
4400                         fname=$DIR/$tdir/$base$((${suff//X/1} + i))
4401                         touch $fname || error "touch $fname failed"
4402                         index2=$($LFS getstripe -m $fname)
4403                         (( $index != $index2 )) && continue
4404
4405                         same=$((same + 1))
4406                 done
4407         done
4408
4409         # the number of "bad" hashes is random, as it depends on the random
4410         # filenames generated by "mktemp".  Allow some margin in the results.
4411         echo "$((same/${#patterns[*]}))/$count matches, expect ~$expect for $1"
4412         (( same / ${#patterns[*]} <= expect * 9 / 7 &&
4413            same / ${#patterns[*]} > expect * 5 / 7 )) ||
4414                 error "MDT index match $((same / ${#patterns[*]}))/$count times"
4415         same=0
4416
4417         # crush2 doesn't put suffixes with special characters on the same MDT
4418         # filename like $tfile.txt.1234 should *not* be considered temp
4419         for pattern in ${patterns[*]}; do
4420                 local base=${pattern%%X*}
4421                 local suff=${pattern#$base}
4422
4423                 pattern=$base...${suff/XXX}
4424                 echo "pattern=$pattern"
4425                 for (( i = 0; i < $count; i++ )); do
4426                         fname=$(mktemp $DIR/$tdir/$pattern) ||
4427                                 error "touch $fname failed"
4428                         index2=$($LFS getstripe -m $fname)
4429                         (( $index != $index2 )) && continue
4430
4431                         same=$((same + 1))
4432                 done
4433         done
4434
4435         # the number of "bad" hashes is random, as it depends on the random
4436         # filenames generated by "mktemp".  Allow some margin in the results.
4437         echo "$((same/${#patterns[*]}))/$count matches, expect ~$expect for $1"
4438         (( same / ${#patterns[*]} <= expect * 9 / 7 &&
4439            same / ${#patterns[*]} > expect * 5 / 7 )) ||
4440                 error "MDT index match $((same / ${#patterns[*]}))/$count times"
4441 }
4442
4443 test_33h() {
4444         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
4445         (( $MDS1_VERSION >= $(version_code 2.13.50) )) ||
4446                 skip "Need MDS version at least 2.13.50"
4447
4448         sub_33h crush
4449 }
4450 run_test 33h "temp file is located on the same MDT as target (crush)"
4451
4452 test_33hh() {
4453         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
4454         echo "MDS1_VERSION=$MDS1_VERSION version_code=$(version_code 2.15.0)"
4455         (( $MDS1_VERSION > $(version_code 2.15.0) )) ||
4456                 skip "Need MDS version at least 2.15.0 for crush2"
4457
4458         sub_33h crush2
4459 }
4460 run_test 33hh "temp file is located on the same MDT as target (crush2)"
4461
4462 test_33i()
4463 {
4464         (( MDSCOUNT < 2 )) && skip "needs >= 2 MDTs"
4465
4466         local FNAME=$(str_repeat 'f' 250)
4467
4468         test_mkdir -i 0 -c $MDSCOUNT $DIR/$tdir || error "mkdir $tdir failed"
4469         createmany -o $DIR/$tdir/$FNAME 1000 || error "createmany failed"
4470
4471         local count
4472         local total
4473
4474         count=$($LFS getstripe -m $DIR/$tdir/* | grep -cw 1)
4475
4476         local MDC=$(lctl dl | awk '/MDT0001-mdc-[^M]/ { print $4 }')
4477
4478         lctl --device %$MDC deactivate
4479         stack_trap "lctl --device %$MDC activate"
4480         ls $DIR/$tdir > /dev/null && error "ls should return an error"
4481         total=$(\ls -l $DIR/$tdir | wc -l)
4482         # "ls -l" will list total in the first line
4483         total=$((total - 1))
4484         (( total + count == 1000 )) ||
4485                 error "ls list $total files, $count files on MDT1"
4486 }
4487 run_test 33i "striped directory can be accessed when one MDT is down"
4488
4489 test_33j() {
4490         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
4491
4492         mkdir -p $DIR/$tdir/
4493
4494         $LFS setdirstripe -D -i0,1 $DIR/$tdir/striped_dir_a &&
4495                 error "setdirstripe -D -i0,1 incorrectly succeeded"
4496
4497         $LFS setdirstripe -D -i0,1 -c1 $DIR/$tdir/striped_dir_b &&
4498                 error "setdirstripe -D -i0,1 -c1 incorrectly succeeded"
4499
4500         $LFS setdirstripe -D -i0,1 -c3 $DIR/$tdir/striped_dir_c &&
4501                 error "setdirstripe -D -i0,1 -c3 incorrectly succeeded"
4502
4503         $LFS setdirstripe -i0,1 $DIR/$tdir/striped_dir_e ||
4504                 error "-D was not specified, but still failed"
4505 }
4506 run_test 33j "lfs setdirstripe -D -i x,y,x should fail"
4507
4508 TEST_34_SIZE=${TEST_34_SIZE:-2000000000000}
4509 test_34a() {
4510         rm -f $DIR/f34
4511         $MCREATE $DIR/f34 || error "mcreate failed"
4512         $LFS getstripe $DIR/f34 2>&1 | grep -q "no stripe info" ||
4513                 error "getstripe failed"
4514         $TRUNCATE $DIR/f34 $TEST_34_SIZE || error "truncate failed"
4515         $LFS getstripe $DIR/f34 2>&1 | grep -q "no stripe info" ||
4516                 error "getstripe failed"
4517         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4518                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4519 }
4520 run_test 34a "truncate file that has not been opened ==========="
4521
4522 test_34b() {
4523         [ ! -f $DIR/f34 ] && test_34a
4524         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4525                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4526         $OPENFILE -f O_RDONLY $DIR/f34
4527         $LFS getstripe $DIR/f34 2>&1 | grep -q "no stripe info" ||
4528                 error "getstripe failed"
4529         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4530                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4531 }
4532 run_test 34b "O_RDONLY opening file doesn't create objects ====="
4533
4534 test_34c() {
4535         [ ! -f $DIR/f34 ] && test_34a
4536         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4537                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4538         $OPENFILE -f O_RDWR $DIR/f34
4539         $LFS getstripe $DIR/f34 2>&1 | grep -q "no stripe info" &&
4540                 error "$LFS getstripe failed"
4541         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4542                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4543 }
4544 run_test 34c "O_RDWR opening file-with-size works =============="
4545
4546 test_34d() {
4547         [ ! -f $DIR/f34 ] && test_34a
4548         dd if=/dev/zero of=$DIR/f34 conv=notrunc bs=4k count=1 ||
4549                 error "dd failed"
4550         $CHECKSTAT -s $TEST_34_SIZE $DIR/f34 ||
4551                 error "Size of $DIR/f34 not equal to $TEST_34_SIZE bytes"
4552         rm $DIR/f34
4553 }
4554 run_test 34d "write to sparse file ============================="
4555
4556 test_34e() {
4557         rm -f $DIR/f34e
4558         $MCREATE $DIR/f34e || error "mcreate failed"
4559         $TRUNCATE $DIR/f34e 1000 || error "truncate failed"
4560         $CHECKSTAT -s 1000 $DIR/f34e ||
4561                 error "Size of $DIR/f34e not equal to 1000 bytes"
4562         $OPENFILE -f O_RDWR $DIR/f34e
4563         $CHECKSTAT -s 1000 $DIR/f34e ||
4564                 error "Size of $DIR/f34e not equal to 1000 bytes"
4565 }
4566 run_test 34e "create objects, some with size and some without =="
4567
4568 test_34f() { # bug 6242, 6243
4569         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4570
4571         SIZE34F=48000
4572         rm -f $DIR/f34f
4573         $MCREATE $DIR/f34f || error "mcreate failed"
4574         $TRUNCATE $DIR/f34f $SIZE34F || error "truncating $DIR/f3f to $SIZE34F"
4575         dd if=$DIR/f34f of=$TMP/f34f
4576         $CHECKSTAT -s $SIZE34F $TMP/f34f || error "$TMP/f34f not $SIZE34F bytes"
4577         dd if=/dev/zero of=$TMP/f34fzero bs=$SIZE34F count=1
4578         cmp $DIR/f34f $TMP/f34fzero || error "$DIR/f34f not all zero"
4579         cmp $TMP/f34f $TMP/f34fzero || error "$TMP/f34f not all zero"
4580         rm $TMP/f34f $TMP/f34fzero $DIR/f34f
4581 }
4582 run_test 34f "read from a file with no objects until EOF ======="
4583
4584 test_34g() {
4585         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4586
4587         dd if=/dev/zero of=$DIR/$tfile bs=1 count=100 seek=$TEST_34_SIZE ||
4588                 error "dd failed"
4589         $TRUNCATE $DIR/$tfile $((TEST_34_SIZE / 2))|| error "truncate failed"
4590         $CHECKSTAT -s $((TEST_34_SIZE / 2)) $DIR/$tfile ||
4591                 error "Size of $DIR/$tfile not equal to $((TEST_34_SIZE / 2))"
4592         cancel_lru_locks osc
4593         $CHECKSTAT -s $((TEST_34_SIZE / 2)) $DIR/$tfile ||
4594                 error "wrong size after lock cancel"
4595
4596         $TRUNCATE $DIR/$tfile $TEST_34_SIZE || error "truncate failed"
4597         $CHECKSTAT -s $TEST_34_SIZE $DIR/$tfile ||
4598                 error "expanding truncate failed"
4599         cancel_lru_locks osc
4600         $CHECKSTAT -s $TEST_34_SIZE $DIR/$tfile ||
4601                 error "wrong expanded size after lock cancel"
4602 }
4603 run_test 34g "truncate long file ==============================="
4604
4605 test_34h() {
4606         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4607
4608         local gid=10
4609         local sz=1000
4610
4611         dd if=/dev/zero of=$DIR/$tfile bs=1M count=10 || error "dd failed"
4612         sync # Flush the cache so that multiop below does not block on cache
4613              # flush when getting the group lock
4614         $MULTIOP $DIR/$tfile OG${gid}T${sz}g${gid}c &
4615         MULTIPID=$!
4616
4617         # Since just timed wait is not good enough, let's do a sync write
4618         # that way we are sure enough time for a roundtrip + processing
4619         # passed + 2 seconds of extra margin.
4620         dd if=/dev/zero of=$DIR/${tfile}-1 bs=$PAGE_SIZE oflag=direct count=1
4621         rm $DIR/${tfile}-1
4622         sleep 2
4623
4624         if [[ `ps h -o comm -p $MULTIPID` == "multiop" ]]; then
4625                 error "Multiop blocked on ftruncate, pid=$MULTIPID"
4626                 kill -9 $MULTIPID
4627         fi
4628         wait $MULTIPID
4629         local nsz=`stat -c %s $DIR/$tfile`
4630         [[ $nsz == $sz ]] || error "New size wrong $nsz != $sz"
4631 }
4632 run_test 34h "ftruncate file under grouplock should not block"
4633
4634 test_35a() {
4635         cp /bin/sh $DIR/f35a
4636         chmod 444 $DIR/f35a
4637         chown $RUNAS_ID $DIR/f35a
4638         $RUNAS $DIR/f35a && error || true
4639         rm $DIR/f35a
4640 }
4641 run_test 35a "exec file with mode 444 (should return and not leak)"
4642
4643 test_36a() {
4644         rm -f $DIR/f36
4645         utime $DIR/f36 || error "utime failed for MDS"
4646 }
4647 run_test 36a "MDS utime check (mknod, utime)"
4648
4649 test_36b() {
4650         echo "" > $DIR/f36
4651         utime $DIR/f36 || error "utime failed for OST"
4652 }
4653 run_test 36b "OST utime check (open, utime)"
4654
4655 test_36c() {
4656         rm -f $DIR/d36/f36
4657         test_mkdir $DIR/d36
4658         chown $RUNAS_ID $DIR/d36
4659         $RUNAS utime $DIR/d36/f36 || error "utime failed for MDS as non-root"
4660 }
4661 run_test 36c "non-root MDS utime check (mknod, utime)"
4662
4663 test_36d() {
4664         [ ! -d $DIR/d36 ] && test_36c
4665         echo "" > $DIR/d36/f36
4666         $RUNAS utime $DIR/d36/f36 || error "utime failed for OST as non-root"
4667 }
4668 run_test 36d "non-root OST utime check (open, utime)"
4669
4670 test_36e() {
4671         [ $RUNAS_ID -eq $UID ] && skip_env "RUNAS_ID = UID = $UID -- skipping"
4672
4673         test_mkdir $DIR/$tdir
4674         touch $DIR/$tdir/$tfile
4675         $RUNAS utime $DIR/$tdir/$tfile &&
4676                 error "utime worked, expected failure" || true
4677 }
4678 run_test 36e "utime on non-owned file (should return error)"
4679
4680 subr_36fh() {
4681         local fl="$1"
4682         local LANG_SAVE=$LANG
4683         local LC_LANG_SAVE=$LC_LANG
4684         export LANG=C LC_LANG=C # for date language
4685
4686         DATESTR="Dec 20  2000"
4687         test_mkdir $DIR/$tdir
4688         lctl set_param fail_loc=$fl
4689         date; date +%s
4690         cp /etc/hosts $DIR/$tdir/$tfile
4691         sync & # write RPC generated with "current" inode timestamp, but delayed
4692         sleep 1
4693         touch --date="$DATESTR" $DIR/$tdir/$tfile # setattr timestamp in past
4694         LS_BEFORE="`ls -l $DIR/$tdir/$tfile`" # old timestamp from client cache
4695         cancel_lru_locks $OSC
4696         LS_AFTER="`ls -l $DIR/$tdir/$tfile`"  # timestamp from OST object
4697         date; date +%s
4698         [ "$LS_BEFORE" != "$LS_AFTER" ] && \
4699                 echo "BEFORE: $LS_BEFORE" && \
4700                 echo "AFTER : $LS_AFTER" && \
4701                 echo "WANT  : $DATESTR" && \
4702                 error "$DIR/$tdir/$tfile timestamps changed" || true
4703
4704         export LANG=$LANG_SAVE LC_LANG=$LC_LANG_SAVE
4705 }
4706
4707 test_36f() {
4708         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4709
4710         #define OBD_FAIL_OST_BRW_PAUSE_BULK 0x214
4711         subr_36fh "0x80000214"
4712 }
4713 run_test 36f "utime on file racing with OST BRW write =========="
4714
4715 test_36g() {
4716         remote_ost_nodsh && skip "remote OST with nodsh"
4717         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4718         [ $MDS1_VERSION -lt $(version_code 2.12.51) ] &&
4719                 skip "Need MDS version at least 2.12.51"
4720
4721         local fmd_max_age
4722         local fmd
4723         local facet="ost1"
4724         local tgt="obdfilter"
4725
4726         [[ $OSC == "mdc" ]] && tgt="mdt" && facet="mds1"
4727
4728         test_mkdir $DIR/$tdir
4729         fmd_max_age=$(do_facet $facet \
4730                 "lctl get_param -n $tgt.*.tgt_fmd_seconds 2> /dev/null | \
4731                 head -n 1")
4732
4733         echo "FMD max age: ${fmd_max_age}s"
4734         touch $DIR/$tdir/$tfile
4735         fmd=$(do_facet $facet "lctl get_param -n $tgt.*.exports.*.fmd_count" |
4736                 gawk '{cnt=cnt+$1}  END{print cnt}')
4737         echo "FMD before: $fmd"
4738         [[ $fmd == 0 ]] &&
4739                 error "FMD wasn't create by touch"
4740         sleep $((fmd_max_age + 12))
4741         fmd=$(do_facet $facet "lctl get_param -n $tgt.*.exports.*.fmd_count" |
4742                 gawk '{cnt=cnt+$1}  END{print cnt}')
4743         echo "FMD after: $fmd"
4744         [[ $fmd == 0 ]] ||
4745                 error "FMD wasn't expired by ping"
4746 }
4747 run_test 36g "FMD cache expiry ====================="
4748
4749 test_36h() {
4750         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4751
4752         #define OBD_FAIL_OST_BRW_PAUSE_BULK2 0x227
4753         subr_36fh "0x80000227"
4754 }
4755 run_test 36h "utime on file racing with OST BRW write =========="
4756
4757 test_36i() {
4758         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
4759
4760         test_mkdir $DIR/$tdir
4761         $LFS setdirstripe -i0 -c$MDSCOUNT $DIR/$tdir/striped_dir
4762
4763         local mtime=$(stat -c%Y $DIR/$tdir/striped_dir)
4764         local new_mtime=$((mtime + 200))
4765
4766         #change Modify time of striped dir
4767         touch -m -d @$new_mtime $DIR/$tdir/striped_dir ||
4768                         error "change mtime failed"
4769
4770         local got=$(stat -c%Y $DIR/$tdir/striped_dir)
4771
4772         [ "$new_mtime" = "$got" ] || error "expect $new_mtime got $got"
4773 }
4774 run_test 36i "change mtime on striped directory"
4775
4776 # test_37 - duplicate with tests 32q 32r
4777
4778 test_38() {
4779         local file=$DIR/$tfile
4780         touch $file
4781         openfile -f O_DIRECTORY $file
4782         local RC=$?
4783         local ENOTDIR=20
4784         [ $RC -eq 0 ] && error "opened file $file with O_DIRECTORY" || true
4785         [ $RC -eq $ENOTDIR ] || error "error $RC should be ENOTDIR ($ENOTDIR)"
4786 }
4787 run_test 38 "open a regular file with O_DIRECTORY should return -ENOTDIR ==="
4788
4789 test_39a() { # was test_39
4790         touch $DIR/$tfile
4791         touch $DIR/${tfile}2
4792 #       ls -l  $DIR/$tfile $DIR/${tfile}2
4793 #       ls -lu  $DIR/$tfile $DIR/${tfile}2
4794 #       ls -lc  $DIR/$tfile $DIR/${tfile}2
4795         sleep 2
4796         $OPENFILE -f O_CREAT:O_TRUNC:O_WRONLY $DIR/${tfile}2
4797         if [ ! $DIR/${tfile}2 -nt $DIR/$tfile ]; then
4798                 echo "mtime"
4799                 ls -l --full-time $DIR/$tfile $DIR/${tfile}2
4800                 echo "atime"
4801                 ls -lu --full-time $DIR/$tfile $DIR/${tfile}2
4802                 echo "ctime"
4803                 ls -lc --full-time $DIR/$tfile $DIR/${tfile}2
4804                 error "O_TRUNC didn't change timestamps"
4805         fi
4806 }
4807 run_test 39a "mtime changed on create"
4808
4809 test_39b() {
4810         test_mkdir -c1 $DIR/$tdir
4811         cp -p /etc/passwd $DIR/$tdir/fopen
4812         cp -p /etc/passwd $DIR/$tdir/flink
4813         cp -p /etc/passwd $DIR/$tdir/funlink
4814         cp -p /etc/passwd $DIR/$tdir/frename
4815         ln $DIR/$tdir/funlink $DIR/$tdir/funlink2
4816
4817         sleep 1
4818         echo "aaaaaa" >> $DIR/$tdir/fopen
4819         echo "aaaaaa" >> $DIR/$tdir/flink
4820         echo "aaaaaa" >> $DIR/$tdir/funlink
4821         echo "aaaaaa" >> $DIR/$tdir/frename
4822
4823         local open_new=`stat -c %Y $DIR/$tdir/fopen`
4824         local link_new=`stat -c %Y $DIR/$tdir/flink`
4825         local unlink_new=`stat -c %Y $DIR/$tdir/funlink`
4826         local rename_new=`stat -c %Y $DIR/$tdir/frename`
4827
4828         cat $DIR/$tdir/fopen > /dev/null
4829         ln $DIR/$tdir/flink $DIR/$tdir/flink2
4830         rm -f $DIR/$tdir/funlink2
4831         mv -f $DIR/$tdir/frename $DIR/$tdir/frename2
4832
4833         for (( i=0; i < 2; i++ )) ; do
4834                 local open_new2=`stat -c %Y $DIR/$tdir/fopen`
4835                 local link_new2=`stat -c %Y $DIR/$tdir/flink`
4836                 local unlink_new2=`stat -c %Y $DIR/$tdir/funlink`
4837                 local rename_new2=`stat -c %Y $DIR/$tdir/frename2`
4838
4839                 [ $open_new2 -eq $open_new ] || error "open file reverses mtime"
4840                 [ $link_new2 -eq $link_new ] || error "link file reverses mtime"
4841                 [ $unlink_new2 -eq $unlink_new ] || error "unlink file reverses mtime"
4842                 [ $rename_new2 -eq $rename_new ] || error "rename file reverses mtime"
4843
4844                 cancel_lru_locks $OSC
4845                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4846         done
4847 }
4848 run_test 39b "mtime change on open, link, unlink, rename  ======"
4849
4850 # this should be set to past
4851 TEST_39_MTIME=`date -d "1 year ago" +%s`
4852
4853 # bug 11063
4854 test_39c() {
4855         touch $DIR1/$tfile
4856         sleep 2
4857         local mtime0=`stat -c %Y $DIR1/$tfile`
4858
4859         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
4860         local mtime1=`stat -c %Y $DIR1/$tfile`
4861         [ "$mtime1" = $TEST_39_MTIME ] || \
4862                 error "mtime is not set to past: $mtime1, should be $TEST_39_MTIME"
4863
4864         local d1=`date +%s`
4865         echo hello >> $DIR1/$tfile
4866         local d2=`date +%s`
4867         local mtime2=`stat -c %Y $DIR1/$tfile`
4868         [ "$mtime2" -ge "$d1" ] && [ "$mtime2" -le "$d2" ] || \
4869                 error "mtime is not updated on write: $d1 <= $mtime2 <= $d2"
4870
4871         mv $DIR1/$tfile $DIR1/$tfile-1
4872
4873         for (( i=0; i < 2; i++ )) ; do
4874                 local mtime3=`stat -c %Y $DIR1/$tfile-1`
4875                 [ "$mtime2" = "$mtime3" ] || \
4876                         error "mtime ($mtime2) changed (to $mtime3) on rename"
4877
4878                 cancel_lru_locks $OSC
4879                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4880         done
4881 }
4882 run_test 39c "mtime change on rename ==========================="
4883
4884 # bug 21114
4885 test_39d() {
4886         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4887
4888         touch $DIR1/$tfile
4889         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
4890
4891         for (( i=0; i < 2; i++ )) ; do
4892                 local mtime=`stat -c %Y $DIR1/$tfile`
4893                 [ $mtime = $TEST_39_MTIME ] || \
4894                         error "mtime($mtime) is not set to $TEST_39_MTIME"
4895
4896                 cancel_lru_locks $OSC
4897                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4898         done
4899 }
4900 run_test 39d "create, utime, stat =============================="
4901
4902 # bug 21114
4903 test_39e() {
4904         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4905
4906         touch $DIR1/$tfile
4907         local mtime1=`stat -c %Y $DIR1/$tfile`
4908
4909         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
4910
4911         for (( i=0; i < 2; i++ )) ; do
4912                 local mtime2=`stat -c %Y $DIR1/$tfile`
4913                 [ $mtime2 = $TEST_39_MTIME ] || \
4914                         error "mtime($mtime2) is not set to $TEST_39_MTIME"
4915
4916                 cancel_lru_locks $OSC
4917                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4918         done
4919 }
4920 run_test 39e "create, stat, utime, stat ========================"
4921
4922 # bug 21114
4923 test_39f() {
4924         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4925
4926         touch $DIR1/$tfile
4927         mtime1=`stat -c %Y $DIR1/$tfile`
4928
4929         sleep 2
4930         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
4931
4932         for (( i=0; i < 2; i++ )) ; do
4933                 local mtime2=`stat -c %Y $DIR1/$tfile`
4934                 [ $mtime2 = $TEST_39_MTIME ] || \
4935                         error "mtime($mtime2) is not set to $TEST_39_MTIME"
4936
4937                 cancel_lru_locks $OSC
4938                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4939         done
4940 }
4941 run_test 39f "create, stat, sleep, utime, stat ================="
4942
4943 # bug 11063
4944 test_39g() {
4945         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4946
4947         echo hello >> $DIR1/$tfile
4948         local mtime1=`stat -c %Y $DIR1/$tfile`
4949
4950         sleep 2
4951         chmod o+r $DIR1/$tfile
4952
4953         for (( i=0; i < 2; i++ )) ; do
4954                 local mtime2=`stat -c %Y $DIR1/$tfile`
4955                 [ "$mtime1" = "$mtime2" ] || \
4956                         error "lost mtime: $mtime2, should be $mtime1"
4957
4958                 cancel_lru_locks $OSC
4959                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4960         done
4961 }
4962 run_test 39g "write, chmod, stat ==============================="
4963
4964 # bug 11063
4965 test_39h() {
4966         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4967
4968         touch $DIR1/$tfile
4969         sleep 1
4970
4971         local d1=`date`
4972         echo hello >> $DIR1/$tfile
4973         local mtime1=`stat -c %Y $DIR1/$tfile`
4974
4975         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
4976         local d2=`date`
4977         if [ "$d1" != "$d2" ]; then
4978                 echo "write and touch not within one second"
4979         else
4980                 for (( i=0; i < 2; i++ )) ; do
4981                         local mtime2=`stat -c %Y $DIR1/$tfile`
4982                         [ "$mtime2" = $TEST_39_MTIME ] || \
4983                                 error "lost mtime: $mtime2, should be $TEST_39_MTIME"
4984
4985                         cancel_lru_locks $OSC
4986                         if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
4987                 done
4988         fi
4989 }
4990 run_test 39h "write, utime within one second, stat ============="
4991
4992 test_39i() {
4993         [ $PARALLEL == "yes" ] && skip "skip parallel run"
4994
4995         touch $DIR1/$tfile
4996         sleep 1
4997
4998         echo hello >> $DIR1/$tfile
4999         local mtime1=`stat -c %Y $DIR1/$tfile`
5000
5001         mv $DIR1/$tfile $DIR1/$tfile-1
5002
5003         for (( i=0; i < 2; i++ )) ; do
5004                 local mtime2=`stat -c %Y $DIR1/$tfile-1`
5005
5006                 [ "$mtime1" = "$mtime2" ] || \
5007                         error "lost mtime: $mtime2, should be $mtime1"
5008
5009                 cancel_lru_locks $OSC
5010                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
5011         done
5012 }
5013 run_test 39i "write, rename, stat =============================="
5014
5015 test_39j() {
5016         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5017
5018         start_full_debug_logging
5019         touch $DIR1/$tfile
5020         sleep 1
5021
5022         #define OBD_FAIL_OSC_DELAY_SETTIME       0x412
5023         lctl set_param fail_loc=0x80000412
5024         multiop_bg_pause $DIR1/$tfile oO_RDWR:w2097152_c ||
5025                 error "multiop failed"
5026         local multipid=$!
5027         local mtime1=`stat -c %Y $DIR1/$tfile`
5028
5029         mv $DIR1/$tfile $DIR1/$tfile-1
5030
5031         kill -USR1 $multipid
5032         wait $multipid || error "multiop close failed"
5033
5034         for (( i=0; i < 2; i++ )) ; do
5035                 local mtime2=`stat -c %Y $DIR1/$tfile-1`
5036                 [ "$mtime1" = "$mtime2" ] ||
5037                         error "mtime is lost on close: $mtime2, " \
5038                               "should be $mtime1"
5039
5040                 cancel_lru_locks
5041                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
5042         done
5043         lctl set_param fail_loc=0
5044         stop_full_debug_logging
5045 }
5046 run_test 39j "write, rename, close, stat ======================="
5047
5048 test_39k() {
5049         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5050
5051         touch $DIR1/$tfile
5052         sleep 1
5053
5054         multiop_bg_pause $DIR1/$tfile oO_RDWR:w2097152_c || error "multiop failed"
5055         local multipid=$!
5056         local mtime1=`stat -c %Y $DIR1/$tfile`
5057
5058         touch -m -d @$TEST_39_MTIME $DIR1/$tfile
5059
5060         kill -USR1 $multipid
5061         wait $multipid || error "multiop close failed"
5062
5063         for (( i=0; i < 2; i++ )) ; do
5064                 local mtime2=`stat -c %Y $DIR1/$tfile`
5065
5066                 [ "$mtime2" = $TEST_39_MTIME ] || \
5067                         error "mtime is lost on close: $mtime2, should be $TEST_39_MTIME"
5068
5069                 cancel_lru_locks
5070                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
5071         done
5072 }
5073 run_test 39k "write, utime, close, stat ========================"
5074
5075 # this should be set to future
5076 TEST_39_ATIME=`date -d "1 year" +%s`
5077
5078 test_39l() {
5079         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5080         remote_mds_nodsh && skip "remote MDS with nodsh"
5081
5082         local atime_diff=$(do_facet $SINGLEMDS \
5083                                 lctl get_param -n mdd.*MDT0000*.atime_diff)
5084         rm -rf $DIR/$tdir
5085         mkdir_on_mdt0 $DIR/$tdir
5086
5087         # test setting directory atime to future
5088         touch -a -d @$TEST_39_ATIME $DIR/$tdir
5089         local atime=$(stat -c %X $DIR/$tdir)
5090         [ "$atime" = $TEST_39_ATIME ] ||
5091                 error "atime is not set to future: $atime, $TEST_39_ATIME"
5092
5093         # test setting directory atime from future to now
5094         local now=$(date +%s)
5095         touch -a -d @$now $DIR/$tdir
5096
5097         atime=$(stat -c %X $DIR/$tdir)
5098         [ "$atime" -eq "$now"  ] ||
5099                 error "atime is not updated from future: $atime, $now"
5100
5101         do_facet $SINGLEMDS lctl set_param -n mdd.*MDT0000*.atime_diff=2
5102         sleep 3
5103
5104         # test setting directory atime when now > dir atime + atime_diff
5105         local d1=$(date +%s)
5106         ls $DIR/$tdir
5107         local d2=$(date +%s)
5108         cancel_lru_locks mdc
5109         atime=$(stat -c %X $DIR/$tdir)
5110         [ "$atime" -ge "$d1" -a "$atime" -le "$d2" ] ||
5111                 error "atime is not updated  : $atime, should be $d2"
5112
5113         do_facet $SINGLEMDS lctl set_param -n mdd.*MDT0000*.atime_diff=60
5114         sleep 3
5115
5116         # test not setting directory atime when now < dir atime + atime_diff
5117         ls $DIR/$tdir
5118         cancel_lru_locks mdc
5119         atime=$(stat -c %X $DIR/$tdir)
5120         [ "$atime" -ge "$d1" -a "$atime" -le "$d2" ] ||
5121                 error "atime is updated to $atime, should remain $d1<atime<$d2"
5122
5123         do_facet $SINGLEMDS \
5124                 lctl set_param -n mdd.*MDT0000*.atime_diff=$atime_diff
5125 }
5126 run_test 39l "directory atime update ==========================="
5127
5128 test_39m() {
5129         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5130
5131         touch $DIR1/$tfile
5132         sleep 2
5133         local far_past_mtime=$(date -d "May 29 1953" +%s)
5134         local far_past_atime=$(date -d "Dec 17 1903" +%s)
5135
5136         touch -m -d @$far_past_mtime $DIR1/$tfile
5137         touch -a -d @$far_past_atime $DIR1/$tfile
5138
5139         for (( i=0; i < 2; i++ )) ; do
5140                 local timestamps=$(stat -c "%X %Y" $DIR1/$tfile)
5141                 [ "$timestamps" = "$far_past_atime $far_past_mtime" ] || \
5142                         error "atime or mtime set incorrectly"
5143
5144                 cancel_lru_locks $OSC
5145                 if [ $i = 0 ] ; then echo "repeat after cancel_lru_locks"; fi
5146         done
5147 }
5148 run_test 39m "test atime and mtime before 1970"
5149
5150 test_39n() { # LU-3832
5151         remote_mds_nodsh && skip "remote MDS with nodsh"
5152
5153         local atime_diff=$(do_facet $SINGLEMDS \
5154                 lctl get_param -n mdd.*MDT0000*.atime_diff)
5155         local atime0
5156         local atime1
5157         local atime2
5158
5159         do_facet $SINGLEMDS lctl set_param -n mdd.*MDT0000*.atime_diff=1
5160
5161         rm -rf $DIR/$tfile
5162         dd if=/dev/zero of=$DIR/$tfile bs=4096 count=1 status=noxfer
5163         atime0=$(stat -c %X $DIR/$tfile)
5164
5165         sleep 5
5166         $MULTIOP $DIR/$tfile oO_RDONLY:O_NOATIME:r4096c
5167         atime1=$(stat -c %X $DIR/$tfile)
5168
5169         sleep 5
5170         cancel_lru_locks mdc
5171         cancel_lru_locks osc
5172         $MULTIOP $DIR/$tfile oO_RDONLY:O_NOATIME:r4096c
5173         atime2=$(stat -c %X $DIR/$tfile)
5174
5175         do_facet $SINGLEMDS \
5176                 lctl set_param -n mdd.*MDT0000*.atime_diff=$atime_diff
5177
5178         [ "$atime0" -eq "$atime1" ] || error "atime0 $atime0 != atime1 $atime1"
5179         [ "$atime1" -eq "$atime2" ] || error "atime0 $atime0 != atime1 $atime1"
5180 }
5181 run_test 39n "check that O_NOATIME is honored"
5182
5183 test_39o() {
5184         TESTDIR=$DIR/$tdir/$tfile
5185         [ -e $TESTDIR ] && rm -rf $TESTDIR
5186         mkdir -p $TESTDIR
5187         cd $TESTDIR
5188         links1=2
5189         ls
5190         mkdir a b
5191         ls
5192         links2=$(stat -c %h .)
5193         [ $(($links1 + 2)) != $links2 ] &&
5194                 error "wrong links count $(($links1 + 2)) != $links2"
5195         rmdir b
5196         links3=$(stat -c %h .)
5197         [ $(($links1 + 1)) != $links3 ] &&
5198                 error "wrong links count $links1 != $links3"
5199         return 0
5200 }
5201 run_test 39o "directory cached attributes updated after create"
5202
5203 test_39p() {
5204         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
5205
5206         local MDTIDX=1
5207         TESTDIR=$DIR/$tdir/$tdir
5208         [ -e $TESTDIR ] && rm -rf $TESTDIR
5209         test_mkdir -p $TESTDIR
5210         cd $TESTDIR
5211         links1=2
5212         ls
5213         test_mkdir -i $MDTIDX $TESTDIR/remote_dir1
5214         test_mkdir -i $MDTIDX $TESTDIR/remote_dir2
5215         ls
5216         links2=$(stat -c %h .)
5217         [ $(($links1 + 2)) != $links2 ] &&
5218                 error "wrong links count $(($links1 + 2)) != $links2"
5219         rmdir remote_dir2
5220         links3=$(stat -c %h .)
5221         [ $(($links1 + 1)) != $links3 ] &&
5222                 error "wrong links count $links1 != $links3"
5223         return 0
5224 }
5225 run_test 39p "remote directory cached attributes updated after create ========"
5226
5227 test_39r() {
5228         [ $OST1_VERSION -ge $(version_code 2.13.52) ] ||
5229                 skip "no atime update on old OST"
5230         if [ "$ost1_FSTYPE" != ldiskfs ]; then
5231                 skip_env "ldiskfs only test"
5232         fi
5233
5234         local saved_adiff
5235         saved_adiff=$(do_facet ost1 \
5236                 lctl get_param -n obdfilter.*OST0000.atime_diff)
5237         stack_trap "do_facet ost1 \
5238                 lctl set_param obdfilter.*.atime_diff=$saved_adiff"
5239
5240         do_facet ost1 "lctl set_param obdfilter.*.atime_diff=5"
5241
5242         $LFS setstripe -i 0 $DIR/$tfile
5243         dd if=/dev/zero of=$DIR/$tfile bs=4k count=1 ||
5244                 error "can't write initial file"
5245         cancel_lru_locks osc
5246
5247         # exceed atime_diff and access file
5248         sleep 10
5249         dd if=$DIR/$tfile of=/dev/null bs=4k count=1 ||
5250                 error "can't udpate atime"
5251
5252         local atime_cli=$(stat -c %X $DIR/$tfile)
5253         echo "client atime: $atime_cli"
5254         # allow atime update to be written to device
5255         do_facet ost1 "$LCTL set_param -n osd*.*OST*.force_sync 1"
5256         sleep 5
5257
5258         local ostdev=$(ostdevname 1)
5259         local fid=($($LFS getstripe $DIR/$tfile | grep 0x))
5260         local seq=${fid[3]#0x}
5261         local oid=${fid[1]}
5262         local oid_hex
5263
5264         if [ $seq == 0 ]; then
5265                 oid_hex=${fid[1]}
5266         else
5267                 oid_hex=${fid[2]#0x}
5268         fi
5269         local objpath="O/$seq/d$(($oid % 32))/$oid_hex"
5270         local cmd="debugfs -c -R \\\"stat $objpath\\\" $ostdev"
5271
5272         echo "OST atime: $(do_facet ost1 "$cmd" |& grep atime)"
5273         local atime_ost=$(do_facet ost1 "$cmd" |&
5274                           awk -F'[: ]' '/atime:/ { print $4 }')
5275         (( atime_cli == atime_ost )) ||
5276                 error "atime on client $atime_cli != ost $atime_ost"
5277 }
5278 run_test 39r "lazy atime update on OST"
5279
5280 test_39q() { # LU-8041
5281         local testdir=$DIR/$tdir
5282         mkdir -p $testdir
5283         multiop_bg_pause $testdir D_c || error "multiop failed"
5284         local multipid=$!
5285         cancel_lru_locks mdc
5286         kill -USR1 $multipid
5287         local atime=$(stat -c %X $testdir)
5288         [ "$atime" -ne 0 ] || error "atime is zero"
5289 }
5290 run_test 39q "close won't zero out atime"
5291
5292 test_39s() {
5293         local atime0
5294         local atime1
5295         local atime2
5296         local atime3
5297         local atime4
5298
5299         umount_client $MOUNT
5300         mount_client $MOUNT relatime
5301
5302         dd if=/dev/zero of=$DIR/$tfile bs=4096 count=1 status=noxfer conv=fsync
5303         atime0=$(stat -c %X $DIR/$tfile)
5304
5305         # First read updates atime
5306         sleep 1
5307         cat $DIR/$tfile >/dev/null
5308         atime1=$(stat -c %X $DIR/$tfile) # (atime = atime0 + 1)
5309
5310         # Next reads do not update atime
5311         sleep 1
5312         cat $DIR/$tfile >/dev/null
5313         atime2=$(stat -c %X $DIR/$tfile) # (atime = atime0 + 1)
5314
5315         # If mtime is greater than atime, atime is updated
5316         sleep 1
5317         touch -m $DIR/$tfile # (mtime = now)
5318         sleep 1
5319         cat $DIR/$tfile >/dev/null # (atime is updated because atime < mtime)
5320         atime3=$(stat -c %X $DIR/$tfile) # (atime = mtime = atime0 + 3)
5321
5322         # Next reads do not update atime
5323         sleep 1
5324         cat $DIR/$tfile >/dev/null
5325         atime4=$(stat -c %X $DIR/$tfile)
5326
5327         # Remount the client to clear 'relatime' option
5328         remount_client $MOUNT
5329
5330         (( atime0 < atime1 )) ||
5331                 error "atime $atime0 should be smaller than $atime1"
5332         (( atime1 == atime2 )) ||
5333                 error "atime $atime1 was updated to $atime2"
5334         (( atime1 < atime3 )) || error "atime1 $atime1 != atime3 $atime3"
5335         (( atime3 == atime4 )) || error "atime3 $atime3 != atime4 $atime4"
5336 }
5337 run_test 39s "relatime is supported"
5338
5339 test_40() {
5340         dd if=/dev/zero of=$DIR/$tfile bs=4096 count=1
5341         $RUNAS $OPENFILE -f O_WRONLY:O_TRUNC $DIR/$tfile &&
5342                 error "openfile O_WRONLY:O_TRUNC $tfile failed"
5343         $CHECKSTAT -t file -s 4096 $DIR/$tfile ||
5344                 error "$tfile is not 4096 bytes in size"
5345 }
5346 run_test 40 "failed open(O_TRUNC) doesn't truncate ============="
5347
5348 test_41() {
5349         # bug 1553
5350         small_write $DIR/f41 18
5351 }
5352 run_test 41 "test small file write + fstat ====================="
5353
5354 count_ost_writes() {
5355         lctl get_param -n ${OSC}.*.stats |
5356                 awk -vwrites=0 '/ost_write/ { writes += $2 } \
5357                         END { printf("%0.0f", writes) }'
5358 }
5359
5360 # decent default
5361 WRITEBACK_SAVE=500
5362 DIRTY_RATIO_SAVE=40
5363 MAX_DIRTY_RATIO=50
5364 BG_DIRTY_RATIO_SAVE=10
5365 MAX_BG_DIRTY_RATIO=25
5366
5367 start_writeback() {
5368         trap 0
5369         # in 2.6, restore /proc/sys/vm/dirty_writeback_centisecs,
5370         # dirty_ratio, dirty_background_ratio
5371         if [ -f /proc/sys/vm/dirty_writeback_centisecs ]; then
5372                 sysctl -w vm.dirty_writeback_centisecs=$WRITEBACK_SAVE
5373                 sysctl -w vm.dirty_background_ratio=$BG_DIRTY_RATIO_SAVE
5374                 sysctl -w vm.dirty_ratio=$DIRTY_RATIO_SAVE
5375         else
5376                 # if file not here, we are a 2.4 kernel
5377                 kill -CONT `pidof kupdated`
5378         fi
5379 }
5380
5381 stop_writeback() {
5382         # setup the trap first, so someone cannot exit the test at the
5383         # exact wrong time and mess up a machine
5384         trap start_writeback EXIT
5385         # in 2.6, save and 0 /proc/sys/vm/dirty_writeback_centisecs
5386         if [ -f /proc/sys/vm/dirty_writeback_centisecs ]; then
5387                 WRITEBACK_SAVE=`sysctl -n vm.dirty_writeback_centisecs`
5388                 sysctl -w vm.dirty_writeback_centisecs=0
5389                 sysctl -w vm.dirty_writeback_centisecs=0
5390                 # save and increase /proc/sys/vm/dirty_ratio
5391                 DIRTY_RATIO_SAVE=`sysctl -n vm.dirty_ratio`
5392                 sysctl -w vm.dirty_ratio=$MAX_DIRTY_RATIO
5393                 # save and increase /proc/sys/vm/dirty_background_ratio
5394                 BG_DIRTY_RATIO_SAVE=`sysctl -n vm.dirty_background_ratio`
5395                 sysctl -w vm.dirty_background_ratio=$MAX_BG_DIRTY_RATIO
5396         else
5397                 # if file not here, we are a 2.4 kernel
5398                 kill -STOP `pidof kupdated`
5399         fi
5400 }
5401
5402 # ensure that all stripes have some grant before we test client-side cache
5403 setup_test42() {
5404         for i in `seq -f $DIR/f42-%g 1 $OSTCOUNT`; do
5405                 dd if=/dev/zero of=$i bs=4k count=1
5406                 rm $i
5407         done
5408 }
5409
5410 # Tests 42* verify that our behaviour is correct WRT caching, file closure,
5411 # file truncation, and file removal.
5412 test_42a() {
5413         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5414
5415         setup_test42
5416         cancel_lru_locks $OSC
5417         stop_writeback
5418         sync; sleep 1; sync # just to be safe
5419         BEFOREWRITES=`count_ost_writes`
5420         lctl get_param -n osc.*[oO][sS][cC][_-]*.cur_grant_bytes | grep "[0-9]"
5421         dd if=/dev/zero of=$DIR/f42a bs=1024 count=100
5422         AFTERWRITES=`count_ost_writes`
5423         [ $BEFOREWRITES -eq $AFTERWRITES ] || \
5424                 error "$BEFOREWRITES < $AFTERWRITES"
5425         start_writeback
5426 }
5427 run_test 42a "ensure that we don't flush on close"
5428
5429 test_42b() {
5430         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5431
5432         setup_test42
5433         cancel_lru_locks $OSC
5434         stop_writeback
5435         sync
5436         dd if=/dev/zero of=$DIR/f42b bs=1024 count=100
5437         BEFOREWRITES=$(count_ost_writes)
5438         $MUNLINK $DIR/f42b || error "$MUNLINK $DIR/f42b: $?"
5439         AFTERWRITES=$(count_ost_writes)
5440         if [[ $BEFOREWRITES -lt $AFTERWRITES ]]; then
5441                 error "$BEFOREWRITES < $AFTERWRITES on unlink"
5442         fi
5443         BEFOREWRITES=$(count_ost_writes)
5444         sync || error "sync: $?"
5445         AFTERWRITES=$(count_ost_writes)
5446         if [[ $BEFOREWRITES -lt $AFTERWRITES ]]; then
5447                 error "$BEFOREWRITES < $AFTERWRITES on sync"
5448         fi
5449         dmesg | grep 'error from obd_brw_async' && error 'error writing back'
5450         start_writeback
5451         return 0
5452 }
5453 run_test 42b "test destroy of file with cached dirty data ======"
5454
5455 # if these tests just want to test the effect of truncation,
5456 # they have to be very careful.  consider:
5457 # - the first open gets a {0,EOF}PR lock
5458 # - the first write conflicts and gets a {0, count-1}PW
5459 # - the rest of the writes are under {count,EOF}PW
5460 # - the open for truncate tries to match a {0,EOF}PR
5461 #   for the filesize and cancels the PWs.
5462 # any number of fixes (don't get {0,EOF} on open, match
5463 # composite locks, do smarter file size management) fix
5464 # this, but for now we want these tests to verify that
5465 # the cancellation with truncate intent works, so we
5466 # start the file with a full-file pw lock to match against
5467 # until the truncate.
5468 trunc_test() {
5469         test=$1
5470         file=$DIR/$test
5471         offset=$2
5472         cancel_lru_locks $OSC
5473         stop_writeback
5474         # prime the file with 0,EOF PW to match
5475         touch $file
5476         $TRUNCATE $file 0
5477         sync; sync
5478         # now the real test..
5479         dd if=/dev/zero of=$file bs=1024 count=100
5480         BEFOREWRITES=`count_ost_writes`
5481         $TRUNCATE $file $offset
5482         cancel_lru_locks $OSC
5483         AFTERWRITES=`count_ost_writes`
5484         start_writeback
5485 }
5486
5487 test_42c() {
5488         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5489
5490         trunc_test 42c 1024
5491         [ $BEFOREWRITES -eq $AFTERWRITES ] &&
5492                 error "beforewrites $BEFOREWRITES == afterwrites $AFTERWRITES on truncate"
5493         rm $file
5494 }
5495 run_test 42c "test partial truncate of file with cached dirty data"
5496
5497 test_42d() {
5498         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5499
5500         local olddebug="$($LCTL get_param -n debug 2> /dev/null)"
5501         stack_trap "$LCTL set_param -n debug='$olddebug'" EXIT
5502         $LCTL set_param debug=+cache
5503
5504         trunc_test 42d 0
5505         [ $BEFOREWRITES -eq $AFTERWRITES ] ||
5506                 error "beforewrites $BEFOREWRITES != afterwrites $AFTERWRITES on truncate"
5507         rm $file
5508 }
5509 run_test 42d "test complete truncate of file with cached dirty data"
5510
5511 test_42e() { # bug22074
5512         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5513
5514         local TDIR=$DIR/${tdir}e
5515         local pages=16 # hardcoded 16 pages, don't change it.
5516         local files=$((OSTCOUNT * 500)) # hopefully 500 files on each OST
5517         local proc_osc0="osc.${FSNAME}-OST0000-osc-[^MDT]*"
5518         local max_dirty_mb
5519         local warmup_files
5520
5521         test_mkdir $DIR/${tdir}e
5522         $LFS setstripe -c 1 $TDIR
5523         createmany -o $TDIR/f $files
5524
5525         max_dirty_mb=$($LCTL get_param -n $proc_osc0/max_dirty_mb)
5526
5527         # we assume that with $OSTCOUNT files, at least one of them will
5528         # be allocated on OST0.
5529         warmup_files=$((OSTCOUNT * max_dirty_mb))
5530         createmany -o $TDIR/w $warmup_files
5531
5532         # write a large amount of data into one file and sync, to get good
5533         # avail_grant number from OST.
5534         for ((i=0; i<$warmup_files; i++)); do
5535                 idx=$($LFS getstripe -i $TDIR/w$i)
5536                 [ $idx -ne 0 ] && continue
5537                 dd if=/dev/zero of=$TDIR/w$i bs="$max_dirty_mb"M count=1
5538                 break
5539         done
5540         [[ $i -gt $warmup_files ]] && error "OST0 is still cold"
5541         sync
5542         $LCTL get_param $proc_osc0/cur_dirty_bytes
5543         $LCTL get_param $proc_osc0/cur_grant_bytes
5544
5545         # create as much dirty pages as we can while not to trigger the actual
5546         # RPCs directly. but depends on the env, VFS may trigger flush during this
5547         # period, hopefully we are good.
5548         for ((i=0; i<$warmup_files; i++)); do
5549                 idx=$($LFS getstripe -i $TDIR/w$i)
5550                 [ $idx -ne 0 ] && continue
5551                 dd if=/dev/zero of=$TDIR/w$i bs=1M count=1 2>/dev/null
5552         done
5553         $LCTL get_param $proc_osc0/cur_dirty_bytes
5554         $LCTL get_param $proc_osc0/cur_grant_bytes
5555
5556         # perform the real test
5557         $LCTL set_param $proc_osc0/rpc_stats 0
5558         for ((;i<$files; i++)); do
5559                 [ $($LFS getstripe -i $TDIR/f$i) -eq 0 ] || continue
5560                 dd if=/dev/zero of=$TDIR/f$i bs=$PAGE_SIZE count=$pages 2>/dev/null
5561         done
5562         sync
5563         $LCTL get_param $proc_osc0/rpc_stats
5564
5565         local percent=0
5566         local have_ppr=false
5567         $LCTL get_param $proc_osc0/rpc_stats |
5568                 while read PPR RRPC RPCT RCUM BAR WRPC WPCT WCUM; do
5569                         # skip lines until we are at the RPC histogram data
5570                         [ "$PPR" == "pages" ] && have_ppr=true && continue
5571                         $have_ppr || continue
5572
5573                         # we only want the percent stat for < 16 pages
5574                         [[ $(echo $PPR | tr -d ':') -ge $pages ]] && break
5575
5576                         percent=$((percent + WPCT))
5577                         if [[ $percent -gt 15 ]]; then
5578                                 error "less than 16-pages write RPCs" \
5579                                       "$percent% > 15%"
5580                                 break
5581                         fi
5582                 done
5583         rm -rf $TDIR
5584 }
5585 run_test 42e "verify sub-RPC writes are not done synchronously"
5586
5587 test_43A() { # was test_43
5588         test_mkdir $DIR/$tdir
5589         cp -p /bin/ls $DIR/$tdir/$tfile
5590         $MULTIOP $DIR/$tdir/$tfile Ow_c &
5591         pid=$!
5592         # give multiop a chance to open
5593         sleep 1
5594
5595         $DIR/$tdir/$tfile && error "execute $DIR/$tdir/$tfile succeeded" || true
5596         kill -USR1 $pid
5597         # Wait for multiop to exit
5598         wait $pid
5599 }
5600 run_test 43A "execution of file opened for write should return -ETXTBSY"
5601
5602 test_43a() {
5603         test_mkdir $DIR/$tdir
5604         cp -p $(which sleep) $DIR/$tdir/sleep || error "can't copy"
5605         $DIR/$tdir/sleep 60 &
5606         SLEEP_PID=$!
5607         # Make sure exec of $tdir/sleep wins race with truncate
5608         sleep 1
5609         $MULTIOP $DIR/$tdir/sleep Oc && error "expected error, got success"
5610         kill $SLEEP_PID
5611 }
5612 run_test 43a "open(RDWR) of file being executed should return -ETXTBSY"
5613
5614 test_43b() {
5615         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5616
5617         test_mkdir $DIR/$tdir
5618         cp -p $(which sleep) $DIR/$tdir/sleep || error "can't copy"
5619         $DIR/$tdir/sleep 60 &
5620         SLEEP_PID=$!
5621         # Make sure exec of $tdir/sleep wins race with truncate
5622         sleep 1
5623         $TRUNCATE $DIR/$tdir/sleep 0 && error "expected error, got success"
5624         kill $SLEEP_PID
5625 }
5626 run_test 43b "truncate of file being executed should return -ETXTBSY"
5627
5628 test_43c() {
5629         local testdir="$DIR/$tdir"
5630         test_mkdir $testdir
5631         cp $SHELL $testdir/
5632         ( cd $(dirname $SHELL) && md5sum $(basename $SHELL) ) |
5633                 ( cd $testdir && md5sum -c )
5634 }
5635 run_test 43c "md5sum of copy into lustre"
5636
5637 test_44A() { # was test_44
5638         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
5639
5640         dd if=/dev/zero of=$DIR/f1 bs=4k count=1 seek=1023
5641         dd if=$DIR/f1 bs=4k count=1 > /dev/null
5642 }
5643 run_test 44A "zero length read from a sparse stripe"
5644
5645 test_44a() {
5646         local nstripe=$($LFS getstripe -c -d $DIR)
5647         [ -z "$nstripe" ] && skip "can't get stripe info"
5648         [[ $nstripe -gt $OSTCOUNT ]] &&
5649                 skip "Wrong default stripe_count: $nstripe OSTCOUNT: $OSTCOUNT"
5650
5651         local stride=$($LFS getstripe -S -d $DIR)
5652         if [[ $nstripe -eq 0 || $nstripe -eq -1 ]]; then
5653                 nstripe=$($LFS df $DIR | grep OST: | wc -l)
5654         fi
5655
5656         OFFSETS="0 $((stride/2)) $((stride-1))"
5657         for offset in $OFFSETS; do
5658                 for i in $(seq 0 $((nstripe-1))); do
5659                         local GLOBALOFFSETS=""
5660                         # size in Bytes
5661                         local size=$((((i + 2 * $nstripe )*$stride + $offset)))
5662                         local myfn=$DIR/d44a-$size
5663                         echo "--------writing $myfn at $size"
5664                         ll_sparseness_write $myfn $size ||
5665                                 error "ll_sparseness_write"
5666                         GLOBALOFFSETS="$GLOBALOFFSETS $size"
5667                         ll_sparseness_verify $myfn $GLOBALOFFSETS ||
5668                                 error "ll_sparseness_verify $GLOBALOFFSETS"
5669
5670                         for j in $(seq 0 $((nstripe-1))); do
5671                                 # size in Bytes
5672                                 size=$((((j + $nstripe )*$stride + $offset)))
5673                                 ll_sparseness_write $myfn $size ||
5674                                         error "ll_sparseness_write"
5675                                 GLOBALOFFSETS="$GLOBALOFFSETS $size"
5676                         done
5677                         ll_sparseness_verify $myfn $GLOBALOFFSETS ||
5678                                 error "ll_sparseness_verify $GLOBALOFFSETS"
5679                         rm -f $myfn
5680                 done
5681         done
5682 }
5683 run_test 44a "test sparse pwrite ==============================="
5684
5685 dirty_osc_total() {
5686         tot=0
5687         for d in `lctl get_param -n ${OSC}.*.cur_dirty_bytes`; do
5688                 tot=$(($tot + $d))
5689         done
5690         echo $tot
5691 }
5692 do_dirty_record() {
5693         before=`dirty_osc_total`
5694         echo executing "\"$*\""
5695         eval $*
5696         after=`dirty_osc_total`
5697         echo before $before, after $after
5698 }
5699 test_45() {
5700         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5701
5702         f="$DIR/f45"
5703         # Obtain grants from OST if it supports it
5704         echo blah > ${f}_grant
5705         stop_writeback
5706         sync
5707         do_dirty_record "echo blah > $f"
5708         [[ $before -eq $after ]] && error "write wasn't cached"
5709         do_dirty_record "> $f"
5710         [[ $before -gt $after ]] || error "truncate didn't lower dirty count"
5711         do_dirty_record "echo blah > $f"
5712         [[ $before -eq $after ]] && error "write wasn't cached"
5713         do_dirty_record "sync"
5714         [[ $before -gt $after ]] || error "writeback didn't lower dirty count"
5715         do_dirty_record "echo blah > $f"
5716         [[ $before -eq $after ]] && error "write wasn't cached"
5717         do_dirty_record "cancel_lru_locks osc"
5718         [[ $before -gt $after ]] ||
5719                 error "lock cancellation didn't lower dirty count"
5720         start_writeback
5721 }
5722 run_test 45 "osc io page accounting ============================"
5723
5724 # in a 2 stripe file (lov.sh), page 1023 maps to page 511 in its object.  this
5725 # test tickles a bug where re-dirtying a page was failing to be mapped to the
5726 # objects offset and an assert hit when an rpc was built with 1023's mapped
5727 # offset 511 and 511's raw 511 offset. it also found general redirtying bugs.
5728 test_46() {
5729         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5730
5731         f="$DIR/f46"
5732         stop_writeback
5733         sync
5734         dd if=/dev/zero of=$f bs=$PAGE_SIZE seek=511 count=1
5735         sync
5736         dd conv=notrunc if=/dev/zero of=$f bs=$PAGE_SIZE seek=1023 count=1
5737         dd conv=notrunc if=/dev/zero of=$f bs=$PAGE_SIZE seek=511 count=1
5738         sync
5739         start_writeback
5740 }
5741 run_test 46 "dirtying a previously written page ================"
5742
5743 # test_47 is removed "Device nodes check" is moved to test_28
5744
5745 test_48a() { # bug 2399
5746         [ "$mds1_FSTYPE" = "zfs" ] &&
5747         [ $MDS1_VERSION -lt $(version_code 2.3.63) ] &&
5748                 skip "MDS prior to 2.3.63 handle ZFS dir .. incorrectly"
5749
5750         test_mkdir $DIR/$tdir
5751         cd $DIR/$tdir
5752         mv $DIR/$tdir $DIR/$tdir.new || error "move directory failed"
5753         test_mkdir $DIR/$tdir
5754         touch foo || error "'touch foo' failed after recreating cwd"
5755         test_mkdir bar
5756         touch .foo || error "'touch .foo' failed after recreating cwd"
5757         test_mkdir .bar
5758         ls . > /dev/null || error "'ls .' failed after recreating cwd"
5759         ls .. > /dev/null || error "'ls ..' failed after removing cwd"
5760         cd . || error "'cd .' failed after recreating cwd"
5761         mkdir . && error "'mkdir .' worked after recreating cwd"
5762         rmdir . && error "'rmdir .' worked after recreating cwd"
5763         ln -s . baz || error "'ln -s .' failed after recreating cwd"
5764         cd .. || error "'cd ..' failed after recreating cwd"
5765 }
5766 run_test 48a "Access renamed working dir (should return errors)="
5767
5768 test_48b() { # bug 2399
5769         rm -rf $DIR/$tdir
5770         test_mkdir $DIR/$tdir
5771         cd $DIR/$tdir
5772         rmdir $DIR/$tdir || error "remove cwd $DIR/$tdir failed"
5773         touch foo && error "'touch foo' worked after removing cwd"
5774         mkdir foo && error "'mkdir foo' worked after removing cwd"
5775         touch .foo && error "'touch .foo' worked after removing cwd"
5776         mkdir .foo && error "'mkdir .foo' worked after removing cwd"
5777         ls . > /dev/null && error "'ls .' worked after removing cwd"
5778         ls .. > /dev/null || error "'ls ..' failed after removing cwd"
5779         mkdir . && error "'mkdir .' worked after removing cwd"
5780         rmdir . && error "'rmdir .' worked after removing cwd"
5781         ln -s . foo && error "'ln -s .' worked after removing cwd"
5782         cd .. || echo "'cd ..' failed after removing cwd `pwd`"  #bug 3517
5783 }
5784 run_test 48b "Access removed working dir (should return errors)="
5785
5786 test_48c() { # bug 2350
5787         #lctl set_param debug=-1
5788         #set -vx
5789         rm -rf $DIR/$tdir
5790         test_mkdir -p $DIR/$tdir/dir
5791         cd $DIR/$tdir/dir
5792         $TRACE rmdir $DIR/$tdir/dir || error "remove cwd $DIR/$tdir/dir failed"
5793         $TRACE touch foo && error "touch foo worked after removing cwd"
5794         $TRACE mkdir foo && error "'mkdir foo' worked after removing cwd"
5795         touch .foo && error "touch .foo worked after removing cwd"
5796         mkdir .foo && error "mkdir .foo worked after removing cwd"
5797         $TRACE ls . && error "'ls .' worked after removing cwd"
5798         $TRACE ls .. || error "'ls ..' failed after removing cwd"
5799         $TRACE mkdir . && error "'mkdir .' worked after removing cwd"
5800         $TRACE rmdir . && error "'rmdir .' worked after removing cwd"
5801         $TRACE ln -s . foo && error "'ln -s .' worked after removing cwd"
5802         $TRACE cd .. || echo "'cd ..' failed after removing cwd `pwd`" #bug 3415
5803 }
5804 run_test 48c "Access removed working subdir (should return errors)"
5805
5806 test_48d() { # bug 2350
5807         #lctl set_param debug=-1
5808         #set -vx
5809         rm -rf $DIR/$tdir
5810         test_mkdir -p $DIR/$tdir/dir
5811         cd $DIR/$tdir/dir
5812         $TRACE rmdir $DIR/$tdir/dir || error "remove cwd $DIR/$tdir/dir failed"
5813         $TRACE rmdir $DIR/$tdir || error "remove parent $DIR/$tdir failed"
5814         $TRACE touch foo && error "'touch foo' worked after removing parent"
5815         $TRACE mkdir foo && error "mkdir foo worked after removing parent"
5816         touch .foo && error "'touch .foo' worked after removing parent"
5817         mkdir .foo && error "mkdir .foo worked after removing parent"
5818         $TRACE ls . && error "'ls .' worked after removing parent"
5819         $TRACE ls .. && error "'ls ..' worked after removing parent"
5820         $TRACE mkdir . && error "'mkdir .' worked after removing parent"
5821         $TRACE rmdir . && error "'rmdir .' worked after removing parent"
5822         $TRACE ln -s . foo && error "'ln -s .' worked after removing parent"
5823         true
5824 }
5825 run_test 48d "Access removed parent subdir (should return errors)"
5826
5827 test_48e() { # bug 4134
5828         #lctl set_param debug=-1
5829         #set -vx
5830         rm -rf $DIR/$tdir
5831         test_mkdir -p $DIR/$tdir/dir
5832         cd $DIR/$tdir/dir
5833         $TRACE rmdir $DIR/$tdir/dir || error "remove cwd $DIR/$tdir/dir failed"
5834         $TRACE rmdir $DIR/$tdir || error "remove parent $DIR/$tdir failed"
5835         $TRACE touch $DIR/$tdir || error "'touch $DIR/$tdir' failed"
5836         $TRACE chmod +x $DIR/$tdir || error "'chmod +x $DIR/$tdir' failed"
5837         # On a buggy kernel addition of "touch foo" after cd .. will
5838         # produce kernel oops in lookup_hash_it
5839         touch ../foo && error "'cd ..' worked after recreate parent"
5840         cd $DIR
5841         $TRACE rm $DIR/$tdir || error "rm '$DIR/$tdir' failed"
5842 }
5843 run_test 48e "Access to recreated parent subdir (should return errors)"
5844
5845 test_48f() {
5846         [[ $MDS1_VERSION -ge $(version_code 2.13.55) ]] ||
5847                 skip "need MDS >= 2.13.55"
5848         [[ $MDSCOUNT -ge 2 ]] || skip "needs >= 2 MDTs"
5849         [[ "$(facet_host mds1)" != "$(facet_host mds2)" ]] ||
5850                 skip "needs different host for mdt1 mdt2"
5851         [[ $(facet_fstype mds1) == ldiskfs ]] || skip "ldiskfs only"
5852
5853         $LFS mkdir -i0 $DIR/$tdir
5854         $LFS mkdir -i 1 $DIR/$tdir/sub1 $DIR/$tdir/sub2 $DIR/$tdir/sub3
5855
5856         for d in sub1 sub2 sub3; do
5857                 #define OBD_FAIL_OSD_REF_DEL    0x19c
5858                 do_facet mds1 $LCTL set_param fail_loc=0x8000019c
5859                 rm -rf $DIR/$tdir/$d && error "rm $d should fail"
5860         done
5861
5862         rm -d --interactive=never $DIR/$tdir || error "rm $tdir fail"
5863 }
5864 run_test 48f "non-zero nlink dir unlink won't LBUG()"
5865
5866 test_49() { # LU-1030
5867         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5868         remote_ost_nodsh && skip "remote OST with nodsh"
5869
5870         # get ost1 size - $FSNAME-OST0000
5871         ost1_size=$(do_facet ost1 $LFS df | grep ${ost1_svc} |
5872                 awk '{ print $4 }')
5873         # write 800M at maximum
5874         [[ $ost1_size -lt 2 ]] && ost1_size=2
5875         [[ $ost1_size -gt 819200 ]] && ost1_size=819200
5876
5877         $LFS setstripe -c 1 -i 0 $DIR/$tfile
5878         dd if=/dev/zero of=$DIR/$tfile bs=4k count=$((ost1_size >> 2)) &
5879         local dd_pid=$!
5880
5881         # change max_pages_per_rpc while writing the file
5882         local osc1_mppc=osc.$(get_osc_import_name client ost1).max_pages_per_rpc
5883         local orig_mppc=$($LCTL get_param -n $osc1_mppc)
5884         # loop until dd process exits
5885         while ps ax -opid | grep -wq $dd_pid; do
5886                 $LCTL set_param $osc1_mppc=$((RANDOM % 256 + 1))
5887                 sleep $((RANDOM % 5 + 1))
5888         done
5889         # restore original max_pages_per_rpc
5890         $LCTL set_param $osc1_mppc=$orig_mppc
5891         rm $DIR/$tfile || error "rm $DIR/$tfile failed"
5892 }
5893 run_test 49 "Change max_pages_per_rpc won't break osc extent"
5894
5895 test_50() {
5896         # bug 1485
5897         test_mkdir $DIR/$tdir
5898         cd $DIR/$tdir
5899         ls /proc/$$/cwd || error "ls /proc/$$/cwd failed"
5900 }
5901 run_test 50 "special situations: /proc symlinks  ==============="
5902
5903 test_51a() {    # was test_51
5904         # bug 1516 - create an empty entry right after ".." then split dir
5905         test_mkdir -c1 $DIR/$tdir
5906         touch $DIR/$tdir/foo
5907         $MCREATE $DIR/$tdir/bar
5908         rm $DIR/$tdir/foo
5909         createmany -m $DIR/$tdir/longfile 201
5910         FNUM=202
5911         while [[ $(ls -sd $DIR/$tdir | awk '{ print $1 }') -eq 4 ]]; do
5912                 $MCREATE $DIR/$tdir/longfile$FNUM
5913                 FNUM=$(($FNUM + 1))
5914                 echo -n "+"
5915         done
5916         echo
5917         ls -l $DIR/$tdir > /dev/null || error "ls -l $DIR/$tdir failed"
5918 }
5919 run_test 51a "special situations: split htree with empty entry =="
5920
5921 cleanup_print_lfs_df () {
5922         trap 0
5923         $LFS df
5924         $LFS df -i
5925 }
5926
5927 test_51b() {
5928         [ $PARALLEL == "yes" ] && skip "skip parallel run"
5929
5930         local dir=$DIR/$tdir
5931         local nrdirs=$((65536 + 100))
5932
5933         # cleanup the directory
5934         rm -fr $dir
5935
5936         mkdir_on_mdt -i $((RANDOM % MDSCOUNT)) $dir
5937
5938         $LFS df
5939         $LFS df -i
5940         local mdtidx=$(printf "%04x" $($LFS getstripe -m $dir))
5941         local numfree=$(lctl get_param -n mdc.$FSNAME-MDT$mdtidx*.filesfree)
5942         [[ $numfree -lt $nrdirs ]] &&
5943                 skip "not enough free inodes ($numfree) on MDT$mdtidx"
5944
5945         # need to check free space for the directories as well
5946         local blkfree=$(lctl get_param -n mdc.$FSNAME-MDT$mdtidx*.kbytesavail)
5947         numfree=$(( blkfree / $(fs_inode_ksize) ))
5948         [[ $numfree -lt $nrdirs ]] && skip "not enough blocks ($numfree)"
5949
5950         trap cleanup_print_lfs_df EXIT
5951
5952         # create files
5953         createmany -d $dir/d $nrdirs || {
5954                 unlinkmany $dir/d $nrdirs
5955                 error "failed to create $nrdirs subdirs in MDT$mdtidx:$dir"
5956         }
5957
5958         # really created :
5959         nrdirs=$(ls -U $dir | wc -l)
5960
5961         # unlink all but 100 subdirectories, then check it still works
5962         local left=100
5963         local delete=$((nrdirs - left))
5964
5965         $LFS df
5966         $LFS df -i
5967
5968         # for ldiskfs the nlink count should be 1, but this is OSD specific
5969         # and so this is listed for informational purposes only
5970         echo "nlink before: $(stat -c %h $dir), created before: $nrdirs"
5971         unlinkmany -d $dir/d $delete ||
5972                 error "unlink of first $delete subdirs failed"
5973
5974         echo "nlink between: $(stat -c %h $dir)"
5975         local found=$(ls -U $dir | wc -l)
5976         [ $found -ne $left ] &&
5977                 error "can't find subdirs: found only $found, expected $left"
5978
5979         unlinkmany -d $dir/d $delete $left ||
5980                 error "unlink of second $left subdirs failed"
5981         # regardless of whether the backing filesystem tracks nlink accurately
5982         # or not, the nlink count shouldn't be more than "." and ".." here
5983         local after=$(stat -c %h $dir)
5984         [[ $after -gt 2 ]] && error "nlink after: $after > 2" ||
5985                 echo "nlink after: $after"
5986
5987         cleanup_print_lfs_df
5988 }
5989 run_test 51b "exceed 64k subdirectory nlink limit on create, verify unlink"
5990
5991 test_51d_sub() {
5992         local stripecount=$1
5993         local nfiles=$2
5994
5995         log "create files with stripecount=$stripecount"
5996         $LFS setstripe -C $stripecount $DIR/$tdir
5997         createmany -o $DIR/$tdir/t- $nfiles
5998         $LFS getstripe $DIR/$tdir > $TMP/$tfile
5999         for ((n = 0; n < $OSTCOUNT; n++)); do
6000                 objs[$n]=$(awk -vobjs=0 '($1 == '$n') { objs += 1 } \
6001                            END { printf("%0.0f", objs) }' $TMP/$tfile)
6002                 objs0[$n]=$(grep -A 1 idx $TMP/$tfile | awk -vobjs=0 \
6003                             '($1 == '$n') { objs += 1 } \
6004                             END { printf("%0.0f", objs) }')
6005                 log "OST$n has ${objs[$n]} objects, ${objs0[$n]} are index 0"
6006         done
6007         unlinkmany $DIR/$tdir/t- $nfiles
6008         rm  -f $TMP/$tfile
6009
6010         local nlast
6011         local min=4
6012         local max=6 # allow variance of (1 - $min/$max) = 33% by default
6013
6014         # For some combinations of stripecount and OSTCOUNT current code
6015         # is not ideal, and allocates 50% fewer *first* objects to some OSTs
6016         # than others. Rather than skipping this test entirely, check that
6017         # and keep testing to ensure imbalance does not get worse. LU-15282
6018         (( (OSTCOUNT == 6 && stripecount == 4) ||
6019            (OSTCOUNT == 10 && (stripecount == 4 || stripecount == 8)) ||
6020            (OSTCOUNT == 12 && (stripecount == 8 || stripecount == 9)))) && max=9
6021         for ((nlast=0, n = 1; n < $OSTCOUNT; nlast=n,n++)); do
6022                 (( ${objs[$n]} > ${objs[$nlast]} * 4 / 5 )) ||
6023                         { $LFS df && $LFS df -i &&
6024                         error "stripecount=$stripecount: " \
6025                               "OST $n has fewer objects vs. OST $nlast " \
6026                               "(${objs[$n]} < ${objs[$nlast]} x 4/5)"; }
6027                 (( ${objs[$n]} < ${objs[$nlast]} * 5 / 4 )) ||
6028                         { $LFS df && $LFS df -i &&
6029                         error "stripecount=$stripecount: " \
6030                               "OST $n has more objects vs. OST $nlast " \
6031                               "(${objs[$n]} > ${objs[$nlast]} x 5/4)"; }
6032
6033                 (( ${objs0[$n]} > ${objs0[$nlast]} * $min / $max )) ||
6034                         { $LFS df && $LFS df -i &&
6035                         error "stripecount=$stripecount: " \
6036                               "OST $n has fewer #0 objects vs. OST $nlast " \
6037                               "(${objs0[$n]} < ${objs0[$nlast]} x $min/$max)"; }
6038                 (( ${objs0[$n]} < ${objs0[$nlast]} * $max / $min )) ||
6039                         { $LFS df && $LFS df -i &&
6040                         error "stripecount=$stripecount: " \
6041                               "OST $n has more #0 objects vs. OST $nlast " \
6042                               "(${objs0[$n]} > ${objs0[$nlast]} x $max/$min)"; }
6043         done
6044 }
6045
6046 test_51d() {
6047         [ $PARALLEL == "yes" ] && skip "skip parallel run"
6048         [[ $OSTCOUNT -lt 3 ]] && skip_env "needs >= 3 OSTs"
6049
6050         local stripecount
6051         local per_ost=100
6052         local nfiles=$((per_ost * OSTCOUNT))
6053         local mdts=$(comma_list $(mdts_nodes))
6054         local param="osp.*.create_count"
6055         local qos_old=$(do_facet mds1 \
6056                 "$LCTL get_param -n lod.$FSNAME-*.qos_threshold_rr" | head -n 1)
6057
6058         do_nodes $mdts \
6059                 "$LCTL set_param lod.$FSNAME-*.qos_threshold_rr=100"
6060         stack_trap "do_nodes $mdts \
6061                 '$LCTL set_param lod.$FSNAME-*.qos_threshold_rr=${qos_old%%%}'"
6062
6063         test_mkdir $DIR/$tdir
6064         local dirstripes=$(lfs getdirstripe -c $DIR/$tdir)
6065         (( dirstripes > 0 )) || dirstripes=1
6066
6067         # Ensure enough OST objects precreated for tests to pass without
6068         # running out of objects.  This is an LOV r-r OST algorithm test,
6069         # not an OST object precreation test.
6070         local old=$(do_facet mds1 "$LCTL get_param -n $param" | head -n 1)
6071         (( old >= nfiles )) ||
6072         {
6073                 local create_count=$((nfiles * OSTCOUNT / dirstripes))
6074
6075                 do_nodes $mdts "$LCTL set_param $param=$create_count"
6076                 stack_trap "do_nodes $mdts $LCTL set_param $param=$old"
6077
6078                 # trigger precreation from all MDTs for all OSTs
6079                 for ((i = 0; i < $MDSCOUNT * 2; i++ )); do
6080                         $LFS setstripe -c -1 $DIR/$tdir/wide.$i
6081                 done
6082         }
6083
6084         for ((stripecount = 3; stripecount <= $OSTCOUNT; stripecount++)); do
6085                 sleep 8  # allow object precreation to catch up
6086                 test_51d_sub $stripecount $nfiles
6087         done
6088 }
6089 run_test 51d "check LOV round-robin OST object distribution"
6090
6091 test_51e() {
6092         if [ "$mds1_FSTYPE" != ldiskfs ]; then
6093                 skip_env "ldiskfs only test"
6094         fi
6095
6096         test_mkdir -c1 $DIR/$tdir
6097         test_mkdir -c1 $DIR/$tdir/d0
6098
6099         touch $DIR/$tdir/d0/foo
6100         createmany -l $DIR/$tdir/d0/foo $DIR/$tdir/d0/f- 65001 &&
6101                 error "file exceed 65000 nlink limit!"
6102         unlinkmany $DIR/$tdir/d0/f- 65001
6103         return 0
6104 }
6105 run_test 51e "check file nlink limit"
6106
6107 test_51f() {
6108         test_mkdir $DIR/$tdir
6109
6110         local max=100000
6111         local ulimit_old=$(ulimit -n)
6112         local spare=20 # number of spare fd's for scripts/libraries, etc.
6113         local mdt=$($LFS getstripe -m $DIR/$tdir)
6114         local numfree=$($LFS df -i $DIR/$tdir | awk '/MDT:'$mdt'/ { print $4 }')
6115
6116         echo "MDT$mdt numfree=$numfree, max=$max"
6117         [[ $numfree -gt $max ]] && numfree=$max || numfree=$((numfree * 7 / 8))
6118         if [ $((numfree + spare)) -gt $ulimit_old ]; then
6119                 while ! ulimit -n $((numfree + spare)); do
6120                         numfree=$((numfree * 3 / 4))
6121                 done
6122                 echo "changed ulimit from $ulimit_old to $((numfree + spare))"
6123         else
6124                 echo "left ulimit at $ulimit_old"
6125         fi
6126
6127         createmany -o -k -t 120 $DIR/$tdir/f $numfree || {
6128                 unlinkmany $DIR/$tdir/f $numfree
6129                 error "create+open $numfree files in $DIR/$tdir failed"
6130         }
6131         ulimit -n $ulimit_old
6132
6133         # if createmany exits at 120s there will be fewer than $numfree files
6134         unlinkmany $DIR/$tdir/f $numfree || true
6135 }
6136 run_test 51f "check many open files limit"
6137
6138 test_52a() {
6139         [ -f $DIR/$tdir/foo ] && chattr -a $DIR/$tdir/foo
6140         test_mkdir $DIR/$tdir
6141         touch $DIR/$tdir/foo
6142         chattr +a $DIR/$tdir/foo || error "chattr +a failed"
6143         echo bar >> $DIR/$tdir/foo || error "append bar failed"
6144         cp /etc/hosts $DIR/$tdir/foo && error "cp worked"
6145         rm -f $DIR/$tdir/foo 2>/dev/null && error "rm worked"
6146         link $DIR/$tdir/foo $DIR/$tdir/foo_link 2>/dev/null &&
6147                                         error "link worked"
6148         echo foo >> $DIR/$tdir/foo || error "append foo failed"
6149         mrename $DIR/$tdir/foo $DIR/$tdir/foo_ren && error "rename worked"
6150         lsattr $DIR/$tdir/foo | egrep -q "^-+a[-e]+ $DIR/$tdir/foo" ||
6151                                                      error "lsattr"
6152         chattr -a $DIR/$tdir/foo || error "chattr -a failed"
6153         cp -r $DIR/$tdir $TMP/
6154         rm -fr $DIR/$tdir $TMP/$tdir || error "cleanup rm failed"
6155 }
6156 run_test 52a "append-only flag test (should return errors)"
6157
6158 test_52b() {
6159         [ -f $DIR/$tdir/foo ] && chattr -i $DIR/$tdir/foo
6160         test_mkdir $DIR/$tdir
6161         touch $DIR/$tdir/foo
6162         chattr +i $DIR/$tdir/foo || error "chattr +i failed"
6163         cat test > $DIR/$tdir/foo && error "cat test worked"
6164         cp /etc/hosts $DIR/$tdir/foo && error "cp worked"
6165         rm -f $DIR/$tdir/foo 2>/dev/null && error "rm worked"
6166         link $DIR/$tdir/foo $DIR/$tdir/foo_link 2>/dev/null &&
6167                                         error "link worked"
6168         echo foo >> $DIR/$tdir/foo && error "echo worked"
6169         mrename $DIR/$tdir/foo $DIR/$tdir/foo_ren && error "rename worked"
6170         [ -f $DIR/$tdir/foo ] || error "$tdir/foo is not a file"
6171         [ -f $DIR/$tdir/foo_ren ] && error "$tdir/foo_ren is not a file"
6172         lsattr $DIR/$tdir/foo | egrep -q "^-+i[-e]+ $DIR/$tdir/foo" ||
6173                                                         error "lsattr"
6174         chattr -i $DIR/$tdir/foo || error "chattr failed"
6175
6176         rm -fr $DIR/$tdir || error "unable to remove $DIR/$tdir"
6177 }
6178 run_test 52b "immutable flag test (should return errors) ======="
6179
6180 test_53() {
6181         [ $PARALLEL == "yes" ] && skip "skip parallel run"
6182         remote_mds_nodsh && skip "remote MDS with nodsh"
6183         remote_ost_nodsh && skip "remote OST with nodsh"
6184
6185         local param
6186         local param_seq
6187         local ostname
6188         local mds_last
6189         local mds_last_seq
6190         local ost_last
6191         local ost_last_seq
6192         local ost_last_id
6193         local ostnum
6194         local node
6195         local found=false
6196         local support_last_seq=true
6197
6198         [[ $MDS1_VERSION -ge $(version_code 2.3.60) ]] ||
6199                 support_last_seq=false
6200
6201         # only test MDT0000
6202         local mdtosc=$(get_mdtosc_proc_path $SINGLEMDS)
6203         local value
6204         for value in $(do_facet $SINGLEMDS \
6205                        $LCTL get_param osp.$mdtosc.prealloc_last_id) ; do
6206                 param=$(echo ${value[0]} | cut -d "=" -f1)
6207                 ostname=$(echo $param | cut -d "." -f2 | cut -d - -f 1-2)
6208
6209                 if $support_last_seq; then
6210                         param_seq=$(echo $param |
6211                                 sed -e s/prealloc_last_id/prealloc_last_seq/g)
6212                         mds_last_seq=$(do_facet $SINGLEMDS \
6213                                        $LCTL get_param -n $param_seq)
6214                 fi
6215                 mds_last=$(do_facet $SINGLEMDS $LCTL get_param -n $param)
6216
6217                 ostnum=$(index_from_ostuuid ${ostname}_UUID)
6218                 node=$(facet_active_host ost$((ostnum+1)))
6219                 param="obdfilter.$ostname.last_id"
6220                 for ost_last in $(do_node $node $LCTL get_param -n $param) ; do
6221                         echo "$ostname.last_id=$ost_last; MDS.last_id=$mds_last"
6222                         ost_last_id=$ost_last
6223
6224                         if $support_last_seq; then
6225                                 ost_last_id=$(echo $ost_last |
6226                                               awk -F':' '{print $2}' |
6227                                               sed -e "s/^0x//g")
6228                                 ost_last_seq=$(echo $ost_last |
6229                                                awk -F':' '{print $1}')
6230                                 [[ $ost_last_seq = $mds_last_seq ]] || continue
6231                         fi
6232
6233                         if [[ $ost_last_id != $mds_last ]]; then
6234                                 error "$ost_last_id != $mds_last"
6235                         else
6236                                 found=true
6237                                 break
6238                         fi
6239                 done
6240         done
6241         $found || error "can not match last_seq/last_id for $mdtosc"
6242         return 0
6243 }
6244 run_test 53 "verify that MDS and OSTs agree on pre-creation ===="
6245
6246 test_54a() {
6247         LANG=C perl -MSocket -e ';' || skip "no Socket perl module installed"
6248
6249         LANG=C $SOCKETSERVER $DIR/socket ||
6250                 error "$SOCKETSERVER $DIR/socket failed: $?"
6251         LANG=C $SOCKETCLIENT $DIR/socket ||
6252                 error "$SOCKETCLIENT $DIR/socket failed: $?"
6253         $MUNLINK $DIR/socket || error "$MUNLINK $DIR/socket failed: $?"
6254 }
6255 run_test 54a "unix domain socket test =========================="
6256
6257 test_54b() {
6258         f="$DIR/f54b"
6259         mknod $f c 1 3
6260         chmod 0666 $f
6261         dd if=/dev/zero of=$f bs=$PAGE_SIZE count=1
6262 }
6263 run_test 54b "char device works in lustre ======================"
6264
6265 find_loop_dev() {
6266         [ -b /dev/loop/0 ] && LOOPBASE=/dev/loop/
6267         [ -b /dev/loop0 ] && LOOPBASE=/dev/loop
6268         [ -z "$LOOPBASE" ] && echo "/dev/loop/0 and /dev/loop0 gone?" && return
6269
6270         for i in $(seq 3 7); do
6271                 losetup $LOOPBASE$i > /dev/null 2>&1 && continue
6272                 LOOPDEV=$LOOPBASE$i
6273                 LOOPNUM=$i
6274                 break
6275         done
6276 }
6277
6278 cleanup_54c() {
6279         local rc=0
6280         loopdev="$DIR/loop54c"
6281
6282         trap 0
6283         $UMOUNT $DIR/$tdir || rc=$?
6284         losetup -d $loopdev || true
6285         losetup -d $LOOPDEV || true
6286         rm -rf $loopdev $DIR/$tfile $DIR/$tdir
6287         return $rc
6288 }
6289
6290 test_54c() {
6291         [ $PARALLEL == "yes" ] && skip "skip parallel run"
6292
6293         loopdev="$DIR/loop54c"
6294
6295         find_loop_dev
6296         [ -z "$LOOPNUM" ] && skip_env "couldn't find empty loop device"
6297         trap cleanup_54c EXIT
6298         mknod $loopdev b 7 $LOOPNUM
6299         echo "make a loop file system with $DIR/$tfile on $loopdev ($LOOPNUM)."
6300         dd if=/dev/zero of=$DIR/$tfile bs=$PAGE_SIZE seek=1024 count=1 > /dev/null
6301         losetup $loopdev $DIR/$tfile ||
6302                 error "can't set up $loopdev for $DIR/$tfile"
6303         mkfs.ext2 $loopdev || error "mke2fs on $loopdev"
6304         test_mkdir $DIR/$tdir
6305         mount -t ext2 $loopdev $DIR/$tdir ||
6306                 error "error mounting $loopdev on $DIR/$tdir"
6307         dd if=/dev/zero of=$DIR/$tdir/tmp bs=$PAGE_SIZE count=30 ||
6308                 error "dd write"
6309         df $DIR/$tdir
6310         dd if=$DIR/$tdir/tmp of=/dev/zero bs=$PAGE_SIZE count=30 ||
6311                 error "dd read"
6312         cleanup_54c
6313 }
6314 run_test 54c "block device works in lustre ====================="
6315
6316 test_54d() {
6317         local pipe="$DIR/$tfile.pipe"
6318         local string="aaaaaa"
6319
6320         mknod $pipe p
6321         echo -n "$string" > $pipe &
6322         local result=$(cat $pipe)
6323         [[ "$result" == "$string" ]] || error "$result != $string"
6324 }
6325 run_test 54d "fifo device works in lustre ======================"
6326
6327 test_54e() {
6328         f="$DIR/f54e"
6329         string="aaaaaa"
6330         cp -aL /dev/console $f
6331         echo $string > $f || error "echo $string to $f failed"
6332 }
6333 run_test 54e "console/tty device works in lustre ======================"
6334
6335 test_56a() {
6336         local numfiles=3
6337         local numdirs=2
6338         local dir=$DIR/$tdir
6339
6340         rm -rf $dir
6341         test_mkdir -p $dir/dir
6342         for i in $(seq $numfiles); do
6343                 touch $dir/file$i
6344                 touch $dir/dir/file$i
6345         done
6346
6347         local numcomp=$($LFS getstripe --component-count $dir)
6348
6349         [[ $numcomp == 0 ]] && numcomp=1
6350
6351         # test lfs getstripe with --recursive
6352         local filenum=$($LFS getstripe -r $dir | egrep -c "obdidx|l_ost_idx")
6353
6354         [[ $filenum -eq $((numfiles * 2)) ]] ||
6355                 error "$LFS getstripe -r: found $filenum != $((numfiles * 2))"
6356         filenum=$($LFS getstripe $dir | egrep -c "obdidx|l_ost_idx")
6357         [[ $filenum -eq $numfiles ]] ||
6358                 error "$LFS getstripe $dir: found $filenum, not $numfiles"
6359         echo "$LFS getstripe showed obdidx or l_ost_idx"
6360
6361         # test lfs getstripe with file instead of dir
6362         filenum=$($LFS getstripe $dir/file1 | egrep -c "obdidx|l_ost_idx")
6363         [[ $filenum -eq 1 ]] ||
6364                 error "$LFS getstripe $dir/file1: found $filenum, not 1"
6365         echo "$LFS getstripe file1 passed"
6366
6367         #test lfs getstripe with --verbose
6368         filenum=$($LFS getstripe --verbose $dir | grep -c lmm_magic)
6369         [[ $filenum -eq $((numfiles * numcomp)) ]] ||
6370                 error "$LFS getstripe --verbose $dir: "\
6371                       "got $filenum want $((numfiles * numcomp)) lmm_magic"
6372         [[ $($LFS getstripe $dir | grep -c lmm_magic) -eq 0 ]] ||
6373                 error "$LFS getstripe $dir: showed lmm_magic"
6374
6375         #test lfs getstripe with -v prints lmm_fid
6376         filenum=$($LFS getstripe -v $dir | grep -c lmm_fid)
6377         local countfids=$((numdirs + numfiles * numcomp))
6378         [[ $filenum -eq $countfids ]] ||
6379                 error "$LFS getstripe -v $dir: "\
6380                       "got $filenum want $countfids lmm_fid"
6381         [[ $($LFS getstripe $dir | grep -c lmm_fid) -eq 0 ]] ||
6382                 error "$LFS getstripe $dir: showed lmm_fid by default"
6383         echo "$LFS getstripe --verbose passed"
6384
6385         #check for FID information
6386         local fid1=$($LFS getstripe --fid $dir/file1)
6387         local fid2=$($LFS getstripe --verbose $dir/file1 |
6388                      awk '/lmm_fid: / { print $2; exit; }')
6389         local fid3=$($LFS path2fid $dir/file1)
6390
6391         [ "$fid1" != "$fid2" ] &&
6392                 error "getstripe --fid '$fid1' != getstripe --verbose '$fid2'"
6393         [ "$fid1" != "$fid3" ] &&
6394                 error "getstripe --fid '$fid1' != lfs path2fid '$fid3'"
6395         echo "$LFS getstripe --fid passed"
6396
6397         #test lfs getstripe with --obd
6398         $LFS getstripe --obd wrong_uuid $dir 2>&1 | grep -q "unknown obduuid" ||
6399                 error "$LFS getstripe --obd wrong_uuid: should return error"
6400
6401         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
6402
6403         local ostidx=1
6404         local obduuid=$(ostuuid_from_index $ostidx)
6405         local found=$($LFS getstripe -r --obd $obduuid $dir |
6406                 grep 'lmm_stripe_offset:' | grep -c " $ostidx\$")
6407
6408         filenum=$($LFS getstripe -ir $dir | grep -c "^$ostidx\$")
6409         [[ $($LFS getstripe -id $dir) -ne $ostidx ]] ||
6410                 ((filenum--))
6411         [[ $($LFS getstripe -id $dir/dir) -ne $ostidx ]] ||
6412                 ((filenum--))
6413
6414         [[ $found -eq $filenum ]] ||
6415                 error "$LFS getstripe --obd: found $found expect $filenum"
6416         [[ $($LFS getstripe -r -v --obd $obduuid $dir |
6417                 sed '/^[         ]*'${ostidx}'[  ]/d' |
6418                 sed -n '/^[      ]*[0-9][0-9]*[  ]/p' | wc -l) -eq 0 ]] ||
6419                 error "$LFS getstripe --obd: should not show file on other obd"
6420         echo "$LFS getstripe --obd passed"
6421 }
6422 run_test 56a "check $LFS getstripe"
6423
6424 test_56b() {
6425         local dir=$DIR/$tdir
6426         local numdirs=3
6427
6428         test_mkdir $dir
6429         for i in $(seq $numdirs); do
6430                 test_mkdir $dir/dir$i
6431         done
6432
6433         # test lfs getdirstripe default mode is non-recursion, which is
6434         # different from lfs getstripe
6435         local dircnt=$($LFS getdirstripe $dir | grep -c lmv_stripe_count)
6436
6437         [[ $dircnt -eq 1 ]] ||
6438                 error "$LFS getdirstripe: found $dircnt, not 1"
6439         dircnt=$($LFS getdirstripe --recursive $dir |
6440                 grep -c lmv_stripe_count)
6441         [[ $dircnt -eq $((numdirs + 1)) ]] ||
6442                 error "$LFS getdirstripe -r: $dircnt, != $((numdirs + 1))"
6443 }
6444 run_test 56b "check $LFS getdirstripe"
6445
6446 test_56bb() {
6447         verify_yaml_available || skip_env "YAML verification not installed"
6448         local output_file=$DIR/$tfile.out
6449
6450         $LFS getdirstripe -v -D -y $DIR 1> $output_file
6451
6452         cat $output_file
6453         cat $output_file | verify_yaml || error "layout is not valid YAML"
6454 }
6455 run_test 56bb "check $LFS getdirstripe layout is YAML"
6456
6457 test_56c() {
6458         remote_ost_nodsh && skip "remote OST with nodsh"
6459
6460         local ost_idx=0
6461         local ost_name=$(ostname_from_index $ost_idx)
6462         local old_status=$(ost_dev_status $ost_idx)
6463         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
6464
6465         [[ -z "$old_status" ]] ||
6466                 skip_env "OST $ost_name is in $old_status status"
6467
6468         do_facet ost1 $LCTL set_param -n obdfilter.$ost_name.degraded=1
6469         [[ $OST1_VERSION -lt $(version_code 2.12.55) ]] || do_facet ost1 \
6470                 $LCTL set_param -n obdfilter.$ost_name.no_precreate=1
6471         if [[ $OST1_VERSION -ge $(version_code 2.12.57) ]]; then
6472                 save_lustre_params ost1 osd-*.$ost_name.nonrotational > $p
6473                 do_facet ost1 $LCTL set_param -n osd-*.$ost_name.nonrotational=1
6474         fi
6475
6476         [[ $($LFS df -v $MOUNT |& grep -c "inactive device") -eq 0 ]] ||
6477                 error "$LFS df -v showing inactive devices"
6478         sleep_maxage
6479
6480         local new_status=$(ost_dev_status $ost_idx $MOUNT -v)
6481
6482         [[ "$new_status" =~ "D" ]] ||
6483                 error "$ost_name status is '$new_status', missing 'D'"
6484         if [[ $OST1_VERSION -ge $(version_code 2.12.55) ]]; then
6485                 [[ "$new_status" =~ "N" ]] ||
6486                         error "$ost_name status is '$new_status', missing 'N'"
6487         fi
6488         if [[ $OST1_VERSION -ge $(version_code 2.12.57) ]]; then
6489                 [[ "$new_status" =~ "f" ]] ||
6490                         error "$ost_name status is '$new_status', missing 'f'"
6491         fi
6492
6493         do_facet ost1 $LCTL set_param -n obdfilter.$ost_name.degraded=0
6494         [[ $OST1_VERSION -lt $(version_code 2.12.55) ]] || do_facet ost1 \
6495                 $LCTL set_param -n obdfilter.$ost_name.no_precreate=0
6496         [[ -z "$p" ]] && restore_lustre_params < $p || true
6497         sleep_maxage
6498
6499         new_status=$(ost_dev_status $ost_idx)
6500         [[ ! "$new_status" =~ "D" && ! "$new_status" =~ "N" ]] ||
6501                 error "$ost_name status is '$new_status', has 'D' and/or 'N'"
6502         # can't check 'f' as devices may actually be on flash
6503 }
6504 run_test 56c "check 'lfs df' showing device status"
6505
6506 test_56d() {
6507         local mdts=$($LFS df -v $MOUNT | grep -c MDT)
6508         local osts=$($LFS df -v $MOUNT | grep -c OST)
6509
6510         $LFS df $MOUNT
6511
6512         (( mdts == MDSCOUNT )) ||
6513                 error "lfs df -v showed $mdts MDTs, not $MDSCOUNT"
6514         (( osts == OSTCOUNT )) ||
6515                 error "lfs df -v showed $osts OSTs, not $OSTCOUNT"
6516 }
6517 run_test 56d "'lfs df -v' prints only configured devices"
6518
6519 test_56e() {
6520         err_enoent=2 # No such file or directory
6521         err_eopnotsupp=95 # Operation not supported
6522
6523         enoent_mnt=/pmt1 # Invalid dentry. Path not present
6524         notsup_mnt=/tmp  # Valid dentry, but Not a lustreFS
6525
6526         # Check for handling of path not exists
6527         output=$($LFS df $enoent_mnt 2>&1)
6528         ret=$?
6529
6530         fs=$(echo $output | awk -F: '{print $2}' | awk '{print $3}' | tr -d \')
6531         [[ $fs = $enoent_mnt && $ret -eq $err_enoent ]] ||
6532                 error "expect failure $err_enoent, not $ret"
6533
6534         # Check for handling of non-Lustre FS
6535         output=$($LFS df $notsup_mnt)
6536         ret=$?
6537
6538         fs=$(echo $output | awk '{print $1}' | awk -F: '{print $2}')
6539         [[ $fs = $notsup_mnt && $ret -eq $err_eopnotsupp ]] ||
6540                 error "expect success $err_eopnotsupp, not $ret"
6541
6542         # Check for multiple LustreFS argument
6543         output=$($LFS df $MOUNT $MOUNT $MOUNT | grep -c "filesystem_summary:")
6544         ret=$?
6545
6546         [[ $output -eq 3 && $ret -eq 0 ]] ||
6547                 error "expect success 3, not $output, rc = $ret"
6548
6549         # Check for correct non-Lustre FS handling among multiple
6550         # LustreFS argument
6551         output=$($LFS df $MOUNT $notsup_mnt $MOUNT |
6552                 grep -c "filesystem_summary:"; exit ${PIPESTATUS[0]})
6553         ret=$?
6554
6555         [[ $output -eq 2 && $ret -eq $err_eopnotsupp ]] ||
6556                 error "expect success 2, not $output, rc = $ret"
6557 }
6558 run_test 56e "'lfs df' Handle non LustreFS & multiple LustreFS"
6559
6560 NUMFILES=3
6561 NUMDIRS=3
6562 setup_56() {
6563         local local_tdir="$1"
6564         local local_numfiles="$2"
6565         local local_numdirs="$3"
6566         local dir_params="$4"
6567         local dir_stripe_params="$5"
6568
6569         if [ ! -d "$local_tdir" ] ; then
6570                 test_mkdir -p $dir_stripe_params $local_tdir
6571                 [ "$dir_params" ] && $LFS setstripe $dir_params $local_tdir
6572                 for i in $(seq $local_numfiles) ; do
6573                         touch $local_tdir/file$i
6574                 done
6575                 for i in $(seq $local_numdirs) ; do
6576                         test_mkdir $dir_stripe_params $local_tdir/dir$i
6577                         for j in $(seq $local_numfiles) ; do
6578                                 touch $local_tdir/dir$i/file$j
6579                         done
6580                 done
6581         fi
6582 }
6583
6584 setup_56_special() {
6585         local local_tdir=$1
6586         local local_numfiles=$2
6587         local local_numdirs=$3
6588
6589         setup_56 $local_tdir $local_numfiles $local_numdirs
6590
6591         if [ ! -e "$local_tdir/loop${local_numfiles}b" ] ; then
6592                 for i in $(seq $local_numfiles) ; do
6593                         mknod $local_tdir/loop${i}b b 7 $i
6594                         mknod $local_tdir/null${i}c c 1 3
6595                         ln -s $local_tdir/file1 $local_tdir/link${i}
6596                 done
6597                 for i in $(seq $local_numdirs) ; do
6598                         mknod $local_tdir/dir$i/loop${i}b b 7 $i
6599                         mknod $local_tdir/dir$i/null${i}c c 1 3
6600                         ln -s $local_tdir/dir$i/file1 $local_tdir/dir$i/link${i}
6601                 done
6602         fi
6603 }
6604
6605 test_56g() {
6606         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6607         local expected=$(($NUMDIRS + 2))
6608
6609         setup_56 $dir $NUMFILES $NUMDIRS
6610
6611         # test lfs find with -name
6612         for i in $(seq $NUMFILES) ; do
6613                 local nums=$($LFS find -name "*$i" $dir | wc -l)
6614
6615                 [ $nums -eq $expected ] ||
6616                         error "lfs find -name '*$i' $dir wrong: "\
6617                               "found $nums, expected $expected"
6618         done
6619 }
6620 run_test 56g "check lfs find -name"
6621
6622 test_56h() {
6623         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6624         local expected=$(((NUMDIRS + 1) * (NUMFILES - 1) + NUMFILES))
6625
6626         setup_56 $dir $NUMFILES $NUMDIRS
6627
6628         # test lfs find with ! -name
6629         for i in $(seq $NUMFILES) ; do
6630                 local nums=$($LFS find ! -name "*$i" $dir | wc -l)
6631
6632                 [ $nums -eq $expected ] ||
6633                         error "lfs find ! -name '*$i' $dir wrong: "\
6634                               "found $nums, expected $expected"
6635         done
6636 }
6637 run_test 56h "check lfs find ! -name"
6638
6639 test_56i() {
6640         local dir=$DIR/$tdir
6641
6642         test_mkdir $dir
6643
6644         local cmd="$LFS find -ost $(ostuuid_from_index 0 $dir) $dir"
6645         local out=$($cmd)
6646
6647         [ -z "$out" ] || error "'$cmd' returned directory '$out'"
6648 }
6649 run_test 56i "check 'lfs find -ost UUID' skips directories"
6650
6651 test_56j() {
6652         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6653
6654         setup_56_special $dir $NUMFILES $NUMDIRS
6655
6656         local expected=$((NUMDIRS + 1))
6657         local cmd="$LFS find -type d $dir"
6658         local nums=$($cmd | wc -l)
6659
6660         [ $nums -eq $expected ] ||
6661                 error "'$cmd' wrong: found $nums, expected $expected"
6662 }
6663 run_test 56j "check lfs find -type d"
6664
6665 test_56k() {
6666         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6667
6668         setup_56_special $dir $NUMFILES $NUMDIRS
6669
6670         local expected=$(((NUMDIRS + 1) * NUMFILES))
6671         local cmd="$LFS find -type f $dir"
6672         local nums=$($cmd | wc -l)
6673
6674         [ $nums -eq $expected ] ||
6675                 error "'$cmd' wrong: found $nums, expected $expected"
6676 }
6677 run_test 56k "check lfs find -type f"
6678
6679 test_56l() {
6680         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6681
6682         setup_56_special $dir $NUMFILES $NUMDIRS
6683
6684         local expected=$((NUMDIRS + NUMFILES))
6685         local cmd="$LFS find -type b $dir"
6686         local nums=$($cmd | wc -l)
6687
6688         [ $nums -eq $expected ] ||
6689                 error "'$cmd' wrong: found $nums, expected $expected"
6690 }
6691 run_test 56l "check lfs find -type b"
6692
6693 test_56m() {
6694         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6695
6696         setup_56_special $dir $NUMFILES $NUMDIRS
6697
6698         local expected=$((NUMDIRS + NUMFILES))
6699         local cmd="$LFS find -type c $dir"
6700         local nums=$($cmd | wc -l)
6701         [ $nums -eq $expected ] ||
6702                 error "'$cmd' wrong: found $nums, expected $expected"
6703 }
6704 run_test 56m "check lfs find -type c"
6705
6706 test_56n() {
6707         local dir=$DIR/d$(basetest $testnum)g.$TESTSUITE
6708         setup_56_special $dir $NUMFILES $NUMDIRS
6709
6710         local expected=$((NUMDIRS + NUMFILES))
6711         local cmd="$LFS find -type l $dir"
6712         local nums=$($cmd | wc -l)
6713
6714         [ $nums -eq $expected ] ||
6715                 error "'$cmd' wrong: found $nums, expected $expected"
6716 }
6717 run_test 56n "check lfs find -type l"
6718
6719 test_56o() {
6720         local dir=$DIR/$tdir
6721
6722         setup_56 $dir $NUMFILES $NUMDIRS
6723         utime $dir/file1 > /dev/null || error "utime (1)"
6724         utime $dir/file2 > /dev/null || error "utime (2)"
6725         utime $dir/dir1 > /dev/null || error "utime (3)"
6726         utime $dir/dir2 > /dev/null || error "utime (4)"
6727         utime $dir/dir1/file1 > /dev/null || error "utime (5)"
6728         dd if=/dev/zero count=1 >> $dir/dir1/file1 && sync
6729
6730         local expected=4
6731         local nums=$($LFS find -mtime +0 $dir | wc -l)
6732
6733         [ $nums -eq $expected ] ||
6734                 error "lfs find -mtime +0 $dir: found $nums expect $expected"
6735
6736         expected=12
6737         cmd="$LFS find -mtime 0 $dir"
6738         nums=$($cmd | wc -l)
6739         [ $nums -eq $expected ] ||
6740                 error "'$cmd' wrong: found $nums, expected $expected"
6741 }
6742 run_test 56o "check lfs find -mtime for old files"
6743
6744 test_56ob() {
6745         local dir=$DIR/$tdir
6746         local expected=1
6747         local count=0
6748
6749         # just to make sure there is something that won't be found
6750         test_mkdir $dir
6751         touch $dir/$tfile.now
6752
6753         for age in year week day hour min; do
6754                 count=$((count + 1))
6755
6756                 touch $dir/$tfile-a.$age $dir/$tfile-m.$age
6757                 touch --date="$count $age ago" -a $dir/$tfile-a.$age
6758                 touch --date="$count $age ago" -m $dir/$tfile-m.$age
6759
6760                 local cmd="$LFS find $dir -mtime $count${age:0:1}"
6761                 local nums=$($cmd | wc -l)
6762                 [ $nums -eq $expected ] ||
6763                         error "'$cmd' wrong: found $nums, expected $expected"
6764
6765                 cmd="$LFS find $dir -atime $count${age:0:1}"
6766                 nums=$($cmd | wc -l)
6767                 [ $nums -eq $expected ] ||
6768                         error "'$cmd' wrong: found $nums, expected $expected"
6769         done
6770
6771         sleep 2
6772         cmd="$LFS find $dir -ctime +1s -type f"
6773         nums=$($cmd | wc -l)
6774         (( $nums == $count * 2 + 1)) ||
6775                 error "'$cmd' wrong: found $nums, expected $((count * 2 + 1))"
6776 }
6777 run_test 56ob "check lfs find -atime -mtime -ctime with units"
6778
6779 test_newerXY_base() {
6780         local x=$1
6781         local y=$2
6782         local dir=$DIR/$tdir
6783         local ref
6784         local negref
6785
6786         if [ $y == "t" ]; then
6787                 if [ $x == "b" ]; then
6788                         ref=\"$(do_facet mds1 date +"%Y-%m-%d\ %H:%M:%S")\"
6789                 else
6790                         ref=\"$(date +"%Y-%m-%d %H:%M:%S")\"
6791                 fi
6792         else
6793                 ref=$DIR/$tfile.newer.$x$y
6794                 touch $ref || error "touch $ref failed"
6795         fi
6796
6797         echo "before = $ref"
6798         sleep 2
6799         setup_56 $dir $NUMFILES $NUMDIRS "-i0 -c1" "-i0 -c1"
6800         sleep 2
6801         if [ $y == "t" ]; then
6802                 if [ $x == "b" ]; then
6803                         negref=\"$(do_facet mds1 date +"%Y-%m-%d\ %H:%M:%S")\"
6804                 else
6805                         negref=\"$(date +"%Y-%m-%d %H:%M:%S")\"
6806                 fi
6807         else
6808                 negref=$DIR/$tfile.negnewer.$x$y
6809                 touch $negref || error "touch $negref failed"
6810         fi
6811
6812         echo "after = $negref"
6813         local cmd="$LFS find $dir -newer$x$y $ref"
6814         local nums=$(eval $cmd | wc -l)
6815         local expected=$(((NUMFILES + 2) * NUMDIRS + 1))
6816
6817         [ $nums -eq $expected ] || { ls -lauR --full-time $dir ;
6818                 error "'$cmd' wrong: found $nums newer, expected $expected"  ; }
6819
6820         cmd="$LFS find $dir ! -newer$x$y $negref"
6821         nums=$(eval $cmd | wc -l)
6822         [ $nums -eq $expected ] || { ls -lauR --full-time $dir ;
6823                 error "'$cmd' wrong: found $nums older, expected $expected"  ; }
6824
6825         cmd="$LFS find $dir -newer$x$y $ref ! -newer$x$y $negref"
6826         nums=$(eval $cmd | wc -l)
6827         [ $nums -eq $expected ] || { ls -lauR --full-time $dir ;
6828                 error "'$cmd' wrong: found $nums between, expected $expected"; }
6829
6830         rm -rf $DIR/*
6831 }
6832
6833 test_56oc() {
6834         test_newerXY_base "a" "a"
6835         test_newerXY_base "a" "m"
6836         test_newerXY_base "a" "c"
6837         test_newerXY_base "m" "a"
6838         test_newerXY_base "m" "m"
6839         test_newerXY_base "m" "c"
6840         test_newerXY_base "c" "a"
6841         test_newerXY_base "c" "m"
6842         test_newerXY_base "c" "c"
6843
6844         test_newerXY_base "a" "t"
6845         test_newerXY_base "m" "t"
6846         test_newerXY_base "c" "t"
6847
6848         [[ $MDS1_VERSION -lt $(version_code 2.13.54) ||
6849            $CLIENT_VERSION -lt $(version_code 2.13.54) ]] &&
6850                 ! btime_supported && echo "btime unsupported" && return 0
6851
6852         test_newerXY_base "b" "b"
6853         test_newerXY_base "b" "t"
6854 }
6855 run_test 56oc "check lfs find -newerXY work"
6856
6857 btime_supported() {
6858         local dir=$DIR/$tdir
6859         local rc
6860
6861         mkdir -p $dir
6862         touch $dir/$tfile
6863         $LFS find $dir -btime -1d -type f
6864         rc=$?
6865         rm -rf $dir
6866         return $rc
6867 }
6868
6869 test_56od() {
6870         [ $MDS1_VERSION -lt $(version_code 2.13.53) ] &&
6871                 ! btime_supported && skip "btime unsupported on MDS"
6872
6873         [ $CLIENT_VERSION -lt $(version_code 2.13.53) ] &&
6874                 ! btime_supported && skip "btime unsupported on clients"
6875
6876         local dir=$DIR/$tdir
6877         local ref=$DIR/$tfile.ref
6878         local negref=$DIR/$tfile.negref
6879
6880         mkdir $dir || error "mkdir $dir failed"
6881         touch $dir/$tfile.n1 || error "touch $dir/$tfile.n1 failed"
6882         touch $dir/$tfile.n2 || error "touch $dir/$tfile.n2 failed"
6883         mkdir $dir/$tdir.n1 || error "mkdir $dir/$tdir.n1 failed"
6884         mkdir $dir/$tdir.n2 || error "mkdir $dir/$tdir.n2 failed"
6885         touch $ref || error "touch $ref failed"
6886         # sleep 3 seconds at least
6887         sleep 3
6888
6889         local before=$(do_facet mds1 date +%s)
6890         local skew=$(($(date +%s) - before + 1))
6891
6892         if (( skew < 0 && skew > -5 )); then
6893                 sleep $((0 - skew + 1))
6894                 skew=0
6895         fi
6896
6897         # Set the dir stripe params to limit files all on MDT0,
6898         # otherwise we need to calc the max clock skew between
6899         # the client and MDTs.
6900         setup_56 $dir/d.btime $NUMFILES $NUMDIRS "-i0 -c1" "-i0 -c1"
6901         sleep 2
6902         touch $negref || error "touch $negref failed"
6903
6904         local cmd="$LFS find $dir -newerbb $ref ! -newerbb $negref -type f"
6905         local nums=$($cmd | wc -l)
6906         local expected=$(((NUMFILES + 1) * NUMDIRS))
6907
6908         [ $nums -eq $expected ] ||
6909                 error "'$cmd' wrong: found $nums, expected $expected"
6910
6911         cmd="$LFS find $dir -newerbb $ref ! -newerbb $negref -type d"
6912         nums=$($cmd | wc -l)
6913         expected=$((NUMFILES + 1))
6914         [ $nums -eq $expected ] ||
6915                 error "'$cmd' wrong: found $nums, expected $expected"
6916
6917         [ $skew -lt 0 ] && return
6918
6919         local after=$(do_facet mds1 date +%s)
6920         local age=$((after - before + 1 + skew))
6921
6922         cmd="$LFS find $dir -btime -${age}s -type f"
6923         nums=$($cmd | wc -l)
6924         expected=$(((NUMFILES + 1) * NUMDIRS))
6925
6926         echo "Clock skew between client and server: $skew, age:$age"
6927         [ $nums -eq $expected ] ||
6928                 error "'$cmd' wrong: found $nums, expected $expected"
6929
6930         expected=$(($NUMDIRS + 1))
6931         cmd="$LFS find $dir -btime -${age}s -type d"
6932         nums=$($cmd | wc -l)
6933         [ $nums -eq $expected ] ||
6934                 error "'$cmd' wrong: found $nums, expected $expected"
6935         rm -f $ref $negref || error "Failed to remove $ref $negref"
6936 }
6937 run_test 56od "check lfs find -btime with units"
6938
6939 test_56p() {
6940         [ $RUNAS_ID -eq $UID ] &&
6941                 skip_env "RUNAS_ID = UID = $UID -- skipping"
6942
6943         local dir=$DIR/$tdir
6944
6945         setup_56 $dir $NUMFILES $NUMDIRS
6946         chown $RUNAS_ID $dir/file* || error "chown $DIR/${tdir}g/file$i failed"
6947
6948         local expected=$NUMFILES
6949         local cmd="$LFS find -uid $RUNAS_ID $dir"
6950         local nums=$($cmd | wc -l)
6951
6952         [ $nums -eq $expected ] ||
6953                 error "'$cmd' wrong: found $nums, expected $expected"
6954
6955         expected=$(((NUMFILES + 1) * NUMDIRS + 1))
6956         cmd="$LFS find ! -uid $RUNAS_ID $dir"
6957         nums=$($cmd | wc -l)
6958         [ $nums -eq $expected ] ||
6959                 error "'$cmd' wrong: found $nums, expected $expected"
6960 }
6961 run_test 56p "check lfs find -uid and ! -uid"
6962
6963 test_56q() {
6964         [ $RUNAS_ID -eq $UID ] &&
6965                 skip_env "RUNAS_ID = UID = $UID -- skipping"
6966
6967         local dir=$DIR/$tdir
6968
6969         setup_56 $dir $NUMFILES $NUMDIRS
6970         chgrp $RUNAS_GID $dir/file* || error "chown $dir/file$i failed"
6971
6972         local expected=$NUMFILES
6973         local cmd="$LFS find -gid $RUNAS_GID $dir"
6974         local nums=$($cmd | wc -l)
6975
6976         [ $nums -eq $expected ] ||
6977                 error "'$cmd' wrong: found $nums, expected $expected"
6978
6979         expected=$(( ($NUMFILES+1) * $NUMDIRS + 1))
6980         cmd="$LFS find ! -gid $RUNAS_GID $dir"
6981         nums=$($cmd | wc -l)
6982         [ $nums -eq $expected ] ||
6983                 error "'$cmd' wrong: found $nums, expected $expected"
6984 }
6985 run_test 56q "check lfs find -gid and ! -gid"
6986
6987 test_56r() {
6988         local dir=$DIR/$tdir
6989
6990         setup_56 $dir $NUMFILES $NUMDIRS
6991
6992         local expected=12
6993         local cmd="$LFS find -size 0 -type f -lazy $dir"
6994         local nums=$($cmd | wc -l)
6995
6996         [ $nums -eq $expected ] ||
6997                 error "'$cmd' wrong: found $nums, expected $expected"
6998         cmd="$LFS find -size 0 -type f $dir"
6999         nums=$($cmd | wc -l)
7000         [ $nums -eq $expected ] ||
7001                 error "'$cmd' wrong: found $nums, expected $expected"
7002
7003         expected=0
7004         cmd="$LFS find ! -size 0 -type f -lazy $dir"
7005         nums=$($cmd | wc -l)
7006         [ $nums -eq $expected ] ||
7007                 error "'$cmd' wrong: found $nums, expected $expected"
7008         cmd="$LFS find ! -size 0 -type f $dir"
7009         nums=$($cmd | wc -l)
7010         [ $nums -eq $expected ] ||
7011                 error "'$cmd' wrong: found $nums, expected $expected"
7012
7013         echo "test" > $dir/$tfile
7014         echo "test2" > $dir/$tfile.2 && sync
7015         expected=1
7016         cmd="$LFS find -size 5 -type f -lazy $dir"
7017         nums=$($cmd | wc -l)
7018         [ $nums -eq $expected ] ||
7019                 error "'$cmd' wrong: found $nums, expected $expected"
7020         cmd="$LFS find -size 5 -type f $dir"
7021         nums=$($cmd | wc -l)
7022         [ $nums -eq $expected ] ||
7023                 error "'$cmd' wrong: found $nums, expected $expected"
7024
7025         expected=1
7026         cmd="$LFS find -size +5 -type f -lazy $dir"
7027         nums=$($cmd | wc -l)
7028         [ $nums -eq $expected ] ||
7029                 error "'$cmd' wrong: found $nums, expected $expected"
7030         cmd="$LFS find -size +5 -type f $dir"
7031         nums=$($cmd | wc -l)
7032         [ $nums -eq $expected ] ||
7033                 error "'$cmd' wrong: found $nums, expected $expected"
7034
7035         expected=2
7036         cmd="$LFS find -size +0 -type f -lazy $dir"
7037         nums=$($cmd | wc -l)
7038         [ $nums -eq $expected ] ||
7039                 error "'$cmd' wrong: found $nums, expected $expected"
7040         cmd="$LFS find -size +0 -type f $dir"
7041         nums=$($cmd | wc -l)
7042         [ $nums -eq $expected ] ||
7043                 error "'$cmd' wrong: found $nums, expected $expected"
7044
7045         expected=2
7046         cmd="$LFS find ! -size -5 -type f -lazy $dir"
7047         nums=$($cmd | wc -l)
7048         [ $nums -eq $expected ] ||
7049                 error "'$cmd' wrong: found $nums, expected $expected"
7050         cmd="$LFS find ! -size -5 -type f $dir"
7051         nums=$($cmd | wc -l)
7052         [ $nums -eq $expected ] ||
7053                 error "'$cmd' wrong: found $nums, expected $expected"
7054
7055         expected=12
7056         cmd="$LFS find -size -5 -type f -lazy $dir"
7057         nums=$($cmd | wc -l)
7058         [ $nums -eq $expected ] ||
7059                 error "'$cmd' wrong: found $nums, expected $expected"
7060         cmd="$LFS find -size -5 -type f $dir"
7061         nums=$($cmd | wc -l)
7062         [ $nums -eq $expected ] ||
7063                 error "'$cmd' wrong: found $nums, expected $expected"
7064 }
7065 run_test 56r "check lfs find -size works"
7066
7067 test_56ra_sub() {
7068         local expected=$1
7069         local glimpses=$2
7070         local cmd="$3"
7071
7072         cancel_lru_locks $OSC
7073
7074         local rpcs_before=$(calc_stats $OSC.*$OSC*.stats ldlm_glimpse_enqueue)
7075         local nums=$($cmd | wc -l)
7076
7077         [ $nums -eq $expected ] ||
7078                 error "'$cmd' wrong: found $nums, expected $expected"
7079
7080         local rpcs_after=$(calc_stats $OSC.*$OSC*.stats ldlm_glimpse_enqueue)
7081
7082         if (( rpcs_before + glimpses != rpcs_after )); then
7083                 echo "Before: $rpcs_before After: $rpcs_after $NUMFILES"
7084                 $LCTL get_param osc.*.stats | grep ldlm_glimpse_enqueue
7085
7086                 if [[ $glimpses == 0 ]]; then
7087                         error "'$cmd' should not send glimpse RPCs to OST"
7088                 else
7089                         error "'$cmd' should send $glimpses glimpse RPCs to OST"
7090                 fi
7091         fi
7092 }
7093
7094 test_56ra() {
7095         [[ $MDS1_VERSION -gt $(version_code 2.12.58) ]] ||
7096                 skip "MDS < 2.12.58 doesn't return LSOM data"
7097         local dir=$DIR/$tdir
7098         local old_agl=$($LCTL get_param -n llite.*.statahead_agl)
7099
7100         [[ $OSC == "mdc" ]] && skip "statahead not needed for DoM files"
7101
7102         # statahead_agl may cause extra glimpse which confuses results. LU-13017
7103         $LCTL set_param -n llite.*.statahead_agl=0
7104         stack_trap "$LCTL set_param -n llite.*.statahead_agl=$old_agl"
7105
7106         setup_56 $dir $NUMFILES $NUMDIRS "-c 1"
7107         # open and close all files to ensure LSOM is updated
7108         cancel_lru_locks $OSC
7109         find $dir -type f | xargs cat > /dev/null
7110
7111         #   expect_found  glimpse_rpcs  command_to_run
7112         test_56ra_sub 12  0 "$LFS find -size 0 -type f -lazy $dir"
7113         test_56ra_sub 12 12 "$LFS find -size 0 -type f $dir"
7114         test_56ra_sub  0  0 "$LFS find ! -size 0 -type f -lazy $dir"
7115         test_56ra_sub  0 12 "$LFS find ! -size 0 -type f $dir"
7116
7117         echo "test" > $dir/$tfile
7118         echo "test2" > $dir/$tfile.2 && sync
7119         cancel_lru_locks $OSC
7120         cat $dir/$tfile $dir/$tfile.2 > /dev/null
7121
7122         test_56ra_sub  1  0 "$LFS find -size 5 -type f -lazy $dir"
7123         test_56ra_sub  1 14 "$LFS find -size 5 -type f $dir"
7124         test_56ra_sub  1  0 "$LFS find -size +5 -type f -lazy $dir"
7125         test_56ra_sub  1 14 "$LFS find -size +5 -type f $dir"
7126
7127         test_56ra_sub  2  0 "$LFS find -size +0 -type f -lazy $dir"
7128         test_56ra_sub  2 14 "$LFS find -size +0 -type f $dir"
7129         test_56ra_sub  2  0 "$LFS find ! -size -5 -type f -lazy $dir"
7130         test_56ra_sub  2 14 "$LFS find ! -size -5 -type f $dir"
7131         test_56ra_sub 12  0 "$LFS find -size -5 -type f -lazy $dir"
7132         test_56ra_sub 12 14 "$LFS find -size -5 -type f $dir"
7133 }
7134 run_test 56ra "check lfs find -size -lazy works for data on OSTs"
7135
7136 test_56rb() {
7137         local dir=$DIR/$tdir
7138         local tmp=$TMP/$tfile.log
7139         local mdt_idx;
7140
7141         test_mkdir -p $dir || error "failed to mkdir $dir"
7142         $LFS setstripe -c 1 -i 0 $dir/$tfile ||
7143                 error "failed to setstripe $dir/$tfile"
7144         mdt_idx=$($LFS getdirstripe -i $dir)
7145         dd if=/dev/zero of=$dir/$tfile bs=1M count=1
7146
7147         stack_trap "rm -f $tmp" EXIT
7148         $LFS find --size +100K --ost 0 $dir |& tee $tmp
7149         ! grep -q obd_uuid $tmp ||
7150                 error "failed to find --size +100K --ost 0 $dir"
7151         $LFS find --size +100K --mdt $mdt_idx $dir |& tee $tmp
7152         ! grep -q obd_uuid $tmp ||
7153                 error "failed to find --size +100K --mdt $mdt_idx $dir"
7154 }
7155 run_test 56rb "check lfs find --size --ost/--mdt works"
7156
7157 test_56rc() {
7158         (( MDSCOUNT >= 2 )) || skip "needs at least 2 MDTs"
7159         local dir=$DIR/$tdir
7160         local found
7161
7162         test_mkdir -c 2 -H all_char $dir || error "failed to mkdir $dir"
7163         $LFS mkdir -c 2 --mdt-hash all_char $dir/$tdir-all{1..10}
7164         (( $MDSCOUNT > 2 )) &&
7165                 $LFS mkdir -c 3 --mdt-hash fnv_1a_64 $dir/$tdir-fnv{1..10}
7166         mkdir $dir/$tdir-{1..10}
7167         touch $dir/$tfile-{1..10}
7168
7169         found=$($LFS find $dir --mdt-count 2 | wc -l)
7170         expect=11
7171         (( $found == $expect )) || error "found $found 2-stripe, expect $expect"
7172
7173         found=$($LFS find $dir -T +1 | wc -l)
7174         (( $MDSCOUNT > 2 )) && expect=$((expect + 10))
7175         (( $found == $expect )) || error "found $found 2+stripe, expect $expect"
7176
7177         found=$($LFS find $dir --mdt-hash all_char | wc -l)
7178         expect=11
7179         (( $found == $expect )) || error "found $found all_char, expect $expect"
7180
7181         found=$($LFS find $dir --mdt-hash fnv_1a_64 | wc -l)
7182         (( $MDSCOUNT > 2 )) && expect=10 || expect=0
7183         (( $found == $expect )) || error "found $found all_char, expect $expect"
7184 }
7185 run_test 56rc "check lfs find --mdt-count/--mdt-hash works"
7186
7187 test_56rd() {
7188         local dir=$DIR/$tdir
7189
7190         test_mkdir $dir
7191         rm -f $dir/*
7192
7193         mkfifo $dir/fifo || error "failed to create fifo file"
7194         $LFS find $dir -t p --printf "%p %y %LP\n" ||
7195                 error "should not fail even cannot get projid from pipe file"
7196         found=$($LFS find $dir -t p --printf "%y")
7197         [[ "p" == $found ]] || error "found $found, expect p"
7198
7199         mknod $dir/chardev c 1 5 ||
7200                 error "failed to create character device file"
7201         $LFS find $dir -t c --printf "%p %y %LP\n" ||
7202                 error "should not fail even cannot get projid from chardev file"
7203         found=$($LFS find $dir -t c --printf "%y")
7204         [[ "c" == $found ]] || error "found $found, expect c"
7205
7206         found=$($LFS find $dir ! -type d --printf "%p %y %LP\n" | wc -l)
7207         (( found == 2 )) || error "unable to list all files"
7208 }
7209 run_test 56rd "check lfs find --printf special files"
7210
7211 test_56s() { # LU-611 #LU-9369
7212         [[ $OSTCOUNT -lt 2 ]] && skip_env "need at least 2 OSTs"
7213
7214         local dir=$DIR/$tdir
7215         local onestripe=$(((NUMDIRS + 1) * NUMFILES))
7216
7217         setup_56 $dir $NUMFILES $NUMDIRS "-c 1"
7218         for i in $(seq $NUMDIRS); do
7219                 $LFS setstripe -c $((OSTCOUNT + 1)) $dir/dir$i/$tfile
7220         done
7221
7222         local expected=$NUMDIRS
7223         local cmd="$LFS find -c $OSTCOUNT $dir"
7224         local nums=$($cmd | wc -l)
7225
7226         [ $nums -eq $expected ] || {
7227                 $LFS getstripe -R $dir
7228                 error "'$cmd' wrong: found $nums, expected $expected"
7229         }
7230
7231         expected=$((NUMDIRS + onestripe))
7232         cmd="$LFS find -stripe-count +0 -type f $dir"
7233         nums=$($cmd | wc -l)
7234         [ $nums -eq $expected ] || {
7235                 $LFS getstripe -R $dir
7236                 error "'$cmd' wrong: found $nums, expected $expected"
7237         }
7238
7239         expected=$onestripe
7240         cmd="$LFS find -stripe-count 1 -type f $dir"
7241         nums=$($cmd | wc -l)
7242         [ $nums -eq $expected ] || {
7243                 $LFS getstripe -R $dir
7244                 error "'$cmd' wrong: found $nums, expected $expected"
7245         }
7246
7247         cmd="$LFS find -stripe-count -2 -type f $dir"
7248         nums=$($cmd | wc -l)
7249         [ $nums -eq $expected ] || {
7250                 $LFS getstripe -R $dir
7251                 error "'$cmd' wrong: found $nums, expected $expected"
7252         }
7253
7254         expected=0
7255         cmd="$LFS find -stripe-count $((OSTCOUNT + 1)) -type f $dir"
7256         nums=$($cmd | wc -l)
7257         [ $nums -eq $expected ] || {
7258                 $LFS getstripe -R $dir
7259                 error "'$cmd' wrong: found $nums, expected $expected"
7260         }
7261 }
7262 run_test 56s "check lfs find -stripe-count works"
7263
7264 test_56t() { # LU-611 #LU-9369
7265         local dir=$DIR/$tdir
7266
7267         setup_56 $dir 0 $NUMDIRS
7268         for i in $(seq $NUMDIRS); do
7269                 $LFS setstripe -S 8M $dir/dir$i/$tfile
7270         done
7271
7272         local expected=$NUMDIRS
7273         local cmd="$LFS find -S 8M $dir"
7274         local nums=$($cmd | wc -l)
7275
7276         [ $nums -eq $expected ] || {
7277                 $LFS getstripe -R $dir
7278                 error "'$cmd' wrong: found $nums, expected $expected"
7279         }
7280         rm -rf $dir
7281
7282         setup_56 $dir $NUMFILES $NUMDIRS "--stripe-size 512k"
7283
7284         $LFS setstripe -S 256k $dir/$tfile.{0,1,2,3}
7285
7286         expected=$(((NUMDIRS + 1) * NUMFILES))
7287         cmd="$LFS find -stripe-size 512k -type f $dir"
7288         nums=$($cmd | wc -l)
7289         [ $nums -eq $expected ] ||
7290                 error "'$cmd' wrong: found $nums, expected $expected"
7291
7292         cmd="$LFS find -stripe-size +320k -type f $dir"
7293         nums=$($cmd | wc -l)
7294         [ $nums -eq $expected ] ||
7295                 error "'$cmd' wrong: found $nums, expected $expected"
7296
7297         expected=$(((NUMDIRS + 1) * NUMFILES + 4))
7298         cmd="$LFS find -stripe-size +200k -type f $dir"
7299         nums=$($cmd | wc -l)
7300         [ $nums -eq $expected ] ||
7301                 error "'$cmd' wrong: found $nums, expected $expected"
7302
7303         cmd="$LFS find -stripe-size -640k -type f $dir"
7304         nums=$($cmd | wc -l)
7305         [ $nums -eq $expected ] ||
7306                 error "'$cmd' wrong: found $nums, expected $expected"
7307
7308         expected=4
7309         cmd="$LFS find -stripe-size 256k -type f $dir"
7310         nums=$($cmd | wc -l)
7311         [ $nums -eq $expected ] ||
7312                 error "'$cmd' wrong: found $nums, expected $expected"
7313
7314         cmd="$LFS find -stripe-size -320k -type f $dir"
7315         nums=$($cmd | wc -l)
7316         [ $nums -eq $expected ] ||
7317                 error "'$cmd' wrong: found $nums, expected $expected"
7318
7319         expected=0
7320         cmd="$LFS find -stripe-size 1024k -type f $dir"
7321         nums=$($cmd | wc -l)
7322         [ $nums -eq $expected ] ||
7323                 error "'$cmd' wrong: found $nums, expected $expected"
7324 }
7325 run_test 56t "check lfs find -stripe-size works"
7326
7327 test_56u() { # LU-611
7328         local dir=$DIR/$tdir
7329
7330         setup_56 $dir $NUMFILES $NUMDIRS "-i 0 -c 1"
7331
7332         if [[ $OSTCOUNT -gt 1 ]]; then
7333                 $LFS setstripe -i 1 -c 1 $dir/$tfile.{0,1,2,3}
7334                 onestripe=4
7335         else
7336                 onestripe=0
7337         fi
7338
7339         local expected=$(((NUMDIRS + 1) * NUMFILES))
7340         local cmd="$LFS find -stripe-index 0 -type f $dir"
7341         local nums=$($cmd | wc -l)
7342
7343         [ $nums -eq $expected ] ||
7344                 error "'$cmd' wrong: found $nums, expected $expected"
7345
7346         expected=$onestripe
7347         cmd="$LFS find -stripe-index 1 -type f $dir"
7348         nums=$($cmd | wc -l)
7349         [ $nums -eq $expected ] ||
7350                 error "'$cmd' wrong: found $nums, expected $expected"
7351
7352         cmd="$LFS find ! -stripe-index 0 -type f $dir"
7353         nums=$($cmd | wc -l)
7354         [ $nums -eq $expected ] ||
7355                 error "'$cmd' wrong: found $nums, expected $expected"
7356
7357         expected=0
7358         # This should produce an error and not return any files
7359         cmd="$LFS find -stripe-index $OSTCOUNT -type f $dir"
7360         nums=$($cmd 2>/dev/null | wc -l)
7361         [ $nums -eq $expected ] ||
7362                 error "'$cmd' wrong: found $nums, expected $expected"
7363
7364         if [[ $OSTCOUNT -gt 1 ]]; then
7365                 expected=$(((NUMDIRS + 1) * NUMFILES + onestripe))
7366                 cmd="$LFS find -stripe-index 0,1 -type f $dir"
7367                 nums=$($cmd | wc -l)
7368                 [ $nums -eq $expected ] ||
7369                         error "'$cmd' wrong: found $nums, expected $expected"
7370         fi
7371 }
7372 run_test 56u "check lfs find -stripe-index works"
7373
7374 test_56v() {
7375         local mdt_idx=0
7376         local dir=$DIR/$tdir
7377
7378         setup_56 $dir $NUMFILES $NUMDIRS
7379
7380         UUID=$(mdtuuid_from_index $mdt_idx $dir)
7381         [ -z "$UUID" ] && error "mdtuuid_from_index cannot find MDT $mdt_idx"
7382
7383         for file in $($LFS find -m $UUID $dir); do
7384                 file_midx=$($LFS getstripe -m $file)
7385                 [ $file_midx -eq $mdt_idx ] ||
7386                         error "lfs find -m $UUID != getstripe -m $file_midx"
7387         done
7388 }
7389 run_test 56v "check 'lfs find -m match with lfs getstripe -m'"
7390
7391 test_56wa() {
7392         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
7393         [ $PARALLEL == "yes" ] && skip "skip parallel run"
7394
7395         local dir=$DIR/$tdir
7396
7397         setup_56 $dir $NUMFILES $NUMDIRS "-c $OSTCOUNT" "-c1"
7398         stack_trap "rm -rf $dir"
7399
7400         local stripe_size=$($LFS getstripe -S -d $dir) ||
7401                 error "$LFS getstripe -S -d $dir failed"
7402         stripe_size=${stripe_size%% *}
7403
7404         local file_size=$((stripe_size * OSTCOUNT))
7405         local file_num=$((NUMDIRS * NUMFILES + NUMFILES))
7406         local required_space=$((file_num * file_size))
7407         local free_space=$($LCTL get_param -n lov.$FSNAME-clilov-*.kbytesavail |
7408                            head -n1)
7409         (( free_space >= required_space / 1024 )) ||
7410                 skip_env "need $required_space, have $free_space kbytes"
7411
7412         local dd_bs=65536
7413         local dd_count=$((file_size / dd_bs))
7414
7415         # write data into the files
7416         local i
7417         local j
7418         local file
7419
7420         for ((i = 1; i <= NUMFILES; i++ )); do
7421                 file=$dir/file$i
7422                 yes | dd bs=$dd_bs count=$dd_count of=$file &>/dev/null ||
7423                         error "write data into $file failed"
7424         done
7425         for ((i = 1; i <= NUMDIRS; i++ )); do
7426                 for ((j = 1; j <= NUMFILES; j++ )); do
7427                         file=$dir/dir$i/file$j
7428                         yes|dd bs=$dd_bs count=$dd_count of=$file &>/dev/null ||
7429                                 error "write data into $file failed"
7430                 done
7431         done
7432
7433         # $LFS_MIGRATE will fail if hard link migration is unsupported
7434         if (( MDS1_VERSION > $(version_code 2.5.55) )); then
7435                 createmany -l$dir/dir1/file1 $dir/dir1/link 200 ||
7436                         error "creating links to $dir/dir1/file1 failed"
7437         fi
7438
7439         local expected=-1
7440
7441         (( OSTCOUNT <= 1 )) || expected=$((OSTCOUNT - 1))
7442
7443         # lfs_migrate file
7444         local cmd="$LFS_MIGRATE -y -c $expected $dir/file1"
7445
7446         echo "$cmd"
7447         eval $cmd || error "$cmd failed"
7448
7449         check_stripe_count $dir/file1 $expected
7450
7451         if (( $MDS1_VERSION >= $(version_code 2.6.90) )); then
7452                 # lfs_migrate file onto OST 0 if it is on OST 1, or onto
7453                 # OST 1 if it is on OST 0. This file is small enough to
7454                 # be on only one stripe.
7455                 file=$dir/migr_1_ost
7456                 dd bs=$dd_bs count=1 if=/dev/urandom of=$file >/dev/null 2>&1 ||
7457                         error "write data into $file failed"
7458                 local obdidx=$($LFS getstripe -i $file)
7459                 local oldmd5=$(md5sum $file)
7460                 local newobdidx=0
7461
7462                 (( obdidx != 0 )) || newobdidx=1
7463                 cmd="$LFS migrate -i $newobdidx $file"
7464                 echo $cmd
7465                 eval $cmd || error "$cmd failed"
7466
7467                 local realobdix=$($LFS getstripe -i $file)
7468                 local newmd5=$(md5sum $file)
7469
7470                 (( $newobdidx == $realobdix )) ||
7471                         error "new OST is different (was=$obdidx, wanted=$newobdidx, got=$realobdix)"
7472                 [[ "$oldmd5" == "$newmd5" ]] ||
7473                         error "md5sum differ: $oldmd5, $newmd5"
7474         fi
7475
7476         # lfs_migrate dir
7477         cmd="$LFS_MIGRATE -y -c $expected $dir/dir1"
7478         echo "$cmd"
7479         eval $cmd || error "$cmd failed"
7480
7481         for (( j = 1; j <= NUMFILES; j++ )); do
7482                 check_stripe_count $dir/dir1/file$j $expected
7483         done
7484
7485         # lfs_migrate works with lfs find
7486         cmd="$LFS find -stripe_count $OSTCOUNT -type f $dir |
7487              $LFS_MIGRATE -y -c $expected"
7488         echo "$cmd"
7489         eval $cmd || error "$cmd failed"
7490
7491         for (( i = 2; i <= NUMFILES; i++ )); do
7492                 check_stripe_count $dir/file$i $expected
7493         done
7494         for (( i = 2; i <= NUMDIRS; i++ )); do
7495                 for (( j = 1; j <= NUMFILES; j++ )); do
7496                         check_stripe_count $dir/dir$i/file$j $expected
7497                 done
7498         done
7499 }
7500 run_test 56wa "check lfs_migrate -c stripe_count works"
7501
7502 test_56wb() {
7503         local file1=$DIR/$tdir/file1
7504         local create_pool=false
7505         local initial_pool=$($LFS getstripe -p $DIR)
7506         local pool_list=()
7507         local pool=""
7508
7509         echo -n "Creating test dir..."
7510         test_mkdir $DIR/$tdir &> /dev/null || error "cannot create dir"
7511         echo "done."
7512
7513         echo -n "Creating test file..."
7514         touch $file1 || error "cannot create file"
7515         echo "done."
7516
7517         echo -n "Detecting existing pools..."
7518         pool_list=($($LFS pool_list $FSNAME | grep "$FSNAME\." | cut -d. -f2))
7519
7520         if [ ${#pool_list[@]} -gt 0 ]; then
7521                 echo "${pool_list[@]}"
7522                 for thispool in "${pool_list[@]}"; do
7523                         if [[ -z "$initial_pool" ||
7524                               "$initial_pool" != "$thispool" ]]; then
7525                                 pool="$thispool"
7526                                 echo "Using existing pool '$pool'"
7527                                 break
7528                         fi
7529                 done
7530         else
7531                 echo "none detected."
7532         fi
7533         if [ -z "$pool" ]; then
7534                 pool=${POOL:-testpool}
7535                 [ "$initial_pool" = "$pool" ] && pool="testpool2"
7536                 echo -n "Creating pool '$pool'..."
7537                 create_pool=true
7538                 pool_add $pool &> /dev/null ||
7539                         error "pool_add failed"
7540                 echo "done."
7541
7542                 echo -n "Adding target to pool..."
7543                 pool_add_targets $pool 0 0 1 &> /dev/null ||
7544                         error "pool_add_targets failed"
7545                 echo "done."
7546         fi
7547
7548         echo -n "Setting pool using -p option..."
7549         $LFS_MIGRATE -y -q --no-rsync -p $pool $file1 &> /dev/null ||
7550                 error "migrate failed rc = $?"
7551         echo "done."
7552
7553         echo -n "Verifying test file is in pool after migrating..."
7554         [ "$($LFS getstripe -p $file1)" = $pool ] ||
7555                 error "file was not migrated to pool $pool"
7556         echo "done."
7557
7558         echo -n "Removing test file from pool '$pool'..."
7559         # "lfs migrate $file" won't remove the file from the pool
7560         # until some striping information is changed.
7561         $LFS migrate -c 1 $file1 &> /dev/null ||
7562                 error "cannot remove from pool"
7563         [ "$($LFS getstripe -p $file1)" ] &&
7564                 error "pool still set"
7565         echo "done."
7566
7567         echo -n "Setting pool using --pool option..."
7568         $LFS_MIGRATE -y -q --no-rsync --pool $pool $file1 &> /dev/null ||
7569                 error "migrate failed rc = $?"
7570         echo "done."
7571
7572         # Clean up
7573         rm -f $file1
7574         if $create_pool; then
7575                 destroy_test_pools 2> /dev/null ||
7576                         error "destroy test pools failed"
7577         fi
7578 }
7579 run_test 56wb "check lfs_migrate pool support"
7580
7581 test_56wc() {
7582         local file1="$DIR/$tdir/$tfile"
7583         local md5
7584         local parent_ssize
7585         local parent_scount
7586         local cur_ssize
7587         local cur_scount
7588         local orig_ssize
7589         local new_scount
7590         local cur_comp
7591
7592         echo -n "Creating test dir..."
7593         test_mkdir $DIR/$tdir &> /dev/null || error "cannot create dir"
7594         $LFS setstripe -S 1M -c 1 "$DIR/$tdir" &> /dev/null ||
7595                 error "cannot set stripe by '-S 1M -c 1'"
7596         echo "done"
7597
7598         echo -n "Setting initial stripe for test file..."
7599         $LFS setstripe -S 512K -c 1 "$file1" &> /dev/null ||
7600                 error "cannot set stripe"
7601         cur_ssize=$($LFS getstripe -S "$file1")
7602         (( cur_ssize == 524288 )) || error "setstripe -S $cur_ssize != 524288"
7603         echo "done."
7604
7605         dd if=/dev/urandom of=$file1 bs=1M count=12 || error "dd $file1 failed"
7606         stack_trap "rm -f $file1"
7607         md5="$(md5sum $file1)"
7608
7609         # File currently set to -S 512K -c 1
7610
7611         # Ensure -c and -S options are rejected when -R is set
7612         echo -n "Verifying incompatible options are detected..."
7613         $LFS_MIGRATE -R -c 1 "$file1" &&
7614                 error "incompatible -R and -c options not detected"
7615         $LFS_MIGRATE -R -S 1M "$file1" &&
7616                 error "incompatible -R and -S options not detected"
7617         $LFS_MIGRATE -R -p pool "$file1" &&
7618                 error "incompatible -R and -p options not detected"
7619         $LFS_MIGRATE -R -E eof -c 1 "$file1" &&
7620                 error "incompatible -R and -E options not detected"
7621         $LFS_MIGRATE -R -A "$file1" &&
7622                 error "incompatible -R and -A options not detected"
7623         $LFS_MIGRATE -A -c 1 "$file1" &&
7624                 error "incompatible -A and -c options not detected"
7625         $LFS_MIGRATE -A -S 1M "$file1" &&
7626                 error "incompatible -A and -S options not detected"
7627         $LFS_MIGRATE -A -p pool "$file1" &&
7628                 error "incompatible -A and -p options not detected"
7629         $LFS_MIGRATE -A -E eof -c 1 "$file1" &&
7630                 error "incompatible -A and -E options not detected"
7631         echo "done."
7632
7633         # Ensure unrecognized options are passed through to 'lfs migrate'
7634         echo -n "Verifying -S option is passed through to lfs migrate..."
7635         $LFS_MIGRATE -y -S 1M "$file1" || error "migration failed"
7636         cur_ssize=$($LFS getstripe -S "$file1")
7637         (( cur_ssize == 1048576 )) || error "migrate -S $cur_ssize != 1048576"
7638         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (1)"
7639         echo "done."
7640
7641         # File currently set to -S 1M -c 1
7642
7643         # Ensure long options are supported
7644         echo -n "Verifying long options supported..."
7645         $LFS_MIGRATE --non-block "$file1" ||
7646                 error "long option without argument not supported"
7647         $LFS_MIGRATE --stripe-size 512K "$file1" ||
7648                 error "long option with argument not supported"
7649         cur_ssize=$($LFS getstripe -S "$file1")
7650         (( cur_ssize == 524288 )) ||
7651                 error "migrate --stripe-size $cur_ssize != 524288"
7652         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (2)"
7653         echo "done."
7654
7655         # File currently set to -S 512K -c 1
7656
7657         if (( OSTCOUNT > 1 )); then
7658                 echo -n "Verifying explicit stripe count can be set..."
7659                 $LFS_MIGRATE -c 2 "$file1" || error "migrate failed"
7660                 cur_scount=$($LFS getstripe -c "$file1")
7661                 (( cur_scount == 2 )) || error "migrate -c $cur_scount != 2"
7662                 [[ "$(md5sum $file1)" == "$md5" ]] ||
7663                         error "file data has changed (3)"
7664                 echo "done."
7665         fi
7666
7667         # File currently set to -S 512K -c 1 or -S 512K -c 2
7668
7669         # Ensure parent striping is used if -R is set, and no stripe
7670         # count or size is specified
7671         echo -n "Setting stripe for parent directory..."
7672         $LFS setstripe -S 2M -c 1 "$DIR/$tdir" &> /dev/null ||
7673                 error "cannot set stripe '-S 2M -c 1'"
7674         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (4)"
7675         echo "done."
7676
7677         echo -n "Verifying restripe option uses parent stripe settings..."
7678         parent_ssize=$($LFS getstripe -S $DIR/$tdir 2>/dev/null)
7679         parent_scount=$($LFS getstripe -c $DIR/$tdir 2>/dev/null)
7680         $LFS_MIGRATE -R "$file1" || error "migrate failed"
7681         cur_ssize=$($LFS getstripe -S "$file1")
7682         (( cur_ssize == parent_ssize )) ||
7683                 error "migrate -R stripe_size $cur_ssize != $parent_ssize"
7684         cur_scount=$($LFS getstripe -c "$file1")
7685         (( cur_scount == parent_scount )) ||
7686                 error "migrate -R stripe_count $cur_scount != $parent_scount"
7687         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (5)"
7688         echo "done."
7689
7690         # File currently set to -S 1M -c 1
7691
7692         # Ensure striping is preserved if -R is not set, and no stripe
7693         # count or size is specified
7694         echo -n "Verifying striping size preserved when not specified..."
7695         orig_ssize=$($LFS getstripe -S "$file1" 2>/dev/null)
7696         $LFS setstripe -S 2M -c 1 "$DIR/$tdir" &> /dev/null ||
7697                 error "cannot set stripe on parent directory"
7698         $LFS_MIGRATE "$file1" || error "migrate failed"
7699         cur_ssize=$($LFS getstripe -S "$file1")
7700         (( cur_ssize == orig_ssize )) ||
7701                 error "migrate by default $cur_ssize != $orig_ssize"
7702         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (6)"
7703         echo "done."
7704
7705         # Ensure file name properly detected when final option has no argument
7706         echo -n "Verifying file name properly detected..."
7707         $LFS_MIGRATE "$file1" ||
7708                 error "file name interpreted as option argument"
7709         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (7)"
7710         echo "done."
7711
7712         # Ensure PFL arguments are passed through properly
7713         echo -n "Verifying PFL options passed through..."
7714         new_scount=$(((OSTCOUNT + 1) / 2))
7715         $LFS_MIGRATE -E 1M -c 1 -E 16M -c $new_scount -E eof -c -1 "$file1" ||
7716                 error "migrate PFL arguments failed"
7717         cur_comp=$($LFS getstripe --comp-count $file1)
7718         (( cur_comp == 3 )) || error "component count '$cur_comp' != 3"
7719         cur_scount=$($LFS getstripe --stripe-count $file1)
7720         (( cur_scount == new_scount)) ||
7721                 error "PFL stripe count $cur_scount != $new_scount"
7722         [[ "$(md5sum $file1)" == "$md5" ]] || error "file data has changed (8)"
7723         echo "done."
7724 }
7725 run_test 56wc "check unrecognized options for lfs_migrate are passed through"
7726
7727 test_56wd() {
7728         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
7729
7730         local file1=$DIR/$tdir/$tfile
7731
7732         echo -n "Creating test dir..."
7733         test_mkdir $DIR/$tdir || error "cannot create dir"
7734         echo "done."
7735
7736         echo -n "Creating test file..."
7737         echo "$tfile" > $file1
7738         echo "done."
7739
7740         # Ensure 'lfs migrate' will fail by using a non-existent option,
7741         # and make sure rsync is not called to recover
7742         echo -n "Make sure --no-rsync option works..."
7743         $LFS_MIGRATE -y --no-rsync --invalid-opt $file1 2>&1 |
7744                 grep -q 'refusing to fall back to rsync' ||
7745                 error "rsync was called with --no-rsync set"
7746         echo "done."
7747
7748         # Ensure rsync is called without trying 'lfs migrate' first
7749         echo -n "Make sure --rsync option works..."
7750         $LFS_MIGRATE -y --rsync --invalid-opt $file1 2>&1 |
7751                 grep -q 'falling back to rsync' &&
7752                 error "lfs migrate was called with --rsync set"
7753         echo "done."
7754 }
7755 run_test 56wd "check lfs_migrate --rsync and --no-rsync work"
7756
7757 test_56we() {
7758         local td=$DIR/$tdir
7759         local tf=$td/$tfile
7760
7761         test_mkdir $td || error "cannot create $td"
7762         touch $tf || error "cannot touch $tf"
7763
7764         echo -n "Make sure --non-direct|-D works..."
7765         $LFS_MIGRATE -y --non-direct -v $tf 2>&1 |
7766                 grep -q "lfs migrate --non-direct" ||
7767                 error "--non-direct option cannot work correctly"
7768         $LFS_MIGRATE -y -D -v $tf 2>&1 |
7769                 grep -q "lfs migrate -D" ||
7770                 error "-D option cannot work correctly"
7771         echo "done."
7772 }
7773 run_test 56we "check lfs_migrate --non-direct|-D support"
7774
7775 test_56x() {
7776         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
7777         check_swap_layouts_support
7778
7779         local dir=$DIR/$tdir
7780         local ref1=/etc/passwd
7781         local file1=$dir/file1
7782
7783         test_mkdir $dir || error "creating dir $dir"
7784         $LFS setstripe -c 2 $file1
7785         cp $ref1 $file1
7786         $LFS migrate -c 1 $file1 || error "migrate failed rc = $?"
7787         stripe=$($LFS getstripe -c $file1)
7788         [[ $stripe == 1 ]] || error "stripe of $file1 is $stripe != 1"
7789         cmp $file1 $ref1 || error "content mismatch $file1 differs from $ref1"
7790
7791         # clean up
7792         rm -f $file1
7793 }
7794 run_test 56x "lfs migration support"
7795
7796 test_56xa() {
7797         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
7798         check_swap_layouts_support
7799
7800         local dir=$DIR/$tdir/$testnum
7801
7802         test_mkdir -p $dir
7803
7804         local ref1=/etc/passwd
7805         local file1=$dir/file1
7806
7807         $LFS setstripe -c 2 $file1
7808         cp $ref1 $file1
7809         $LFS migrate --block -c 1 $file1 || error "migrate failed rc = $?"
7810
7811         local stripe=$($LFS getstripe -c $file1)
7812
7813         [[ $stripe == 1 ]] || error "stripe of $file1 is $stripe != 1"
7814         cmp $file1 $ref1 || error "content mismatch $file1 differs from $ref1"
7815
7816         # clean up
7817         rm -f $file1
7818 }
7819 run_test 56xa "lfs migration --block support"
7820
7821 check_migrate_links() {
7822         [[ "$1" == "--rsync" ]] && local opts="--rsync -y" && shift
7823         local dir="$1"
7824         local file1="$dir/file1"
7825         local begin="$2"
7826         local count="$3"
7827         local runas="$4"
7828         local total_count=$(($begin + $count - 1))
7829         local symlink_count=10
7830         local uniq_count=10
7831
7832         if [ ! -f "$file1" ]; then
7833                 echo -n "creating initial file..."
7834                 $LFS setstripe -c 1 -S "512k" "$file1" ||
7835                         error "cannot setstripe initial file"
7836                 echo "done"
7837
7838                 echo -n "creating symlinks..."
7839                 for s in $(seq 1 $symlink_count); do
7840                         ln -s "$file1" "$dir/slink$s" ||
7841                                 error "cannot create symlinks"
7842                 done
7843                 echo "done"
7844
7845                 echo -n "creating nonlinked files..."
7846                 createmany -o "$dir/uniq" 1 10 &> /dev/null ||
7847                         error "cannot create nonlinked files"
7848                 echo "done"
7849         fi
7850
7851         # create hard links
7852         if [ ! -f "$dir/file$total_count" ]; then
7853                 echo -n "creating hard links $begin:$total_count..."
7854                 createmany -l"$file1" "$dir/file" "$begin" "$count" &>  \
7855                         /dev/null || error "cannot create hard links"
7856                 echo "done"
7857         fi
7858
7859         echo -n "checking number of hard links listed in xattrs..."
7860         local fid=$($LFS getstripe -F "$file1")
7861         local paths=($($LFS fid2path "$MOUNT" "$fid" 2> /dev/null))
7862
7863         echo "${#paths[*]}"
7864         if [ ${#paths[*]} -lt $total_count -a "$begin" -eq 2  ]; then
7865                         skip "hard link list has unexpected size, skipping test"
7866         fi
7867         if [ ${#paths[*]} -ge $total_count -a "$begin" -ne 2  ]; then
7868                         error "link names should exceed xattrs size"
7869         fi
7870
7871         echo -n "migrating files..."
7872         local migrate_out=$($runas $LFS_MIGRATE $opts -S '1m' $dir)
7873         local rc=$?
7874         [ $rc -eq 0 ] || error "migrate failed rc = $rc"
7875         echo "done"
7876
7877         # make sure all links have been properly migrated
7878         echo -n "verifying files..."
7879         fid=$($LFS getstripe -F "$file1") ||
7880                 error "cannot get fid for file $file1"
7881         for i in $(seq 2 $total_count); do
7882                 local fid2=$($LFS getstripe -F $dir/file$i)
7883
7884                 [ "$fid2" == "$fid" ] ||
7885                         error "migrated hard link has mismatched FID"
7886         done
7887
7888         # make sure hard links were properly detected, and migration was
7889         # performed only once for the entire link set; nonlinked files should
7890         # also be migrated
7891         local actual=$(grep -c 'done' <<< "$migrate_out")
7892         local expected=$(($uniq_count + 1))
7893
7894         [ "$actual" -eq  "$expected" ] ||
7895                 error "hard links individually migrated ($actual != $expected)"
7896
7897         # make sure the correct number of hard links are present
7898         local hardlinks=$(stat -c '%h' "$file1")
7899
7900         [ $hardlinks -eq $total_count ] ||
7901                 error "num hard links $hardlinks != $total_count"
7902         echo "done"
7903
7904         return 0
7905 }
7906
7907 test_56xb() {
7908         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
7909                 skip "Need MDS version at least 2.10.55"
7910
7911         local dir="$DIR/$tdir"
7912
7913         test_mkdir "$dir" || error "cannot create dir $dir"
7914
7915         echo "testing lfs migrate mode when all links fit within xattrs"
7916         check_migrate_links "$dir" 2 99
7917
7918         echo "testing rsync mode when all links fit within xattrs"
7919         check_migrate_links --rsync "$dir" 2 99
7920
7921         echo "testing lfs migrate mode when all links do not fit within xattrs"
7922         check_migrate_links "$dir" 101 100
7923
7924         echo "testing rsync mode when all links do not fit within xattrs"
7925         check_migrate_links --rsync "$dir" 101 100
7926
7927         chown -R $RUNAS_ID $dir
7928         echo "testing non-root lfs migrate mode when not all links are in xattr"
7929         check_migrate_links "$dir" 101 100 "$RUNAS"
7930
7931         # clean up
7932         rm -rf $dir
7933 }
7934 run_test 56xb "lfs migration hard link support"
7935
7936 test_56xc() {
7937         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
7938
7939         local dir="$DIR/$tdir"
7940
7941         test_mkdir "$dir" || error "cannot create dir $dir"
7942
7943         # Test 1: ensure file < 1 GB is always migrated with 1 stripe
7944         echo -n "Setting initial stripe for 20MB test file..."
7945         $LFS setstripe -c 2 -i 0 "$dir/20mb" ||
7946                 error "cannot setstripe 20MB file"
7947         echo "done"
7948         echo -n "Sizing 20MB test file..."
7949         $TRUNCATE "$dir/20mb" 20971520 || error "cannot create 20MB test file"
7950         echo "done"
7951         echo -n "Verifying small file autostripe count is 1..."
7952         $LFS_MIGRATE -y -A -C 1 "$dir/20mb" ||
7953                 error "cannot migrate 20MB file"
7954         local stripe_count=$($LFS getstripe -c "$dir/20mb") ||
7955                 error "cannot get stripe for $dir/20mb"
7956         [ $stripe_count -eq 1 ] ||
7957                 error "unexpected stripe count $stripe_count for 20MB file"
7958         rm -f "$dir/20mb"
7959         echo "done"
7960
7961         # Test 2: File is small enough to fit within the available space on
7962         # sqrt(size_in_gb) + 1 OSTs but is larger than 1GB.  The file must
7963         # have at least an additional 1KB for each desired stripe for test 3
7964         echo -n "Setting stripe for 1GB test file..."
7965         $LFS setstripe -c 1 -i 0 "$dir/1gb" || error "cannot setstripe 1GB file"
7966         echo "done"
7967         echo -n "Sizing 1GB test file..."
7968         # File size is 1GB + 3KB
7969         $TRUNCATE "$dir/1gb" 1073744896 || error "cannot create 1GB test file"
7970         echo "done"
7971
7972         # need at least 512MB per OST for 1GB file to fit in 2 stripes
7973         local avail=$($LCTL get_param -n llite.$FSNAME*.kbytesavail)
7974         if (( avail > 524288 * OSTCOUNT )); then
7975                 echo -n "Migrating 1GB file..."
7976                 $LFS_MIGRATE -y -A -C 1 "$dir/1gb" ||
7977                         error "cannot migrate 1GB file"
7978                 echo "done"
7979                 echo -n "Verifying autostripe count is sqrt(n) + 1..."
7980                 stripe_count=$($LFS getstripe -c "$dir/1gb") ||
7981                         error "cannot getstripe for 1GB file"
7982                 [ $stripe_count -eq 2 ] ||
7983                         error "unexpected stripe count $stripe_count != 2"
7984                 echo "done"
7985         fi
7986
7987         # Test 3: File is too large to fit within the available space on
7988         # sqrt(n) + 1 OSTs.  Simulate limited available space with -X
7989         if [ $OSTCOUNT -ge 3 ]; then
7990                 # The required available space is calculated as
7991                 # file size (1GB + 3KB) / OST count (3).
7992                 local kb_per_ost=349526
7993
7994                 echo -n "Migrating 1GB file with limit..."
7995                 $LFS_MIGRATE -y -A -C 1 -X $kb_per_ost "$dir/1gb" ||
7996                         error "cannot migrate 1GB file with limit"
7997                 echo "done"
7998
7999                 stripe_count=$($LFS getstripe -c "$dir/1gb")
8000                 echo -n "Verifying 1GB autostripe count with limited space..."
8001                 [ "$stripe_count" -a $stripe_count -ge 3 ] ||
8002                         error "unexpected stripe count $stripe_count (min 3)"
8003                 echo "done"
8004         fi
8005
8006         # clean up
8007         rm -rf $dir
8008 }
8009 run_test 56xc "lfs migration autostripe"
8010
8011 test_56xd() {
8012         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
8013
8014         local dir=$DIR/$tdir
8015         local f_mgrt=$dir/$tfile.mgrt
8016         local f_yaml=$dir/$tfile.yaml
8017         local f_copy=$dir/$tfile.copy
8018         local layout_yaml="-E 1M -S 512K -c 1 -E -1 -S 1M -c 2 -i 0"
8019         local layout_copy="-c 2 -S 2M -i 1"
8020         local yamlfile=$dir/yamlfile
8021         local layout_before;
8022         local layout_after;
8023
8024         test_mkdir "$dir" || error "cannot create dir $dir"
8025         stack_trap "rm -rf $dir"
8026         $LFS setstripe $layout_yaml $f_yaml ||
8027                 error "cannot setstripe $f_yaml with layout $layout_yaml"
8028         $LFS getstripe --yaml $f_yaml > $yamlfile
8029         $LFS setstripe $layout_copy $f_copy ||
8030                 error "cannot setstripe $f_copy with layout $layout_copy"
8031         touch $f_mgrt
8032         dd if=/dev/zero of=$f_mgrt bs=1M count=4
8033
8034         # 1. test option --yaml
8035         $LFS_MIGRATE -y --yaml $yamlfile $f_mgrt ||
8036                 error "cannot migrate $f_mgrt with --yaml $yamlfile"
8037         layout_before=$(get_layout_param $f_yaml)
8038         layout_after=$(get_layout_param $f_mgrt)
8039         [ "$layout_after" == "$layout_before" ] ||
8040                 error "lfs_migrate --yaml: $layout_after != $layout_before"
8041
8042         # 2. test option --copy
8043         $LFS_MIGRATE -y --copy $f_copy $f_mgrt ||
8044                 error "cannot migrate $f_mgrt with --copy $f_copy"
8045         layout_before=$(SKIP_INDEX=yes get_layout_param $f_copy)
8046         layout_after=$(SKIP_INDEX=yes get_layout_param $f_mgrt)
8047         [ "$layout_after" == "$layout_before" ] ||
8048                 error "lfs_migrate --copy: $layout_after != $layout_before"
8049 }
8050 run_test 56xd "check lfs_migrate --yaml and --copy support"
8051
8052 test_56xe() {
8053         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
8054
8055         local dir=$DIR/$tdir
8056         local f_comp=$dir/$tfile
8057         local layout="-E 1M -S 512K -c 1 -E -1 -S 1M -c 2 -i 0"
8058         local layout_before=""
8059         local layout_after=""
8060
8061         test_mkdir "$dir" || error "cannot create dir $dir"
8062         stack_trap "rm -rf $dir"
8063         $LFS setstripe $layout $f_comp ||
8064                 error "cannot setstripe $f_comp with layout $layout"
8065         layout_before=$(SKIP_INDEX=yes get_layout_param $f_comp)
8066         dd if=/dev/zero of=$f_comp bs=1M count=4
8067
8068         # 1. migrate a comp layout file by lfs_migrate
8069         $LFS_MIGRATE -y $f_comp || error "cannot migrate $f_comp by lfs_migrate"
8070         layout_after=$(SKIP_INDEX=yes get_layout_param $f_comp)
8071         [ "$layout_before" == "$layout_after" ] ||
8072                 error "lfs_migrate: $layout_before != $layout_after"
8073
8074         # 2. migrate a comp layout file by lfs migrate
8075         $LFS migrate $f_comp || error "cannot migrate $f_comp by lfs migrate"
8076         layout_after=$(SKIP_INDEX=yes get_layout_param $f_comp)
8077         [ "$layout_before" == "$layout_after" ] ||
8078                 error "lfs migrate: $layout_before != $layout_after"
8079 }
8080 run_test 56xe "migrate a composite layout file"
8081
8082 test_56xf() {
8083         [[ $OSTCOUNT -ge 2 ]] || skip_env "needs >= 2 OSTs"
8084
8085         [[ $MDS1_VERSION -ge $(version_code 2.13.53) ]] ||
8086                 skip "Need server version at least 2.13.53"
8087
8088         local dir=$DIR/$tdir
8089         local f_comp=$dir/$tfile
8090         local layout="-E 1M -c1 -E -1 -c2"
8091         local fid_before=""
8092         local fid_after=""
8093
8094         test_mkdir "$dir" || error "cannot create dir $dir"
8095         stack_trap "rm -rf $dir"
8096         $LFS setstripe $layout $f_comp ||
8097                 error "cannot setstripe $f_comp with layout $layout"
8098         fid_before=$($LFS getstripe --fid $f_comp)
8099         dd if=/dev/zero of=$f_comp bs=1M count=4
8100
8101         # 1. migrate a comp layout file to a comp layout
8102         $LFS migrate $f_comp || error "cannot migrate $f_comp by lfs migrate"
8103         fid_after=$($LFS getstripe --fid $f_comp)
8104         [ "$fid_before" == "$fid_after" ] ||
8105                 error "comp-to-comp migrate: $fid_before != $fid_after"
8106
8107         # 2. migrate a comp layout file to a plain layout
8108         $LFS migrate -c2 $f_comp ||
8109                 error "cannot migrate $f_comp by lfs migrate"
8110         fid_after=$($LFS getstripe --fid $f_comp)
8111         [ "$fid_before" == "$fid_after" ] ||
8112                 error "comp-to-plain migrate: $fid_before != $fid_after"
8113
8114         # 3. migrate a plain layout file to a comp layout
8115         $LFS migrate $layout $f_comp ||
8116                 error "cannot migrate $f_comp by lfs migrate"
8117         fid_after=$($LFS getstripe --fid $f_comp)
8118         [ "$fid_before" == "$fid_after" ] ||
8119                 error "plain-to-comp migrate: $fid_before != $fid_after"
8120 }
8121 run_test 56xf "FID is not lost during migration of a composite layout file"
8122
8123 check_file_ost_range() {
8124         local file="$1"
8125         shift
8126         local range="$*"
8127         local -a file_range
8128         local idx
8129
8130         file_range=($($LFS getstripe -y "$file" |
8131                 awk '/l_ost_idx:/ { print $NF }'))
8132
8133         if [[ "${#file_range[@]}" = 0 ]]; then
8134                 echo "No osts found for $file"
8135                 return 1
8136         fi
8137
8138         for idx in "${file_range[@]}"; do
8139                 [[ " $range " =~ " $idx " ]] ||
8140                         return 1
8141         done
8142
8143         return 0
8144 }
8145
8146 sub_test_56xg() {
8147         local stripe_opt="$1"
8148         local pool="$2"
8149         shift 2
8150         local pool_ostidx="$(seq $* | tr '\n' ' ')"
8151
8152         $LFS migrate $stripe_opt -p $pool $DIR/$tfile ||
8153                 error "Fail to migrate $tfile on $pool"
8154         [[ "$($LFS getstripe -p $DIR/$tfile)" = "$pool" ]] ||
8155                 error "$tfile is not in pool $pool"
8156         check_file_ost_range "$DIR/$tfile" $pool_ostidx ||
8157                 error "$tfile osts mismatch with pool $pool (osts $pool_ostidx)"
8158 }
8159
8160 test_56xg() {
8161         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
8162         [[ $OSTCOUNT -ge 2 ]] || skip "needs >= 2 OSTs"
8163         [[ $MDS1_VERSION -gt $(version_code 2.14.52) ]] ||
8164                 skip "Need MDS version newer than 2.14.52"
8165
8166         local -a pool_names=("${TESTNAME}_0" "${TESTNAME}_1" "${TESTNAME}_2")
8167         local -a pool_ranges=("0 0" "1 1" "0 1")
8168
8169         # init pools
8170         for i in "${!pool_names[@]}"; do
8171                 pool_add ${pool_names[$i]} ||
8172                         error "pool_add failed (pool: ${pool_names[$i]})"
8173                 pool_add_targets ${pool_names[$i]} ${pool_ranges[$i]} ||
8174                         error "pool_add_targets failed (pool: ${pool_names[$i]})"
8175         done
8176
8177         # init the file to migrate
8178         $LFS setstripe -c1 -i1 $DIR/$tfile ||
8179                 error "Unable to create $tfile on OST1"
8180         stack_trap "rm -f $DIR/$tfile"
8181         dd if=/dev/urandom of=$DIR/$tfile bs=1M count=4 status=none ||
8182                 error "Unable to write on $tfile"
8183
8184         echo "1. migrate $tfile on pool ${pool_names[0]}"
8185         sub_test_56xg "-c-1" "${pool_names[0]}" ${pool_ranges[0]}
8186
8187         echo "2. migrate $tfile on pool ${pool_names[2]}"
8188         sub_test_56xg "-c-1 -S2M" "${pool_names[2]}" ${pool_ranges[2]}
8189
8190         echo "3. migrate $tfile on pool ${pool_names[1]}"
8191         sub_test_56xg "-n -c-1" "${pool_names[1]}" ${pool_ranges[1]}
8192
8193         echo "4. migrate $tfile on pool ${pool_names[2]} with default stripe parameters"
8194         sub_test_56xg "" "${pool_names[2]}" ${pool_ranges[2]}
8195         echo
8196
8197         # Clean pools
8198         destroy_test_pools ||
8199                 error "pool_destroy failed"
8200 }
8201 run_test 56xg "lfs migrate pool support"
8202
8203 test_56xh() {
8204         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
8205
8206         local size_mb=25
8207         local file1=$DIR/$tfile
8208         local tmp1=$TMP/$tfile.tmp
8209
8210         $LFS setstripe -c 2 $file1
8211
8212         stack_trap "rm -f $file1 $tmp1"
8213         dd if=/dev/urandom of=$tmp1 bs=1M count=$size_mb ||
8214                         error "error creating $tmp1"
8215         ls -lsh $tmp1
8216         cp $tmp1 $file1
8217
8218         local start=$SECONDS
8219
8220         $LFS migrate --stats --stats-interval=1 -W 1M -c 1 $file1 ||
8221                 error "migrate failed rc = $?"
8222
8223         local elapsed=$((SECONDS - start))
8224
8225         # with 1MB/s, elapsed should equal size_mb
8226         (( elapsed >= size_mb * 95 / 100 )) ||
8227                 error "'lfs migrate -W' too fast ($elapsed < 0.95 * $size_mb)?"
8228
8229         (( elapsed <= size_mb * 120 / 100 )) ||
8230                 error_not_in_vm "'lfs migrate -W' slow ($elapsed > 1.2 * $size_mb)"
8231
8232         (( elapsed <= size_mb * 350 / 100 )) ||
8233                 error "'lfs migrate -W' too slow in VM ($elapsed > 3.5 * $size_mb)"
8234
8235         stripe=$($LFS getstripe -c $file1)
8236         (( $stripe == 1 )) || error "stripe of $file1 is $stripe != 1"
8237         cmp $file1 $tmp1 || error "content mismatch $file1 differs from $tmp1"
8238
8239         # Clean up file (since it is multiple MB)
8240         rm -f $file1 $tmp1
8241 }
8242 run_test 56xh "lfs migrate bandwidth limitation support"
8243
8244 test_56xi() {
8245         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
8246         verify_yaml_available || skip_env "YAML verification not installed"
8247
8248         local size_mb=5
8249         local file1=$DIR/$tfile.1
8250         local file2=$DIR/$tfile.2
8251         local file3=$DIR/$tfile.3
8252         local output_file=$DIR/$tfile.out
8253         local tmp1=$TMP/$tfile.tmp
8254
8255         $LFS setstripe -c 2 $file1
8256         $LFS setstripe -c 2 $file2
8257         $LFS setstripe -c 2 $file3
8258
8259         stack_trap "rm -f $file1 $file2 $file3 $tmp1 $output_file"
8260         dd if=/dev/urandom of=$tmp1 bs=1M count=$size_mb ||
8261                         error "error creating $tmp1"
8262         ls -lsh $tmp1
8263         cp $tmp1 $file1
8264         cp $tmp1 $file2
8265         cp $tmp1 $file3
8266
8267         $LFS migrate --stats --stats-interval=1 \
8268                 -c 1 $file1 $file2 $file3 1> $output_file ||
8269                 error "migrate failed rc = $?"
8270
8271         cat $output_file
8272         cat $output_file | verify_yaml || error "rename_stats is not valid YAML"
8273
8274         # Clean up file (since it is multiple MB)
8275         rm -f $file1 $file2 $file3 $tmp1 $output_file
8276 }
8277 run_test 56xi "lfs migrate stats support"
8278
8279 test_56xj() { # LU-16571 "lfs migrate -b" can cause thread starvation on OSS
8280         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
8281
8282         local file=$DIR/$tfile
8283         local linkdir=$DIR/$tdir
8284
8285         test_mkdir $linkdir || error "fail to create $linkdir"
8286         $LFS setstripe -i 0 -c 1 -S1M $file
8287         stack_trap "rm -rf $file $linkdir"
8288         dd if=/dev/urandom of=$file bs=1M count=10 ||
8289                 error "fail to create $file"
8290
8291         # Create file links
8292         local cpts
8293         local threads_max
8294         local nlinks
8295
8296         thread_max=$(do_facet ost1 "$LCTL get_param -n ost.OSS.ost.threads_max")
8297         cpts=$(do_facet ost1 "$LCTL get_param -n cpu_partition_table | wc -l")
8298         (( nlinks = thread_max * 3 / 2 / cpts))
8299
8300         echo "create $nlinks hard links of $file"
8301         createmany -l $file $linkdir/link $nlinks
8302
8303         # Parallel migrates (should not block)
8304         local i
8305         for ((i = 0; i < nlinks; i++)); do
8306                 echo $linkdir/link$i
8307         done | xargs -n1 -P $nlinks $LFS migrate -c2
8308
8309         local stripe_count
8310         stripe_count=$($LFS getstripe -c $file) ||
8311                 error "fail to get stripe count on $file"
8312
8313         ((stripe_count == 2)) ||
8314                 error "fail to migrate $file (stripe_count = $stripe_count)"
8315 }
8316 run_test 56xj "lfs migrate -b should not cause starvation of threads on OSS"
8317
8318 test_56y() {
8319         [ $MDS1_VERSION -lt $(version_code 2.4.53) ] &&
8320                 skip "No HSM $(lustre_build_version $SINGLEMDS) MDS < 2.4.53"
8321
8322         local res=""
8323         local dir=$DIR/$tdir
8324         local f1=$dir/file1
8325         local f2=$dir/file2
8326
8327         test_mkdir -p $dir || error "creating dir $dir"
8328         touch $f1 || error "creating std file $f1"
8329         $MULTIOP $f2 H2c || error "creating released file $f2"
8330
8331         # a directory can be raid0, so ask only for files
8332         res=$($LFS find $dir -L raid0 -type f | wc -l)
8333         [[ $res == 2 ]] || error "search raid0: found $res files != 2"
8334
8335         res=$($LFS find $dir \! -L raid0 -type f | wc -l)
8336         [[ $res == 0 ]] || error "search !raid0: found $res files != 0"
8337
8338         # only files can be released, so no need to force file search
8339         res=$($LFS find $dir -L released)
8340         [[ $res == $f2 ]] || error "search released: found $res != $f2"
8341
8342         res=$($LFS find $dir -type f \! -L released)
8343         [[ $res == $f1 ]] || error "search !released: found $res != $f1"
8344 }
8345 run_test 56y "lfs find -L raid0|released"
8346
8347 test_56z() { # LU-4824
8348         # This checks to make sure 'lfs find' continues after errors
8349         # There are two classes of errors that should be caught:
8350         # - If multiple paths are provided, all should be searched even if one
8351         #   errors out
8352         # - If errors are encountered during the search, it should not terminate
8353         #   early
8354         local dir=$DIR/$tdir
8355         local i
8356
8357         test_mkdir $dir
8358         for i in d{0..9}; do
8359                 test_mkdir $dir/$i
8360                 touch $dir/$i/$tfile
8361         done
8362         $LFS find $DIR/non_existent_dir $dir &&
8363                 error "$LFS find did not return an error"
8364         # Make a directory unsearchable. This should NOT be the last entry in
8365         # directory order.  Arbitrarily pick the 6th entry
8366         chmod 700 $($LFS find $dir -type d | sed '6!d')
8367
8368         $RUNAS $LFS find $DIR/non_existent $dir
8369         local count=$($RUNAS $LFS find $DIR/non_existent $dir | wc -l)
8370
8371         # The user should be able to see 10 directories and 9 files
8372         (( count == 19 )) ||
8373                 error "$LFS find found $count != 19 entries after error"
8374 }
8375 run_test 56z "lfs find should continue after an error"
8376
8377 test_56aa() { # LU-5937
8378         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
8379
8380         local dir=$DIR/$tdir
8381
8382         mkdir $dir
8383         $LFS setdirstripe -c$MDSCOUNT $dir/striped_dir
8384
8385         createmany -o $dir/striped_dir/${tfile}- 1024
8386         local dirs=$($LFS find --size +8k $dir/)
8387
8388         [ -n "$dirs" ] || error "lfs find --size wrong under striped dir"
8389 }
8390 run_test 56aa "lfs find --size under striped dir"
8391
8392 test_56ab() { # LU-10705
8393         test_mkdir $DIR/$tdir
8394         dd if=/dev/zero of=$DIR/$tdir/$tfile.1 bs=8k count=1 seek=2k
8395         dd if=/dev/zero of=$DIR/$tdir/$tfile.2 bs=4k count=1 seek=4k
8396         dd if=/dev/zero of=$DIR/$tdir/$tfile.3 bs=1M count=2 seek=16
8397         # Flush writes to ensure valid blocks.  Need to be more thorough for
8398         # ZFS, since blocks are not allocated/returned to client immediately.
8399         sync_all_data
8400         wait_zfs_commit ost1 2
8401         cancel_lru_locks osc
8402         ls -ls $DIR/$tdir
8403
8404         local files=$($LFS find --size +16M $DIR/$tdir | wc -l)
8405
8406         [[ $files == 3 ]] || error ">16M size files $files isn't 3 as expected"
8407
8408         files=$($LFS find --blocks +1M $DIR/$tdir | wc -l)
8409         [[ $files == 1 ]] || error ">1M blocks files $files isn't 1 as expected"
8410
8411         rm -f $DIR/$tdir/$tfile.[123]
8412 }
8413 run_test 56ab "lfs find --blocks"
8414
8415 # LU-11188
8416 test_56aca() {
8417         local dir="$DIR/$tdir"
8418         local perms=(001 002 003 004 005 006 007
8419                      010 020 030 040 050 060 070
8420                      100 200 300 400 500 600 700
8421                      111 222 333 444 555 666 777)
8422         local perm_minus=(8 8 4 8 4 4 2
8423                           8 8 4 8 4 4 2
8424                           8 8 4 8 4 4 2
8425                           4 4 2 4 2 2 1)
8426         local perm_slash=(8  8 12  8 12 12 14
8427                           8  8 12  8 12 12 14
8428                           8  8 12  8 12 12 14
8429                          16 16 24 16 24 24 28)
8430
8431         test_mkdir "$dir"
8432         for perm in ${perms[*]}; do
8433                 touch "$dir/$tfile.$perm"
8434                 chmod $perm "$dir/$tfile.$perm"
8435         done
8436
8437         for ((i = 0; i < ${#perms[*]}; i++)); do
8438                 local num=$($LFS find $dir -perm ${perms[i]} | wc -l)
8439                 (( $num == 1 )) ||
8440                         error "lfs find -perm ${perms[i]}:"\
8441                               "$num != 1"
8442
8443                 num=$($LFS find $dir -perm -${perms[i]} -type f| wc -l)
8444                 (( $num == ${perm_minus[i]} )) ||
8445                         error "lfs find -perm -${perms[i]}:"\
8446                               "$num != ${perm_minus[i]}"
8447
8448                 num=$($LFS find $dir -perm /${perms[i]} -type f| wc -l)
8449                 (( $num == ${perm_slash[i]} )) ||
8450                         error "lfs find -perm /${perms[i]}:"\
8451                               "$num != ${perm_slash[i]}"
8452         done
8453 }
8454 run_test 56aca "check lfs find -perm with octal representation"
8455
8456 test_56acb() {
8457         local dir=$DIR/$tdir
8458         # p is the permission of write and execute for user, group and other
8459         # without the umask. It is used to test +wx.
8460         local p=$(printf "%o" "$((0333 & ~$(umask)))")
8461         local perms=(1000 000 2000 4000 $p 644 111 110 100 004)
8462         local symbolic=(+t  a+t u+t g+t o+t
8463                         g+s u+s o+s +s o+sr
8464                         o=r,ug+o,u+w
8465                         u+ g+ o+ a+ ugo+
8466                         u- g- o- a- ugo-
8467                         u= g= o= a= ugo=
8468                         o=r,ug+o,u+w u=r,a+u,u+w
8469                         g=r,ugo=g,u+w u+x,+X +X
8470                         u+x,u+X u+X u+x,g+X o+r,+X
8471                         u+x,go+X +wx +rwx)
8472
8473         test_mkdir $dir
8474         for perm in ${perms[*]}; do
8475                 touch "$dir/$tfile.$perm"
8476                 chmod $perm "$dir/$tfile.$perm"
8477         done
8478
8479         for (( i = 0; i < ${#symbolic[*]}; i++ )); do
8480                 local num=$($LFS find $dir -perm ${symbolic[i]} | wc -l)
8481
8482                 (( $num == 1 )) ||
8483                         error "lfs find $dir -perm ${symbolic[i]}: $num != 1"
8484         done
8485 }
8486 run_test 56acb "check lfs find -perm with symbolic representation"
8487
8488 test_56acc() {
8489         local dir=$DIR/$tdir
8490         local tests="17777 787 789 abcd
8491                 ug=uu ug=a ug=gu uo=ou urw
8492                 u+xg+x a=r,u+x,"
8493
8494         test_mkdir $dir
8495         for err in $tests; do
8496                 if $LFS find $dir -perm $err 2>/dev/null; then
8497                         error "lfs find -perm $err: parsing should have failed"
8498                 fi
8499         done
8500 }
8501 run_test 56acc "check parsing error for lfs find -perm"
8502
8503 test_56ba() {
8504         [ $MDS1_VERSION -lt $(version_code 2.10.50) ] &&
8505                 skip "Need MDS version at least 2.10.50"
8506
8507         # Create composite files with one component
8508         local dir=$DIR/$tdir
8509
8510         setup_56 $dir/1Mfiles 5 1 "-S 1M --component-end 1M"
8511         # Create composite files with three components
8512         setup_56 $dir/2Mfiles 5 2 "-E 2M -S 1M -E 4M -E 6M"
8513         # Create non-composite files
8514         createmany -o $dir/${tfile}- 10
8515
8516         local nfiles=$($LFS find --component-end 1M --type f $dir | wc -l)
8517
8518         [[ $nfiles == 10 ]] ||
8519                 error "lfs find -E 1M found $nfiles != 10 files"
8520
8521         nfiles=$($LFS find ! -E 1M --type f $dir | wc -l)
8522         [[ $nfiles == 25 ]] ||
8523                 error "lfs find ! -E 1M found $nfiles != 25 files"
8524
8525         # All files have a component that starts at 0
8526         nfiles=$($LFS find --component-start 0 --type f $dir | wc -l)
8527         [[ $nfiles == 35 ]] ||
8528                 error "lfs find --component-start 0 - $nfiles != 35 files"
8529
8530         nfiles=$($LFS find --component-start 2M --type f $dir | wc -l)
8531         [[ $nfiles == 15 ]] ||
8532                 error "lfs find --component-start 2M - $nfiles != 15 files"
8533
8534         # All files created here have a componenet that does not starts at 2M
8535         nfiles=$($LFS find ! --component-start 2M --type f $dir | wc -l)
8536         [[ $nfiles == 35 ]] ||
8537                 error "lfs find ! --component-start 2M - $nfiles != 35 files"
8538
8539         # Find files with a specified number of components
8540         local nfiles=$($LFS find --component-count 3 --type f $dir | wc -l)
8541         [[ $nfiles == 15 ]] ||
8542                 error "lfs find --component-count 3 - $nfiles != 15 files"
8543
8544         # Remember non-composite files have a component count of zero
8545         local nfiles=$($LFS find --component-count 0 --type f $dir | wc -l)
8546         [[ $nfiles == 10 ]] ||
8547                 error "lfs find --component-count 0 - $nfiles != 10 files"
8548
8549         nfiles=$($LFS find ! --component-count 3 --type f $dir | wc -l)
8550         [[ $nfiles == 20 ]] ||
8551                 error "lfs find ! --component-count 3 - $nfiles != 20 files"
8552
8553         # All files have a flag called "init"
8554         local nfiles=$($LFS find --component-flags init --type f $dir | wc -l)
8555         [[ $nfiles == 35 ]] ||
8556                 error "lfs find --component-flags init - $nfiles != 35 files"
8557
8558         # Multi-component files will have a component not initialized
8559         local nfiles=$($LFS find ! --component-flags init --type f $dir | wc -l)
8560         [[ $nfiles == 15 ]] ||
8561                 error "lfs find !--component-flags init - $nfiles != 15 files"
8562
8563         rm -rf $dir
8564
8565 }
8566 run_test 56ba "test lfs find --component-end, -start, -count, and -flags"
8567
8568 test_56ca() {
8569         [[ $MDS1_VERSION -ge $(version_code 2.10.57) ]] ||
8570                 skip "Need MDS version at least 2.10.57"
8571
8572         local td=$DIR/$tdir
8573         local tf=$td/$tfile
8574         local dir
8575         local nfiles
8576         local cmd
8577         local i
8578         local j
8579
8580         # create mirrored directories and mirrored files
8581         mkdir $td || error "mkdir $td failed"
8582         $LFS mirror create -N3 $td || error "create mirrored dir $td failed"
8583         createmany -o $tf- 10 || error "create $tf- failed"
8584
8585         for i in $(seq 2); do
8586                 dir=$td/dir$i
8587                 mkdir $dir || error "mkdir $dir failed"
8588                 $LFS mirror create -N$((3 + i)) $dir ||
8589                         error "create mirrored dir $dir failed"
8590                 createmany -o $dir/$tfile- 10 ||
8591                         error "create $dir/$tfile- failed"
8592         done
8593
8594         # change the states of some mirrored files
8595         echo foo > $tf-6
8596         for i in $(seq 2); do
8597                 dir=$td/dir$i
8598                 for j in $(seq 4 9); do
8599                         echo foo > $dir/$tfile-$j
8600                 done
8601         done
8602
8603         # find mirrored files with specific mirror count
8604         cmd="$LFS find --mirror-count 3 --type f $td"
8605         nfiles=$($cmd | wc -l)
8606         [[ $nfiles = 10 ]] || error "$cmd: $nfiles != 10 files"
8607
8608         cmd="$LFS find ! --mirror-count 3 --type f $td"
8609         nfiles=$($cmd | wc -l)
8610         [[ $nfiles = 20 ]] || error "$cmd: $nfiles != 20 files"
8611
8612         cmd="$LFS find --mirror-count +2 --type f $td"
8613         nfiles=$($cmd | wc -l)
8614         [[ $nfiles = 30 ]] || error "$cmd: $nfiles != 30 files"
8615
8616         cmd="$LFS find --mirror-count -6 --type f $td"
8617         nfiles=$($cmd | wc -l)
8618         [[ $nfiles = 30 ]] || error "$cmd: $nfiles != 30 files"
8619
8620         # find mirrored files with specific file state
8621         cmd="$LFS find --maxdepth 1 --mirror-state=^ro --type f $td"
8622         [[ $($cmd) = $tf-6 ]] || error "$cmd: didn't return $tf-6"
8623
8624         cmd="$LFS find --mirror-state=ro --type f $td"
8625         nfiles=$($cmd | wc -l)
8626         [[ $nfiles = 17 ]] || error "$cmd: $nfiles != 17 files"
8627
8628         cmd="$LFS find ! --mirror-state=ro --type f $td"
8629         nfiles=$($cmd | wc -l)
8630         [[ $nfiles = 13 ]] || error "$cmd: $nfiles != 13 files"
8631
8632         cmd="$LFS find --mirror-state=wp --type f $td"
8633         nfiles=$($cmd | wc -l)
8634         [[ $nfiles = 13 ]] || error "$cmd: $nfiles != 13 files"
8635
8636         cmd="$LFS find ! --mirror-state=sp --type f $td"
8637         nfiles=$($cmd | wc -l)
8638         [[ $nfiles = 30 ]] || error "$cmd: $nfiles != 30 files"
8639 }
8640 run_test 56ca "check lfs find --mirror-count|-N and --mirror-state"
8641
8642 test_56da() { # LU-14179
8643         local path=$DIR/$tdir
8644
8645         test_mkdir $path
8646         cd $path
8647
8648         local longdir=$(str_repeat 'a' 255)
8649
8650         for i in {1..15}; do
8651                 path=$path/$longdir
8652                 test_mkdir $longdir
8653                 cd $longdir
8654         done
8655
8656         local len=${#path}
8657         local lastdir=$(str_repeat 'a' $((4096 - 1 - $len - 1)))
8658
8659         test_mkdir $lastdir
8660         cd $lastdir
8661         # PATH_MAX-1
8662         (( ${#PWD} == 4095 )) || error "bad PWD length ${#PWD}, expect 4095"
8663
8664         # NAME_MAX
8665         touch $(str_repeat 'f' 255)
8666
8667         $LFS find $DIR/$tdir --type d |& grep "lfs find: error" &&
8668                 error "lfs find reported an error"
8669
8670         rm -rf $DIR/$tdir
8671 }
8672 run_test 56da "test lfs find with long paths"
8673
8674 test_56ea() { #LU-10378
8675         local path=$DIR/$tdir
8676         local pool=$TESTNAME
8677
8678         # Create ost pool
8679         pool_add $pool || error "pool_add $pool failed"
8680         pool_add_targets $pool 0 $((OSTCOUNT - 1)) 1 ||
8681                 error "adding targets to $pool failed"
8682
8683         # Set default pool on directory before creating file
8684         mkdir $path || error "mkdir $path failed"
8685         $LFS setstripe -p $pool $path ||
8686                 error "set OST pool on $pool failed"
8687         touch $path/$tfile || error "touch $path/$tfile failed"
8688
8689         # Compare basic file attributes from -printf and stat
8690         local attr_printf=$($LFS find $path/$tfile -printf "%A@ %T@ %C@ %U %G %n")
8691         local attr_stat=$(stat -c "%X %Y %Z %u %g %h" $path/$tfile)
8692
8693         [[ "${attr_printf}" == "${attr_stat}" ]] ||
8694                 error "Attrs from lfs find and stat don't match"
8695
8696         # Compare Lustre attributes from lfs find and lfs getstripe
8697         local lattr_printf=$($LFS find $path/$tfile -printf "%Lc %LS %Li %Lp")
8698         local str_cnt=$($LFS getstripe --stripe-count $path/$tfile)
8699         local str_size=$($LFS getstripe --stripe-size $path/$tfile)
8700         local str_idx=$($LFS getstripe --stripe-index $path/$tfile)
8701         local fpool=$($LFS getstripe --pool $path/$tfile)
8702         local lattr_getstr="${str_cnt} ${str_size} ${str_idx} ${fpool}"
8703
8704         [[ "${lattr_printf}" == "${lattr_getstr}" ]] ||
8705                 error "Attrs from lfs find and lfs getstripe don't match"
8706
8707         # Verify behavior for unknown escape/format sequences
8708         local esc_printf=$($LFS find $path/$tfile -printf '\\ %% \Q %Q')
8709
8710         [[ "${esc_printf}" == '\ % \Q %Q' ]] ||
8711                 error "Escape/format codes don't match"
8712 }
8713 run_test 56ea "test lfs find -printf option"
8714
8715 test_56eb() {
8716         local dir=$DIR/$tdir
8717         local subdir_1=$dir/subdir_1
8718
8719         test_mkdir -p $subdir_1
8720         ln -s subdir_1 $dir/link_1
8721
8722         $LFS getstripe $dir | grep "^$dir/link_1$" -A1 ||
8723                 error "symlink is not followed"
8724
8725         $LFS getstripe --no-follow $dir |
8726                 grep "^$dir/link_1 has no stripe info$" ||
8727                 error "symlink should not have stripe info"
8728
8729         touch $dir/testfile
8730         ln -s testfile $dir/file_link_2
8731
8732         $LFS getstripe $dir | grep "^$dir/file_link_2$" -A1 ||
8733                 error "symlink is not followed"
8734
8735         $LFS getstripe --no-follow $dir |
8736                 grep "^$dir/file_link_2 has no stripe info$" ||
8737                 error "symlink should not have stripe info"
8738 }
8739 run_test 56eb "check lfs getstripe on symlink"
8740
8741 test_56ec() {
8742         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
8743         local dir=$DIR/$tdir
8744         local srcfile=$dir/srcfile
8745         local srcyaml=$dir/srcyaml
8746         local destfile=$dir/destfile
8747
8748         test_mkdir -p $dir
8749
8750         $LFS setstripe -i 1 $srcfile
8751         $LFS getstripe --hex-idx --yaml $srcfile > $srcyaml
8752         # if the setstripe yaml parsing fails for any reason, the command can
8753         # randomly assign the correct OST index, leading to an erroneous
8754         # success. but the chance of false success is low enough that a
8755         # regression should still be quickly caught.
8756         $LFS setstripe --yaml=$srcyaml $destfile
8757
8758         local srcindex=$($LFS getstripe -i $srcfile)
8759         local destindex=$($LFS getstripe -i $destfile)
8760
8761         if [[ ! $srcindex -eq $destindex ]]; then
8762                 error "setstripe did not set OST index correctly"
8763         fi
8764 }
8765 run_test 56ec "check lfs getstripe,setstripe --hex --yaml"
8766
8767 test_56eda() {
8768         local dir=$DIR/$tdir
8769         local subdir=$dir/subdir
8770         local file1=$dir/$tfile
8771         local file2=$dir/$tfile\2
8772         local link=$dir/$tfile-link
8773         local nfiles
8774
8775         test_mkdir -p $dir
8776         $LFS setdirstripe -c1 $subdir
8777         touch $file1
8778         touch $file2
8779         ln $file2 $link
8780
8781         nfiles=$($LFS find --links 1 $dir | wc -l)
8782         (( $nfiles == 1 )) ||
8783                 error "lfs find --links expected 1 file, got $nfiles"
8784
8785         nfiles=$($LFS find --type f --links 2 $dir | wc -l)
8786         (( $nfiles == 2 )) ||
8787                 error "lfs find --links expected 2 files, got $nfiles"
8788
8789         nfiles=$($LFS find --type d --links 2 $dir | wc -l)
8790         (( $nfiles == 1 )) ||
8791                 error "lfs find --links expected 1 directory, got $nfiles"
8792 }
8793 run_test 56eda "check lfs find --links"
8794
8795 test_56edb() {
8796         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
8797
8798         local dir=$DIR/$tdir
8799         local stripedir=$dir/stripedir
8800         local nfiles
8801
8802         test_mkdir -p $dir
8803
8804         $LFS setdirstripe -c2 $stripedir
8805
8806         $LFS getdirstripe $stripedir
8807
8808         nfiles=$($LFS find --type d --links 2 $stripedir | wc -l)
8809         (( $nfiles == 1 )) ||
8810                 error "lfs find --links expected 1 directory, got $nfiles"
8811 }
8812 run_test 56edb "check lfs find --links for directory striped on multiple MDTs"
8813
8814 test_57a() {
8815         [ $PARALLEL == "yes" ] && skip "skip parallel run"
8816         # note test will not do anything if MDS is not local
8817         if [ "$mds1_FSTYPE" != ldiskfs ]; then
8818                 skip_env "ldiskfs only test"
8819         fi
8820         remote_mds_nodsh && skip "remote MDS with nodsh"
8821
8822         local MNTDEV="osd*.*MDT*.mntdev"
8823         DEV=$(do_facet $SINGLEMDS lctl get_param -n $MNTDEV)
8824         [ -z "$DEV" ] && error "can't access $MNTDEV"
8825         for DEV in $(do_facet $SINGLEMDS lctl get_param -n $MNTDEV); do
8826                 do_facet $SINGLEMDS $DUMPE2FS -h $DEV > $TMP/t57a.dump ||
8827                         error "can't access $DEV"
8828                 DEVISIZE=$(awk '/Inode size:/ { print $3 }' $TMP/t57a.dump)
8829                 [[ $DEVISIZE -gt 128 ]] || error "inode size $DEVISIZE"
8830                 rm $TMP/t57a.dump
8831         done
8832 }
8833 run_test 57a "verify MDS filesystem created with large inodes =="
8834
8835 test_57b() {
8836         [ $PARALLEL == "yes" ] && skip "skip parallel run"
8837         if [ "$mds1_FSTYPE" != ldiskfs ]; then
8838                 skip_env "ldiskfs only test"
8839         fi
8840         remote_mds_nodsh && skip "remote MDS with nodsh"
8841
8842         local dir=$DIR/$tdir
8843         local filecount=100
8844         local file1=$dir/f1
8845         local fileN=$dir/f$filecount
8846
8847         rm -rf $dir || error "removing $dir"
8848         test_mkdir -c1 $dir
8849         local mdtidx=$($LFS getstripe -m $dir)
8850         local mdtname=MDT$(printf %04x $mdtidx)
8851         local facet=mds$((mdtidx + 1))
8852
8853         echo "mcreating $filecount files"
8854         createmany -m $dir/f 1 $filecount || error "creating files in $dir"
8855
8856         # verify that files do not have EAs yet
8857         $LFS getstripe $file1 2>&1 | grep -q "no stripe" ||
8858                 error "$file1 has an EA"
8859         $LFS getstripe $fileN 2>&1 | grep -q "no stripe" ||
8860                 error "$fileN has an EA"
8861
8862         sync
8863         sleep 1
8864         df $dir  #make sure we get new statfs data
8865         local mdsfree=$(do_facet $facet \
8866                         lctl get_param -n osd*.*$mdtname.kbytesfree)
8867         local mdcfree=$(lctl get_param -n mdc.*$mdtname-mdc-*.kbytesfree)
8868         local file
8869
8870         echo "opening files to create objects/EAs"
8871         for file in $(seq -f $dir/f%g 1 $filecount); do
8872                 $OPENFILE -f O_RDWR $file > /dev/null 2>&1 ||
8873                         error "opening $file"
8874         done
8875
8876         # verify that files have EAs now
8877         $LFS getstripe $file1 | grep -q "obdidx" || error "$file1 missing EA"
8878         $LFS getstripe $fileN | grep -q "obdidx" || error "$fileN missing EA"
8879
8880         sleep 1  #make sure we get new statfs data
8881         df $dir
8882         local mdsfree2=$(do_facet $facet \
8883                          lctl get_param -n osd*.*$mdtname.kbytesfree)
8884         local mdcfree2=$(lctl get_param -n mdc.*$mdtname-mdc-*.kbytesfree)
8885
8886         if [[ $mdcfree2 -lt $((mdcfree - 16)) ]]; then
8887                 if [ "$mdsfree" != "$mdsfree2" ]; then
8888                         error "MDC before $mdcfree != after $mdcfree2"
8889                 else
8890                         echo "MDC before $mdcfree != after $mdcfree2"
8891                         echo "unable to confirm if MDS has large inodes"
8892                 fi
8893         fi
8894         rm -rf $dir
8895 }
8896 run_test 57b "default LOV EAs are stored inside large inodes ==="
8897
8898 test_58() {
8899         [ $PARALLEL == "yes" ] && skip "skip parallel run"
8900         [ -z "$(which wiretest 2>/dev/null)" ] &&
8901                         skip_env "could not find wiretest"
8902
8903         wiretest
8904 }
8905 run_test 58 "verify cross-platform wire constants =============="
8906
8907 test_59() {
8908         [ $PARALLEL == "yes" ] && skip "skip parallel run"
8909
8910         echo "touch 130 files"
8911         createmany -o $DIR/f59- 130
8912         echo "rm 130 files"
8913         unlinkmany $DIR/f59- 130
8914         sync
8915         # wait for commitment of removal
8916         wait_delete_completed
8917 }
8918 run_test 59 "verify cancellation of llog records async ========="
8919
8920 TEST60_HEAD="test_60 run $RANDOM"
8921 test_60a() {
8922         [ $PARALLEL == "yes" ] && skip "skip parallel run"
8923         remote_mgs_nodsh && skip "remote MGS with nodsh"
8924         do_facet mgs "! which run-llog.sh &> /dev/null" &&
8925                 do_facet mgs "! ls run-llog.sh &> /dev/null" &&
8926                         skip_env "missing subtest run-llog.sh"
8927
8928         log "$TEST60_HEAD - from kernel mode"
8929         do_facet mgs "$LCTL dk > /dev/null"
8930         do_facet mgs "bash run-llog.sh" || error "run-llog.sh failed"
8931         do_facet mgs $LCTL dk > $TMP/$tfile
8932
8933         # LU-6388: test llog_reader
8934         local llog_reader=$(do_facet mgs "which llog_reader 2> /dev/null")
8935         llog_reader=${llog_reader:-$LUSTRE/utils/llog_reader}
8936         [ -z $(do_facet mgs ls -d $llog_reader 2> /dev/null) ] &&
8937                         skip_env "missing llog_reader"
8938         local fstype=$(facet_fstype mgs)
8939         [ $fstype != ldiskfs -a $fstype != zfs ] &&
8940                 skip_env "Only for ldiskfs or zfs type mgs"
8941
8942         local mntpt=$(facet_mntpt mgs)
8943         local mgsdev=$(mgsdevname 1)
8944         local fid_list
8945         local fid
8946         local rec_list
8947         local rec
8948         local rec_type
8949         local obj_file
8950         local path
8951         local seq
8952         local oid
8953         local pass=true
8954
8955         #get fid and record list
8956         fid_list=($(awk '/9_sub.*record/ { print $NF }' $TMP/$tfile |
8957                 tail -n 4))
8958         rec_list=($(awk '/9_sub.*record/ { print $((NF-3)) }' $TMP/$tfile |
8959                 tail -n 4))
8960         #remount mgs as ldiskfs or zfs type
8961         stop mgs || error "stop mgs failed"
8962         mount_fstype mgs || error "remount mgs failed"
8963         for ((i = 0; i < ${#fid_list[@]}; i++)); do
8964                 fid=${fid_list[i]}
8965                 rec=${rec_list[i]}
8966                 seq=$(echo $fid | awk -F ':' '{ print $1 }' | sed -e "s/^0x//g")
8967                 oid=$(echo $fid | awk -F ':' '{ print $2 }' | sed -e "s/^0x//g")
8968                 oid=$((16#$oid))
8969
8970                 case $fstype in
8971                         ldiskfs )
8972                                 obj_file=$mntpt/O/$seq/d$((oid%32))/$oid ;;
8973                         zfs )
8974                                 obj_file=$mntpt/oi.$(($((16#$seq))&127))/$fid ;;
8975                 esac
8976                 echo "obj_file is $obj_file"
8977                 do_facet mgs $llog_reader $obj_file
8978
8979                 rec_type=$(do_facet mgs $llog_reader $obj_file | grep "type=" |
8980                         awk '{ print $3 }' | sed -e "s/^type=//g")
8981                 if [ $rec_type != $rec ]; then
8982                         echo "FAILED test_60a wrong record type $rec_type," \
8983                               "should be $rec"
8984                         pass=false
8985                         break
8986                 fi
8987
8988                 #check obj path if record type is LLOG_LOGID_MAGIC
8989                 if [ "$rec" == "1064553b" ]; then
8990                         path=$(do_facet mgs $llog_reader $obj_file |
8991                                 grep "path=" | awk '{ print $NF }' |
8992                                 sed -e "s/^path=//g")
8993                         if [ $obj_file != $mntpt/$path ]; then
8994                                 echo "FAILED test_60a wrong obj path" \
8995                                       "$montpt/$path, should be $obj_file"
8996                                 pass=false
8997                                 break
8998                         fi
8999                 fi
9000         done
9001         rm -f $TMP/$tfile
9002         #restart mgs before "error", otherwise it will block the next test
9003         stop mgs || error "stop mgs failed"
9004         start mgs $(mgsdevname) $MGS_MOUNT_OPTS || error "start mgs failed"
9005         $pass || error "test failed, see FAILED test_60a messages for specifics"
9006 }
9007 run_test 60a "llog_test run from kernel module and test llog_reader"
9008
9009 test_60b() { # bug 6411
9010         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9011
9012         dmesg > $DIR/$tfile
9013         LLOG_COUNT=$(do_facet mgs dmesg |
9014                      awk "/$TEST60_HEAD/ { marker = 1; from_marker = 0; }
9015                           /llog_[a-z]*.c:[0-9]/ {
9016                                 if (marker)
9017                                         from_marker++
9018                                 from_begin++
9019                           }
9020                           END {
9021                                 if (marker)
9022                                         print from_marker
9023                                 else
9024                                         print from_begin
9025                           }")
9026
9027         [[ $LLOG_COUNT -gt 120 ]] &&
9028                 error "CDEBUG_LIMIT not limiting messages ($LLOG_COUNT)" || true
9029 }
9030 run_test 60b "limit repeated messages from CERROR/CWARN"
9031
9032 test_60c() {
9033         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9034
9035         echo "create 5000 files"
9036         createmany -o $DIR/f60c- 5000
9037 #define OBD_FAIL_MDS_LLOG_CREATE_FAILED  0x137
9038         lctl set_param fail_loc=0x80000137
9039         unlinkmany $DIR/f60c- 5000
9040         lctl set_param fail_loc=0
9041 }
9042 run_test 60c "unlink file when mds full"
9043
9044 test_60d() {
9045         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9046
9047         SAVEPRINTK=$(lctl get_param -n printk)
9048         # verify "lctl mark" is even working"
9049         MESSAGE="test message ID $RANDOM $$"
9050         $LCTL mark "$MESSAGE" || error "$LCTL mark failed"
9051         dmesg | grep -q "$MESSAGE" || error "didn't find debug marker in log"
9052
9053         lctl set_param printk=0 || error "set lnet.printk failed"
9054         lctl get_param -n printk | grep emerg || error "lnet.printk dropped emerg"
9055         MESSAGE="new test message ID $RANDOM $$"
9056         # Assume here that libcfs_debug_mark_buffer() uses D_WARNING
9057         $LCTL mark "$MESSAGE" || error "$LCTL mark failed"
9058         dmesg | grep -q "$MESSAGE" && error "D_WARNING wasn't masked" || true
9059
9060         lctl set_param -n printk="$SAVEPRINTK"
9061 }
9062 run_test 60d "test printk console message masking"
9063
9064 test_60e() {
9065         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9066         remote_mds_nodsh && skip "remote MDS with nodsh"
9067
9068         touch $DIR/$tfile
9069 #define OBD_FAIL_MDS_LLOG_CREATE_FAILED2  0x15b
9070         do_facet mds1 lctl set_param fail_loc=0x15b
9071         rm $DIR/$tfile
9072 }
9073 run_test 60e "no space while new llog is being created"
9074
9075 test_60f() {
9076         local old_path=$($LCTL get_param -n debug_path)
9077
9078         stack_trap "$LCTL set_param debug_path=$old_path"
9079         stack_trap "rm -f $TMP/$tfile*"
9080         rm -f $TMP/$tfile* 2> /dev/null
9081         #define OBD_FAIL_PTLRPC_DUMP_LOG         0x50e
9082         $LCTL set_param debug_path=$TMP/$tfile fail_loc=0x8000050e
9083         test_mkdir $DIR/$tdir
9084         # retry in case the open is cached and not released
9085         for (( i = 0; i < 100 && $(ls $TMP/$tfile* | wc -l) == 0; i++ )); do
9086                 echo $i > $DIR/$tdir/$tfile.$i && cat $DIR/$tdir/$tfile.$i
9087                 sleep 0.1
9088         done
9089         ls $TMP/$tfile*
9090         (( $(ls $TMP/$tfile* | wc -l) > 0 )) || error "$TMP/$tfile not dumped"
9091 }
9092 run_test 60f "change debug_path works"
9093
9094 test_60g() {
9095         local pid
9096         local i
9097
9098         test_mkdir -c $MDSCOUNT $DIR/$tdir
9099
9100         (
9101                 local index=0
9102                 while true; do
9103                         $LFS setdirstripe -i $(($index % $MDSCOUNT)) \
9104                                 -c $MDSCOUNT $DIR/$tdir/subdir$index \
9105                                 2>/dev/null
9106                         mkdir $DIR/$tdir/subdir$index 2>/dev/null
9107                         rmdir $DIR/$tdir/subdir$index 2>/dev/null
9108                         index=$((index + 1))
9109                 done
9110         ) &
9111
9112         pid=$!
9113
9114         for i in {0..100}; do
9115                 # define OBD_FAIL_OSD_TXN_START    0x19a
9116                 local index=$((i % MDSCOUNT + 1))
9117
9118                 do_facet mds$index $LCTL set_param fail_loc=0x8000019a \
9119                         > /dev/null
9120                 sleep 0.01
9121         done
9122
9123         kill -9 $pid
9124
9125         for i in $(seq $MDSCOUNT); do
9126                 do_facet mds$i $LCTL set_param fail_loc=0 > /dev/null
9127         done
9128
9129         mkdir $DIR/$tdir/new || error "mkdir failed"
9130         rmdir $DIR/$tdir/new || error "rmdir failed"
9131
9132         do_facet mds1 $LCTL lfsck_start -M $(facet_svc mds1) -A -C \
9133                 -t namespace
9134         for i in $(seq $MDSCOUNT); do
9135                 wait_update_facet mds$i "$LCTL get_param -n \
9136                         mdd.$(facet_svc mds$i).lfsck_namespace |
9137                         awk '/^status/ { print \\\$2 }'" "completed"
9138         done
9139
9140         ls -R $DIR/$tdir
9141         rm -rf $DIR/$tdir || error "rmdir failed"
9142 }
9143 run_test 60g "transaction abort won't cause MDT hung"
9144
9145 test_60h() {
9146         [ $MDS1_VERSION -le $(version_code 2.12.52) ] &&
9147                 skip "Need MDS version at least 2.12.52"
9148         [ $MDSCOUNT -lt 2 ] && skip "Need at least 2 MDTs"
9149
9150         local f
9151
9152         #define OBD_FAIL_MDS_STRIPE_CREATE       0x188
9153         #define OBD_FAIL_MDS_STRIPE_FID          0x189
9154         for fail_loc in 0x80000188 0x80000189; do
9155                 do_facet mds1 "$LCTL set_param fail_loc=$fail_loc"
9156                 $LFS mkdir -c $MDSCOUNT -i 0 $DIR/$tdir-$fail_loc ||
9157                         error "mkdir $dir-$fail_loc failed"
9158                 for i in {0..10}; do
9159                         # create may fail on missing stripe
9160                         echo $i > $DIR/$tdir-$fail_loc/$i
9161                 done
9162                 $LFS getdirstripe $DIR/$tdir-$fail_loc ||
9163                         error "getdirstripe $tdir-$fail_loc failed"
9164                 $LFS migrate -m 1 $DIR/$tdir-$fail_loc ||
9165                         error "migrate $tdir-$fail_loc failed"
9166                 $LFS getdirstripe $DIR/$tdir-$fail_loc ||
9167                         error "getdirstripe $tdir-$fail_loc failed"
9168                 pushd $DIR/$tdir-$fail_loc
9169                 for f in *; do
9170                         echo $f | cmp $f - || error "$f data mismatch"
9171                 done
9172                 popd
9173                 rm -rf $DIR/$tdir-$fail_loc
9174         done
9175 }
9176 run_test 60h "striped directory with missing stripes can be accessed"
9177
9178 function t60i_load() {
9179         mkdir $DIR/$tdir
9180         #define OBD_FAIL_LLOG_PAUSE_AFTER_PAD               0x131c
9181         $LCTL set_param fail_loc=0x131c fail_val=1
9182         for ((i=0; i<5000; i++)); do
9183                 touch $DIR/$tdir/f$i
9184         done
9185 }
9186
9187 test_60i() {
9188         changelog_register || error "changelog_register failed"
9189         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
9190         changelog_users $SINGLEMDS | grep -q $cl_user ||
9191                 error "User $cl_user not found in changelog_users"
9192         changelog_chmask "ALL"
9193         t60i_load &
9194         local PID=$!
9195         for((i=0; i<100; i++)); do
9196                 changelog_dump >/dev/null ||
9197                         error "can't read changelog"
9198         done
9199         kill $PID
9200         wait $PID
9201         changelog_deregister || error "changelog_deregister failed"
9202         $LCTL set_param fail_loc=0
9203 }
9204 run_test 60i "llog: new record vs reader race"
9205
9206 test_60j() {
9207         (( $MDS1_VERSION >= $(version_code 2.15.50) )) ||
9208                 skip "need MDS version at least 2.15.50"
9209         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
9210         remote_mds_nodsh && skip "remote MDS with nodsh"
9211         [[ "$mds1_FSTYPE" == "ldiskfs" ]] || skip "ldiskfs only test"
9212
9213         changelog_users $SINGLEMDS | grep "^cl" &&
9214                 skip "active changelog user"
9215
9216         local llog_reader=$(do_facet $SINGLEMDS "which llog_reader 2> /dev/null")
9217
9218         [[ -z $(do_facet $SINGLEMDS ls -d $llog_reader 2> /dev/null) ]] &&
9219                 skip_env "missing llog_reader"
9220
9221         mkdir_on_mdt0 $DIR/$tdir
9222
9223         local f=$DIR/$tdir/$tfile
9224         local mdt_dev
9225         local tmpfile
9226         local plain
9227
9228         changelog_register || error "cannot register changelog user"
9229
9230         # set changelog_mask to ALL
9231         changelog_chmask "ALL"
9232         changelog_clear
9233
9234         createmany -o ${f}- 100 || error "createmany failed as $RUNAS_ID"
9235         unlinkmany ${f}- 100 || error "unlinkmany failed"
9236
9237         tmpfile="$(mktemp --tmpdir -u $tfile.XXXXXX)"
9238         mdt_dev=$(facet_device $SINGLEMDS)
9239
9240         do_facet $SINGLEMDS sync
9241         plain=$(do_facet $SINGLEMDS "$DEBUGFS -c -R 'dump changelog_catalog \
9242                 $tmpfile' $mdt_dev; $llog_reader $tmpfile" |
9243                 awk '{match($0,"path=([^ ]+)",a)}END{print a[1]}')
9244
9245         stack_trap "do_facet $SINGLEMDS rm -f $tmpfile"
9246
9247         # if $tmpfile is not on EXT3 filesystem for some reason
9248         [[ ${plain:0:1} == 'O' ]] ||
9249                 skip "path $plain is not in 'O/1/d<n>/<n>' format"
9250
9251         size=$(do_facet $SINGLEMDS "$DEBUGFS -c -R 'dump $plain $tmpfile' \
9252                 $mdt_dev; stat -c %s $tmpfile")
9253         echo "Truncate llog from $size to $((size - size % 8192))"
9254         size=$((size - size % 8192))
9255         do_facet $SINGLEMDS $TRUNCATE $tmpfile $size
9256         errs=$(do_facet $SINGLEMDS "$llog_reader $tmpfile" |
9257                 grep -c 'in bitmap only')
9258         (( $errs > 0 )) || error "llog_reader didn't find lost records"
9259
9260         size=$((size - 9000))
9261         echo "Corrupt llog in the middle at $size"
9262         do_facet $SINGLEMDS dd if=/dev/urandom of=$tmpfile bs=1 seek=$size \
9263                 count=333 conv=notrunc
9264         errs=$(do_facet $SINGLEMDS "$llog_reader $tmpfile" |
9265                 grep -c 'next chunk')
9266         (( $errs > 0 )) || error "llog_reader didn't skip bad chunk"
9267 }
9268 run_test 60j "llog_reader reports corruptions"
9269
9270 test_61a() {
9271         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9272
9273         f="$DIR/f61"
9274         dd if=/dev/zero of=$f bs=$PAGE_SIZE count=1 || error "dd $f failed"
9275         cancel_lru_locks osc
9276         $MULTIOP $f OSMWUc || error "$MULTIOP $f failed"
9277         sync
9278 }
9279 run_test 61a "mmap() writes don't make sync hang ================"
9280
9281 test_61b() {
9282         mmap_mknod_test $DIR/$tfile || error "mmap_mknod_test failed"
9283 }
9284 run_test 61b "mmap() of unstriped file is successful"
9285
9286 # bug 2330 - insufficient obd_match error checking causes LBUG
9287 test_62() {
9288         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9289
9290         f="$DIR/f62"
9291         echo foo > $f
9292         cancel_lru_locks osc
9293         lctl set_param fail_loc=0x405
9294         cat $f && error "cat succeeded, expect -EIO"
9295         lctl set_param fail_loc=0
9296 }
9297 # This test is now irrelevant (as of bug 10718 inclusion), we no longer
9298 # match every page all of the time.
9299 #run_test 62 "verify obd_match failure doesn't LBUG (should -EIO)"
9300
9301 # bug 2319 - oig_wait() interrupted causes crash because of invalid waitq.
9302 # Though this test is irrelevant anymore, it helped to reveal some
9303 # other grant bugs (LU-4482), let's keep it.
9304 test_63a() {   # was test_63
9305         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9306
9307         MAX_DIRTY_MB=$(lctl get_param -n osc.*.max_dirty_mb | head -n 1)
9308
9309         for i in `seq 10` ; do
9310                 dd if=/dev/zero of=$DIR/f63 bs=8k &
9311                 sleep 5
9312                 kill $!
9313                 sleep 1
9314         done
9315
9316         rm -f $DIR/f63 || true
9317 }
9318 run_test 63a "Verify oig_wait interruption does not crash ======="
9319
9320 # bug 2248 - async write errors didn't return to application on sync
9321 # bug 3677 - async write errors left page locked
9322 test_63b() {
9323         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9324
9325         debugsave
9326         lctl set_param debug=-1
9327
9328         # ensure we have a grant to do async writes
9329         dd if=/dev/zero of=$DIR/$tfile bs=4k count=1
9330         rm $DIR/$tfile
9331
9332         sync    # sync lest earlier test intercept the fail_loc
9333
9334         #define OBD_FAIL_OSC_BRW_PREP_REQ        0x406
9335         lctl set_param fail_loc=0x80000406
9336         $MULTIOP $DIR/$tfile Owy && \
9337                 error "sync didn't return ENOMEM"
9338         sync; sleep 2; sync     # do a real sync this time to flush page
9339         lctl get_param -n llite.*.dump_page_cache | grep locked && \
9340                 error "locked page left in cache after async error" || true
9341         debugrestore
9342 }
9343 run_test 63b "async write errors should be returned to fsync ==="
9344
9345 test_64a () {
9346         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9347
9348         lfs df $DIR
9349         lctl get_param osc.*[oO][sS][cC][_-]*.cur* | grep "=[1-9]"
9350 }
9351 run_test 64a "verify filter grant calculations (in kernel) ====="
9352
9353 test_64b () {
9354         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9355
9356         bash oos.sh $MOUNT || error "oos.sh failed: $?"
9357 }
9358 run_test 64b "check out-of-space detection on client"
9359
9360 test_64c() {
9361         $LCTL set_param osc.*OST0000-osc-[^mM]*.cur_grant_bytes=0
9362 }
9363 run_test 64c "verify grant shrink"
9364
9365 import_param() {
9366         local tgt=$1
9367         local param=$2
9368
9369         $LCTL get_param osc.$tgt.import | awk "/$param/ { print \$2 }"
9370 }
9371
9372 # this does exactly what osc_request.c:osc_announce_cached() does in
9373 # order to calculate max amount of grants to ask from server
9374 want_grant() {
9375         local tgt=$1
9376
9377         local nrpages=$($LCTL get_param -n osc.$tgt.max_pages_per_rpc)
9378         local rpc_in_flight=$($LCTL get_param -n osc.$tgt.max_rpcs_in_flight)
9379
9380         ((rpc_in_flight++));
9381         nrpages=$((nrpages * rpc_in_flight))
9382
9383         local dirty_max_pages=$($LCTL get_param -n osc.$tgt.max_dirty_mb)
9384
9385         dirty_max_pages=$((dirty_max_pages * 1024 * 1024 / PAGE_SIZE))
9386
9387         [[ $dirty_max_pages -gt $nrpages ]] && nrpages=$dirty_max_pages
9388         local undirty=$((nrpages * PAGE_SIZE))
9389
9390         local max_extent_pages
9391         max_extent_pages=$(import_param $tgt grant_max_extent_size)
9392         max_extent_pages=$((max_extent_pages / PAGE_SIZE))
9393         local nrextents=$(((nrpages + max_extent_pages - 1) / max_extent_pages))
9394         local grant_extent_tax
9395         grant_extent_tax=$(import_param $tgt grant_extent_tax)
9396
9397         undirty=$((undirty + nrextents * grant_extent_tax))
9398
9399         echo $undirty
9400 }
9401
9402 # this is size of unit for grant allocation. It should be equal to
9403 # what tgt_grant.c:tgt_grant_chunk() calculates
9404 grant_chunk() {
9405         local tgt=$1
9406         local max_brw_size
9407         local grant_extent_tax
9408
9409         max_brw_size=$(import_param $tgt max_brw_size)
9410
9411         grant_extent_tax=$(import_param $tgt grant_extent_tax)
9412
9413         echo $(((max_brw_size + grant_extent_tax) * 2))
9414 }
9415
9416 test_64d() {
9417         [ $OST1_VERSION -ge $(version_code 2.10.56) ] ||
9418                 skip "OST < 2.10.55 doesn't limit grants enough"
9419
9420         local tgt=$($LCTL dl | awk '/OST0000-osc-[^mM]/ { print $4 }')
9421
9422         [[ "$($LCTL get_param osc.${tgt}.import)" =~ "grant_param" ]] ||
9423                 skip "no grant_param connect flag"
9424
9425         local olddebug="$($LCTL get_param -n debug 2> /dev/null)"
9426
9427         $LCTL set_param -n -n debug="$OLDDEBUG" || true
9428         stack_trap "$LCTL set_param -n debug='$olddebug'" EXIT
9429
9430
9431         local max_cur_granted=$(($(want_grant $tgt) + $(grant_chunk $tgt)))
9432         stack_trap "rm -f $DIR/$tfile && wait_delete_completed" EXIT
9433
9434         $LFS setstripe $DIR/$tfile -i 0 -c 1
9435         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1000 &
9436         ddpid=$!
9437
9438         while kill -0 $ddpid; do
9439                 local cur_grant=$($LCTL get_param -n osc.$tgt.cur_grant_bytes)
9440
9441                 if [[ $cur_grant -gt $max_cur_granted ]]; then
9442                         kill $ddpid
9443                         error "cur_grant $cur_grant > $max_cur_granted"
9444                 fi
9445
9446                 sleep 1
9447         done
9448 }
9449 run_test 64d "check grant limit exceed"
9450
9451 check_grants() {
9452         local tgt=$1
9453         local expected=$2
9454         local msg=$3
9455         local cur_grants=$($LCTL get_param -n osc.$tgt.cur_grant_bytes)
9456
9457         ((cur_grants == expected)) ||
9458                 error "$msg: grants mismatch: $cur_grants, expected $expected"
9459 }
9460
9461 round_up_p2() {
9462         echo $((($1 + $2 - 1) & ~($2 - 1)))
9463 }
9464
9465 test_64e() {
9466         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9467         [ $OST1_VERSION -ge $(version_code 2.11.56) ] ||
9468                 skip "Need OSS version at least 2.11.56"
9469
9470         local olddebug="$($LCTL get_param -n debug 2> /dev/null)"
9471         stack_trap "$LCTL set_param -n debug='$olddebug'" EXIT
9472         $LCTL set_param debug=+cache
9473
9474         # Remount client to reset grant
9475         remount_client $MOUNT || error "failed to remount client"
9476         local osc_tgt="$FSNAME-OST0000-osc-$($LFS getname -i $DIR)"
9477
9478         local init_grants=$(import_param $osc_tgt initial_grant)
9479
9480         check_grants $osc_tgt $init_grants "init grants"
9481
9482         local extent_tax=$(import_param $osc_tgt grant_extent_tax)
9483         local max_brw_size=$(import_param $osc_tgt max_brw_size)
9484         local gbs=$(import_param $osc_tgt grant_block_size)
9485
9486         # write random number of bytes from max_brw_size / 4 to max_brw_size
9487         local write_bytes=$(shuf -i $((max_brw_size / 4))-$max_brw_size -n 1)
9488         # align for direct io
9489         write_bytes=$(round_up_p2 $write_bytes PAGE_SIZE)
9490         # round to grant consumption unit
9491         local wb_round_up=$(round_up_p2 $write_bytes gbs)
9492
9493         local grants=$((wb_round_up + extent_tax))
9494
9495         $LFS setstripe -c 1 -i 0 $DIR/$tfile  || error "lfs setstripe failed"
9496         stack_trap "rm -f $DIR/$tfile"
9497
9498         # define OBD_FAIL_TGT_NO_GRANT 0x725
9499         # make the server not grant more back
9500         do_facet ost1 $LCTL set_param fail_loc=0x725
9501         dd if=/dev/zero of=$DIR/$tfile bs=$write_bytes count=1 oflag=direct
9502
9503         do_facet ost1 $LCTL set_param fail_loc=0
9504
9505         check_grants $osc_tgt $((init_grants - grants)) "dio w/o grant alloc"
9506
9507         rm -f $DIR/$tfile || error "rm failed"
9508
9509         # Remount client to reset grant
9510         remount_client $MOUNT || error "failed to remount client"
9511         osc_tgt="$FSNAME-OST0000-osc-$($LFS getname -i $DIR)"
9512
9513         $LFS setstripe -c 1 -i 0 $DIR/$tfile || error "lfs setstripe failed"
9514
9515         # define OBD_FAIL_TGT_NO_GRANT 0x725
9516         # make the server not grant more back
9517         do_facet ost1 $LCTL set_param fail_loc=0x725
9518         $MULTIOP $DIR/$tfile "oO_WRONLY:w${write_bytes}yc"
9519         do_facet ost1 $LCTL set_param fail_loc=0
9520
9521         check_grants $osc_tgt $((init_grants - grants)) "buf io w/o grant alloc"
9522 }
9523 run_test 64e "check grant consumption (no grant allocation)"
9524
9525 test_64f() {
9526         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9527
9528         local olddebug="$($LCTL get_param -n debug 2> /dev/null)"
9529         stack_trap "$LCTL set_param -n debug='$olddebug'" EXIT
9530         $LCTL set_param debug=+cache
9531
9532         # Remount client to reset grant
9533         remount_client $MOUNT || error "failed to remount client"
9534         local osc_tgt="$FSNAME-OST0000-osc-$($LFS getname -i $DIR)"
9535
9536         local init_grants=$(import_param $osc_tgt initial_grant)
9537         local extent_tax=$(import_param $osc_tgt grant_extent_tax)
9538         local max_brw_size=$(import_param $osc_tgt max_brw_size)
9539         local gbs=$(import_param $osc_tgt grant_block_size)
9540         local chunk=$(grant_chunk $osc_tgt)
9541
9542         # write random number of bytes from max_brw_size / 4 to max_brw_size
9543         local write_bytes=$(shuf -i $((max_brw_size / 4))-$max_brw_size -n 1)
9544         # align for direct io
9545         write_bytes=$(round_up_p2 $write_bytes PAGE_SIZE)
9546         # round to grant consumption unit
9547         local wb_round_up=$(round_up_p2 $write_bytes gbs)
9548
9549         local grants=$((wb_round_up + extent_tax))
9550
9551         $LFS setstripe -c 1 -i 0 $DIR/$tfile || error "lfs setstripe failed"
9552         dd if=/dev/zero of=$DIR/$tfile bs=$write_bytes count=1 oflag=direct ||
9553                 error "error writing to $DIR/$tfile"
9554
9555         check_grants $osc_tgt $((init_grants - grants + chunk)) \
9556                 "direct io with grant allocation"
9557
9558         rm -f $DIR/$tfile || error "rm failed"
9559
9560         # Remount client to reset grant
9561         remount_client $MOUNT || error "failed to remount client"
9562         osc_tgt="$FSNAME-OST0000-osc-$($LFS getname -i $DIR)"
9563
9564         $LFS setstripe -c 1 -i 0 $DIR/$tfile || error "lfs setstripe failed"
9565
9566         local cmd="oO_WRONLY:w${write_bytes}_yc"
9567
9568         $MULTIOP $DIR/$tfile $cmd &
9569         MULTIPID=$!
9570         sleep 1
9571
9572         check_grants $osc_tgt $((init_grants - grants)) \
9573                 "buffered io, not write rpc"
9574
9575         kill -USR1 $MULTIPID
9576         wait
9577
9578         check_grants $osc_tgt $((init_grants - grants + chunk)) \
9579                 "buffered io, one RPC"
9580 }
9581 run_test 64f "check grant consumption (with grant allocation)"
9582
9583 test_64g() {
9584         (( $MDS1_VERSION >= $(version_code 2.14.56) )) ||
9585                 skip "Need MDS version at least 2.14.56"
9586
9587         local mdts=$(comma_list $(mdts_nodes))
9588
9589         local old=$($LCTL get_param mdc.$FSNAME-*.grant_shrink_interval |
9590                         tr '\n' ' ')
9591         stack_trap "$LCTL set_param $old"
9592
9593         # generate dirty pages and increase dirty granted on MDT
9594         stack_trap "rm -f $DIR/$tfile-*"
9595         for (( i = 0; i < 10; i++)); do
9596                 $LFS setstripe -E 1M -L mdt $DIR/$tfile-$i ||
9597                         error "can't set stripe"
9598                 dd if=/dev/zero of=$DIR/$tfile-$i bs=128k count=1 ||
9599                         error "can't dd"
9600                 $LFS getstripe $DIR/$tfile-$i | grep -q pattern.*mdt || {
9601                         $LFS getstripe $DIR/$tfile-$i
9602                         error "not DoM file"
9603                 }
9604         done
9605
9606         # flush dirty pages
9607         sync
9608
9609         # wait until grant shrink reset grant dirty on MDTs
9610         for ((i = 0; i < 120; i++)); do
9611                 grant_dirty=$(do_nodes $mdts $LCTL get_param -n  mdt.*.tot_dirty |
9612                         awk '{sum=sum+$1} END {print sum}')
9613                 vm_dirty=$(awk '/Dirty:/{print $2}' /proc/meminfo)
9614                 echo "$grant_dirty grants, $vm_dirty pages"
9615                 (( grant_dirty + vm_dirty == 0 )) && break
9616                 (( i == 3 )) && sync &&
9617                         $LCTL set_param mdc.$FSNAME-*.grant_shrink_interval=5
9618                 sleep 1
9619         done
9620
9621         grant_dirty=$(do_nodes $mdts $LCTL get_param -n  mdt.*.tot_dirty |
9622                 awk '{sum=sum+$1} END {print sum}')
9623         (( grant_dirty == 0 )) || error "$grant_dirty on MDT"
9624 }
9625 run_test 64g "grant shrink on MDT"
9626
9627 test_64h() {
9628         (( $OST1_VERSION >= $(version_code 2.14.56) )) ||
9629                 skip "need OST at least 2.14.56 to avoid grant shrink on read"
9630
9631         local instance=$($LFS getname -i $DIR)
9632         local osc_tgt="$FSNAME-OST0000-osc-$instance"
9633         local num_exps=$(do_facet ost1 \
9634             $LCTL get_param -n obdfilter.*OST0000*.num_exports)
9635         local max_brw_size=$(import_param $osc_tgt max_brw_size)
9636         local avail=$($LCTL get_param -n osc.*OST0000-osc-$instance.kbytesavail)
9637         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
9638
9639         # 10MiB is for file to be written, max_brw_size * 16 *
9640         # num_exps is space reserve so that tgt_grant_shrink() decided
9641         # to not shrink
9642         local expect=$((max_brw_size * 16 * num_exps + 10 * 1048576))
9643         (( avail * 1024 < expect )) &&
9644                 skip "need $expect bytes on ost1, have $(( avail * 1024 )) only"
9645
9646         save_lustre_params client "osc.*OST0000*.grant_shrink" > $p
9647         save_lustre_params client "osc.*OST0000*.grant_shrink_interval" >> $p
9648         stack_trap "restore_lustre_params < $p; rm -f $save" EXIT
9649         $LCTL set_param osc.*OST0000*.grant_shrink=1
9650         $LCTL set_param osc.*OST0000*.grant_shrink_interval=10
9651
9652         $LFS setstripe -c 1 -i 0 $DIR/$tfile
9653         stack_trap "rm -f $DIR/$tfile"
9654         dd if=/dev/zero of=$DIR/$tfile bs=1M count=10 oflag=sync
9655
9656         # drop cache so that coming read would do rpc
9657         cancel_lru_locks osc
9658
9659         # shrink interval is set to 10, pause for 7 seconds so that
9660         # grant thread did not wake up yet but coming read entered
9661         # shrink mode for rpc (osc_should_shrink_grant())
9662         sleep 7
9663
9664         declare -a cur_grant_bytes
9665         declare -a tot_granted
9666         cur_grant_bytes[0]=$($LCTL get_param -n osc.*OST0000*.cur_grant_bytes)
9667         tot_granted[0]=$(do_facet ost1 \
9668             $LCTL get_param -n obdfilter.*OST0000*.tot_granted)
9669
9670         dd if=$DIR/$tfile bs=4K count=1 of=/dev/null
9671
9672         cur_grant_bytes[1]=$($LCTL get_param -n osc.*OST0000*.cur_grant_bytes)
9673         tot_granted[1]=$(do_facet ost1 \
9674             $LCTL get_param -n obdfilter.*OST0000*.tot_granted)
9675
9676         # grant change should be equal on both sides
9677         (( cur_grant_bytes[0] - cur_grant_bytes[1] ==
9678                 tot_granted[0] - tot_granted[1])) ||
9679                 error "grant change mismatch, "                                \
9680                         "server: ${tot_granted[0]} to ${tot_granted[1]}, "     \
9681                         "client: ${cur_grant_bytes[0]} to ${cur_grant_bytes[1]}"
9682 }
9683 run_test 64h "grant shrink on read"
9684
9685 test_64i() {
9686         (( $OST1_VERSION >= $(version_code 2.14.56) )) ||
9687                 skip "need OST at least 2.14.56 to avoid grant shrink on replay"
9688
9689         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9690         remote_ost_nodsh && skip "remote OSTs with nodsh"
9691
9692         $LFS setstripe -c 1 -i 0 $DIR/$tfile
9693         stack_trap "rm -f $DIR/$tfile"
9694
9695         dd if=/dev/zero of=$DIR/$tfile bs=1M count=64
9696
9697         # lustre-ffff9fc75e850800 /mnt/lustre -> ffff9fc75e850800
9698         local instance=$($LFS getname -i $DIR)
9699
9700         local osc_tgt="$FSNAME-OST0000-osc-$instance"
9701         local cgb=$($LCTL get_param -n osc.$osc_tgt.cur_grant_bytes)
9702
9703         # shrink grants and simulate rpc loss
9704         #define OBD_FAIL_PTLRPC_DROP_REQ_OPC     0x513
9705         do_facet ost1 "$LCTL set_param fail_loc=0x80000513 fail_val=17"
9706         $LCTL set_param osc.$osc_tgt.cur_grant_bytes=$((cgb/2))B
9707
9708         fail ost1
9709
9710         dd if=/dev/zero of=$DIR/$tfile oflag=append bs=1M count=8 conv=notrunc
9711
9712         local testid=$(echo $TESTNAME | tr '_' ' ')
9713
9714         do_facet ost1 dmesg | tac | sed "/$testid/,$ d" |
9715                 grep "GRANT, real grant" &&
9716                 error "client has more grants then it owns" || true
9717 }
9718 run_test 64i "shrink on reconnect"
9719
9720 # bug 1414 - set/get directories' stripe info
9721 test_65a() {
9722         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9723
9724         test_mkdir $DIR/$tdir
9725         touch $DIR/$tdir/f1
9726         $LVERIFY $DIR/$tdir $DIR/$tdir/f1 || error "lverify failed"
9727 }
9728 run_test 65a "directory with no stripe info"
9729
9730 test_65b() {
9731         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9732
9733         test_mkdir $DIR/$tdir
9734         local STRIPESIZE=$($LFS getstripe -S $DIR/$tdir)
9735
9736         $LFS setstripe -S $((STRIPESIZE * 2)) -i 0 -c 1 $DIR/$tdir ||
9737                                                 error "setstripe"
9738         touch $DIR/$tdir/f2
9739         $LVERIFY $DIR/$tdir $DIR/$tdir/f2 || error "lverify failed"
9740 }
9741 run_test 65b "directory setstripe -S stripe_size*2 -i 0 -c 1"
9742
9743 test_65c() {
9744         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9745         [ $OSTCOUNT -lt 2 ] && skip_env "need at least 2 OSTs"
9746
9747         test_mkdir $DIR/$tdir
9748         local stripesize=$($LFS getstripe -S $DIR/$tdir)
9749
9750         $LFS setstripe -S $((stripesize * 4)) -i 1 \
9751                 -c $((OSTCOUNT - 1)) $DIR/$tdir || error "setstripe"
9752         touch $DIR/$tdir/f3
9753         $LVERIFY $DIR/$tdir $DIR/$tdir/f3 || error "lverify failed"
9754 }
9755 run_test 65c "directory setstripe -S stripe_size*4 -i 1 -c $((OSTCOUNT-1))"
9756
9757 test_65d() {
9758         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9759
9760         test_mkdir $DIR/$tdir
9761         local STRIPECOUNT=$($LFS getstripe -c $DIR/$tdir)
9762         local STRIPESIZE=$($LFS getstripe -S $DIR/$tdir)
9763
9764         if [[ $STRIPECOUNT -le 0 ]]; then
9765                 sc=1
9766         elif [[ $STRIPECOUNT -gt $LOV_MAX_STRIPE_COUNT ]]; then
9767                 [[ $OSTCOUNT -gt $LOV_MAX_STRIPE_COUNT ]] &&
9768                         sc=$LOV_MAX_STRIPE_COUNT || sc=$(($OSTCOUNT - 1))
9769         else
9770                 sc=$(($STRIPECOUNT - 1))
9771         fi
9772         $LFS setstripe -S $STRIPESIZE -c $sc $DIR/$tdir || error "setstripe"
9773         touch $DIR/$tdir/f4 $DIR/$tdir/f5
9774         $LVERIFY $DIR/$tdir $DIR/$tdir/f4 $DIR/$tdir/f5 ||
9775                 error "lverify failed"
9776 }
9777 run_test 65d "directory setstripe -S stripe_size -c stripe_count"
9778
9779 test_65e() {
9780         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9781
9782         test_mkdir $DIR/$tdir
9783
9784         $LFS setstripe $DIR/$tdir || error "setstripe"
9785         $LFS getstripe -v $DIR/$tdir | grep "Default" ||
9786                                         error "no stripe info failed"
9787         touch $DIR/$tdir/f6
9788         $LVERIFY $DIR/$tdir $DIR/$tdir/f6 || error "lverify failed"
9789 }
9790 run_test 65e "directory setstripe defaults"
9791
9792 test_65f() {
9793         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9794
9795         test_mkdir $DIR/${tdir}f
9796         $RUNAS $LFS setstripe $DIR/${tdir}f &&
9797                 error "setstripe succeeded" || true
9798 }
9799 run_test 65f "dir setstripe permission (should return error) ==="
9800
9801 test_65g() {
9802         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9803
9804         test_mkdir $DIR/$tdir
9805         local STRIPESIZE=$($LFS getstripe -S $DIR/$tdir)
9806
9807         $LFS setstripe -S $((STRIPESIZE * 2)) -i 0 -c 1 $DIR/$tdir ||
9808                 error "setstripe -S failed"
9809         $LFS setstripe -d $DIR/$tdir || error "setstripe -d failed"
9810         $LFS getstripe -v $DIR/$tdir | grep "Default" ||
9811                 error "delete default stripe failed"
9812 }
9813 run_test 65g "directory setstripe -d"
9814
9815 test_65h() {
9816         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9817
9818         test_mkdir $DIR/$tdir
9819         local STRIPESIZE=$($LFS getstripe -S $DIR/$tdir)
9820
9821         $LFS setstripe -S $((STRIPESIZE * 2)) -i 0 -c 1 $DIR/$tdir ||
9822                 error "setstripe -S failed"
9823         test_mkdir $DIR/$tdir/dd1
9824         [ $($LFS getstripe -c $DIR/$tdir) = $($LFS getstripe -c $DIR/$tdir/dd1) ] ||
9825                 error "stripe info inherit failed"
9826 }
9827 run_test 65h "directory stripe info inherit ===================="
9828
9829 test_65i() {
9830         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9831
9832         save_layout_restore_at_exit $MOUNT
9833
9834         # bug6367: set non-default striping on root directory
9835         $LFS setstripe -S 65536 -c -1 $MOUNT || error "error setting stripe"
9836
9837         # bug12836: getstripe on -1 default directory striping
9838         $LFS getstripe $MOUNT || error "getstripe $MOUNT failed"
9839
9840         # bug12836: getstripe -v on -1 default directory striping
9841         $LFS getstripe -v $MOUNT || error "getstripe -v $MOUNT failed"
9842
9843         # bug12836: new find on -1 default directory striping
9844         $LFS find -mtime -1 $MOUNT > /dev/null || error "find $MOUNT failed"
9845 }
9846 run_test 65i "various tests to set root directory striping"
9847
9848 test_65j() { # bug6367
9849         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9850
9851         sync; sleep 1
9852
9853         # if we aren't already remounting for each test, do so for this test
9854         if [ "$I_MOUNTED" = "yes" ]; then
9855                 cleanup || error "failed to unmount"
9856                 setup
9857         fi
9858
9859         save_layout_restore_at_exit $MOUNT
9860
9861         $LFS setstripe -d $MOUNT || error "setstripe failed"
9862 }
9863 run_test 65j "set default striping on root directory (bug 6367)="
9864
9865 cleanup_65k() {
9866         rm -rf $DIR/$tdir
9867         wait_delete_completed
9868         do_facet $SINGLEMDS "lctl set_param -n \
9869                 osp.$ost*MDT0000.max_create_count=$max_count"
9870         do_facet $SINGLEMDS "lctl set_param -n \
9871                 osp.$ost*MDT0000.create_count=$count"
9872         do_facet $SINGLEMDS lctl --device  %$INACTIVE_OSC activate
9873         echo $INACTIVE_OSC "is Activate"
9874
9875         wait_osc_import_state mds ost$(( ostnum + 1 )) FULL
9876 }
9877
9878 test_65k() { # bug11679
9879         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9880         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
9881         remote_mds_nodsh && skip "remote MDS with nodsh"
9882
9883         local disable_precreate=true
9884         [ $MDS1_VERSION -le $(version_code 2.8.54) ] &&
9885                 disable_precreate=false
9886
9887         echo "Check OST status: "
9888         local MDS_OSCS=$(do_facet $SINGLEMDS lctl dl |
9889                 awk '/[oO][sS][cC].*md[ts]/ { print $4 }')
9890
9891         for OSC in $MDS_OSCS; do
9892                 echo $OSC "is active"
9893                 do_facet $SINGLEMDS lctl --device %$OSC activate
9894         done
9895
9896         for INACTIVE_OSC in $MDS_OSCS; do
9897                 local ost=$(osc_to_ost $INACTIVE_OSC)
9898                 local ostnum=$(do_facet $SINGLEMDS lctl get_param -n \
9899                                lov.*md*.target_obd |
9900                                awk -F: /$ost/'{ print $1 }' | head -n 1)
9901
9902                 mkdir -p $DIR/$tdir
9903                 $LFS setstripe -i $ostnum -c 1 $DIR/$tdir
9904                 createmany -o $DIR/$tdir/$tfile.$ostnum. 1000
9905
9906                 echo "Deactivate: " $INACTIVE_OSC
9907                 do_facet $SINGLEMDS lctl --device %$INACTIVE_OSC deactivate
9908
9909                 local count=$(do_facet $SINGLEMDS "lctl get_param -n \
9910                               osp.$ost*MDT0000.create_count")
9911                 local max_count=$(do_facet $SINGLEMDS "lctl get_param -n \
9912                                   osp.$ost*MDT0000.max_create_count")
9913                 $disable_precreate &&
9914                         do_facet $SINGLEMDS "lctl set_param -n \
9915                                 osp.$ost*MDT0000.max_create_count=0"
9916
9917                 for idx in $(seq 0 $((OSTCOUNT - 1))); do
9918                         [ -f $DIR/$tdir/$idx ] && continue
9919                         echo "$LFS setstripe -i $idx -c 1 $DIR/$tdir/$idx"
9920                         $LFS setstripe -i $idx -c 1 $DIR/$tdir/$idx ||
9921                                 { cleanup_65k;
9922                                   error "setstripe $idx should succeed"; }
9923                         rm -f $DIR/$tdir/$idx || error "rm $idx failed"
9924                 done
9925                 unlinkmany $DIR/$tdir/$tfile.$ostnum. 1000
9926                 rmdir $DIR/$tdir
9927
9928                 do_facet $SINGLEMDS "lctl set_param -n \
9929                         osp.$ost*MDT0000.max_create_count=$max_count"
9930                 do_facet $SINGLEMDS "lctl set_param -n \
9931                         osp.$ost*MDT0000.create_count=$count"
9932                 do_facet $SINGLEMDS lctl --device  %$INACTIVE_OSC activate
9933                 echo $INACTIVE_OSC "is Activate"
9934
9935                 wait_osc_import_state mds ost$(( ostnum + 1 )) FULL
9936         done
9937 }
9938 run_test 65k "validate manual striping works properly with deactivated OSCs"
9939
9940 test_65l() { # bug 12836
9941         [ $PARALLEL == "yes" ] && skip "skip parallel run"
9942
9943         test_mkdir -p $DIR/$tdir/test_dir
9944         $LFS setstripe -c -1 $DIR/$tdir/test_dir
9945         $LFS find -mtime -1 $DIR/$tdir >/dev/null
9946 }
9947 run_test 65l "lfs find on -1 stripe dir ========================"
9948
9949 test_65m() {
9950         local layout=$(save_layout $MOUNT)
9951         $RUNAS $LFS setstripe -c 2 $MOUNT && {
9952                 restore_layout $MOUNT $layout
9953                 error "setstripe should fail by non-root users"
9954         }
9955         true
9956 }
9957 run_test 65m "normal user can't set filesystem default stripe"
9958
9959 test_65n() {
9960         [ -n "$FILESET" ] && skip "Not functional for FILESET set"
9961         [[ $MDS1_VERSION -ge $(version_code 2.12.50) ]] ||
9962                 skip "Need MDS version at least 2.12.50"
9963         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
9964
9965         [[ $OSTCOUNT -ge 2 ]] || skip_env "needs >= 2 OSTs"
9966         which getfattr > /dev/null 2>&1 || skip_env "no getfattr command"
9967         which setfattr > /dev/null 2>&1 || skip_env "no setfattr command"
9968
9969         save_layout_restore_at_exit $MOUNT
9970
9971         # new subdirectory under root directory should not inherit
9972         # the default layout from root
9973         local dir1=$MOUNT/$tdir-1
9974         mkdir $dir1 || error "mkdir $dir1 failed"
9975         ! getfattr -n trusted.lov $dir1 &> /dev/null ||
9976                 error "$dir1 shouldn't have LOV EA"
9977
9978         # delete the default layout on root directory
9979         $LFS setstripe -d $MOUNT || error "delete root default layout failed"
9980
9981         local dir2=$MOUNT/$tdir-2
9982         mkdir $dir2 || error "mkdir $dir2 failed"
9983         ! getfattr -n trusted.lov $dir2 &> /dev/null ||
9984                 error "$dir2 shouldn't have LOV EA"
9985
9986         # set a new striping pattern on root directory
9987         local def_stripe_size=$($LFS getstripe -S $MOUNT)
9988         local new_def_stripe_size=$((def_stripe_size * 2))
9989         $LFS setstripe -S $new_def_stripe_size $MOUNT ||
9990                 error "set stripe size on $MOUNT failed"
9991
9992         # new file created in $dir2 should inherit the new stripe size from
9993         # the filesystem default
9994         local file2=$dir2/$tfile-2
9995         touch $file2 || error "touch $file2 failed"
9996
9997         local file2_stripe_size=$($LFS getstripe -S $file2)
9998         [[ $file2_stripe_size -eq $new_def_stripe_size ]] ||
9999         {
10000                 echo "file2_stripe_size: '$file2_stripe_size'"
10001                 echo "new_def_stripe_size: '$new_def_stripe_size'"
10002                 error "$file2 didn't inherit stripe size $new_def_stripe_size"
10003         }
10004
10005         local dir3=$MOUNT/$tdir-3
10006         mkdir $dir3 || error "mkdir $dir3 failed"
10007         # $dir3 shouldn't have LOV EA, but "lfs getstripe -d $dir3" should show
10008         # the root layout, which is the actual default layout that will be used
10009         # when new files are created in $dir3.
10010         local dir3_layout=$(get_layout_param $dir3)
10011         local root_dir_layout=$(get_layout_param $MOUNT)
10012         [[ "$dir3_layout" = "$root_dir_layout" ]] ||
10013         {
10014                 echo "dir3_layout: '$dir3_layout'"
10015                 echo "root_dir_layout: '$root_dir_layout'"
10016                 error "$dir3 should show the default layout from $MOUNT"
10017         }
10018
10019         # set OST pool on root directory
10020         local pool=$TESTNAME
10021         pool_add $pool || error "add $pool failed"
10022         pool_add_targets $pool 0 $((OSTCOUNT - 1)) 1 ||
10023                 error "add targets to $pool failed"
10024
10025         $LFS setstripe -p $pool $MOUNT ||
10026                 error "set OST pool on $MOUNT failed"
10027
10028         # new file created in $dir3 should inherit the pool from
10029         # the filesystem default
10030         local file3=$dir3/$tfile-3
10031         touch $file3 || error "touch $file3 failed"
10032
10033         local file3_pool=$($LFS getstripe -p $file3)
10034         [[ "$file3_pool" = "$pool" ]] ||
10035                 error "$file3 ('$file3_pool') didn't inherit OST pool '$pool'"
10036
10037         local dir4=$MOUNT/$tdir-4
10038         mkdir $dir4 || error "mkdir $dir4 failed"
10039         local dir4_layout=$(get_layout_param $dir4)
10040         root_dir_layout=$(get_layout_param $MOUNT)
10041         echo "$LFS getstripe -d $dir4"
10042         $LFS getstripe -d $dir4
10043         echo "$LFS getstripe -d $MOUNT"
10044         $LFS getstripe -d $MOUNT
10045         [[ "$dir4_layout" = "$root_dir_layout" ]] ||
10046         {
10047                 echo "dir4_layout: '$dir4_layout'"
10048                 echo "root_dir_layout: '$root_dir_layout'"
10049                 error "$dir4 should show the default layout from $MOUNT"
10050         }
10051
10052         # new file created in $dir4 should inherit the pool from
10053         # the filesystem default
10054         local file4=$dir4/$tfile-4
10055         touch $file4 || error "touch $file4 failed"
10056
10057         local file4_pool=$($LFS getstripe -p $file4)
10058         [[ "$file4_pool" = "$pool" ]] ||
10059                 error "$file4 ('$file4_pool') didn't inherit OST pool $pool"
10060
10061         # new subdirectory under non-root directory should inherit
10062         # the default layout from its parent directory
10063         $LFS setstripe -S $new_def_stripe_size -p $pool $dir4 ||
10064                 error "set directory layout on $dir4 failed"
10065
10066         local dir5=$dir4/$tdir-5
10067         mkdir $dir5 || error "mkdir $dir5 failed"
10068
10069         dir4_layout=$(get_layout_param $dir4)
10070         local dir5_layout=$(get_layout_param $dir5)
10071         [[ "$dir4_layout" = "$dir5_layout" ]] ||
10072         {
10073                 echo "dir4_layout: '$dir4_layout'"
10074                 echo "dir5_layout: '$dir5_layout'"
10075                 error "$dir5 should inherit the default layout from $dir4"
10076         }
10077
10078         # though subdir under ROOT doesn't inherit default layout, but
10079         # its sub dir/file should be created with default layout.
10080         [[ $MDSCOUNT -ge 2 ]] || skip_env "needs >= 2 MDTs"
10081         [[ $MDS1_VERSION -ge $(version_code 2.12.59) ]] ||
10082                 skip "Need MDS version at least 2.12.59"
10083
10084         local default_lmv_count=$($LFS getdirstripe -D -c $MOUNT)
10085         local default_lmv_index=$($LFS getdirstripe -D -i $MOUNT)
10086         local default_lmv_hash=$($LFS getdirstripe -D -H $MOUNT)
10087
10088         if [ $default_lmv_hash == "none" ]; then
10089                 stack_trap "$LFS setdirstripe -D -d $MOUNT" EXIT
10090         else
10091                 stack_trap "$LFS setdirstripe -D -i $default_lmv_index \
10092                         -c $default_lmv_count -H $default_lmv_hash $MOUNT" EXIT
10093         fi
10094
10095         $LFS setdirstripe -D -c 2 $MOUNT ||
10096                 error "setdirstripe -D -c 2 failed"
10097         mkdir $MOUNT/$tdir-6 || error "mkdir $tdir-6 failed"
10098         local lmv_count=$($LFS getdirstripe -c $MOUNT/$tdir-6)
10099         [ $lmv_count -eq 2 ] || error "$tdir-6 stripe count $lmv_count"
10100
10101         # $dir4 layout includes pool
10102         $LFS setstripe -S $((new_def_stripe_size * 2)) $dir4
10103         [[ "$pool" = $($LFS getstripe -p -d $dir4) ]] ||
10104                 error "pool lost on setstripe"
10105         $LFS setstripe -E -1 -S $new_def_stripe_size $dir4
10106         [[ "$pool" = $($LFS getstripe -p -d $dir4) ]] ||
10107                 error "pool lost on compound layout setstripe"
10108 }
10109 run_test 65n "don't inherit default layout from root for new subdirectories"
10110
10111 test_65o() {
10112         (( $MDS1_VERSION >= $(version_code 2.14.57) )) ||
10113                 skip "need MDS version at least 2.14.57"
10114
10115         # set OST pool on root directory
10116         local pool=$TESTNAME
10117
10118         pool_add $pool || error "add $pool failed"
10119         pool_add_targets $pool 0 $((OSTCOUNT - 1)) 1 ||
10120                 error "add targets to $pool failed"
10121
10122         local dir1=$MOUNT/$tdir
10123
10124         mkdir $dir1 || error "mkdir $dir1 failed"
10125
10126         # set a new striping pattern on root directory
10127         local def_stripe_size=$($LFS getstripe -S $MOUNT)
10128
10129         $LFS setstripe -p $pool $dir1 ||
10130                 error "set directory layout on $dir1 failed"
10131
10132         # $dir1 layout includes pool
10133         $LFS setstripe -S $((def_stripe_size * 2)) $dir1
10134         [[ "$pool" = $($LFS getstripe -p -d $dir1) ]] ||
10135                 error "pool lost on setstripe"
10136         $LFS setstripe -E 1M -L mdt -E -1 -c 1 $dir1
10137         $LFS getstripe $dir1
10138         [[ "$pool" = $($LFS getstripe -p -d $dir1) ]] ||
10139                 error "pool lost on compound layout setstripe"
10140
10141         $LFS setdirstripe -i 0 -c 2 $dir1/dir2 ||
10142                 error "setdirstripe failed on sub-dir with inherited pool"
10143         $LFS getstripe $dir1/dir2
10144         [[ "$pool" = $($LFS getstripe -p -d $dir1/dir2) ]] ||
10145                 error "pool lost on compound layout setdirstripe"
10146
10147         $LFS setstripe -E -1 -c 1 $dir1
10148         $LFS getstripe -d $dir1
10149         [[ "$pool" = $($LFS getstripe -p -d $dir1) ]] ||
10150                 error "pool lost on setstripe"
10151 }
10152 run_test 65o "pool inheritance for mdt component"
10153
10154 test_65p () { # LU-16152
10155         local src_dir=$DIR/$tdir/src_dir
10156         local dst_dir=$DIR/$tdir/dst_dir
10157         local yaml_file=$DIR/$tdir/layout.yaml
10158         local border
10159
10160         (( $CLIENT_VERSION >= $(version_code 2.15.51) )) ||
10161                 skip "Need at least version 2.15.51"
10162
10163         test_mkdir -p $src_dir
10164         $LFS setstripe -E 2048M -c 4 -E EOF -c 8 $src_dir ||
10165                 error "failed to setstripe"
10166         $LFS getstripe --yaml -d $src_dir > $yaml_file ||
10167                 error "failed to getstripe"
10168
10169         test_mkdir -p $dst_dir
10170         $LFS setstripe --yaml $yaml_file $dst_dir ||
10171                 error "failed to setstripe with yaml file"
10172         border=$($LFS getstripe -d $dst_dir |
10173                 awk '/lcme_extent.e_end:/ { print $2; exit; }') ||
10174                 error "failed to getstripe"
10175
10176         # 2048M is 0x80000000, or 2147483648
10177         (( $border == 2147483648 )) ||
10178                 error "failed to handle huge number in yaml layout"
10179 }
10180 run_test 65p "setstripe with yaml file and huge number"
10181
10182 # bug 2543 - update blocks count on client
10183 test_66() {
10184         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10185
10186         local COUNT=${COUNT:-8}
10187         dd if=/dev/zero of=$DIR/f66 bs=1k count=$COUNT
10188         sync; sync_all_data; sync; sync_all_data
10189         cancel_lru_locks osc
10190         local BLOCKS=$(ls -s --block-size=1k $DIR/f66 | awk '{ print $1 }')
10191         (( BLOCKS >= COUNT )) || error "$DIR/f66 blocks $BLOCKS < $COUNT"
10192 }
10193 run_test 66 "update inode blocks count on client ==============="
10194
10195 meminfo() {
10196         awk '($1 == "'$1':") { print $2 }' /proc/meminfo
10197 }
10198
10199 swap_used() {
10200         swapon -s | awk '($1 == "'$1'") { print $4 }'
10201 }
10202
10203 # bug5265, obdfilter oa2dentry return -ENOENT
10204 # #define OBD_FAIL_SRV_ENOENT 0x217
10205 test_69() {
10206         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10207         remote_ost_nodsh && skip "remote OST with nodsh"
10208
10209         f="$DIR/$tfile"
10210         $LFS setstripe -c 1 -i 0 $f
10211         stack_trap "rm -f $f ${f}.2"
10212
10213         $DIRECTIO write ${f}.2 0 1 || error "directio write error"
10214
10215         do_facet ost1 lctl set_param fail_loc=0x217
10216         $TRUNCATE $f 1 # vmtruncate() will ignore truncate() error.
10217         $DIRECTIO write $f 0 2 && error "write succeeded, expect -ENOENT"
10218
10219         do_facet ost1 lctl set_param fail_loc=0
10220         $DIRECTIO write $f 0 2 || error "write error"
10221
10222         cancel_lru_locks osc
10223         $DIRECTIO read $f 0 1 || error "read error"
10224
10225         do_facet ost1 lctl set_param fail_loc=0x217
10226         $DIRECTIO read $f 1 1 && error "read succeeded, expect -ENOENT"
10227
10228         do_facet ost1 lctl set_param fail_loc=0
10229 }
10230 run_test 69 "verify oa2dentry return -ENOENT doesn't LBUG ======"
10231
10232 test_71() {
10233         test_mkdir $DIR/$tdir
10234         $LFS setdirstripe -D -c$MDSCOUNT $DIR/$tdir
10235         bash rundbench -C -D $DIR/$tdir 2 || error "dbench failed!"
10236 }
10237 run_test 71 "Running dbench on lustre (don't segment fault) ===="
10238
10239 test_72a() { # bug 5695 - Test that on 2.6 remove_suid works properly
10240         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10241         [ "$RUNAS_ID" = "$UID" ] &&
10242                 skip_env "RUNAS_ID = UID = $UID -- skipping"
10243         # Check that testing environment is properly set up. Skip if not
10244         FAIL_ON_ERROR=false check_runas_id_ret $RUNAS_ID $RUNAS_GID $RUNAS ||
10245                 skip_env "User $RUNAS_ID does not exist - skipping"
10246
10247         touch $DIR/$tfile
10248         chmod 777 $DIR/$tfile
10249         chmod ug+s $DIR/$tfile
10250         $RUNAS dd if=/dev/zero of=$DIR/$tfile bs=512 count=1 ||
10251                 error "$RUNAS dd $DIR/$tfile failed"
10252         # See if we are still setuid/sgid
10253         [ -u $DIR/$tfile ] || [ -g $DIR/$tfile ] &&
10254                 error "S/gid is not dropped on write"
10255         # Now test that MDS is updated too
10256         cancel_lru_locks mdc
10257         [ -u $DIR/$tfile ] || [ -g $DIR/$tfile ] &&
10258                 error "S/gid is not dropped on MDS"
10259         rm -f $DIR/$tfile
10260 }
10261 run_test 72a "Test that remove suid works properly (bug5695) ===="
10262
10263 test_72b() { # bug 24226 -- keep mode setting when size is not changing
10264         local perm
10265
10266         [ "$RUNAS_ID" = "$UID" ] &&
10267                 skip_env "RUNAS_ID = UID = $UID -- skipping"
10268         [ "$RUNAS_ID" -eq 0 ] &&
10269                 skip_env "RUNAS_ID = 0 -- skipping"
10270         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10271         # Check that testing environment is properly set up. Skip if not
10272         FAIL_ON_ERROR=false check_runas_id_ret $RUNAS_ID $RUNAS_ID $RUNAS ||
10273                 skip_env "User $RUNAS_ID does not exist - skipping"
10274
10275         touch $DIR/${tfile}-f{g,u}
10276         test_mkdir $DIR/${tfile}-dg
10277         test_mkdir $DIR/${tfile}-du
10278         chmod 770 $DIR/${tfile}-{f,d}{g,u}
10279         chmod g+s $DIR/${tfile}-{f,d}g
10280         chmod u+s $DIR/${tfile}-{f,d}u
10281         for perm in 777 2777 4777; do
10282                 $RUNAS chmod $perm $DIR/${tfile}-fg && error "S/gid file allowed improper chmod to $perm"
10283                 $RUNAS chmod $perm $DIR/${tfile}-fu && error "S/uid file allowed improper chmod to $perm"
10284                 $RUNAS chmod $perm $DIR/${tfile}-dg && error "S/gid dir allowed improper chmod to $perm"
10285                 $RUNAS chmod $perm $DIR/${tfile}-du && error "S/uid dir allowed improper chmod to $perm"
10286         done
10287         true
10288 }
10289 run_test 72b "Test that we keep mode setting if without file data changed (bug 24226)"
10290
10291 # bug 3462 - multiple simultaneous MDC requests
10292 test_73() {
10293         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10294
10295         test_mkdir $DIR/d73-1
10296         test_mkdir $DIR/d73-2
10297         multiop_bg_pause $DIR/d73-1/f73-1 O_c || return 1
10298         pid1=$!
10299
10300         lctl set_param fail_loc=0x80000129
10301         $MULTIOP $DIR/d73-1/f73-2 Oc &
10302         sleep 1
10303         lctl set_param fail_loc=0
10304
10305         $MULTIOP $DIR/d73-2/f73-3 Oc &
10306         pid3=$!
10307
10308         kill -USR1 $pid1
10309         wait $pid1 || return 1
10310
10311         sleep 25
10312
10313         $CHECKSTAT -t file $DIR/d73-1/f73-1 || return 4
10314         $CHECKSTAT -t file $DIR/d73-1/f73-2 || return 5
10315         $CHECKSTAT -t file $DIR/d73-2/f73-3 || return 6
10316
10317         rm -rf $DIR/d73-*
10318 }
10319 run_test 73 "multiple MDC requests (should not deadlock)"
10320
10321 test_74a() { # bug 6149, 6184
10322         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10323
10324         touch $DIR/f74a
10325         #define OBD_FAIL_LDLM_ENQUEUE_OLD_EXPORT 0x30e
10326         #
10327         # very important to OR with CFS_FAIL_ONCE (0x80000000) -- otherwise it
10328         # will spin in a tight reconnection loop
10329         $LCTL set_param fail_loc=0x8000030e
10330         # get any lock that won't be difficult - lookup works.
10331         ls $DIR/f74a
10332         $LCTL set_param fail_loc=0
10333         rm -f $DIR/f74a
10334         true
10335 }
10336 run_test 74a "ldlm_enqueue freed-export error path, ls (shouldn't LBUG)"
10337
10338 test_74b() { # bug 13310
10339         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10340
10341         #define OBD_FAIL_LDLM_ENQUEUE_OLD_EXPORT 0x30e
10342         #
10343         # very important to OR with CFS_FAIL_ONCE (0x80000000) -- otherwise it
10344         # will spin in a tight reconnection loop
10345         $LCTL set_param fail_loc=0x8000030e
10346         # get a "difficult" lock
10347         touch $DIR/f74b
10348         $LCTL set_param fail_loc=0
10349         rm -f $DIR/f74b
10350         true
10351 }
10352 run_test 74b "ldlm_enqueue freed-export error path, touch (shouldn't LBUG)"
10353
10354 test_74c() {
10355         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10356
10357         #define OBD_FAIL_LDLM_NEW_LOCK
10358         $LCTL set_param fail_loc=0x319
10359         touch $DIR/$tfile && error "touch successful"
10360         $LCTL set_param fail_loc=0
10361         true
10362 }
10363 run_test 74c "ldlm_lock_create error path, (shouldn't LBUG)"
10364
10365 slab_lic=/sys/kernel/slab/lustre_inode_cache
10366 num_objects() {
10367         [ -f $slab_lic/shrink ] && echo 1 > $slab_lic/shrink
10368         [ -f $slab_lic/objects ] && awk '{ print $1 }' $slab_lic/objects ||
10369                 awk '/lustre_inode_cache/ { print $2; exit }' /proc/slabinfo
10370 }
10371
10372 test_76a() { # Now for b=20433, added originally in b=1443
10373         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10374
10375         cancel_lru_locks osc
10376         # there may be some slab objects cached per core
10377         local cpus=$(getconf _NPROCESSORS_ONLN 2>/dev/null)
10378         local before=$(num_objects)
10379         local count=$((512 * cpus))
10380         [ "$SLOW" = "no" ] && count=$((128 * cpus))
10381         local margin=$((count / 10))
10382         if [[ -f $slab_lic/aliases ]]; then
10383                 local aliases=$(cat $slab_lic/aliases)
10384                 (( aliases > 0 )) && margin=$((margin * aliases))
10385         fi
10386
10387         echo "before slab objects: $before"
10388         for i in $(seq $count); do
10389                 touch $DIR/$tfile
10390                 rm -f $DIR/$tfile
10391         done
10392         cancel_lru_locks osc
10393         local after=$(num_objects)
10394         echo "created: $count, after slab objects: $after"
10395         # shared slab counts are not very accurate, allow significant margin
10396         # the main goal is that the cache growth is not permanently > $count
10397         while (( after > before + margin )); do
10398                 sleep 1
10399                 after=$(num_objects)
10400                 wait=$((wait + 1))
10401                 (( wait % 5 == 0 )) && echo "wait $wait seconds objects: $after"
10402                 if (( wait > 60 )); then
10403                         error "inode slab grew from $before+$margin to $after"
10404                 fi
10405         done
10406 }
10407 run_test 76a "confirm clients recycle inodes properly ===="
10408
10409 test_76b() {
10410         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10411         [ $CLIENT_VERSION -ge $(version_code 2.13.55) ] || skip "not supported"
10412
10413         local count=512
10414         local before=$(num_objects)
10415
10416         for i in $(seq $count); do
10417                 mkdir $DIR/$tdir
10418                 rmdir $DIR/$tdir
10419         done
10420
10421         local after=$(num_objects)
10422         local wait=0
10423
10424         while (( after > before )); do
10425                 sleep 1
10426                 after=$(num_objects)
10427                 wait=$((wait + 1))
10428                 (( wait % 5 == 0 )) && echo "wait $wait seconds objects: $after"
10429                 if (( wait > 60 )); then
10430                         error "inode slab grew from $before to $after"
10431                 fi
10432         done
10433
10434         echo "slab objects before: $before, after: $after"
10435 }
10436 run_test 76b "confirm clients recycle directory inodes properly ===="
10437
10438 export ORIG_CSUM=""
10439 set_checksums()
10440 {
10441         # Note: in sptlrpc modes which enable its own bulk checksum, the
10442         # original crc32_le bulk checksum will be automatically disabled,
10443         # and the OBD_FAIL_OSC_CHECKSUM_SEND/OBD_FAIL_OSC_CHECKSUM_RECEIVE
10444         # will be checked by sptlrpc code against sptlrpc bulk checksum.
10445         # In this case set_checksums() will not be no-op, because sptlrpc
10446         # bulk checksum will be enabled all through the test.
10447
10448         [ "$ORIG_CSUM" ] || ORIG_CSUM=`lctl get_param -n osc.*.checksums | head -n1`
10449         lctl set_param -n osc.*.checksums $1
10450         return 0
10451 }
10452
10453 export ORIG_CSUM_TYPE="`lctl get_param -n osc.*osc-[^mM]*.checksum_type |
10454                         sed 's/.*\[\(.*\)\].*/\1/g' | head -n1`"
10455 CKSUM_TYPES=${CKSUM_TYPES:-$(lctl get_param -n osc.*osc-[^mM]*.checksum_type |
10456                              tr -d [] | head -n1)}
10457 set_checksum_type()
10458 {
10459         lctl set_param -n osc.*osc-[^mM]*.checksum_type $1
10460         rc=$?
10461         log "set checksum type to $1, rc = $rc"
10462         return $rc
10463 }
10464
10465 get_osc_checksum_type()
10466 {
10467         # arugment 1: OST name, like OST0000
10468         ost=$1
10469         checksum_type=$(lctl get_param -n osc.*${ost}-osc-[^mM]*.checksum_type |
10470                         sed 's/.*\[\(.*\)\].*/\1/g')
10471         rc=$?
10472         [ $rc -ne 0 ] && error "failed to get checksum type of $ost, rc = $rc, output = $checksum_type"
10473         echo $checksum_type
10474 }
10475
10476 F77_TMP=$TMP/f77-temp
10477 F77SZ=8
10478 setup_f77() {
10479         dd if=/dev/urandom of=$F77_TMP bs=1M count=$F77SZ || \
10480                 error "error writing to $F77_TMP"
10481 }
10482
10483 test_77a() { # bug 10889
10484         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10485         $GSS && skip_env "could not run with gss"
10486
10487         [ ! -f $F77_TMP ] && setup_f77
10488         set_checksums 1
10489         dd if=$F77_TMP of=$DIR/$tfile bs=1M count=$F77SZ || error "dd error"
10490         set_checksums 0
10491         rm -f $DIR/$tfile
10492 }
10493 run_test 77a "normal checksum read/write operation"
10494
10495 test_77b() { # bug 10889
10496         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10497         $GSS && skip_env "could not run with gss"
10498
10499         [ ! -f $F77_TMP ] && setup_f77
10500         #define OBD_FAIL_OSC_CHECKSUM_SEND       0x409
10501         $LCTL set_param fail_loc=0x80000409
10502         set_checksums 1
10503
10504         dd if=$F77_TMP of=$DIR/$tfile bs=1M count=$F77SZ conv=sync ||
10505                 error "dd error: $?"
10506         $LCTL set_param fail_loc=0
10507
10508         for algo in $CKSUM_TYPES; do
10509                 cancel_lru_locks osc
10510                 set_checksum_type $algo
10511                 #define OBD_FAIL_OSC_CHECKSUM_RECEIVE    0x408
10512                 $LCTL set_param fail_loc=0x80000408
10513                 cmp $F77_TMP $DIR/$tfile || error "file compare failed"
10514                 $LCTL set_param fail_loc=0
10515         done
10516         set_checksums 0
10517         set_checksum_type $ORIG_CSUM_TYPE
10518         rm -f $DIR/$tfile
10519 }
10520 run_test 77b "checksum error on client write, read"
10521
10522 cleanup_77c() {
10523         trap 0
10524         set_checksums 0
10525         $LCTL set_param osc.*osc-[^mM]*.checksum_dump=0
10526         $check_ost &&
10527                 do_facet ost1 $LCTL set_param obdfilter.*-OST*.checksum_dump=0
10528         [ -n "$osc_file_prefix" ] && rm -f ${osc_file_prefix}*
10529         $check_ost && [ -n "$ost_file_prefix" ] &&
10530                 do_facet ost1 rm -f ${ost_file_prefix}\*
10531 }
10532
10533 test_77c() {
10534         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10535         $GSS && skip_env "could not run with gss"
10536         remote_ost_nodsh && skip "remote OST with nodsh"
10537
10538         local bad1
10539         local osc_file_prefix
10540         local osc_file
10541         local check_ost=false
10542         local ost_file_prefix
10543         local ost_file
10544         local orig_cksum
10545         local dump_cksum
10546         local fid
10547
10548         # ensure corruption will occur on first OSS/OST
10549         $LFS setstripe -i 0 $DIR/$tfile
10550
10551         [ ! -f $F77_TMP ] && setup_f77
10552         dd if=$F77_TMP of=$DIR/$tfile bs=1M count=$F77SZ conv=sync ||
10553                 error "dd write error: $?"
10554         fid=$($LFS path2fid $DIR/$tfile)
10555
10556         if [ $OST1_VERSION -ge $(version_code 2.9.57) ]
10557         then
10558                 check_ost=true
10559                 ost_file_prefix=$(do_facet ost1 $LCTL get_param -n debug_path)
10560                 ost_file_prefix=${ost_file_prefix}-checksum_dump-ost-\\${fid}
10561         else
10562                 echo "OSS do not support bulk pages dump upon error"
10563         fi
10564
10565         osc_file_prefix=$($LCTL get_param -n debug_path)
10566         osc_file_prefix=${osc_file_prefix}-checksum_dump-osc-\\${fid}
10567
10568         trap cleanup_77c EXIT
10569
10570         set_checksums 1
10571         # enable bulk pages dump upon error on Client
10572         $LCTL set_param osc.*osc-[^mM]*.checksum_dump=1
10573         # enable bulk pages dump upon error on OSS
10574         $check_ost &&
10575                 do_facet ost1 $LCTL set_param obdfilter.*-OST*.checksum_dump=1
10576
10577         # flush Client cache to allow next read to reach OSS
10578         cancel_lru_locks osc
10579
10580         #define OBD_FAIL_OSC_CHECKSUM_RECEIVE       0x408
10581         $LCTL set_param fail_loc=0x80000408
10582         dd if=$DIR/$tfile of=/dev/null bs=1M || error "dd read error: $?"
10583         $LCTL set_param fail_loc=0
10584
10585         rm -f $DIR/$tfile
10586
10587         # check cksum dump on Client
10588         osc_file=$(ls ${osc_file_prefix}*)
10589         [ -n "$osc_file" ] || error "no checksum dump file on Client"
10590         # OBD_FAIL_OSC_CHECKSUM_RECEIVE corrupts with "bad1" at start of file
10591         bad1=$(dd if=$osc_file bs=1 count=4 2>/dev/null) || error "dd error: $?"
10592         [ $bad1 == "bad1" ] || error "unexpected corrupt pattern"
10593         orig_cksum=$(dd if=$F77_TMP bs=1 skip=4 count=1048572 2>/dev/null |
10594                      cksum)
10595         dump_cksum=$(dd if=$osc_file bs=1 skip=4 2>/dev/null | cksum)
10596         [[ "$orig_cksum" == "$dump_cksum" ]] ||
10597                 error "dump content does not match on Client"
10598
10599         $check_ost || skip "No need to check cksum dump on OSS"
10600
10601         # check cksum dump on OSS
10602         ost_file=$(do_facet ost1 ls ${ost_file_prefix}\*)
10603         [ -n "$ost_file" ] || error "no checksum dump file on OSS"
10604         orig_cksum=$(dd if=$F77_TMP bs=1048576 count=1 2>/dev/null | cksum)
10605         dump_cksum=$(do_facet ost1 dd if=$ost_file 2>/dev/null \| cksum)
10606         [[ "$orig_cksum" == "$dump_cksum" ]] ||
10607                 error "dump content does not match on OSS"
10608
10609         cleanup_77c
10610 }
10611 run_test 77c "checksum error on client read with debug"
10612
10613 test_77d() { # bug 10889
10614         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10615         $GSS && skip_env "could not run with gss"
10616
10617         stack_trap "rm -f $DIR/$tfile"
10618         #define OBD_FAIL_OSC_CHECKSUM_SEND       0x409
10619         $LCTL set_param fail_loc=0x80000409
10620         set_checksums 1
10621         $DIRECTIO write $DIR/$tfile 0 $F77SZ $((1024 * 1024)) ||
10622                 error "direct write: rc=$?"
10623         $LCTL set_param fail_loc=0
10624         set_checksums 0
10625
10626         #define OBD_FAIL_OSC_CHECKSUM_RECEIVE    0x408
10627         $LCTL set_param fail_loc=0x80000408
10628         set_checksums 1
10629         cancel_lru_locks osc
10630         $DIRECTIO read $DIR/$tfile 0 $F77SZ $((1024 * 1024)) ||
10631                 error "direct read: rc=$?"
10632         $LCTL set_param fail_loc=0
10633         set_checksums 0
10634 }
10635 run_test 77d "checksum error on OST direct write, read"
10636
10637 test_77f() { # bug 10889
10638         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10639         $GSS && skip_env "could not run with gss"
10640
10641         set_checksums 1
10642         stack_trap "rm -f $DIR/$tfile"
10643         for algo in $CKSUM_TYPES; do
10644                 cancel_lru_locks osc
10645                 set_checksum_type $algo
10646                 #define OBD_FAIL_OSC_CHECKSUM_SEND       0x409
10647                 $LCTL set_param fail_loc=0x409
10648                 $DIRECTIO write $DIR/$tfile 0 $F77SZ $((1024 * 1024)) &&
10649                         error "direct write succeeded"
10650                 $LCTL set_param fail_loc=0
10651         done
10652         set_checksum_type $ORIG_CSUM_TYPE
10653         set_checksums 0
10654 }
10655 run_test 77f "repeat checksum error on write (expect error)"
10656
10657 test_77g() { # bug 10889
10658         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10659         $GSS && skip_env "could not run with gss"
10660         remote_ost_nodsh && skip "remote OST with nodsh"
10661
10662         [ ! -f $F77_TMP ] && setup_f77
10663
10664         local file=$DIR/$tfile
10665         stack_trap "rm -f $file" EXIT
10666
10667         $LFS setstripe -c 1 -i 0 $file
10668         #define OBD_FAIL_OST_CHECKSUM_RECEIVE       0x21a
10669         do_facet ost1 lctl set_param fail_loc=0x8000021a
10670         set_checksums 1
10671         dd if=$F77_TMP of=$file bs=1M count=$F77SZ ||
10672                 error "write error: rc=$?"
10673         do_facet ost1 lctl set_param fail_loc=0
10674         set_checksums 0
10675
10676         cancel_lru_locks osc
10677         #define OBD_FAIL_OST_CHECKSUM_SEND          0x21b
10678         do_facet ost1 lctl set_param fail_loc=0x8000021b
10679         set_checksums 1
10680         cmp $F77_TMP $file || error "file compare failed"
10681         do_facet ost1 lctl set_param fail_loc=0
10682         set_checksums 0
10683 }
10684 run_test 77g "checksum error on OST write, read"
10685
10686 test_77k() { # LU-10906
10687         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10688         $GSS && skip_env "could not run with gss"
10689
10690         local cksum_param="osc.$FSNAME*.checksums"
10691         local get_checksum="$LCTL get_param -n $cksum_param | head -n1"
10692         local checksum
10693         local i
10694
10695         [ "$ORIG_CSUM" ] || ORIG_CSUM=$(eval $get_checksum)
10696         stack_trap "wait_update $HOSTNAME '$get_checksum' $ORIG_CSUM || true"
10697         stack_trap "do_facet mgs $LCTL set_param -P $cksum_param=$ORIG_CSUM"
10698
10699         for i in 0 1; do
10700                 do_facet mgs $LCTL set_param -P $cksum_param=$i ||
10701                         error "failed to set checksum=$i on MGS"
10702                 wait_update $HOSTNAME "$get_checksum" $i
10703                 #remount
10704                 echo "remount client, checksum should be $i"
10705                 remount_client $MOUNT || error "failed to remount client"
10706                 checksum=$(eval $get_checksum)
10707                 [ $checksum -eq $i ] || error "checksum($checksum) != $i"
10708         done
10709         # remove persistent param to avoid races with checksum mountopt below
10710         do_facet mgs $LCTL set_param -P -d $cksum_param ||
10711                 error "failed to delete checksum on MGS"
10712
10713         for opt in "checksum" "nochecksum"; do
10714                 #remount with mount option
10715                 echo "remount client with option $opt, checksum should be $i"
10716                 umount_client $MOUNT || error "failed to umount client"
10717                 mount_client $MOUNT "$MOUNT_OPTS,$opt" ||
10718                         error "failed to mount client with option '$opt'"
10719                 checksum=$(eval $get_checksum)
10720                 [ $checksum -eq $i ] || error "checksum($checksum) != $i"
10721                 i=$((i - 1))
10722         done
10723
10724         remount_client $MOUNT || error "failed to remount client"
10725 }
10726 run_test 77k "enable/disable checksum correctly"
10727
10728 test_77l() {
10729         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10730         $GSS && skip_env "could not run with gss"
10731
10732         set_checksums 1
10733         stack_trap "set_checksums $ORIG_CSUM" EXIT
10734         stack_trap "set_checksum_type $ORIG_CSUM_TYPE" EXIT
10735
10736         set_checksum_type invalid && error "unexpected success of invalid checksum type"
10737
10738         $LFS setstripe -c 1 -i 0 $DIR/$tfile
10739         for algo in $CKSUM_TYPES; do
10740                 set_checksum_type $algo || error "fail to set checksum type $algo"
10741                 osc_algo=$(get_osc_checksum_type OST0000)
10742                 [ "$osc_algo" != "$algo" ] && error "checksum type is $osc_algo after setting it to $algo"
10743
10744                 # no locks, no reqs to let the connection idle
10745                 cancel_lru_locks osc
10746                 lru_resize_disable osc
10747                 wait_osc_import_state client ost1 IDLE
10748
10749                 # ensure ost1 is connected
10750                 stat $DIR/$tfile >/dev/null || error "can't stat"
10751                 wait_osc_import_state client ost1 FULL
10752
10753                 osc_algo=$(get_osc_checksum_type OST0000)
10754                 [ "$osc_algo" != "$algo" ] && error "checksum type changed from $algo to $osc_algo after reconnection"
10755         done
10756         return 0
10757 }
10758 run_test 77l "preferred checksum type is remembered after reconnected"
10759
10760 [ "$ORIG_CSUM" ] && set_checksums $ORIG_CSUM || true
10761 rm -f $F77_TMP
10762 unset F77_TMP
10763
10764 test_77m() {
10765         (( $CLIENT_VERSION >= $(version_code 2.14.52) )) ||
10766                 skip "Need at least version 2.14.52"
10767         local param=checksum_speed
10768
10769         $LCTL get_param $param || error "reading $param failed"
10770
10771         csum_speeds=$($LCTL get_param -n $param)
10772
10773         [[ "$csum_speeds" =~ "adler32" && "$csum_speeds" =~ "crc32" ]] ||
10774                 error "known checksum types are missing"
10775 }
10776 run_test 77m "Verify checksum_speed is correctly read"
10777
10778 check_filefrag_77n() {
10779         local nr_ext=0
10780         local starts=()
10781         local ends=()
10782
10783         while read extidx a b start end rest; do
10784                 if [[ "${extidx}" =~ ^[0-9]+: ]]; then
10785                         nr_ext=$(( $nr_ext + 1 ))
10786                         starts+=( ${start%..} )
10787                         ends+=( ${end%:} )
10788                 fi
10789         done < <( filefrag -sv $1 )
10790
10791         [[ $nr_ext -eq 2 ]] && [[ "${starts[-1]}" == $(( ${ends[0]} + 1 )) ]] && return 0
10792         return 1
10793 }
10794
10795 test_77n() {
10796         [[ "$CKSUM_TYPES" =~ t10 ]] || skip "no T10 checksum support on osc"
10797
10798         touch $DIR/$tfile
10799         $TRUNCATE $DIR/$tfile 0
10800         dd if=/dev/urandom of=$DIR/$tfile bs=4k conv=notrunc count=1 seek=0
10801         dd if=/dev/urandom of=$DIR/$tfile bs=4k conv=notrunc count=1 seek=2
10802         check_filefrag_77n $DIR/$tfile ||
10803                 skip "$tfile blocks not contiguous around hole"
10804
10805         set_checksums 1
10806         stack_trap "set_checksums $ORIG_CSUM" EXIT
10807         stack_trap "set_checksum_type $ORIG_CSUM_TYPE" EXIT
10808         stack_trap "rm -f $DIR/$tfile"
10809
10810         for algo in $CKSUM_TYPES; do
10811                 if [[ "$algo" =~ ^t10 ]]; then
10812                         set_checksum_type $algo ||
10813                                 error "fail to set checksum type $algo"
10814                         dd if=$DIR/$tfile of=/dev/null bs=12k count=1 iflag=direct ||
10815                                 error "fail to read $tfile with $algo"
10816                 fi
10817         done
10818         rm -f $DIR/$tfile
10819         return 0
10820 }
10821 run_test 77n "Verify read from a hole inside contiguous blocks with T10PI"
10822
10823 test_77o() {
10824         (( $MDS1_VERSION >= $(version_code 2.14.55) )) ||
10825                 skip "Need MDS version at least 2.14.55"
10826         (( $OST1_VERSION >= $(version_code 2.14.55) )) ||
10827                 skip "Need OST version at least 2.14.55"
10828         local ofd=obdfilter
10829         local mdt=mdt
10830
10831         # print OST checksum_type
10832         echo "$ofd.$FSNAME-*.checksum_type:"
10833         do_nodes $(comma_list $(osts_nodes)) \
10834                 $LCTL get_param -n $ofd.$FSNAME-*.checksum_type
10835
10836         # print MDT checksum_type
10837         echo "$mdt.$FSNAME-*.checksum_type:"
10838         do_nodes $(comma_list $(mdts_nodes)) \
10839                 $LCTL get_param -n $mdt.$FSNAME-*.checksum_type
10840
10841         local o_count=$(do_nodes $(comma_list $(osts_nodes)) \
10842                    $LCTL get_param -n $ofd.$FSNAME-*.checksum_type | wc -l)
10843
10844         (( $o_count == $OSTCOUNT )) ||
10845                 error "found $o_count checksums, not \$MDSCOUNT=$OSTCOUNT"
10846
10847         local m_count=$(do_nodes $(comma_list $(mdts_nodes)) \
10848                    $LCTL get_param -n $mdt.$FSNAME-*.checksum_type | wc -l)
10849
10850         (( $m_count == $MDSCOUNT )) ||
10851                 error "found $m_count checksums, not \$MDSCOUNT=$MDSCOUNT"
10852 }
10853 run_test 77o "Verify checksum_type for server (mdt and ofd(obdfilter))"
10854
10855 cleanup_test_78() {
10856         trap 0
10857         rm -f $DIR/$tfile
10858 }
10859
10860 test_78() { # bug 10901
10861         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10862         remote_ost || skip_env "local OST"
10863
10864         NSEQ=5
10865         F78SIZE=$(($(awk '/MemFree:/ { print $2 }' /proc/meminfo) / 1024))
10866         echo "MemFree: $F78SIZE, Max file size: $MAXFREE"
10867         MEMTOTAL=$(($(awk '/MemTotal:/ { print $2 }' /proc/meminfo) / 1024))
10868         echo "MemTotal: $MEMTOTAL"
10869
10870         # reserve 256MB of memory for the kernel and other running processes,
10871         # and then take 1/2 of the remaining memory for the read/write buffers.
10872         if [ $MEMTOTAL -gt 512 ] ;then
10873                 MEMTOTAL=$(((MEMTOTAL - 256 ) / 2))
10874         else
10875                 # for those poor memory-starved high-end clusters...
10876                 MEMTOTAL=$((MEMTOTAL / 2))
10877         fi
10878         echo "Mem to use for directio: $MEMTOTAL"
10879
10880         [[ $F78SIZE -gt $MEMTOTAL ]] && F78SIZE=$MEMTOTAL
10881         [[ $F78SIZE -gt 512 ]] && F78SIZE=512
10882         [[ $F78SIZE -gt $((MAXFREE / 1024)) ]] && F78SIZE=$((MAXFREE / 1024))
10883         SMALLESTOST=$($LFS df $DIR | grep OST | awk '{ print $4 }' | sort -n |
10884                 head -n1)
10885         echo "Smallest OST: $SMALLESTOST"
10886         [[ $SMALLESTOST -lt 10240 ]] &&
10887                 skip "too small OSTSIZE, useless to run large O_DIRECT test"
10888
10889         trap cleanup_test_78 EXIT
10890
10891         [[ $F78SIZE -gt $((SMALLESTOST * $OSTCOUNT / 1024 - 80)) ]] &&
10892                 F78SIZE=$((SMALLESTOST * $OSTCOUNT / 1024 - 80))
10893
10894         [ "$SLOW" = "no" ] && NSEQ=1 && [ $F78SIZE -gt 32 ] && F78SIZE=32
10895         echo "File size: $F78SIZE"
10896         $LFS setstripe -c $OSTCOUNT $DIR/$tfile || error "setstripe failed"
10897         for i in $(seq 1 $NSEQ); do
10898                 FSIZE=$(($F78SIZE / ($NSEQ - $i + 1)))
10899                 echo directIO rdwr round $i of $NSEQ
10900                 $DIRECTIO rdwr $DIR/$tfile 0 $FSIZE 1048576||error "rdwr failed"
10901         done
10902
10903         cleanup_test_78
10904 }
10905 run_test 78 "handle large O_DIRECT writes correctly ============"
10906
10907 test_79() { # bug 12743
10908         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10909
10910         wait_delete_completed
10911
10912         BKTOTAL=$(calc_osc_kbytes kbytestotal)
10913         BKFREE=$(calc_osc_kbytes kbytesfree)
10914         BKAVAIL=$(calc_osc_kbytes kbytesavail)
10915
10916         STRING=`df -P $MOUNT | tail -n 1 | awk '{print $2","$3","$4}'`
10917         DFTOTAL=`echo $STRING | cut -d, -f1`
10918         DFUSED=`echo $STRING  | cut -d, -f2`
10919         DFAVAIL=`echo $STRING | cut -d, -f3`
10920         DFFREE=$(($DFTOTAL - $DFUSED))
10921
10922         ALLOWANCE=$((64 * $OSTCOUNT))
10923
10924         if [ $DFTOTAL -lt $(($BKTOTAL - $ALLOWANCE)) ] ||
10925            [ $DFTOTAL -gt $(($BKTOTAL + $ALLOWANCE)) ] ; then
10926                 error "df total($DFTOTAL) mismatch OST total($BKTOTAL)"
10927         fi
10928         if [ $DFFREE -lt $(($BKFREE - $ALLOWANCE)) ] ||
10929            [ $DFFREE -gt $(($BKFREE + $ALLOWANCE)) ] ; then
10930                 error "df free($DFFREE) mismatch OST free($BKFREE)"
10931         fi
10932         if [ $DFAVAIL -lt $(($BKAVAIL - $ALLOWANCE)) ] ||
10933            [ $DFAVAIL -gt $(($BKAVAIL + $ALLOWANCE)) ] ; then
10934                 error "df avail($DFAVAIL) mismatch OST avail($BKAVAIL)"
10935         fi
10936 }
10937 run_test 79 "df report consistency check ======================="
10938
10939 test_80() { # bug 10718
10940         remote_ost_nodsh && skip "remote OST with nodsh"
10941         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10942
10943         # relax strong synchronous semantics for slow backends like ZFS
10944         if [ "$ost1_FSTYPE" != "ldiskfs" ]; then
10945                 local soc="obdfilter.*.sync_lock_cancel"
10946                 local save=$(do_facet ost1 $LCTL get_param -n $soc | head -n1)
10947
10948                 # "sync_on_lock_cancel" was broken by v2_11_55_0-26-g7059644e9a
10949                 if [ -z "$save" ]; then
10950                         soc="obdfilter.*.sync_on_lock_cancel"
10951                         save=$(do_facet ost1 $LCTL get_param -n $soc | head -n1)
10952                 fi
10953
10954                 if [ "$save" != "never" ]; then
10955                         local hosts=$(comma_list $(osts_nodes))
10956
10957                         do_nodes $hosts $LCTL set_param $soc=never
10958                         stack_trap "do_nodes $hosts $LCTL set_param $soc=$save"
10959                 fi
10960         fi
10961
10962         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 seek=1M
10963         sync; sleep 1; sync
10964         local before=$(date +%s)
10965         cancel_lru_locks osc
10966         local after=$(date +%s)
10967         local diff=$((after - before))
10968         [ $diff -le 1 ] || error "elapsed for 1M@1T = $diff"
10969
10970         rm -f $DIR/$tfile
10971 }
10972 run_test 80 "Page eviction is equally fast at high offsets too"
10973
10974 test_81a() { # LU-456
10975         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10976         remote_ost_nodsh && skip "remote OST with nodsh"
10977
10978         # define OBD_FAIL_OST_MAPBLK_ENOSPC    0x228
10979         # MUST OR with the CFS_FAIL_ONCE (0x80000000)
10980         do_facet ost1 lctl set_param fail_loc=0x80000228
10981
10982         # write should trigger a retry and success
10983         $LFS setstripe -i 0 -c 1 $DIR/$tfile
10984         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
10985         RC=$?
10986         if [ $RC -ne 0 ] ; then
10987                 error "write should success, but failed for $RC"
10988         fi
10989 }
10990 run_test 81a "OST should retry write when get -ENOSPC ==============="
10991
10992 test_81b() { # LU-456
10993         [ $PARALLEL == "yes" ] && skip "skip parallel run"
10994         remote_ost_nodsh && skip "remote OST with nodsh"
10995
10996         # define OBD_FAIL_OST_MAPBLK_ENOSPC    0x228
10997         # Don't OR with the CFS_FAIL_ONCE (0x80000000)
10998         do_facet ost1 lctl set_param fail_loc=0x228
10999
11000         # write should retry several times and return -ENOSPC finally
11001         $LFS setstripe -i 0 -c 1 $DIR/$tfile
11002         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
11003         RC=$?
11004         ENOSPC=28
11005         if [ $RC -ne $ENOSPC ] ; then
11006                 error "dd should fail for -ENOSPC, but succeed."
11007         fi
11008 }
11009 run_test 81b "OST should return -ENOSPC when retry still fails ======="
11010
11011 test_99() {
11012         [ -z "$(which cvs 2>/dev/null)" ] && skip_env "could not find cvs"
11013
11014         test_mkdir $DIR/$tdir.cvsroot
11015         chown $RUNAS_ID $DIR/$tdir.cvsroot
11016
11017         cd $TMP
11018         $RUNAS cvs -d $DIR/$tdir.cvsroot init || error "cvs init failed"
11019
11020         cd /etc/init.d
11021         # some versions of cvs import exit(1) when asked to import links or
11022         # files they can't read.  ignore those files.
11023         local toignore=$(find . -type l -printf '-I %f\n' -o \
11024                          ! -perm /4 -printf '-I %f\n')
11025         $RUNAS cvs -d $DIR/$tdir.cvsroot import -m "nomesg" $toignore \
11026                 $tdir.reposname vtag rtag
11027
11028         cd $DIR
11029         test_mkdir $DIR/$tdir.reposname
11030         chown $RUNAS_ID $DIR/$tdir.reposname
11031         $RUNAS cvs -d $DIR/$tdir.cvsroot co $tdir.reposname
11032
11033         cd $DIR/$tdir.reposname
11034         $RUNAS touch foo99
11035         $RUNAS cvs add -m 'addmsg' foo99
11036         $RUNAS cvs update
11037         $RUNAS cvs commit -m 'nomsg' foo99
11038         rm -fr $DIR/$tdir.cvsroot
11039 }
11040 run_test 99 "cvs strange file/directory operations"
11041
11042 test_100() {
11043         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11044         [[ "$NETTYPE" =~ tcp ]] ||
11045                 skip_env "TCP secure port test, not useful for NETTYPE=$NETTYPE"
11046         [[ -n "$(type -p ss)" ]] || skip_env "ss not available"
11047         remote_ost_nodsh && skip "remote OST with nodsh"
11048         remote_mds_nodsh && skip "remote MDS with nodsh"
11049         remote_servers || skip "useless for local single node setup"
11050
11051         ss -tna | ( rc=1; while read STATE SND RCV LOCAL REMOTE STAT; do
11052                 [[ "${REMOTE/*:/}" == "$ACCEPTOR_PORT" ]] || continue
11053
11054                 rc=0
11055                 if (( ${LOCAL/*:/} >= 1024 )); then
11056                         echo "bad: $PROT $SND $RCV $LOCAL $REMOTE $STAT"
11057                         ss -tna
11058                         error "local: ${LOCAL/*:/} > 1024 remote: ${REMOTE/*:/}"
11059                 fi
11060         done
11061         (( $rc == 0 )) || error "privileged port not found" )
11062 }
11063 run_test 100 "check local port using privileged port"
11064
11065 function get_named_value()
11066 {
11067     local tag=$1
11068
11069     grep -w "$tag" | sed "s/^$tag  *\([0-9]*\)  *.*/\1/"
11070 }
11071
11072 export CACHE_MAX=$($LCTL get_param -n llite.*.max_cached_mb |
11073                    awk '/^max_cached_mb/ { print $2 }')
11074
11075 cleanup_101a() {
11076         $LCTL set_param -n llite.*.max_cached_mb $CACHE_MAX
11077         trap 0
11078 }
11079
11080 test_101a() {
11081         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11082
11083         local s
11084         local discard
11085         local nreads=10000
11086         local cache_limit=32
11087
11088         $LCTL set_param -n osc.*-osc*.rpc_stats=0
11089         trap cleanup_101a EXIT
11090         $LCTL set_param -n llite.*.read_ahead_stats=0
11091         $LCTL set_param -n llite.*.max_cached_mb=$cache_limit
11092
11093         #
11094         # randomly read 10000 of 64K chunks from file 3x 32MB in size
11095         #
11096         echo "nreads: $nreads file size: $((cache_limit * 3))MB"
11097         $READS -f $DIR/$tfile -s$((cache_limit * 3192 * 1024)) -b65536 -C -n$nreads -t 180
11098
11099         discard=0
11100         for s in $($LCTL get_param -n llite.*.read_ahead_stats |
11101                    get_named_value 'read.but.discarded'); do
11102                         discard=$(($discard + $s))
11103         done
11104         cleanup_101a
11105
11106         $LCTL get_param osc.*-osc*.rpc_stats
11107         $LCTL get_param llite.*.read_ahead_stats
11108
11109         # Discard is generally zero, but sometimes a few random reads line up
11110         # and trigger larger readahead, which is wasted & leads to discards.
11111         if [[ $(($discard)) -gt $nreads ]]; then
11112                 error "too many ($discard) discarded pages"
11113         fi
11114         rm -f $DIR/$tfile || true
11115 }
11116 run_test 101a "check read-ahead for random reads"
11117
11118 setup_test101bc() {
11119         test_mkdir $DIR/$tdir
11120         local ssize=$1
11121         local FILE_LENGTH=$2
11122         STRIPE_OFFSET=0
11123
11124         local FILE_SIZE_MB=$((FILE_LENGTH / ssize))
11125
11126         local list=$(comma_list $(osts_nodes))
11127         set_osd_param $list '' read_cache_enable 0
11128         set_osd_param $list '' writethrough_cache_enable 0
11129
11130         trap cleanup_test101bc EXIT
11131         # prepare the read-ahead file
11132         $LFS setstripe -S $ssize -i $STRIPE_OFFSET -c $OSTCOUNT $DIR/$tfile
11133
11134         dd if=/dev/zero of=$DIR/$tfile bs=$ssize \
11135                                 count=$FILE_SIZE_MB 2> /dev/null
11136
11137 }
11138
11139 cleanup_test101bc() {
11140         trap 0
11141         rm -rf $DIR/$tdir
11142         rm -f $DIR/$tfile
11143
11144         local list=$(comma_list $(osts_nodes))
11145         set_osd_param $list '' read_cache_enable 1
11146         set_osd_param $list '' writethrough_cache_enable 1
11147 }
11148
11149 calc_total() {
11150         awk 'BEGIN{total=0}; {total+=$1}; END{print total}'
11151 }
11152
11153 ra_check_101() {
11154         local read_size=$1
11155         local stripe_size=$2
11156         local stride_length=$((stripe_size / read_size))
11157         local stride_width=$((stride_length * OSTCOUNT))
11158         local discard_limit=$(( ((stride_length - 1) * 3 / stride_width) *
11159                                 (stride_width - stride_length) ))
11160         local discard=$($LCTL get_param -n llite.*.read_ahead_stats |
11161                   get_named_value 'read.but.discarded' | calc_total)
11162
11163         if [[ $discard -gt $discard_limit ]]; then
11164                 $LCTL get_param llite.*.read_ahead_stats
11165                 error "($discard limit ${discard_limit}) discarded pages with size (${read_size})"
11166         else
11167                 echo "Read-ahead success for size ${read_size}"
11168         fi
11169 }
11170
11171 test_101b() {
11172         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11173         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11174
11175         local STRIPE_SIZE=1048576
11176         local STRIDE_SIZE=$((STRIPE_SIZE*OSTCOUNT))
11177
11178         if [ $SLOW == "yes" ]; then
11179                 local FILE_LENGTH=$((STRIDE_SIZE * 64))
11180         else
11181                 local FILE_LENGTH=$((STRIDE_SIZE * 8))
11182         fi
11183
11184         local ITERATION=$((FILE_LENGTH / STRIDE_SIZE))
11185
11186         # prepare the read-ahead file
11187         setup_test101bc $STRIPE_SIZE $FILE_LENGTH
11188         cancel_lru_locks osc
11189         for BIDX in 2 4 8 16 32 64 128 256
11190         do
11191                 local BSIZE=$((BIDX*4096))
11192                 local READ_COUNT=$((STRIPE_SIZE/BSIZE))
11193                 local STRIDE_LENGTH=$((STRIDE_SIZE/BSIZE))
11194                 local OFFSET=$((STRIPE_SIZE/BSIZE*(OSTCOUNT - 1)))
11195                 $LCTL set_param -n llite.*.read_ahead_stats=0
11196                 $READS -f $DIR/$tfile  -l $STRIDE_LENGTH -o $OFFSET \
11197                               -s $FILE_LENGTH -b $STRIPE_SIZE -a $READ_COUNT -n $ITERATION
11198                 cancel_lru_locks osc
11199                 ra_check_101 $BSIZE $STRIPE_SIZE $FILE_LENGTH
11200         done
11201         cleanup_test101bc
11202         true
11203 }
11204 run_test 101b "check stride-io mode read-ahead ================="
11205
11206 test_101c() {
11207         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11208
11209         local STRIPE_SIZE=1048576
11210         local FILE_LENGTH=$((STRIPE_SIZE*100))
11211         local nreads=10000
11212         local rsize=65536
11213         local osc_rpc_stats
11214
11215         setup_test101bc $STRIPE_SIZE $FILE_LENGTH
11216
11217         cancel_lru_locks osc
11218         $LCTL set_param osc.*.rpc_stats=0
11219         $READS -f $DIR/$tfile -s$FILE_LENGTH -b$rsize -n$nreads -t 180
11220         $LCTL get_param osc.*.rpc_stats
11221         for osc_rpc_stats in $($LCTL get_param -N osc.*.rpc_stats); do
11222                 local stats=$($LCTL get_param -n $osc_rpc_stats)
11223                 local lines=$(echo "$stats" | awk 'END {print NR;}')
11224                 local size
11225
11226                 if [ $lines -le 20 ]; then
11227                         echo "continue debug"
11228                         continue
11229                 fi
11230                 for size in 1 2 4 8; do
11231                         local rpc=$(echo "$stats" |
11232                                     awk '($1 == "'$size':") {print $2; exit; }')
11233                         [ $rpc != 0 ] && ((size * PAGE_SIZE < rsize)) &&
11234                                 error "Small $((size*PAGE_SIZE)) read IO $rpc!"
11235                 done
11236                 echo "$osc_rpc_stats check passed!"
11237         done
11238         cleanup_test101bc
11239         true
11240 }
11241 run_test 101c "check stripe_size aligned read-ahead"
11242
11243 test_101d() {
11244         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11245
11246         local file=$DIR/$tfile
11247         local sz_MB=${FILESIZE_101d:-80}
11248         local ra_MB=${READAHEAD_MB:-40}
11249
11250         local free_MB=$(($(df -P $DIR | tail -n 1 | awk '{ print $4 }') / 1024))
11251         [ $free_MB -lt $sz_MB ] &&
11252                 skip "Need free space ${sz_MB}M, have ${free_MB}M"
11253
11254         echo "Create test file $file size ${sz_MB}M, ${free_MB}M free"
11255         $LFS setstripe -c -1 $file || error "setstripe failed"
11256
11257         dd if=/dev/zero of=$file bs=1M count=$sz_MB || error "dd failed"
11258         echo Cancel LRU locks on lustre client to flush the client cache
11259         cancel_lru_locks osc
11260
11261         echo Disable read-ahead
11262         local old_RA=$($LCTL get_param -n llite.*.max_read_ahead_mb | head -n 1)
11263         $LCTL set_param -n llite.*.max_read_ahead_mb=0
11264         stack_trap "$LCTL set_param -n llite.*.max_read_ahead_mb=$old_RA" EXIT
11265         $LCTL get_param -n llite.*.max_read_ahead_mb
11266
11267         echo "Reading the test file $file with read-ahead disabled"
11268         local sz_KB=$((sz_MB * 1024 / 4))
11269         # 10485760 bytes transferred in 0.000938 secs (11179579337 bytes/sec)
11270         # 104857600 bytes (105 MB) copied, 0.00876352 s, 12.0 GB/s
11271         local raOFF=$(LANG=C dd if=$file of=/dev/null bs=4k count=$sz_KB |&
11272                       sed -e '/records/d' -e 's/.* \([0-9]*\.[0-9]*\) *s.*/\1/')
11273
11274         echo "Cancel LRU locks on lustre client to flush the client cache"
11275         cancel_lru_locks osc
11276         echo Enable read-ahead with ${ra_MB}MB
11277         $LCTL set_param -n llite.*.max_read_ahead_mb=$ra_MB
11278
11279         echo "Reading the test file $file with read-ahead enabled"
11280         local raON=$(LANG=C dd if=$file of=/dev/null bs=4k count=$sz_KB |&
11281                      sed -e '/records/d' -e 's/.* \([0-9]*\.[0-9]*\) *s.*/\1/')
11282
11283         echo "read-ahead disabled time read $raOFF"
11284         echo "read-ahead enabled time read $raON"
11285
11286         rm -f $file
11287         wait_delete_completed
11288
11289         # use awk for this check instead of bash because it handles decimals
11290         awk "{ exit !($raOFF < 1.0 || $raOFF > $raON) }" <<<"ignore_me" ||
11291                 error "readahead ${raON}s > no-readahead ${raOFF}s ${sz_MB}M"
11292 }
11293 run_test 101d "file read with and without read-ahead enabled"
11294
11295 test_101e() {
11296         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11297
11298         local file=$DIR/$tfile
11299         local size_KB=500  #KB
11300         local count=100
11301         local bsize=1024
11302
11303         local free_KB=$(df -P $DIR | tail -n 1 | awk '{ print $4 }')
11304         local need_KB=$((count * size_KB))
11305         [[ $free_KB -le $need_KB ]] &&
11306                 skip_env "Need free space $need_KB, have $free_KB"
11307
11308         echo "Creating $count ${size_KB}K test files"
11309         for ((i = 0; i < $count; i++)); do
11310                 dd if=/dev/zero of=$file.$i bs=$bsize count=$size_KB 2>/dev/null
11311         done
11312
11313         echo "Cancel LRU locks on lustre client to flush the client cache"
11314         cancel_lru_locks $OSC
11315
11316         echo "Reset readahead stats"
11317         $LCTL set_param -n llite.*.read_ahead_stats=0
11318
11319         for ((i = 0; i < $count; i++)); do
11320                 dd if=$file.$i of=/dev/null bs=$bsize count=$size_KB 2>/dev/null
11321         done
11322
11323         $LCTL get_param llite.*.max_cached_mb
11324         $LCTL get_param llite.*.read_ahead_stats
11325         local miss=$($LCTL get_param -n llite.*.read_ahead_stats |
11326                      get_named_value 'misses' | calc_total)
11327
11328         for ((i = 0; i < $count; i++)); do
11329                 rm -rf $file.$i 2>/dev/null
11330         done
11331
11332         #10000 means 20% reads are missing in readahead
11333         [[ $miss -lt 10000 ]] ||  error "misses too much for small reads"
11334 }
11335 run_test 101e "check read-ahead for small read(1k) for small files(500k)"
11336
11337 test_101f() {
11338         which iozone || skip_env "no iozone installed"
11339
11340         local old_debug=$($LCTL get_param debug)
11341         old_debug=${old_debug#*=}
11342         $LCTL set_param debug="reada mmap"
11343
11344         # create a test file
11345         iozone -i 0 -+n -r 1m -s 128m -w -f $DIR/$tfile > /dev/null 2>&1
11346
11347         echo Cancel LRU locks on lustre client to flush the client cache
11348         cancel_lru_locks osc
11349
11350         echo Reset readahead stats
11351         $LCTL set_param -n llite.*.read_ahead_stats=0
11352
11353         echo mmap read the file with small block size
11354         iozone -i 1 -u 1 -l 1 -+n -r 32k -s 128m -B -f $DIR/$tfile \
11355                 > /dev/null 2>&1
11356
11357         echo checking missing pages
11358         $LCTL get_param llite.*.read_ahead_stats
11359         local miss=$($LCTL get_param -n llite.*.read_ahead_stats |
11360                         get_named_value 'misses' | calc_total)
11361
11362         $LCTL set_param debug="$old_debug"
11363         [ $miss -lt 3 ] || error "misses too much pages ('$miss')!"
11364         rm -f $DIR/$tfile
11365 }
11366 run_test 101f "check mmap read performance"
11367
11368 test_101g_brw_size_test() {
11369         local mb=$1
11370         local pages=$((mb * 1048576 / PAGE_SIZE))
11371         local file=$DIR/$tfile
11372
11373         $LCTL set_param osc.*.max_pages_per_rpc=${mb}M ||
11374                 { error "unable to set max_pages_per_rpc=${mb}M"; return 1; }
11375         for mp in $($LCTL get_param -n osc.*.max_pages_per_rpc); do
11376                 [ $mp -ne $pages ] && error "max_pages_per_rpc $mp != $pages" &&
11377                         return 2
11378         done
11379
11380         stack_trap "rm -f $file" EXIT
11381         $LCTL set_param -n osc.*.rpc_stats=0
11382
11383         # 10 RPCs should be enough for the test
11384         local count=10
11385         dd if=/dev/zero of=$file bs=${mb}M count=$count ||
11386                 { error "dd write ${mb} MB blocks failed"; return 3; }
11387         cancel_lru_locks osc
11388         dd of=/dev/null if=$file bs=${mb}M count=$count ||
11389                 { error "dd write ${mb} MB blocks failed"; return 4; }
11390
11391         # calculate number of full-sized read and write RPCs
11392         rpcs=($($LCTL get_param -n 'osc.*.rpc_stats' |
11393                 sed -n '/pages per rpc/,/^$/p' |
11394                 awk '/'$pages':/ { reads += $2; writes += $6 }; \
11395                 END { print reads,writes }'))
11396         # allow one extra full-sized read RPC for async readahead
11397         [[ ${rpcs[0]} == $count || ${rpcs[0]} == $((count + 1)) ]] ||
11398                 { error "${rpcs[0]} != $count read RPCs"; return 5; }
11399         [[ ${rpcs[1]} == $count ]] ||
11400                 { error "${rpcs[1]} != $count write RPCs"; return 6; }
11401 }
11402
11403 test_101g() {
11404         remote_ost_nodsh && skip "remote OST with nodsh"
11405
11406         local rpcs
11407         local osts=$(get_facets OST)
11408         local list=$(comma_list $(osts_nodes))
11409         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
11410         local brw_size="obdfilter.*.brw_size"
11411
11412         $LFS setstripe -i 0 -c 1 $DIR/$tfile
11413
11414         local orig_mb=$(do_facet ost1 $LCTL get_param -n $brw_size | head -n 1)
11415
11416         if { [ $OST1_VERSION -ge $(version_code 2.8.52) ] ||
11417                 { [ $OST1_VERSION -ge $(version_code 2.7.17) ] &&
11418                   [ $OST1_VERSION -lt $(version_code 2.7.50) ]; }; } &&
11419            { [ $CLIENT_VERSION -ge $(version_code 2.8.52) ] ||
11420                 { [ $CLIENT_VERSION -ge $(version_code 2.7.17) ] &&
11421                   [ $CLIENT_VERSION -lt $(version_code 2.7.50) ]; }; }; then
11422
11423                 [ $OST1_VERSION -ge $(version_code 2.9.52) ] &&
11424                         suffix="M"
11425
11426                 if [[ $orig_mb -lt 16 ]]; then
11427                         save_lustre_params $osts "$brw_size" > $p
11428                         do_nodes $list $LCTL set_param -n $brw_size=16$suffix ||
11429                                 error "set 16MB RPC size failed"
11430
11431                         echo "remount client to enable new RPC size"
11432                         remount_client $MOUNT || error "remount_client failed"
11433                 fi
11434
11435                 test_101g_brw_size_test 16 || error "16MB RPC test failed"
11436                 # should be able to set brw_size=12, but no rpc_stats for that
11437                 test_101g_brw_size_test 8 || error "8MB RPC test failed"
11438         fi
11439
11440         test_101g_brw_size_test 4 || error "4MB RPC test failed"
11441
11442         if [[ $orig_mb -lt 16 ]]; then
11443                 restore_lustre_params < $p
11444                 remount_client $MOUNT || error "remount_client restore failed"
11445         fi
11446
11447         rm -f $p $DIR/$tfile
11448 }
11449 run_test 101g "Big bulk(4/16 MiB) readahead"
11450
11451 test_101h() {
11452         $LFS setstripe -i 0 -c 1 $DIR/$tfile
11453
11454         dd if=/dev/zero of=$DIR/$tfile bs=1M count=70 ||
11455                 error "dd 70M file failed"
11456         echo Cancel LRU locks on lustre client to flush the client cache
11457         cancel_lru_locks osc
11458
11459         echo "Reset readahead stats"
11460         $LCTL set_param -n llite.*.read_ahead_stats 0
11461
11462         echo "Read 10M of data but cross 64M bundary"
11463         dd if=$DIR/$tfile of=/dev/null bs=10M skip=6 count=1
11464         local miss=$($LCTL get_param -n llite.*.read_ahead_stats |
11465                      get_named_value 'misses' | calc_total)
11466         [ $miss -eq 1 ] || error "expected miss 1 but got $miss"
11467         rm -f $p $DIR/$tfile
11468 }
11469 run_test 101h "Readahead should cover current read window"
11470
11471 test_101i() {
11472         dd if=/dev/zero of=$DIR/$tfile bs=1M count=10 ||
11473                 error "dd 10M file failed"
11474
11475         local max_per_file_mb=$($LCTL get_param -n \
11476                 llite.*.max_read_ahead_per_file_mb 2>/dev/null)
11477         cancel_lru_locks osc
11478         stack_trap "$LCTL set_param llite.*.max_read_ahead_per_file_mb=$max_per_file_mb"
11479         $LCTL set_param llite.*.max_read_ahead_per_file_mb=1 ||
11480                 error "set max_read_ahead_per_file_mb to 1 failed"
11481
11482         echo "Reset readahead stats"
11483         $LCTL set_param llite.*.read_ahead_stats=0
11484
11485         dd if=$DIR/$tfile of=/dev/null bs=2M
11486
11487         $LCTL get_param llite.*.read_ahead_stats
11488         local miss=$($LCTL get_param -n llite.*.read_ahead_stats |
11489                      awk '/misses/ { print $2 }')
11490         [ $miss -eq 5 ] || error "expected misses 5 but got $miss"
11491         rm -f $DIR/$tfile
11492 }
11493 run_test 101i "allow current readahead to exceed reservation"
11494
11495 test_101j() {
11496         $LFS setstripe -i 0 -c 1 $DIR/$tfile ||
11497                 error "setstripe $DIR/$tfile failed"
11498         local file_size=$((1048576 * 16))
11499         local old_ra=$($LCTL get_param -n llite.*.max_read_ahead_mb | head -n 1)
11500         stack_trap "$LCTL set_param -n llite.*.max_read_ahead_mb $old_ra" EXIT
11501
11502         echo Disable read-ahead
11503         $LCTL set_param -n llite.*.max_read_ahead_mb=0
11504
11505         dd if=/dev/zero of=$DIR/$tfile bs=1M count=$(($file_size / 1048576))
11506         for blk in $PAGE_SIZE 1048576 $file_size; do
11507                 cancel_lru_locks osc
11508                 echo "Reset readahead stats"
11509                 $LCTL set_param -n llite.*.read_ahead_stats=0
11510                 local count=$(($file_size / $blk))
11511                 dd if=$DIR/$tfile bs=$blk count=$count of=/dev/null
11512                 local miss=$($LCTL get_param -n llite.*.read_ahead_stats |
11513                              get_named_value 'failed.to.fast.read' | calc_total)
11514                 $LCTL get_param -n llite.*.read_ahead_stats
11515                 [ $miss -eq $count ] || error "expected $count got $miss"
11516         done
11517
11518         rm -f $p $DIR/$tfile
11519 }
11520 run_test 101j "A complete read block should be submitted when no RA"
11521
11522 test_readahead_base() {
11523         local file=$DIR/$tfile
11524         local size=$1
11525         local iosz
11526         local ramax
11527         local ranum
11528
11529         $LCTL set_param -n llite.*.read_ahead_stats=0
11530         # The first page is not accounted into readahead
11531         ramax=$(((size + PAGE_SIZE - 1) / PAGE_SIZE - 1))
11532         iosz=$(((size + 1048575) / 1048576 * 1048576))
11533         echo "Test readahead: size=$size ramax=$ramx iosz=$iosz"
11534
11535         $LCTL mark  "Test readahead: size=$size ramax=$ramx iosz=$iosz"
11536         fallocate -l $size $file || error "failed to fallocate $file"
11537         cancel_lru_locks osc
11538         $MULTIOP $file or${iosz}c || error "failed to read $file"
11539         $LCTL get_param -n llite.*.read_ahead_stats
11540         ranum=$($LCTL get_param -n llite.*.read_ahead_stats |
11541                 awk '/readahead.pages/ { print $7 }' | calc_total)
11542         (( $ranum <= $ramax )) ||
11543                 error "read-ahead pages is $ranum more than $ramax"
11544         rm -rf $file || error "failed to remove $file"
11545 }
11546
11547 test_101m()
11548 {
11549         local file=$DIR/$tfile
11550         local ramax
11551         local ranum
11552         local size
11553         local iosz
11554
11555         check_set_fallocate_or_skip
11556         stack_trap "rm -f $file" EXIT
11557
11558         test_readahead_base 4096
11559
11560         # file size: 16K = 16384
11561         test_readahead_base 16384
11562         test_readahead_base 16385
11563         test_readahead_base 16383
11564
11565         # file size: 1M + 1 = 1048576 + 1
11566         test_readahead_base 1048577
11567         # file size: 1M + 16K
11568         test_readahead_base $((1048576 + 16384))
11569
11570         # file size: stripe_size * (stripe_count - 1) + 16K
11571         $LFS setstripe -c -1 $file || error "failed to setstripe $file"
11572         test_readahead_base $((1048576 * (OSTCOUNT - 1) + 16384))
11573         # file size: stripe_size * stripe_count + 16K
11574         $LFS setstripe -c -1 $file || error "failed to setstripe $file"
11575         test_readahead_base $((1048576 * OSTCOUNT + 16384))
11576         # file size: 2 * stripe_size * stripe_count + 16K
11577         $LFS setstripe -c -1 $file || error "failed to setstripe $file"
11578         test_readahead_base $((2 * 1048576 * OSTCOUNT + 16384))
11579 }
11580 run_test 101m "read ahead for small file and last stripe of the file"
11581
11582 setup_test102() {
11583         test_mkdir $DIR/$tdir
11584         chown $RUNAS_ID $DIR/$tdir
11585         STRIPE_SIZE=65536
11586         STRIPE_OFFSET=1
11587         STRIPE_COUNT=$OSTCOUNT
11588         [[ $OSTCOUNT -gt 4 ]] && STRIPE_COUNT=4
11589
11590         trap cleanup_test102 EXIT
11591         cd $DIR
11592         $1 $LFS setstripe -S $STRIPE_SIZE -i $STRIPE_OFFSET -c $STRIPE_COUNT $tdir
11593         cd $DIR/$tdir
11594         for num in 1 2 3 4; do
11595                 for count in $(seq 1 $STRIPE_COUNT); do
11596                         for idx in $(seq 0 $[$STRIPE_COUNT - 1]); do
11597                                 local size=`expr $STRIPE_SIZE \* $num`
11598                                 local file=file"$num-$idx-$count"
11599                                 $1 $LFS setstripe -S $size -i $idx -c $count $file
11600                         done
11601                 done
11602         done
11603
11604         cd $DIR
11605         $1 tar cf $TMP/f102.tar $tdir --xattrs
11606 }
11607
11608 cleanup_test102() {
11609         trap 0
11610         rm -f $TMP/f102.tar
11611         rm -rf $DIR/d0.sanity/d102
11612 }
11613
11614 test_102a() {
11615         [ "$UID" != 0 ] && skip "must run as root"
11616         [ -z "$(lctl get_param -n mdc.*-mdc-*.connect_flags | grep xattr)" ] &&
11617                 skip_env "must have user_xattr"
11618
11619         [ -z "$(which setfattr 2>/dev/null)" ] &&
11620                 skip_env "could not find setfattr"
11621
11622         local testfile=$DIR/$tfile
11623
11624         touch $testfile
11625         echo "set/get xattr..."
11626         setfattr -n trusted.name1 -v value1 $testfile ||
11627                 error "setfattr -n trusted.name1=value1 $testfile failed"
11628         getfattr -n trusted.name1 $testfile 2> /dev/null |
11629           grep "trusted.name1=.value1" ||
11630                 error "$testfile missing trusted.name1=value1"
11631
11632         setfattr -n user.author1 -v author1 $testfile ||
11633                 error "setfattr -n user.author1=author1 $testfile failed"
11634         getfattr -n user.author1 $testfile 2> /dev/null |
11635           grep "user.author1=.author1" ||
11636                 error "$testfile missing trusted.author1=author1"
11637
11638         echo "listxattr..."
11639         setfattr -n trusted.name2 -v value2 $testfile ||
11640                 error "$testfile unable to set trusted.name2"
11641         setfattr -n trusted.name3 -v value3 $testfile ||
11642                 error "$testfile unable to set trusted.name3"
11643         [ $(getfattr -d -m "^trusted" $testfile 2> /dev/null |
11644             grep "trusted.name" | wc -l) -eq 3 ] ||
11645                 error "$testfile missing 3 trusted.name xattrs"
11646
11647         setfattr -n user.author2 -v author2 $testfile ||
11648                 error "$testfile unable to set user.author2"
11649         setfattr -n user.author3 -v author3 $testfile ||
11650                 error "$testfile unable to set user.author3"
11651         [ $(getfattr -d -m "^user" $testfile 2> /dev/null |
11652             grep "user.author" | wc -l) -eq 3 ] ||
11653                 error "$testfile missing 3 user.author xattrs"
11654
11655         echo "remove xattr..."
11656         setfattr -x trusted.name1 $testfile ||
11657                 error "$testfile error deleting trusted.name1"
11658         getfattr -d -m trusted $testfile 2> /dev/null | grep "trusted.name1" &&
11659                 error "$testfile did not delete trusted.name1 xattr"
11660
11661         setfattr -x user.author1 $testfile ||
11662                 error "$testfile error deleting user.author1"
11663         echo "set lustre special xattr ..."
11664         $LFS setstripe -c1 $testfile
11665         local lovea=$(getfattr -n "trusted.lov" -e hex $testfile |
11666                 awk -F "=" '/trusted.lov/ { print $2 }' )
11667         setfattr -n "trusted.lov" -v $lovea $testfile ||
11668                 error "$testfile doesn't ignore setting trusted.lov again"
11669         setfattr -n "trusted.lov" -v "invalid_value" $testfile &&
11670                 error "$testfile allow setting invalid trusted.lov"
11671         rm -f $testfile
11672 }
11673 run_test 102a "user xattr test =================================="
11674
11675 check_102b_layout() {
11676         local layout="$*"
11677         local testfile=$DIR/$tfile
11678
11679         echo "test layout '$layout'"
11680         $LFS setstripe $layout $testfile || error "setstripe failed"
11681         $LFS getstripe -y $testfile
11682
11683         echo "get/set/list trusted.lov xattr ..." # b=10930
11684         local value=$(getfattr -n trusted.lov -e hex $testfile | grep trusted)
11685         [[ "$value" =~ "trusted.lov" ]] ||
11686                 error "can't get trusted.lov from $testfile"
11687         local stripe_count_orig=$($LFS getstripe -c $testfile) ||
11688                 error "getstripe failed"
11689
11690         $MCREATE $testfile.2 || error "mcreate $testfile.2 failed"
11691
11692         value=$(cut -d= -f2 <<<$value)
11693         # LU-13168: truncated xattr should fail if short lov_user_md header
11694         [ $CLIENT_VERSION -lt $(version_code 2.13.53) ] &&
11695                 lens="${#value}" || lens="$(seq 4 2 ${#value})"
11696         for len in $lens; do
11697                 echo "setfattr $len $testfile.2"
11698                 setfattr -n trusted.lov -v ${value:0:$len} $testfile.2 &&
11699                         [ $len -lt 66 ] && error "short xattr len=$len worked"
11700         done
11701         local stripe_size=$($LFS getstripe -S $testfile.2)
11702         local stripe_count=$($LFS getstripe -c $testfile.2)
11703         [[ $stripe_size -eq 65536 ]] ||
11704                 error "stripe size $stripe_size != 65536"
11705         [[ $stripe_count -eq $stripe_count_orig ]] ||
11706                 error "stripe count $stripe_count != $stripe_count_orig"
11707         rm $testfile $testfile.2
11708 }
11709
11710 test_102b() {
11711         [ -z "$(which setfattr 2>/dev/null)" ] &&
11712                 skip_env "could not find setfattr"
11713         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11714
11715         # check plain layout
11716         check_102b_layout -S 65536 -i 1 -c $OSTCOUNT
11717
11718         # and also check composite layout
11719         check_102b_layout -E 1M -S 65536 -i 1 -c $OSTCOUNT -Eeof -S4M
11720
11721 }
11722 run_test 102b "getfattr/setfattr for trusted.lov EAs"
11723
11724 test_102c() {
11725         [ -z "$(which setfattr 2>/dev/null)" ] &&
11726                 skip_env "could not find setfattr"
11727         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11728
11729         # b10930: get/set/list lustre.lov xattr
11730         echo "get/set/list lustre.lov xattr ..."
11731         test_mkdir $DIR/$tdir
11732         chown $RUNAS_ID $DIR/$tdir
11733         local testfile=$DIR/$tdir/$tfile
11734         $RUNAS $LFS setstripe -S 65536 -i 1 -c $OSTCOUNT $testfile ||
11735                 error "setstripe failed"
11736         local STRIPECOUNT=$($RUNAS $LFS getstripe -c $testfile) ||
11737                 error "getstripe failed"
11738         $RUNAS getfattr -d -m "^lustre" $testfile 2> /dev/null | \
11739         grep "lustre.lov" || error "can't get lustre.lov from $testfile"
11740
11741         local testfile2=${testfile}2
11742         local value=`getfattr -n lustre.lov $testfile 2> /dev/null | \
11743                      grep "lustre.lov" |sed -e 's/[^=]\+=//'  `
11744
11745         $RUNAS $MCREATE $testfile2
11746         $RUNAS setfattr -n lustre.lov -v $value $testfile2
11747         local stripe_size=$($RUNAS $LFS getstripe -S $testfile2)
11748         local stripe_count=$($RUNAS $LFS getstripe -c $testfile2)
11749         [ $stripe_size -eq 65536 ] || error "stripe size $stripe_size != 65536"
11750         [ $stripe_count -eq $STRIPECOUNT ] ||
11751                 error "stripe count $stripe_count != $STRIPECOUNT"
11752 }
11753 run_test 102c "non-root getfattr/setfattr for lustre.lov EAs ==========="
11754
11755 compare_stripe_info1() {
11756         local stripe_index_all_zero=true
11757
11758         for num in 1 2 3 4; do
11759                 for count in $(seq 1 $STRIPE_COUNT); do
11760                         for offset in $(seq 0 $[$STRIPE_COUNT - 1]); do
11761                                 local size=$((STRIPE_SIZE * num))
11762                                 local file=file"$num-$offset-$count"
11763                                 stripe_size=$($LFS getstripe -S $PWD/$file)
11764                                 [[ $stripe_size -ne $size ]] &&
11765                                     error "$file: size $stripe_size != $size"
11766                                 stripe_count=$($LFS getstripe -c $PWD/$file)
11767                                 # allow fewer stripes to be created, ORI-601
11768                                 [[ $stripe_count -lt $(((3 * count + 3) / 4)) ]] &&
11769                                     error "$file: count $stripe_count != $count"
11770                                 stripe_index=$($LFS getstripe -i $PWD/$file)
11771                                 [[ $stripe_index -ne 0 ]] &&
11772                                         stripe_index_all_zero=false
11773                         done
11774                 done
11775         done
11776         $stripe_index_all_zero &&
11777                 error "all files are being extracted starting from OST index 0"
11778         return 0
11779 }
11780
11781 have_xattrs_include() {
11782         tar --help | grep -q xattrs-include &&
11783                 echo --xattrs-include="lustre.*"
11784 }
11785
11786 test_102d() {
11787         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11788         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11789
11790         XINC=$(have_xattrs_include)
11791         setup_test102
11792         tar xf $TMP/f102.tar -C $DIR/$tdir --xattrs $XINC
11793         cd $DIR/$tdir/$tdir
11794         compare_stripe_info1
11795 }
11796 run_test 102d "tar restore stripe info from tarfile,not keep osts"
11797
11798 test_102f() {
11799         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11800         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11801
11802         XINC=$(have_xattrs_include)
11803         setup_test102
11804         test_mkdir $DIR/$tdir.restore
11805         cd $DIR
11806         tar cf - --xattrs $tdir | tar xf - \
11807                 -C $DIR/$tdir.restore --xattrs $XINC
11808         cd $DIR/$tdir.restore/$tdir
11809         compare_stripe_info1
11810 }
11811 run_test 102f "tar copy files, not keep osts"
11812
11813 grow_xattr() {
11814         [ -z "$(lctl get_param -n mdc.*.connect_flags | grep xattr)" ] &&
11815                 skip "must have user_xattr"
11816         [ -z "$(which setfattr 2>/dev/null)" ] &&
11817                 skip_env "could not find setfattr"
11818         [ -z "$(which getfattr 2>/dev/null)" ] &&
11819                 skip_env "could not find getfattr"
11820
11821         local xsize=${1:-1024}  # in bytes
11822         local file=$DIR/$tfile
11823         local value="$(generate_string $xsize)"
11824         local xbig=trusted.big
11825         local toobig=$2
11826
11827         touch $file
11828         log "save $xbig on $file"
11829         if [ -z "$toobig" ]
11830         then
11831                 setfattr -n $xbig -v $value $file ||
11832                         error "saving $xbig on $file failed"
11833         else
11834                 setfattr -n $xbig -v $value $file &&
11835                         error "saving $xbig on $file succeeded"
11836                 return 0
11837         fi
11838
11839         local orig=$(get_xattr_value $xbig $file)
11840         [[ "$orig" != "$value" ]] && error "$xbig different after saving $xbig"
11841
11842         local xsml=trusted.sml
11843         log "save $xsml on $file"
11844         setfattr -n $xsml -v val $file || error "saving $xsml on $file failed"
11845
11846         local new=$(get_xattr_value $xbig $file)
11847         [[ "$new" != "$orig" ]] && error "$xbig different after saving $xsml"
11848
11849         log "grow $xsml on $file"
11850         setfattr -n $xsml -v "$value" $file ||
11851                 error "growing $xsml on $file failed"
11852
11853         new=$(get_xattr_value $xbig $file)
11854         [[ "$new" != "$orig" ]] && error "$xbig different after growing $xsml"
11855         log "$xbig still valid after growing $xsml"
11856
11857         rm -f $file
11858 }
11859
11860 test_102h() { # bug 15777
11861         grow_xattr 1024
11862 }
11863 run_test 102h "grow xattr from inside inode to external block"
11864
11865 test_102ha() {
11866         large_xattr_enabled || skip_env "ea_inode feature disabled"
11867
11868         echo "setting xattr of max xattr size: $(max_xattr_size)"
11869         grow_xattr $(max_xattr_size)
11870
11871         echo "setting xattr of > max xattr size: $(max_xattr_size) + 10"
11872         echo "This should fail:"
11873         grow_xattr $(($(max_xattr_size) + 10)) 1
11874 }
11875 run_test 102ha "grow xattr from inside inode to external inode"
11876
11877 test_102i() { # bug 17038
11878         [ -z "$(which getfattr 2>/dev/null)" ] &&
11879                 skip "could not find getfattr"
11880
11881         touch $DIR/$tfile
11882         ln -s $DIR/$tfile $DIR/${tfile}link
11883         getfattr -n trusted.lov $DIR/$tfile ||
11884                 error "lgetxattr on $DIR/$tfile failed"
11885         getfattr -h -n trusted.lov $DIR/${tfile}link 2>&1 |
11886                 grep -i "no such attr" ||
11887                 error "error for lgetxattr on $DIR/${tfile}link is not ENODATA"
11888         rm -f $DIR/$tfile $DIR/${tfile}link
11889 }
11890 run_test 102i "lgetxattr test on symbolic link ============"
11891
11892 test_102j() {
11893         [ $PARALLEL == "yes" ] && skip "skip parallel run"
11894         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
11895
11896         XINC=$(have_xattrs_include)
11897         setup_test102 "$RUNAS"
11898         chown $RUNAS_ID $DIR/$tdir
11899         $RUNAS tar xf $TMP/f102.tar -C $DIR/$tdir --xattrs $XINC
11900         cd $DIR/$tdir/$tdir
11901         compare_stripe_info1 "$RUNAS"
11902 }
11903 run_test 102j "non-root tar restore stripe info from tarfile, not keep osts ==="
11904
11905 test_102k() {
11906         [ -z "$(which setfattr 2>/dev/null)" ] &&
11907                 skip "could not find setfattr"
11908
11909         touch $DIR/$tfile
11910         # b22187 just check that does not crash for regular file.
11911         setfattr -n trusted.lov $DIR/$tfile
11912         # b22187 'setfattr -n trusted.lov' should remove LOV EA for directories
11913         local test_kdir=$DIR/$tdir
11914         test_mkdir $test_kdir
11915         local default_size=$($LFS getstripe -S $test_kdir)
11916         local default_count=$($LFS getstripe -c $test_kdir)
11917         local default_offset=$($LFS getstripe -i $test_kdir)
11918         $LFS setstripe -S 65536 -i 0 -c $OSTCOUNT $test_kdir ||
11919                 error 'dir setstripe failed'
11920         setfattr -n trusted.lov $test_kdir
11921         local stripe_size=$($LFS getstripe -S $test_kdir)
11922         local stripe_count=$($LFS getstripe -c $test_kdir)
11923         local stripe_offset=$($LFS getstripe -i $test_kdir)
11924         [ $stripe_size -eq $default_size ] ||
11925                 error "stripe size $stripe_size != $default_size"
11926         [ $stripe_count -eq $default_count ] ||
11927                 error "stripe count $stripe_count != $default_count"
11928         [ $stripe_offset -eq $default_offset ] ||
11929                 error "stripe offset $stripe_offset != $default_offset"
11930         rm -rf $DIR/$tfile $test_kdir
11931 }
11932 run_test 102k "setfattr without parameter of value shouldn't cause a crash"
11933
11934 test_102l() {
11935         [ -z "$(which getfattr 2>/dev/null)" ] &&
11936                 skip "could not find getfattr"
11937
11938         # LU-532 trusted. xattr is invisible to non-root
11939         local testfile=$DIR/$tfile
11940
11941         touch $testfile
11942
11943         echo "listxattr as user..."
11944         chown $RUNAS_ID $testfile
11945         $RUNAS getfattr -d -m '.*' $testfile 2>&1 |
11946             grep -q "trusted" &&
11947                 error "$testfile trusted xattrs are user visible"
11948
11949         return 0;
11950 }
11951 run_test 102l "listxattr size test =================================="
11952
11953 test_102m() { # LU-3403 llite: error of listxattr when buffer is small
11954         local path=$DIR/$tfile
11955         touch $path
11956
11957         listxattr_size_check $path || error "listattr_size_check $path failed"
11958 }
11959 run_test 102m "Ensure listxattr fails on small bufffer ========"
11960
11961 cleanup_test102
11962
11963 getxattr() { # getxattr path name
11964         # Return the base64 encoding of the value of xattr name on path.
11965         local path=$1
11966         local name=$2
11967
11968         # # getfattr --absolute-names --encoding=base64 --name=trusted.lov $path
11969         # file: $path
11970         # trusted.lov=0s0AvRCwEAAAAGAAAAAAAAAAAEAAACAAAAAAAQAAEAA...AAAAAAAAA=
11971         #
11972         # We print just 0s0AvRCwEAAAAGAAAAAAAAAAAEAAACAAAAAAAQAAEAA...AAAAAAAAA=
11973
11974         getfattr --absolute-names --encoding=base64 --name=$name $path |
11975                 awk -F= -v name=$name '$1 == name {
11976                         print substr($0, index($0, "=") + 1);
11977         }'
11978 }
11979
11980 test_102n() { # LU-4101 mdt: protect internal xattrs
11981         [ -z "$(which setfattr 2>/dev/null)" ] &&
11982                 skip "could not find setfattr"
11983         if [ $MDS1_VERSION -lt $(version_code 2.5.50) ]
11984         then
11985                 skip "MDT < 2.5.50 allows setxattr on internal trusted xattrs"
11986         fi
11987
11988         local file0=$DIR/$tfile.0
11989         local file1=$DIR/$tfile.1
11990         local xattr0=$TMP/$tfile.0
11991         local xattr1=$TMP/$tfile.1
11992         local namelist="lov lma lmv link fid version som hsm"
11993         local name
11994         local value
11995
11996         rm -rf $file0 $file1 $xattr0 $xattr1
11997         touch $file0 $file1
11998
11999         # Get 'before' xattrs of $file1.
12000         getfattr --absolute-names --dump --match=- $file1 > $xattr0
12001
12002         [ $MDS1_VERSION -lt $(version_code 2.8.53) ] &&
12003                 namelist+=" lfsck_namespace"
12004         for name in $namelist; do
12005                 # Try to copy xattr from $file0 to $file1.
12006                 value=$(getxattr $file0 trusted.$name 2> /dev/null)
12007
12008                 setfattr --name=trusted.$name --value="$value" $file1 ||
12009                         error "setxattr 'trusted.$name' failed"
12010
12011                 # Try to set a garbage xattr.
12012                 value=0sVGhlIHF1aWNrIGJyb3duIGZveCBqdW1wcyBvdmVyIGl0c2VsZi4=
12013
12014                 if [[ x$name == "xlov" ]]; then
12015                         setfattr --name=trusted.lov --value="$value" $file1 &&
12016                         error "setxattr invalid 'trusted.lov' success"
12017                 else
12018                         setfattr --name=trusted.$name --value="$value" $file1 ||
12019                                 error "setxattr invalid 'trusted.$name' failed"
12020                 fi
12021
12022                 # Try to remove the xattr from $file1. We don't care if this
12023                 # appears to succeed or fail, we just don't want there to be
12024                 # any changes or crashes.
12025                 setfattr --remove=$trusted.$name $file1 2> /dev/null
12026         done
12027
12028         if [ $MDS1_VERSION -gt $(version_code 2.6.50) ]
12029         then
12030                 name="lfsck_ns"
12031                 # Try to copy xattr from $file0 to $file1.
12032                 value=$(getxattr $file0 trusted.$name 2> /dev/null)
12033
12034                 setfattr --name=trusted.$name --value="$value" $file1 ||
12035                         error "setxattr 'trusted.$name' failed"
12036
12037                 # Try to set a garbage xattr.
12038                 value=0sVGhlIHF1aWNrIGJyb3duIGZveCBqdW1wcyBvdmVyIGl0c2VsZi4=
12039
12040                 setfattr --name=trusted.$name --value="$value" $file1 ||
12041                         error "setxattr 'trusted.$name' failed"
12042
12043                 # Try to remove the xattr from $file1. We don't care if this
12044                 # appears to succeed or fail, we just don't want there to be
12045                 # any changes or crashes.
12046                 setfattr --remove=$trusted.$name $file1 2> /dev/null
12047         fi
12048
12049         # Get 'after' xattrs of file1.
12050         getfattr --absolute-names --dump --match=- $file1 > $xattr1
12051
12052         if ! diff $xattr0 $xattr1; then
12053                 error "before and after xattrs of '$file1' differ"
12054         fi
12055
12056         rm -rf $file0 $file1 $xattr0 $xattr1
12057
12058         return 0
12059 }
12060 run_test 102n "silently ignore setxattr on internal trusted xattrs"
12061
12062 test_102p() { # LU-4703 setxattr did not check ownership
12063         [ $MDS1_VERSION -lt $(version_code 2.5.56) ] &&
12064                 skip "MDS needs to be at least 2.5.56"
12065
12066         local testfile=$DIR/$tfile
12067
12068         touch $testfile
12069
12070         echo "setfacl as user..."
12071         $RUNAS setfacl -m "u:$RUNAS_ID:rwx" $testfile
12072         [ $? -ne 0 ] || error "setfacl by $RUNAS_ID was allowed on $testfile"
12073
12074         echo "setfattr as user..."
12075         setfacl -m "u:$RUNAS_ID:---" $testfile
12076         $RUNAS setfattr -x system.posix_acl_access $testfile
12077         [ $? -ne 0 ] || error "setfattr by $RUNAS_ID was allowed on $testfile"
12078 }
12079 run_test 102p "check setxattr(2) correctly fails without permission"
12080
12081 test_102q() {
12082         [ $MDS1_VERSION -lt $(version_code 2.6.92) ] &&
12083                 skip "MDS needs to be at least 2.6.92"
12084
12085         orphan_linkea_check $DIR/$tfile || error "orphan_linkea_check"
12086 }
12087 run_test 102q "flistxattr should not return trusted.link EAs for orphans"
12088
12089 test_102r() {
12090         [ $MDS1_VERSION -lt $(version_code 2.6.93) ] &&
12091                 skip "MDS needs to be at least 2.6.93"
12092
12093         touch $DIR/$tfile || error "touch"
12094         setfattr -n user.$(basename $tfile) $DIR/$tfile || error "setfattr"
12095         getfattr -n user.$(basename $tfile) $DIR/$tfile || error "getfattr"
12096         rm $DIR/$tfile || error "rm"
12097
12098         #normal directory
12099         mkdir -p $DIR/$tdir || error "mkdir"
12100         setfattr -n user.$(basename $tdir) $DIR/$tdir || error "setfattr dir"
12101         getfattr -n user.$(basename $tdir) $DIR/$tdir || error "getfattr dir"
12102         setfattr -x user.$(basename $tdir) $DIR/$tdir ||
12103                 error "$testfile error deleting user.author1"
12104         getfattr -d -m user.$(basename $tdir) 2> /dev/null |
12105                 grep "user.$(basename $tdir)" &&
12106                 error "$tdir did not delete user.$(basename $tdir)"
12107         rmdir $DIR/$tdir || error "rmdir"
12108
12109         #striped directory
12110         test_mkdir $DIR/$tdir
12111         setfattr -n user.$(basename $tdir) $DIR/$tdir || error "setfattr dir"
12112         getfattr -n user.$(basename $tdir) $DIR/$tdir || error "getfattr dir"
12113         setfattr -x user.$(basename $tdir) $DIR/$tdir ||
12114                 error "$testfile error deleting user.author1"
12115         getfattr -d -m user.$(basename $tdir) 2> /dev/null |
12116                 grep "user.$(basename $tdir)" &&
12117                 error "$tdir did not delete user.$(basename $tdir)"
12118         rmdir $DIR/$tdir || error "rm striped dir"
12119 }
12120 run_test 102r "set EAs with empty values"
12121
12122 test_102s() {
12123         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
12124                 skip "MDS needs to be at least 2.11.52"
12125
12126         local save="$TMP/$TESTSUITE-$TESTNAME.parameters"
12127
12128         save_lustre_params client "llite.*.xattr_cache" > $save
12129
12130         for cache in 0 1; do
12131                 lctl set_param llite.*.xattr_cache=$cache
12132
12133                 rm -f $DIR/$tfile
12134                 touch $DIR/$tfile || error "touch"
12135                 for prefix in lustre security system trusted user; do
12136                         # Note getxattr() may fail with 'Operation not
12137                         # supported' or 'No such attribute' depending
12138                         # on prefix and cache.
12139                         getfattr -n $prefix.n102s $DIR/$tfile &&
12140                                 error "getxattr '$prefix.n102s' should fail (cache = $cache)"
12141                 done
12142         done
12143
12144         restore_lustre_params < $save
12145 }
12146 run_test 102s "getting nonexistent xattrs should fail"
12147
12148 test_102t() {
12149         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
12150                 skip "MDS needs to be at least 2.11.52"
12151
12152         local save="$TMP/$TESTSUITE-$TESTNAME.parameters"
12153
12154         save_lustre_params client "llite.*.xattr_cache" > $save
12155
12156         for cache in 0 1; do
12157                 lctl set_param llite.*.xattr_cache=$cache
12158
12159                 for buf_size in 0 256; do
12160                         rm -f $DIR/$tfile
12161                         touch $DIR/$tfile || error "touch"
12162                         setfattr -n user.multiop $DIR/$tfile
12163                         $MULTIOP $DIR/$tfile oa$buf_size ||
12164                                 error "cannot get zero length xattr value (buf_size = $buf_size)"
12165                 done
12166         done
12167
12168         restore_lustre_params < $save
12169 }
12170 run_test 102t "zero length xattr values handled correctly"
12171
12172 run_acl_subtest()
12173 {
12174         local test=$LUSTRE/tests/acl/$1.test
12175         local tmp=$(mktemp -t $1-XXXXXX).test
12176         local bin=$2
12177         local dmn=$3
12178         local grp=$4
12179         local nbd=$5
12180         export LANG=C
12181
12182
12183         local sedusers="-e s/bin/$bin/g -e s/daemon/$dmn/g"
12184         local sedgroups="-e s/:users/:$grp/g"
12185         [[ -z "$nbd" ]] || sedusers+=" -e s/nobody/$nbd/g"
12186
12187         sed $sedusers $sedgroups < $test > $tmp
12188         stack_trap "rm -f $tmp"
12189         [[ -s $tmp ]] || error "sed failed to create test script"
12190
12191         echo "performing $1 with bin='$bin' daemon='$dmn' users='$grp'..."
12192         $LUSTRE/tests/acl/run $tmp || error "run_acl_subtest '$1' failed"
12193 }
12194
12195 test_103a() {
12196         [ "$UID" != 0 ] && skip "must run as root"
12197         $GSS && skip_env "could not run under gss"
12198         [[ "$(lctl get_param -n mdc.*-mdc-*.connect_flags)" =~ "acl" ]] ||
12199                 skip_env "must have acl enabled"
12200         which setfacl || skip_env "could not find setfacl"
12201         remote_mds_nodsh && skip "remote MDS with nodsh"
12202
12203         ACLBIN=${ACLBIN:-"bin"}
12204         ACLDMN=${ACLDMN:-"daemon"}
12205         ACLGRP=${ACLGRP:-"users"}
12206         ACLNBD=${ACLNBD:-"nobody"}
12207
12208         if ! id $ACLBIN ||
12209            [[ "$(id -u $ACLBIN)" != "$(do_facet mds1 id -u $ACLBIN)" ]]; then
12210                 echo "bad 'bin' user '$ACLBIN', using '$USER0'"
12211                 ACLBIN=$USER0
12212                 if ! id $ACLBIN ; then
12213                         cat /etc/passwd
12214                         skip_env "can't find suitable ACL 'bin' $ACLBIN"
12215                 fi
12216         fi
12217         if ! id $ACLDMN || (( $(id -u $ACLDMN) < $(id -u $ACLBIN) )) ||
12218            [[ "$(id -u $ACLDMN)" != "$(do_facet mds1 id -u $ACLDMN)" ]]; then
12219                 echo "bad 'daemon' user '$ACLDMN', using '$USER1'"
12220                 ACLDMN=$USER1
12221                 if ! id $ACLDMN ; then
12222                         cat /etc/passwd
12223                         skip_env "can't find suitable ACL 'daemon' $ACLDMN"
12224                 fi
12225         fi
12226         if ! getent group $ACLGRP; then
12227                 echo "missing 'users' group '$ACLGRP', using '$TSTUSR'"
12228                 ACLGRP="$TSTUSR"
12229                 if ! getent group $ACLGRP; then
12230                         echo "cannot find group '$ACLGRP', adding it"
12231                         cat /etc/group
12232                         add_group 60000 $ACLGRP
12233                 fi
12234         fi
12235
12236         local bingid=$(getent group $ACLBIN | cut -d: -f 3)
12237         local dmngid=$(getent group $ACLDMN | cut -d: -f 3)
12238         local grpgid=$(getent group $ACLGRP | cut -d: -f 3)
12239
12240         if (( $bingid > $grpgid || $dmngid > $grpgid )); then
12241                 echo "group '$ACLGRP' has low gid=$grpgid, use '$TSTUSR'"
12242                 ACLGRP="$TSTUSR"
12243                 if ! getent group $ACLGRP; then
12244                         echo "cannot find group '$ACLGRP', adding it"
12245                         cat /etc/group
12246                         add_group 60000 $ACLGRP
12247                 fi
12248                 grpgid=$(getent group $ACLGRP | cut -d: -f 3)
12249                 if (( $bingid > $grpgid || $dmngid > $grpgid )); then
12250                         cat /etc/group
12251                         skip_env "$ACLGRP gid=$grpgid less than $bingid|$dmngid"
12252                 fi
12253         fi
12254
12255         gpasswd -a $ACLDMN $ACLBIN ||
12256                 error "setting client group failed"             # LU-5641
12257         do_facet mds1 gpasswd -a $ACLDMN $ACLBIN ||
12258                 error "setting MDS group failed"                # LU-5641
12259
12260         declare -a identity_old
12261
12262         for num in $(seq $MDSCOUNT); do
12263                 switch_identity $num true || identity_old[$num]=$?
12264         done
12265
12266         SAVE_UMASK=$(umask)
12267         umask 0022
12268         mkdir -p $DIR/$tdir
12269         cd $DIR/$tdir
12270
12271         run_acl_subtest cp $ACLBIN $ACLDMN $ACLGRP
12272         run_acl_subtest getfacl-noacl $ACLBIN $ACLDMN $ACLGRP
12273         run_acl_subtest misc $ACLBIN $ACLDMN $ACLGRP
12274         run_acl_subtest permissions $ACLBIN $ACLDMN $ACLGRP
12275         # LU-1482 mdd: Setting xattr are properly checked with and without ACLs
12276         # CentOS7- uses nobody=99, while newer distros use nobody=65534
12277         if ! id -u $ACLNBD ||
12278            (( $(id -u nobody) != $(do_facet mds1 id -u nobody) )); then
12279                 ACLNBD="nfsnobody"
12280                 if ! id -u $ACLNBD; then
12281                         ACLNBD=""
12282                 fi
12283         fi
12284         if [[ -n "$ACLNBD" ]] && ! getent group $ACLNBD; then
12285                 add_group $(id -u $ACLNBD) $ACLNBD
12286                 if ! getent group $ACLNBD; then
12287                         ACLNBD=""
12288                 fi
12289         fi
12290         if (( $MDS1_VERSION > $(version_code 2.8.55) )) &&
12291            [[ -n "$ACLNBD" ]] && which setfattr; then
12292                 run_acl_subtest permissions_xattr \
12293                         $ACLBIN $ACLDMN $ACLGRP $ACLNBD
12294         elif [[ -z "$ACLNBD" ]]; then
12295                 echo "skip 'permission_xattr' test - missing 'nobody' user/grp"
12296         else
12297                 echo "skip 'permission_xattr' test - missing setfattr command"
12298         fi
12299         run_acl_subtest setfacl $ACLBIN $ACLDMN $ACLGRP
12300
12301         # inheritance test got from HP
12302         cp $LUSTRE/tests/acl/make-tree . || error "cannot copy make-tree"
12303         chmod +x make-tree || error "chmod +x failed"
12304         run_acl_subtest inheritance $ACLBIN $ACLDMN $ACLGRP
12305         rm -f make-tree
12306
12307         echo "LU-974 ignore umask when acl is enabled..."
12308         run_acl_subtest 974 $ACLBIN $ACLDMN $ACLGRP
12309         if [ $MDSCOUNT -ge 2 ]; then
12310                 run_acl_subtest 974_remote $ACLBIN $ACLDMN $ACLGRP
12311         fi
12312
12313         echo "LU-2561 newly created file is same size as directory..."
12314         if [ "$mds1_FSTYPE" != "zfs" ]; then
12315                 run_acl_subtest 2561 $ACLBIN $ACLDMN $ACLGRP
12316         else
12317                 run_acl_subtest 2561_zfs $ACLBIN $ACLDMN $ACLGRP
12318         fi
12319
12320         run_acl_subtest 4924 $ACLBIN $ACLDMN $ACLGRP
12321
12322         cd $SAVE_PWD
12323         umask $SAVE_UMASK
12324
12325         for num in $(seq $MDSCOUNT); do
12326                 if [ "${identity_old[$num]}" = 1 ]; then
12327                         switch_identity $num false || identity_old[$num]=$?
12328                 fi
12329         done
12330 }
12331 run_test 103a "acl test"
12332
12333 test_103b() {
12334         declare -a pids
12335         local U
12336
12337         stack_trap "rm -f $DIR/$tfile.*"
12338         for U in {0..511}; do
12339                 {
12340                 local O=$(printf "%04o" $U)
12341
12342                 umask $(printf "%04o" $((511 ^ $O)))
12343                 $LFS setstripe -c 1 $DIR/$tfile.s$O
12344                 local S=$(printf "%04o" 0$(stat -c%a $DIR/$tfile.s$O))
12345
12346                 (( $S == ($O & 0666) )) ||
12347                         error "lfs setstripe $DIR/$tfile.s$O '$S' != '$O'"
12348
12349                 $LFS setstripe -E16M -c 1 -E1G -S4M $DIR/$tfile.p$O
12350                 S=$(printf "%04o" 0$(stat -c%a $DIR/$tfile.p$O))
12351                 (( $S == ($O & 0666) )) ||
12352                         error "lfs setstripe -E $DIR/$tfile.p$O '$S' != '$O'"
12353
12354                 $LFS setstripe -N2 -c 1 $DIR/$tfile.m$O
12355                 S=$(printf "%04o" 0$(stat -c%a $DIR/$tfile.m$O))
12356                 (( $S == ($O & 0666) )) ||
12357                         error "lfs setstripe -N2 $DIR/$tfile.m$O '$S' != '$O'"
12358                 rm -f $DIR/$tfile.[smp]$0
12359                 } &
12360                 local pid=$!
12361
12362                 # limit the concurrently running threads to 64. LU-11878
12363                 local idx=$((U % 64))
12364                 [ -z "${pids[idx]}" ] || wait ${pids[idx]}
12365                 pids[idx]=$pid
12366         done
12367         wait
12368 }
12369 run_test 103b "umask lfs setstripe"
12370
12371 test_103c() {
12372         mkdir -p $DIR/$tdir
12373         cp -rp $DIR/$tdir $DIR/$tdir.bak
12374
12375         [ -n "$(getfattr -d -m. $DIR/$tdir | grep posix_acl_default)" ] &&
12376                 error "$DIR/$tdir shouldn't contain default ACL"
12377         [ -n "$(getfattr -d -m. $DIR/$tdir.bak | grep posix_acl_default)" ] &&
12378                 error "$DIR/$tdir.bak shouldn't contain default ACL"
12379         true
12380 }
12381 run_test 103c "'cp -rp' won't set empty acl"
12382
12383 test_103e() {
12384         local numacl
12385         local fileacl
12386         local saved_debug=$($LCTL get_param -n debug)
12387
12388         (( $MDS1_VERSION >= $(version_code 2.14.52) )) ||
12389                 skip "MDS needs to be at least 2.14.52"
12390
12391         large_xattr_enabled || skip_env "ea_inode feature disabled"
12392
12393         mkdir -p $DIR/$tdir
12394         # add big LOV EA to cause reply buffer overflow earlier
12395         $LFS setstripe -C 1000 $DIR/$tdir
12396         lctl set_param mdc.*-mdc*.stats=clear
12397
12398         $LCTL set_param debug=0
12399         stack_trap "$LCTL set_param debug=\"$saved_debug\"" EXIT
12400         stack_trap "$LCTL get_param mdc.*-mdc*.stats" EXIT
12401
12402         # add a large number of default ACLs (expect 8000+ for 2.13+)
12403         for U in {2..7000}; do
12404                 setfacl -d -m user:$U:rwx $DIR/$tdir ||
12405                         error "Able to add just $U default ACLs"
12406         done
12407         numacl=$(getfacl $DIR/$tdir |& grep -c "default:user")
12408         echo "$numacl default ACLs created"
12409
12410         stat $DIR/$tdir || error "Cannot stat directory"
12411         # check file creation
12412         touch $DIR/$tdir/$tfile ||
12413                 error "failed to create $tfile with $numacl default ACLs"
12414         stat $DIR/$tdir/$tfile  || error "Cannot stat file"
12415         fileacl=$(getfacl $DIR/$tdir/$tfile |& grep -c "user:")
12416         echo "$fileacl ACLs were inherited"
12417         (( $fileacl == $numacl )) ||
12418                 error "Not all default ACLs were inherited: $numacl != $fileacl"
12419         # check that new ACLs creation adds new ACLs to inherited ACLs
12420         setfacl -m user:19000:rwx $DIR/$tdir/$tfile ||
12421                 error "Cannot set new ACL"
12422         numacl=$((numacl + 1))
12423         fileacl=$(getfacl $DIR/$tdir/$tfile |& grep -c "user:")
12424         (( $fileacl == $numacl )) ||
12425                 error "failed to add new ACL: $fileacl != $numacl as expected"
12426         # adds more ACLs to a file to reach their maximum at 8000+
12427         numacl=0
12428         for U in {20000..25000}; do
12429                 setfacl -m user:$U:rwx $DIR/$tdir/$tfile || break
12430                 numacl=$((numacl + 1))
12431         done
12432         echo "Added $numacl more ACLs to the file"
12433         fileacl=$(getfacl $DIR/$tdir/$tfile |& grep -c "user:")
12434         echo "Total $fileacl ACLs in file"
12435         stat $DIR/$tdir/$tfile > /dev/null || error "Cannot stat file"
12436         rm -f $DIR/$tdir/$tfile || error "Cannot remove file"
12437         rmdir $DIR/$tdir || error "Cannot remove directory"
12438 }
12439 run_test 103e "inheritance of big amount of default ACLs"
12440
12441 test_103f() {
12442         (( $MDS1_VERSION >= $(version_code 2.14.51) )) ||
12443                 skip "MDS needs to be at least 2.14.51"
12444
12445         large_xattr_enabled || skip_env "ea_inode feature disabled"
12446
12447         # enable changelog to consume more internal MDD buffers
12448         changelog_register
12449
12450         mkdir -p $DIR/$tdir
12451         # add big LOV EA
12452         $LFS setstripe -C 1000 $DIR/$tdir
12453         setfacl -d -m user:$U:rwx $DIR/$tdir || error "Cannot add default ACLs"
12454         mkdir $DIR/$tdir/inherited || error "failed to create subdirectory"
12455         rmdir $DIR/$tdir/inherited || error "Cannot remove subdirectory"
12456         rmdir $DIR/$tdir || error "Cannot remove directory"
12457 }
12458 run_test 103f "changelog doesn't interfere with default ACLs buffers"
12459
12460 test_104a() {
12461         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12462
12463         touch $DIR/$tfile
12464         lfs df || error "lfs df failed"
12465         lfs df -ih || error "lfs df -ih failed"
12466         lfs df -h $DIR || error "lfs df -h $DIR failed"
12467         lfs df -i $DIR || error "lfs df -i $DIR failed"
12468         lfs df $DIR/$tfile || error "lfs df $DIR/$tfile failed"
12469         lfs df -ih $DIR/$tfile || error "lfs df -ih $DIR/$tfile failed"
12470
12471         local OSC=$(lctl dl | grep OST0000-osc-[^M] | awk '{ print $4 }')
12472         lctl --device %$OSC deactivate
12473         lfs df || error "lfs df with deactivated OSC failed"
12474         lctl --device %$OSC activate
12475         # wait the osc back to normal
12476         wait_osc_import_ready client ost
12477
12478         lfs df || error "lfs df with reactivated OSC failed"
12479         rm -f $DIR/$tfile
12480 }
12481 run_test 104a "lfs df [-ih] [path] test ========================="
12482
12483 test_104b() {
12484         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12485         [ $RUNAS_ID -eq $UID ] &&
12486                 skip_env "RUNAS_ID = UID = $UID -- skipping"
12487
12488         denied_cnt=$(($($RUNAS $LFS check servers 2>&1 |
12489                         grep "Permission denied" | wc -l)))
12490         if [ $denied_cnt -ne 0 ]; then
12491                 error "lfs check servers test failed"
12492         fi
12493 }
12494 run_test 104b "$RUNAS lfs check servers test ===================="
12495
12496 #
12497 # Verify $1 is within range of $2.
12498 # Success when $1 is within range. That is, when $1 is >= 2% of $2 and
12499 # $1 is <= 2% of $2. Else Fail.
12500 #
12501 value_in_range() {
12502         # Strip all units (M, G, T)
12503         actual=$(echo $1 | tr -d A-Z)
12504         expect=$(echo $2 | tr -d A-Z)
12505
12506         expect_lo=$(($expect * 98 / 100)) # 2% below
12507         expect_hi=$(($expect * 102 / 100)) # 2% above
12508
12509         # permit 2% drift above and below
12510         (( $actual >= $expect_lo && $actual <= $expect_hi ))
12511 }
12512
12513 test_104c() {
12514         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12515         [ "$ost1_FSTYPE" == "zfs" ] || skip "zfs only test"
12516
12517         local ost_param="osd-zfs.$FSNAME-OST0000."
12518         local mdt_param="osd-zfs.$FSNAME-MDT0000."
12519         local ofacets=$(get_facets OST)
12520         local mfacets=$(get_facets MDS)
12521         local saved_ost_blocks=
12522         local saved_mdt_blocks=
12523
12524         echo "Before recordsize change"
12525         lfs_df=($($LFS df -h | grep "filesystem_summary:"))
12526         df=($(df -h | grep "$MOUNT"$))
12527
12528         # For checking.
12529         echo "lfs output : ${lfs_df[*]}"
12530         echo "df  output : ${df[*]}"
12531
12532         for facet in ${ofacets//,/ }; do
12533                 if [ -z $saved_ost_blocks ]; then
12534                         saved_ost_blocks=$(do_facet $facet \
12535                                 lctl get_param -n $ost_param.blocksize)
12536                         echo "OST Blocksize: $saved_ost_blocks"
12537                 fi
12538                 ost=$(do_facet $facet lctl get_param -n $ost_param.mntdev)
12539                 do_facet $facet zfs set recordsize=32768 $ost
12540         done
12541
12542         # BS too small. Sufficient for functional testing.
12543         for facet in ${mfacets//,/ }; do
12544                 if [ -z $saved_mdt_blocks ]; then
12545                         saved_mdt_blocks=$(do_facet $facet \
12546                                 lctl get_param -n $mdt_param.blocksize)
12547                         echo "MDT Blocksize: $saved_mdt_blocks"
12548                 fi
12549                 mdt=$(do_facet $facet lctl get_param -n $mdt_param.mntdev)
12550                 do_facet $facet zfs set recordsize=32768 $mdt
12551         done
12552
12553         # Give new values chance to reflect change
12554         sleep 2
12555
12556         echo "After recordsize change"
12557         lfs_df_after=($($LFS df -h | grep "filesystem_summary:"))
12558         df_after=($(df -h | grep "$MOUNT"$))
12559
12560         # For checking.
12561         echo "lfs output : ${lfs_df_after[*]}"
12562         echo "df  output : ${df_after[*]}"
12563
12564         # Verify lfs df
12565         value_in_range ${lfs_df_after[1]%.*} ${lfs_df[1]%.*} ||
12566                 error "lfs_df bytes: ${lfs_df_after[1]%.*} != ${lfs_df[1]%.*}"
12567         value_in_range ${lfs_df_after[2]%.*} ${lfs_df[2]%.*} ||
12568                 error "lfs_df used: ${lfs_df_after[2]%.*} != ${lfs_df[2]%.*}"
12569         value_in_range ${lfs_df_after[3]%.*} ${lfs_df[3]%.*} ||
12570                 error "lfs_df avail: ${lfs_df_after[3]%.*} != ${lfs_df[3]%.*}"
12571
12572         # Verify df
12573         value_in_range ${df_after[1]%.*} ${df[1]%.*} ||
12574                 error "df bytes: ${df_after[1]%.*} != ${df[1]%.*}"
12575         value_in_range ${df_after[2]%.*} ${df[2]%.*} ||
12576                 error "df used: ${df_after[2]%.*} != ${df[2]%.*}"
12577         value_in_range ${df_after[3]%.*} ${df[3]%.*} ||
12578                 error "df avail: ${df_after[3]%.*} != ${df[3]%.*}"
12579
12580         # Restore MDT recordize back to original
12581         for facet in ${mfacets//,/ }; do
12582                 mdt=$(do_facet $facet lctl get_param -n $mdt_param.mntdev)
12583                 do_facet $facet zfs set recordsize=$saved_mdt_blocks $mdt
12584         done
12585
12586         # Restore OST recordize back to original
12587         for facet in ${ofacets//,/ }; do
12588                 ost=$(do_facet $facet lctl get_param -n $ost_param.mntdev)
12589                 do_facet $facet zfs set recordsize=$saved_ost_blocks $ost
12590         done
12591
12592         return 0
12593 }
12594 run_test 104c "Verify df vs lfs_df stays same after recordsize change"
12595
12596 test_104d() {
12597         (( $RUNAS_ID != $UID )) ||
12598                 skip_env "RUNAS_ID = UID = $UID -- skipping"
12599
12600         (( $CLIENT_VERSION >= $(version_code 2.15.51) )) ||
12601                 skip "lustre version doesn't support lctl dl with non-root"
12602
12603         # debugfs only allows root users to access files, so the
12604         # previous move of the "devices" file to debugfs broke
12605         # "lctl dl" for non-root users. The LU-9680 Netlink
12606         # interface again allows non-root users to list devices.
12607         [ "$($RUNAS $LCTL dl | wc -l)" -ge 3 ] ||
12608                 error "lctl dl doesn't work for non root"
12609
12610         ost_count="$($RUNAS $LCTL dl | grep $FSNAME-OST* | wc -l)"
12611         [ "$ost_count" -eq $OSTCOUNT ]  ||
12612                 error "lctl dl reports wrong number of OST devices"
12613
12614         mdt_count="$($RUNAS $LCTL dl | grep $FSNAME-MDT* | wc -l)"
12615         [ "$mdt_count" -eq $MDSCOUNT ]  ||
12616                 error "lctl dl reports wrong number of MDT devices"
12617 }
12618 run_test 104d "$RUNAS lctl dl test"
12619
12620 test_105a() {
12621         # doesn't work on 2.4 kernels
12622         touch $DIR/$tfile
12623         if $(flock_is_enabled); then
12624                 flocks_test 1 on -f $DIR/$tfile || error "fail flock on"
12625         else
12626                 flocks_test 1 off -f $DIR/$tfile || error "fail flock off"
12627         fi
12628         rm -f $DIR/$tfile
12629 }
12630 run_test 105a "flock when mounted without -o flock test ========"
12631
12632 test_105b() {
12633         touch $DIR/$tfile
12634         if $(flock_is_enabled); then
12635                 flocks_test 1 on -c $DIR/$tfile || error "fail flock on"
12636         else
12637                 flocks_test 1 off -c $DIR/$tfile || error "fail flock off"
12638         fi
12639         rm -f $DIR/$tfile
12640 }
12641 run_test 105b "fcntl when mounted without -o flock test ========"
12642
12643 test_105c() {
12644         touch $DIR/$tfile
12645         if $(flock_is_enabled); then
12646                 flocks_test 1 on -l $DIR/$tfile || error "fail flock on"
12647         else
12648                 flocks_test 1 off -l $DIR/$tfile || error "fail flock off"
12649         fi
12650         rm -f $DIR/$tfile
12651 }
12652 run_test 105c "lockf when mounted without -o flock test"
12653
12654 test_105d() { # bug 15924
12655         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12656
12657         test_mkdir $DIR/$tdir
12658         flock_is_enabled || skip_env "mount w/o flock enabled"
12659         #define OBD_FAIL_LDLM_CP_CB_WAIT  0x315
12660         $LCTL set_param fail_loc=0x80000315
12661         flocks_test 2 $DIR/$tdir
12662 }
12663 run_test 105d "flock race (should not freeze) ========"
12664
12665 test_105e() { # bug 22660 && 22040
12666         flock_is_enabled || skip_env "mount w/o flock enabled"
12667
12668         touch $DIR/$tfile
12669         flocks_test 3 $DIR/$tfile
12670 }
12671 run_test 105e "Two conflicting flocks from same process"
12672
12673 test_106() { #bug 10921
12674         test_mkdir $DIR/$tdir
12675         $DIR/$tdir && error "exec $DIR/$tdir succeeded"
12676         chmod 777 $DIR/$tdir || error "chmod $DIR/$tdir failed"
12677 }
12678 run_test 106 "attempt exec of dir followed by chown of that dir"
12679
12680 test_107() {
12681         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12682
12683         CDIR=`pwd`
12684         local file=core
12685
12686         cd $DIR
12687         rm -f $file
12688
12689         local save_pattern=$(sysctl -n kernel.core_pattern)
12690         local save_uses_pid=$(sysctl -n kernel.core_uses_pid)
12691         sysctl -w kernel.core_pattern=$file
12692         sysctl -w kernel.core_uses_pid=0
12693
12694         ulimit -c unlimited
12695         sleep 60 &
12696         SLEEPPID=$!
12697
12698         sleep 1
12699
12700         kill -s 11 $SLEEPPID
12701         wait $SLEEPPID
12702         if [ -e $file ]; then
12703                 size=`stat -c%s $file`
12704                 [ $size -eq 0 ] && error "Fail to create core file $file"
12705         else
12706                 error "Fail to create core file $file"
12707         fi
12708         rm -f $file
12709         sysctl -w kernel.core_pattern=$save_pattern
12710         sysctl -w kernel.core_uses_pid=$save_uses_pid
12711         cd $CDIR
12712 }
12713 run_test 107 "Coredump on SIG"
12714
12715 test_110() {
12716         test_mkdir $DIR/$tdir
12717         test_mkdir $DIR/$tdir/$(str_repeat 'a' 255)
12718         $LFS mkdir -c $MDSCOUNT $DIR/$tdir/$(str_repeat 'b' 256) &&
12719                 error "mkdir with 256 char should fail, but did not"
12720         touch $DIR/$tdir/$(str_repeat 'x' 255) ||
12721                 error "create with 255 char failed"
12722         touch $DIR/$tdir/$(str_repeat 'y' 256) &&
12723                 error "create with 256 char should fail, but did not"
12724
12725         ls -l $DIR/$tdir
12726         rm -rf $DIR/$tdir
12727 }
12728 run_test 110 "filename length checking"
12729
12730 test_116a() { # was previously test_116()
12731         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12732         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
12733         remote_mds_nodsh && skip "remote MDS with nodsh"
12734
12735         echo -n "Free space priority "
12736         do_facet $SINGLEMDS lctl get_param -n lo[vd].*-mdtlov.qos_prio_free |
12737                 head -n1
12738         declare -a AVAIL
12739         free_min_max
12740
12741         [ $MINV -eq 0 ] && skip "no free space in OST$MINI, skip"
12742         [ $MINV -gt 10000000 ] && skip "too much free space in OST$MINI, skip"
12743         stack_trap simple_cleanup_common
12744
12745         # Check if we need to generate uneven OSTs
12746         test_mkdir -p $DIR/$tdir/OST${MINI}
12747         local FILL=$((MINV / 4))
12748         local DIFF=$((MAXV - MINV))
12749         local DIFF2=$((DIFF * 100 / MINV))
12750
12751         local threshold=$(do_facet $SINGLEMDS \
12752                 lctl get_param -n *.*MDT0000-mdtlov.qos_threshold_rr | head -n1)
12753         threshold=${threshold%%%}
12754         echo -n "Check for uneven OSTs: "
12755         echo -n "diff=${DIFF}KB (${DIFF2}%) must be > ${threshold}% ..."
12756
12757         if [[ $DIFF2 -gt $threshold ]]; then
12758                 echo "ok"
12759                 echo "Don't need to fill OST$MINI"
12760         else
12761                 # generate uneven OSTs. Write 2% over the QOS threshold value
12762                 echo "no"
12763                 DIFF=$((threshold - DIFF2 + 2))
12764                 DIFF2=$((MINV * DIFF / 100))
12765                 echo "Fill $DIFF% remaining space in OST$MINI with ${DIFF2}KB"
12766                 $LFS setstripe -i $MINI -c 1 $DIR/$tdir/OST${MINI} ||
12767                         error "setstripe failed"
12768                 DIFF=$((DIFF2 / 2048))
12769                 i=0
12770                 while [ $i -lt $DIFF ]; do
12771                         i=$((i + 1))
12772                         dd if=/dev/zero of=$DIR/$tdir/OST${MINI}/$tfile-$i \
12773                                 bs=2M count=1 2>/dev/null
12774                         echo -n .
12775                 done
12776                 echo .
12777                 sync
12778                 sleep_maxage
12779                 free_min_max
12780         fi
12781
12782         DIFF=$((MAXV - MINV))
12783         DIFF2=$((DIFF * 100 / MINV))
12784         echo -n "diff=$DIFF=$DIFF2% must be > $threshold% for QOS mode..."
12785         if [ $DIFF2 -gt $threshold ]; then
12786                 echo "ok"
12787         else
12788                 skip "QOS imbalance criteria not met"
12789         fi
12790
12791         MINI1=$MINI
12792         MINV1=$MINV
12793         MAXI1=$MAXI
12794         MAXV1=$MAXV
12795
12796         # now fill using QOS
12797         $LFS setstripe -c 1 $DIR/$tdir
12798         FILL=$((FILL / 200))
12799         if [ $FILL -gt 600 ]; then
12800                 FILL=600
12801         fi
12802         echo "writing $FILL files to QOS-assigned OSTs"
12803         i=0
12804         while [ $i -lt $FILL ]; do
12805                 i=$((i + 1))
12806                 dd if=/dev/zero of=$DIR/$tdir/$tfile-$i bs=200k \
12807                         count=1 2>/dev/null
12808                 echo -n .
12809         done
12810         echo "wrote $i 200k files"
12811         sync
12812         sleep_maxage
12813
12814         echo "Note: free space may not be updated, so measurements might be off"
12815         free_min_max
12816         DIFF2=$((MAXV - MINV))
12817         echo "free space delta: orig $DIFF final $DIFF2"
12818         [ $DIFF2 -gt $DIFF ] && echo "delta got worse!"
12819         DIFF=$((MINV1 - ${AVAIL[$MINI1]}))
12820         echo "Wrote ${DIFF}KB to smaller OST $MINI1"
12821         DIFF2=$((MAXV1 - ${AVAIL[$MAXI1]}))
12822         echo "Wrote ${DIFF2}KB to larger OST $MAXI1"
12823         if [[ $DIFF -gt 0 ]]; then
12824                 FILL=$((DIFF2 * 100 / DIFF - 100))
12825                 echo "Wrote ${FILL}% more data to larger OST $MAXI1"
12826         fi
12827
12828         # Figure out which files were written where
12829         UUID=$(lctl get_param -n lov.${FSNAME}-clilov-*.target_obd |
12830                awk '/'$MINI1': / {print $2; exit}')
12831         echo $UUID
12832         MINC=$($LFS getstripe --ost $UUID $DIR/$tdir | grep $DIR | wc -l)
12833         echo "$MINC files created on smaller OST $MINI1"
12834         UUID=$(lctl get_param -n lov.${FSNAME}-clilov-*.target_obd |
12835                awk '/'$MAXI1': / {print $2; exit}')
12836         echo $UUID
12837         MAXC=$($LFS getstripe --ost $UUID $DIR/$tdir | grep $DIR | wc -l)
12838         echo "$MAXC files created on larger OST $MAXI1"
12839         if [[ $MINC -gt 0 ]]; then
12840                 FILL=$((MAXC * 100 / MINC - 100))
12841                 echo "Wrote ${FILL}% more files to larger OST $MAXI1"
12842         fi
12843         [[ $MAXC -gt $MINC ]] ||
12844                 error_ignore LU-9 "stripe QOS didn't balance free space"
12845 }
12846 run_test 116a "stripe QOS: free space balance ==================="
12847
12848 test_116b() { # LU-2093
12849         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12850         remote_mds_nodsh && skip "remote MDS with nodsh"
12851
12852 #define OBD_FAIL_MDS_OSC_CREATE_FAIL     0x147
12853         local old_rr=$(do_facet $SINGLEMDS lctl get_param -n \
12854                        lo[vd].$FSNAME-MDT0000-mdtlov.qos_threshold_rr | head -1)
12855         [ -z "$old_rr" ] && skip "no QOS"
12856         do_facet $SINGLEMDS lctl set_param \
12857                 lo[vd].$FSNAME-MDT0000-mdtlov.qos_threshold_rr=0
12858         mkdir -p $DIR/$tdir
12859         do_facet $SINGLEMDS lctl set_param fail_loc=0x147
12860         createmany -o $DIR/$tdir/f- 20 || error "can't create"
12861         do_facet $SINGLEMDS lctl set_param fail_loc=0
12862         rm -rf $DIR/$tdir
12863         do_facet $SINGLEMDS lctl set_param \
12864                 lo[vd].$FSNAME-MDT0000-mdtlov.qos_threshold_rr=$old_rr
12865 }
12866 run_test 116b "QoS shouldn't LBUG if not enough OSTs found on the 2nd pass"
12867
12868 test_117() # bug 10891
12869 {
12870         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12871
12872         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
12873         #define OBD_FAIL_OST_SETATTR_CREDITS 0x21e
12874         lctl set_param fail_loc=0x21e
12875         > $DIR/$tfile || error "truncate failed"
12876         lctl set_param fail_loc=0
12877         echo "Truncate succeeded."
12878         rm -f $DIR/$tfile
12879 }
12880 run_test 117 "verify osd extend =========="
12881
12882 NO_SLOW_RESENDCOUNT=4
12883 export OLD_RESENDCOUNT=""
12884 set_resend_count () {
12885         local PROC_RESENDCOUNT="osc.${FSNAME}-OST*-osc-*.resend_count"
12886         OLD_RESENDCOUNT=$(lctl get_param -n $PROC_RESENDCOUNT | head -n1)
12887         lctl set_param -n $PROC_RESENDCOUNT $1
12888         echo resend_count is set to $(lctl get_param -n $PROC_RESENDCOUNT)
12889 }
12890
12891 # for reduce test_118* time (b=14842)
12892 [ "$SLOW" = "no" ] && set_resend_count $NO_SLOW_RESENDCOUNT
12893
12894 # Reset async IO behavior after error case
12895 reset_async() {
12896         FILE=$DIR/reset_async
12897
12898         # Ensure all OSCs are cleared
12899         $LFS setstripe -c -1 $FILE
12900         dd if=/dev/zero of=$FILE bs=64k count=$OSTCOUNT
12901         sync
12902         rm $FILE
12903 }
12904
12905 test_118a() #bug 11710
12906 {
12907         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12908
12909         reset_async
12910
12911         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
12912         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
12913         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache | grep -c writeback)
12914
12915         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
12916                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
12917                 return 1;
12918         fi
12919         rm -f $DIR/$tfile
12920 }
12921 run_test 118a "verify O_SYNC works =========="
12922
12923 test_118b()
12924 {
12925         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12926         remote_ost_nodsh && skip "remote OST with nodsh"
12927
12928         reset_async
12929
12930         #define OBD_FAIL_SRV_ENOENT 0x217
12931         set_nodes_failloc "$(osts_nodes)" 0x217
12932         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
12933         RC=$?
12934         set_nodes_failloc "$(osts_nodes)" 0
12935         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
12936         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
12937                     grep -c writeback)
12938
12939         if [[ $RC -eq 0 ]]; then
12940                 error "Must return error due to dropped pages, rc=$RC"
12941                 return 1;
12942         fi
12943
12944         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
12945                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
12946                 return 1;
12947         fi
12948
12949         echo "Dirty pages not leaked on ENOENT"
12950
12951         # Due to the above error the OSC will issue all RPCs syncronously
12952         # until a subsequent RPC completes successfully without error.
12953         $MULTIOP $DIR/$tfile Ow4096yc
12954         rm -f $DIR/$tfile
12955
12956         return 0
12957 }
12958 run_test 118b "Reclaim dirty pages on fatal error =========="
12959
12960 test_118c()
12961 {
12962         [ $PARALLEL == "yes" ] && skip "skip parallel run"
12963
12964         # for 118c, restore the original resend count, LU-1940
12965         [ "$SLOW" = "no" ] && [ -n "$OLD_RESENDCOUNT" ] &&
12966                                 set_resend_count $OLD_RESENDCOUNT
12967         remote_ost_nodsh && skip "remote OST with nodsh"
12968
12969         reset_async
12970
12971         #define OBD_FAIL_OST_EROFS               0x216
12972         set_nodes_failloc "$(osts_nodes)" 0x216
12973
12974         # multiop should block due to fsync until pages are written
12975         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c &
12976         MULTIPID=$!
12977         sleep 1
12978
12979         if [[ `ps h -o comm -p $MULTIPID` != "multiop" ]]; then
12980                 error "Multiop failed to block on fsync, pid=$MULTIPID"
12981         fi
12982
12983         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
12984                     grep -c writeback)
12985         if [[ $WRITEBACK -eq 0 ]]; then
12986                 error "No page in writeback, writeback=$WRITEBACK"
12987         fi
12988
12989         set_nodes_failloc "$(osts_nodes)" 0
12990         wait $MULTIPID
12991         RC=$?
12992         if [[ $RC -ne 0 ]]; then
12993                 error "Multiop fsync failed, rc=$RC"
12994         fi
12995
12996         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
12997         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
12998                     grep -c writeback)
12999         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13000                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13001         fi
13002
13003         rm -f $DIR/$tfile
13004         echo "Dirty pages flushed via fsync on EROFS"
13005         return 0
13006 }
13007 run_test 118c "Fsync blocks on EROFS until dirty pages are flushed =========="
13008
13009 # continue to use small resend count to reduce test_118* time (b=14842)
13010 [ "$SLOW" = "no" ] && set_resend_count $NO_SLOW_RESENDCOUNT
13011
13012 test_118d()
13013 {
13014         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13015         remote_ost_nodsh && skip "remote OST with nodsh"
13016
13017         reset_async
13018
13019         #define OBD_FAIL_OST_BRW_PAUSE_BULK
13020         set_nodes_failloc "$(osts_nodes)" 0x214
13021         # multiop should block due to fsync until pages are written
13022         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c &
13023         MULTIPID=$!
13024         sleep 1
13025
13026         if [[ `ps h -o comm -p $MULTIPID` != "multiop" ]]; then
13027                 error "Multiop failed to block on fsync, pid=$MULTIPID"
13028         fi
13029
13030         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13031                     grep -c writeback)
13032         if [[ $WRITEBACK -eq 0 ]]; then
13033                 error "No page in writeback, writeback=$WRITEBACK"
13034         fi
13035
13036         wait $MULTIPID || error "Multiop fsync failed, rc=$?"
13037         set_nodes_failloc "$(osts_nodes)" 0
13038
13039         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13040         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13041                     grep -c writeback)
13042         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13043                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13044         fi
13045
13046         rm -f $DIR/$tfile
13047         echo "Dirty pages gaurenteed flushed via fsync"
13048         return 0
13049 }
13050 run_test 118d "Fsync validation inject a delay of the bulk =========="
13051
13052 test_118f() {
13053         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13054
13055         reset_async
13056
13057         #define OBD_FAIL_OSC_BRW_PREP_REQ2        0x40a
13058         lctl set_param fail_loc=0x8000040a
13059
13060         # Should simulate EINVAL error which is fatal
13061         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
13062         RC=$?
13063         if [[ $RC -eq 0 ]]; then
13064                 error "Must return error due to dropped pages, rc=$RC"
13065         fi
13066
13067         lctl set_param fail_loc=0x0
13068
13069         LOCKED=$(lctl get_param -n llite.*.dump_page_cache | grep -c locked)
13070         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13071         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13072                     grep -c writeback)
13073         if [[ $LOCKED -ne 0 ]]; then
13074                 error "Locked pages remain in cache, locked=$LOCKED"
13075         fi
13076
13077         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13078                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13079         fi
13080
13081         rm -f $DIR/$tfile
13082         echo "No pages locked after fsync"
13083
13084         reset_async
13085         return 0
13086 }
13087 run_test 118f "Simulate unrecoverable OSC side error =========="
13088
13089 test_118g() {
13090         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13091
13092         reset_async
13093
13094         #define OBD_FAIL_OSC_BRW_PREP_REQ        0x406
13095         lctl set_param fail_loc=0x406
13096
13097         # simulate local -ENOMEM
13098         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
13099         RC=$?
13100
13101         lctl set_param fail_loc=0
13102         if [[ $RC -eq 0 ]]; then
13103                 error "Must return error due to dropped pages, rc=$RC"
13104         fi
13105
13106         LOCKED=$(lctl get_param -n llite.*.dump_page_cache | grep -c locked)
13107         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13108         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13109                         grep -c writeback)
13110         if [[ $LOCKED -ne 0 ]]; then
13111                 error "Locked pages remain in cache, locked=$LOCKED"
13112         fi
13113
13114         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13115                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13116         fi
13117
13118         rm -f $DIR/$tfile
13119         echo "No pages locked after fsync"
13120
13121         reset_async
13122         return 0
13123 }
13124 run_test 118g "Don't stay in wait if we got local -ENOMEM  =========="
13125
13126 test_118h() {
13127         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13128         remote_ost_nodsh && skip "remote OST with nodsh"
13129
13130         reset_async
13131
13132         #define OBD_FAIL_OST_BRW_WRITE_BULK      0x20e
13133         set_nodes_failloc "$(osts_nodes)" 0x20e
13134         # Should simulate ENOMEM error which is recoverable and should be handled by timeout
13135         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
13136         RC=$?
13137
13138         set_nodes_failloc "$(osts_nodes)" 0
13139         if [[ $RC -eq 0 ]]; then
13140                 error "Must return error due to dropped pages, rc=$RC"
13141         fi
13142
13143         LOCKED=$(lctl get_param -n llite.*.dump_page_cache | grep -c locked)
13144         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13145         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache |
13146                     grep -c writeback)
13147         if [[ $LOCKED -ne 0 ]]; then
13148                 error "Locked pages remain in cache, locked=$LOCKED"
13149         fi
13150
13151         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13152                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13153         fi
13154
13155         rm -f $DIR/$tfile
13156         echo "No pages locked after fsync"
13157
13158         return 0
13159 }
13160 run_test 118h "Verify timeout in handling recoverables errors  =========="
13161
13162 [ "$SLOW" = "no" ] && [ -n "$OLD_RESENDCOUNT" ] && set_resend_count $OLD_RESENDCOUNT
13163
13164 test_118i() {
13165         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13166         remote_ost_nodsh && skip "remote OST with nodsh"
13167
13168         reset_async
13169
13170         #define OBD_FAIL_OST_BRW_WRITE_BULK      0x20e
13171         set_nodes_failloc "$(osts_nodes)" 0x20e
13172
13173         # Should simulate ENOMEM error which is recoverable and should be handled by timeout
13174         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c &
13175         PID=$!
13176         sleep 5
13177         set_nodes_failloc "$(osts_nodes)" 0
13178
13179         wait $PID
13180         RC=$?
13181         if [[ $RC -ne 0 ]]; then
13182                 error "got error, but should be not, rc=$RC"
13183         fi
13184
13185         LOCKED=$(lctl get_param -n llite.*.dump_page_cache | grep -c locked)
13186         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13187         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache | grep -c writeback)
13188         if [[ $LOCKED -ne 0 ]]; then
13189                 error "Locked pages remain in cache, locked=$LOCKED"
13190         fi
13191
13192         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13193                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13194         fi
13195
13196         rm -f $DIR/$tfile
13197         echo "No pages locked after fsync"
13198
13199         return 0
13200 }
13201 run_test 118i "Fix error before timeout in recoverable error  =========="
13202
13203 [ "$SLOW" = "no" ] && set_resend_count 4
13204
13205 test_118j() {
13206         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13207         remote_ost_nodsh && skip "remote OST with nodsh"
13208
13209         reset_async
13210
13211         #define OBD_FAIL_OST_BRW_WRITE_BULK2     0x220
13212         set_nodes_failloc "$(osts_nodes)" 0x220
13213
13214         # return -EIO from OST
13215         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:O_SYNC:w4096c
13216         RC=$?
13217         set_nodes_failloc "$(osts_nodes)" 0x0
13218         if [[ $RC -eq 0 ]]; then
13219                 error "Must return error due to dropped pages, rc=$RC"
13220         fi
13221
13222         LOCKED=$(lctl get_param -n llite.*.dump_page_cache | grep -c locked)
13223         DIRTY=$(lctl get_param -n llite.*.dump_page_cache | grep -c dirty)
13224         WRITEBACK=$(lctl get_param -n llite.*.dump_page_cache | grep -c writeback)
13225         if [[ $LOCKED -ne 0 ]]; then
13226                 error "Locked pages remain in cache, locked=$LOCKED"
13227         fi
13228
13229         # in recoverable error on OST we want resend and stay until it finished
13230         if [[ $DIRTY -ne 0 || $WRITEBACK -ne 0 ]]; then
13231                 error "Dirty pages not flushed to disk, dirty=$DIRTY, writeback=$WRITEBACK"
13232         fi
13233
13234         rm -f $DIR/$tfile
13235         echo "No pages locked after fsync"
13236
13237         return 0
13238 }
13239 run_test 118j "Simulate unrecoverable OST side error =========="
13240
13241 test_118k()
13242 {
13243         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13244         remote_ost_nodsh && skip "remote OSTs with nodsh"
13245
13246         #define OBD_FAIL_OST_BRW_WRITE_BULK      0x20e
13247         set_nodes_failloc "$(osts_nodes)" 0x20e
13248         test_mkdir $DIR/$tdir
13249
13250         for ((i=0;i<10;i++)); do
13251                 (dd if=/dev/zero of=$DIR/$tdir/$tfile-$i bs=1M count=10 || \
13252                         error "dd to $DIR/$tdir/$tfile-$i failed" )&
13253                 SLEEPPID=$!
13254                 sleep 0.500s
13255                 kill $SLEEPPID
13256                 wait $SLEEPPID
13257         done
13258
13259         set_nodes_failloc "$(osts_nodes)" 0
13260         rm -rf $DIR/$tdir
13261 }
13262 run_test 118k "bio alloc -ENOMEM and IO TERM handling ========="
13263
13264 test_118l() # LU-646
13265 {
13266         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13267
13268         test_mkdir $DIR/$tdir
13269         $MULTIOP $DIR/$tdir Dy || error "fsync dir failed"
13270         rm -rf $DIR/$tdir
13271 }
13272 run_test 118l "fsync dir"
13273
13274 test_118m() # LU-3066
13275 {
13276         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13277
13278         test_mkdir $DIR/$tdir
13279         $MULTIOP $DIR/$tdir DY || error "fdatasync dir failed"
13280         rm -rf $DIR/$tdir
13281 }
13282 run_test 118m "fdatasync dir ========="
13283
13284 [ "$SLOW" = "no" ] && [ -n "$OLD_RESENDCOUNT" ] && set_resend_count $OLD_RESENDCOUNT
13285
13286 test_118n()
13287 {
13288         local begin
13289         local end
13290
13291         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13292         remote_ost_nodsh && skip "remote OSTs with nodsh"
13293
13294         # Sleep to avoid a cached response.
13295         #define OBD_STATFS_CACHE_SECONDS 1
13296         sleep 2
13297
13298         # Inject a 10 second delay in the OST_STATFS handler.
13299         #define OBD_FAIL_OST_STATFS_DELAY 0x242
13300         set_nodes_failloc "$(osts_nodes)" 0x242
13301
13302         begin=$SECONDS
13303         stat --file-system $MOUNT > /dev/null
13304         end=$SECONDS
13305
13306         set_nodes_failloc "$(osts_nodes)" 0
13307
13308         if ((end - begin > 20)); then
13309             error "statfs took $((end - begin)) seconds, expected 10"
13310         fi
13311 }
13312 run_test 118n "statfs() sends OST_STATFS requests in parallel"
13313
13314 test_119a() # bug 11737
13315 {
13316         BSIZE=$((512 * 1024))
13317         directio write $DIR/$tfile 0 1 $BSIZE
13318         # We ask to read two blocks, which is more than a file size.
13319         # directio will indicate an error when requested and actual
13320         # sizes aren't equeal (a normal situation in this case) and
13321         # print actual read amount.
13322         NOB=`directio read $DIR/$tfile 0 2 $BSIZE | awk '/error/ {print $6}'`
13323         if [ "$NOB" != "$BSIZE" ]; then
13324                 error "read $NOB bytes instead of $BSIZE"
13325         fi
13326         rm -f $DIR/$tfile
13327 }
13328 run_test 119a "Short directIO read must return actual read amount"
13329
13330 test_119b() # bug 11737
13331 {
13332         [[ $OSTCOUNT -lt 2 ]] && skip_env "needs >= 2 OSTs"
13333
13334         $LFS setstripe -c 2 $DIR/$tfile || error "setstripe failed"
13335         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 seek=1 || error "dd failed"
13336         sync
13337         $MULTIOP $DIR/$tfile oO_RDONLY:O_DIRECT:r$((2048 * 1024)) ||
13338                 error "direct read failed"
13339         rm -f $DIR/$tfile
13340 }
13341 run_test 119b "Sparse directIO read must return actual read amount"
13342
13343 test_119c() # bug 13099
13344 {
13345         BSIZE=1048576
13346         directio write $DIR/$tfile 3 1 $BSIZE || error "direct write failed"
13347         directio readhole $DIR/$tfile 0 2 $BSIZE || error "reading hole failed"
13348         rm -f $DIR/$tfile
13349 }
13350 run_test 119c "Testing for direct read hitting hole"
13351
13352 test_120a() {
13353         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13354         remote_mds_nodsh && skip "remote MDS with nodsh"
13355         test_mkdir -i0 -c1 $DIR/$tdir
13356         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13357                 skip_env "no early lock cancel on server"
13358
13359         lru_resize_disable mdc
13360         lru_resize_disable osc
13361         cancel_lru_locks mdc
13362         # asynchronous object destroy at MDT could cause bl ast to client
13363         cancel_lru_locks osc
13364
13365         stat $DIR/$tdir > /dev/null
13366         can1=$(do_facet mds1 \
13367                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13368                awk '/ldlm_cancel/ {print $2}')
13369         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13370                awk '/ldlm_bl_callback/ {print $2}')
13371         test_mkdir -i0 -c1 $DIR/$tdir/d1
13372         can2=$(do_facet mds1 \
13373                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13374                awk '/ldlm_cancel/ {print $2}')
13375         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13376                awk '/ldlm_bl_callback/ {print $2}')
13377         [ $can1 -eq $can2 ] || error $((can2-can1)) "cancel RPC occured."
13378         [ $blk1 -eq $blk2 ] || error $((blk2-blk1)) "blocking RPC occured."
13379         lru_resize_enable mdc
13380         lru_resize_enable osc
13381 }
13382 run_test 120a "Early Lock Cancel: mkdir test"
13383
13384 test_120b() {
13385         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13386         remote_mds_nodsh && skip "remote MDS with nodsh"
13387         test_mkdir $DIR/$tdir
13388         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13389                 skip_env "no early lock cancel on server"
13390
13391         lru_resize_disable mdc
13392         lru_resize_disable osc
13393         cancel_lru_locks mdc
13394         stat $DIR/$tdir > /dev/null
13395         can1=$(do_facet $SINGLEMDS \
13396                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13397                awk '/ldlm_cancel/ {print $2}')
13398         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13399                awk '/ldlm_bl_callback/ {print $2}')
13400         touch $DIR/$tdir/f1
13401         can2=$(do_facet $SINGLEMDS \
13402                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13403                awk '/ldlm_cancel/ {print $2}')
13404         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13405                awk '/ldlm_bl_callback/ {print $2}')
13406         [ $can1 -eq $can2 ] || error $((can2-can1)) "cancel RPC occured."
13407         [ $blk1 -eq $blk2 ] || error $((blk2-blk1)) "blocking RPC occured."
13408         lru_resize_enable mdc
13409         lru_resize_enable osc
13410 }
13411 run_test 120b "Early Lock Cancel: create test"
13412
13413 test_120c() {
13414         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13415         remote_mds_nodsh && skip "remote MDS with nodsh"
13416         test_mkdir -i0 -c1 $DIR/$tdir
13417         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13418                 skip "no early lock cancel on server"
13419
13420         lru_resize_disable mdc
13421         lru_resize_disable osc
13422         test_mkdir -i0 -c1 $DIR/$tdir/d1
13423         test_mkdir -i0 -c1 $DIR/$tdir/d2
13424         touch $DIR/$tdir/d1/f1
13425         cancel_lru_locks mdc
13426         stat $DIR/$tdir/d1 $DIR/$tdir/d2 $DIR/$tdir/d1/f1 > /dev/null
13427         can1=$(do_facet mds1 \
13428                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13429                awk '/ldlm_cancel/ {print $2}')
13430         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13431                awk '/ldlm_bl_callback/ {print $2}')
13432         ln $DIR/$tdir/d1/f1 $DIR/$tdir/d2/f2
13433         can2=$(do_facet mds1 \
13434                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13435                awk '/ldlm_cancel/ {print $2}')
13436         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13437                awk '/ldlm_bl_callback/ {print $2}')
13438         [ $can1 -eq $can2 ] || error $((can2-can1)) "cancel RPC occured."
13439         [ $blk1 -eq $blk2 ] || error $((blk2-blk1)) "blocking RPC occured."
13440         lru_resize_enable mdc
13441         lru_resize_enable osc
13442 }
13443 run_test 120c "Early Lock Cancel: link test"
13444
13445 test_120d() {
13446         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13447         remote_mds_nodsh && skip "remote MDS with nodsh"
13448         test_mkdir -i0 -c1 $DIR/$tdir
13449         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13450                 skip_env "no early lock cancel on server"
13451
13452         lru_resize_disable mdc
13453         lru_resize_disable osc
13454         touch $DIR/$tdir
13455         cancel_lru_locks mdc
13456         stat $DIR/$tdir > /dev/null
13457         can1=$(do_facet mds1 \
13458                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13459                awk '/ldlm_cancel/ {print $2}')
13460         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13461                awk '/ldlm_bl_callback/ {print $2}')
13462         chmod a+x $DIR/$tdir
13463         can2=$(do_facet mds1 \
13464                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13465                awk '/ldlm_cancel/ {print $2}')
13466         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13467                awk '/ldlm_bl_callback/ {print $2}')
13468         [ $can1 -eq $can2 ] || error $((can2-can1)) "cancel RPC occured."
13469         [ $blk1 -eq $blk2 ] || error $((blk2-blk1)) "blocking RPC occured."
13470         lru_resize_enable mdc
13471         lru_resize_enable osc
13472 }
13473 run_test 120d "Early Lock Cancel: setattr test"
13474
13475 test_120e() {
13476         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13477         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13478                 skip_env "no early lock cancel on server"
13479         remote_mds_nodsh && skip "remote MDS with nodsh"
13480
13481         local dlmtrace_set=false
13482
13483         test_mkdir -i0 -c1 $DIR/$tdir
13484         lru_resize_disable mdc
13485         lru_resize_disable osc
13486         ! $LCTL get_param debug | grep -q dlmtrace &&
13487                 $LCTL set_param debug=+dlmtrace && dlmtrace_set=true
13488         dd if=/dev/zero of=$DIR/$tdir/f1 count=1
13489         cancel_lru_locks mdc
13490         cancel_lru_locks osc
13491         dd if=$DIR/$tdir/f1 of=/dev/null
13492         stat $DIR/$tdir $DIR/$tdir/f1 > /dev/null
13493         # XXX client can not do early lock cancel of OST lock
13494         # during unlink (LU-4206), so cancel osc lock now.
13495         sleep 2
13496         cancel_lru_locks osc
13497         can1=$(do_facet mds1 \
13498                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13499                awk '/ldlm_cancel/ {print $2}')
13500         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13501                awk '/ldlm_bl_callback/ {print $2}')
13502         unlink $DIR/$tdir/f1
13503         sleep 5
13504         can2=$(do_facet mds1 \
13505                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13506                awk '/ldlm_cancel/ {print $2}')
13507         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13508                awk '/ldlm_bl_callback/ {print $2}')
13509         [ $can1 -ne $can2 ] && error "$((can2 - can1)) cancel RPC occured" &&
13510                 $LCTL dk $TMP/cancel.debug.txt
13511         [ $blk1 -ne $blk2 ] && error "$((blk2 - blk1)) blocking RPC occured" &&
13512                 $LCTL dk $TMP/blocking.debug.txt
13513         $dlmtrace_set && $LCTL set_param debug=-dlmtrace
13514         lru_resize_enable mdc
13515         lru_resize_enable osc
13516 }
13517 run_test 120e "Early Lock Cancel: unlink test"
13518
13519 test_120f() {
13520         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13521         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13522                 skip_env "no early lock cancel on server"
13523         remote_mds_nodsh && skip "remote MDS with nodsh"
13524
13525         test_mkdir -i0 -c1 $DIR/$tdir
13526         lru_resize_disable mdc
13527         lru_resize_disable osc
13528         test_mkdir -i0 -c1 $DIR/$tdir/d1
13529         test_mkdir -i0 -c1 $DIR/$tdir/d2
13530         dd if=/dev/zero of=$DIR/$tdir/d1/f1 count=1
13531         dd if=/dev/zero of=$DIR/$tdir/d2/f2 count=1
13532         cancel_lru_locks mdc
13533         cancel_lru_locks osc
13534         dd if=$DIR/$tdir/d1/f1 of=/dev/null
13535         dd if=$DIR/$tdir/d2/f2 of=/dev/null
13536         stat $DIR/$tdir/d1 $DIR/$tdir/d2 $DIR/$tdir/d1/f1 $DIR/$tdir/d2/f2 > /dev/null
13537         # XXX client can not do early lock cancel of OST lock
13538         # during rename (LU-4206), so cancel osc lock now.
13539         sleep 2
13540         cancel_lru_locks osc
13541         can1=$(do_facet mds1 \
13542                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13543                awk '/ldlm_cancel/ {print $2}')
13544         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13545                awk '/ldlm_bl_callback/ {print $2}')
13546         mrename $DIR/$tdir/d1/f1 $DIR/$tdir/d2/f2
13547         sleep 5
13548         can2=$(do_facet mds1 \
13549                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13550                awk '/ldlm_cancel/ {print $2}')
13551         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13552                awk '/ldlm_bl_callback/ {print $2}')
13553         [ $can1 -eq $can2 ] || error $((can2-can1)) "cancel RPC occured."
13554         [ $blk1 -eq $blk2 ] || error $((blk2-blk1)) "blocking RPC occured."
13555         lru_resize_enable mdc
13556         lru_resize_enable osc
13557 }
13558 run_test 120f "Early Lock Cancel: rename test"
13559
13560 test_120g() {
13561         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13562         $LCTL get_param -n mdc.*.connect_flags | grep -q early_lock_cancel ||
13563                 skip_env "no early lock cancel on server"
13564         remote_mds_nodsh && skip "remote MDS with nodsh"
13565
13566         lru_resize_disable mdc
13567         lru_resize_disable osc
13568         count=10000
13569         echo create $count files
13570         test_mkdir $DIR/$tdir
13571         cancel_lru_locks mdc
13572         cancel_lru_locks osc
13573         t0=$(date +%s)
13574
13575         can0=$(do_facet $SINGLEMDS \
13576                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13577                awk '/ldlm_cancel/ {print $2}')
13578         blk0=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13579                awk '/ldlm_bl_callback/ {print $2}')
13580         createmany -o $DIR/$tdir/f $count
13581         sync
13582         can1=$(do_facet $SINGLEMDS \
13583                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13584                awk '/ldlm_cancel/ {print $2}')
13585         blk1=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13586                awk '/ldlm_bl_callback/ {print $2}')
13587         t1=$(date +%s)
13588         echo total: $((can1-can0)) cancels, $((blk1-blk0)) blockings
13589         echo rm $count files
13590         rm -r $DIR/$tdir
13591         sync
13592         can2=$(do_facet $SINGLEMDS \
13593                "$LCTL get_param -n ldlm.services.ldlm_canceld.stats" |
13594                awk '/ldlm_cancel/ {print $2}')
13595         blk2=$($LCTL get_param -n ldlm.services.ldlm_cbd.stats |
13596                awk '/ldlm_bl_callback/ {print $2}')
13597         t2=$(date +%s)
13598         echo total: $count removes in $((t2-t1))
13599         echo total: $((can2-can1)) cancels, $((blk2-blk1)) blockings
13600         sleep 2
13601         # wait for commitment of removal
13602         lru_resize_enable mdc
13603         lru_resize_enable osc
13604 }
13605 run_test 120g "Early Lock Cancel: performance test"
13606
13607 test_121() { #bug #10589
13608         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13609
13610         rm -rf $DIR/$tfile
13611         writes=$(LANG=C dd if=/dev/zero of=$DIR/$tfile count=1 2>&1 | awk -F '+' '/out$/ {print $1}')
13612 #define OBD_FAIL_LDLM_CANCEL_RACE        0x310
13613         lctl set_param fail_loc=0x310
13614         cancel_lru_locks osc > /dev/null
13615         reads=$(LANG=C dd if=$DIR/$tfile of=/dev/null 2>&1 | awk -F '+' '/in$/ {print $1}')
13616         lctl set_param fail_loc=0
13617         [[ $reads -eq $writes ]] ||
13618                 error "read $reads blocks, must be $writes blocks"
13619 }
13620 run_test 121 "read cancel race ========="
13621
13622 test_123a_base() { # was test 123, statahead(bug 11401)
13623         local lsx="$1"
13624
13625         ost_set_temp_seq_width_all $DATA_SEQ_MAX_WIDTH
13626
13627         SLOWOK=0
13628         if ! grep -q "processor.*: 1" /proc/cpuinfo; then
13629                 log "testing UP system. Performance may be lower than expected."
13630                 SLOWOK=1
13631         fi
13632         running_in_vm && SLOWOK=1
13633
13634         $LCTL set_param mdc.*.batch_stats=0
13635
13636         rm -rf $DIR/$tdir
13637         test_mkdir $DIR/$tdir
13638         NUMFREE=$(df -i -P $DIR | tail -n 1 | awk '{ print $4 }')
13639         [[ $NUMFREE -gt 100000 ]] && NUMFREE=100000 || NUMFREE=$((NUMFREE-1000))
13640         MULT=10
13641         for ((i=100, j=0; i<=$NUMFREE; j=$i, i=$((i * MULT)) )); do
13642                 createmany -o $DIR/$tdir/$tfile $j $((i - j))
13643
13644                 max=$(lctl get_param -n llite.*.statahead_max | head -n 1)
13645                 lctl set_param -n llite.*.statahead_max 0
13646                 lctl get_param llite.*.statahead_max
13647                 cancel_lru_locks mdc
13648                 cancel_lru_locks osc
13649                 stime=$(date +%s)
13650                 time $lsx $DIR/$tdir | wc -l
13651                 etime=$(date +%s)
13652                 delta=$((etime - stime))
13653                 log "$lsx $i files without statahead: $delta sec"
13654                 lctl set_param llite.*.statahead_max=$max
13655
13656                 swrong=$(lctl get_param -n llite.*.statahead_stats |
13657                          awk '/statahead.wrong:/ { print $NF }')
13658                 lctl get_param -n llite.*.statahead_max | grep '[0-9]'
13659                 cancel_lru_locks mdc
13660                 cancel_lru_locks osc
13661                 stime=$(date +%s)
13662                 time $lsx $DIR/$tdir | wc -l
13663                 etime=$(date +%s)
13664                 delta_sa=$((etime - stime))
13665                 log "$lsx $i files with statahead: $delta_sa sec"
13666                 lctl get_param -n llite.*.statahead_stats
13667                 ewrong=$(lctl get_param -n llite.*.statahead_stats |
13668                          awk '/statahead.wrong:/ { print $NF }')
13669
13670                 [[ $swrong -lt $ewrong ]] &&
13671                         log "statahead was stopped, maybe too many locks held!"
13672                 [[ $delta -eq 0 || $delta_sa -eq 0 ]] && continue
13673
13674                 if (( $delta_sa*100 > $delta*105 && $delta_sa > $delta+2)); then
13675                         max=$(lctl get_param -n llite.*.statahead_max |
13676                                 head -n 1)
13677                         lctl set_param -n llite.*.statahead_max 0
13678                         lctl get_param llite.*.statahead_max
13679                         cancel_lru_locks mdc
13680                         cancel_lru_locks osc
13681                         stime=$(date +%s)
13682                         time $lsx $DIR/$tdir | wc -l
13683                         etime=$(date +%s)
13684                         delta=$((etime - stime))
13685                         log "$lsx $i files again without statahead: $delta sec"
13686                         lctl set_param llite.*.statahead_max=$max
13687                         if (( $delta_sa*100 > delta*105 && delta_sa > delta+2 )); then
13688                                 if [ $SLOWOK -eq 0 ]; then
13689                                         error "$lsx $i files is slower with statahead!"
13690                                 else
13691                                         log "$lsx $i files is slower with statahead!"
13692                                 fi
13693                                 break
13694                         fi
13695                 fi
13696
13697                 [ $delta -gt 20 ] && break
13698                 [ $delta -gt 8 ] && MULT=$((50 / delta))
13699                 [ "$SLOW" = "no" -a $delta -gt 5 ] && break
13700         done
13701         log "$lsx done"
13702
13703         stime=$(date +%s)
13704         rm -r $DIR/$tdir
13705         sync
13706         etime=$(date +%s)
13707         delta=$((etime - stime))
13708         log "rm -r $DIR/$tdir/: $delta seconds"
13709         log "rm done"
13710         lctl get_param -n llite.*.statahead_stats
13711         $LCTL get_param mdc.*.batch_stats
13712 }
13713
13714 test_123aa() {
13715         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13716
13717         test_123a_base "ls -l"
13718 }
13719 run_test 123aa "verify statahead work"
13720
13721 test_123ab() {
13722         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13723
13724         statx_supported || skip_env "Test must be statx() syscall supported"
13725
13726         test_123a_base "$STATX -l"
13727 }
13728 run_test 123ab "verify statahead work by using statx"
13729
13730 test_123ac() {
13731         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13732
13733         statx_supported || skip_env "Test must be statx() syscall supported"
13734
13735         local rpcs_before
13736         local rpcs_after
13737         local agl_before
13738         local agl_after
13739
13740         cancel_lru_locks $OSC
13741         rpcs_before=$(calc_stats $OSC.*$OSC*.stats ldlm_glimpse_enqueue)
13742         agl_before=$($LCTL get_param -n llite.*.statahead_stats |
13743                      awk '/agl.total:/ { print $NF }')
13744         test_123a_base "$STATX -c \"%n %i %A %h %u %g %W %X %Z\" -D"
13745         test_123a_base "$STATX --cached=always -D"
13746         agl_after=$($LCTL get_param -n llite.*.statahead_stats |
13747                     awk '/agl.total:/ { print $NF }')
13748         [ $agl_before -eq $agl_after ] ||
13749                 error "Should not trigger AGL thread - $agl_before:$agl_after"
13750         rpcs_after=$(calc_stats $OSC.*$OSC*.stats ldlm_glimpse_enqueue)
13751         [ $rpcs_after -eq $rpcs_before ] ||
13752                 error "$STATX should not send glimpse RPCs to $OSC"
13753 }
13754 run_test 123ac "verify statahead work by using statx without glimpse RPCs"
13755
13756 test_batch_statahead() {
13757         local max=$1
13758         local batch_max=$2
13759         local num=10000
13760         local batch_rpcs
13761         local unbatch_rpcs
13762         local hit_total
13763
13764         echo -e "\nbatching: statahead_max=$max statahead_batch_max=$batch_max"
13765         $LCTL set_param mdc.*.batch_stats=0
13766         $LCTL set_param llite.*.statahead_max=$max
13767         $LCTL set_param llite.*.statahead_batch_max=$batch_max
13768         # Verify that batched statahead is faster than one without statahead
13769         test_123a_base "ls -l"
13770
13771         stack_trap "rm -rf $DIR/$tdir" EXIT
13772         mkdir $DIR/$tdir || error "failed to mkdir $DIR/$tdir"
13773         createmany -o $DIR/$tdir/$tfile $num || error "failed to create files"
13774
13775         # unbatched statahead
13776         $LCTL set_param llite.*.statahead_batch_max=0
13777         $LCTL set_param llite.*.statahead_stats=clear
13778         $LCTL set_param mdc.*.stats=clear
13779         cancel_lru_locks mdc
13780         cancel_lru_locks osc
13781         time ls -l $DIR/$tdir | wc -l
13782         unbatch_rpcs=$(calc_stats mdc.*.stats ldlm_ibits_enqueue)
13783         sleep 2
13784         hit_total=$($LCTL get_param -n llite.*.statahead_stats |
13785                     awk '/hit.total:/ { print $NF }')
13786         # hit ratio should be larger than 75% (7500).
13787         (( $hit_total > 7500 )) ||
13788                 error "unbatched statahead hit count ($hit_total) is too low"
13789
13790         # batched statahead
13791         $LCTL set_param llite.*.statahead_batch_max=$batch_max
13792         $LCTL set_param llite.*.statahead_stats=clear
13793         $LCTL set_param mdc.*.batch_stats=clear
13794         $LCTL set_param mdc.*.stats=clear
13795         cancel_lru_locks mdc
13796         cancel_lru_locks osc
13797         time ls -l $DIR/$tdir | wc -l
13798         batch_rpcs=$(calc_stats mdc.*.stats mds_batch)
13799         # wait for statahead thread to quit and update statahead stats
13800         sleep 2
13801         hit_total=$($LCTL get_param -n llite.*.statahead_stats |
13802                     awk '/hit.total:/ { print $NF }')
13803         # hit ratio should be larger than 75% (7500).
13804         (( $hit_total > 7500 )) ||
13805                 error "batched statahead hit count ($hit_total) is too low"
13806
13807         echo "unbatched RPCs: $unbatch_rpcs, batched RPCs: $batch_rpcs"
13808         (( $unbatch_rpcs > $batch_rpcs )) ||
13809                 error "batched statahead does not reduce RPC count"
13810         $LCTL get_param mdc.*.batch_stats
13811 }
13812
13813 test_123ad() {
13814         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13815
13816         (( $MDS1_VERSION >= $(version_code 2.15.53) )) ||
13817                 skip "Need server version at least 2.15.53"
13818
13819         local max
13820         local batch_max
13821
13822         max=$($LCTL get_param -n llite.*.statahead_max | head -n 1)
13823         batch_max=$($LCTL get_param -n llite.*.statahead_batch_max | head -n 1)
13824
13825         stack_trap "$LCTL set_param llite.*.statahead_max=$max" EXIT
13826         stack_trap "$LCTL set_param llite.*.statahead_batch_max=$batch_max" EXIT
13827
13828         test_batch_statahead 32 32
13829         test_batch_statahead 2048 256
13830 }
13831 run_test 123ad "Verify batching statahead works correctly"
13832
13833 test_123b () { # statahead(bug 15027)
13834         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13835
13836         test_mkdir $DIR/$tdir
13837         createmany -o $DIR/$tdir/$tfile-%d 1000
13838
13839         cancel_lru_locks mdc
13840         cancel_lru_locks osc
13841
13842 #define OBD_FAIL_MDC_GETATTR_ENQUEUE     0x803
13843         lctl set_param fail_loc=0x80000803
13844         ls -lR $DIR/$tdir > /dev/null
13845         log "ls done"
13846         lctl set_param fail_loc=0x0
13847         lctl get_param -n llite.*.statahead_stats
13848         rm -r $DIR/$tdir
13849         sync
13850
13851 }
13852 run_test 123b "not panic with network error in statahead enqueue (bug 15027)"
13853
13854 test_123c() {
13855         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
13856
13857         test_mkdir -i 0 -c 1 $DIR/$tdir.0
13858         test_mkdir -i 1 -c 1 $DIR/$tdir.1
13859         touch $DIR/$tdir.1/{1..3}
13860         mv $DIR/$tdir.1/{1..3} $DIR/$tdir.0
13861
13862         remount_client $MOUNT
13863
13864         $MULTIOP $DIR/$tdir.0 Q
13865
13866         # let statahead to complete
13867         ls -l $DIR/$tdir.0 > /dev/null
13868
13869         testid=$(echo $TESTNAME | tr '_' ' ')
13870         dmesg | tac | sed "/$testid/,$ d" | grep "Can not initialize inode" &&
13871                 error "statahead warning" || true
13872 }
13873 run_test 123c "Can not initialize inode warning on DNE statahead"
13874
13875 test_123d() {
13876         local num=100
13877         local swrong
13878         local ewrong
13879
13880         test_mkdir -c -1 $DIR/$tdir || error "test_mkdir $DIR/$tdir failed"
13881         $LFS setdirstripe -D -c $MDSCOUNT $DIR/$tdir ||
13882                 error "setdirstripe $DIR/$tdir failed"
13883         createmany -d $DIR/$tdir/$tfile $num || error "createmany $num failed"
13884         remount_client $MOUNT
13885         $LCTL get_param llite.*.statahead_max
13886         $LCTL set_param llite.*.statahead_stats=0 ||
13887                 error "clear statahead_stats failed"
13888         swrong=$(lctl get_param -n llite.*.statahead_stats |
13889                  awk '/statahead.wrong:/ { print $NF }')
13890         ls -l $DIR/$tdir || error "ls -l $DIR/$tdir failed"
13891         # wait for statahead thread finished to update hit/miss stats.
13892         sleep 1
13893         $LCTL get_param -n llite.*.statahead_stats
13894         ewrong=$(lctl get_param -n llite.*.statahead_stats |
13895                  awk '/statahead.wrong:/ { print $NF }')
13896         (( $swrong == $ewrong )) ||
13897                 log "statahead was stopped, maybe too many locks held!"
13898 }
13899 run_test 123d "Statahead on striped directories works correctly"
13900
13901 test_123e() {
13902         local max
13903         local batch_max
13904         local dir=$DIR/$tdir
13905
13906         mkdir $dir || error "mkdir $dir failed"
13907         $LFS setstripe -C 32 $dir || error "setstripe $dir failed"
13908         stack_trap "rm -rf $dir"
13909
13910         touch $dir/$tfile.{0..1000} || error "touch 1000 files failed"
13911
13912         max=$($LCTL get_param -n llite.*.statahead_max | head -n 1)
13913         batch_max=$($LCTL get_param -n llite.*.statahead_batch_max | head -n 1)
13914         stack_trap "$LCTL set_param llite.*.statahead_max=$max" EXIT
13915         stack_trap "$LCTL set_param llite.*.statahead_batch_max=$batch_max" EXIT
13916
13917         $LCTL set_param llite.*.statahead_max=2048
13918         $LCTL set_param llite.*.statahead_batch_max=1024
13919
13920         ls -l $dir
13921         $LCTL get_param mdc.*.batch_stats
13922         $LCTL get_param llite.*.statahead_*
13923 }
13924 run_test 123e "statahead with large wide striping"
13925
13926 test_123f() {
13927         local max
13928         local batch_max
13929         local dir=$DIR/$tdir
13930
13931         mkdir $dir || error "mkdir $dir failed"
13932         $LFS setstripe -C 1000 $dir || error "setstripe $dir failed"
13933         stack_trap "rm -rf $dir"
13934
13935         touch $dir/$tfile.{0..200} || error "touch 200 files failed"
13936
13937         max=$($LCTL get_param -n llite.*.statahead_max | head -n 1)
13938         batch_max=$($LCTL get_param -n llite.*.statahead_batch_max | head -n 1)
13939
13940         $LCTL set_param llite.*.statahead_max=64
13941         $LCTL set_param llite.*.statahead_batch_max=64
13942
13943         ls -l $dir
13944         lctl get_param mdc.*.batch_stats
13945         lctl get_param llite.*.statahead_*
13946
13947         $LCTL set_param llite.*.statahead_max=$max
13948         $LCTL set_param llite.*.statahead_batch_max=$batch_max
13949 }
13950 run_test 123f "Retry mechanism with large wide striping files"
13951
13952 test_124a() {
13953         [ $PARALLEL == "yes" ] && skip "skip parallel run"
13954         $LCTL get_param -n mdc.*.connect_flags | grep -q lru_resize ||
13955                 skip_env "no lru resize on server"
13956
13957         local NR=2000
13958
13959         test_mkdir $DIR/$tdir
13960
13961         log "create $NR files at $DIR/$tdir"
13962         createmany -o $DIR/$tdir/f $NR ||
13963                 error "failed to create $NR files in $DIR/$tdir"
13964
13965         cancel_lru_locks mdc
13966         ls -l $DIR/$tdir > /dev/null
13967
13968         local NSDIR=""
13969         local LRU_SIZE=0
13970         for VALUE in $($LCTL get_param ldlm.namespaces.*mdc-*.lru_size); do
13971                 local PARAM=$(echo ${VALUE[0]} | cut -d "=" -f1)
13972                 LRU_SIZE=$($LCTL get_param -n $PARAM)
13973                 if [[ $LRU_SIZE -gt $(default_lru_size) ]]; then
13974                         NSDIR=$(echo $PARAM | cut -d "." -f1-3)
13975                         log "NSDIR=$NSDIR"
13976                         log "NS=$(basename $NSDIR)"
13977                         break
13978                 fi
13979         done
13980
13981         if [[ -z "$NSDIR" || $LRU_SIZE -lt $(default_lru_size) ]]; then
13982                 skip "Not enough cached locks created!"
13983         fi
13984         log "LRU=$LRU_SIZE"
13985
13986         local SLEEP=30
13987
13988         # We know that lru resize allows one client to hold $LIMIT locks
13989         # for 10h. After that locks begin to be killed by client.
13990         local MAX_HRS=10
13991         local LIMIT=$($LCTL get_param -n $NSDIR.pool.limit)
13992         log "LIMIT=$LIMIT"
13993         if [ $LIMIT -lt $LRU_SIZE ]; then
13994                 skip "Limit is too small $LIMIT"
13995         fi
13996
13997         # Make LVF so higher that sleeping for $SLEEP is enough to _start_
13998         # killing locks. Some time was spent for creating locks. This means
13999         # that up to the moment of sleep finish we must have killed some of
14000         # them (10-100 locks). This depends on how fast ther were created.
14001         # Many of them were touched in almost the same moment and thus will
14002         # be killed in groups.
14003         local LVF=$(($MAX_HRS * 60 * 60 / $SLEEP * $LIMIT / $LRU_SIZE * 100))
14004
14005         # Use $LRU_SIZE_B here to take into account real number of locks
14006         # created in the case of CMD, LRU_SIZE_B != $NR in most of cases
14007         local LRU_SIZE_B=$LRU_SIZE
14008         log "LVF=$LVF"
14009         local OLD_LVF=$($LCTL get_param -n $NSDIR.pool.lock_volume_factor)
14010         log "OLD_LVF=$OLD_LVF"
14011         $LCTL set_param -n $NSDIR.pool.lock_volume_factor $LVF
14012
14013         # Let's make sure that we really have some margin. Client checks
14014         # cached locks every 10 sec.
14015         SLEEP=$((SLEEP+20))
14016         log "Sleep ${SLEEP} sec"
14017         local SEC=0
14018         while ((SEC<$SLEEP)); do
14019                 echo -n "..."
14020                 sleep 5
14021                 SEC=$((SEC+5))
14022                 LRU_SIZE=$($LCTL get_param -n $NSDIR/lru_size)
14023                 echo -n "$LRU_SIZE"
14024         done
14025         echo ""
14026         $LCTL set_param -n $NSDIR.pool.lock_volume_factor $OLD_LVF
14027         local LRU_SIZE_A=$($LCTL get_param -n $NSDIR.lru_size)
14028
14029         [[ $LRU_SIZE_B -gt $LRU_SIZE_A ]] || {
14030                 error "No locks dropped in ${SLEEP}s. LRU size: $LRU_SIZE_A"
14031                 unlinkmany $DIR/$tdir/f $NR
14032                 return
14033         }
14034
14035         log "Dropped "$((LRU_SIZE_B-LRU_SIZE_A))" locks in ${SLEEP}s"
14036         log "unlink $NR files at $DIR/$tdir"
14037         unlinkmany $DIR/$tdir/f $NR
14038 }
14039 run_test 124a "lru resize ======================================="
14040
14041 get_max_pool_limit()
14042 {
14043         local limit=$($LCTL get_param \
14044                       -n ldlm.namespaces.*-MDT0000-mdc-*.pool.limit)
14045         local max=0
14046         for l in $limit; do
14047                 if [[ $l -gt $max ]]; then
14048                         max=$l
14049                 fi
14050         done
14051         echo $max
14052 }
14053
14054 test_124b() {
14055         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14056         $LCTL get_param -n mdc.*.connect_flags | grep -q lru_resize ||
14057                 skip_env "no lru resize on server"
14058
14059         LIMIT=$(get_max_pool_limit)
14060
14061         NR=$(($(default_lru_size)*20))
14062         if [[ $NR -gt $LIMIT ]]; then
14063                 log "Limit lock number by $LIMIT locks"
14064                 NR=$LIMIT
14065         fi
14066
14067         IFree=$(mdsrate_inodes_available)
14068         if [ $IFree -lt $NR ]; then
14069                 log "Limit lock number by $IFree inodes"
14070                 NR=$IFree
14071         fi
14072
14073         lru_resize_disable mdc
14074         test_mkdir -p $DIR/$tdir/disable_lru_resize
14075
14076         createmany -o $DIR/$tdir/disable_lru_resize/f $NR
14077         log "doing ls -la $DIR/$tdir/disable_lru_resize 3 times"
14078         cancel_lru_locks mdc
14079         stime=`date +%s`
14080         PID=""
14081         ls -la $DIR/$tdir/disable_lru_resize > /dev/null &
14082         PID="$PID $!"
14083         sleep 2
14084         ls -la $DIR/$tdir/disable_lru_resize > /dev/null &
14085         PID="$PID $!"
14086         sleep 2
14087         ls -la $DIR/$tdir/disable_lru_resize > /dev/null &
14088         PID="$PID $!"
14089         wait $PID
14090         etime=`date +%s`
14091         nolruresize_delta=$((etime-stime))
14092         log "ls -la time: $nolruresize_delta seconds"
14093         log "lru_size = $(lctl get_param -n ldlm.namespaces.*mdc*.lru_size)"
14094         unlinkmany $DIR/$tdir/disable_lru_resize/f $NR
14095
14096         lru_resize_enable mdc
14097         test_mkdir -p $DIR/$tdir/enable_lru_resize
14098
14099         createmany -o $DIR/$tdir/enable_lru_resize/f $NR
14100         log "doing ls -la $DIR/$tdir/enable_lru_resize 3 times"
14101         cancel_lru_locks mdc
14102         stime=`date +%s`
14103         PID=""
14104         ls -la $DIR/$tdir/enable_lru_resize > /dev/null &
14105         PID="$PID $!"
14106         sleep 2
14107         ls -la $DIR/$tdir/enable_lru_resize > /dev/null &
14108         PID="$PID $!"
14109         sleep 2
14110         ls -la $DIR/$tdir/enable_lru_resize > /dev/null &
14111         PID="$PID $!"
14112         wait $PID
14113         etime=`date +%s`
14114         lruresize_delta=$((etime-stime))
14115         log "ls -la time: $lruresize_delta seconds"
14116         log "lru_size = $(lctl get_param -n ldlm.namespaces.*mdc*.lru_size)"
14117
14118         if [ $lruresize_delta -gt $nolruresize_delta ]; then
14119                 log "ls -la is $(((lruresize_delta - $nolruresize_delta) * 100 / $nolruresize_delta))% slower with lru resize enabled"
14120         elif [ $nolruresize_delta -gt $lruresize_delta ]; then
14121                 log "ls -la is $(((nolruresize_delta - $lruresize_delta) * 100 / $nolruresize_delta))% faster with lru resize enabled"
14122         else
14123                 log "lru resize performs the same with no lru resize"
14124         fi
14125         unlinkmany $DIR/$tdir/enable_lru_resize/f $NR
14126 }
14127 run_test 124b "lru resize (performance test) ======================="
14128
14129 test_124c() {
14130         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14131         $LCTL get_param -n mdc.*.connect_flags | grep -q lru_resize ||
14132                 skip_env "no lru resize on server"
14133
14134         # cache ununsed locks on client
14135         local nr=100
14136         cancel_lru_locks mdc
14137         test_mkdir $DIR/$tdir
14138         createmany -o $DIR/$tdir/f $nr ||
14139                 error "failed to create $nr files in $DIR/$tdir"
14140         ls -l $DIR/$tdir > /dev/null
14141
14142         local nsdir="ldlm.namespaces.*-MDT0000-mdc-*"
14143         local unused=$($LCTL get_param -n $nsdir.lock_unused_count)
14144         local max_age=$($LCTL get_param -n $nsdir.lru_max_age)
14145         local recalc_p=$($LCTL get_param -n $nsdir.pool.recalc_period)
14146         echo "unused=$unused, max_age=$max_age, recalc_p=$recalc_p"
14147
14148         # set lru_max_age to 1 sec
14149         $LCTL set_param $nsdir.lru_max_age=1000 # milliseconds
14150         echo "sleep $((recalc_p * 2)) seconds..."
14151         sleep $((recalc_p * 2))
14152
14153         local remaining=$($LCTL get_param -n $nsdir.lock_unused_count)
14154         # restore lru_max_age
14155         $LCTL set_param -n $nsdir.lru_max_age $max_age
14156         [ $remaining -eq 0 ] || error "$remaining locks are not canceled"
14157         unlinkmany $DIR/$tdir/f $nr
14158 }
14159 run_test 124c "LRUR cancel very aged locks"
14160
14161 test_124d() {
14162         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14163         $LCTL get_param -n mdc.*.connect_flags | grep -q lru_resize ||
14164                 skip_env "no lru resize on server"
14165
14166         # cache ununsed locks on client
14167         local nr=100
14168
14169         lru_resize_disable mdc
14170         stack_trap "lru_resize_enable mdc" EXIT
14171
14172         cancel_lru_locks mdc
14173
14174         # asynchronous object destroy at MDT could cause bl ast to client
14175         test_mkdir $DIR/$tdir
14176         createmany -o $DIR/$tdir/f $nr ||
14177                 error "failed to create $nr files in $DIR/$tdir"
14178         stack_trap "unlinkmany $DIR/$tdir/f $nr" EXIT
14179
14180         ls -l $DIR/$tdir > /dev/null
14181
14182         local nsdir="ldlm.namespaces.*-MDT0000-mdc-*"
14183         local unused=$($LCTL get_param -n $nsdir.lock_unused_count)
14184         local max_age=$($LCTL get_param -n $nsdir.lru_max_age)
14185         local recalc_p=$($LCTL get_param -n $nsdir.pool.recalc_period)
14186
14187         echo "unused=$unused, max_age=$max_age, recalc_p=$recalc_p"
14188
14189         # set lru_max_age to 1 sec
14190         $LCTL set_param $nsdir.lru_max_age=1000 # milliseconds
14191         stack_trap "$LCTL set_param -n $nsdir.lru_max_age $max_age" EXIT
14192
14193         echo "sleep $((recalc_p * 2)) seconds..."
14194         sleep $((recalc_p * 2))
14195
14196         local remaining=$($LCTL get_param -n $nsdir.lock_unused_count)
14197
14198         [ $remaining -eq 0 ] || error "$remaining locks are not canceled"
14199 }
14200 run_test 124d "cancel very aged locks if lru-resize diasbaled"
14201
14202 test_125() { # 13358
14203         $LCTL get_param -n llite.*.client_type | grep -q local ||
14204                 skip "must run as local client"
14205         $LCTL get_param -n mdc.*-mdc-*.connect_flags | grep -q acl ||
14206                 skip_env "must have acl enabled"
14207         [ -z "$(which setfacl)" ] && skip_env "must have setfacl tool"
14208
14209         test_mkdir $DIR/$tdir
14210         $LFS setstripe -S 65536 -c -1 $DIR/$tdir || error "setstripe failed"
14211         setfacl -R -m u:$USER0:rwx $DIR/$tdir ||
14212                 error "setfacl $DIR/$tdir failed"
14213         ls -ld $DIR/$tdir || error "cannot access $DIR/$tdir"
14214 }
14215 run_test 125 "don't return EPROTO when a dir has a non-default striping and ACLs"
14216
14217 test_126() { # bug 12829/13455
14218         $GSS && skip_env "must run as gss disabled"
14219         $LCTL get_param -n llite.*.client_type | grep -q local ||
14220                 skip "must run as local client"
14221         [ "$UID" != 0 ] && skip "must run as root, not UID $UID"
14222
14223         $RUNAS -u 0 -g 1 touch $DIR/$tfile || error "touch failed"
14224         gid=`ls -n $DIR/$tfile | awk '{print $4}'`
14225         rm -f $DIR/$tfile
14226         [ $gid -eq "1" ] || error "gid is set to" $gid "instead of 1"
14227 }
14228 run_test 126 "check that the fsgid provided by the client is taken into account"
14229
14230 test_127a() { # bug 15521
14231         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14232         local name count samp unit min max sum sumsq
14233         local tmpfile=$TMP/$tfile.tmp
14234
14235         $LFS setstripe -i 0 -c 1 $DIR/$tfile || error "setstripe failed"
14236         echo "stats before reset"
14237         stack_trap "rm -f $tmpfile"
14238         local now=$(date +%s)
14239
14240         $LCTL get_param osc.*.stats | tee $tmpfile
14241
14242         local snapshot_time=$(awk '/snapshot_time/ { print $2; exit }' $tmpfile)
14243         local start_time=$(awk '/start_time/ { print $2; exit }' $tmpfile)
14244         local elapsed=$(awk '/elapsed_time/ { print $2; exit }' $tmpfile)
14245         local uptime=$(awk '{ print $1 }' /proc/uptime)
14246
14247         # snapshot_time should match POSIX epoch time, allow some delta for VMs
14248         (( ${snapshot_time%\.*} >= $now - 5 &&
14249            ${snapshot_time%\.*} <= $now + 5 )) ||
14250                 error "snapshot_time=$snapshot_time != now=$now"
14251         # elapsed _should_ be from mount, but at least less than uptime
14252         (( ${elapsed%\.*} < ${uptime%\.*} )) ||
14253                 error "elapsed=$elapsed > uptime=$uptime"
14254         (( ${snapshot_time%\.*} - ${start_time%\.*} >= ${elapsed%\.*} - 2 &&
14255            ${snapshot_time%\.*} - ${start_time%\.*} <= ${elapsed%\.*} + 2 )) ||
14256                 error "elapsed=$elapsed != $snapshot_time - $start_time"
14257
14258         $LCTL set_param osc.*.stats=0
14259         local reset=$(date +%s)
14260         local fsize=$((2048 * 1024))
14261
14262         dd if=/dev/zero of=$DIR/$tfile bs=$fsize count=1
14263         cancel_lru_locks osc
14264         dd if=$DIR/$tfile of=/dev/null bs=$fsize
14265
14266         now=$(date +%s)
14267         $LCTL get_param osc.*0000-osc-*.stats > $tmpfile
14268         while read name count samp unit min max sum sumsq; do
14269                 [[ "$samp" == "samples" ]] || continue
14270
14271                 echo "got name=$name count=$count unit=$unit min=$min max=$max"
14272                 [ ! $min ] && error "Missing min value for $name proc entry"
14273                 eval $name=$count || error "Wrong proc format"
14274
14275                 case $name in
14276                 read_bytes|write_bytes)
14277                         [[ "$unit" =~ "bytes" ]] ||
14278                                 error "unit is not 'bytes': $unit"
14279                         (( $min >= 4096 )) || error "min is too small: $min"
14280                         (( $min <= $fsize )) || error "min is too big: $min"
14281                         (( $max >= 4096 )) || error "max is too small: $max"
14282                         (( $max <= $fsize )) || error "max is too big: $max"
14283                         (( $sum == $fsize )) || error "sum is wrong: $sum"
14284                         (( $sumsq >= ($fsize / 4096) * (4096 * 4096) )) ||
14285                                 error "sumsquare is too small: $sumsq"
14286                         (( $sumsq <= $fsize * $fsize )) ||
14287                                 error "sumsquare is too big: $sumsq"
14288                         ;;
14289                 ost_read|ost_write)
14290                         [[ "$unit" =~ "usec" ]] ||
14291                                 error "unit is not 'usec': $unit"
14292                         ;;
14293                 *)      ;;
14294                 esac
14295         done < $tmpfile
14296
14297         #check that we actually got some stats
14298         [ "$read_bytes" ] || error "Missing read_bytes stats"
14299         [ "$write_bytes" ] || error "Missing write_bytes stats"
14300         [ "$read_bytes" != 0 ] || error "no read done"
14301         [ "$write_bytes" != 0 ] || error "no write done"
14302
14303         snapshot_time=$(awk '/snapshot_time/ { print $2; exit }' $tmpfile)
14304         start_time=$(awk '/start_time/ { print $2; exit }' $tmpfile)
14305         elapsed=$(awk '/elapsed_time/ { print $2; exit }' $tmpfile)
14306
14307         # snapshot_time should match POSIX epoch time, allow some delta for VMs
14308         (( ${snapshot_time%\.*} >= $now - 5 &&
14309            ${snapshot_time%\.*} <= $now + 5 )) ||
14310                 error "reset snapshot_time=$snapshot_time != now=$now"
14311         # elapsed should be from time of stats reset
14312         (( ${elapsed%\.*} >= $now - $reset - 2 &&
14313            ${elapsed%\.*} <= $now - $reset + 2 )) ||
14314                 error "reset elapsed=$elapsed > $now - $reset"
14315         (( ${snapshot_time%\.*} - ${start_time%\.*} >= ${elapsed%\.*} - 2 &&
14316            ${snapshot_time%\.*} - ${start_time%\.*} <= ${elapsed%\.*} + 2 )) ||
14317                 error "reset elapsed=$elapsed != $snapshot_time - $start_time"
14318 }
14319 run_test 127a "verify the client stats are sane"
14320
14321 test_127b() { # bug LU-333
14322         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14323         local name count samp unit min max sum sumsq
14324
14325         echo "stats before reset"
14326         $LCTL get_param llite.*.stats
14327         $LCTL set_param llite.*.stats=0
14328
14329         # perform 2 reads and writes so MAX is different from SUM.
14330         dd if=/dev/zero of=$DIR/$tfile bs=$PAGE_SIZE count=1
14331         dd if=/dev/zero of=$DIR/$tfile bs=$PAGE_SIZE count=1
14332         cancel_lru_locks osc
14333         dd if=$DIR/$tfile of=/dev/null bs=$PAGE_SIZE count=1
14334         dd if=$DIR/$tfile of=/dev/null bs=$PAGE_SIZE count=1
14335
14336         $LCTL get_param llite.*.stats | grep samples > $TMP/$tfile.tmp
14337         stack_trap "rm -f $TMP/$tfile.tmp"
14338         while read name count samp unit min max sum sumsq; do
14339                 echo "got name=$name count=$count unit=$unit min=$min max=$max"
14340                 eval $name=$count || error "Wrong proc format"
14341
14342                 case $name in
14343                 read_bytes|write_bytes)
14344                         [[ "$unit" =~ "bytes" ]] ||
14345                                 error "unit is not 'bytes': $unit"
14346                         (( $count == 2 )) || error "count is not 2: $count"
14347                         (( $min == $PAGE_SIZE )) ||
14348                                 error "min is not $PAGE_SIZE: $min"
14349                         (( $max == $PAGE_SIZE )) ||
14350                                 error "max is not $PAGE_SIZE: $max"
14351                         (( $sum == $PAGE_SIZE * 2 )) ||
14352                                 error "sum is not $((PAGE_SIZE * 2)): $sum"
14353                         ;;
14354                 read|write)
14355                         [[ "$unit" =~ "usec" ]] ||
14356                                 error "unit is not 'usec': $unit"
14357                         ;;
14358                 *)      ;;
14359                 esac
14360         done < $TMP/$tfile.tmp
14361
14362         #check that we actually got some stats
14363         [ "$read_bytes" ] || error "Missing read_bytes stats"
14364         [ "$write_bytes" ] || error "Missing write_bytes stats"
14365         [ "$read_bytes" != 0 ] || error "no read done"
14366         [ "$write_bytes" != 0 ] || error "no write done"
14367 }
14368 run_test 127b "verify the llite client stats are sane"
14369
14370 test_127c() { # LU-12394
14371         [ "$OSTCOUNT" -lt "2" ] && skip_env "needs >= 2 OSTs"
14372         local size
14373         local bsize
14374         local reads
14375         local writes
14376         local count
14377
14378         $LCTL set_param llite.*.extents_stats=1
14379         stack_trap "$LCTL set_param llite.*.extents_stats=0" EXIT
14380
14381         # Use two stripes so there is enough space in default config
14382         $LFS setstripe -c 2 $DIR/$tfile
14383
14384         # Extent stats start at 0-4K and go in power of two buckets
14385         # LL_HIST_START = 12 --> 2^12 = 4K
14386         # We do 3K*2^i, so 3K, 6K, 12K, 24K... hitting each bucket.
14387         # We do not do buckets larger than 64 MiB to avoid ENOSPC issues on
14388         # small configs
14389         for size in 3K 6K 12K 24K 48K 96K 192K 384K 768K 1536K 3M 6M 12M 24M 48M;
14390                 do
14391                 # Write and read, 2x each, second time at a non-zero offset
14392                 dd if=/dev/zero of=$DIR/$tfile bs=$size count=1
14393                 dd if=/dev/zero of=$DIR/$tfile bs=$size count=1 seek=10
14394                 dd if=$DIR/$tfile of=/dev/null bs=$size count=1
14395                 dd if=$DIR/$tfile of=/dev/null bs=$size count=1 seek=10
14396                 rm -f $DIR/$tfile
14397         done
14398
14399         $LCTL get_param llite.*.extents_stats
14400
14401         count=2
14402         for bsize in 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M;
14403                 do
14404                 local bucket=$($LCTL get_param -n llite.*.extents_stats |
14405                                 grep -m 1 $bsize)
14406                 reads=$(echo $bucket | awk '{print $5}')
14407                 writes=$(echo $bucket | awk '{print $9}')
14408                 [ "$reads" -eq $count ] ||
14409                         error "$reads reads in < $bsize bucket, expect $count"
14410                 [ "$writes" -eq $count ] ||
14411                         error "$writes writes in < $bsize bucket, expect $count"
14412         done
14413
14414         # Test mmap write and read
14415         $LCTL set_param llite.*.extents_stats=c
14416         size=512
14417         dd if=/dev/zero of=$DIR/$tfile bs=${size}K count=1
14418         $MULTIOP $DIR/$tfile OSMRUc || error "$MULTIOP $DIR/$tfile failed"
14419         $MULTIOP $DIR/$tfile OSMWUc || error "$MULTIOP $DIR/$tfile failed"
14420
14421         $LCTL get_param llite.*.extents_stats
14422
14423         count=$(((size*1024) / PAGE_SIZE))
14424
14425         bsize=$((2 * PAGE_SIZE / 1024))K
14426
14427         bucket=$($LCTL get_param -n llite.*.extents_stats |
14428                         grep -m 1 $bsize)
14429         reads=$(echo $bucket | awk '{print $5}')
14430         writes=$(echo $bucket | awk '{print $9}')
14431         # mmap writes fault in the page first, creating an additonal read
14432         [ "$reads" -eq $((2 * count)) ] ||
14433                 error "$reads reads in < $bsize bucket, expect $count"
14434         [ "$writes" -eq $count ] ||
14435                 error "$writes writes in < $bsize bucket, expect $count"
14436 }
14437 run_test 127c "test llite extent stats with regular & mmap i/o"
14438
14439 test_128() { # bug 15212
14440         touch $DIR/$tfile
14441         $LFS 2>&1 <<-EOF | tee $TMP/$tfile.log
14442                 find $DIR/$tfile
14443                 find $DIR/$tfile
14444         EOF
14445
14446         result=$(grep error $TMP/$tfile.log)
14447         rm -f $DIR/$tfile $TMP/$tfile.log
14448         [ -z "$result" ] ||
14449                 error "consecutive find's under interactive lfs failed"
14450 }
14451 run_test 128 "interactive lfs for 2 consecutive find's"
14452
14453 set_dir_limits () {
14454         local mntdev
14455         local canondev
14456         local node
14457
14458         local ldproc=/proc/fs/ldiskfs
14459         local facets=$(get_facets MDS)
14460
14461         for facet in ${facets//,/ }; do
14462                 canondev=$(ldiskfs_canon \
14463                            *.$(convert_facet2label $facet).mntdev $facet)
14464                 do_facet $facet "test -e $ldproc/$canondev/max_dir_size" ||
14465                         ldproc=/sys/fs/ldiskfs
14466                 do_facet $facet "echo $1 >$ldproc/$canondev/max_dir_size"
14467                 do_facet $facet "echo $2 >$ldproc/$canondev/warning_dir_size"
14468         done
14469 }
14470
14471 check_mds_dmesg() {
14472         local facets=$(get_facets MDS)
14473         for facet in ${facets//,/ }; do
14474                 do_facet $facet "dmesg | tail -3 | grep $1" && return 0
14475         done
14476         return 1
14477 }
14478
14479 test_129() {
14480         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14481         [[ $MDS1_VERSION -ge $(version_code 2.5.56) ]] ||
14482                 skip "Need MDS version with at least 2.5.56"
14483         if [ "$mds1_FSTYPE" != ldiskfs ]; then
14484                 skip_env "ldiskfs only test"
14485         fi
14486         remote_mds_nodsh && skip "remote MDS with nodsh"
14487
14488         local ENOSPC=28
14489         local has_warning=false
14490
14491         rm -rf $DIR/$tdir
14492         mkdir -p $DIR/$tdir
14493
14494         # block size of mds1
14495         local maxsize=$(($($LCTL get_param -n mdc.*MDT0000*.blocksize) * 8))
14496         set_dir_limits $maxsize $((maxsize * 6 / 8))
14497         stack_trap "set_dir_limits 0 0"
14498         stack_trap "unlinkmany $DIR/$tdir/file_base_ 2000 || true"
14499         local dirsize=$(stat -c%s "$DIR/$tdir")
14500         local nfiles=0
14501         while (( $dirsize <= $maxsize )); do
14502                 $MCREATE $DIR/$tdir/file_base_$nfiles
14503                 rc=$?
14504                 # check two errors:
14505                 # ENOSPC for ext4 max_dir_size, which has been used since
14506                 # kernel v3.6-rc1-8-gdf981d03ee, lustre v2_4_50_0-79-gaed82035c0
14507                 if (( rc == ENOSPC )); then
14508                         set_dir_limits 0 0
14509                         echo "rc=$rc returned as expected after $nfiles files"
14510
14511                         createmany -o $DIR/$tdir/file_extra_$nfiles. 5 ||
14512                                 error "create failed w/o dir size limit"
14513
14514                         # messages may be rate limited if test is run repeatedly
14515                         check_mds_dmesg '"is approaching max"' ||
14516                                 echo "warning message should be output"
14517                         check_mds_dmesg '"has reached max"' ||
14518                                 echo "reached message should be output"
14519
14520                         dirsize=$(stat -c%s "$DIR/$tdir")
14521
14522                         [[ $dirsize -ge $maxsize ]] && return 0
14523                         error "dirsize $dirsize < $maxsize after $nfiles files"
14524                 elif (( rc != 0 )); then
14525                         break
14526                 fi
14527                 nfiles=$((nfiles + 1))
14528                 dirsize=$(stat -c%s "$DIR/$tdir")
14529         done
14530
14531         error "rc=$rc, size=$dirsize/$maxsize, mdt=$MDSCOUNT, nfiles=$nfiles"
14532 }
14533 run_test 129 "test directory size limit ========================"
14534
14535 OLDIFS="$IFS"
14536 cleanup_130() {
14537         trap 0
14538         IFS="$OLDIFS"
14539         rm -f $DIR/$tfile
14540 }
14541
14542 test_130a() {
14543         local filefrag_op=$(filefrag -e 2>&1 | grep "invalid option")
14544         [[ -z "$filefrag_op" ]] || skip_env "filefrag does not support FIEMAP"
14545
14546         trap cleanup_130 EXIT RETURN
14547
14548         local fm_file=$DIR/$tfile
14549         $LFS setstripe -S 65536 -c 1 $fm_file || error "setstripe on $fm_file"
14550         dd if=/dev/zero of=$fm_file bs=65536 count=1 ||
14551                 error "dd failed for $fm_file"
14552
14553         # LU-1795: test filefrag/FIEMAP once, even if unsupported on ZFS
14554         filefrag -ves $fm_file
14555         local rc=$?
14556         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14557                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14558         (( $rc == 0 )) || error "filefrag $fm_file failed"
14559
14560         filefrag_op=$(filefrag -ve -k $fm_file |
14561                       sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
14562         local lun=$($LFS getstripe -i $fm_file)
14563
14564         local start_blk=$(echo $filefrag_op | cut -d: -f2 | cut -d. -f1)
14565         IFS=$'\n'
14566         local tot_len=0
14567         for line in $filefrag_op; do
14568                 local frag_lun=$(echo $line | cut -d: -f5)
14569                 local ext_len=$(echo $line | cut -d: -f4)
14570
14571                 if (( $frag_lun != $lun )); then
14572                         error "FIEMAP on 1-stripe file($fm_file) failed"
14573                         return
14574                 fi
14575                 (( tot_len += ext_len ))
14576         done
14577
14578         if (( lun != frag_lun || start_blk != 0 || tot_len != 64 )); then
14579                 error "FIEMAP on 1-stripe file($fm_file) failed"
14580                 return
14581         fi
14582
14583         echo "FIEMAP on single striped file succeeded"
14584 }
14585 run_test 130a "FIEMAP (1-stripe file)"
14586
14587 test_130b() {
14588         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
14589
14590         local filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
14591         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
14592         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14593                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14594
14595         trap cleanup_130 EXIT RETURN
14596
14597         local fm_file=$DIR/$tfile
14598         $LFS setstripe -S 65536 -c $OSTCOUNT $fm_file ||
14599                 error "setstripe on $fm_file"
14600
14601         dd if=/dev/zero of=$fm_file bs=1M count=$OSTCOUNT ||
14602                 error "dd failed on $fm_file"
14603
14604         filefrag -ves $fm_file || error "filefrag $fm_file failed"
14605         filefrag_op=$(filefrag -ve -k $fm_file |
14606                       sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
14607
14608         local last_lun=$(echo $filefrag_op | cut -d: -f5 |
14609                          sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14610
14611         IFS=$'\n'
14612         local tot_len=0
14613         local num_luns=1
14614
14615         for line in $filefrag_op; do
14616                 local frag_lun=$(echo $line | cut -d: -f5 |
14617                                  sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14618                 local ext_len=$(echo $line | cut -d: -f4)
14619                 if (( $frag_lun != $last_lun )); then
14620                         if (( tot_len != 1024 )); then
14621                                 error "FIEMAP on $fm_file failed; returned len $tot_len for OST $last_lun instead of 1024"
14622                                 return
14623                         else
14624                                 (( num_luns += 1 ))
14625                                 tot_len=0
14626                         fi
14627                 fi
14628                 (( tot_len += ext_len ))
14629                 last_lun=$frag_lun
14630         done
14631         if (( num_luns != $OSTCOUNT || tot_len != 1024 )); then
14632                 error "FIEMAP on $fm_file failed; returned wrong number of luns or wrong len for OST $last_lun"
14633                 return
14634         fi
14635
14636         echo "FIEMAP on $OSTCOUNT-stripe file succeeded"
14637 }
14638 run_test 130b "FIEMAP ($OSTCOUNT-stripe file)"
14639
14640 test_130c() {
14641         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
14642
14643         local filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
14644         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
14645         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14646                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14647
14648         trap cleanup_130 EXIT RETURN
14649
14650         local fm_file=$DIR/$tfile
14651         $LFS setstripe -S 65536 -c 2 $fm_file || error "setstripe on $fm_file"
14652
14653         dd if=/dev/zero of=$fm_file seek=1 bs=1M count=1 ||
14654                 error "dd failed on $fm_file"
14655
14656         filefrag -ves $fm_file || error "filefrag $fm_file failed"
14657         filefrag_op=$(filefrag -ve -k $fm_file |
14658                       sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
14659
14660         local last_lun=$(echo $filefrag_op | cut -d: -f5 |
14661                          sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14662
14663         IFS=$'\n'
14664         local tot_len=0
14665         local num_luns=1
14666         for line in $filefrag_op; do
14667                 local frag_lun=$(echo $line | cut -d: -f5 |
14668                                  sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14669                 local ext_len=$(echo $line | cut -d: -f4)
14670                 if (( $frag_lun != $last_lun )); then
14671                         local logical=$(echo $line | cut -d: -f2 | cut -d. -f1)
14672                         if (( logical != 512 )); then
14673                                 error "FIEMAP on $fm_file failed; returned logical start for lun $logical instead of 512"
14674                                 return
14675                         fi
14676                         if (( tot_len != 512 )); then
14677                                 error "FIEMAP on $fm_file failed; returned len $tot_len for OST $last_lun instead of 1024"
14678                                 return
14679                         else
14680                                 (( num_luns += 1 ))
14681                                 tot_len=0
14682                         fi
14683                 fi
14684                 (( tot_len += ext_len ))
14685                 last_lun=$frag_lun
14686         done
14687         if (( num_luns != 2 || tot_len != 512 )); then
14688                 error "FIEMAP on $fm_file failed; returned wrong number of luns or wrong len for OST $last_lun"
14689                 return
14690         fi
14691
14692         echo "FIEMAP on 2-stripe file with hole succeeded"
14693 }
14694 run_test 130c "FIEMAP (2-stripe file with hole)"
14695
14696 test_130d() {
14697         (( $OSTCOUNT >= 3 )) || skip "needs >= 3 OSTs"
14698
14699         filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
14700         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
14701         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14702                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14703
14704         trap cleanup_130 EXIT RETURN
14705
14706         local fm_file=$DIR/$tfile
14707         $LFS setstripe -S 65536 -c $OSTCOUNT $fm_file ||
14708                         error "setstripe on $fm_file"
14709
14710         local actual_stripe_count=$($LFS getstripe -c $fm_file)
14711         dd if=/dev/zero of=$fm_file bs=1M count=$actual_stripe_count ||
14712                 error "dd failed on $fm_file"
14713
14714         filefrag -ves $fm_file || error "filefrag $fm_file failed"
14715         filefrag_op=$(filefrag -ve -k $fm_file |
14716                       sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
14717
14718         local last_lun=$(echo $filefrag_op | cut -d: -f5 |
14719                          sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14720
14721         IFS=$'\n'
14722         local tot_len=0
14723         local num_luns=1
14724         for line in $filefrag_op; do
14725                 local frag_lun=$(echo $line | cut -d: -f5 |
14726                                  sed -e 's/^[ \t]*/0x/' | sed -e 's/0x0x/0x/')
14727                 local ext_len=$(echo $line | cut -d: -f4)
14728                 if (( $frag_lun != $last_lun )); then
14729                         if (( tot_len != 1024 )); then
14730                                 error "FIEMAP on $fm_file failed; returned len $tot_len for OST $last_lun instead of 1024"
14731                                 return
14732                         else
14733                                 (( num_luns += 1 ))
14734                                 local tot_len=0
14735                         fi
14736                 fi
14737                 (( tot_len += ext_len ))
14738                 last_lun=$frag_lun
14739         done
14740         if (( num_luns != actual_stripe_count || tot_len != 1024 )); then
14741                 error "FIEMAP on $fm_file failed; returned wrong number of luns or wrong len for OST $last_lun"
14742                 return
14743         fi
14744
14745         echo "FIEMAP on N-stripe file succeeded"
14746 }
14747 run_test 130d "FIEMAP (N-stripe file)"
14748
14749 test_130e() {
14750         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
14751
14752         local filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
14753         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
14754         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14755                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14756
14757         trap cleanup_130 EXIT RETURN
14758
14759         local fm_file=$DIR/$tfile
14760         $LFS setstripe -S 131072 -c 2 $fm_file || error "setstripe on $fm_file"
14761         stack_trap "rm -f $fm_file"
14762
14763         local num_blks=512
14764         local expected_len=$(( (num_blks / 2) * 64 ))
14765         for ((i = 0; i < $num_blks; i++)); do
14766                 dd if=/dev/zero of=$fm_file count=1 bs=64k seek=$((2*$i)) \
14767                         conv=notrunc > /dev/null 2>&1
14768         done
14769
14770         filefrag -ves $fm_file || error "filefrag $fm_file failed"
14771         filefrag_op=$(filefrag -ve -k $fm_file |
14772                       sed -n '/ext:/,/found/{/ext:/d; /found/d; p}')
14773
14774         local last_lun=$(echo $filefrag_op | cut -d: -f5)
14775
14776         IFS=$'\n'
14777         local tot_len=0
14778         local num_luns=1
14779         for line in $filefrag_op; do
14780                 local frag_lun=$(echo $line | cut -d: -f5)
14781                 local ext_len=$(echo $line | cut -d: -f4)
14782                 if (( $frag_lun != $last_lun )); then
14783                         if (( tot_len != $expected_len )); then
14784                                 error "OST$last_lun $tot_len != $expected_len"
14785                         else
14786                                 (( num_luns += 1 ))
14787                                 tot_len=0
14788                         fi
14789                 fi
14790                 (( tot_len += ext_len ))
14791                 last_lun=$frag_lun
14792         done
14793         if (( num_luns != 2 || tot_len != $expected_len )); then
14794                 error "OST$last_lun $num_luns != 2, $tot_len != $expected_len"
14795         fi
14796
14797         echo "FIEMAP with continuation calls succeeded"
14798 }
14799 run_test 130e "FIEMAP (test continuation FIEMAP calls)"
14800
14801 test_130f() {
14802         local filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
14803         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
14804         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14805                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14806
14807         local fm_file=$DIR/$tfile
14808         $MULTIOP $fm_file oO_RDWR:O_CREAT:O_LOV_DELAY_CREATE:T33554432c ||
14809                 error "multiop create with lov_delay_create on $fm_file"
14810
14811         filefrag -ves $fm_file || error "filefrag $fm_file failed"
14812         filefrag_extents=$(filefrag -vek $fm_file |
14813                            awk '/extents? found/ { print $2 }')
14814         if (( $filefrag_extents != 0 )); then
14815                 error "$fm_file: filefrag_extents=$filefrag_extents != 0"
14816         fi
14817
14818         rm -f $fm_file
14819 }
14820 run_test 130f "FIEMAP (unstriped file)"
14821
14822 test_130g() {
14823         (( $MDS1_VERSION >= $(version_code 2.12.53) )) ||
14824                 skip "Need MDS version with at least 2.12.53 for overstriping"
14825         local filefrag_op=$(filefrag -l 2>&1 | grep "invalid option")
14826         [[ -z "$filefrag_op" ]] || skip_env "filefrag missing logical ordering"
14827         [[ "$ost1_FSTYPE" != "zfs" ]] ||
14828                 skip "LU-1941: FIEMAP unimplemented on ZFS"
14829
14830         local file=$DIR/$tfile
14831         local nr=$((OSTCOUNT * 100))
14832
14833         $LFS setstripe -C $nr $file || error "failed to setstripe -C $nr $file"
14834
14835         stack_trap "rm -f $file"
14836         dd if=/dev/zero of=$file count=$nr bs=1M
14837         sync
14838         nr=$($LFS getstripe -c $file)
14839
14840         local extents=$(filefrag -v $file |
14841                         sed -n '/ext:/,/found/{/ext:/d; /found/d; p}' | wc -l)
14842
14843         echo "filefrag list $extents extents in file with stripecount $nr"
14844         if (( extents < nr )); then
14845                 $LFS getstripe $file
14846                 filefrag -v $file
14847                 error "filefrag printed $extents < $nr extents"
14848         fi
14849 }
14850 run_test 130g "FIEMAP (overstripe file)"
14851
14852 # Test for writev/readv
14853 test_131a() {
14854         rwv -f $DIR/$tfile -w -n 3 524288 1048576 1572864 ||
14855                 error "writev test failed"
14856         rwv -f $DIR/$tfile -r -v -n 2 1572864 1048576 ||
14857                 error "readv failed"
14858         rm -f $DIR/$tfile
14859 }
14860 run_test 131a "test iov's crossing stripe boundary for writev/readv"
14861
14862 test_131b() {
14863         local fsize=$((524288 + 1048576 + 1572864))
14864         rwv -f $DIR/$tfile -w -a -n 3 524288 1048576 1572864 &&
14865                 $CHECKSTAT -t file $DIR/$tfile -s $fsize ||
14866                         error "append writev test failed"
14867
14868         ((fsize += 1572864 + 1048576))
14869         rwv -f $DIR/$tfile -w -a -n 2 1572864 1048576 &&
14870                 $CHECKSTAT -t file $DIR/$tfile -s $fsize ||
14871                         error "append writev test failed"
14872         rm -f $DIR/$tfile
14873 }
14874 run_test 131b "test append writev"
14875
14876 test_131c() {
14877         rwv -f $DIR/$tfile -w -d -n 1 1048576 || return 0
14878         error "NOT PASS"
14879 }
14880 run_test 131c "test read/write on file w/o objects"
14881
14882 test_131d() {
14883         rwv -f $DIR/$tfile -w -n 1 1572864
14884         NOB=`rwv -f $DIR/$tfile -r -n 3 524288 524288 1048576 | awk '/error/ {print $6}'`
14885         if [ "$NOB" != 1572864 ]; then
14886                 error "Short read filed: read $NOB bytes instead of 1572864"
14887         fi
14888         rm -f $DIR/$tfile
14889 }
14890 run_test 131d "test short read"
14891
14892 test_131e() {
14893         rwv -f $DIR/$tfile -w -s 1048576 -n 1 1048576
14894         rwv -f $DIR/$tfile -r -z -s 0 -n 1 524288 || \
14895         error "read hitting hole failed"
14896         rm -f $DIR/$tfile
14897 }
14898 run_test 131e "test read hitting hole"
14899
14900 check_stats() {
14901         local facet=$1
14902         local op=$2
14903         local want=${3:-0}
14904         local res
14905
14906         # open             11 samples [usecs] 468 4793 13658 35791898
14907         case $facet in
14908         mds*) res=($(do_facet $facet \
14909                    $LCTL get_param mdt.$FSNAME-MDT0000.md_stats | grep "$op"))
14910                  ;;
14911         ost*) res=($(do_facet $facet \
14912                   $LCTL get_param obdfilter.$FSNAME-OST0000.stats | grep "$op"))
14913                  ;;
14914         *) error "Wrong facet '$facet'" ;;
14915         esac
14916         [[ -n "$res" ]] || error "counter for $op on $facet not incremented"
14917         # if $want is zero, it means any stat increment is ok.
14918         if (( $want > 0 )); then
14919                 local count=${res[1]}
14920
14921                 if (( $count != $want )); then
14922                         if [[ $facet =~ "mds" ]]; then
14923                                 do_nodes $(comma_list $(mdts_nodes)) \
14924                                         $LCTL get_param mdt.*.md_stats
14925                         else
14926                                 do_nodes $(comma_list $(osts-nodes)) \
14927                                         $LCTL get_param obdfilter.*.stats
14928                         fi
14929                         error "The $op counter on $facet is $count, not $want"
14930                 fi
14931         fi
14932 }
14933
14934 test_133a() {
14935         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14936         remote_ost_nodsh && skip "remote OST with nodsh"
14937         remote_mds_nodsh && skip "remote MDS with nodsh"
14938         do_facet $SINGLEMDS $LCTL list_param mdt.*.rename_stats ||
14939                 skip_env "MDS doesn't support rename stats"
14940
14941         local testdir=$DIR/${tdir}/stats_testdir
14942
14943         mkdir -p $DIR/${tdir}
14944
14945         # clear stats.
14946         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
14947         do_facet ost1 $LCTL set_param obdfilter.*.stats=clear
14948
14949         # verify mdt stats first.
14950         mkdir_on_mdt0 ${testdir} || error "mkdir_on_mdt0 failed"
14951         check_stats $SINGLEMDS "mkdir" 1
14952
14953         # clear "open" from "lfs mkdir" above
14954         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
14955         touch ${testdir}/${tfile} || error "touch failed"
14956         check_stats $SINGLEMDS "open" 1
14957         check_stats $SINGLEMDS "close" 1
14958         [ $MDS1_VERSION -ge $(version_code 2.8.54) ] && {
14959                 mknod ${testdir}/${tfile}-pipe p || error "mknod failed"
14960                 check_stats $SINGLEMDS "mknod" 2
14961         }
14962         rm -f ${testdir}/${tfile}-pipe || error "pipe remove failed"
14963         check_stats $SINGLEMDS "unlink" 1
14964         rm -f ${testdir}/${tfile} || error "file remove failed"
14965         check_stats $SINGLEMDS "unlink" 2
14966
14967         # remove working dir and check mdt stats again.
14968         rmdir ${testdir} || error "rmdir failed"
14969         check_stats $SINGLEMDS "rmdir" 1
14970
14971         local testdir1=$DIR/${tdir}/stats_testdir1
14972         mkdir_on_mdt0 -p ${testdir}
14973         mkdir_on_mdt0 -p ${testdir1}
14974         touch ${testdir1}/test1
14975         mv ${testdir1}/test1 ${testdir} || error "file crossdir rename"
14976         check_stats $SINGLEMDS "crossdir_rename" 1
14977
14978         mv ${testdir}/test1 ${testdir}/test0 || error "file samedir rename"
14979         check_stats $SINGLEMDS "samedir_rename" 1
14980
14981         rm -rf $DIR/${tdir}
14982 }
14983 run_test 133a "Verifying MDT stats ========================================"
14984
14985 test_133b() {
14986         local res
14987
14988         [ $PARALLEL == "yes" ] && skip "skip parallel run"
14989         remote_ost_nodsh && skip "remote OST with nodsh"
14990         remote_mds_nodsh && skip "remote MDS with nodsh"
14991
14992         local testdir=$DIR/${tdir}/stats_testdir
14993
14994         mkdir -p $DIR/$tdir || error "mkdir $tdir failed"
14995         mkdir_on_mdt0 ${testdir} || error "mkdir_on_mdt0 failed"
14996         touch ${testdir}/${tfile} || error "touch failed"
14997         cancel_lru_locks mdc
14998
14999         # clear stats.
15000         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15001         do_facet ost1 $LCTL set_param obdfilter.*.stats=clear
15002
15003         # extra mdt stats verification.
15004         chmod 444 ${testdir}/${tfile} || error "chmod failed"
15005         check_stats $SINGLEMDS "setattr" 1
15006         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15007         if [ $MDS1_VERSION -ne $(version_code 2.2.0) ]
15008         then            # LU-1740
15009                 ls -l ${testdir}/${tfile} > /dev/null|| error "ls failed"
15010                 check_stats $SINGLEMDS "getattr" 1
15011         fi
15012         rm -rf $DIR/${tdir}
15013
15014         # when DNE is enabled, MDT uses STATFS RPC to ping other targets
15015         # so the check below is not reliable
15016         [ $MDSCOUNT -eq 1 ] || return 0
15017
15018         # Sleep to avoid a cached response.
15019         #define OBD_STATFS_CACHE_SECONDS 1
15020         sleep 2
15021         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15022         do_facet ost1 $LCTL set_param obdfilter.*.exports.*.stats=clear
15023         $LFS df || error "lfs failed"
15024         check_stats $SINGLEMDS "statfs" 1
15025
15026         # check aggregated statfs (LU-10018)
15027         [ $MDS1_VERSION -lt $(version_code 2.11.54) ] &&
15028                 return 0
15029         [ $CLIENT_VERSION -lt $(version_code 2.11.54) ] &&
15030                 return 0
15031         sleep 2
15032         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15033         do_facet ost1 $LCTL set_param obdfilter.*.exports.*.stats=clear
15034         df $DIR
15035         check_stats $SINGLEMDS "statfs" 1
15036
15037         # We want to check that the client didn't send OST_STATFS to
15038         # ost1 but the MDT also uses OST_STATFS for precreate. So some
15039         # extra care is needed here.
15040         if remote_mds; then
15041                 local nid=$($LCTL list_nids | head -1 | sed  "s/\./\\\./g")
15042                 local param="obdfilter.$FSNAME-OST0000.exports.'$nid'.stats"
15043
15044                 res=$(do_facet ost1 $LCTL get_param $param | grep statfs)
15045                 [ "$res" ] && error "OST got STATFS"
15046         fi
15047
15048         return 0
15049 }
15050 run_test 133b "Verifying extra MDT stats =================================="
15051
15052 test_133c() {
15053         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15054         remote_ost_nodsh && skip "remote OST with nodsh"
15055         remote_mds_nodsh && skip "remote MDS with nodsh"
15056
15057         local testdir=$DIR/$tdir/stats_testdir
15058
15059         test_mkdir -p $testdir
15060
15061         # verify obdfilter stats.
15062         $LFS setstripe -c 1 -i 0 $testdir/$tfile
15063         sync
15064         cancel_lru_locks osc
15065         wait_delete_completed
15066
15067         # clear stats.
15068         do_facet $SINGLEMDS $LCTL set_param mdt.*.md_stats=clear
15069         do_facet ost1 $LCTL set_param obdfilter.*.stats=clear
15070
15071         dd if=/dev/zero of=$testdir/$tfile conv=notrunc bs=512k count=1 ||
15072                 error "dd failed"
15073         sync
15074         cancel_lru_locks osc
15075         check_stats ost1 "write" 1
15076
15077         dd if=$testdir/$tfile of=/dev/null bs=1k count=1 || error "dd failed"
15078         check_stats ost1 "read" 1
15079
15080         > $testdir/$tfile || error "truncate failed"
15081         check_stats ost1 "punch" 1
15082
15083         rm -f $testdir/$tfile || error "file remove failed"
15084         wait_delete_completed
15085         check_stats ost1 "destroy" 1
15086
15087         rm -rf $DIR/$tdir
15088 }
15089 run_test 133c "Verifying OST stats ========================================"
15090
15091 order_2() {
15092         local value=$1
15093         local orig=$value
15094         local order=1
15095
15096         while [ $value -ge 2 ]; do
15097                 order=$((order*2))
15098                 value=$((value/2))
15099         done
15100
15101         if [ $orig -gt $order ]; then
15102                 order=$((order*2))
15103         fi
15104         echo $order
15105 }
15106
15107 size_in_KMGT() {
15108     local value=$1
15109     local size=('K' 'M' 'G' 'T');
15110     local i=0
15111     local size_string=$value
15112
15113     while [ $value -ge 1024 ]; do
15114         if [ $i -gt 3 ]; then
15115             #T is the biggest unit we get here, if that is bigger,
15116             #just return XXXT
15117             size_string=${value}T
15118             break
15119         fi
15120         value=$((value >> 10))
15121         if [ $value -lt 1024 ]; then
15122             size_string=${value}${size[$i]}
15123             break
15124         fi
15125         i=$((i + 1))
15126     done
15127
15128     echo $size_string
15129 }
15130
15131 get_rename_size() {
15132         local size=$1
15133         local context=${2:-.}
15134         local sample=$(do_facet $SINGLEMDS $LCTL \
15135                 get_param mdt.$FSNAME-MDT0000.rename_stats |
15136                 grep -A1 $context |
15137                 awk '/ '${size}'/ {print $4}' | sed -e "s/,//g")
15138         echo $sample
15139 }
15140
15141 test_133d() {
15142         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15143         remote_ost_nodsh && skip "remote OST with nodsh"
15144         remote_mds_nodsh && skip "remote MDS with nodsh"
15145         do_facet $SINGLEMDS $LCTL list_param mdt.*.rename_stats ||
15146                 skip_env "MDS doesn't support rename stats"
15147
15148         local testdir1=$DIR/${tdir}/stats_testdir1
15149         local testdir2=$DIR/${tdir}/stats_testdir2
15150         mkdir -p $DIR/${tdir} || error "mkdir $tdir failed"
15151
15152         do_facet $SINGLEMDS $LCTL set_param mdt.*.rename_stats=clear
15153
15154         mkdir_on_mdt0 ${testdir1} || error "mkdir $testdir1 failed"
15155         mkdir_on_mdt0 ${testdir2} || error "mkdir $testdir2 failed"
15156
15157         createmany -o $testdir1/test 512 || error "createmany failed"
15158
15159         # check samedir rename size
15160         mv ${testdir1}/test0 ${testdir1}/test_0
15161
15162         local testdir1_size=$(ls -l $DIR/${tdir} |
15163                 awk '/stats_testdir1/ {print $5}')
15164         local testdir2_size=$(ls -l $DIR/${tdir} |
15165                 awk '/stats_testdir2/ {print $5}')
15166
15167         testdir1_size=$(order_2 $testdir1_size)
15168         testdir2_size=$(order_2 $testdir2_size)
15169
15170         testdir1_size=$(size_in_KMGT $testdir1_size)
15171         testdir2_size=$(size_in_KMGT $testdir2_size)
15172
15173         echo "source rename dir size: ${testdir1_size}"
15174         echo "target rename dir size: ${testdir2_size}"
15175
15176         local cmd="do_facet $SINGLEMDS $LCTL "
15177         cmd+="get_param mdt.$FSNAME-MDT0000.rename_stats"
15178
15179         eval $cmd || error "$cmd failed"
15180         local samedir=$($cmd | grep 'same_dir')
15181         local same_sample=$(get_rename_size $testdir1_size)
15182         [ -z "$samedir" ] && error "samedir_rename_size count error"
15183         [[ $same_sample -eq 1 ]] ||
15184                 error "samedir_rename_size error $same_sample"
15185         echo "Check same dir rename stats success"
15186
15187         do_facet $SINGLEMDS $LCTL set_param mdt.*.rename_stats=clear
15188
15189         # check crossdir rename size
15190         mv ${testdir1}/test_0 ${testdir2}/test_0
15191
15192         testdir1_size=$(ls -l $DIR/${tdir} |
15193                 awk '/stats_testdir1/ {print $5}')
15194         testdir2_size=$(ls -l $DIR/${tdir} |
15195                 awk '/stats_testdir2/ {print $5}')
15196
15197         testdir1_size=$(order_2 $testdir1_size)
15198         testdir2_size=$(order_2 $testdir2_size)
15199
15200         testdir1_size=$(size_in_KMGT $testdir1_size)
15201         testdir2_size=$(size_in_KMGT $testdir2_size)
15202
15203         echo "source rename dir size: ${testdir1_size}"
15204         echo "target rename dir size: ${testdir2_size}"
15205
15206         eval $cmd || error "$cmd failed"
15207         local crossdir=$($cmd | grep 'crossdir')
15208         local src_sample=$(get_rename_size $testdir1_size crossdir_src)
15209         local tgt_sample=$(get_rename_size $testdir2_size crossdir_tgt)
15210         [ -z "$crossdir" ] && error "crossdir_rename_size count error"
15211         [[ $src_sample -eq 1 ]] ||
15212                 error "crossdir_rename_size error $src_sample"
15213         [[ $tgt_sample -eq 1 ]] ||
15214                 error "crossdir_rename_size error $tgt_sample"
15215         echo "Check cross dir rename stats success"
15216         rm -rf $DIR/${tdir}
15217 }
15218 run_test 133d "Verifying rename_stats ========================================"
15219
15220 test_133e() {
15221         remote_mds_nodsh && skip "remote MDS with nodsh"
15222         remote_ost_nodsh && skip "remote OST with nodsh"
15223         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15224
15225         local testdir=$DIR/${tdir}/stats_testdir
15226         local ctr f0 f1 bs=32768 count=42 sum
15227
15228         mkdir -p ${testdir} || error "mkdir failed"
15229
15230         $LFS setstripe -c 1 -i 0 ${testdir}/${tfile}
15231
15232         for ctr in {write,read}_bytes; do
15233                 sync
15234                 cancel_lru_locks osc
15235
15236                 do_facet ost1 $LCTL set_param -n \
15237                         "obdfilter.*.exports.clear=clear"
15238
15239                 if [ $ctr = write_bytes ]; then
15240                         f0=/dev/zero
15241                         f1=${testdir}/${tfile}
15242                 else
15243                         f0=${testdir}/${tfile}
15244                         f1=/dev/null
15245                 fi
15246
15247                 dd if=$f0 of=$f1 conv=notrunc bs=$bs count=$count || \
15248                         error "dd failed"
15249                 sync
15250                 cancel_lru_locks osc
15251
15252                 sum=$(do_facet ost1 $LCTL get_param \
15253                         "obdfilter.*.exports.*.stats" |
15254                         awk -v ctr=$ctr 'BEGIN { sum = 0 }
15255                                 $1 == ctr { sum += $7 }
15256                                 END { printf("%0.0f", sum) }')
15257
15258                 if ((sum != bs * count)); then
15259                         error "Bad $ctr sum, expected $((bs * count)), got $sum"
15260                 fi
15261         done
15262
15263         rm -rf $DIR/${tdir}
15264 }
15265 run_test 133e "Verifying OST {read,write}_bytes nid stats ================="
15266
15267 test_133f() {
15268         [[ $(lustre_version_code $facet) -ge $(version_code 2.7.65) ]] ||
15269                 skip "too old lustre for get_param -R ($facet_ver)"
15270
15271         # verifying readability.
15272         $LCTL get_param -R '*' &> /dev/null
15273
15274         # Verifing writability with badarea_io.
15275         local proc_dirs=$(eval \ls -d $proc_regexp 2>/dev/null)
15276         local skipped_params='force_lbug|changelog_mask|daemon_file'
15277         $LCTL list_param -FR '*' | grep '=' | tr -d = |
15278                 egrep -v "$skipped_params" |
15279                 xargs -n 1 find $proc_dirs -name |
15280                 xargs -n 1 badarea_io ||
15281                 error "client badarea_io failed"
15282
15283         # remount the FS in case writes/reads /proc break the FS
15284         cleanup || error "failed to unmount"
15285         setup || error "failed to setup"
15286 }
15287 run_test 133f "Check reads/writes of client lustre proc files with bad area io"
15288
15289 test_133g() {
15290         remote_mds_nodsh && skip "remote MDS with nodsh"
15291         remote_ost_nodsh && skip "remote OST with nodsh"
15292
15293         local proc_dirs=$(eval \ls -d $proc_regexp 2>/dev/null)
15294         local proc_dirs_str=$(eval echo $proc_dirs)
15295         local skipped_params="'force_lbug|changelog_mask|daemon_file'"
15296         local facet
15297         for facet in mds1 ost1; do
15298                 local facet_ver=$(lustre_version_code $facet)
15299                 if [ $facet_ver -ge $(version_code 2.7.65) ]; then
15300                         do_facet $facet "$LCTL get_param -R '*'" &> /dev/null
15301                 else
15302                         log "$facet: too old lustre for get_param -R"
15303                 fi
15304                 if [ $facet_ver -ge $(version_code 2.5.54) ]; then
15305                         do_facet $facet "$LCTL list_param -FR '*' | grep '=' |
15306                                 tr -d = | egrep -v $skipped_params |
15307                                 xargs -n 1 find $proc_dirs_str -name |
15308                                 xargs -n 1 badarea_io" ||
15309                                         error "$facet badarea_io failed"
15310                 else
15311                         skip_noexit "$facet: too old lustre for get_param -R"
15312                 fi
15313         done
15314
15315         # remount the FS in case writes/reads /proc break the FS
15316         cleanup || error "failed to unmount"
15317         setup || error "failed to setup"
15318 }
15319 run_test 133g "Check reads/writes of server lustre proc files with bad area io"
15320
15321 test_133h() {
15322         remote_mds_nodsh && skip "remote MDS with nodsh"
15323         remote_ost_nodsh && skip "remote OST with nodsh"
15324         [[ $MDS1_VERSION -lt $(version_code 2.9.54) ]] &&
15325                 skip "Need MDS version at least 2.9.54"
15326
15327         local facet
15328         for facet in client mds1 ost1; do
15329                 # Get the list of files that are missing the terminating newline
15330                 local plist=$(do_facet $facet
15331                         $LCTL list_param -FR '*' | grep '=' | tr -d =)
15332                 local ent
15333                 for ent in $plist; do
15334                         local missing=$(do_facet $facet $LCTL get_param $ent \|\
15335                                 awk -v FS='\v' -v RS='\v\v' \
15336                                 "'END { if(NR>0 && \\\$NF !~ /.*\\\n\$/) \
15337                                         print FILENAME}'" 2>/dev/null)
15338                         [ -z $missing ] || {
15339                                 do_facet $facet $LCTL get_param $ent | od -An -tx1
15340                                 error "file does not end with newline: $facet-$ent"
15341                         }
15342                 done
15343         done
15344 }
15345 run_test 133h "Proc files should end with newlines"
15346
15347 test_134a() {
15348         remote_mds_nodsh && skip "remote MDS with nodsh"
15349         [[ $MDS1_VERSION -lt $(version_code 2.7.54) ]] &&
15350                 skip "Need MDS version at least 2.7.54"
15351
15352         mkdir_on_mdt0 $DIR/$tdir || error "failed to create $DIR/$tdir"
15353         cancel_lru_locks mdc
15354
15355         local nsdir="ldlm.namespaces.*-MDT0000-mdc-*"
15356         local unused=$($LCTL get_param -n $nsdir.lock_unused_count)
15357         [ $unused -eq 0 ] || error "$unused locks are not cleared"
15358
15359         local nr=1000
15360         createmany -o $DIR/$tdir/f $nr ||
15361                 error "failed to create $nr files in $DIR/$tdir"
15362         unused=$($LCTL get_param -n $nsdir.lock_unused_count)
15363
15364         #define OBD_FAIL_LDLM_WATERMARK_LOW     0x327
15365         do_facet mds1 $LCTL set_param fail_loc=0x327
15366         do_facet mds1 $LCTL set_param fail_val=500
15367         touch $DIR/$tdir/m
15368
15369         echo "sleep 10 seconds ..."
15370         sleep 10
15371         local lck_cnt=$($LCTL get_param -n $nsdir.lock_unused_count)
15372
15373         do_facet mds1 $LCTL set_param fail_loc=0
15374         do_facet mds1 $LCTL set_param fail_val=0
15375         [ $lck_cnt -lt $unused ] ||
15376                 error "No locks reclaimed, before:$unused, after:$lck_cnt"
15377
15378         rm $DIR/$tdir/m
15379         unlinkmany $DIR/$tdir/f $nr
15380 }
15381 run_test 134a "Server reclaims locks when reaching lock_reclaim_threshold"
15382
15383 test_134b() {
15384         remote_mds_nodsh && skip "remote MDS with nodsh"
15385         [[ $MDS1_VERSION -lt $(version_code 2.7.54) ]] &&
15386                 skip "Need MDS version at least 2.7.54"
15387
15388         mkdir_on_mdt0 $DIR/$tdir || error "failed to create $DIR/$tdir"
15389         cancel_lru_locks mdc
15390
15391         local low_wm=$(do_facet mds1 $LCTL get_param -n \
15392                         ldlm.lock_reclaim_threshold_mb)
15393         # disable reclaim temporarily
15394         do_facet mds1 $LCTL set_param ldlm.lock_reclaim_threshold_mb=0
15395
15396         #define OBD_FAIL_LDLM_WATERMARK_HIGH     0x328
15397         do_facet mds1 $LCTL set_param fail_loc=0x328
15398         do_facet mds1 $LCTL set_param fail_val=500
15399
15400         $LCTL set_param debug=+trace
15401
15402         local nr=600
15403         createmany -o $DIR/$tdir/f $nr &
15404         local create_pid=$!
15405
15406         echo "Sleep $TIMEOUT seconds ..."
15407         sleep $TIMEOUT
15408         if ! ps -p $create_pid  > /dev/null 2>&1; then
15409                 do_facet mds1 $LCTL set_param fail_loc=0
15410                 do_facet mds1 $LCTL set_param fail_val=0
15411                 do_facet mds1 $LCTL set_param \
15412                         ldlm.lock_reclaim_threshold_mb=${low_wm}m
15413                 error "createmany finished incorrectly!"
15414         fi
15415         do_facet mds1 $LCTL set_param fail_loc=0
15416         do_facet mds1 $LCTL set_param fail_val=0
15417         do_facet mds1 $LCTL set_param ldlm.lock_reclaim_threshold_mb=${low_wm}m
15418         wait $create_pid || return 1
15419
15420         unlinkmany $DIR/$tdir/f $nr
15421 }
15422 run_test 134b "Server rejects lock request when reaching lock_limit_mb"
15423
15424 test_135() {
15425         remote_mds_nodsh && skip "remote MDS with nodsh"
15426         [[ $MDS1_VERSION -lt $(version_code 2.13.50) ]] &&
15427                 skip "Need MDS version at least 2.13.50"
15428         local fname
15429
15430         mkdir -p $DIR/$tdir || error "failed to create $DIR/$tdir"
15431
15432 #define OBD_FAIL_PLAIN_RECORDS 0x1319
15433         #set only one record at plain llog
15434         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x1319 fail_val=1
15435
15436         ost_set_temp_seq_width_all $DATA_SEQ_MAX_WIDTH
15437
15438         #fill already existed plain llog each 64767
15439         #wrapping whole catalog
15440         createmany -o -u $DIR/$tdir/$tfile- $((64767 * 1))
15441
15442         createmany -o $DIR/$tdir/$tfile_ 64700
15443         for (( i = 0; i < 64700; i = i + 2 ))
15444         do
15445                 rm $DIR/$tdir/$tfile_$i &
15446                 rm $DIR/$tdir/$tfile_$((i + 1)) &
15447                 local pid=$!
15448                 wait $pid
15449         done
15450
15451         #waiting osp synchronization
15452         wait_delete_completed
15453 }
15454 run_test 135 "Race catalog processing"
15455
15456 test_136() {
15457         remote_mds_nodsh && skip "remote MDS with nodsh"
15458         [[ $MDS1_VERSION -lt $(version_code 2.13.50) ]] &&
15459                 skip "Need MDS version at least 2.13.50"
15460         local fname
15461
15462         mkdir -p $DIR/$tdir || error "failed to create $DIR/$tdir"
15463         $LFS setstripe -c 1 -i 0 $DIR/$tdir || error "failed to set striping"
15464         #set only one record at plain llog
15465 #define OBD_FAIL_CATALOG_FULL_CHECK                0x131a
15466         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x131a fail_val=1
15467
15468         ost_set_temp_seq_width_all $DATA_SEQ_MAX_WIDTH
15469
15470         #fill already existed 2 plain llogs each 64767
15471         #wrapping whole catalog
15472         createmany -o -u $DIR/$tdir/$tfile- $((64767 * 1))
15473         createmany -o -u $DIR/$tdir/$tfile- $((64767 * 3 / 2))
15474         wait_delete_completed
15475
15476         createmany -o $DIR/$tdir/$tfile_ 10
15477         sleep 25
15478
15479         do_facet $SINGLEMDS $LCTL set_param fail_val=3
15480         for (( i = 0; i < 10; i = i + 3 ))
15481         do
15482                 rm $DIR/$tdir/$tfile_$i &
15483                 rm $DIR/$tdir/$tfile_$((i + 1)) &
15484                 local pid=$!
15485                 wait $pid
15486                 sleep 7
15487                 rm $DIR/$tdir/$tfile_$((i + 2)) &
15488         done
15489
15490         #waiting osp synchronization
15491         wait_delete_completed
15492 }
15493 run_test 136 "Race catalog processing 2"
15494
15495 test_140() { #bug-17379
15496         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15497
15498         test_mkdir $DIR/$tdir
15499         cd $DIR/$tdir || error "Changing to $DIR/$tdir"
15500         cp $(which stat) . || error "Copying stat to $DIR/$tdir"
15501
15502         # VFS limits max symlink depth to 5(4KSTACK) or 7(8KSTACK) or 8
15503         # For kernel > 3.5, bellow only tests consecutive symlink (MAX 40)
15504         local i=0
15505         while i=$((i + 1)); do
15506                 test_mkdir $i
15507                 cd $i || error "Changing to $i"
15508                 ln -s ../stat stat || error "Creating stat symlink"
15509                 # Read the symlink until ELOOP present,
15510                 # not LBUGing the system is considered success,
15511                 # we didn't overrun the stack.
15512                 $OPENFILE -f O_RDONLY stat >/dev/null 2>&1; ret=$?
15513                 if [ $ret -ne 0 ]; then
15514                         if [ $ret -eq 40 ]; then
15515                                 break  # -ELOOP
15516                         else
15517                                 error "Open stat symlink"
15518                                         return
15519                         fi
15520                 fi
15521         done
15522         i=$((i - 1))
15523         echo "The symlink depth = $i"
15524         [ $i -eq 5 ] || [ $i -eq 7 ] || [ $i -eq 8 ] || [ $i -eq 40 ] ||
15525                 error "Invalid symlink depth"
15526
15527         # Test recursive symlink
15528         ln -s symlink_self symlink_self
15529         $OPENFILE -f O_RDONLY symlink_self >/dev/null 2>&1; ret=$?
15530         echo "open symlink_self returns $ret"
15531         [ $ret -eq 40 ] || error "recursive symlink doesn't return -ELOOP"
15532 }
15533 run_test 140 "Check reasonable stack depth (shouldn't LBUG) ===="
15534
15535 test_150a() {
15536         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15537
15538         local TF="$TMP/$tfile"
15539
15540         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15541         dd if=/dev/urandom of=$TF bs=6096 count=1 || error "dd failed"
15542         cp $TF $DIR/$tfile
15543         cancel_lru_locks $OSC
15544         cmp $TF $DIR/$tfile || error "$TMP/$tfile $DIR/$tfile differ"
15545         remount_client $MOUNT
15546         df -P $MOUNT
15547         cmp $TF $DIR/$tfile || error "$TF $DIR/$tfile differ (remount)"
15548
15549         $TRUNCATE $TF 6000
15550         $TRUNCATE $DIR/$tfile 6000
15551         cancel_lru_locks $OSC
15552         cmp $TF $DIR/$tfile || error "$TF $DIR/$tfile differ (truncate1)"
15553
15554         echo "12345" >>$TF
15555         echo "12345" >>$DIR/$tfile
15556         cancel_lru_locks $OSC
15557         cmp $TF $DIR/$tfile || error "$TF $DIR/$tfile differ (append1)"
15558
15559         echo "12345" >>$TF
15560         echo "12345" >>$DIR/$tfile
15561         cancel_lru_locks $OSC
15562         cmp $TF $DIR/$tfile || error "$TF $DIR/$tfile differ (append2)"
15563 }
15564 run_test 150a "truncate/append tests"
15565
15566 test_150b() {
15567         check_set_fallocate_or_skip
15568         local out
15569
15570         touch $DIR/$tfile
15571         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15572         out=$(check_fallocate $DIR/$tfile 2>&1) ||
15573                 skip_eopnotsupp "$out|check_fallocate failed"
15574 }
15575 run_test 150b "Verify fallocate (prealloc) functionality"
15576
15577 test_150bb() {
15578         check_set_fallocate_or_skip
15579
15580         touch $DIR/$tfile
15581         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15582         dd if=/dev/urandom of=$DIR/$tfile bs=1M count=20 || error "dd failed"
15583         > $DIR/$tfile
15584         fallocate -l $((1048576 * 20)) $DIR/$tfile || error "fallocate failed"
15585         # precomputed md5sum for 20MB of zeroes
15586         local expect="8f4e33f3dc3e414ff94e5fb6905cba8c"
15587         local sum=($(md5sum $DIR/$tfile))
15588
15589         [[ "${sum[0]}" == "$expect" ]] || error "fallocate unwritten is not zero"
15590
15591         check_set_fallocate 1
15592
15593         > $DIR/$tfile
15594         fallocate -l $((1048576 * 20)) $DIR/$tfile || error "fallocate failed"
15595         sum=($(md5sum $DIR/$tfile))
15596
15597         [[ "${sum[0]}" == "$expect" ]] || error "fallocate zero is not zero"
15598 }
15599 run_test 150bb "Verify fallocate modes both zero space"
15600
15601 test_150c() {
15602         check_set_fallocate_or_skip
15603         local striping="-c2"
15604
15605         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15606         $LFS setstripe -c $OSTCOUNT -S1M $DIR/$tfile || error "setstripe failed"
15607         fallocate -l ${OSTCOUNT}m $DIR/$tfile || error "fallocate failed"
15608         local bytes=$(($(stat -c '%b * %B' $DIR/$tfile)))
15609         local want=$((OSTCOUNT * 1048576))
15610
15611         # Must allocate all requested space, not more than 5% extra
15612         (( $bytes >= $want && $bytes < $want * 105 / 100 )) ||
15613                 error "bytes $bytes is not $want"
15614
15615         rm -f $DIR/$tfile
15616
15617         echo "verify fallocate on PFL file"
15618
15619         [[ "x$DOM" == "xyes" ]] && striping="-L mdt"
15620
15621         $LFS setstripe -E1M $striping -E16M -c3 -Eeof -c 4 $DIR/$tfile ||
15622                 error "Create $DIR/$tfile failed"
15623         fallocate -l $((1048576 * 512)) $DIR/$tfile || error "fallocate failed"
15624         bytes=$(($(stat -c '%b * %B' $DIR/$tfile)))
15625         want=$((512 * 1048576))
15626
15627         # Must allocate all requested space, not more than 5% extra
15628         (( $bytes >= $want && $bytes < $want * 105 / 100 )) ||
15629                 error "bytes $bytes is not $want"
15630 }
15631 run_test 150c "Verify fallocate Size and Blocks"
15632
15633 test_150d() {
15634         check_set_fallocate_or_skip
15635         local striping="-c2"
15636
15637         [[ "x$DOM" == "xyes" ]] && striping="-L mdt"
15638
15639         stack_trap "rm -f $DIR/$tdir; wait_delete_completed"
15640         $LFS setstripe -E1M $striping -E eof -c $OSTCOUNT -S1M $DIR/$tdir ||
15641                 error "setstripe failed"
15642         fallocate -o 1G -l ${OSTCOUNT}m $DIR/$tdir || error "fallocate failed"
15643         local bytes=$(($(stat -c '%b * %B' $DIR/$tdir)))
15644         local want=$((OSTCOUNT * 1048576))
15645
15646         # Must allocate all requested space, not more than 5% extra
15647         (( $bytes >= $want && $bytes < $want * 105 / 100 )) ||
15648                 error "bytes $bytes is not $want"
15649 }
15650 run_test 150d "Verify fallocate Size and Blocks - Non zero start"
15651
15652 test_150e() {
15653         check_set_fallocate_or_skip
15654
15655         echo "df before:"
15656         $LFS df
15657         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15658         $LFS setstripe -c${OSTCOUNT} $DIR/$tfile ||
15659                 error "$LFS setstripe -c${OSTCOUNT} $DIR/$tfile failed"
15660
15661         # Find OST with Minimum Size
15662         min_size_ost=$($LFS df | awk "/$FSNAME-OST/ { print \$4 }" |
15663                        sort -un | head -1)
15664
15665         # Get 100MB per OST of the available space to reduce run time
15666         # else 60% of the available space if we are running SLOW tests
15667         if [ $SLOW == "no" ]; then
15668                 local space=$((1024 * 100 * OSTCOUNT))
15669         else
15670                 local space=$(((min_size_ost * 60)/100 * OSTCOUNT))
15671         fi
15672
15673         fallocate -l${space}k $DIR/$tfile ||
15674                 error "fallocate ${space}k $DIR/$tfile failed"
15675         echo "'fallocate -l ${space}k $DIR/$tfile' succeeded"
15676
15677         # get size immediately after fallocate. This should be correctly
15678         # updated
15679         local size=$(stat -c '%s' $DIR/$tfile)
15680         local used=$(( $(stat -c '%b * %B' $DIR/$tfile) / 1024))
15681
15682         # Sleep for a while for statfs to get updated. And not pull from cache.
15683         sleep 2
15684
15685         echo "df after fallocate:"
15686         $LFS df
15687
15688         (( size / 1024 == space )) || error "size $size != requested $space"
15689         [ "$ost1_FSTYPE" != ldiskfs ] || (( used >= space )) ||
15690                 error "used $used < space $space"
15691
15692         rm $DIR/$tfile || error "rm failed"
15693         sync
15694         wait_delete_completed
15695
15696         echo "df after unlink:"
15697         $LFS df
15698 }
15699 run_test 150e "Verify 60% of available OST space consumed by fallocate"
15700
15701 test_150f() {
15702         local size
15703         local blocks
15704         local want_size_before=20480 # in bytes
15705         local want_blocks_before=40 # 512 sized blocks
15706         local want_blocks_after=24  # 512 sized blocks
15707         local length=$(((want_blocks_before - want_blocks_after) * 512))
15708
15709         [[ $OST1_VERSION -ge $(version_code 2.14.0) ]] ||
15710                 skip "need at least 2.14.0 for fallocate punch"
15711
15712         if [ "$ost1_FSTYPE" = "zfs" ] || [ "$mds1_FSTYPE" = "zfs" ]; then
15713                 skip "LU-14160: punch mode is not implemented on OSD ZFS"
15714         fi
15715
15716         check_set_fallocate_or_skip
15717         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15718
15719         [[ "x$DOM" == "xyes" ]] &&
15720                 $LFS setstripe -E1M -L mdt -E eof $DIR/$tfile
15721
15722         echo "Verify fallocate punch: Range within the file range"
15723         yes 'A' | dd of=$DIR/$tfile bs=4096 count=5 ||
15724                 error "dd failed for bs 4096 and count 5"
15725
15726         # Call fallocate with punch range which is within the file range
15727         out=$(fallocate -p --offset 4096 -l $length $DIR/$tfile 2>&1) ||
15728                 skip_eopnotsupp "$out|fallocate: offset 4096 and length $length"
15729         # client must see changes immediately after fallocate
15730         size=$(stat -c '%s' $DIR/$tfile)
15731         blocks=$(stat -c '%b' $DIR/$tfile)
15732
15733         # Verify punch worked.
15734         (( blocks == want_blocks_after )) ||
15735                 error "punch failed: blocks $blocks != $want_blocks_after"
15736
15737         (( size == want_size_before )) ||
15738                 error "punch failed: size $size != $want_size_before"
15739
15740         # Verify there is hole in file
15741         local data_off=$(lseek_test -d 4096 $DIR/$tfile)
15742         # precomputed md5sum
15743         local expect="4a9a834a2db02452929c0a348273b4aa"
15744
15745         cksum=($(md5sum $DIR/$tfile))
15746         [[ "${cksum[0]}" == "$expect" ]] ||
15747                 error "unexpected MD5SUM after punch: ${cksum[0]}"
15748
15749         # Start second sub-case for fallocate punch.
15750         echo "Verify fallocate punch: Range overlapping and less than blocksize"
15751         yes 'A' | dd of=$DIR/$tfile bs=4096 count=5 ||
15752                 error "dd failed for bs 4096 and count 5"
15753
15754         # Punch range less than block size will have no change in block count
15755         want_blocks_after=40  # 512 sized blocks
15756
15757         # Punch overlaps two blocks and less than blocksize
15758         out=$(fallocate -p --offset 4000 -l 3000 $DIR/$tfile 2>&1) ||
15759                 skip_eopnotsupp "$out|fallocate: offset 4000 length 3000"
15760         size=$(stat -c '%s' $DIR/$tfile)
15761         blocks=$(stat -c '%b' $DIR/$tfile)
15762
15763         # Verify punch worked.
15764         (( blocks == want_blocks_after )) ||
15765                 error "punch failed: blocks $blocks != $want_blocks_after"
15766
15767         (( size == want_size_before )) ||
15768                 error "punch failed: size $size != $want_size_before"
15769
15770         # Verify if range is really zero'ed out. We expect Zeros.
15771         # precomputed md5sum
15772         expect="c57ec5d769c3dbe3426edc3f7d7e11d3"
15773         cksum=($(md5sum $DIR/$tfile))
15774         [[ "${cksum[0]}" == "$expect" ]] ||
15775                 error "unexpected MD5SUM after punch: ${cksum[0]}"
15776 }
15777 run_test 150f "Verify fallocate punch functionality"
15778
15779 test_150g() {
15780         local space
15781         local size
15782         local blocks
15783         local blocks_after
15784         local size_after
15785         local BS=4096 # Block size in bytes
15786
15787         [[ $OST1_VERSION -ge $(version_code 2.14.0) ]] ||
15788                 skip "need at least 2.14.0 for fallocate punch"
15789
15790         if [ "$ost1_FSTYPE" = "zfs" ] || [ "$mds1_FSTYPE" = "zfs" ]; then
15791                 skip "LU-14160: punch mode is not implemented on OSD ZFS"
15792         fi
15793
15794         check_set_fallocate_or_skip
15795         stack_trap "rm -f $DIR/$tfile; wait_delete_completed"
15796
15797         if [[ "x$DOM" == "xyes" ]]; then
15798                 $LFS setstripe -E2M -L mdt -E eof -c${OSTCOUNT} $DIR/$tfile ||
15799                         error "$LFS setstripe DoM + ${OSTCOUNT} OST failed"
15800         else
15801                 $LFS setstripe -c${OSTCOUNT} $DIR/$tfile ||
15802                         error "$LFS setstripe -c${OSTCOUNT} $DIR/$tfile failed"
15803         fi
15804
15805         # Get 100MB per OST of the available space to reduce run time
15806         # else 60% of the available space if we are running SLOW tests
15807         if [ $SLOW == "no" ]; then
15808                 space=$((1024 * 100 * OSTCOUNT))
15809         else
15810                 # Find OST with Minimum Size
15811                 space=$($LFS df | awk "/$FSNAME-OST/ { print \$4 }" |
15812                         sort -un | head -1)
15813                 echo "min size OST: $space"
15814                 space=$(((space * 60)/100 * OSTCOUNT))
15815         fi
15816         # space in 1k units, round to 4k blocks
15817         local blkcount=$((space * 1024 / $BS))
15818
15819         echo "Verify fallocate punch: Very large Range"
15820         fallocate -l${space}k $DIR/$tfile ||
15821                 error "fallocate ${space}k $DIR/$tfile failed"
15822         # write 1M at the end, start and in the middle
15823         yes 'A' | dd of=$DIR/$tfile bs=$BS count=256 ||
15824                 error "dd failed: bs $BS count 256"
15825         yes 'A' | dd of=$DIR/$tfile bs=$BS seek=$((blkcount - 256)) count=256 ||
15826                 error "dd failed: bs $BS count 256 seek $((blkcount - 256))"
15827         yes 'A' | dd of=$DIR/$tfile bs=$BS seek=$((blkcount / 2)) count=1024 ||
15828                 error "dd failed: bs $BS count 256 seek $((blkcount / 2))"
15829
15830         # Gather stats.
15831         size=$(stat -c '%s' $DIR/$tfile)
15832
15833         # gather punch length.
15834         local punch_size=$((size - (BS * 2)))
15835
15836         echo "punch_size = $punch_size"
15837         echo "size - punch_size: $((size - punch_size))"
15838         echo "size - punch_size in blocks: $(((size - punch_size)/BS))"
15839
15840         # Call fallocate to punch all except 2 blocks. We leave the
15841         # first and the last block
15842         echo "fallocate -p --offset $BS -l $punch_size $DIR/$tfile"
15843         out=$(fallocate -p --offset $BS -l $punch_size $DIR/$tfile 2>&1) ||
15844                 skip_eopnotsupp "$out|fallocate: offset $BS length $punch_size"
15845
15846         size_after=$(stat -c '%s' $DIR/$tfile)
15847         blocks_after=$(stat -c '%b' $DIR/$tfile)
15848
15849         # Verify punch worked.
15850         # Size should be kept
15851         (( size == size_after )) ||
15852                 error "punch failed: size $size != $size_after"
15853
15854         # two 4k data blocks to remain plus possible 1 extra extent block
15855         (( blocks_after <= ((BS / 512) * 3) )) ||
15856                 error "too many blocks remains: $blocks_after"
15857
15858         # Verify that file has hole between the first and the last blocks
15859         local hole_start=$(lseek_test -l 0 $DIR/$tfile)
15860         local hole_end=$(lseek_test -d $BS $DIR/$tfile)
15861
15862         echo "Hole at [$hole_start, $hole_end)"
15863         (( hole_start == BS )) ||
15864                 error "no hole at offset $BS after punch"
15865
15866         (( hole_end == BS + punch_size )) ||
15867                 error "data at offset $hole_end < $((BS + punch_size))"
15868 }
15869 run_test 150g "Verify fallocate punch on large range"
15870
15871 test_150h() {
15872         local file=$DIR/$tfile
15873         local size
15874
15875         check_set_fallocate_or_skip
15876         statx_supported || skip_env "Test must be statx() syscall supported"
15877
15878         # fallocate() does not update the size information on the MDT
15879         fallocate -l 16K $file || error "failed to fallocate $file"
15880         cancel_lru_locks $OSC
15881         # STATX with cached-always mode will not send glimpse RPCs to OST,
15882         # it uses the caching attrs on the client side as much as possible.
15883         size=$($STATX --cached=always -c %s $file)
15884         [ $size == 16384 ] ||
15885                 error "size after fallocate() is $size, expected 16384"
15886 }
15887 run_test 150h "Verify extend fallocate updates the file size"
15888
15889 #LU-2902 roc_hit was not able to read all values from lproc
15890 function roc_hit_init() {
15891         local list=$(comma_list $(osts_nodes))
15892         local dir=$DIR/$tdir-check
15893         local file=$dir/$tfile
15894         local BEFORE
15895         local AFTER
15896         local idx
15897
15898         test_mkdir $dir
15899         #use setstripe to do a write to every ost
15900         for i in $(seq 0 $((OSTCOUNT-1))); do
15901                 $LFS setstripe -c 1 -i $i $dir || error "$LFS setstripe $file failed"
15902                 dd if=/dev/urandom of=$file bs=4k count=4 2>&1 > /dev/null
15903                 idx=$(printf %04x $i)
15904                 BEFORE=$(get_osd_param $list *OST*$idx stats |
15905                         awk '$1 == "cache_access" {sum += $7}
15906                                 END { printf("%0.0f", sum) }')
15907
15908                 cancel_lru_locks osc
15909                 cat $file >/dev/null
15910
15911                 AFTER=$(get_osd_param $list *OST*$idx stats |
15912                         awk '$1 == "cache_access" {sum += $7}
15913                                 END { printf("%0.0f", sum) }')
15914
15915                 echo BEFORE:$BEFORE AFTER:$AFTER
15916                 if ! let "AFTER - BEFORE == 4"; then
15917                         rm -rf $dir
15918                         error "roc_hit is not safe to use"
15919                 fi
15920                 rm $file
15921         done
15922
15923         rm -rf $dir
15924 }
15925
15926 function roc_hit() {
15927         local list=$(comma_list $(osts_nodes))
15928         echo $(get_osd_param $list '' stats |
15929                 awk '$1 == "cache_hit" {sum += $7}
15930                         END { printf("%0.0f", sum) }')
15931 }
15932
15933 function set_cache() {
15934         local on=1
15935
15936         if [ "$2" == "off" ]; then
15937                 on=0;
15938         fi
15939         local list=$(comma_list $(osts_nodes))
15940         set_osd_param $list '' $1_cache_enable $on
15941
15942         cancel_lru_locks osc
15943 }
15944
15945 test_151() {
15946         [ $PARALLEL == "yes" ] && skip "skip parallel run"
15947         remote_ost_nodsh && skip "remote OST with nodsh"
15948         (( CLIENT_VERSION == OST1_VERSION )) ||
15949                 skip "LU-13081: no interop testing for OSS cache"
15950
15951         local CPAGES=3
15952         local list=$(comma_list $(osts_nodes))
15953
15954         # check whether obdfilter is cache capable at all
15955         if ! get_osd_param $list '' read_cache_enable >/dev/null; then
15956                 skip "not cache-capable obdfilter"
15957         fi
15958
15959         # check cache is enabled on all obdfilters
15960         if get_osd_param $list '' read_cache_enable | grep 0; then
15961                 skip "oss cache is disabled"
15962         fi
15963
15964         set_osd_param $list '' writethrough_cache_enable 1
15965
15966         # check write cache is enabled on all obdfilters
15967         if get_osd_param $list '' writethrough_cache_enable | grep 0; then
15968                 skip "oss write cache is NOT enabled"
15969         fi
15970
15971         roc_hit_init
15972
15973         #define OBD_FAIL_OBD_NO_LRU  0x609
15974         do_nodes $list $LCTL set_param fail_loc=0x609
15975
15976         # pages should be in the case right after write
15977         dd if=/dev/urandom of=$DIR/$tfile bs=4k count=$CPAGES ||
15978                 error "dd failed"
15979
15980         local BEFORE=$(roc_hit)
15981         cancel_lru_locks osc
15982         cat $DIR/$tfile >/dev/null
15983         local AFTER=$(roc_hit)
15984
15985         do_nodes $list $LCTL set_param fail_loc=0
15986
15987         if ! let "AFTER - BEFORE == CPAGES"; then
15988                 error "NOT IN CACHE: before: $BEFORE, after: $AFTER"
15989         fi
15990
15991         cancel_lru_locks osc
15992         # invalidates OST cache
15993         do_nodes $list "echo 1 > /proc/sys/vm/drop_caches"
15994         set_osd_param $list '' read_cache_enable 0
15995         cat $DIR/$tfile >/dev/null
15996
15997         # now data shouldn't be found in the cache
15998         BEFORE=$(roc_hit)
15999         cancel_lru_locks osc
16000         cat $DIR/$tfile >/dev/null
16001         AFTER=$(roc_hit)
16002         if let "AFTER - BEFORE != 0"; then
16003                 error "IN CACHE: before: $BEFORE, after: $AFTER"
16004         fi
16005
16006         set_osd_param $list '' read_cache_enable 1
16007         rm -f $DIR/$tfile
16008 }
16009 run_test 151 "test cache on oss and controls ==============================="
16010
16011 test_152() {
16012         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16013
16014         local TF="$TMP/$tfile"
16015
16016         # simulate ENOMEM during write
16017 #define OBD_FAIL_OST_NOMEM      0x226
16018         lctl set_param fail_loc=0x80000226
16019         dd if=/dev/urandom of=$TF bs=6096 count=1 || error "dd failed"
16020         cp $TF $DIR/$tfile
16021         sync || error "sync failed"
16022         lctl set_param fail_loc=0
16023
16024         # discard client's cache
16025         cancel_lru_locks osc
16026
16027         # simulate ENOMEM during read
16028         lctl set_param fail_loc=0x80000226
16029         cmp $TF $DIR/$tfile || error "cmp failed"
16030         lctl set_param fail_loc=0
16031
16032         rm -f $TF
16033 }
16034 run_test 152 "test read/write with enomem ============================"
16035
16036 test_153() {
16037         $MULTIOP $DIR/$tfile Ow4096Ycu || error "multiop failed"
16038 }
16039 run_test 153 "test if fdatasync does not crash ======================="
16040
16041 dot_lustre_fid_permission_check() {
16042         local fid=$1
16043         local ffid=$MOUNT/.lustre/fid/$fid
16044         local test_dir=$2
16045
16046         echo "stat fid $fid"
16047         stat $ffid || error "stat $ffid failed."
16048         echo "touch fid $fid"
16049         touch $ffid || error "touch $ffid failed."
16050         echo "write to fid $fid"
16051         cat /etc/hosts > $ffid || error "write $ffid failed."
16052         echo "read fid $fid"
16053         diff /etc/hosts $ffid || error "read $ffid failed."
16054         echo "append write to fid $fid"
16055         cat /etc/hosts >> $ffid || error "append write $ffid failed."
16056         echo "rename fid $fid"
16057         mv $ffid $test_dir/$tfile.1 &&
16058                 error "rename $ffid to $tfile.1 should fail."
16059         touch $test_dir/$tfile.1
16060         mv $test_dir/$tfile.1 $ffid &&
16061                 error "rename $tfile.1 to $ffid should fail."
16062         rm -f $test_dir/$tfile.1
16063         echo "truncate fid $fid"
16064         $TRUNCATE $ffid 777 || error "truncate $ffid failed."
16065         echo "link fid $fid"
16066         ln -f $ffid $test_dir/tfile.lnk || error "link $ffid failed."
16067         if [[ $($LCTL get_param -n mdc.*-mdc-*.connect_flags) =~ acl ]]; then
16068                 echo "setfacl fid $fid"
16069                 setfacl -R -m u:$USER0:rwx $ffid ||
16070                         error "setfacl $ffid failed"
16071                 echo "getfacl fid $fid"
16072                 getfacl $ffid || error "getfacl $ffid failed."
16073         fi
16074         echo "unlink fid $fid"
16075         unlink $MOUNT/.lustre/fid/$fid && error "unlink $ffid should fail."
16076         echo "mknod fid $fid"
16077         mknod $ffid c 1 3 && error "mknod $ffid should fail."
16078
16079         fid=[0xf00000400:0x1:0x0]
16080         ffid=$MOUNT/.lustre/fid/$fid
16081
16082         echo "stat non-exist fid $fid"
16083         stat $ffid > /dev/null && error "stat non-exist $ffid should fail."
16084         echo "write to non-exist fid $fid"
16085         cat /etc/hosts > $ffid && error "write non-exist $ffid should fail."
16086         echo "link new fid $fid"
16087         ln $test_dir/$tfile $ffid && error "link $ffid should fail."
16088
16089         mkdir -p $test_dir/$tdir
16090         touch $test_dir/$tdir/$tfile
16091         fid=$($LFS path2fid $test_dir/$tdir)
16092         rc=$?
16093         [ $rc -ne 0 ] &&
16094                 error "error: could not get fid for $test_dir/$dir/$tfile."
16095
16096         ffid=$MOUNT/.lustre/fid/$fid
16097
16098         echo "ls $fid"
16099         ls $ffid || error "ls $ffid failed."
16100         echo "touch $fid/$tfile.1"
16101         touch $ffid/$tfile.1 || error "touch $ffid/$tfile.1 failed."
16102
16103         echo "touch $MOUNT/.lustre/fid/$tfile"
16104         touch $MOUNT/.lustre/fid/$tfile && \
16105                 error "touch $MOUNT/.lustre/fid/$tfile should fail."
16106
16107         echo "setxattr to $MOUNT/.lustre/fid"
16108         setfattr -n trusted.name1 -v value1 $MOUNT/.lustre/fid
16109
16110         echo "listxattr for $MOUNT/.lustre/fid"
16111         getfattr -d -m "^trusted" $MOUNT/.lustre/fid
16112
16113         echo "delxattr from $MOUNT/.lustre/fid"
16114         setfattr -x trusted.name1 $MOUNT/.lustre/fid
16115
16116         echo "touch invalid fid: $MOUNT/.lustre/fid/[0x200000400:0x2:0x3]"
16117         touch $MOUNT/.lustre/fid/[0x200000400:0x2:0x3] &&
16118                 error "touch invalid fid should fail."
16119
16120         echo "touch non-normal fid: $MOUNT/.lustre/fid/[0x1:0x2:0x0]"
16121         touch $MOUNT/.lustre/fid/[0x1:0x2:0x0] &&
16122                 error "touch non-normal fid should fail."
16123
16124         echo "rename $tdir to $MOUNT/.lustre/fid"
16125         mrename $test_dir/$tdir $MOUNT/.lustre/fid &&
16126                 error "rename to $MOUNT/.lustre/fid should fail."
16127
16128         if [ $MDS1_VERSION -ge $(version_code 2.3.51) ]
16129         then            # LU-3547
16130                 local old_obf_mode=$(stat --format="%a" $DIR/.lustre/fid)
16131                 local new_obf_mode=777
16132
16133                 echo "change mode of $DIR/.lustre/fid to $new_obf_mode"
16134                 chmod $new_obf_mode $DIR/.lustre/fid ||
16135                         error "chmod $new_obf_mode $DIR/.lustre/fid failed"
16136
16137                 local obf_mode=$(stat --format=%a $DIR/.lustre/fid)
16138                 [ $obf_mode -eq $new_obf_mode ] ||
16139                         error "stat $DIR/.lustre/fid returned wrong mode $obf_mode"
16140
16141                 echo "restore mode of $DIR/.lustre/fid to $old_obf_mode"
16142                 chmod $old_obf_mode $DIR/.lustre/fid ||
16143                         error "chmod $old_obf_mode $DIR/.lustre/fid failed"
16144         fi
16145
16146         $OPENFILE -f O_LOV_DELAY_CREATE:O_CREAT $test_dir/$tfile-2
16147         fid=$($LFS path2fid $test_dir/$tfile-2)
16148
16149         if [ $MDS1_VERSION -ge $(version_code 2.6.50) ]
16150         then # LU-5424
16151                 echo "cp /etc/passwd $MOUNT/.lustre/fid/$fid"
16152                 cp /etc/passwd $MOUNT/.lustre/fid/$fid ||
16153                         error "create lov data thru .lustre failed"
16154         fi
16155         echo "cp /etc/passwd $test_dir/$tfile-2"
16156         cp /etc/passwd $test_dir/$tfile-2 ||
16157                 error "copy to $test_dir/$tfile-2 failed."
16158         echo "diff /etc/passwd $MOUNT/.lustre/fid/$fid"
16159         diff /etc/passwd $MOUNT/.lustre/fid/$fid ||
16160                 error "diff /etc/passwd $MOUNT/.lustre/fid/$fid failed."
16161
16162         rm -rf $test_dir/tfile.lnk
16163         rm -rf $test_dir/$tfile-2
16164 }
16165
16166 test_154A() {
16167         [[ $MDS1_VERSION -lt $(version_code 2.4.1) ]] &&
16168                 skip "Need MDS version at least 2.4.1"
16169
16170         local tf=$DIR/$tfile
16171         touch $tf
16172
16173         local fid=$($LFS path2fid $tf)
16174         [ -z "$fid" ] && error "path2fid unable to get $tf FID"
16175
16176         # check that we get the same pathname back
16177         local rootpath
16178         local found
16179         for rootpath in "$MOUNT" "$MOUNT///" "$MOUNT/$tfile"; do
16180                 echo "$rootpath $fid"
16181                 found=$($LFS fid2path $rootpath "$fid")
16182                 [ -z "$found" ] && error "fid2path unable to get '$fid' path"
16183                 [ "$found" == "$tf" ] || error "fid2path $found != $tf"
16184         done
16185
16186         # check wrong root path format
16187         rootpath=$MOUNT"_wrong"
16188         found=$($LFS fid2path $rootpath "$fid")
16189         [ -z "$found" ] || error "should fail ($rootpath != $MOUNT)"
16190 }
16191 run_test 154A "lfs path2fid and fid2path basic checks"
16192
16193 test_154B() {
16194         [[ $MDS1_VERSION -lt $(version_code 2.4.1) ]] &&
16195                 skip "Need MDS version at least 2.4.1"
16196
16197         mkdir -p $DIR/$tdir || error "mkdir $tdir failed"
16198         touch $DIR/$tdir/$tfile || error "touch $DIR/$tdir/$tfile failed"
16199         local linkea=$($LL_DECODE_LINKEA $DIR/$tdir/$tfile | grep 'pfid')
16200         [ -z "$linkea" ] && error "decode linkea $DIR/$tdir/$tfile failed"
16201
16202         local name=$(echo $linkea | awk '/pfid/ {print $5}' | sed -e "s/'//g")
16203         local PFID=$(echo $linkea | awk '/pfid/ {print $3}' | sed -e "s/,//g")
16204
16205         # check that we get the same pathname
16206         echo "PFID: $PFID, name: $name"
16207         local FOUND=$($LFS fid2path $MOUNT "$PFID")
16208         [ -z "$FOUND" ] && error "fid2path unable to get $PFID path"
16209         [ "$FOUND/$name" != "$DIR/$tdir/$tfile" ] &&
16210                 error "ll_decode_linkea has $FOUND/$name != $DIR/$tdir/$tfile"
16211
16212         rm -rf $DIR/$tdir || error "Can not delete directory $DIR/$tdir"
16213 }
16214 run_test 154B "verify the ll_decode_linkea tool"
16215
16216 test_154a() {
16217         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16218         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
16219         (( $MDS1_VERSION >= $(version_code 2.2.51) )) ||
16220                 skip "Need MDS version at least 2.2.51"
16221         [ -z "$(which setfacl)" ] && skip_env "must have setfacl tool"
16222
16223         cp /etc/hosts $DIR/$tfile
16224
16225         fid=$($LFS path2fid $DIR/$tfile)
16226         rc=$?
16227         [ $rc -ne 0 ] && error "error: could not get fid for $DIR/$tfile."
16228
16229         dot_lustre_fid_permission_check "$fid" $DIR ||
16230                 error "dot lustre permission check $fid failed"
16231
16232         ls -a $MOUNT | grep "\.lustre" && error ".lustre should not be listed"
16233
16234         rm -rf $MOUNT/.lustre && error ".lustre is not allowed to be unlinked"
16235
16236         touch $MOUNT/.lustre/file &&
16237                 error "creation is not allowed under .lustre"
16238
16239         mkdir $MOUNT/.lustre/dir &&
16240                 error "mkdir is not allowed under .lustre"
16241
16242         rm -rf $DIR/$tfile
16243 }
16244 run_test 154a "Open-by-FID"
16245
16246 test_154b() {
16247         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16248         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
16249         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
16250         [[ $MDS1_VERSION -ge $(version_code 2.2.51) ]] ||
16251                 skip "Need MDS version at least 2.2.51"
16252
16253         local remote_dir=$DIR/$tdir/remote_dir
16254         local MDTIDX=1
16255         local rc=0
16256
16257         mkdir -p $DIR/$tdir
16258         $LFS mkdir -i $MDTIDX $remote_dir ||
16259                 error "create remote directory failed"
16260
16261         cp /etc/hosts $remote_dir/$tfile
16262
16263         fid=$($LFS path2fid $remote_dir/$tfile)
16264         rc=$?
16265         [ $rc -ne 0 ] && error "error: could not get fid for $remote_dir/$tfile"
16266
16267         dot_lustre_fid_permission_check "$fid" $remote_dir ||
16268                 error "dot lustre permission check $fid failed"
16269         rm -rf $DIR/$tdir
16270 }
16271 run_test 154b "Open-by-FID for remote directory"
16272
16273 test_154c() {
16274         [[ $MDS1_VERSION -lt $(version_code 2.4.1) ]] &&
16275                 skip "Need MDS version at least 2.4.1"
16276
16277         touch $DIR/$tfile.1 $DIR/$tfile.2 $DIR/$tfile.3
16278         local FID1=$($LFS path2fid $DIR/$tfile.1)
16279         local FID2=$($LFS path2fid $DIR/$tfile.2)
16280         local FID3=$($LFS path2fid $DIR/$tfile.3)
16281
16282         local N=1
16283         $LFS path2fid $DIR/$tfile.[123] | while read PATHNAME FID; do
16284                 [ "$PATHNAME" = "$DIR/$tfile.$N:" ] ||
16285                         error "path2fid pathname $PATHNAME != $DIR/$tfile.$N:"
16286                 local want=FID$N
16287                 [ "$FID" = "${!want}" ] ||
16288                         error "path2fid $PATHNAME FID $FID != FID$N ${!want}"
16289                 N=$((N + 1))
16290         done
16291
16292         $LFS fid2path $MOUNT "$FID1" "$FID2" "$FID3" | while read PATHNAME;
16293         do
16294                 [ "$PATHNAME" = "$DIR/$tfile.$N" ] ||
16295                         error "fid2path pathname $PATHNAME != $DIR/$tfile.$N:"
16296                 N=$((N + 1))
16297         done
16298 }
16299 run_test 154c "lfs path2fid and fid2path multiple arguments"
16300
16301 test_154d() {
16302         remote_mds_nodsh && skip "remote MDS with nodsh"
16303         [[ $MDS1_VERSION -lt $(version_code 2.5.53) ]] &&
16304                 skip "Need MDS version at least 2.5.53"
16305
16306         if remote_mds; then
16307                 nid=$($LCTL list_nids | sed  "s/\./\\\./g")
16308         else
16309                 nid="0@lo"
16310         fi
16311         local proc_ofile="mdt.*.exports.'$nid'.open_files"
16312         local fd
16313         local cmd
16314
16315         rm -f $DIR/$tfile
16316         touch $DIR/$tfile
16317
16318         local fid=$($LFS path2fid $DIR/$tfile)
16319         # Open the file
16320         fd=$(free_fd)
16321         cmd="exec $fd<$DIR/$tfile"
16322         eval $cmd
16323         local fid_list=$(do_facet $SINGLEMDS $LCTL get_param $proc_ofile)
16324         echo "$fid_list" | grep "$fid"
16325         rc=$?
16326
16327         cmd="exec $fd>/dev/null"
16328         eval $cmd
16329         if [ $rc -ne 0 ]; then
16330                 error "FID $fid not found in open files list $fid_list"
16331         fi
16332 }
16333 run_test 154d "Verify open file fid"
16334
16335 test_154e()
16336 {
16337         [[ $MDS1_VERSION -lt $(version_code 2.6.50) ]] &&
16338                 skip "Need MDS version at least 2.6.50"
16339
16340         if ls -a $MOUNT | grep -q '^\.lustre$'; then
16341                 error ".lustre returned by readdir"
16342         fi
16343 }
16344 run_test 154e ".lustre is not returned by readdir"
16345
16346 test_154f() {
16347         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
16348
16349         # create parent directory on a single MDT to avoid cross-MDT hardlinks
16350         mkdir_on_mdt0 $DIR/$tdir
16351         # test dirs inherit from its stripe
16352         mkdir -p $DIR/$tdir/foo1 || error "mkdir error"
16353         mkdir -p $DIR/$tdir/foo2 || error "mkdir error"
16354         cp /etc/hosts $DIR/$tdir/foo1/$tfile
16355         ln $DIR/$tdir/foo1/$tfile $DIR/$tdir/foo2/link
16356         touch $DIR/f
16357
16358         # get fid of parents
16359         local FID0=$($LFS path2fid $DIR/$tdir)
16360         local FID1=$($LFS path2fid $DIR/$tdir/foo1)
16361         local FID2=$($LFS path2fid $DIR/$tdir/foo2)
16362         local FID3=$($LFS path2fid $DIR)
16363
16364         # check that path2fid --parents returns expected <parent_fid>/name
16365         # 1) test for a directory (single parent)
16366         local parent=$($LFS path2fid --parents $DIR/$tdir/foo1)
16367         [ "$parent" == "$FID0/foo1" ] ||
16368                 error "expected parent: $FID0/foo1, got: $parent"
16369
16370         # 2) test for a file with nlink > 1 (multiple parents)
16371         parent=$($LFS path2fid --parents $DIR/$tdir/foo1/$tfile)
16372         echo "$parent" | grep -F "$FID1/$tfile" ||
16373                 error "$FID1/$tfile not returned in parent list"
16374         echo "$parent" | grep -F "$FID2/link" ||
16375                 error "$FID2/link not returned in parent list"
16376
16377         # 3) get parent by fid
16378         local file_fid=$($LFS path2fid $DIR/$tdir/foo1/$tfile)
16379         parent=$($LFS path2fid --parents $MOUNT/.lustre/fid/$file_fid)
16380         echo "$parent" | grep -F "$FID1/$tfile" ||
16381                 error "$FID1/$tfile not returned in parent list (by fid)"
16382         echo "$parent" | grep -F "$FID2/link" ||
16383                 error "$FID2/link not returned in parent list (by fid)"
16384
16385         # 4) test for entry in root directory
16386         parent=$($LFS path2fid --parents $DIR/f)
16387         echo "$parent" | grep -F "$FID3/f" ||
16388                 error "$FID3/f not returned in parent list"
16389
16390         # 5) test it on root directory
16391         [ -z "$($LFS path2fid --parents $MOUNT 2>/dev/null)" ] ||
16392                 error "$MOUNT should not have parents"
16393
16394         # enable xattr caching and check that linkea is correctly updated
16395         local save="$TMP/$TESTSUITE-$TESTNAME.parameters"
16396         save_lustre_params client "llite.*.xattr_cache" > $save
16397         lctl set_param llite.*.xattr_cache 1
16398
16399         # 6.1) linkea update on rename
16400         mv $DIR/$tdir/foo1/$tfile $DIR/$tdir/foo2/$tfile.moved
16401
16402         # get parents by fid
16403         parent=$($LFS path2fid --parents $MOUNT/.lustre/fid/$file_fid)
16404         # foo1 should no longer be returned in parent list
16405         echo "$parent" | grep -F "$FID1" &&
16406                 error "$FID1 should no longer be in parent list"
16407         # the new path should appear
16408         echo "$parent" | grep -F "$FID2/$tfile.moved" ||
16409                 error "$FID2/$tfile.moved is not in parent list"
16410
16411         # 6.2) linkea update on unlink
16412         rm -f $DIR/$tdir/foo2/link
16413         parent=$($LFS path2fid --parents $MOUNT/.lustre/fid/$file_fid)
16414         # foo2/link should no longer be returned in parent list
16415         echo "$parent" | grep -F "$FID2/link" &&
16416                 error "$FID2/link should no longer be in parent list"
16417         true
16418
16419         rm -f $DIR/f
16420         restore_lustre_params < $save
16421         rm -f $save
16422 }
16423 run_test 154f "get parent fids by reading link ea"
16424
16425 test_154g()
16426 {
16427         [[ $MDS1_VERSION -ge $(version_code 2.6.92) &&
16428            $CLIENT_VERSION -gt $(version_code 2.6.99) ]] ||
16429                 skip "Need MDS version at least 2.6.92"
16430
16431         mkdir_on_mdt0 $DIR/$tdir
16432         llapi_fid_test -d $DIR/$tdir
16433 }
16434 run_test 154g "various llapi FID tests"
16435
16436 test_154h()
16437 {
16438         (( $CLIENT_VERSION >= $(version_code 2.15.55.1) )) ||
16439                 skip "Need client at least version 2.15.55.1"
16440
16441         # Create an empty file
16442         touch $DIR/$tfile
16443
16444         # Get FID (interactive mode) and save under $TMP/$tfile.log
16445         $LFS 2>&1 <<-EOF | tee $TMP/$tfile.log
16446                 path2fid $DIR/$tfile
16447         EOF
16448
16449         fid=$(cat $TMP/$tfile.log)
16450         # $fid should not be empty
16451         [[ ! -z $fid ]] || error "FID is empty"
16452         $LFS rmfid $DIR "$fid" || error "rmfid failed for $fid"
16453 }
16454 run_test 154h "Verify interactive path2fid"
16455
16456 test_155_small_load() {
16457     local temp=$TMP/$tfile
16458     local file=$DIR/$tfile
16459
16460     dd if=/dev/urandom of=$temp bs=6096 count=1 || \
16461         error "dd of=$temp bs=6096 count=1 failed"
16462     cp $temp $file
16463     cancel_lru_locks $OSC
16464     cmp $temp $file || error "$temp $file differ"
16465
16466     $TRUNCATE $temp 6000
16467     $TRUNCATE $file 6000
16468     cmp $temp $file || error "$temp $file differ (truncate1)"
16469
16470     echo "12345" >>$temp
16471     echo "12345" >>$file
16472     cmp $temp $file || error "$temp $file differ (append1)"
16473
16474     echo "12345" >>$temp
16475     echo "12345" >>$file
16476     cmp $temp $file || error "$temp $file differ (append2)"
16477
16478     rm -f $temp $file
16479     true
16480 }
16481
16482 test_155_big_load() {
16483         remote_ost_nodsh && skip "remote OST with nodsh"
16484
16485         local temp=$TMP/$tfile
16486         local file=$DIR/$tfile
16487
16488         free_min_max
16489         local cache_size=$(do_facet ost$((MAXI+1)) \
16490                 "awk '/cache/ {sum+=\\\$4} END {print sum}' /proc/cpuinfo")
16491
16492         # LU-16042: can not get the cache size on Arm64 VM here, fallback to a
16493         # pre-set value
16494         if [ -z "$cache_size" ]; then
16495                 cache_size=256
16496         fi
16497         local large_file_size=$((cache_size * 2))
16498
16499         echo "OSS cache size: $cache_size KB"
16500         echo "Large file size: $large_file_size KB"
16501
16502         [ $MAXV -le $large_file_size ] &&
16503                 skip_env "max available OST size needs > $large_file_size KB"
16504
16505         $LFS setstripe $file -c 1 -i $MAXI || error "$LFS setstripe $file failed"
16506
16507         dd if=/dev/urandom of=$temp bs=$large_file_size count=1k ||
16508                 error "dd of=$temp bs=$large_file_size count=1k failed"
16509         cp $temp $file
16510         ls -lh $temp $file
16511         cancel_lru_locks osc
16512         cmp $temp $file || error "$temp $file differ"
16513
16514         rm -f $temp $file
16515         true
16516 }
16517
16518 save_writethrough() {
16519         local facets=$(get_facets OST)
16520
16521         save_lustre_params $facets "osd-*.*.writethrough_cache_enable" > $1
16522 }
16523
16524 test_155a() {
16525         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16526
16527         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16528
16529         save_writethrough $p
16530
16531         set_cache read on
16532         set_cache writethrough on
16533         test_155_small_load
16534         restore_lustre_params < $p
16535         rm -f $p
16536 }
16537 run_test 155a "Verify small file correctness: read cache:on write_cache:on"
16538
16539 test_155b() {
16540         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16541
16542         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16543
16544         save_writethrough $p
16545
16546         set_cache read on
16547         set_cache writethrough off
16548         test_155_small_load
16549         restore_lustre_params < $p
16550         rm -f $p
16551 }
16552 run_test 155b "Verify small file correctness: read cache:on write_cache:off"
16553
16554 test_155c() {
16555         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16556
16557         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16558
16559         save_writethrough $p
16560
16561         set_cache read off
16562         set_cache writethrough on
16563         test_155_small_load
16564         restore_lustre_params < $p
16565         rm -f $p
16566 }
16567 run_test 155c "Verify small file correctness: read cache:off write_cache:on"
16568
16569 test_155d() {
16570         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16571
16572         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16573
16574         save_writethrough $p
16575
16576         set_cache read off
16577         set_cache writethrough off
16578         test_155_small_load
16579         restore_lustre_params < $p
16580         rm -f $p
16581 }
16582 run_test 155d "Verify small file correctness: read cache:off write_cache:off"
16583
16584 test_155e() {
16585         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16586
16587         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16588
16589         save_writethrough $p
16590
16591         set_cache read on
16592         set_cache writethrough on
16593         test_155_big_load
16594         restore_lustre_params < $p
16595         rm -f $p
16596 }
16597 run_test 155e "Verify big file correctness: read cache:on write_cache:on"
16598
16599 test_155f() {
16600         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16601
16602         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16603
16604         save_writethrough $p
16605
16606         set_cache read on
16607         set_cache writethrough off
16608         test_155_big_load
16609         restore_lustre_params < $p
16610         rm -f $p
16611 }
16612 run_test 155f "Verify big file correctness: read cache:on write_cache:off"
16613
16614 test_155g() {
16615         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16616
16617         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16618
16619         save_writethrough $p
16620
16621         set_cache read off
16622         set_cache writethrough on
16623         test_155_big_load
16624         restore_lustre_params < $p
16625         rm -f $p
16626 }
16627 run_test 155g "Verify big file correctness: read cache:off write_cache:on"
16628
16629 test_155h() {
16630         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16631
16632         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16633
16634         save_writethrough $p
16635
16636         set_cache read off
16637         set_cache writethrough off
16638         test_155_big_load
16639         restore_lustre_params < $p
16640         rm -f $p
16641 }
16642 run_test 155h "Verify big file correctness: read cache:off write_cache:off"
16643
16644 test_156() {
16645         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16646         remote_ost_nodsh && skip "remote OST with nodsh"
16647         [ $OST1_VERSION -lt $(version_code 2.6.93) ] &&
16648                 skip "stats not implemented on old servers"
16649         [ "$ost1_FSTYPE" = "zfs" ] &&
16650                 skip "LU-1956/LU-2261: stats not implemented on OSD ZFS"
16651         (( CLIENT_VERSION == OST1_VERSION )) ||
16652                 skip "LU-13081: no interop testing for OSS cache"
16653
16654         local CPAGES=3
16655         local BEFORE
16656         local AFTER
16657         local file="$DIR/$tfile"
16658         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
16659
16660         save_writethrough $p
16661         roc_hit_init
16662
16663         log "Turn on read and write cache"
16664         set_cache read on
16665         set_cache writethrough on
16666
16667         log "Write data and read it back."
16668         log "Read should be satisfied from the cache."
16669         dd if=/dev/urandom of=$file bs=4k count=$CPAGES || error "dd failed"
16670         BEFORE=$(roc_hit)
16671         cancel_lru_locks osc
16672         cat $file >/dev/null
16673         AFTER=$(roc_hit)
16674         if ! let "AFTER - BEFORE == CPAGES"; then
16675                 error "NOT IN CACHE (2): before: $BEFORE, after: $AFTER"
16676         else
16677                 log "cache hits: before: $BEFORE, after: $AFTER"
16678         fi
16679
16680         log "Read again; it should be satisfied from the cache."
16681         BEFORE=$AFTER
16682         cancel_lru_locks osc
16683         cat $file >/dev/null
16684         AFTER=$(roc_hit)
16685         if ! let "AFTER - BEFORE == CPAGES"; then
16686                 error "NOT IN CACHE (3): before: $BEFORE, after: $AFTER"
16687         else
16688                 log "cache hits:: before: $BEFORE, after: $AFTER"
16689         fi
16690
16691         log "Turn off the read cache and turn on the write cache"
16692         set_cache read off
16693         set_cache writethrough on
16694
16695         log "Read again; it should be satisfied from the cache."
16696         BEFORE=$(roc_hit)
16697         cancel_lru_locks osc
16698         cat $file >/dev/null
16699         AFTER=$(roc_hit)
16700         if ! let "AFTER - BEFORE == CPAGES"; then
16701                 error "NOT IN CACHE (4): before: $BEFORE, after: $AFTER"
16702         else
16703                 log "cache hits:: before: $BEFORE, after: $AFTER"
16704         fi
16705
16706         if [ $OST1_VERSION -lt $(version_code 2.12.55) ]; then
16707                 # > 2.12.56 uses pagecache if cached
16708                 log "Read again; it should not be satisfied from the cache."
16709                 BEFORE=$AFTER
16710                 cancel_lru_locks osc
16711                 cat $file >/dev/null
16712                 AFTER=$(roc_hit)
16713                 if ! let "AFTER - BEFORE == 0"; then
16714                         error "IN CACHE (5): before: $BEFORE, after: $AFTER"
16715                 else
16716                         log "cache hits:: before: $BEFORE, after: $AFTER"
16717                 fi
16718         fi
16719
16720         log "Write data and read it back."
16721         log "Read should be satisfied from the cache."
16722         dd if=/dev/urandom of=$file bs=4k count=$CPAGES || error "dd failed"
16723         BEFORE=$(roc_hit)
16724         cancel_lru_locks osc
16725         cat $file >/dev/null
16726         AFTER=$(roc_hit)
16727         if ! let "AFTER - BEFORE == CPAGES"; then
16728                 error "NOT IN CACHE (6): before: $BEFORE, after: $AFTER"
16729         else
16730                 log "cache hits:: before: $BEFORE, after: $AFTER"
16731         fi
16732
16733         if [ $OST1_VERSION -lt $(version_code 2.12.55) ]; then
16734                 # > 2.12.56 uses pagecache if cached
16735                 log "Read again; it should not be satisfied from the cache."
16736                 BEFORE=$AFTER
16737                 cancel_lru_locks osc
16738                 cat $file >/dev/null
16739                 AFTER=$(roc_hit)
16740                 if ! let "AFTER - BEFORE == 0"; then
16741                         error "IN CACHE (7): before: $BEFORE, after: $AFTER"
16742                 else
16743                         log "cache hits:: before: $BEFORE, after: $AFTER"
16744                 fi
16745         fi
16746
16747         log "Turn off read and write cache"
16748         set_cache read off
16749         set_cache writethrough off
16750
16751         log "Write data and read it back"
16752         log "It should not be satisfied from the cache."
16753         rm -f $file
16754         dd if=/dev/urandom of=$file bs=4k count=$CPAGES || error "dd failed"
16755         cancel_lru_locks osc
16756         BEFORE=$(roc_hit)
16757         cat $file >/dev/null
16758         AFTER=$(roc_hit)
16759         if ! let "AFTER - BEFORE == 0"; then
16760                 error_ignore bz20762 "IN CACHE (8):before:$BEFORE,after:$AFTER"
16761         else
16762                 log "cache hits:: before: $BEFORE, after: $AFTER"
16763         fi
16764
16765         log "Turn on the read cache and turn off the write cache"
16766         set_cache read on
16767         set_cache writethrough off
16768
16769         log "Write data and read it back"
16770         log "It should not be satisfied from the cache."
16771         rm -f $file
16772         dd if=/dev/urandom of=$file bs=4k count=$CPAGES || error "dd failed"
16773         BEFORE=$(roc_hit)
16774         cancel_lru_locks osc
16775         cat $file >/dev/null
16776         AFTER=$(roc_hit)
16777         if ! let "AFTER - BEFORE == 0"; then
16778                 error_ignore bz20762 "IN CACHE (9):before:$BEFORE,after:$AFTER"
16779         else
16780                 log "cache hits:: before: $BEFORE, after: $AFTER"
16781         fi
16782
16783         log "Read again; it should be satisfied from the cache."
16784         BEFORE=$(roc_hit)
16785         cancel_lru_locks osc
16786         cat $file >/dev/null
16787         AFTER=$(roc_hit)
16788         if ! let "AFTER - BEFORE == CPAGES"; then
16789                 error "NOT IN CACHE (1): before: $BEFORE, after: $AFTER"
16790         else
16791                 log "cache hits:: before: $BEFORE, after: $AFTER"
16792         fi
16793
16794         restore_lustre_params < $p
16795         rm -f $p $file
16796 }
16797 run_test 156 "Verification of tunables"
16798
16799 test_160a() {
16800         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16801         remote_mds_nodsh && skip "remote MDS with nodsh"
16802         [ $MDS1_VERSION -ge $(version_code 2.2.0) ] ||
16803                 skip "Need MDS version at least 2.2.0"
16804
16805         changelog_register || error "changelog_register failed"
16806         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
16807         changelog_users $SINGLEMDS | grep -q $cl_user ||
16808                 error "User $cl_user not found in changelog_users"
16809
16810         mkdir_on_mdt0 $DIR/$tdir
16811
16812         # change something
16813         test_mkdir -p $DIR/$tdir/pics/2008/zachy
16814         changelog_clear 0 || error "changelog_clear failed"
16815         touch $DIR/$tdir/pics/2008/zachy/$tfile                 # open 1
16816         cp /etc/hosts $DIR/$tdir/pics/2008/zachy/pic1.jpg       # open 2
16817         mv $DIR/$tdir/pics/2008/zachy $DIR/$tdir/pics/zach
16818         ln $DIR/$tdir/pics/zach/pic1.jpg $DIR/$tdir/pics/2008/portland.jpg
16819         ln -s $DIR/$tdir/pics/2008/portland.jpg $DIR/$tdir/pics/desktop.jpg
16820         rm $DIR/$tdir/pics/desktop.jpg
16821
16822         echo "verifying changelog mask"
16823         changelog_chmask "-MKDIR"
16824         changelog_chmask "-CLOSE"
16825
16826         test_mkdir -p $DIR/$tdir/pics/zach/sofia                # not logged
16827         echo "zzzzzz" > $DIR/$tdir/pics/zach/file               # not logged
16828
16829         changelog_chmask "+MKDIR"
16830         changelog_chmask "+CLOSE"
16831
16832         test_mkdir -p $DIR/$tdir/pics/2008/sofia                # mkdir 1
16833         echo "zzzzzz" > $DIR/$tdir/pics/zach/file               # open 3
16834
16835         MKDIRS=$(changelog_dump | grep -c "MKDIR")
16836         CLOSES=$(changelog_dump | grep -c "CLOSE")
16837         [ $MKDIRS -eq 1 ] || error "MKDIR changelog mask count $MKDIRS != 1"
16838         [ $CLOSES -eq 3 ] || error "CLOSE changelog mask count $CLOSES != 3"
16839
16840         # verify contents
16841         echo "verifying target fid"
16842         local fidc=$(changelog_extract_field "CREAT" "$tfile" "t=")
16843         local fidf=$($LFS path2fid $DIR/$tdir/pics/zach/$tfile)
16844         [ "$fidc" == "$fidf" ] ||
16845                 error "changelog '$tfile' fid $fidc != file fid $fidf"
16846         echo "verifying parent fid"
16847         # The FID returned from the Changelog may be the directory shard on
16848         # a different MDT, and not the FID returned by path2fid on the parent.
16849         # Instead of comparing FIDs, verify that fid2path(fidp) is correct,
16850         # since this is what will matter when recreating this file in the tree.
16851         local fidp=$(changelog_extract_field "CREAT" "$tfile" "p=")
16852         local pathp=$($LFS fid2path $MOUNT "$fidp")
16853         [ "${pathp%/}" == "$DIR/$tdir/pics/zach" ] ||
16854                 error "changelog fid2path($fidc) $pathp != $DIR/$tdir/pics/zach"
16855
16856         echo "getting records for $cl_user"
16857         changelog_users $SINGLEMDS
16858         local user_rec1=$(changelog_user_rec $SINGLEMDS $cl_user)
16859         local nclr=3
16860         __changelog_clear $SINGLEMDS $cl_user +$nclr ||
16861                 error "changelog_clear failed"
16862         local user_rec2=$(changelog_user_rec $SINGLEMDS $cl_user)
16863         echo "verifying user clear: $user_rec1 + $nclr == $user_rec2"
16864         [ $user_rec2 == $((user_rec1 + nclr)) ] ||
16865                 error "user index expect $user_rec1 + $nclr != $user_rec2"
16866
16867         local min0_rec=$(changelog_users $SINGLEMDS |
16868                 awk 'min == "" || $2 < min { min = $2 }; END { print min }')
16869         local first_rec=$($LFS changelog $(facet_svc $SINGLEMDS) |
16870                           awk '{ print $1; exit; }')
16871
16872         changelog_dump | tail -n 5
16873         echo "verifying user min purge: $min0_rec + 1 == $first_rec"
16874         [ $first_rec == $((min0_rec + 1)) ] ||
16875                 error "first index should be $min0_rec + 1 not $first_rec"
16876
16877         # LU-3446 changelog index reset on MDT restart
16878         local cur_rec1=$(changelog_users $SINGLEMDS |
16879                          awk '/^current.index:/ { print $NF }')
16880         changelog_clear 0 ||
16881                 error "clear all changelog records for $cl_user failed"
16882         stop $SINGLEMDS || error "Fail to stop $SINGLEMDS"
16883         start $SINGLEMDS $(mdsdevname ${SINGLEMDS//mds/}) $MDS_MOUNT_OPTS ||
16884                 error "Fail to start $SINGLEMDS"
16885         local cur_rec2=$(changelog_users $SINGLEMDS |
16886                          awk '/^current.index:/ { print $NF }')
16887         echo "verifying index survives MDT restart: $cur_rec1 == $cur_rec2"
16888         [ $cur_rec1 == $cur_rec2 ] ||
16889                 error "current index should be $cur_rec1 not $cur_rec2"
16890
16891         echo "verifying users from this test are deregistered"
16892         changelog_deregister || error "changelog_deregister failed"
16893         changelog_users $SINGLEMDS | grep -q $cl_user &&
16894                 error "User '$cl_user' still in changelog_users"
16895
16896         # lctl get_param -n mdd.*.changelog_users
16897         # current_index: 144
16898         # ID    index (idle seconds)
16899         # cl3   144   (2) mask=<list>
16900         if [ -z "$(changelog_users $SINGLEMDS | grep -v current.index)" ]; then
16901                 # this is the normal case where all users were deregistered
16902                 # make sure no new records are added when no users are present
16903                 local last_rec1=$(changelog_users $SINGLEMDS |
16904                                   awk '/^current.index:/ { print $NF }')
16905                 touch $DIR/$tdir/chloe
16906                 local last_rec2=$(changelog_users $SINGLEMDS |
16907                                   awk '/^current.index:/ { print $NF }')
16908                 echo "verify changelogs are off: $last_rec1 == $last_rec2"
16909                 [ $last_rec1 == $last_rec2 ] || error "changelogs not off"
16910         else
16911                 # any changelog users must be leftovers from a previous test
16912                 changelog_users $SINGLEMDS
16913                 echo "other changelog users; can't verify off"
16914         fi
16915 }
16916 run_test 160a "changelog sanity"
16917
16918 test_160b() { # LU-3587
16919         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16920         remote_mds_nodsh && skip "remote MDS with nodsh"
16921         [ $MDS1_VERSION -ge $(version_code 2.2.0) ] ||
16922                 skip "Need MDS version at least 2.2.0"
16923
16924         changelog_register || error "changelog_register failed"
16925         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
16926         changelog_users $SINGLEMDS | grep -q $cl_user ||
16927                 error "User '$cl_user' not found in changelog_users"
16928
16929         local longname1=$(str_repeat a 255)
16930         local longname2=$(str_repeat b 255)
16931
16932         cd $DIR
16933         echo "creating very long named file"
16934         touch $longname1 || error "create of '$longname1' failed"
16935         echo "renaming very long named file"
16936         mv $longname1 $longname2
16937
16938         changelog_dump | grep RENME | tail -n 5
16939         rm -f $longname2
16940 }
16941 run_test 160b "Verify that very long rename doesn't crash in changelog"
16942
16943 test_160c() {
16944         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16945         remote_mds_nodsh && skip "remote MDS with nodsh"
16946
16947         [[ $MDS1_VERSION -gt $(version_code 2.5.57) ]] ||
16948                 [[ $MDS1_VERSION -gt $(version_code 2.5.1) &&
16949                    $MDS1_VERSION -lt $(version_code 2.5.50) ]] ||
16950                 skip "Need MDS version at least 2.5.58 or 2.5.2+"
16951
16952         local rc=0
16953
16954         # Registration step
16955         changelog_register || error "changelog_register failed"
16956
16957         rm -rf $DIR/$tdir
16958         mkdir -p $DIR/$tdir
16959         $MCREATE $DIR/$tdir/foo_160c
16960         changelog_chmask "-TRUNC"
16961         $TRUNCATE $DIR/$tdir/foo_160c 200
16962         changelog_chmask "+TRUNC"
16963         $TRUNCATE $DIR/$tdir/foo_160c 199
16964         changelog_dump | tail -n 5
16965         local truncs=$(changelog_dump | tail -n 5 | grep -c TRUNC)
16966         [ $truncs -eq 1 ] || error "TRUNC changelog mask count $truncs != 1"
16967 }
16968 run_test 160c "verify that changelog log catch the truncate event"
16969
16970 test_160d() {
16971         remote_mds_nodsh && skip "remote MDS with nodsh"
16972         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
16973         [ $PARALLEL == "yes" ] && skip "skip parallel run"
16974         [[ $MDS1_VERSION -ge $(version_code 2.7.60) ]] ||
16975                 skip "Need MDS version at least 2.7.60"
16976
16977         # Registration step
16978         changelog_register || error "changelog_register failed"
16979
16980         mkdir -p $DIR/$tdir/migrate_dir
16981         changelog_clear 0 || error "changelog_clear failed"
16982
16983         $LFS migrate -m 1 $DIR/$tdir/migrate_dir || error "migrate fails"
16984         changelog_dump | tail -n 5
16985         local migrates=$(changelog_dump | grep -c "MIGRT")
16986         [ $migrates -eq 1 ] || error "MIGRATE changelog count $migrates != 1"
16987 }
16988 run_test 160d "verify that changelog log catch the migrate event"
16989
16990 test_160e() {
16991         remote_mds_nodsh && skip "remote MDS with nodsh"
16992
16993         # Create a user
16994         changelog_register || error "changelog_register failed"
16995
16996         local MDT0=$(facet_svc $SINGLEMDS)
16997         local rc
16998
16999         # No user (expect fail)
17000         do_facet $SINGLEMDS $LCTL --device $MDT0 changelog_deregister
17001         rc=$?
17002         if [ $rc -eq 0 ]; then
17003                 error "Should fail without user"
17004         elif [ $rc -ne 4 ]; then
17005                 error "changelog_deregister failed with $rc, expect 4(CMD_HELP)"
17006         fi
17007
17008         # Delete a future user (expect fail)
17009         do_facet $SINGLEMDS $LCTL --device $MDT0 changelog_deregister "cl77"
17010         rc=$?
17011         if [ $rc -eq 0 ]; then
17012                 error "Deleted non-existant user cl77"
17013         elif [ $rc -ne 2 ]; then
17014                 error "changelog_deregister failed with $rc, expect 2 (ENOENT)"
17015         fi
17016
17017         # Clear to a bad index (1 billion should be safe)
17018         $LFS changelog_clear $MDT0 "${CL_USERS[$SINGLEMDS]%% *}" 1000000000
17019         rc=$?
17020
17021         if [ $rc -eq 0 ]; then
17022                 error "Successfully cleared to invalid CL index"
17023         elif [ $rc -ne 22 ]; then
17024                 error "changelog_clear failed with $rc, expected 22 (EINVAL)"
17025         fi
17026 }
17027 run_test 160e "changelog negative testing (should return errors)"
17028
17029 test_160f() {
17030         remote_mds_nodsh && skip "remote MDS with nodsh" && return
17031         [[ $MDS1_VERSION -ge $(version_code 2.10.56) ]] ||
17032                 skip "Need MDS version at least 2.10.56"
17033
17034         local mdts=$(comma_list $(mdts_nodes))
17035
17036         # Create a user
17037         changelog_register || error "first changelog_register failed"
17038         changelog_register || error "second changelog_register failed"
17039         local cl_users
17040         declare -A cl_user1
17041         declare -A cl_user2
17042         local user_rec1
17043         local user_rec2
17044         local i
17045
17046         # generate some changelog records to accumulate on each MDT
17047         # use all_char because created files should be evenly distributed
17048         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17049                 error "test_mkdir $tdir failed"
17050         log "$(date +%s): creating first files"
17051         for ((i = 0; i < MDSCOUNT * 2; i++)); do
17052                 $LFS mkdir -i $((i%MDSCOUNT)) $DIR/$tdir/d$i.$((i/MDSCOUNT)) ||
17053                         error "create $DIR/$tdir/d$i.$((i/MDSCOUNT)) failed"
17054         done
17055
17056         # check changelogs have been generated
17057         local start=$SECONDS
17058         local idle_time=$((MDSCOUNT * 5 + 5))
17059         local nbcl=$(changelog_dump | wc -l)
17060         [[ $nbcl -eq 0 ]] && error "no changelogs found"
17061
17062         for param in "changelog_max_idle_time=$idle_time" \
17063                      "changelog_gc=1" \
17064                      "changelog_min_gc_interval=2" \
17065                      "changelog_min_free_cat_entries=3"; do
17066                 local MDT0=$(facet_svc $SINGLEMDS)
17067                 local var="${param%=*}"
17068                 local old=$(do_facet mds1 "$LCTL get_param -n mdd.$MDT0.$var")
17069
17070                 stack_trap "do_nodes $mdts $LCTL set_param mdd.*.$var=$old" EXIT
17071                 do_nodes $mdts $LCTL set_param mdd.*.$param
17072         done
17073
17074         # force cl_user2 to be idle (1st part), but also cancel the
17075         # cl_user1 records so that it is not evicted later in the test.
17076         local sleep1=$((idle_time / 2))
17077         echo "$(date +%s): sleep1 $sleep1/${idle_time}s"
17078         sleep $sleep1
17079
17080         # simulate changelog catalog almost full
17081         #define OBD_FAIL_CAT_FREE_RECORDS       0x1313
17082         do_nodes $mdts "$LCTL set_param fail_loc=0x1313 fail_val=3"
17083
17084         for i in $(seq $MDSCOUNT); do
17085                 cl_users=(${CL_USERS[mds$i]})
17086                 cl_user1[mds$i]="${cl_users[0]}"
17087                 cl_user2[mds$i]="${cl_users[1]}"
17088
17089                 [ -n "${cl_user1[mds$i]}" ] ||
17090                         error "mds$i: no user registered"
17091                 [ -n "${cl_user2[mds$i]}" ] ||
17092                         error "mds$i: only ${cl_user2[mds$i]} is registered"
17093
17094                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17095                 [ -n "$user_rec1" ] ||
17096                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17097                 __changelog_clear mds$i ${cl_user1[mds$i]} +2
17098                 user_rec2=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17099                 [ -n "$user_rec2" ] ||
17100                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17101                 echo "mds$i: verifying user ${cl_user1[mds$i]} clear: " \
17102                      "$user_rec1 + 2 == $user_rec2"
17103                 [ $((user_rec1 + 2)) == $user_rec2 ] ||
17104                         error "mds$i: user ${cl_user1[mds$i]} index expected " \
17105                               "$user_rec1 + 2, but is $user_rec2"
17106                 user_rec2=$(changelog_user_rec mds$i ${cl_user2[mds$i]})
17107                 [ -n "$user_rec2" ] ||
17108                         error "mds$i: User ${cl_user2[mds$i]} not registered"
17109                 [ $user_rec1 == $user_rec2 ] ||
17110                         error "mds$i: user ${cl_user2[mds$i]} index expected " \
17111                               "$user_rec1, but is $user_rec2"
17112         done
17113
17114         # force cl_user2 idle (2nd part) to just exceed changelog_max_idle_time
17115         local sleep2=$((idle_time - (SECONDS - start) + 1))
17116         echo "$(date +%s): sleep2 $sleep2/${idle_time}s"
17117         sleep $sleep2
17118
17119         # Generate one more changelog to trigger GC at fail_loc for cl_user2.
17120         # cl_user1 should be OK because it recently processed records.
17121         echo "$(date +%s): creating $((MDSCOUNT * 2)) files"
17122         for ((i = 0; i < MDSCOUNT * 2; i++)); do
17123                 $LFS mkdir -i $((i%MDSCOUNT)) $DIR/$tdir/d$i.$((i/MDSCOUNT+2))||
17124                         error "create $DIR/$tdir/d$i.$((i/MDSCOUNT+2)) failed"
17125         done
17126
17127         # ensure gc thread is done
17128         for i in $(mdts_nodes); do
17129                 wait_update $i "ps -e -o comm= | grep chlg_gc_thread" "" 20 ||
17130                         error "$i: GC-thread not done"
17131         done
17132
17133         local first_rec
17134         for (( i = 1; i <= MDSCOUNT; i++ )); do
17135                 # check cl_user1 still registered
17136                 changelog_users mds$i | grep -q "${cl_user1[mds$i]}" ||
17137                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17138                 # check cl_user2 unregistered
17139                 changelog_users mds$i | grep -q "${cl_user2[mds$i]}" &&
17140                         error "mds$i: User ${cl_user2[mds$i]} still registered"
17141
17142                 # check changelogs are present and starting at $user_rec1 + 1
17143                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17144                 [ -n "$user_rec1" ] ||
17145                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17146                 first_rec=$($LFS changelog $(facet_svc mds$i) |
17147                             awk '{ print $1; exit; }')
17148
17149                 echo "mds$i: $(date +%s) verify rec $user_rec1+1 == $first_rec"
17150                 [ $((user_rec1 + 1)) == $first_rec ] ||
17151                         error "mds$i: rec $first_rec != $user_rec1 + 1"
17152         done
17153 }
17154 run_test 160f "changelog garbage collect (timestamped users)"
17155
17156 test_160g() {
17157         remote_mds_nodsh && skip "remote MDS with nodsh"
17158         [[ $MDS1_VERSION -ge $(version_code 2.14.55) ]] ||
17159                 skip "Need MDS version at least 2.14.55"
17160
17161         local mdts=$(comma_list $(mdts_nodes))
17162
17163         # Create a user
17164         changelog_register || error "first changelog_register failed"
17165         changelog_register || error "second changelog_register failed"
17166         local cl_users
17167         declare -A cl_user1
17168         declare -A cl_user2
17169         local user_rec1
17170         local user_rec2
17171         local i
17172
17173         # generate some changelog records to accumulate on each MDT
17174         # use all_char because created files should be evenly distributed
17175         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17176                 error "test_mkdir $tdir failed"
17177         for ((i = 0; i < MDSCOUNT; i++)); do
17178                 $LFS mkdir -i $i $DIR/$tdir/d$i.1 $DIR/$tdir/d$i.2 ||
17179                         error "create $DIR/$tdir/d$i.1 failed"
17180         done
17181
17182         # check changelogs have been generated
17183         local nbcl=$(changelog_dump | wc -l)
17184         (( $nbcl > 0 )) || error "no changelogs found"
17185
17186         # reduce the max_idle_indexes value to make sure we exceed it
17187         for param in "changelog_max_idle_indexes=2" \
17188                      "changelog_gc=1" \
17189                      "changelog_min_gc_interval=2"; do
17190                 local MDT0=$(facet_svc $SINGLEMDS)
17191                 local var="${param%=*}"
17192                 local old=$(do_facet mds1 "$LCTL get_param -n mdd.$MDT0.$var")
17193
17194                 stack_trap "do_nodes $mdts $LCTL set_param mdd.*.$var=$old" EXIT
17195                 do_nodes $mdts $LCTL set_param mdd.*.$param ||
17196                         error "unable to set mdd.*.$param"
17197         done
17198
17199         local start=$SECONDS
17200         for i in $(seq $MDSCOUNT); do
17201                 cl_users=(${CL_USERS[mds$i]})
17202                 cl_user1[mds$i]="${cl_users[0]}"
17203                 cl_user2[mds$i]="${cl_users[1]}"
17204
17205                 [ -n "${cl_user1[mds$i]}" ] ||
17206                         error "mds$i: user1 is not registered"
17207                 [ -n "${cl_user2[mds$i]}" ] ||
17208                         error "mds$i: only ${cl_user1[mds$i]} is registered"
17209
17210                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17211                 [ -n "$user_rec1" ] ||
17212                         error "mds$i: user1 ${cl_user1[mds$i]} not found"
17213                 __changelog_clear mds$i ${cl_user1[mds$i]} +2
17214                 user_rec2=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17215                 [ -n "$user_rec2" ] ||
17216                         error "mds$i: user1 ${cl_user1[mds$i]} not found (2)"
17217                 echo "mds$i: verifying user1 ${cl_user1[mds$i]} clear: " \
17218                      "$user_rec1 + 2 == $user_rec2"
17219                 [ $((user_rec1 + 2)) == $user_rec2 ] ||
17220                         error "mds$i: user1 ${cl_user1[mds$i]} index " \
17221                               "expected $user_rec1 + 2, but is $user_rec2"
17222                 user_rec2=$(changelog_user_rec mds$i ${cl_user2[mds$i]})
17223                 [ -n "$user_rec2" ] ||
17224                         error "mds$i: user2 ${cl_user2[mds$i]} not found"
17225                 [ $user_rec1 == $user_rec2 ] ||
17226                         error "mds$i: user2 ${cl_user2[mds$i]} index " \
17227                               "expected $user_rec1, but is $user_rec2"
17228         done
17229
17230         # ensure we are past the previous changelog_min_gc_interval set above
17231         local sleep2=$((start + 2 - SECONDS))
17232         (( sleep2 > 0 )) && echo "sleep $sleep2 for interval" && sleep $sleep2
17233         # Generate one more changelog to trigger GC at fail_loc for cl_user2.
17234         # cl_user1 should be OK because it recently processed records.
17235         for ((i = 0; i < MDSCOUNT; i++)); do
17236                 $LFS mkdir -i $i $DIR/$tdir/d$i.3 ||
17237                         error "create $DIR/$tdir/d$i.3 failed"
17238         done
17239
17240         # ensure gc thread is done
17241         for i in $(mdts_nodes); do
17242                 wait_update $i "ps -e -o comm= | grep chlg_gc_thread" "" 20 ||
17243                         error "$i: GC-thread not done"
17244         done
17245
17246         local first_rec
17247         for (( i = 1; i <= MDSCOUNT; i++ )); do
17248                 # check cl_user1 still registered
17249                 changelog_users mds$i | grep -q "${cl_user1[mds$i]}" ||
17250                         error "mds$i: user1 ${cl_user1[mds$i]} not found (3)"
17251                 # check cl_user2 unregistered
17252                 changelog_users mds$i | grep -q "${cl_user2[mds$i]}" &&
17253                         error "mds$i: user2 ${cl_user2[mds$i]} is registered"
17254
17255                 # check changelogs are present and starting at $user_rec1 + 1
17256                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17257                 [ -n "$user_rec1" ] ||
17258                         error "mds$i: user1 ${cl_user1[mds$i]} not found (4)"
17259                 first_rec=$($LFS changelog $(facet_svc mds$i) |
17260                             awk '{ print $1; exit; }')
17261
17262                 echo "mds$i: $(date +%s) verify rec $user_rec1+1 == $first_rec"
17263                 [ $((user_rec1 + 1)) == $first_rec ] ||
17264                         error "mds$i: rec $first_rec != $user_rec1 + 1"
17265         done
17266 }
17267 run_test 160g "changelog garbage collect on idle records"
17268
17269 test_160h() {
17270         remote_mds_nodsh && skip "remote MDS with nodsh" && return
17271         [[ $MDS1_VERSION -ge $(version_code 2.10.56) ]] ||
17272                 skip "Need MDS version at least 2.10.56"
17273
17274         local mdts=$(comma_list $(mdts_nodes))
17275
17276         # Create a user
17277         changelog_register || error "first changelog_register failed"
17278         changelog_register || error "second changelog_register failed"
17279         local cl_users
17280         declare -A cl_user1
17281         declare -A cl_user2
17282         local user_rec1
17283         local user_rec2
17284         local i
17285
17286         # generate some changelog records to accumulate on each MDT
17287         # use all_char because created files should be evenly distributed
17288         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17289                 error "test_mkdir $tdir failed"
17290         for ((i = 0; i < MDSCOUNT; i++)); do
17291                 $LFS mkdir -i $i $DIR/$tdir/d$i.1 $DIR/$tdir/d$i.2 ||
17292                         error "create $DIR/$tdir/d$i.1 failed"
17293         done
17294
17295         # check changelogs have been generated
17296         local nbcl=$(changelog_dump | wc -l)
17297         [[ $nbcl -eq 0 ]] && error "no changelogs found"
17298
17299         for param in "changelog_max_idle_time=10" \
17300                      "changelog_gc=1" \
17301                      "changelog_min_gc_interval=2"; do
17302                 local MDT0=$(facet_svc $SINGLEMDS)
17303                 local var="${param%=*}"
17304                 local old=$(do_facet mds1 "$LCTL get_param -n mdd.$MDT0.$var")
17305
17306                 stack_trap "do_nodes $mdts $LCTL set_param mdd.*.$var=$old" EXIT
17307                 do_nodes $mdts $LCTL set_param mdd.*.$param
17308         done
17309
17310         # force cl_user2 to be idle (1st part)
17311         sleep 9
17312
17313         for i in $(seq $MDSCOUNT); do
17314                 cl_users=(${CL_USERS[mds$i]})
17315                 cl_user1[mds$i]="${cl_users[0]}"
17316                 cl_user2[mds$i]="${cl_users[1]}"
17317
17318                 [ -n "${cl_user1[mds$i]}" ] ||
17319                         error "mds$i: no user registered"
17320                 [ -n "${cl_user2[mds$i]}" ] ||
17321                         error "mds$i: only ${cl_user2[mds$i]} is registered"
17322
17323                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17324                 [ -n "$user_rec1" ] ||
17325                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17326                 __changelog_clear mds$i ${cl_user1[mds$i]} +2
17327                 user_rec2=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17328                 [ -n "$user_rec2" ] ||
17329                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17330                 echo "mds$i: verifying user ${cl_user1[mds$i]} clear: " \
17331                      "$user_rec1 + 2 == $user_rec2"
17332                 [ $((user_rec1 + 2)) == $user_rec2 ] ||
17333                         error "mds$i: user ${cl_user1[mds$i]} index expected " \
17334                               "$user_rec1 + 2, but is $user_rec2"
17335                 user_rec2=$(changelog_user_rec mds$i ${cl_user2[mds$i]})
17336                 [ -n "$user_rec2" ] ||
17337                         error "mds$i: User ${cl_user2[mds$i]} not registered"
17338                 [ $user_rec1 == $user_rec2 ] ||
17339                         error "mds$i: user ${cl_user2[mds$i]} index expected " \
17340                               "$user_rec1, but is $user_rec2"
17341         done
17342
17343         # force cl_user2 to be idle (2nd part) and to reach
17344         # changelog_max_idle_time
17345         sleep 2
17346
17347         # force each GC-thread start and block then
17348         # one per MDT/MDD, set fail_val accordingly
17349         #define OBD_FAIL_FORCE_GC_THREAD 0x1316
17350         do_nodes $mdts $LCTL set_param fail_loc=0x1316
17351
17352         # generate more changelogs to trigger fail_loc
17353         createmany -m $DIR/$tdir/${tfile}bis $((MDSCOUNT * 2)) ||
17354                 error "create $DIR/$tdir/${tfile}bis failed"
17355
17356         # stop MDT to stop GC-thread, should be done in back-ground as it will
17357         # block waiting for the thread to be released and exit
17358         declare -A stop_pids
17359         for i in $(seq $MDSCOUNT); do
17360                 stop mds$i &
17361                 stop_pids[mds$i]=$!
17362         done
17363
17364         for i in $(mdts_nodes); do
17365                 local facet
17366                 local nb=0
17367                 local facets=$(facets_up_on_host $i)
17368
17369                 for facet in ${facets//,/ }; do
17370                         if [[ $facet == mds* ]]; then
17371                                 nb=$((nb + 1))
17372                         fi
17373                 done
17374                 # ensure each MDS's gc threads are still present and all in "R"
17375                 # state (OBD_FAIL_FORCE_GC_THREAD effect!)
17376                 [[ $(do_node $i pgrep chlg_gc_thread | wc -l) -eq $nb ]] ||
17377                         error "$i: expected $nb GC-thread"
17378                 wait_update $i \
17379                         "ps -C chlg_gc_thread -o state --no-headers | uniq" \
17380                         "R" 20 ||
17381                         error "$i: GC-thread not found in R-state"
17382                 # check umounts of each MDT on MDS have reached kthread_stop()
17383                 [[ $(do_node $i pgrep umount | wc -l) -eq $nb ]] ||
17384                         error "$i: expected $nb umount"
17385                 wait_update $i \
17386                         "ps -C umount -o state --no-headers | uniq" "D" 20 ||
17387                         error "$i: umount not found in D-state"
17388         done
17389
17390         # release all GC-threads
17391         do_nodes $mdts $LCTL set_param fail_loc=0
17392
17393         # wait for MDT stop to complete
17394         for i in $(seq $MDSCOUNT); do
17395                 wait ${stop_pids[mds$i]} || error "mds$i: stop failed"
17396         done
17397
17398         # XXX
17399         # may try to check if any orphan changelog records are present
17400         # via ldiskfs/zfs and llog_reader...
17401
17402         # re-start/mount MDTs
17403         for i in $(seq $MDSCOUNT); do
17404                 start mds$i $(mdsdevname $i) $MDS_MOUNT_OPTS ||
17405                         error "Fail to start mds$i"
17406         done
17407
17408         local first_rec
17409         for i in $(seq $MDSCOUNT); do
17410                 # check cl_user1 still registered
17411                 changelog_users mds$i | grep -q "${cl_user1[mds$i]}" ||
17412                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17413                 # check cl_user2 unregistered
17414                 changelog_users mds$i | grep -q "${cl_user2[mds$i]}" &&
17415                         error "mds$i: User ${cl_user2[mds$i]} still registered"
17416
17417                 # check changelogs are present and starting at $user_rec1 + 1
17418                 user_rec1=$(changelog_user_rec mds$i ${cl_user1[mds$i]})
17419                 [ -n "$user_rec1" ] ||
17420                         error "mds$i: User ${cl_user1[mds$i]} not registered"
17421                 first_rec=$($LFS changelog $(facet_svc mds$i) |
17422                             awk '{ print $1; exit; }')
17423
17424                 echo "mds$i: verifying first index $user_rec1 + 1 == $first_rec"
17425                 [ $((user_rec1 + 1)) == $first_rec ] ||
17426                         error "mds$i: first index should be $user_rec1 + 1, " \
17427                               "but is $first_rec"
17428         done
17429 }
17430 run_test 160h "changelog gc thread stop upon umount, orphan records delete " \
17431               "during mount"
17432
17433 test_160i() {
17434
17435         local mdts=$(comma_list $(mdts_nodes))
17436
17437         changelog_register || error "first changelog_register failed"
17438
17439         # generate some changelog records to accumulate on each MDT
17440         # use all_char because created files should be evenly distributed
17441         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17442                 error "test_mkdir $tdir failed"
17443         for ((i = 0; i < MDSCOUNT; i++)); do
17444                 $LFS mkdir -i $i $DIR/$tdir/d$i.1 $DIR/$tdir/d$i.2 ||
17445                         error "create $DIR/$tdir/d$i.1 failed"
17446         done
17447
17448         # check changelogs have been generated
17449         local nbcl=$(changelog_dump | wc -l)
17450         [[ $nbcl -eq 0 ]] && error "no changelogs found"
17451
17452         # simulate race between register and unregister
17453         # XXX as fail_loc is set per-MDS, with DNE configs the race
17454         # simulation will only occur for one MDT per MDS and for the
17455         # others the normal race scenario will take place
17456         #define CFS_FAIL_CHLOG_USER_REG_UNREG_RACE          0x1315
17457         do_nodes $mdts $LCTL set_param fail_loc=0x10001315
17458         do_nodes $mdts $LCTL set_param fail_val=1
17459
17460         # unregister 1st user
17461         changelog_deregister &
17462         local pid1=$!
17463         # wait some time for deregister work to reach race rdv
17464         sleep 2
17465         # register 2nd user
17466         changelog_register || error "2nd user register failed"
17467
17468         wait $pid1 || error "1st user deregister failed"
17469
17470         local i
17471         local last_rec
17472         declare -A LAST_REC
17473         for i in $(seq $MDSCOUNT); do
17474                 if changelog_users mds$i | grep "^cl"; then
17475                         # make sure new records are added with one user present
17476                         LAST_REC[mds$i]=$(changelog_users $SINGLEMDS |
17477                                           awk '/^current.index:/ { print $NF }')
17478                 else
17479                         error "mds$i has no user registered"
17480                 fi
17481         done
17482
17483         # generate more changelog records to accumulate on each MDT
17484         createmany -m $DIR/$tdir/${tfile}bis $((MDSCOUNT * 2)) ||
17485                 error "create $DIR/$tdir/${tfile}bis failed"
17486
17487         for i in $(seq $MDSCOUNT); do
17488                 last_rec=$(changelog_users $SINGLEMDS |
17489                            awk '/^current.index:/ { print $NF }')
17490                 echo "verify changelogs are on: $last_rec != ${LAST_REC[mds$i]}"
17491                 [ $last_rec != ${LAST_REC[mds$i]} ] ||
17492                         error "changelogs are off on mds$i"
17493         done
17494 }
17495 run_test 160i "changelog user register/unregister race"
17496
17497 test_160j() {
17498         remote_mds_nodsh && skip "remote MDS with nodsh"
17499         [[ $MDS1_VERSION -lt $(version_code 2.12.56) ]] &&
17500                 skip "Need MDS version at least 2.12.56"
17501
17502         mount_client $MOUNT2 || error "mount_client on $MOUNT2 failed"
17503         stack_trap "umount $MOUNT2" EXIT
17504
17505         changelog_register || error "first changelog_register failed"
17506         stack_trap "changelog_deregister" EXIT
17507
17508         # generate some changelog
17509         # use all_char because created files should be evenly distributed
17510         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17511                 error "mkdir $tdir failed"
17512         for ((i = 0; i < MDSCOUNT; i++)); do
17513                 $LFS mkdir -i $i $DIR/$tdir/d$i.1 $DIR/$tdir/d$i.2 ||
17514                         error "create $DIR/$tdir/d$i.1 failed"
17515         done
17516
17517         # open the changelog device
17518         exec 3>/dev/changelog-$FSNAME-MDT0000
17519         stack_trap "exec 3>&-" EXIT
17520         exec 4</dev/changelog-$FSNAME-MDT0000
17521         stack_trap "exec 4<&-" EXIT
17522
17523         # umount the first lustre mount
17524         umount $MOUNT
17525         stack_trap "mount_client $MOUNT" EXIT
17526
17527         # read changelog, which may or may not fail, but should not crash
17528         cat <&4 >/dev/null
17529
17530         # clear changelog
17531         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
17532         changelog_users $SINGLEMDS | grep -q $cl_user ||
17533                 error "User $cl_user not found in changelog_users"
17534
17535         printf 'clear:'$cl_user':0' >&3
17536 }
17537 run_test 160j "client can be umounted while its chanangelog is being used"
17538
17539 test_160k() {
17540         [ $PARALLEL == "yes" ] && skip "skip parallel run"
17541         remote_mds_nodsh && skip "remote MDS with nodsh"
17542
17543         mkdir -p $DIR/$tdir/1/1
17544
17545         changelog_register || error "changelog_register failed"
17546         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
17547
17548         changelog_users $SINGLEMDS | grep -q $cl_user ||
17549                 error "User '$cl_user' not found in changelog_users"
17550 #define OBD_FAIL_MDS_CHANGELOG_REORDER 0x15d
17551         do_facet mds1 $LCTL set_param fail_loc=0x8000015d fail_val=3
17552         rmdir $DIR/$tdir/1/1 & sleep 1
17553         mkdir $DIR/$tdir/2
17554         touch $DIR/$tdir/2/2
17555         rm -rf $DIR/$tdir/2
17556
17557         wait
17558         sleep 4
17559
17560         changelog_dump | grep rmdir || error "rmdir not recorded"
17561 }
17562 run_test 160k "Verify that changelog records are not lost"
17563
17564 # Verifies that a file passed as a parameter has recently had an operation
17565 # performed on it that has generated an MTIME changelog which contains the
17566 # correct parent FID. As files might reside on a different MDT from the
17567 # parent directory in DNE configurations, the FIDs are translated to paths
17568 # before being compared, which should be identical
17569 compare_mtime_changelog() {
17570         local file="${1}"
17571         local mdtidx
17572         local mtime
17573         local cl_fid
17574         local pdir
17575         local dir
17576
17577         mdtidx=$($LFS getstripe --mdt-index $file)
17578         mdtidx=$(printf "%04x" $mdtidx)
17579
17580         # Obtain the parent FID from the MTIME changelog
17581         mtime=$($LFS changelog $FSNAME-MDT$mdtidx | tail -n 1 | grep MTIME)
17582         [ -z "$mtime" ] && error "MTIME changelog not recorded"
17583
17584         cl_fid=$(sed -e 's/.* p=//' -e 's/ .*//' <<<$mtime)
17585         [ -z "$cl_fid" ] && error "parent FID not present"
17586
17587         # Verify that the path for the parent FID is the same as the path for
17588         # the test directory
17589         pdir=$($LFS fid2path $MOUNT "$cl_fid")
17590
17591         dir=$(dirname $1)
17592
17593         [[ "${pdir%/}" == "$dir" ]] ||
17594                 error "MTIME changelog parent FID is wrong, expected $dir, got $pdir"
17595 }
17596
17597 test_160l() {
17598         [ $PARALLEL == "yes" ] && skip "skip parallel run"
17599
17600         remote_mds_nodsh && skip "remote MDS with nodsh"
17601         [[ $MDS1_VERSION -ge $(version_code 2.13.55) ]] ||
17602                 skip "Need MDS version at least 2.13.55"
17603
17604         local cl_user
17605
17606         changelog_register || error "changelog_register failed"
17607         cl_user="${CL_USERS[$SINGLEMDS]%% *}"
17608
17609         changelog_users $SINGLEMDS | grep -q $cl_user ||
17610                 error "User '$cl_user' not found in changelog_users"
17611
17612         # Clear some types so that MTIME changelogs are generated
17613         changelog_chmask "-CREAT"
17614         changelog_chmask "-CLOSE"
17615
17616         test_mkdir $DIR/$tdir || error "failed to mkdir $DIR/$tdir"
17617
17618         # Test CL_MTIME during setattr
17619         touch $DIR/$tdir/$tfile
17620         compare_mtime_changelog $DIR/$tdir/$tfile
17621
17622         # Test CL_MTIME during close
17623         $MULTIOP $DIR/$tdir/${tfile}_2 O_2w4096c || error "multiop failed"
17624         compare_mtime_changelog $DIR/$tdir/${tfile}_2
17625 }
17626 run_test 160l "Verify that MTIME changelog records contain the parent FID"
17627
17628 test_160m() {
17629         remote_mds_nodsh && skip "remote MDS with nodsh" && return
17630         [[ $MDS1_VERSION -ge $(version_code 2.14.51) ]] ||
17631                 skip "Need MDS version at least 2.14.51"
17632         local cl_users
17633         local cl_user1
17634         local cl_user2
17635         local pid1
17636
17637         # Create a user
17638         changelog_register || error "first changelog_register failed"
17639         changelog_register || error "second changelog_register failed"
17640
17641         cl_users=(${CL_USERS[mds1]})
17642         cl_user1="${cl_users[0]}"
17643         cl_user2="${cl_users[1]}"
17644         # generate some changelog records to accumulate on MDT0
17645         test_mkdir -p -i0 -c1 $DIR/$tdir || error "test_mkdir $tdir failed"
17646         createmany -m $DIR/$tdir/$tfile 50 ||
17647                 error "create $DIR/$tdir/$tfile failed"
17648         unlinkmany $DIR/$tdir/$tfile 50 || error "unlinkmany failed"
17649         rm -f $DIR/$tdir
17650
17651         # check changelogs have been generated
17652         local nbcl=$(changelog_dump | wc -l)
17653         [[ $nbcl -eq 0 ]] && error "no changelogs found"
17654
17655 #define OBD_FAIL_MDS_CHANGELOG_RACE      0x15f
17656         do_facet mds1 $LCTL set_param fail_loc=0x8000015f fail_val=0
17657
17658         __changelog_clear mds1 $cl_user1 +10
17659         __changelog_clear mds1 $cl_user2 0 &
17660         pid1=$!
17661         sleep 2
17662         __changelog_clear mds1 $cl_user1 0 ||
17663                 error "fail to cancel record for $cl_user1"
17664         wait $pid1
17665         [[ $? -eq 0 ]] || error "fail to cancel record for $cl_user2"
17666 }
17667 run_test 160m "Changelog clear race"
17668
17669 test_160n() {
17670         remote_mds_nodsh && skip "remote MDS with nodsh" && return
17671         [[ $MDS1_VERSION -ge $(version_code 2.14.51) ]] ||
17672                 skip "Need MDS version at least 2.14.51"
17673         local cl_users
17674         local cl_user1
17675         local cl_user2
17676         local pid1
17677         local first_rec
17678         local last_rec=0
17679
17680         # Create a user
17681         changelog_register || error "first changelog_register failed"
17682
17683         cl_users=(${CL_USERS[mds1]})
17684         cl_user1="${cl_users[0]}"
17685
17686         # generate some changelog records to accumulate on MDT0
17687         test_mkdir -i0 -c1 $DIR/$tdir || error "test_mkdir $tdir failed"
17688         first_rec=$(changelog_users $SINGLEMDS |
17689                         awk '/^current.index:/ { print $NF }')
17690         while (( last_rec < (( first_rec + 65000)) )); do
17691                 createmany -m $DIR/$tdir/$tfile 10000 ||
17692                         error "create $DIR/$tdir/$tfile failed"
17693
17694                 for i in $(seq 0 10000); do
17695                         mrename $DIR/$tdir/$tfile$i $DIR/$tdir/$tfile-new$i \
17696                                 > /dev/null
17697                 done
17698
17699                 unlinkmany $DIR/$tdir/$tfile-new 10000 ||
17700                         error "unlinkmany failed unlink"
17701                 last_rec=$(changelog_users $SINGLEMDS |
17702                         awk '/^current.index:/ { print $NF }')
17703                 echo last record $last_rec
17704                 (( last_rec == 0 )) && error "no changelog found"
17705         done
17706
17707 #define OBD_FAIL_MDS_CHANGELOG_DEL       0x16c
17708         do_facet mds1 $LCTL set_param fail_loc=0x8000016c fail_val=0
17709
17710         __changelog_clear mds1 $cl_user1 0 &
17711         pid1=$!
17712         sleep 2
17713         __changelog_clear mds1 $cl_user1 0 ||
17714                 error "fail to cancel record for $cl_user1"
17715         wait $pid1
17716         [[ $? -eq 0 ]] || error "fail to cancel record for $cl_user2"
17717 }
17718 run_test 160n "Changelog destroy race"
17719
17720 test_160o() {
17721         local mdt="$(facet_svc $SINGLEMDS)"
17722
17723         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
17724         remote_mds_nodsh && skip "remote MDS with nodsh"
17725         [ $MDS1_VERSION -ge $(version_code 2.14.52) ] ||
17726                 skip "Need MDS version at least 2.14.52"
17727
17728         changelog_register --user test_160o -m unlnk+close+open ||
17729                 error "changelog_register failed"
17730
17731         do_facet $SINGLEMDS $LCTL --device $mdt \
17732                                 changelog_register -u "Tt3_-#" &&
17733                 error "bad symbols in name should fail"
17734
17735         do_facet $SINGLEMDS $LCTL --device $mdt \
17736                                 changelog_register -u test_160o &&
17737                 error "the same name registration should fail"
17738
17739         do_facet $SINGLEMDS $LCTL --device $mdt \
17740                         changelog_register -u test_160toolongname &&
17741                 error "too long name registration should fail"
17742
17743         changelog_chmask "MARK+HSM"
17744         lctl get_param mdd.*.changelog*mask
17745         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
17746         changelog_users $SINGLEMDS | grep -q $cl_user ||
17747                 error "User $cl_user not found in changelog_users"
17748         #verify username
17749         echo $cl_user | grep -q test_160o ||
17750                 error "User $cl_user has no specific name 'test160o'"
17751
17752         # change something
17753         changelog_clear 0 || error "changelog_clear failed"
17754         # generate some changelog records to accumulate on MDT0
17755         test_mkdir -p -i0 -c1 $DIR/$tdir || error "test_mkdir $tdir failed"
17756         touch $DIR/$tdir/$tfile                 # open 1
17757
17758         OPENS=$(changelog_dump | grep -c "OPEN")
17759         [[ $OPENS -eq 1 ]] || error "OPEN changelog mask count $OPENS != 1"
17760
17761         # must be no MKDIR it wasn't set as user mask
17762         MKDIR=$(changelog_dump | grep -c "MKDIR")
17763         [[ $MKDIR -eq 0 ]] || error "MKDIR changelog mask found $MKDIR > 0"
17764
17765         oldmask=$(do_facet $SINGLEMDS $LCTL get_param \
17766                                 mdd.$mdt.changelog_current_mask -n)
17767         # register maskless user
17768         changelog_register || error "changelog_register failed"
17769         # effective mask should be not changed because it is not minimal
17770         mask=$(do_facet $SINGLEMDS $LCTL get_param \
17771                                 mdd.$mdt.changelog_current_mask -n)
17772         [[ $mask == $oldmask ]] || error "mask was changed: $mask vs $oldmask"
17773         # set server mask to minimal value
17774         changelog_chmask "MARK"
17775         # check effective mask again, should be treated as DEFMASK now
17776         mask=$(do_facet $SINGLEMDS $LCTL get_param \
17777                                 mdd.$mdt.changelog_current_mask -n)
17778         [[ $mask == *"HLINK"* ]] || error "mask is not DEFMASK as expected"
17779
17780         if (( $MDS1_VERSION >= $(version_code 2.15.52) )) ; then
17781                 # set server mask back to some value
17782                 changelog_chmask "CLOSE,UNLNK"
17783                 # check effective mask again, should not remain as DEFMASK
17784                 mask=$(do_facet $SINGLEMDS $LCTL get_param \
17785                                 mdd.$mdt.changelog_current_mask -n)
17786                 [[ $mask != *"HLINK"* ]] || error "mask is still DEFMASK"
17787         fi
17788
17789         do_facet $SINGLEMDS $LCTL --device $mdt \
17790                                 changelog_deregister -u test_160o ||
17791                 error "cannot deregister by name"
17792 }
17793 run_test 160o "changelog user name and mask"
17794
17795 test_160p() {
17796         remote_mds_nodsh && skip "remote MDS with nodsh" && return
17797         [[ $MDS1_VERSION -ge $(version_code 2.14.51) ]] ||
17798                 skip "Need MDS version at least 2.14.51"
17799         [[ "$mds1_FSTYPE" == "ldiskfs" ]] || skip "ldiskfs only test"
17800         local cl_users
17801         local cl_user1
17802         local entry_count
17803
17804         # Create a user
17805         changelog_register || error "first changelog_register failed"
17806
17807         cl_users=(${CL_USERS[mds1]})
17808         cl_user1="${cl_users[0]}"
17809
17810         test_mkdir -p -i0 -c1 $DIR/$tdir || error "test_mkdir $tdir failed"
17811         createmany -m $DIR/$tdir/$tfile 50 ||
17812                 error "create $DIR/$tdir/$tfile failed"
17813         unlinkmany $DIR/$tdir/$tfile 50 || error "unlinkmany failed"
17814         rm -rf $DIR/$tdir
17815
17816         # check changelogs have been generated
17817         entry_count=$(changelog_dump | wc -l)
17818         ((entry_count != 0)) || error "no changelog entries found"
17819
17820         # remove changelog_users and check that orphan entries are removed
17821         stop mds1
17822         local dev=$(mdsdevname 1)
17823         do_facet mds1 "$DEBUGFS -w -R 'rm changelog_users' $dev"
17824         start mds1 $dev $MDS_MOUNT_OPTS || error "cannot start mds1"
17825         entry_count=$(changelog_dump | wc -l)
17826         ((entry_count == 0)) ||
17827                 error "found $entry_count changelog entries, expected none"
17828 }
17829 run_test 160p "Changelog orphan cleanup with no users"
17830
17831 test_160q() {
17832         local mdt="$(facet_svc $SINGLEMDS)"
17833         local clu
17834
17835         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
17836         remote_mds_nodsh && skip "remote MDS with nodsh"
17837         [ $MDS1_VERSION -ge $(version_code 2.14.54) ] ||
17838                 skip "Need MDS version at least 2.14.54"
17839
17840         # set server mask to minimal value like server init does
17841         changelog_chmask "MARK"
17842         clu=$(do_facet $SINGLEMDS $LCTL --device $mdt changelog_register -n) ||
17843                 error "changelog_register failed"
17844         # check effective mask again, should be treated as DEFMASK now
17845         mask=$(do_facet $SINGLEMDS $LCTL get_param \
17846                                 mdd.$mdt.changelog_current_mask -n)
17847         do_facet $SINGLEMDS $LCTL --device $mdt changelog_deregister $clu ||
17848                 error "changelog_deregister failed"
17849         [[ $mask == *"HLINK"* ]] || error "mask is not DEFMASK as expected"
17850 }
17851 run_test 160q "changelog effective mask is DEFMASK if not set"
17852
17853 test_160s() {
17854         remote_mds_nodsh && skip "remote MDS with nodsh"
17855         (( $MDS1_VERSION >= $(version_code 2.14.55) )) ||
17856                 skip "Need MDS version at least 2.14.55"
17857
17858         local mdts=$(comma_list $(mdts_nodes))
17859
17860         #define OBD_FAIL_TIME_IN_CHLOG_USER     0x1314
17861         do_nodes $mdts $LCTL set_param fail_loc=0x1314 \
17862                                        fail_val=$((24 * 3600 * 10))
17863
17864         # Create a user which is 10 days old
17865         changelog_register || error "first changelog_register failed"
17866         local cl_users
17867         declare -A cl_user1
17868         local i
17869
17870         # generate some changelog records to accumulate on each MDT
17871         # use all_char because created files should be evenly distributed
17872         test_mkdir -c $MDSCOUNT -H all_char $DIR/$tdir ||
17873                 error "test_mkdir $tdir failed"
17874         for ((i = 0; i < MDSCOUNT; i++)); do
17875                 $LFS mkdir -i $i $DIR/$tdir/d$i.1 $DIR/$tdir/d$i.2 ||
17876                         error "create $DIR/$tdir/d$i.1 failed"
17877         done
17878
17879         # check changelogs have been generated
17880         local nbcl=$(changelog_dump | wc -l)
17881         (( nbcl > 0 )) || error "no changelogs found"
17882
17883         # reduce the max_idle_indexes value to make sure we exceed it
17884         for param in "changelog_max_idle_indexes=2097446912" \
17885                      "changelog_max_idle_time=2592000" \
17886                      "changelog_gc=1" \
17887                      "changelog_min_gc_interval=2"; do
17888                 local MDT0=$(facet_svc $SINGLEMDS)
17889                 local var="${param%=*}"
17890                 local old=$(do_facet mds1 "$LCTL get_param -n mdd.$MDT0.$var")
17891
17892                 stack_trap "do_nodes $mdts $LCTL set_param mdd.*.$var=$old" EXIT
17893                 do_nodes $mdts $LCTL set_param mdd.*.$param ||
17894                         error "unable to set mdd.*.$param"
17895         done
17896
17897         local start=$SECONDS
17898         for i in $(seq $MDSCOUNT); do
17899                 cl_users=(${CL_USERS[mds$i]})
17900                 cl_user1[mds$i]="${cl_users[0]}"
17901
17902                 [[ -n "${cl_user1[mds$i]}" ]] ||
17903                         error "mds$i: no user registered"
17904         done
17905
17906         #define OBD_FAIL_MDS_CHANGELOG_IDX_PUMP   0x16d
17907         do_nodes $mdts $LCTL set_param fail_loc=0x16d fail_val=500000000
17908
17909         # ensure we are past the previous changelog_min_gc_interval set above
17910         local sleep2=$((start + 2 - SECONDS))
17911         (( sleep2 > 0 )) && echo "sleep $sleep2 for interval" && sleep $sleep2
17912
17913         # Generate one more changelog to trigger GC
17914         for ((i = 0; i < MDSCOUNT; i++)); do
17915                 $LFS mkdir -i $i $DIR/$tdir/d$i.3 $DIR/$tdir/d$i.4 ||
17916                         error "create $DIR/$tdir/d$i.3 failed"
17917         done
17918
17919         # ensure gc thread is done
17920         for node in $(mdts_nodes); do
17921                 wait_update $node "pgrep chlg_gc_thread" "" 20 ||
17922                         error "$node: GC-thread not done"
17923         done
17924
17925         do_nodes $mdts $LCTL set_param fail_loc=0
17926
17927         for (( i = 1; i <= MDSCOUNT; i++ )); do
17928                 # check cl_user1 is purged
17929                 changelog_users mds$i | grep -q "${cl_user1[mds$i]}" &&
17930                         error "mds$i: User ${cl_user1[mds$i]} is registered"
17931         done
17932         return 0
17933 }
17934 run_test 160s "changelog garbage collect on idle records * time"
17935
17936 test_160t() {
17937         remote_mds_nodsh && skip "remote MDS with nodsh"
17938         (( $MDS1_VERSION >= $(version_code 2.15.50) )) ||
17939                 skip "Need MDS version at least 2.15.50"
17940
17941         local MDT0=$(facet_svc $SINGLEMDS)
17942         local cl_users
17943         local cl_user1
17944         local cl_user2
17945         local start
17946
17947         changelog_register --user user1 -m all ||
17948                 error "user1 failed to register"
17949
17950         mkdir_on_mdt0 $DIR/$tdir
17951         # create default overstripe to maximize changelog size
17952         $LFS setstripe  -C 8 $DIR/$tdir || error "setstripe failed"
17953         createmany -o $DIR/$tdir/u1_ 2000 || error "createmany for user1 failed"
17954         llog_size1=$(do_facet mds1 $LCTL get_param -n mdd.$MDT0.changelog_size)
17955
17956         # user2 consumes less records so less space
17957         changelog_register --user user2 || error "user2 failed to register"
17958         createmany -o $DIR/$tdir/u2_ 500 || error "createmany for user2 failed"
17959         llog_size2=$(do_facet mds1 $LCTL get_param -n mdd.$MDT0.changelog_size)
17960
17961         # check changelogs have been generated
17962         local nbcl=$(changelog_dump | wc -l)
17963         (( nbcl > 0 )) || error "no changelogs found"
17964
17965         # reduce the changelog_min_gc_interval to force check
17966         for param in "changelog_gc=1" "changelog_min_gc_interval=2"; do
17967                 local var="${param%=*}"
17968                 local old=$(do_facet mds1 "$LCTL get_param -n mdd.$MDT0.$var")
17969
17970                 stack_trap "do_facet mds1 $LCTL set_param mdd.$MDT0.$var=$old"
17971                 do_facet mds1 $LCTL set_param mdd.$MDT0.$param ||
17972                         error "unable to set mdd.*.$param"
17973         done
17974
17975         start=$SECONDS
17976         cl_users=(${CL_USERS[mds1]})
17977         cl_user1="${cl_users[0]}"
17978         cl_user2="${cl_users[1]}"
17979
17980         [[ -n $cl_user1 ]] ||
17981                 error "mds1: user #1 isn't registered"
17982         [[ -n $cl_user2 ]] ||
17983                 error "mds1: user #2 isn't registered"
17984
17985         # ensure we are past the previous changelog_min_gc_interval set above
17986         local sleep2=$((start + 2 - SECONDS))
17987         (( sleep2 > 0 )) && echo "sleep $sleep2 for interval" && sleep $sleep2
17988
17989         #define OBD_FAIL_MDS_CHANGELOG_ENOSPC 0x018c
17990         do_facet mds1 $LCTL set_param fail_loc=0x018c \
17991                         fail_val=$(((llog_size1 + llog_size2) / 2))
17992
17993         # Generate more changelog to trigger GC
17994         createmany -o $DIR/$tdir/u3_ 4 ||
17995                 error "create failed for more files"
17996
17997         # ensure gc thread is done
17998         wait_update_facet mds1 "pgrep chlg_gc_thread" "" 20 ||
17999                 error "mds1: GC-thread not done"
18000
18001         do_facet mds1 $LCTL set_param fail_loc=0
18002
18003         # check cl_user1 is purged
18004         changelog_users mds1 | grep -q "$cl_user1" &&
18005                 error "User $cl_user1 is registered"
18006         # check cl_user2 is not purged
18007         changelog_users mds1 | grep -q "$cl_user2" ||
18008                 error "User $cl_user2 is not registered"
18009 }
18010 run_test 160t "changelog garbage collect on lack of space"
18011
18012 test_161a() {
18013         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18014
18015         test_mkdir -c1 $DIR/$tdir
18016         cp /etc/hosts $DIR/$tdir/$tfile
18017         test_mkdir -c1 $DIR/$tdir/foo1
18018         test_mkdir -c1 $DIR/$tdir/foo2
18019         ln $DIR/$tdir/$tfile $DIR/$tdir/foo1/sofia
18020         ln $DIR/$tdir/$tfile $DIR/$tdir/foo2/zachary
18021         ln $DIR/$tdir/$tfile $DIR/$tdir/foo1/luna
18022         ln $DIR/$tdir/$tfile $DIR/$tdir/foo2/thor
18023         local FID=$($LFS path2fid $DIR/$tdir/$tfile | tr -d '[]')
18024         if [ "$($LFS fid2path $DIR $FID | wc -l)" != "5" ]; then
18025                 $LFS fid2path $DIR $FID
18026                 error "bad link ea"
18027         fi
18028         # middle
18029         rm $DIR/$tdir/foo2/zachary
18030         # last
18031         rm $DIR/$tdir/foo2/thor
18032         # first
18033         rm $DIR/$tdir/$tfile
18034         # rename
18035         mv $DIR/$tdir/foo1/sofia $DIR/$tdir/foo2/maggie
18036         [ "$($LFS fid2path $FSNAME --link 1 $FID)" != "$tdir/foo2/maggie" ] &&
18037                 { $LFS fid2path $DIR $FID; error "bad link rename"; }
18038         rm $DIR/$tdir/foo2/maggie
18039
18040         # overflow the EA
18041         local longname=$tfile.avg_len_is_thirty_two_
18042         stack_trap "unlinkmany $DIR/$tdir/foo2/$longname 1000 || \
18043                 error_noexit 'failed to unlink many hardlinks'" EXIT
18044         createmany -l$DIR/$tdir/foo1/luna $DIR/$tdir/foo2/$longname 1000 ||
18045                 error "failed to hardlink many files"
18046         links=$($LFS fid2path $DIR $FID | wc -l)
18047         echo -n "${links}/1000 links in link EA"
18048         [[ $links -gt 60 ]] || error "expected at least 60 links in link EA"
18049 }
18050 run_test 161a "link ea sanity"
18051
18052 test_161b() {
18053         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18054         [ $MDSCOUNT -lt 2 ] && skip_env "skipping remote directory test"
18055
18056         local MDTIDX=1
18057         local remote_dir=$DIR/$tdir/remote_dir
18058
18059         mkdir -p $DIR/$tdir
18060         $LFS mkdir -i $MDTIDX $remote_dir ||
18061                 error "create remote directory failed"
18062
18063         cp /etc/hosts $remote_dir/$tfile
18064         mkdir -p $remote_dir/foo1
18065         mkdir -p $remote_dir/foo2
18066         ln $remote_dir/$tfile $remote_dir/foo1/sofia
18067         ln $remote_dir/$tfile $remote_dir/foo2/zachary
18068         ln $remote_dir/$tfile $remote_dir/foo1/luna
18069         ln $remote_dir/$tfile $remote_dir/foo2/thor
18070
18071         local FID=$($LFS path2fid $remote_dir/$tfile | tr -d '[' |
18072                      tr -d ']')
18073         if [ "$($LFS fid2path $DIR $FID | wc -l)" != "5" ]; then
18074                 $LFS fid2path $DIR $FID
18075                 error "bad link ea"
18076         fi
18077         # middle
18078         rm $remote_dir/foo2/zachary
18079         # last
18080         rm $remote_dir/foo2/thor
18081         # first
18082         rm $remote_dir/$tfile
18083         # rename
18084         mv $remote_dir/foo1/sofia $remote_dir/foo2/maggie
18085         local link_path=$($LFS fid2path $FSNAME --link 1 $FID)
18086         if [ "$DIR/$link_path" != "$remote_dir/foo2/maggie" ]; then
18087                 $LFS fid2path $DIR $FID
18088                 error "bad link rename"
18089         fi
18090         rm $remote_dir/foo2/maggie
18091
18092         # overflow the EA
18093         local longname=filename_avg_len_is_thirty_two_
18094         createmany -l$remote_dir/foo1/luna $remote_dir/foo2/$longname 1000 ||
18095                 error "failed to hardlink many files"
18096         links=$($LFS fid2path $DIR $FID | wc -l)
18097         echo -n "${links}/1000 links in link EA"
18098         [[ ${links} -gt 60 ]] ||
18099                 error "expected at least 60 links in link EA"
18100         unlinkmany $remote_dir/foo2/$longname 1000 ||
18101         error "failed to unlink many hardlinks"
18102 }
18103 run_test 161b "link ea sanity under remote directory"
18104
18105 test_161c() {
18106         remote_mds_nodsh && skip "remote MDS with nodsh"
18107         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18108         [[ $MDS1_VERSION -lt $(version_code 2.1.5) ]] &&
18109                 skip "Need MDS version at least 2.1.5"
18110
18111         # define CLF_RENAME_LAST 0x0001
18112         # rename overwrite a target having nlink = 1 (changelog flag 0x1)
18113         changelog_register || error "changelog_register failed"
18114
18115         rm -rf $DIR/$tdir
18116         test_mkdir -i $((MDSCOUNT - 1)) $DIR/$tdir
18117         touch $DIR/$tdir/foo_161c
18118         touch $DIR/$tdir/bar_161c
18119         mv -f $DIR/$tdir/foo_161c $DIR/$tdir/bar_161c
18120         changelog_dump | grep RENME | tail -n 5
18121         local flags=$(changelog_dump | grep "RENME.*bar_161c" | cut -f5 -d' ')
18122         changelog_clear 0 || error "changelog_clear failed"
18123         if [ x$flags != "x0x1" ]; then
18124                 error "flag $flags is not 0x1"
18125         fi
18126
18127         echo "rename overwrite target with nlink = 1, changelog flags=$flags"
18128         # rename overwrite a target having nlink > 1 (changelog flag 0x0)
18129         touch $DIR/$tdir/foo_161c
18130         touch $DIR/$tdir/bar_161c
18131         ln $DIR/$tdir/bar_161c $DIR/$tdir/foobar_161c
18132         mv -f $DIR/$tdir/foo_161c $DIR/$tdir/bar_161c
18133         changelog_dump | grep RENME | tail -n 5
18134         flags=$(changelog_dump | grep "RENME.*bar_161c" | cut -f5 -d' ')
18135         changelog_clear 0 || error "changelog_clear failed"
18136         if [ x$flags != "x0x0" ]; then
18137                 error "flag $flags is not 0x0"
18138         fi
18139         echo "rename overwrite a target having nlink > 1," \
18140                 "changelog record has flags of $flags"
18141
18142         # rename doesn't overwrite a target (changelog flag 0x0)
18143         touch $DIR/$tdir/foo_161c
18144         mv -f $DIR/$tdir/foo_161c $DIR/$tdir/foo2_161c
18145         changelog_dump | grep RENME | tail -n 5
18146         flags=$(changelog_dump | grep RENME | tail -1 | cut -f5 -d' ')
18147         changelog_clear 0 || error "changelog_clear failed"
18148         if [ x$flags != "x0x0" ]; then
18149                 error "flag $flags is not 0x0"
18150         fi
18151         echo "rename doesn't overwrite a target," \
18152                 "changelog record has flags of $flags"
18153
18154         # define CLF_UNLINK_LAST 0x0001
18155         # unlink a file having nlink = 1 (changelog flag 0x1)
18156         rm -f $DIR/$tdir/foo2_161c
18157         changelog_dump | grep UNLNK | tail -n 5
18158         flags=$(changelog_dump | grep UNLNK | tail -1 | cut -f5 -d' ')
18159         changelog_clear 0 || error "changelog_clear failed"
18160         if [ x$flags != "x0x1" ]; then
18161                 error "flag $flags is not 0x1"
18162         fi
18163         echo "unlink a file having nlink = 1," \
18164                 "changelog record has flags of $flags"
18165
18166         # unlink a file having nlink > 1 (changelog flag 0x0)
18167         ln -f $DIR/$tdir/bar_161c $DIR/$tdir/foobar_161c
18168         rm -f $DIR/$tdir/foobar_161c
18169         changelog_dump | grep UNLNK | tail -n 5
18170         flags=$(changelog_dump | grep UNLNK | tail -1 | cut -f5 -d' ')
18171         changelog_clear 0 || error "changelog_clear failed"
18172         if [ x$flags != "x0x0" ]; then
18173                 error "flag $flags is not 0x0"
18174         fi
18175         echo "unlink a file having nlink > 1, changelog record flags '$flags'"
18176 }
18177 run_test 161c "check CL_RENME[UNLINK] changelog record flags"
18178
18179 test_161d() {
18180         remote_mds_nodsh && skip "remote MDS with nodsh"
18181         [ -n "$FILESET" ] && skip "Not functional for FILESET set"
18182
18183         local pid
18184         local fid
18185
18186         changelog_register || error "changelog_register failed"
18187
18188         # work in a standalone dir to avoid locking on $DIR/$MOUNT to
18189         # interfer with $MOUNT/.lustre/fid/ access
18190         mkdir $DIR/$tdir
18191         [[ $? -eq 0 ]] || error "mkdir failed"
18192
18193         #define OBD_FAIL_LLITE_CREATE_NODE_PAUSE 0x140c | CFS_FAIL_ONCE
18194         $LCTL set_param fail_loc=0x8000140c
18195         # 5s pause
18196         $LCTL set_param fail_val=5
18197
18198         # create file
18199         echo foofoo > $DIR/$tdir/$tfile &
18200         pid=$!
18201
18202         # wait for create to be delayed
18203         sleep 2
18204
18205         ps -p $pid
18206         [[ $? -eq 0 ]] || error "create should be blocked"
18207
18208         local tempfile="$(mktemp --tmpdir $tfile.XXXXXX)"
18209         stack_trap "rm -f $tempfile"
18210         fid=$(changelog_extract_field "CREAT" "$tfile" "t=")
18211         cat $MOUNT/.lustre/fid/$fid 2>/dev/null >$tempfile || error "cat failed"
18212         # some delay may occur during ChangeLog publishing and file read just
18213         # above, that could allow file write to happen finally
18214         [[ -s $tempfile ]] && echo "file should be empty"
18215
18216         $LCTL set_param fail_loc=0
18217
18218         wait $pid
18219         [[ $? -eq 0 ]] || error "create failed"
18220 }
18221 run_test 161d "create with concurrent .lustre/fid access"
18222
18223 check_path() {
18224         local expected="$1"
18225         shift
18226         local fid="$2"
18227
18228         local path
18229         path=$($LFS fid2path "$@")
18230         local rc=$?
18231
18232         if [ $rc -ne 0 ]; then
18233                 error "path looked up of '$expected' failed: rc=$rc"
18234         elif [ "$path" != "$expected" ]; then
18235                 error "path looked up '$path' instead of '$expected'"
18236         else
18237                 echo "FID '$fid' resolves to path '$path' as expected"
18238         fi
18239 }
18240
18241 test_162a() { # was test_162
18242         test_mkdir -p -c1 $DIR/$tdir/d2
18243         touch $DIR/$tdir/d2/$tfile
18244         touch $DIR/$tdir/d2/x1
18245         touch $DIR/$tdir/d2/x2
18246         test_mkdir -p -c1 $DIR/$tdir/d2/a/b/c
18247         test_mkdir -p -c1 $DIR/$tdir/d2/p/q/r
18248         # regular file
18249         local fid=$($LFS path2fid $DIR/$tdir/d2/$tfile | tr -d '[]')
18250         check_path "$tdir/d2/$tfile" $FSNAME "$fid" --link 0
18251
18252         # softlink
18253         ln -s $DIR/$tdir/d2/$tfile $DIR/$tdir/d2/p/q/r/slink
18254         fid=$($LFS path2fid $DIR/$tdir/d2/p/q/r/slink | tr -d '[]')
18255         check_path "$tdir/d2/p/q/r/slink" $FSNAME "$fid" --link 0
18256
18257         # softlink to wrong file
18258         ln -s /this/is/garbage $DIR/$tdir/d2/p/q/r/slink.wrong
18259         fid=$($LFS path2fid $DIR/$tdir/d2/p/q/r/slink.wrong | tr -d '[]')
18260         check_path "$tdir/d2/p/q/r/slink.wrong" $FSNAME "$fid" --link 0
18261
18262         # hardlink
18263         ln $DIR/$tdir/d2/$tfile $DIR/$tdir/d2/p/q/r/hlink
18264         mv $DIR/$tdir/d2/$tfile $DIR/$tdir/d2/a/b/c/new_file
18265         fid=$($LFS path2fid $DIR/$tdir/d2/a/b/c/new_file | tr -d '[]')
18266         # fid2path dir/fsname should both work
18267         check_path "$tdir/d2/a/b/c/new_file" $FSNAME "$fid" --link 1
18268         check_path "$DIR/$tdir/d2/p/q/r/hlink" $DIR "$fid" --link 0
18269
18270         # hardlink count: check that there are 2 links
18271         local nlinks=$($LFS fid2path $DIR "$fid" | wc -l)
18272         [ $nlinks -eq 2 ] || error "expect 2 links, found $nlinks"
18273
18274         # hardlink indexing: remove the first link
18275         rm $DIR/$tdir/d2/p/q/r/hlink
18276         check_path "$tdir/d2/a/b/c/new_file" $FSNAME $fid --link 0
18277 }
18278 run_test 162a "path lookup sanity"
18279
18280 test_162b() {
18281         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18282         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
18283
18284         mkdir $DIR/$tdir
18285         $LFS setdirstripe -i0 -c$MDSCOUNT -H all_char $DIR/$tdir/striped_dir ||
18286                                 error "create striped dir failed"
18287
18288         local FID=$($LFS getdirstripe $DIR/$tdir/striped_dir |
18289                                         tail -n 1 | awk '{print $2}')
18290         stat $MOUNT/.lustre/fid/$FID && error "sub_stripe can be accessed"
18291
18292         touch $DIR/$tdir/striped_dir/f{0..4} || error "touch f0..4 failed"
18293         mkdir $DIR/$tdir/striped_dir/d{0..4} || error "mkdir d0..4 failed"
18294
18295         # regular file
18296         for ((i=0;i<5;i++)); do
18297                 FID=$($LFS path2fid $DIR/$tdir/striped_dir/f$i | tr -d '[]') ||
18298                         error "get fid for f$i failed"
18299                 check_path "$tdir/striped_dir/f$i" $FSNAME $FID --link 0
18300
18301                 FID=$($LFS path2fid $DIR/$tdir/striped_dir/d$i | tr -d '[]') ||
18302                         error "get fid for d$i failed"
18303                 check_path "$tdir/striped_dir/d$i" $FSNAME $FID --link 0
18304         done
18305
18306         return 0
18307 }
18308 run_test 162b "striped directory path lookup sanity"
18309
18310 # LU-4239: Verify fid2path works with paths 100 or more directories deep
18311 test_162c() {
18312         [[ $MDS1_VERSION -lt $(version_code 2.7.51) ]] &&
18313                 skip "Need MDS version at least 2.7.51"
18314
18315         local lpath=$tdir.local
18316         local rpath=$tdir.remote
18317
18318         test_mkdir $DIR/$lpath
18319         test_mkdir $DIR/$rpath
18320
18321         for ((i = 0; i <= 101; i++)); do
18322                 lpath="$lpath/$i"
18323                 mkdir $DIR/$lpath
18324                 FID=$($LFS path2fid $DIR/$lpath | tr -d '[]') ||
18325                         error "get fid for local directory $DIR/$lpath failed"
18326                 check_path "$DIR/$lpath" $MOUNT $FID --link 0
18327
18328                 rpath="$rpath/$i"
18329                 test_mkdir $DIR/$rpath
18330                 FID=$($LFS path2fid $DIR/$rpath | tr -d '[]') ||
18331                         error "get fid for remote directory $DIR/$rpath failed"
18332                 check_path "$DIR/$rpath" $MOUNT $FID --link 0
18333         done
18334
18335         return 0
18336 }
18337 run_test 162c "fid2path works with paths 100 or more directories deep"
18338
18339 oalr_event_count() {
18340         local event="${1}"
18341         local trace="${2}"
18342
18343         awk -v name="${FSNAME}-OST0000" \
18344             -v event="${event}" \
18345             '$1 == "TRACE" && $2 == event && $3 == name' \
18346             "${trace}" |
18347         wc -l
18348 }
18349
18350 oalr_expect_event_count() {
18351         local event="${1}"
18352         local trace="${2}"
18353         local expect="${3}"
18354         local count
18355
18356         count=$(oalr_event_count "${event}" "${trace}")
18357         if ((count == expect)); then
18358                 return 0
18359         fi
18360
18361         error_noexit "${event} event count was '${count}', expected ${expect}"
18362         cat "${trace}" >&2
18363         exit 1
18364 }
18365
18366 cleanup_165() {
18367         do_facet ost1 killall --quiet -KILL ofd_access_log_reader || true
18368         stop ost1
18369         start ost1 "$(ostdevname 1)" $OST_MOUNT_OPTS
18370 }
18371
18372 setup_165() {
18373         sync # Flush previous IOs so we can count log entries.
18374         do_facet ost1 $LCTL set_param "obdfilter.${FSNAME}-OST0000.access_log_size=4096"
18375         stack_trap cleanup_165 EXIT
18376 }
18377
18378 test_165a() {
18379         local trace="/tmp/${tfile}.trace"
18380         local rc
18381         local count
18382
18383         (( $OST1_VERSION >= $(version_code 2.13.54) )) ||
18384                 skip "OFD access log unsupported"
18385
18386         setup_165
18387         do_facet ost1 ofd_access_log_reader --debug=- --trace=- > "${trace}" &
18388         sleep 5
18389
18390         do_facet ost1 ofd_access_log_reader --list
18391         stop ost1
18392
18393         do_facet ost1 killall -TERM ofd_access_log_reader
18394         wait
18395         rc=$?
18396
18397         if ((rc != 0)); then
18398                 error "ofd_access_log_reader exited with rc = '${rc}'"
18399         fi
18400
18401         # Parse trace file for discovery events:
18402         oalr_expect_event_count alr_log_add "${trace}" 1
18403         oalr_expect_event_count alr_log_eof "${trace}" 1
18404         oalr_expect_event_count alr_log_free "${trace}" 1
18405 }
18406 run_test 165a "ofd access log discovery"
18407
18408 test_165b() {
18409         local trace="/tmp/${tfile}.trace"
18410         local file="${DIR}/${tfile}"
18411         local pfid1
18412         local pfid2
18413         local -a entry
18414         local rc
18415         local count
18416         local size
18417         local flags
18418
18419         (( $OST1_VERSION >= $(version_code 2.13.54) )) ||
18420                 skip "OFD access log unsupported"
18421
18422         setup_165
18423         do_facet ost1 ofd_access_log_reader --debug=- --trace=- > "${trace}" &
18424         sleep 5
18425
18426         do_facet ost1 ofd_access_log_reader --list
18427
18428         lfs setstripe -c 1 -i 0 "${file}"
18429         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_WRONLY:w1048576c ||
18430                 error "cannot create '${file}'"
18431
18432         sleep 5
18433         do_facet ost1 killall -TERM ofd_access_log_reader
18434         wait
18435         rc=$?
18436
18437         if ((rc != 0)); then
18438                 error "ofd_access_log_reader exited with rc = '${rc}'"
18439         fi
18440
18441         oalr_expect_event_count alr_log_entry "${trace}" 1
18442
18443         pfid1=$($LFS path2fid "${file}")
18444
18445         # 1     2             3   4    5     6   7    8    9     10
18446         # TRACE alr_log_entry OST PFID BEGIN END TIME SIZE COUNT FLAGS
18447         entry=( - $(awk -v pfid="${pfid}" '$1 == "TRACE" && $2 == "alr_log_entry"' "${trace}" ) )
18448
18449         echo "entry = '${entry[*]}'" >&2
18450
18451         pfid2=${entry[4]}
18452         if [[ "${pfid1}" != "${pfid2}" ]]; then
18453                 error "entry '${entry[*]}' has invalid PFID '${pfid2}', expected ${pfid1}"
18454         fi
18455
18456         size=${entry[8]}
18457         if ((size != 1048576)); then
18458                 error "entry '${entry[*]}' has invalid io size '${size}', expected 1048576"
18459         fi
18460
18461         flags=${entry[10]}
18462         if [[ "${flags}" != "w" ]]; then
18463                 error "entry '${entry[*]}' has invalid io flags '${flags}', expected 'w'"
18464         fi
18465
18466         do_facet ost1 ofd_access_log_reader --debug=- --trace=- > "${trace}" &
18467         sleep 5
18468
18469         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_RDONLY:r524288c ||
18470                 error "cannot read '${file}'"
18471         sleep 5
18472
18473         do_facet ost1 killall -TERM ofd_access_log_reader
18474         wait
18475         rc=$?
18476
18477         if ((rc != 0)); then
18478                 error "ofd_access_log_reader exited with rc = '${rc}'"
18479         fi
18480
18481         oalr_expect_event_count alr_log_entry "${trace}" 1
18482
18483         entry=( - $(awk -v pfid="${pfid}" '$1 == "TRACE" && $2 == "alr_log_entry"' "${trace}" ) )
18484         echo "entry = '${entry[*]}'" >&2
18485
18486         pfid2=${entry[4]}
18487         if [[ "${pfid1}" != "${pfid2}" ]]; then
18488                 error "entry '${entry[*]}' has invalid PFID '${pfid2}', expected ${pfid1}"
18489         fi
18490
18491         size=${entry[8]}
18492         if ((size != 524288)); then
18493                 error "entry '${entry[*]}' has invalid io size '${size}', 524288"
18494         fi
18495
18496         flags=${entry[10]}
18497         if [[ "${flags}" != "r" ]]; then
18498                 error "entry '${entry[*]}' has invalid io flags '${flags}', expected 'r'"
18499         fi
18500 }
18501 run_test 165b "ofd access log entries are produced and consumed"
18502
18503 test_165c() {
18504         local trace="/tmp/${tfile}.trace"
18505         local file="${DIR}/${tdir}/${tfile}"
18506
18507         (( $OST1_VERSION >= $(version_code 2.13.54) )) ||
18508                 skip "OFD access log unsupported"
18509
18510         test_mkdir "${DIR}/${tdir}"
18511
18512         setup_165
18513         do_facet ost1 ofd_access_log_reader --debug=- --trace=- > "${trace}" &
18514         sleep 5
18515
18516         lfs setstripe -c 1 -i 0 "${DIR}/${tdir}"
18517
18518         # 4096 / 64 = 64. Create twice as many entries.
18519         for ((i = 0; i < 128; i++)); do
18520                 $MULTIOP "${file}-${i}" oO_CREAT:O_WRONLY:w512c ||
18521                         error "cannot create file"
18522         done
18523
18524         sync
18525
18526         do_facet ost1 killall -TERM ofd_access_log_reader
18527         wait
18528         rc=$?
18529         if ((rc != 0)); then
18530                 error "ofd_access_log_reader exited with rc = '${rc}'"
18531         fi
18532
18533         unlinkmany  "${file}-%d" 128
18534 }
18535 run_test 165c "full ofd access logs do not block IOs"
18536
18537 oal_get_read_count() {
18538         local stats="$1"
18539
18540         # STATS lustre-OST0001 alr_read_count 1
18541
18542         do_facet ost1 cat "${stats}" |
18543         awk '$1 == "STATS" && $3 == "alr_read_count" { count = $4; }
18544              END { print count; }'
18545 }
18546
18547 oal_expect_read_count() {
18548         local stats="$1"
18549         local count
18550         local expect="$2"
18551
18552         # Ask ofd_access_log_reader to write stats.
18553         do_facet ost1 killall -USR1 ofd_access_log_reader
18554
18555         # Allow some time for things to happen.
18556         sleep 1
18557
18558         count=$(oal_get_read_count "${stats}")
18559         if ((count == expect)); then
18560                 return 0
18561         fi
18562
18563         error_noexit "bad read count, got ${count}, expected ${expect}"
18564         do_facet ost1 cat "${stats}" >&2
18565         exit 1
18566 }
18567
18568 test_165d() {
18569         local stats="/tmp/${tfile}.stats"
18570         local file="${DIR}/${tdir}/${tfile}"
18571         local param="obdfilter.${FSNAME}-OST0000.access_log_mask"
18572
18573         (( $OST1_VERSION >= $(version_code 2.13.54) )) ||
18574                 skip "OFD access log unsupported"
18575
18576         test_mkdir "${DIR}/${tdir}"
18577
18578         setup_165
18579         do_facet ost1 ofd_access_log_reader --stats="${stats}" &
18580         sleep 5
18581
18582         lfs setstripe -c 1 -i 0 "${file}"
18583
18584         do_facet ost1 lctl set_param "${param}=rw"
18585         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_WRONLY:w1048576c ||
18586                 error "cannot create '${file}'"
18587         oal_expect_read_count "${stats}" 1
18588
18589         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_RDONLY:r1048576c ||
18590                 error "cannot read '${file}'"
18591         oal_expect_read_count "${stats}" 2
18592
18593         do_facet ost1 lctl set_param "${param}=r"
18594         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_WRONLY:w1048576c ||
18595                 error "cannot create '${file}'"
18596         oal_expect_read_count "${stats}" 2
18597
18598         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_RDONLY:r1048576c ||
18599                 error "cannot read '${file}'"
18600         oal_expect_read_count "${stats}" 3
18601
18602         do_facet ost1 lctl set_param "${param}=w"
18603         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_WRONLY:w1048576c ||
18604                 error "cannot create '${file}'"
18605         oal_expect_read_count "${stats}" 4
18606
18607         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_RDONLY:r1048576c ||
18608                 error "cannot read '${file}'"
18609         oal_expect_read_count "${stats}" 4
18610
18611         do_facet ost1 lctl set_param "${param}=0"
18612         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_WRONLY:w1048576c ||
18613                 error "cannot create '${file}'"
18614         oal_expect_read_count "${stats}" 4
18615
18616         $MULTIOP "${file}" oO_CREAT:O_DIRECT:O_RDONLY:r1048576c ||
18617                 error "cannot read '${file}'"
18618         oal_expect_read_count "${stats}" 4
18619
18620         do_facet ost1 killall -TERM ofd_access_log_reader
18621         wait
18622         rc=$?
18623         if ((rc != 0)); then
18624                 error "ofd_access_log_reader exited with rc = '${rc}'"
18625         fi
18626 }
18627 run_test 165d "ofd_access_log mask works"
18628
18629 test_165e() {
18630         local stats="/tmp/${tfile}.stats"
18631         local file0="${DIR}/${tdir}-0/${tfile}"
18632         local file1="${DIR}/${tdir}-1/${tfile}"
18633
18634         (( $OST1_VERSION >= $(version_code 2.13.54) )) ||
18635                 skip "OFD access log unsupported"
18636
18637         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
18638
18639         test_mkdir -c 1 -i 0 "${DIR}/${tdir}-0"
18640         test_mkdir -c 1 -i 1 "${DIR}/${tdir}-1"
18641
18642         lfs setstripe -c 1 -i 0 "${file0}"
18643         lfs setstripe -c 1 -i 0 "${file1}"
18644
18645         setup_165
18646         do_facet ost1 ofd_access_log_reader -I 1 --stats="${stats}" &
18647         sleep 5
18648
18649         $MULTIOP "${file0}" oO_CREAT:O_WRONLY:w512c ||
18650                 error "cannot create '${file0}'"
18651         sync
18652         oal_expect_read_count "${stats}" 0
18653
18654         $MULTIOP "${file1}" oO_CREAT:O_WRONLY:w512c ||
18655                 error "cannot create '${file1}'"
18656         sync
18657         oal_expect_read_count "${stats}" 1
18658
18659         do_facet ost1 killall -TERM ofd_access_log_reader
18660         wait
18661         rc=$?
18662         if ((rc != 0)); then
18663                 error "ofd_access_log_reader exited with rc = '${rc}'"
18664         fi
18665 }
18666 run_test 165e "ofd_access_log MDT index filter works"
18667
18668 test_165f() {
18669         local trace="/tmp/${tfile}.trace"
18670         local rc
18671         local count
18672
18673         setup_165
18674         do_facet ost1 timeout 60 ofd_access_log_reader \
18675                 --exit-on-close --debug=- --trace=- > "${trace}" &
18676         sleep 5
18677         stop ost1
18678
18679         wait
18680         rc=$?
18681
18682         if ((rc != 0)); then
18683                 error_noexit "ofd_access_log_reader exited with rc = '${rc}'"
18684                 cat "${trace}"
18685                 exit 1
18686         fi
18687 }
18688 run_test 165f "ofd_access_log_reader --exit-on-close works"
18689
18690 test_169() {
18691         # do directio so as not to populate the page cache
18692         log "creating a 10 Mb file"
18693         $MULTIOP $DIR/$tfile oO_CREAT:O_DIRECT:O_RDWR:w$((10*1048576))c ||
18694                 error "multiop failed while creating a file"
18695         log "starting reads"
18696         dd if=$DIR/$tfile of=/dev/null bs=4096 &
18697         log "truncating the file"
18698         $MULTIOP $DIR/$tfile oO_TRUNC:c ||
18699                 error "multiop failed while truncating the file"
18700         log "killing dd"
18701         kill %+ || true # reads might have finished
18702         echo "wait until dd is finished"
18703         wait
18704         log "removing the temporary file"
18705         rm -rf $DIR/$tfile || error "tmp file removal failed"
18706 }
18707 run_test 169 "parallel read and truncate should not deadlock"
18708
18709 test_170() {
18710         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18711
18712         $LCTL clear     # bug 18514
18713         $LCTL debug_daemon start $TMP/${tfile}_log_good
18714         touch $DIR/$tfile
18715         $LCTL debug_daemon stop
18716         sed -e "s/^...../a/g" $TMP/${tfile}_log_good > $TMP/${tfile}_log_bad ||
18717                 error "sed failed to read log_good"
18718
18719         $LCTL debug_daemon start $TMP/${tfile}_log_good
18720         rm -rf $DIR/$tfile
18721         $LCTL debug_daemon stop
18722
18723         $LCTL df $TMP/${tfile}_log_bad > $TMP/${tfile}_log_bad.out 2>&1 ||
18724                error "lctl df log_bad failed"
18725
18726         local bad_line=$(tail -n 1 $TMP/${tfile}_log_bad.out | awk '{print $9}')
18727         local good_line1=$(tail -n 1 $TMP/${tfile}_log_bad.out | awk '{print $5}')
18728
18729         $LCTL df $TMP/${tfile}_log_good > $TMP/${tfile}_log_good.out 2>&1
18730         local good_line2=$(tail -n 1 $TMP/${tfile}_log_good.out | awk '{print $5}')
18731
18732         [ "$bad_line" ] && [ "$good_line1" ] && [ "$good_line2" ] ||
18733                 error "bad_line good_line1 good_line2 are empty"
18734
18735         cat $TMP/${tfile}_log_good >> $TMP/${tfile}_logs_corrupt
18736         cat $TMP/${tfile}_log_bad >> $TMP/${tfile}_logs_corrupt
18737         cat $TMP/${tfile}_log_good >> $TMP/${tfile}_logs_corrupt
18738
18739         $LCTL df $TMP/${tfile}_logs_corrupt > $TMP/${tfile}_log_bad.out 2>&1
18740         local bad_line_new=$(tail -n 1 $TMP/${tfile}_log_bad.out | awk '{print $9}')
18741         local good_line_new=$(tail -n 1 $TMP/${tfile}_log_bad.out | awk '{print $5}')
18742
18743         [ "$bad_line_new" ] && [ "$good_line_new" ] ||
18744                 error "bad_line_new good_line_new are empty"
18745
18746         local expected_good=$((good_line1 + good_line2*2))
18747
18748         rm -f $TMP/${tfile}*
18749         # LU-231, short malformed line may not be counted into bad lines
18750         if [ $bad_line -ne $bad_line_new ] &&
18751                    [ $bad_line -ne $((bad_line_new - 1)) ]; then
18752                 error "expected $bad_line bad lines, but got $bad_line_new"
18753                 return 1
18754         fi
18755
18756         if [ $expected_good -ne $good_line_new ]; then
18757                 error "expected $expected_good good lines, but got $good_line_new"
18758                 return 2
18759         fi
18760         true
18761 }
18762 run_test 170 "test lctl df to handle corrupted log ====================="
18763
18764 test_171() { # bug20592
18765         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18766
18767         #define OBD_FAIL_PTLRPC_DUMP_LOG         0x50e
18768         $LCTL set_param fail_loc=0x50e
18769         $LCTL set_param fail_val=3000
18770         multiop_bg_pause $DIR/$tfile O_s || true
18771         local MULTIPID=$!
18772         kill -USR1 $MULTIPID
18773         # cause log dump
18774         sleep 3
18775         wait $MULTIPID
18776         if dmesg | grep "recursive fault"; then
18777                 error "caught a recursive fault"
18778         fi
18779         $LCTL set_param fail_loc=0
18780         true
18781 }
18782 run_test 171 "test libcfs_debug_dumplog_thread stuck in do_exit() ======"
18783
18784 test_172() {
18785
18786         #define OBD_FAIL_OBD_CLEANUP  0x60e
18787         $LCTL set_param fail_loc=0x60e
18788         umount $MOUNT || error "umount $MOUNT failed"
18789         stack_trap "mount_client $MOUNT"
18790
18791         (( $($LCTL dl | egrep -c " osc | lov | lmv | mdc ") > 0 )) ||
18792                 error "no client OBDs are remained"
18793
18794         $LCTL dl | while read devno state type name foo; do
18795                 case $type in
18796                 lov|osc|lmv|mdc)
18797                         $LCTL --device $name cleanup
18798                         $LCTL --device $name detach
18799                         ;;
18800                 *)
18801                         # skip server devices
18802                         ;;
18803                 esac
18804         done
18805
18806         if (( $($LCTL dl | egrep -c " osc | lov | lmv | mdc ") > 0 )); then
18807                 $LCTL dl | egrep " osc | lov | lmv | mdc "
18808                 error "some client OBDs are still remained"
18809         fi
18810
18811 }
18812 run_test 172 "manual device removal with lctl cleanup/detach ======"
18813
18814 # it would be good to share it with obdfilter-survey/iokit-libecho code
18815 setup_obdecho_osc () {
18816         local rc=0
18817         local ost_nid=$1
18818         local obdfilter_name=$2
18819         echo "Creating new osc for $obdfilter_name on $ost_nid"
18820         # make sure we can find loopback nid
18821         $LCTL add_uuid $ost_nid $ost_nid >/dev/null 2>&1
18822
18823         [ $rc -eq 0 ] && { $LCTL attach osc ${obdfilter_name}_osc     \
18824                            ${obdfilter_name}_osc_UUID || rc=2; }
18825         [ $rc -eq 0 ] && { $LCTL --device ${obdfilter_name}_osc setup \
18826                            ${obdfilter_name}_UUID  $ost_nid || rc=3; }
18827         return $rc
18828 }
18829
18830 cleanup_obdecho_osc () {
18831         local obdfilter_name=$1
18832         $LCTL --device ${obdfilter_name}_osc cleanup >/dev/null
18833         $LCTL --device ${obdfilter_name}_osc detach  >/dev/null
18834         return 0
18835 }
18836
18837 obdecho_test() {
18838         local OBD=$1
18839         local node=$2
18840         local pages=${3:-64}
18841         local rc=0
18842         local id
18843
18844         local count=10
18845         local obd_size=$(get_obd_size $node $OBD)
18846         local page_size=$(get_page_size $node)
18847         if [[ -n "$obd_size" ]]; then
18848                 local new_count=$((obd_size / (pages * page_size / 1024)))
18849                 [[ $new_count -ge $count ]] || count=$new_count
18850         fi
18851
18852         do_facet $node "$LCTL attach echo_client ec ec_uuid" || rc=1
18853         [ $rc -eq 0 ] && { do_facet $node "$LCTL --device ec setup $OBD" ||
18854                            rc=2; }
18855         if [ $rc -eq 0 ]; then
18856             id=$(do_facet $node "$LCTL --device ec create 1"  | awk '/object id/ {print $6}')
18857             [ ${PIPESTATUS[0]} -eq 0 -a -n "$id" ] || rc=3
18858         fi
18859         echo "New object id is $id"
18860         [ $rc -eq 0 ] && { do_facet $node "$LCTL --device ec getattr $id" ||
18861                            rc=4; }
18862         [ $rc -eq 0 ] && { do_facet $node "$LCTL --device ec "                 \
18863                            "test_brw $count w v $pages $id" || rc=4; }
18864         [ $rc -eq 0 ] && { do_facet $node "$LCTL --device ec destroy $id 1" ||
18865                            rc=4; }
18866         [ $rc -eq 0 ] || [ $rc -gt 2 ] &&
18867                 { do_facet $node "$LCTL --device ec cleanup" || rc=5; }
18868         [ $rc -eq 0 ] || [ $rc -gt 1 ] &&
18869                 { do_facet $node "$LCTL --device ec detach" || rc=6; }
18870         [ $rc -ne 0 ] && echo "obecho_create_test failed: $rc"
18871         return $rc
18872 }
18873
18874 test_180a() {
18875         skip "obdecho on osc is no longer supported"
18876 }
18877 run_test 180a "test obdecho on osc"
18878
18879 test_180b() {
18880         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18881         remote_ost_nodsh && skip "remote OST with nodsh"
18882
18883         do_rpc_nodes $(facet_active_host ost1) load_module obdecho/obdecho &&
18884                 stack_trap "do_facet ost1 rmmod obdecho" EXIT ||
18885                 error "failed to load module obdecho"
18886
18887         local target=$(do_facet ost1 $LCTL dl |
18888                        awk '/obdfilter/ { print $4; exit; }')
18889
18890         if [ -n "$target" ]; then
18891                 obdecho_test $target ost1 || error "obdecho_test failed with $?"
18892         else
18893                 do_facet ost1 $LCTL dl
18894                 error "there is no obdfilter target on ost1"
18895         fi
18896 }
18897 run_test 180b "test obdecho directly on obdfilter"
18898
18899 test_180c() { # LU-2598
18900         [ $PARALLEL == "yes" ] && skip "skip parallel run"
18901         remote_ost_nodsh && skip "remote OST with nodsh"
18902         [[ $MDS1_VERSION -lt $(version_code 2.4.0) ]] &&
18903                 skip "Need MDS version at least 2.4.0"
18904
18905         do_rpc_nodes $(facet_active_host ost1) load_module obdecho/obdecho &&
18906                 stack_trap "do_facet ost1 rmmod obdecho" EXIT ||
18907                 error "failed to load module obdecho"
18908
18909         local target=$(do_facet ost1 $LCTL dl |
18910                        awk '/obdfilter/ { print $4; exit; }')
18911
18912         if [ -n "$target" ]; then
18913                 local pages=16384 # 64MB bulk I/O RPC size
18914
18915                 obdecho_test "$target" ost1 "$pages" ||
18916                         error "obdecho_test with pages=$pages failed with $?"
18917         else
18918                 do_facet ost1 $LCTL dl
18919                 error "there is no obdfilter target on ost1"
18920         fi
18921 }
18922 run_test 180c "test huge bulk I/O size on obdfilter, don't LASSERT"
18923
18924 test_181() { # bug 22177
18925         test_mkdir $DIR/$tdir
18926         # create enough files to index the directory
18927         createmany -o $DIR/$tdir/foobar 4000
18928         # print attributes for debug purpose
18929         lsattr -d .
18930         # open dir
18931         multiop_bg_pause $DIR/$tdir D_Sc || return 1
18932         MULTIPID=$!
18933         # remove the files & current working dir
18934         unlinkmany $DIR/$tdir/foobar 4000
18935         rmdir $DIR/$tdir
18936         kill -USR1 $MULTIPID
18937         wait $MULTIPID
18938         stat $DIR/$tdir && error "open-unlinked dir was not removed!"
18939         return 0
18940 }
18941 run_test 181 "Test open-unlinked dir ========================"
18942
18943 test_182a() {
18944         local fcount=1000
18945         local tcount=10
18946
18947         mkdir -p $DIR/$tdir || error "creating dir $DIR/$tdir"
18948
18949         $LCTL set_param mdc.*.rpc_stats=clear
18950
18951         for (( i = 0; i < $tcount; i++ )) ; do
18952                 mkdir $DIR/$tdir/$i
18953         done
18954
18955         for (( i = 0; i < $tcount; i++ )) ; do
18956                 createmany -o $DIR/$tdir/$i/f- $fcount &
18957         done
18958         wait
18959
18960         for (( i = 0; i < $tcount; i++ )) ; do
18961                 unlinkmany $DIR/$tdir/$i/f- $fcount &
18962         done
18963         wait
18964
18965         $LCTL get_param mdc.*.rpc_stats
18966
18967         rm -rf $DIR/$tdir
18968 }
18969 run_test 182a "Test parallel modify metadata operations from mdc"
18970
18971 test_182b() {
18972         [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
18973         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
18974         local dcount=1000
18975         local tcount=10
18976         local stime
18977         local etime
18978         local delta
18979
18980         do_facet mds1 $LCTL list_param \
18981                 osp.$FSNAME-MDT*-osp-MDT*.rpc_stats ||
18982                 skip "MDS lacks parallel RPC handling"
18983
18984         $LFS mkdir -i 0 $DIR/$tdir || error "creating dir $DIR/$tdir"
18985
18986         rpc_count=$(do_facet mds1 $LCTL get_param -n \
18987                     osp.$FSNAME-MDT0001-osp-MDT0000.max_mod_rpcs_in_flight)
18988
18989         stime=$(date +%s)
18990         createmany -i 0 -d $DIR/$tdir/t- $tcount
18991
18992         for (( i = 0; i < $tcount; i++ )) ; do
18993                 createmany -i 0 -d $DIR/$tdir/t-$i/d- 0 $dcount &
18994         done
18995         wait
18996         etime=$(date +%s)
18997         delta=$((etime - stime))
18998         echo "Time for file creation $delta sec for $rpc_count parallel RPCs"
18999
19000         stime=$(date +%s)
19001         for (( i = 0; i < $tcount; i++ )) ; do
19002                 unlinkmany -d $DIR/$tdir/$i/d- $dcount &
19003         done
19004         wait
19005         etime=$(date +%s)
19006         delta=$((etime - stime))
19007         echo "Time for file removal $delta sec for $rpc_count parallel RPCs"
19008
19009         rm -rf $DIR/$tdir
19010
19011         $LFS mkdir -i 0 $DIR/$tdir || error "creating dir $DIR/$tdir"
19012
19013         do_facet mds1 $LCTL set_param osp.$FSNAME-MDT0001-osp-MDT0000.max_mod_rpcs_in_flight=1
19014
19015         stime=$(date +%s)
19016         createmany -i 0 -d $DIR/$tdir/t- $tcount
19017
19018         for (( i = 0; i < $tcount; i++ )) ; do
19019                 createmany -i 0 -d $DIR/$tdir/t-$i/d- 0 $dcount &
19020         done
19021         wait
19022         etime=$(date +%s)
19023         delta=$((etime - stime))
19024         echo "Time for file creation $delta sec for 1 RPC sent at a time"
19025
19026         stime=$(date +%s)
19027         for (( i = 0; i < $tcount; i++ )) ; do
19028                 unlinkmany -d $DIR/$tdir/t-$i/d- $dcount &
19029         done
19030         wait
19031         etime=$(date +%s)
19032         delta=$((etime - stime))
19033         echo "Time for file removal $delta sec for 1 RPC sent at a time"
19034
19035         do_facet mds1 $LCTL set_param osp.$FSNAME-MDT0001-osp-MDT0000.max_mod_rpcs_in_flight=$rpc_count
19036 }
19037 run_test 182b "Test parallel modify metadata operations from osp"
19038
19039 test_183() { # LU-2275
19040         [ $PARALLEL == "yes" ] && skip "skip parallel run"
19041         remote_mds_nodsh && skip "remote MDS with nodsh"
19042         [[ $MDS1_VERSION -lt $(version_code 2.3.56) ]] &&
19043                 skip "Need MDS version at least 2.3.56"
19044
19045         mkdir_on_mdt0 $DIR/$tdir || error "creating dir $DIR/$tdir"
19046         echo aaa > $DIR/$tdir/$tfile
19047
19048 #define OBD_FAIL_MDS_NEGATIVE_POSITIVE  0x148
19049         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x148
19050
19051         ls -l $DIR/$tdir && error "ls succeeded, should have failed"
19052         cat $DIR/$tdir/$tfile && error "cat succeeded, should have failed"
19053
19054         do_facet $SINGLEMDS $LCTL set_param fail_loc=0
19055
19056         # Flush negative dentry cache
19057         touch $DIR/$tdir/$tfile
19058
19059         # We are not checking for any leaked references here, they'll
19060         # become evident next time we do cleanup with module unload.
19061         rm -rf $DIR/$tdir
19062 }
19063 run_test 183 "No crash or request leak in case of strange dispositions ========"
19064
19065 # test suite 184 is for LU-2016, LU-2017
19066 test_184a() {
19067         check_swap_layouts_support
19068
19069         dir0=$DIR/$tdir/$testnum
19070         test_mkdir -p -c1 $dir0
19071         ref1=/etc/passwd
19072         ref2=/etc/group
19073         file1=$dir0/f1
19074         file2=$dir0/f2
19075         $LFS setstripe -c1 $file1
19076         cp $ref1 $file1
19077         $LFS setstripe -c2 $file2
19078         cp $ref2 $file2
19079         gen1=$($LFS getstripe -g $file1)
19080         gen2=$($LFS getstripe -g $file2)
19081
19082         $LFS swap_layouts $file1 $file2 || error "swap of file layout failed"
19083         gen=$($LFS getstripe -g $file1)
19084         [[ $gen1 != $gen ]] ||
19085                 error "Layout generation on $file1 does not change"
19086         gen=$($LFS getstripe -g $file2)
19087         [[ $gen2 != $gen ]] ||
19088                 error "Layout generation on $file2 does not change"
19089
19090         cmp $ref1 $file2 || error "content compare failed ($ref1 != $file2)"
19091         cmp $ref2 $file1 || error "content compare failed ($ref2 != $file1)"
19092
19093         lfsck_verify_pfid $file1 $file2 || error "PFID are not transferred"
19094 }
19095 run_test 184a "Basic layout swap"
19096
19097 test_184b() {
19098         check_swap_layouts_support
19099
19100         dir0=$DIR/$tdir/$testnum
19101         mkdir -p $dir0 || error "creating dir $dir0"
19102         file1=$dir0/f1
19103         file2=$dir0/f2
19104         file3=$dir0/f3
19105         dir1=$dir0/d1
19106         dir2=$dir0/d2
19107         mkdir $dir1 $dir2
19108         $LFS setstripe -c1 $file1
19109         $LFS setstripe -c2 $file2
19110         $LFS setstripe -c1 $file3
19111         chown $RUNAS_ID $file3
19112         gen1=$($LFS getstripe -g $file1)
19113         gen2=$($LFS getstripe -g $file2)
19114
19115         $LFS swap_layouts $dir1 $dir2 &&
19116                 error "swap of directories layouts should fail"
19117         $LFS swap_layouts $dir1 $file1 &&
19118                 error "swap of directory and file layouts should fail"
19119         $RUNAS $LFS swap_layouts $file1 $file2 &&
19120                 error "swap of file we cannot write should fail"
19121         $LFS swap_layouts $file1 $file3 &&
19122                 error "swap of file with different owner should fail"
19123         /bin/true # to clear error code
19124 }
19125 run_test 184b "Forbidden layout swap (will generate errors)"
19126
19127 test_184c() {
19128         local cmpn_arg=$(cmp -n 2>&1 | grep "invalid option")
19129         [ -n "$cmpn_arg" ] && skip_env "cmp does not support -n"
19130         check_swap_layouts_support
19131         check_swap_layout_no_dom $DIR
19132
19133         local dir0=$DIR/$tdir/$testnum
19134         mkdir -p $dir0 || error "creating dir $dir0"
19135
19136         local ref1=$dir0/ref1
19137         local ref2=$dir0/ref2
19138         local file1=$dir0/file1
19139         local file2=$dir0/file2
19140         # create a file large enough for the concurrent test
19141         dd if=/dev/urandom of=$ref1 bs=1M count=$((RANDOM % 50 + 20))
19142         dd if=/dev/urandom of=$ref2 bs=1M count=$((RANDOM % 50 + 20))
19143         echo "ref file size: ref1($(stat -c %s $ref1))," \
19144              "ref2($(stat -c %s $ref2))"
19145
19146         cp $ref2 $file2
19147         dd if=$ref1 of=$file1 bs=16k &
19148         local DD_PID=$!
19149
19150         # Make sure dd starts to copy file, but wait at most 5 seconds
19151         local loops=0
19152         while [ ! -s $file1 -a $((loops++)) -lt 50 ]; do sleep 0.1; done
19153
19154         $LFS swap_layouts $file1 $file2
19155         local rc=$?
19156         wait $DD_PID
19157         [[ $? == 0 ]] || error "concurrent write on $file1 failed"
19158         [[ $rc == 0 ]] || error "swap of $file1 and $file2 failed"
19159
19160         # how many bytes copied before swapping layout
19161         local copied=$(stat -c %s $file2)
19162         local remaining=$(stat -c %s $ref1)
19163         remaining=$((remaining - copied))
19164         echo "Copied $copied bytes before swapping layout..."
19165
19166         cmp -n $copied $file1 $ref2 | grep differ &&
19167                 error "Content mismatch [0, $copied) of ref2 and file1"
19168         cmp -n $copied $file2 $ref1 ||
19169                 error "Content mismatch [0, $copied) of ref1 and file2"
19170         cmp -i $copied:$copied -n $remaining $file1 $ref1 ||
19171                 error "Content mismatch [$copied, EOF) of ref1 and file1"
19172
19173         # clean up
19174         rm -f $ref1 $ref2 $file1 $file2
19175 }
19176 run_test 184c "Concurrent write and layout swap"
19177
19178 test_184d() {
19179         check_swap_layouts_support
19180         check_swap_layout_no_dom $DIR
19181         [ -z "$(which getfattr 2>/dev/null)" ] &&
19182                 skip_env "no getfattr command"
19183
19184         local file1=$DIR/$tdir/$tfile-1
19185         local file2=$DIR/$tdir/$tfile-2
19186         local file3=$DIR/$tdir/$tfile-3
19187         local lovea1
19188         local lovea2
19189
19190         mkdir -p $DIR/$tdir
19191         touch $file1 || error "create $file1 failed"
19192         $OPENFILE -f O_CREAT:O_LOV_DELAY_CREATE $file2 ||
19193                 error "create $file2 failed"
19194         $OPENFILE -f O_CREAT:O_LOV_DELAY_CREATE $file3 ||
19195                 error "create $file3 failed"
19196         lovea1=$(get_layout_param $file1)
19197
19198         $LFS swap_layouts $file2 $file3 ||
19199                 error "swap $file2 $file3 layouts failed"
19200         $LFS swap_layouts $file1 $file2 ||
19201                 error "swap $file1 $file2 layouts failed"
19202
19203         lovea2=$(get_layout_param $file2)
19204         echo "$lovea1"
19205         echo "$lovea2"
19206         [ "$lovea1" == "$lovea2" ] || error "lovea $lovea1 != $lovea2"
19207
19208         lovea1=$(getfattr -n trusted.lov $file1 | grep ^trusted)
19209         [[ -z "$lovea1" ]] || error "$file1 shouldn't have lovea"
19210 }
19211 run_test 184d "allow stripeless layouts swap"
19212
19213 test_184e() {
19214         [[ $MDS1_VERSION -ge $(version_code 2.6.94) ]] ||
19215                 skip "Need MDS version at least 2.6.94"
19216         check_swap_layouts_support
19217         check_swap_layout_no_dom $DIR
19218         [ -z "$(which getfattr 2>/dev/null)" ] &&
19219                 skip_env "no getfattr command"
19220
19221         local file1=$DIR/$tdir/$tfile-1
19222         local file2=$DIR/$tdir/$tfile-2
19223         local file3=$DIR/$tdir/$tfile-3
19224         local lovea
19225
19226         mkdir -p $DIR/$tdir
19227         touch $file1 || error "create $file1 failed"
19228         $OPENFILE -f O_CREAT:O_LOV_DELAY_CREATE $file2 ||
19229                 error "create $file2 failed"
19230         $OPENFILE -f O_CREAT:O_LOV_DELAY_CREATE $file3 ||
19231                 error "create $file3 failed"
19232
19233         $LFS swap_layouts $file1 $file2 ||
19234                 error "swap $file1 $file2 layouts failed"
19235
19236         lovea=$(getfattr -n trusted.lov $file1 | grep ^trusted)
19237         [[ -z "$lovea" ]] || error "$file1 shouldn't have lovea"
19238
19239         echo 123 > $file1 || error "Should be able to write into $file1"
19240
19241         $LFS swap_layouts $file1 $file3 ||
19242                 error "swap $file1 $file3 layouts failed"
19243
19244         echo 123 > $file1 || error "Should be able to write into $file1"
19245
19246         rm -rf $file1 $file2 $file3
19247 }
19248 run_test 184e "Recreate layout after stripeless layout swaps"
19249
19250 test_184f() {
19251         # Create a file with name longer than sizeof(struct stat) ==
19252         # 144 to see if we can get chars from the file name to appear
19253         # in the returned striping. Note that 'f' == 0x66.
19254         local file=$(for ((i = 0; i < 200; i++)); do echo -n f; done)
19255
19256         mkdir -p $DIR/$tdir
19257         mcreate $DIR/$tdir/$file
19258         if lfs find --stripe-count 0x6666 $DIR/$tdir | grep $file; then
19259                 error "IOC_MDC_GETFILEINFO returned garbage striping"
19260         fi
19261 }
19262 run_test 184f "IOC_MDC_GETFILEINFO for files with long names but no striping"
19263
19264 test_185() { # LU-2441
19265         # LU-3553 - no volatile file support in old servers
19266         [[ $MDS1_VERSION -ge $(version_code 2.3.60) ]] ||
19267                 skip "Need MDS version at least 2.3.60"
19268
19269         mkdir -p $DIR/$tdir || error "creating dir $DIR/$tdir"
19270         touch $DIR/$tdir/spoo
19271         local mtime1=$(stat -c "%Y" $DIR/$tdir)
19272         local fid=$($MULTIOP $DIR/$tdir VFw4096c) ||
19273                 error "cannot create/write a volatile file"
19274         [ "$FILESET" == "" ] &&
19275         $CHECKSTAT -t file $MOUNT/.lustre/fid/$fid 2>/dev/null &&
19276                 error "FID is still valid after close"
19277
19278         multiop_bg_pause $DIR/$tdir vVw4096_c
19279         local multi_pid=$!
19280
19281         local OLD_IFS=$IFS
19282         IFS=":"
19283         local fidv=($fid)
19284         IFS=$OLD_IFS
19285         # assume that the next FID for this client is sequential, since stdout
19286         # is unfortunately eaten by multiop_bg_pause
19287         local n=$((${fidv[1]} + 1))
19288         local next_fid="${fidv[0]}:$(printf "0x%x" $n):${fidv[2]}"
19289         if [ "$FILESET" == "" ]; then
19290                 $CHECKSTAT -t file $MOUNT/.lustre/fid/$next_fid ||
19291                         error "FID is missing before close"
19292         fi
19293         kill -USR1 $multi_pid
19294         # 1 second delay, so if mtime change we will see it
19295         sleep 1
19296         local mtime2=$(stat -c "%Y" $DIR/$tdir)
19297         [[ $mtime1 == $mtime2 ]] || error "mtime has changed"
19298 }
19299 run_test 185 "Volatile file support"
19300
19301 function create_check_volatile() {
19302         local idx=$1
19303         local tgt
19304
19305         $MULTIOP $MOUNT/.lustre/fid V${idx}Fw4096_c >&/tmp/${tfile}.fid &
19306         local PID=$!
19307         sleep 1
19308         local FID=$(cat /tmp/${tfile}.fid)
19309         [ "$FID" == "" ] && error "can't get FID for volatile"
19310         $CHECKSTAT -t file $MOUNT/.lustre/fid/$FID || error "can't stat $FID"
19311         tgt=$($LFS getstripe -m $MOUNT/.lustre/fid/$FID)
19312         [ "$tgt" != "$idx" ] && error "wrong MDS $tgt, expected $idx"
19313         kill -USR1 $PID
19314         wait
19315         sleep 1
19316         cancel_lru_locks mdc # flush opencache
19317         $CHECKSTAT -t file $MOUNT/.lustre/fid/$FID && error "can stat $FID"
19318         return 0
19319 }
19320
19321 test_185a(){
19322         # LU-12516 - volatile creation via .lustre
19323         [[ $MDS1_VERSION -ge $(version_code 2.12.55) ]] ||
19324                 skip "Need MDS version at least 2.3.55"
19325
19326         create_check_volatile 0
19327         [ $MDSCOUNT -lt 2 ] && return 0
19328
19329         # DNE case
19330         create_check_volatile 1
19331
19332         return 0
19333 }
19334 run_test 185a "Volatile file creation in .lustre/fid/"
19335
19336 test_187a() {
19337         remote_mds_nodsh && skip "remote MDS with nodsh"
19338         [ $MDS1_VERSION -lt $(version_code 2.3.0) ] &&
19339                 skip "Need MDS version at least 2.3.0"
19340
19341         local dir0=$DIR/$tdir/$testnum
19342         mkdir -p $dir0 || error "creating dir $dir0"
19343
19344         local file=$dir0/file1
19345         dd if=/dev/urandom of=$file count=10 bs=1M conv=fsync
19346         stack_trap "rm -f $file"
19347         local dv1=$($LFS data_version $file)
19348         dd if=/dev/urandom of=$file seek=10 count=1 bs=1M conv=fsync
19349         local dv2=$($LFS data_version $file)
19350         [[ $dv1 != $dv2 ]] ||
19351                 error "data version did not change on write $dv1 == $dv2"
19352 }
19353 run_test 187a "Test data version change"
19354
19355 test_187b() {
19356         remote_mds_nodsh && skip "remote MDS with nodsh"
19357         [ $MDS1_VERSION -lt $(version_code 2.3.0) ] &&
19358                 skip "Need MDS version at least 2.3.0"
19359
19360         local dir0=$DIR/$tdir/$testnum
19361         mkdir -p $dir0 || error "creating dir $dir0"
19362
19363         declare -a DV=$($MULTIOP $dir0 Vw1000xYw1000xY | cut -f3 -d" ")
19364         [[ ${DV[0]} != ${DV[1]} ]] ||
19365                 error "data version did not change on write"\
19366                       " ${DV[0]} == ${DV[1]}"
19367
19368         # clean up
19369         rm -f $file1
19370 }
19371 run_test 187b "Test data version change on volatile file"
19372
19373 test_200() {
19374         [ $PARALLEL == "yes" ] && skip "skip parallel run"
19375         remote_mgs_nodsh && skip "remote MGS with nodsh"
19376         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
19377
19378         local POOL=${POOL:-cea1}
19379         local POOL_ROOT=${POOL_ROOT:-$DIR/d200.pools}
19380         local POOL_DIR_NAME=${POOL_DIR_NAME:-dir_tst}
19381         # Pool OST targets
19382         local first_ost=0
19383         local last_ost=$(($OSTCOUNT - 1))
19384         local ost_step=2
19385         local ost_list=$(seq $first_ost $ost_step $last_ost)
19386         local ost_range="$first_ost $last_ost $ost_step"
19387         local test_path=$POOL_ROOT/$POOL_DIR_NAME
19388         local file_dir=$POOL_ROOT/file_tst
19389         local subdir=$test_path/subdir
19390         local rc=0
19391
19392         while : ; do
19393                 # former test_200a test_200b
19394                 pool_add $POOL                          || { rc=$? ; break; }
19395                 pool_add_targets  $POOL $ost_range      || { rc=$? ; break; }
19396                 # former test_200c test_200d
19397                 mkdir -p $test_path
19398                 pool_set_dir      $POOL $test_path      || { rc=$? ; break; }
19399                 pool_check_dir    $POOL $test_path      || { rc=$? ; break; }
19400                 mkdir -p $subdir
19401                 pool_check_dir    $POOL $subdir         || { rc=$? ; break; }
19402                 pool_dir_rel_path $POOL $POOL_DIR_NAME $POOL_ROOT \
19403                                                         || { rc=$? ; break; }
19404                 # former test_200e test_200f
19405                 local files=$((OSTCOUNT*3))
19406                 pool_alloc_files  $POOL $test_path $files "$ost_list" \
19407                                                         || { rc=$? ; break; }
19408                 pool_create_files $POOL $file_dir $files "$ost_list" \
19409                                                         || { rc=$? ; break; }
19410                 # former test_200g test_200h
19411                 pool_lfs_df $POOL                       || { rc=$? ; break; }
19412                 pool_file_rel_path $POOL $test_path     || { rc=$? ; break; }
19413
19414                 # former test_201a test_201b test_201c
19415                 pool_remove_first_target $POOL          || { rc=$? ; break; }
19416
19417                 local f=$test_path/$tfile
19418                 pool_remove_all_targets $POOL $f        || { rc=$? ; break; }
19419                 pool_remove $POOL $f                    || { rc=$? ; break; }
19420                 break
19421         done
19422
19423         destroy_test_pools
19424
19425         return $rc
19426 }
19427 run_test 200 "OST pools"
19428
19429 # usage: default_attr <count | size | offset>
19430 default_attr() {
19431         $LCTL get_param -n lov.$FSNAME-clilov-\*.stripe${1}
19432 }
19433
19434 # usage: check_default_stripe_attr
19435 check_default_stripe_attr() {
19436         ACTUAL=$($LFS getstripe $* $DIR/$tdir)
19437         case $1 in
19438         --stripe-count|-c)
19439                 [ -n "$2" ] && EXPECTED=0 || EXPECTED=$(default_attr count);;
19440         --stripe-size|-S)
19441                 [ -n "$2" ] && EXPECTED=0 || EXPECTED=$(default_attr size);;
19442         --stripe-index|-i)
19443                 EXPECTED=-1;;
19444         *)
19445                 error "unknown getstripe attr '$1'"
19446         esac
19447
19448         [ $ACTUAL == $EXPECTED ] ||
19449                 error "$DIR/$tdir has $1 '$ACTUAL', not '$EXPECTED'"
19450 }
19451
19452 test_204a() {
19453         test_mkdir $DIR/$tdir
19454         $LFS setstripe --stripe-count 0 --stripe-size 0 --stripe-index -1 $DIR/$tdir
19455
19456         check_default_stripe_attr --stripe-count
19457         check_default_stripe_attr --stripe-size
19458         check_default_stripe_attr --stripe-index
19459 }
19460 run_test 204a "Print default stripe attributes"
19461
19462 test_204b() {
19463         test_mkdir $DIR/$tdir
19464         $LFS setstripe --stripe-count 1 $DIR/$tdir
19465
19466         check_default_stripe_attr --stripe-size
19467         check_default_stripe_attr --stripe-index
19468 }
19469 run_test 204b "Print default stripe size and offset"
19470
19471 test_204c() {
19472         test_mkdir $DIR/$tdir
19473         $LFS setstripe --stripe-size 65536 $DIR/$tdir
19474
19475         check_default_stripe_attr --stripe-count
19476         check_default_stripe_attr --stripe-index
19477 }
19478 run_test 204c "Print default stripe count and offset"
19479
19480 test_204d() {
19481         test_mkdir $DIR/$tdir
19482         $LFS setstripe --stripe-index 0 $DIR/$tdir
19483
19484         check_default_stripe_attr --stripe-count
19485         check_default_stripe_attr --stripe-size
19486 }
19487 run_test 204d "Print default stripe count and size"
19488
19489 test_204e() {
19490         test_mkdir $DIR/$tdir
19491         $LFS setstripe -d $DIR/$tdir
19492
19493         check_default_stripe_attr --stripe-count --raw
19494         check_default_stripe_attr --stripe-size --raw
19495         check_default_stripe_attr --stripe-index --raw
19496 }
19497 run_test 204e "Print raw stripe attributes"
19498
19499 test_204f() {
19500         test_mkdir $DIR/$tdir
19501         $LFS setstripe --stripe-count 1 $DIR/$tdir
19502
19503         check_default_stripe_attr --stripe-size --raw
19504         check_default_stripe_attr --stripe-index --raw
19505 }
19506 run_test 204f "Print raw stripe size and offset"
19507
19508 test_204g() {
19509         test_mkdir $DIR/$tdir
19510         $LFS setstripe --stripe-size 65536 $DIR/$tdir
19511
19512         check_default_stripe_attr --stripe-count --raw
19513         check_default_stripe_attr --stripe-index --raw
19514 }
19515 run_test 204g "Print raw stripe count and offset"
19516
19517 test_204h() {
19518         test_mkdir $DIR/$tdir
19519         $LFS setstripe --stripe-index 0 $DIR/$tdir
19520
19521         check_default_stripe_attr --stripe-count --raw
19522         check_default_stripe_attr --stripe-size --raw
19523 }
19524 run_test 204h "Print raw stripe count and size"
19525
19526 # Figure out which job scheduler is being used, if any,
19527 # or use a fake one
19528 if [ -n "$SLURM_JOB_ID" ]; then # SLURM
19529         JOBENV=SLURM_JOB_ID
19530 elif [ -n "$LSB_JOBID" ]; then # Load Sharing Facility
19531         JOBENV=LSB_JOBID
19532 elif [ -n "$PBS_JOBID" ]; then # PBS/Maui/Moab
19533         JOBENV=PBS_JOBID
19534 elif [ -n "$LOADL_STEPID" ]; then # LoadLeveller
19535         JOBENV=LOADL_STEP_ID
19536 elif [ -n "$JOB_ID" ]; then # Sun Grid Engine
19537         JOBENV=JOB_ID
19538 else
19539         $LCTL list_param jobid_name > /dev/null 2>&1
19540         if [ $? -eq 0 ]; then
19541                 JOBENV=nodelocal
19542         else
19543                 JOBENV=FAKE_JOBID
19544         fi
19545 fi
19546 LUSTRE_JOBID_SIZE=31 # plus NUL terminator
19547
19548 verify_jobstats() {
19549         local cmd=($1)
19550         shift
19551         local facets="$@"
19552
19553 # we don't really need to clear the stats for this test to work, since each
19554 # command has a unique jobid, but it makes debugging easier if needed.
19555 #       for facet in $facets; do
19556 #               local dev=$(convert_facet2label $facet)
19557 #               # clear old jobstats
19558 #               do_facet $facet lctl set_param *.$dev.job_stats="clear"
19559 #       done
19560
19561         # use a new JobID for each test, or we might see an old one
19562         [ "$JOBENV" = "FAKE_JOBID" ] &&
19563                 FAKE_JOBID=id.$testnum.$(basename ${cmd[0]}).$RANDOM
19564
19565         JOBVAL=${!JOBENV:0:$LUSTRE_JOBID_SIZE}
19566
19567         [ "$JOBENV" = "nodelocal" ] && {
19568                 FAKE_JOBID=id.$testnum.%e.$RANDOM
19569                 $LCTL set_param jobid_name=$FAKE_JOBID
19570                 JOBVAL=${FAKE_JOBID/\%e/$(basename ${cmd[0]})}
19571         }
19572
19573         log "Test: ${cmd[*]}"
19574         log "Using JobID environment $($LCTL get_param -n jobid_var)=$JOBVAL"
19575
19576         if [ $JOBENV = "FAKE_JOBID" ]; then
19577                 FAKE_JOBID=$JOBVAL ${cmd[*]}
19578         else
19579                 ${cmd[*]}
19580         fi
19581
19582         # all files are created on OST0000
19583         for facet in $facets; do
19584                 local stats="*.$(convert_facet2label $facet).job_stats"
19585
19586                 # strip out libtool wrappers for in-tree executables
19587                 if (( $(do_facet $facet lctl get_param $stats |
19588                         sed -e 's/\.lt-/./' | grep -cw $JOBVAL) != 1 )); then
19589                         do_facet $facet lctl get_param $stats
19590                         error "No jobstats for $JOBVAL found on $facet::$stats"
19591                 fi
19592         done
19593 }
19594
19595 jobstats_set() {
19596         local new_jobenv=$1
19597
19598         set_persistent_param_and_check client "jobid_var" \
19599                 "$FSNAME.sys.jobid_var" $new_jobenv
19600 }
19601
19602 test_205a() { # Job stats
19603         [ $PARALLEL == "yes" ] && skip "skip parallel run"
19604         [[ $MDS1_VERSION -ge $(version_code 2.7.1) ]] ||
19605                 skip "Need MDS version with at least 2.7.1"
19606         remote_mgs_nodsh && skip "remote MGS with nodsh"
19607         remote_mds_nodsh && skip "remote MDS with nodsh"
19608         remote_ost_nodsh && skip "remote OST with nodsh"
19609         [ -z "$(lctl get_param -n mdc.*.connect_flags | grep jobstats)" ] &&
19610                 skip "Server doesn't support jobstats"
19611         [[ $JOBID_VAR = disable ]] && skip_env "jobstats is disabled"
19612
19613         local old_jobenv=$($LCTL get_param -n jobid_var)
19614         [ $old_jobenv != $JOBENV ] && jobstats_set $JOBENV
19615         stack_trap "jobstats_set $old_jobenv" EXIT
19616
19617         changelog_register
19618
19619         local old_jobid_name=$($LCTL get_param jobid_name)
19620         stack_trap "$LCTL set_param $old_jobid_name" EXIT
19621
19622         local old_interval=$(do_facet $SINGLEMDS lctl get_param -n \
19623                                 mdt.*.job_cleanup_interval | head -n 1)
19624         local new_interval=5
19625         do_facet $SINGLEMDS \
19626                 $LCTL set_param mdt.*.job_cleanup_interval=$new_interval
19627         stack_trap "do_facet $SINGLEMDS \
19628                 $LCTL set_param mdt.*.job_cleanup_interval=$old_interval" EXIT
19629         local start=$SECONDS
19630
19631         local cmd
19632         # mkdir
19633         cmd="$LFS mkdir -i 0 -c 1 $DIR/$tdir"
19634         verify_jobstats "$cmd" "$SINGLEMDS"
19635         # rmdir
19636         cmd="rmdir $DIR/$tdir"
19637         verify_jobstats "$cmd" "$SINGLEMDS"
19638         # mkdir on secondary MDT
19639         if [ $MDSCOUNT -gt 1 ]; then
19640                 cmd="lfs mkdir -i 1 $DIR/$tdir.remote"
19641                 verify_jobstats "$cmd" "mds2"
19642         fi
19643         # mknod
19644         cmd="mknod $DIR/$tfile c 1 3"
19645         verify_jobstats "$cmd" "$SINGLEMDS"
19646         # unlink
19647         cmd="rm -f $DIR/$tfile"
19648         verify_jobstats "$cmd" "$SINGLEMDS"
19649         # create all files on OST0000 so verify_jobstats can find OST stats
19650         # open & close
19651         cmd="$LFS setstripe -i 0 -c 1 $DIR/$tfile"
19652         verify_jobstats "$cmd" "$SINGLEMDS"
19653         # setattr
19654         cmd="touch $DIR/$tfile"
19655         verify_jobstats "$cmd" "$SINGLEMDS ost1"
19656         # write
19657         cmd="dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 oflag=sync"
19658         verify_jobstats "$cmd" "ost1"
19659         # read
19660         cancel_lru_locks osc
19661         cmd="dd if=$DIR/$tfile of=/dev/null bs=1M count=1 iflag=direct"
19662         verify_jobstats "$cmd" "ost1"
19663         # truncate
19664         cmd="$TRUNCATE $DIR/$tfile 0"
19665         verify_jobstats "$cmd" "$SINGLEMDS ost1"
19666         # rename
19667         cmd="mv -f $DIR/$tfile $DIR/$tdir.rename"
19668         verify_jobstats "$cmd" "$SINGLEMDS"
19669         # jobstats expiry - sleep until old stats should be expired
19670         local left=$((new_interval + 5 - (SECONDS - start)))
19671         [ $left -ge 0 ] && wait_update_facet $SINGLEMDS \
19672                 "lctl get_param *.*.job_stats | grep -c 'job_id.*mkdir'" \
19673                         "0" $left
19674         cmd="$LFS mkdir -i 0 -c 1 $DIR/$tdir.expire"
19675         verify_jobstats "$cmd" "$SINGLEMDS"
19676         [ $(do_facet $SINGLEMDS lctl get_param *.*.job_stats |
19677             grep -c "job_id.*mkdir") -gt 1 ] && error "old jobstats not expired"
19678
19679         # Ensure that jobid are present in changelog (if supported by MDS)
19680         if [ $MDS1_VERSION -ge $(version_code 2.6.52) ];then
19681                 changelog_dump | tail -10
19682                 jobids=$(changelog_dump | tail -9 | grep -c "j=")
19683                 [ $jobids -eq 9 ] ||
19684                         error "Wrong changelog jobid count $jobids != 9"
19685
19686                 # LU-5862
19687                 JOBENV="disable"
19688                 jobstats_set $JOBENV
19689                 touch $DIR/$tfile
19690                 changelog_dump | grep $tfile
19691                 jobids=$(changelog_dump | grep $tfile | tail -1 | grep -c "j=")
19692                 [ $jobids -eq 0 ] ||
19693                         error "Unexpected jobids when jobid_var=$JOBENV"
19694         fi
19695
19696         # test '%j' access to environment variable - if supported
19697         if lctl set_param jobid_var=USER jobid_name="S.%j.%e.%u.%h.E"; then
19698                 JOBENV="JOBCOMPLEX"
19699                 JOBCOMPLEX="S.$USER.touch.$(id -u).$(hostname).E"
19700
19701                 verify_jobstats "touch $DIR/$tfile" $SINGLEMDS
19702         fi
19703
19704         if lctl set_param jobid_var=USER jobid_name="S.%j.%e.%u.%H.E"; then
19705                 JOBENV="JOBCOMPLEX"
19706                 JOBCOMPLEX="S.$USER.touch.$(id -u).$(hostname -s).E"
19707
19708                 verify_jobstats "touch $DIR/$tfile" $SINGLEMDS
19709         fi
19710
19711         # test '%j' access to per-session jobid - if supported
19712         if lctl list_param jobid_this_session > /dev/null 2>&1
19713         then
19714                 lctl set_param jobid_var=session jobid_name="S.%j.%e.%u.%h.E"
19715                 lctl set_param jobid_this_session=$USER
19716
19717                 JOBENV="JOBCOMPLEX"
19718                 JOBCOMPLEX="S.$USER.touch.$(id -u).$(hostname).E"
19719
19720                 verify_jobstats "touch $DIR/$tfile" $SINGLEMDS
19721         fi
19722 }
19723 run_test 205a "Verify job stats"
19724
19725 # LU-13117, LU-13597, LU-16599
19726 test_205b() {
19727         (( $MDS1_VERSION >= $(version_code 2.13.54.91) )) ||
19728                 skip "Need MDS version at least 2.13.54.91"
19729
19730         local job_stats="mdt.*.job_stats"
19731         local old_jobid=$(do_facet mds1 $LCTL get_param jobid_var)
19732
19733         do_facet mds1 $LCTL set_param $job_stats=clear
19734
19735         # Setting jobid_var to USER might not be supported
19736         [[ -n "$old_jobid" ]] && stack_trap "$LCTL set_param $old_jobid"
19737         $LCTL set_param jobid_var=USER || true
19738         stack_trap "$LCTL set_param $($LCTL get_param jobid_name)"
19739         $LCTL set_param jobid_name="%j.%e.%u"
19740
19741         env -i USERTESTJOBSTATS=foolish touch $DIR/$tfile.1
19742         do_facet mds1 $LCTL get_param $job_stats | grep "job_id:.*foolish" &&
19743                 { do_facet mds1 $LCTL get_param $job_stats;
19744                   error "Unexpected jobid found"; }
19745         do_facet mds1 $LCTL get_param $job_stats | grep "open:.*min.*max.*sum"||
19746                 { do_facet mds1 $LCTL get_param $job_stats;
19747                   error "wrong job_stats format found"; }
19748
19749         (( $MDS1_VERSION <= $(version_code 2.15.0) )) &&
19750                 echo "MDS does not yet escape jobid" && return 0
19751
19752         mkdir_on_mdt0 $DIR/$tdir
19753         $LCTL set_param jobid_var=TEST205b
19754         env -i TEST205b="has sp" touch $DIR/$tdir/$tfile.2
19755         local jobid=$(do_facet mds1 $LCTL get_param $job_stats |
19756                       awk '/has\\x20sp/ {print $3}')
19757         [[ -n "$jobid" ]] || { do_facet mds1 $LCTL get_param $job_stats;
19758                   error "jobid not escaped"; }
19759
19760         if (( $MDS1_VERSION >= $(version_code 2.15.53.139) )); then
19761                 # need to run such a command on mds1:
19762                 # lctl set_param mdt.$FSNAME-MDT0000.job_stats='"has\x20sp.touch.0"'
19763                 #
19764                 # there might be multiple MDTs on single mds server, so need to
19765                 # specifiy MDT0000. Or the command will fail due to other MDTs
19766                 do_facet_vp mds1 $LCTL set_param mdt.$FSNAME-MDT0000.job_stats=$jobid ||
19767                         error "cannot clear escaped jobid in job_stats";
19768         else
19769                 echo "MDS does not support clearing escaped jobid"
19770         fi
19771 }
19772 run_test 205b "Verify job stats jobid and output format"
19773
19774 # LU-13733
19775 test_205c() {
19776         $LCTL set_param llite.*.stats=0
19777         dd if=/dev/zero of=$DIR/$tfile.1 bs=4k count=1
19778         $LCTL get_param llite.*.stats
19779         $LCTL get_param llite.*.stats | grep \
19780                 "write_bytes *1 samples \[bytes\] 4096 4096 4096 16777216" ||
19781                         error "wrong client stats format found"
19782 }
19783 run_test 205c "Verify client stats format"
19784
19785 test_205d() {
19786         local file=$DIR/$tdir/$tfile
19787
19788         (( $MDS1_VERSION >= $(version_code 2.15.53) )) ||
19789                 skip "need lustre >= 2.15.53 for lljobstat"
19790         (( $OST1_VERSION >= $(version_code 2.15.53) )) ||
19791                 skip "need lustre >= 2.15.53 for lljobstat"
19792         verify_yaml_available || skip_env "YAML verification not installed"
19793
19794         test_mkdir -i 0 $DIR/$tdir
19795         $LFS setstripe -E 1M -L mdt -E -1 $file || error "create file failed"
19796         stack_trap "rm -rf $DIR/$tdir"
19797
19798         dd if=/dev/zero of=$file bs=1M count=10 conv=sync ||
19799                 error "failed to write data to $file"
19800         mv $file $file.2
19801
19802         do_facet mds1 "$LCTL get_param -n mdt.$FSNAME-MDT0000.rename_stats"
19803         echo -n 'verify rename_stats...'
19804         do_facet mds1 "$LCTL get_param -n mdt.$FSNAME-MDT0000.rename_stats" |
19805                 verify_yaml || error "rename_stats is not valid YAML"
19806         echo " OK"
19807
19808         echo -n 'verify mdt job_stats...'
19809         do_facet mds1 "$LCTL get_param -n mdt.$FSNAME-MDT0000.job_stats" |
19810                 verify_yaml || error "job_stats on mds1 is not valid YAML"
19811         echo " OK"
19812
19813         echo -n 'verify ost job_stats...'
19814         do_facet ost1 "$LCTL get_param -n obdfilter.$FSNAME-OST0000.job_stats" |
19815                 verify_yaml || error "job_stats on ost1 is not valid YAML"
19816         echo " OK"
19817 }
19818 run_test 205d "verify the format of some stats files"
19819
19820 test_205e() {
19821         local ops_comma
19822         local file=$DIR/$tdir/$tfile
19823         local -a cli_params
19824
19825         (( $MDS1_VERSION >= $(version_code 2.15.53) )) ||
19826                 skip "need lustre >= 2.15.53 for lljobstat"
19827         (( $OST1_VERSION >= $(version_code 2.15.53) )) ||
19828                 skip "need lustre >= 2.15.53 for lljobstat"
19829         verify_yaml_available || skip_env "YAML verification not installed"
19830
19831         cli_params=( $($LCTL get_param jobid_name jobid_var) )
19832         $LCTL set_param jobid_var=nodelocal jobid_name=205e.%e.%u
19833         stack_trap "$LCTL set_param ${cli_params[*]}" EXIT
19834
19835         mkdir_on_mdt0 $DIR/$tdir || error "failed to create dir"
19836         stack_trap "rm -rf $DIR/$tdir"
19837
19838         $LFS setstripe -E EOF -i 0 -c 1 $file ||
19839                 error "failed to create $file on ost1"
19840         dd if=/dev/zero of=$file bs=1M count=10 oflag=sync ||
19841                 error "failed to write data to $file"
19842
19843         do_facet mds1 "$LCTL get_param *.*.job_stats"
19844         do_facet ost1 "$LCTL get_param *.*.job_stats"
19845
19846         do_facet ost1 "lljobstat -n 1 -i 0 -c 1000"
19847         do_facet ost1 "lljobstat -n 1 -i 0 -c 1000" | verify_yaml ||
19848                 error "The output of lljobstat is not an valid YAML"
19849
19850         # verify that job dd.0 does exist and has some ops on ost1
19851         # typically this line is like:
19852         # - 205e.dd.0:            {ops: 20, ...}
19853         ops_comma=$(do_facet ost1 "lljobstat -n 1 -i 0 -c 1000" |
19854                     awk '$2=="205e.dd.0:" {print $4}')
19855
19856         (( ${ops_comma%,} >= 10 )) ||
19857                 error "cannot find job 205e.dd.0 with ops >= 10"
19858 }
19859 run_test 205e "verify the output of lljobstat"
19860
19861 test_205f() {
19862         verify_yaml_available || skip_env "YAML verification not installed"
19863
19864         # check both qos_ost_weights and qos_mdt_weights
19865         do_facet mds1 $LCTL get_param -n lod.*.qos*weights
19866         do_facet mds1 $LCTL get_param -n lod.*.qos*weights | verify_yaml ||
19867                 error "qos_ost_weights is not valid YAML"
19868 }
19869 run_test 205f "verify qos_ost_weights YAML format "
19870
19871 __test_205_jobstats_dump() {
19872         local -a pids
19873         local nbr_instance=$1
19874
19875         while true; do
19876                 if (( ${#pids[@]} >= nbr_instance )); then
19877                         wait ${pids[@]}
19878                         pids=()
19879                 fi
19880
19881                 do_facet mds1 "$LCTL get_param mdt.*.job_stats > /dev/null" &
19882                 pids+=( $! )
19883         done
19884 }
19885
19886 __test_205_cleanup() {
19887         kill $@
19888         # Clear all job entries
19889         do_facet mds1 "$LCTL set_param mdt.*.job_stats=clear"
19890 }
19891
19892 test_205g() {
19893         local -a mds1_params
19894         local -a cli_params
19895         local pids
19896         local interval=5
19897
19898         mds1_params=( $(do_facet mds1 $LCTL get_param mdt.*.job_cleanup_interval) )
19899         do_facet mds1 $LCTL set_param mdt.*.job_cleanup_interval=$interval
19900         stack_trap "do_facet mds1 $LCTL set_param ${mds1_params[*]}" EXIT
19901
19902         cli_params=( $($LCTL get_param jobid_name jobid_var) )
19903         $LCTL set_param jobid_var=TEST205G_ID jobid_name=%j.%p
19904         stack_trap "$LCTL set_param ${cli_params[*]}" EXIT
19905
19906         # start jobs loop
19907         export TEST205G_ID=205g
19908         stack_trap "unset TEST205G_ID" EXIT
19909         while true; do
19910                 printf $DIR/$tfile.{0001..1000} | xargs -P10 -n1 touch
19911         done & pids="$! "
19912
19913         __test_205_jobstats_dump 4 & pids+="$! "
19914         stack_trap "__test_205_cleanup $pids" EXIT INT
19915
19916         [[ $SLOW == "no" ]] && sleep 90 || sleep 240
19917 }
19918 run_test 205g "stress test for job_stats procfile"
19919
19920 # LU-1480, LU-1773 and LU-1657
19921 test_206() {
19922         mkdir -p $DIR/$tdir
19923         $LFS setstripe -c -1 $DIR/$tdir
19924 #define OBD_FAIL_LOV_INIT 0x1403
19925         $LCTL set_param fail_loc=0xa0001403
19926         $LCTL set_param fail_val=1
19927         touch $DIR/$tdir/$tfile || true
19928 }
19929 run_test 206 "fail lov_init_raid0() doesn't lbug"
19930
19931 test_207a() {
19932         dd if=/dev/zero of=$DIR/$tfile bs=4k count=$((RANDOM%10+1))
19933         local fsz=`stat -c %s $DIR/$tfile`
19934         cancel_lru_locks mdc
19935
19936         # do not return layout in getattr intent
19937 #define OBD_FAIL_MDS_NO_LL_GETATTR 0x170
19938         $LCTL set_param fail_loc=0x170
19939         local sz=`stat -c %s $DIR/$tfile`
19940
19941         [ $fsz -eq $sz ] || error "file size expected $fsz, actual $sz"
19942
19943         rm -rf $DIR/$tfile
19944 }
19945 run_test 207a "can refresh layout at glimpse"
19946
19947 test_207b() {
19948         dd if=/dev/zero of=$DIR/$tfile bs=4k count=$((RANDOM%10+1))
19949         local cksum=`md5sum $DIR/$tfile`
19950         local fsz=`stat -c %s $DIR/$tfile`
19951         cancel_lru_locks mdc
19952         cancel_lru_locks osc
19953
19954         # do not return layout in getattr intent
19955 #define OBD_FAIL_MDS_NO_LL_OPEN 0x171
19956         $LCTL set_param fail_loc=0x171
19957
19958         # it will refresh layout after the file is opened but before read issues
19959         echo checksum is "$cksum"
19960         echo "$cksum" |md5sum -c --quiet || error "file differs"
19961
19962         rm -rf $DIR/$tfile
19963 }
19964 run_test 207b "can refresh layout at open"
19965
19966 test_208() {
19967         # FIXME: in this test suite, only RD lease is used. This is okay
19968         # for now as only exclusive open is supported. After generic lease
19969         # is done, this test suite should be revised. - Jinshan
19970
19971         remote_mds_nodsh && skip "remote MDS with nodsh"
19972         [[ $MDS1_VERSION -ge $(version_code 2.4.52) ]] ||
19973                 skip "Need MDS version at least 2.4.52"
19974
19975         echo "==== test 1: verify get lease work"
19976         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:eRE+eU || error "get lease error"
19977
19978         echo "==== test 2: verify lease can be broken by upcoming open"
19979         $MULTIOP $DIR/$tfile oO_RDWR:eR_E-eUc &
19980         local PID=$!
19981         sleep 2
19982
19983         $MULTIOP $DIR/$tfile oO_RDWR:c
19984         kill -USR1 $PID && wait $PID || error "break lease error"
19985
19986         echo "==== test 3: verify lease can't be granted if an open already exists"
19987         $MULTIOP $DIR/$tfile oO_RDWR:_c &
19988         local PID=$!
19989         sleep 2
19990
19991         $MULTIOP $DIR/$tfile oO_RDWR:eReUc && error "apply lease should fail"
19992         kill -USR1 $PID && wait $PID || error "open file error"
19993
19994         echo "==== test 4: lease can sustain over recovery"
19995         $MULTIOP $DIR/$tfile oO_RDWR:eR_E+eUc &
19996         PID=$!
19997         sleep 2
19998
19999         fail mds1
20000
20001         kill -USR1 $PID && wait $PID || error "lease broken over recovery"
20002
20003         echo "==== test 5: lease broken can't be regained by replay"
20004         $MULTIOP $DIR/$tfile oO_RDWR:eR_E-eUc &
20005         PID=$!
20006         sleep 2
20007
20008         # open file to break lease and then recovery
20009         $MULTIOP $DIR/$tfile oO_RDWR:c || error "open file error"
20010         fail mds1
20011
20012         kill -USR1 $PID && wait $PID || error "lease not broken over recovery"
20013
20014         rm -f $DIR/$tfile
20015 }
20016 run_test 208 "Exclusive open"
20017
20018 test_209() {
20019         [ -z "$(lctl get_param -n mdc.*.connect_flags | grep disp_stripe)" ] &&
20020                 skip_env "must have disp_stripe"
20021
20022         touch $DIR/$tfile
20023         sync; sleep 5; sync;
20024
20025         echo 3 > /proc/sys/vm/drop_caches
20026         [ -f /sys/kernel/slab/ptlrpc_cache/shrink ] &&
20027                 echo 1 > /sys/kernel/slab/ptlrpc_cache/shrink
20028         req_before=$(awk '/ptlrpc_cache / { print $2 }' /proc/slabinfo)
20029
20030         # open/close 500 times
20031         for i in $(seq 500); do
20032                 cat $DIR/$tfile
20033         done
20034
20035         echo 3 > /proc/sys/vm/drop_caches
20036         [ -f /sys/kernel/slab/ptlrpc_cache/shrink ] &&
20037                 echo 1 > /sys/kernel/slab/ptlrpc_cache/shrink
20038         req_after=$(awk '/ptlrpc_cache / { print $2 }' /proc/slabinfo)
20039
20040         echo "before: $req_before, after: $req_after"
20041         [ $((req_after - req_before)) -ge 300 ] &&
20042                 error "open/close requests are not freed"
20043         return 0
20044 }
20045 run_test 209 "read-only open/close requests should be freed promptly"
20046
20047 test_210() {
20048         local pid
20049
20050         $MULTIOP $DIR/$tfile oO_CREAT:O_RDWR:eW_E+eUc &
20051         pid=$!
20052         sleep 1
20053
20054         $LFS getstripe $DIR/$tfile
20055         kill -USR1 $pid
20056         wait $pid || error "multiop failed"
20057
20058         $MULTIOP $DIR/$tfile oO_RDONLY:eR_E+eUc &
20059         pid=$!
20060         sleep 1
20061
20062         $LFS getstripe $DIR/$tfile
20063         kill -USR1 $pid
20064         wait $pid || error "multiop failed"
20065 }
20066 run_test 210 "lfs getstripe does not break leases"
20067
20068 test_212() {
20069         size=`date +%s`
20070         size=$((size % 8192 + 1))
20071         dd if=/dev/urandom of=$DIR/f212 bs=1k count=$size
20072         sendfile $DIR/f212 $DIR/f212.xyz || error "sendfile wrong"
20073         rm -f $DIR/f212 $DIR/f212.xyz
20074 }
20075 run_test 212 "Sendfile test ============================================"
20076
20077 test_213() {
20078         dd if=/dev/zero of=$DIR/$tfile bs=4k count=4
20079         cancel_lru_locks osc
20080         lctl set_param fail_loc=0x8000040f
20081         # generate a read lock
20082         cat $DIR/$tfile > /dev/null
20083         # write to the file, it will try to cancel the above read lock.
20084         cat /etc/hosts >> $DIR/$tfile
20085 }
20086 run_test 213 "OSC lock completion and cancel race don't crash - bug 18829"
20087
20088 test_214() { # for bug 20133
20089         mkdir -p $DIR/$tdir/d214c || error "mkdir $DIR/$tdir/d214c failed"
20090         for (( i=0; i < 340; i++ )) ; do
20091                 touch $DIR/$tdir/d214c/a$i
20092         done
20093
20094         ls -l $DIR/$tdir || error "ls -l $DIR/d214p failed"
20095         mv $DIR/$tdir/d214c $DIR/ || error "mv $DIR/d214p/d214c $DIR/ failed"
20096         ls $DIR/d214c || error "ls $DIR/d214c failed"
20097         rm -rf $DIR/$tdir || error "rm -rf $DIR/d214* failed"
20098         rm -rf $DIR/d214* || error "rm -rf $DIR/d214* failed"
20099 }
20100 run_test 214 "hash-indexed directory test - bug 20133"
20101
20102 # having "abc" as 1st arg, creates $TMP/lnet_abc.out and $TMP/lnet_abc.sys
20103 create_lnet_proc_files() {
20104         lctl get_param -n $1 >$TMP/lnet_$1.sys || error "cannot read lnet.$1"
20105 }
20106
20107 # counterpart of create_lnet_proc_files
20108 remove_lnet_proc_files() {
20109         rm -f $TMP/lnet_$1.sys
20110 }
20111
20112 # uses 1st arg as trailing part of filename, 2nd arg as description for reports,
20113 # 3rd arg as regexp for body
20114 check_lnet_proc_stats() {
20115         local l=$(cat "$TMP/lnet_$1" |wc -l)
20116         [ $l = 1 ] || (cat "$TMP/lnet_$1" && error "$2 is not of 1 line: $l")
20117
20118         grep -E "$3" "$TMP/lnet_$1" || (cat "$TMP/lnet_$1" && error "$2 misformatted")
20119 }
20120
20121 # uses 1st arg as trailing part of filename, 2nd arg as description for reports,
20122 # 3rd arg as regexp for body, 4th arg as regexp for 1st line, 5th arg is
20123 # optional and can be regexp for 2nd line (lnet.routes case)
20124 check_lnet_proc_entry() {
20125         local blp=2          # blp stands for 'position of 1st line of body'
20126         [ -z "$5" ] || blp=3 # lnet.routes case
20127
20128         local l=$(cat "$TMP/lnet_$1" |wc -l)
20129         # subtracting one from $blp because the body can be empty
20130         [ "$l" -ge "$(($blp - 1))" ] || (cat "$TMP/lnet_$1" && error "$2 is too short: $l")
20131
20132         sed -n '1 p' "$TMP/lnet_$1" |grep -E "$4" >/dev/null ||
20133                 (cat "$TMP/lnet_$1" && error "1st line of $2 misformatted")
20134
20135         [ "$5" = "" ] || sed -n '2 p' "$TMP/lnet_$1" |grep -E "$5" >/dev/null ||
20136                 (cat "$TMP/lnet_$1" && error "2nd line of $2 misformatted")
20137
20138         # bail out if any unexpected line happened
20139         sed -n "$blp p" "$TMP/lnet_$1" | grep -Ev "$3"
20140         [ "$?" != 0 ] || error "$2 misformatted"
20141 }
20142
20143 test_215() { # for bugs 18102, 21079, 21517
20144         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20145
20146         local N='(0|[1-9][0-9]*)'       # non-negative numeric
20147         local P='[1-9][0-9]*'           # positive numeric
20148         local I='(0|-?[1-9][0-9]*|NA)'  # any numeric (0 | >0 | <0) or NA if no value
20149         local NET='[a-z][a-z0-9]*'      # LNET net like o2ib2
20150         local ADDR='[0-9.]+'            # LNET addr like 10.0.0.1
20151         local NID="$ADDR@$NET"          # LNET nid like 10.0.0.1@o2ib2
20152
20153         local L1 # regexp for 1st line
20154         local L2 # regexp for 2nd line (optional)
20155         local BR # regexp for the rest (body)
20156
20157         # lnet.stats should look as 11 space-separated non-negative numerics
20158         BR="^$N $N $N $N $N $N $N $N $N $N $N$"
20159         create_lnet_proc_files "stats"
20160         check_lnet_proc_stats "stats.sys" "lnet.stats" "$BR"
20161         remove_lnet_proc_files "stats"
20162
20163         # lnet.routes should look like this:
20164         # Routing disabled/enabled
20165         # net hops priority state router
20166         # where net is a string like tcp0, hops > 0, priority >= 0,
20167         # state is up/down,
20168         # router is a string like 192.168.1.1@tcp2
20169         L1="^Routing (disabled|enabled)$"
20170         L2="^net +hops +priority +state +router$"
20171         BR="^$NET +$N +(0|1) +(up|down) +$NID$"
20172         create_lnet_proc_files "routes"
20173         check_lnet_proc_entry "routes.sys" "lnet.routes" "$BR" "$L1" "$L2"
20174         remove_lnet_proc_files "routes"
20175
20176         # lnet.routers should look like this:
20177         # ref rtr_ref alive_cnt state last_ping ping_sent deadline down_ni router
20178         # where ref > 0, rtr_ref > 0, alive_cnt >= 0, state is up/down,
20179         # last_ping >= 0, ping_sent is boolean (0/1), deadline and down_ni are
20180         # numeric (0 or >0 or <0), router is a string like 192.168.1.1@tcp2
20181         L1="^ref +rtr_ref +alive +router$"
20182         BR="^$P +$P +(up|down) +$NID$"
20183         create_lnet_proc_files "routers"
20184         check_lnet_proc_entry "routers.sys" "lnet.routers" "$BR" "$L1"
20185         remove_lnet_proc_files "routers"
20186
20187         # lnet.peers should look like this:
20188         # nid refs state last max rtr min tx min queue
20189         # where nid is a string like 192.168.1.1@tcp2, refs > 0,
20190         # state is up/down/NA, max >= 0. last, rtr, min, tx, min are
20191         # numeric (0 or >0 or <0), queue >= 0.
20192         L1="^nid +refs +state +last +max +rtr +min +tx +min +queue$"
20193         BR="^$NID +$P +(up|down|NA) +$I +$N +$I +$I +$I +$I +$N$"
20194         create_lnet_proc_files "peers"
20195         check_lnet_proc_entry "peers.sys" "lnet.peers" "$BR" "$L1"
20196         remove_lnet_proc_files "peers"
20197
20198         # lnet.buffers  should look like this:
20199         # pages count credits min
20200         # where pages >=0, count >=0, credits and min are numeric (0 or >0 or <0)
20201         L1="^pages +count +credits +min$"
20202         BR="^ +$N +$N +$I +$I$"
20203         create_lnet_proc_files "buffers"
20204         check_lnet_proc_entry "buffers.sys" "lnet.buffers" "$BR" "$L1"
20205         remove_lnet_proc_files "buffers"
20206
20207         # lnet.nis should look like this:
20208         # nid status alive refs peer rtr max tx min
20209         # where nid is a string like 192.168.1.1@tcp2, status is up/down,
20210         # alive is numeric (0 or >0 or <0), refs >= 0, peer >= 0,
20211         # rtr >= 0, max >=0, tx and min are numeric (0 or >0 or <0).
20212         L1="^nid +status +alive +refs +peer +rtr +max +tx +min$"
20213         BR="^$NID +(up|down) +$I +$N +$N +$N +$N +$I +$I$"
20214         create_lnet_proc_files "nis"
20215         check_lnet_proc_entry "nis.sys" "lnet.nis" "$BR" "$L1"
20216         remove_lnet_proc_files "nis"
20217
20218         # can we successfully write to lnet.stats?
20219         lctl set_param -n stats=0 || error "cannot write to lnet.stats"
20220 }
20221 run_test 215 "lnet exists and has proper content - bugs 18102, 21079, 21517"
20222
20223 test_216() { # bug 20317
20224         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20225         remote_ost_nodsh && skip "remote OST with nodsh"
20226
20227         local node
20228         local facets=$(get_facets OST)
20229         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
20230
20231         save_lustre_params client "osc.*.contention_seconds" > $p
20232         save_lustre_params $facets \
20233                 "ldlm.namespaces.filter-*.max_nolock_bytes" >> $p
20234         save_lustre_params $facets \
20235                 "ldlm.namespaces.filter-*.contended_locks" >> $p
20236         save_lustre_params $facets \
20237                 "ldlm.namespaces.filter-*.contention_seconds" >> $p
20238         clear_stats osc.*.osc_stats
20239
20240         # agressive lockless i/o settings
20241         do_nodes $(comma_list $(osts_nodes)) \
20242                 "lctl set_param -n ldlm.namespaces.*.max_nolock_bytes=2000000 \
20243                         ldlm.namespaces.filter-*.contended_locks=0 \
20244                         ldlm.namespaces.filter-*.contention_seconds=60"
20245         lctl set_param -n osc.*.contention_seconds=60
20246
20247         $DIRECTIO write $DIR/$tfile 0 10 4096
20248         $CHECKSTAT -s 40960 $DIR/$tfile
20249
20250         # disable lockless i/o
20251         do_nodes $(comma_list $(osts_nodes)) \
20252                 "lctl set_param -n ldlm.namespaces.filter-*.max_nolock_bytes=0 \
20253                         ldlm.namespaces.filter-*.contended_locks=32 \
20254                         ldlm.namespaces.filter-*.contention_seconds=0"
20255         lctl set_param -n osc.*.contention_seconds=0
20256         clear_stats osc.*.osc_stats
20257
20258         dd if=/dev/zero of=$DIR/$tfile count=0
20259         $CHECKSTAT -s 0 $DIR/$tfile
20260
20261         restore_lustre_params <$p
20262         rm -f $p
20263         rm $DIR/$tfile
20264 }
20265 run_test 216 "check lockless direct write updates file size and kms correctly"
20266
20267 test_217() { # bug 22430
20268         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20269
20270         local node
20271
20272         for node in $(nodes_list); do
20273                 local nid=$(host_nids_address $node $NETTYPE)
20274                 local node_ip=$(do_node $node getent ahostsv4 $node |
20275                                 awk '{ print $1; exit; }')
20276
20277                 echo "node: '$node', nid: '$nid', node_ip='$node_ip'"
20278                 # if hostname matches any NID, use hostname for better testing
20279                 if [[ -z "$nid" || "$nid" =~ "$node_ip" ]]; then
20280                         echo "lctl ping node $node@$NETTYPE"
20281                         lctl ping $node@$NETTYPE
20282                 else # otherwise, at least test 'lctl ping' is working
20283                         echo "lctl ping nid $(h2nettype $nid)"
20284                         lctl ping $(h2nettype $nid)
20285                         echo "skipping $node (no hyphen detected)"
20286                 fi
20287         done
20288 }
20289 run_test 217 "check lctl ping for hostnames with embedded hyphen ('-')"
20290
20291 test_218() {
20292         # do directio so as not to populate the page cache
20293         log "creating a 10 Mb file"
20294         $MULTIOP $DIR/$tfile oO_CREAT:O_DIRECT:O_RDWR:w$((10*1048576))c ||
20295                 error "multiop failed while creating a file"
20296         log "starting reads"
20297         dd if=$DIR/$tfile of=/dev/null bs=4096 &
20298         log "truncating the file"
20299         $MULTIOP $DIR/$tfile oO_TRUNC:c ||
20300                 error "multiop failed while truncating the file"
20301         log "killing dd"
20302         kill %+ || true # reads might have finished
20303         echo "wait until dd is finished"
20304         wait
20305         log "removing the temporary file"
20306         rm -rf $DIR/$tfile || error "tmp file removal failed"
20307 }
20308 run_test 218 "parallel read and truncate should not deadlock"
20309
20310 test_219() {
20311         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20312
20313         # write one partial page
20314         dd if=/dev/zero of=$DIR/$tfile bs=1024 count=1
20315         # set no grant so vvp_io_commit_write will do sync write
20316         $LCTL set_param fail_loc=0x411
20317         # write a full page at the end of file
20318         dd if=/dev/zero of=$DIR/$tfile bs=4096 count=1 seek=1 conv=notrunc
20319
20320         $LCTL set_param fail_loc=0
20321         dd if=/dev/zero of=$DIR/$tfile bs=4096 count=1 seek=3
20322         $LCTL set_param fail_loc=0x411
20323         dd if=/dev/zero of=$DIR/$tfile bs=1024 count=1 seek=2 conv=notrunc
20324
20325         # LU-4201
20326         dd if=/dev/zero of=$DIR/$tfile-2 bs=1024 count=1
20327         $CHECKSTAT -s 1024 $DIR/$tfile-2 || error "checkstat wrong size"
20328 }
20329 run_test 219 "LU-394: Write partial won't cause uncontiguous pages vec at LND"
20330
20331 test_220() { #LU-325
20332         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20333         remote_ost_nodsh && skip "remote OST with nodsh"
20334         remote_mds_nodsh && skip "remote MDS with nodsh"
20335         remote_mgs_nodsh && skip "remote MGS with nodsh"
20336
20337         local OSTIDX=0
20338
20339         # create on MDT0000 so the last_id and next_id are correct
20340         mkdir_on_mdt0 $DIR/$tdir
20341         local OST=$($LFS df $DIR | awk '/OST:'$OSTIDX'/ { print $1 }')
20342         OST=${OST%_UUID}
20343
20344         # on the mdt's osc
20345         local mdtosc_proc1=$(get_mdtosc_proc_path $SINGLEMDS $OST)
20346         local last_id=$(do_facet $SINGLEMDS lctl get_param -n \
20347                         osp.$mdtosc_proc1.prealloc_last_id)
20348         local next_id=$(do_facet $SINGLEMDS lctl get_param -n \
20349                         osp.$mdtosc_proc1.prealloc_next_id)
20350
20351         $LFS df -i
20352
20353         do_facet ost$((OSTIDX + 1)) lctl set_param fail_val=-1
20354         #define OBD_FAIL_OST_ENOINO              0x229
20355         do_facet ost$((OSTIDX + 1)) lctl set_param fail_loc=0x229
20356         create_pool $FSNAME.$TESTNAME || return 1
20357         do_facet mgs $LCTL pool_add $FSNAME.$TESTNAME $OST || return 2
20358
20359         $LFS setstripe $DIR/$tdir -i $OSTIDX -c 1 -p $FSNAME.$TESTNAME
20360
20361         MDSOBJS=$((last_id - next_id))
20362         echo "preallocated objects on MDS is $MDSOBJS" "($last_id - $next_id)"
20363
20364         blocks=$($LFS df $MOUNT | awk '($1 == '$OSTIDX') { print $4 }')
20365         echo "OST still has $count kbytes free"
20366
20367         echo "create $MDSOBJS files @next_id..."
20368         createmany -o $DIR/$tdir/f $MDSOBJS || return 3
20369
20370         local last_id2=$(do_facet mds${MDSIDX} lctl get_param -n \
20371                         osp.$mdtosc_proc1.prealloc_last_id)
20372         local next_id2=$(do_facet mds${MDSIDX} lctl get_param -n \
20373                         osp.$mdtosc_proc1.prealloc_next_id)
20374
20375         echo "after creation, last_id=$last_id2, next_id=$next_id2"
20376         $LFS df -i
20377
20378         echo "cleanup..."
20379
20380         do_facet ost$((OSTIDX + 1)) lctl set_param fail_val=0
20381         do_facet ost$((OSTIDX + 1)) lctl set_param fail_loc=0
20382
20383         do_facet mgs $LCTL pool_remove $FSNAME.$TESTNAME $OST ||
20384                 error "$LCTL pool_remove $FSNAME.$TESTNAME $OST failed"
20385         do_facet mgs $LCTL pool_destroy $FSNAME.$TESTNAME ||
20386                 error "$LCTL pool_destroy $FSNAME.$TESTNAME failed"
20387         echo "unlink $MDSOBJS files @$next_id..."
20388         unlinkmany $DIR/$tdir/f $MDSOBJS || error "unlinkmany failed"
20389 }
20390 run_test 220 "preallocated MDS objects still used if ENOSPC from OST"
20391
20392 test_221() {
20393         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20394
20395         dd if=`which date` of=$MOUNT/date oflag=sync
20396         chmod +x $MOUNT/date
20397
20398         #define OBD_FAIL_LLITE_FAULT_TRUNC_RACE  0x1401
20399         $LCTL set_param fail_loc=0x80001401
20400
20401         $MOUNT/date > /dev/null
20402         rm -f $MOUNT/date
20403 }
20404 run_test 221 "make sure fault and truncate race to not cause OOM"
20405
20406 test_222a () {
20407         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20408
20409         rm -rf $DIR/$tdir
20410         test_mkdir $DIR/$tdir
20411         $LFS setstripe -c 1 -i 0 $DIR/$tdir
20412         createmany -o $DIR/$tdir/$tfile 10
20413         cancel_lru_locks mdc
20414         cancel_lru_locks osc
20415         #define OBD_FAIL_LDLM_AGL_DELAY           0x31a
20416         $LCTL set_param fail_loc=0x31a
20417         ls -l $DIR/$tdir > /dev/null || error "AGL for ls failed"
20418         $LCTL set_param fail_loc=0
20419         rm -r $DIR/$tdir
20420 }
20421 run_test 222a "AGL for ls should not trigger CLIO lock failure"
20422
20423 test_222b () {
20424         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20425
20426         rm -rf $DIR/$tdir
20427         test_mkdir $DIR/$tdir
20428         $LFS setstripe -c 1 -i 0 $DIR/$tdir
20429         createmany -o $DIR/$tdir/$tfile 10
20430         cancel_lru_locks mdc
20431         cancel_lru_locks osc
20432         #define OBD_FAIL_LDLM_AGL_DELAY           0x31a
20433         $LCTL set_param fail_loc=0x31a
20434         rm -r $DIR/$tdir || error "AGL for rmdir failed"
20435         $LCTL set_param fail_loc=0
20436 }
20437 run_test 222b "AGL for rmdir should not trigger CLIO lock failure"
20438
20439 test_223 () {
20440         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20441
20442         rm -rf $DIR/$tdir
20443         test_mkdir $DIR/$tdir
20444         $LFS setstripe -c 1 -i 0 $DIR/$tdir
20445         createmany -o $DIR/$tdir/$tfile 10
20446         cancel_lru_locks mdc
20447         cancel_lru_locks osc
20448         #define OBD_FAIL_LDLM_AGL_NOLOCK          0x31b
20449         $LCTL set_param fail_loc=0x31b
20450         ls -l $DIR/$tdir > /dev/null || error "reenqueue failed"
20451         $LCTL set_param fail_loc=0
20452         rm -r $DIR/$tdir
20453 }
20454 run_test 223 "osc reenqueue if without AGL lock granted ======================="
20455
20456 test_224a() { # LU-1039, MRP-303
20457         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20458         #define OBD_FAIL_PTLRPC_CLIENT_BULK_CB   0x508
20459         $LCTL set_param fail_loc=0x508
20460         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 conv=fsync
20461         $LCTL set_param fail_loc=0
20462         df $DIR
20463 }
20464 run_test 224a "Don't panic on bulk IO failure"
20465
20466 test_224bd_sub() { # LU-1039, MRP-303
20467         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20468         local timeout=$1
20469
20470         shift
20471         dd if=/dev/urandom of=$TMP/$tfile bs=1M count=1
20472
20473         $LFS setstripe -c 1 -i 0 $DIR/$tfile
20474
20475         dd if=$TMP/$tfile of=$DIR/$tfile bs=1M count=1
20476         cancel_lru_locks osc
20477         set_checksums 0
20478         stack_trap "set_checksums $ORIG_CSUM" EXIT
20479         local at_max_saved=0
20480
20481         # adaptive timeouts may prevent seeing the issue
20482         if at_is_enabled; then
20483                 at_max_saved=$(at_max_get mds)
20484                 at_max_set 0 mds client
20485                 stack_trap "at_max_set $at_max_saved mds client" EXIT
20486         fi
20487
20488         #define OBD_FAIL_PTLRPC_CLIENT_BULK_CB2   0x515
20489         do_facet ost1 $LCTL set_param fail_val=$timeout fail_loc=0x80000515
20490         dd of=$TMP/$tfile.new if=$DIR/$tfile bs=1M count=1 || "$@"
20491
20492         do_facet ost1 $LCTL set_param fail_loc=0
20493         cmp $TMP/$tfile $TMP/$tfile.new || error "file contents wrong"
20494         df $DIR
20495 }
20496
20497 test_224b() {
20498         test_224bd_sub 3 error "dd failed"
20499 }
20500 run_test 224b "Don't panic on bulk IO failure"
20501
20502 test_224c() { # LU-6441
20503         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20504         remote_mds_nodsh && skip "remote MDS with nodsh"
20505
20506         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
20507         save_writethrough $p
20508         set_cache writethrough on
20509
20510         local pages_per_rpc=$($LCTL get_param osc.*.max_pages_per_rpc)
20511         local at_max=$($LCTL get_param -n at_max)
20512         local timeout=$($LCTL get_param -n timeout)
20513         local test_at="at_max"
20514         local param_at="$FSNAME.sys.at_max"
20515         local test_timeout="timeout"
20516         local param_timeout="$FSNAME.sys.timeout"
20517
20518         $LCTL set_param -n osc.*.max_pages_per_rpc=1024
20519
20520         set_persistent_param_and_check client "$test_at" "$param_at" 0
20521         set_persistent_param_and_check client "$test_timeout" "$param_timeout" 5
20522
20523         #define OBD_FAIL_PTLRPC_CLIENT_BULK_CB3 0x520
20524         do_facet ost1 "$LCTL set_param fail_loc=0x520"
20525         $LFS setstripe -c 1 -i 0 $DIR/$tfile
20526         stack_trap "rm -f $DIR/$tfile"
20527         dd if=/dev/zero of=$DIR/$tfile bs=8MB count=1
20528         sync
20529         do_facet ost1 "$LCTL set_param fail_loc=0"
20530
20531         set_persistent_param_and_check client "$test_at" "$param_at" $at_max
20532         set_persistent_param_and_check client "$test_timeout" "$param_timeout" \
20533                 $timeout
20534
20535         $LCTL set_param -n $pages_per_rpc
20536         restore_lustre_params < $p
20537         rm -f $p
20538 }
20539 run_test 224c "Don't hang if one of md lost during large bulk RPC"
20540
20541 test_224d() { # LU-11169
20542         test_224bd_sub $((TIMEOUT + 2)) error "dd failed"
20543 }
20544 run_test 224d "Don't corrupt data on bulk IO timeout"
20545
20546 MDSSURVEY=${MDSSURVEY:-$(which mds-survey 2>/dev/null || true)}
20547 test_225a () {
20548         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20549         if [ -z ${MDSSURVEY} ]; then
20550                 skip_env "mds-survey not found"
20551         fi
20552         [ $MDS1_VERSION -ge $(version_code 2.2.51) ] ||
20553                 skip "Need MDS version at least 2.2.51"
20554
20555         local mds=$(facet_host $SINGLEMDS)
20556         local target=$(do_nodes $mds 'lctl dl' |
20557                        awk '{ if ($2 == "UP" && $3 == "mdt") { print $4 }}')
20558
20559         local cmd1="file_count=1000 thrhi=4"
20560         local cmd2="dir_count=2 layer=mdd stripe_count=0"
20561         local cmd3="rslt_loc=${TMP} targets=\"$mds:$target\" $MDSSURVEY"
20562         local cmd="$cmd1 $cmd2 $cmd3"
20563
20564         rm -f ${TMP}/mds_survey*
20565         echo + $cmd
20566         eval $cmd || error "mds-survey with zero-stripe failed"
20567         cat ${TMP}/mds_survey*
20568         rm -f ${TMP}/mds_survey*
20569 }
20570 run_test 225a "Metadata survey sanity with zero-stripe"
20571
20572 test_225b () {
20573         if [ -z ${MDSSURVEY} ]; then
20574                 skip_env "mds-survey not found"
20575         fi
20576         [ $MDS1_VERSION -ge $(version_code 2.2.51) ] ||
20577                 skip "Need MDS version at least 2.2.51"
20578         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20579         remote_mds_nodsh && skip "remote MDS with nodsh"
20580         if [ $($LCTL dl | grep -c osc) -eq 0 ]; then
20581                 skip_env "Need to mount OST to test"
20582         fi
20583
20584         local mds=$(facet_host $SINGLEMDS)
20585         local target=$(do_nodes $mds 'lctl dl' |
20586                        awk '{ if ($2 == "UP" && $3 == "mdt") { print $4 }}')
20587
20588         local cmd1="file_count=1000 thrhi=4"
20589         local cmd2="dir_count=2 layer=mdd stripe_count=1"
20590         local cmd3="rslt_loc=${TMP} targets=\"$mds:$target\" $MDSSURVEY"
20591         local cmd="$cmd1 $cmd2 $cmd3"
20592
20593         rm -f ${TMP}/mds_survey*
20594         echo + $cmd
20595         eval $cmd || error "mds-survey with stripe_count failed"
20596         cat ${TMP}/mds_survey*
20597         rm -f ${TMP}/mds_survey*
20598 }
20599 run_test 225b "Metadata survey sanity with stripe_count = 1"
20600
20601 mcreate_path2fid () {
20602         local mode=$1
20603         local major=$2
20604         local minor=$3
20605         local name=$4
20606         local desc=$5
20607         local path=$DIR/$tdir/$name
20608         local fid
20609         local rc
20610         local fid_path
20611
20612         $MCREATE --mode=$1 --major=$2 --minor=$3 $path ||
20613                 error "cannot create $desc"
20614
20615         fid=$($LFS path2fid $path | tr -d '[' | tr -d ']')
20616         rc=$?
20617         [ $rc -ne 0 ] && error "cannot get fid of a $desc"
20618
20619         fid_path=$($LFS fid2path $MOUNT $fid)
20620         rc=$?
20621         [ $rc -ne 0 ] && error "cannot get path of $desc by $DIR $path $fid"
20622
20623         [ "$path" == "$fid_path" ] ||
20624                 error "fid2path returned $fid_path, expected $path"
20625
20626         echo "pass with $path and $fid"
20627 }
20628
20629 test_226a () {
20630         rm -rf $DIR/$tdir
20631         mkdir -p $DIR/$tdir
20632
20633         mcreate_path2fid 0010666 0 0 fifo "FIFO"
20634         mcreate_path2fid 0020666 1 3 null "character special file (null)"
20635         mcreate_path2fid 0020666 1 255 none "character special file (no device)"
20636         mcreate_path2fid 0040666 0 0 dir "directory"
20637         mcreate_path2fid 0060666 7 0 loop0 "block special file (loop)"
20638         mcreate_path2fid 0100666 0 0 file "regular file"
20639         mcreate_path2fid 0120666 0 0 link "symbolic link"
20640         mcreate_path2fid 0140666 0 0 sock "socket"
20641 }
20642 run_test 226a "call path2fid and fid2path on files of all type"
20643
20644 test_226b () {
20645         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
20646
20647         local MDTIDX=1
20648
20649         rm -rf $DIR/$tdir
20650         mkdir -p $DIR/$tdir
20651         $LFS setdirstripe -i $MDTIDX $DIR/$tdir/remote_dir ||
20652                 error "create remote directory failed"
20653         mcreate_path2fid 0010666 0 0 "remote_dir/fifo" "FIFO"
20654         mcreate_path2fid 0020666 1 3 "remote_dir/null" \
20655                                 "character special file (null)"
20656         mcreate_path2fid 0020666 1 255 "remote_dir/none" \
20657                                 "character special file (no device)"
20658         mcreate_path2fid 0040666 0 0 "remote_dir/dir" "directory"
20659         mcreate_path2fid 0060666 7 0 "remote_dir/loop0" \
20660                                 "block special file (loop)"
20661         mcreate_path2fid 0100666 0 0 "remote_dir/file" "regular file"
20662         mcreate_path2fid 0120666 0 0 "remote_dir/link" "symbolic link"
20663         mcreate_path2fid 0140666 0 0 "remote_dir/sock" "socket"
20664 }
20665 run_test 226b "call path2fid and fid2path on files of all type under remote dir"
20666
20667 test_226c () {
20668         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
20669         [[ $MDS1_VERSION -ge $(version_code 2.13.55) ]] ||
20670                 skip "Need MDS version at least 2.13.55"
20671
20672         local submnt=/mnt/submnt
20673         local srcfile=/etc/passwd
20674         local dstfile=$submnt/passwd
20675         local path
20676         local fid
20677
20678         rm -rf $DIR/$tdir
20679         rm -rf $submnt
20680         $LFS setdirstripe -c -1 -i 1 $DIR/$tdir ||
20681                 error "create remote directory failed"
20682         mkdir -p $submnt || error "create $submnt failed"
20683         $MOUNT_CMD $MGSNID:/$FSNAME/$tdir $submnt ||
20684                 error "mount $submnt failed"
20685         stack_trap "umount $submnt" EXIT
20686
20687         cp $srcfile $dstfile
20688         fid=$($LFS path2fid $dstfile)
20689         path=$($LFS fid2path $submnt "$fid")
20690         [ "$path" = "$dstfile" ] ||
20691                 error "fid2path $submnt $fid failed ($path != $dstfile)"
20692 }
20693 run_test 226c "call path2fid and fid2path under remote dir with subdir mount"
20694
20695 # LU-1299 Executing or running ldd on a truncated executable does not
20696 # cause an out-of-memory condition.
20697 test_227() {
20698         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20699         [ -z "$(which ldd)" ] && skip_env "should have ldd tool"
20700
20701         dd if=$(which date) of=$MOUNT/date bs=1k count=1
20702         chmod +x $MOUNT/date
20703
20704         $MOUNT/date > /dev/null
20705         ldd $MOUNT/date > /dev/null
20706         rm -f $MOUNT/date
20707 }
20708 run_test 227 "running truncated executable does not cause OOM"
20709
20710 # LU-1512 try to reuse idle OI blocks
20711 test_228a() {
20712         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20713         remote_mds_nodsh && skip "remote MDS with nodsh"
20714         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
20715
20716         local MDT_DEV=$(mdsdevname ${SINGLEMDS//mds/})
20717         local myDIR=$DIR/$tdir
20718
20719         mkdir -p $myDIR
20720         #define OBD_FAIL_SEQ_EXHAUST             0x1002
20721         $LCTL set_param fail_loc=0x80001002
20722         createmany -o $myDIR/t- 10000
20723         $LCTL set_param fail_loc=0
20724         # The guard is current the largest FID holder
20725         touch $myDIR/guard
20726         local SEQ=$($LFS path2fid $myDIR/guard | awk -F ':' '{print $1}' |
20727                     tr -d '[')
20728         local IDX=$(($SEQ % 64))
20729
20730         do_facet $SINGLEMDS sync
20731         # Make sure journal flushed.
20732         sleep 6
20733         local blk1=$(do_facet $SINGLEMDS \
20734                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
20735                      grep Blockcount | awk '{print $4}')
20736
20737         # Remove old files, some OI blocks will become idle.
20738         unlinkmany $myDIR/t- 10000
20739         # Create new files, idle OI blocks should be reused.
20740         createmany -o $myDIR/t- 2000
20741         do_facet $SINGLEMDS sync
20742         # Make sure journal flushed.
20743         sleep 6
20744         local blk2=$(do_facet $SINGLEMDS \
20745                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
20746                      grep Blockcount | awk '{print $4}')
20747
20748         [ $blk1 == $blk2 ] || error "old blk1=$blk1, new blk2=$blk2, unmatched!"
20749 }
20750 run_test 228a "try to reuse idle OI blocks"
20751
20752 test_228b() {
20753         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20754         remote_mds_nodsh && skip "remote MDS with nodsh"
20755         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
20756
20757         local MDT_DEV=$(mdsdevname ${SINGLEMDS//mds/})
20758         local myDIR=$DIR/$tdir
20759
20760         mkdir -p $myDIR
20761         #define OBD_FAIL_SEQ_EXHAUST             0x1002
20762         $LCTL set_param fail_loc=0x80001002
20763         createmany -o $myDIR/t- 10000
20764         $LCTL set_param fail_loc=0
20765         # The guard is current the largest FID holder
20766         touch $myDIR/guard
20767         local SEQ=$($LFS path2fid $myDIR/guard | awk -F ':' '{print $1}' |
20768                     tr -d '[')
20769         local IDX=$(($SEQ % 64))
20770
20771         do_facet $SINGLEMDS sync
20772         # Make sure journal flushed.
20773         sleep 6
20774         local blk1=$(do_facet $SINGLEMDS \
20775                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
20776                      grep Blockcount | awk '{print $4}')
20777
20778         # Remove old files, some OI blocks will become idle.
20779         unlinkmany $myDIR/t- 10000
20780
20781         # stop the MDT
20782         stop $SINGLEMDS || error "Fail to stop MDT."
20783         # remount the MDT
20784         start $SINGLEMDS $(facet_device $SINGLEMDS) $MDS_MOUNT_OPTS ||
20785                 error "Fail to start MDT."
20786
20787         client_up || error "Fail to df."
20788         # Create new files, idle OI blocks should be reused.
20789         createmany -o $myDIR/t- 2000
20790         do_facet $SINGLEMDS sync
20791         # Make sure journal flushed.
20792         sleep 6
20793         local blk2=$(do_facet $SINGLEMDS \
20794                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
20795                      grep Blockcount | awk '{print $4}')
20796
20797         [ $blk1 == $blk2 ] || error "old blk1=$blk1, new blk2=$blk2, unmatched!"
20798 }
20799 run_test 228b "idle OI blocks can be reused after MDT restart"
20800
20801 #LU-1881
20802 test_228c() {
20803         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20804         remote_mds_nodsh && skip "remote MDS with nodsh"
20805         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
20806
20807         local MDT_DEV=$(mdsdevname ${SINGLEMDS//mds/})
20808         local myDIR=$DIR/$tdir
20809
20810         mkdir -p $myDIR
20811         #define OBD_FAIL_SEQ_EXHAUST             0x1002
20812         $LCTL set_param fail_loc=0x80001002
20813         # 20000 files can guarantee there are index nodes in the OI file
20814         createmany -o $myDIR/t- 20000
20815         $LCTL set_param fail_loc=0
20816         # The guard is current the largest FID holder
20817         touch $myDIR/guard
20818         local SEQ=$($LFS path2fid $myDIR/guard | awk -F ':' '{print $1}' |
20819                     tr -d '[')
20820         local IDX=$(($SEQ % 64))
20821
20822         do_facet $SINGLEMDS sync
20823         # Make sure journal flushed.
20824         sleep 6
20825         local blk1=$(do_facet $SINGLEMDS \
20826                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
20827                      grep Blockcount | awk '{print $4}')
20828
20829         # Remove old files, some OI blocks will become idle.
20830         unlinkmany $myDIR/t- 20000
20831         rm -f $myDIR/guard
20832         # The OI file should become empty now
20833
20834         # Create new files, idle OI blocks should be reused.
20835         createmany -o $myDIR/t- 2000
20836         do_facet $SINGLEMDS sync
20837         # Make sure journal flushed.
20838         sleep 6
20839         local blk2=$(do_facet $SINGLEMDS \
20840                      "$DEBUGFS -c -R \\\"stat oi.16.${IDX}\\\" $MDT_DEV" |
20841                      grep Blockcount | awk '{print $4}')
20842
20843         [ $blk1 == $blk2 ] || error "old blk1=$blk1, new blk2=$blk2, unmatched!"
20844 }
20845 run_test 228c "NOT shrink the last entry in OI index node to recycle idle leaf"
20846
20847 test_229() { # LU-2482, LU-3448
20848         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20849         [ $OSTCOUNT -lt 2 ] && skip_env "needs >= 2 OSTs"
20850         [ $MDS1_VERSION -lt $(version_code 2.4.53) ] &&
20851                 skip "No HSM $(lustre_build_version $SINGLEMDS) MDS < 2.4.53"
20852
20853         rm -f $DIR/$tfile
20854
20855         # Create a file with a released layout and stripe count 2.
20856         $MULTIOP $DIR/$tfile H2c ||
20857                 error "failed to create file with released layout"
20858
20859         $LFS getstripe -v $DIR/$tfile
20860
20861         local pattern=$($LFS getstripe -L $DIR/$tfile)
20862         [ X"$pattern" = X"released" ] || error "pattern error ($pattern)"
20863
20864         local stripe_count=$($LFS getstripe -c $DIR/$tfile) ||
20865                 error "getstripe"
20866         [ $stripe_count -eq 2 ] || error "stripe count not 2 ($stripe_count)"
20867         stat $DIR/$tfile || error "failed to stat released file"
20868
20869         chown $RUNAS_ID $DIR/$tfile ||
20870                 error "chown $RUNAS_ID $DIR/$tfile failed"
20871
20872         chgrp $RUNAS_ID $DIR/$tfile ||
20873                 error "chgrp $RUNAS_ID $DIR/$tfile failed"
20874
20875         touch $DIR/$tfile || error "touch $DIR/$tfile failed"
20876         rm $DIR/$tfile || error "failed to remove released file"
20877 }
20878 run_test 229 "getstripe/stat/rm/attr changes work on released files"
20879
20880 test_230a() {
20881         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20882         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
20883         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
20884                 skip "Need MDS version at least 2.11.52"
20885
20886         local MDTIDX=1
20887
20888         test_mkdir $DIR/$tdir
20889         test_mkdir -i0 -c1 $DIR/$tdir/test_230_local
20890         local mdt_idx=$($LFS getstripe -m $DIR/$tdir/test_230_local)
20891         [ $mdt_idx -ne 0 ] &&
20892                 error "create local directory on wrong MDT $mdt_idx"
20893
20894         $LFS mkdir -i $MDTIDX $DIR/$tdir/test_230 ||
20895                         error "create remote directory failed"
20896         local mdt_idx=$($LFS getstripe -m $DIR/$tdir/test_230)
20897         [ $mdt_idx -ne $MDTIDX ] &&
20898                 error "create remote directory on wrong MDT $mdt_idx"
20899
20900         createmany -o $DIR/$tdir/test_230/t- 10 ||
20901                 error "create files on remote directory failed"
20902         mdt_idx=$($LFS getstripe -m $DIR/$tdir/test_230/t-0)
20903         [ $mdt_idx -ne $MDTIDX ] && error "create files on wrong MDT $mdt_idx"
20904         rm -r $DIR/$tdir || error "unlink remote directory failed"
20905 }
20906 run_test 230a "Create remote directory and files under the remote directory"
20907
20908 test_230b() {
20909         [ $PARALLEL == "yes" ] && skip "skip parallel run"
20910         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
20911         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
20912                 skip "Need MDS version at least 2.11.52"
20913
20914         local MDTIDX=1
20915         local mdt_index
20916         local i
20917         local file
20918         local pid
20919         local stripe_count
20920         local migrate_dir=$DIR/$tdir/migrate_dir
20921         local other_dir=$DIR/$tdir/other_dir
20922
20923         test_mkdir $DIR/$tdir
20924         test_mkdir -i0 -c1 $migrate_dir
20925         test_mkdir -i0 -c1 $other_dir
20926         for ((i=0; i<10; i++)); do
20927                 mkdir -p $migrate_dir/dir_${i}
20928                 createmany -o $migrate_dir/dir_${i}/f 10 ||
20929                         error "create files under remote dir failed $i"
20930         done
20931
20932         cp /etc/passwd $migrate_dir/$tfile
20933         cp /etc/passwd $other_dir/$tfile
20934         chattr +SAD $migrate_dir
20935         chattr +SAD $migrate_dir/$tfile
20936
20937         local old_dir_flag=$(lsattr -a $migrate_dir | awk '/\/\.$/ {print $1}')
20938         local old_file_flag=$(lsattr $migrate_dir/$tfile | awk '{print $1}')
20939         local old_dir_mode=$(stat -c%f $migrate_dir)
20940         local old_file_mode=$(stat -c%f $migrate_dir/$tfile)
20941
20942         mkdir -p $migrate_dir/dir_default_stripe2
20943         $LFS setstripe -c 2 $migrate_dir/dir_default_stripe2
20944         $LFS setstripe -c 2 $migrate_dir/${tfile}_stripe2
20945
20946         mkdir -p $other_dir
20947         ln $migrate_dir/$tfile $other_dir/luna
20948         ln $migrate_dir/$tfile $migrate_dir/sofia
20949         ln $other_dir/$tfile $migrate_dir/david
20950         ln -s $migrate_dir/$tfile $other_dir/zachary
20951         ln -s $migrate_dir/$tfile $migrate_dir/${tfile}_ln
20952         ln -s $other_dir/$tfile $migrate_dir/${tfile}_ln_other
20953
20954         local len
20955         local lnktgt
20956
20957         # inline symlink
20958         for len in 58 59 60; do
20959                 lnktgt=$(str_repeat 'l' $len)
20960                 touch $migrate_dir/$lnktgt
20961                 ln -s $lnktgt $migrate_dir/${len}char_ln
20962         done
20963
20964         # PATH_MAX
20965         for len in 4094 4095; do
20966                 lnktgt=$(str_repeat 'l' $len)
20967                 ln -s $lnktgt $migrate_dir/${len}char_ln
20968         done
20969
20970         # NAME_MAX
20971         for len in 254 255; do
20972                 touch $migrate_dir/$(str_repeat 'l' $len)
20973         done
20974
20975         $LFS migrate -m $MDTIDX $migrate_dir ||
20976                 error "fails on migrating remote dir to MDT1"
20977
20978         echo "migratate to MDT1, then checking.."
20979         for ((i = 0; i < 10; i++)); do
20980                 for file in $(find $migrate_dir/dir_${i}); do
20981                         mdt_index=$($LFS getstripe -m $file)
20982                         # broken symlink getstripe will fail
20983                         [ $mdt_index -ne $MDTIDX ] && stat -L $file &&
20984                                 error "$file is not on MDT${MDTIDX}"
20985                 done
20986         done
20987
20988         # the multiple link file should still in MDT0
20989         mdt_index=$($LFS getstripe -m $migrate_dir/$tfile)
20990         [ $mdt_index == 0 ] ||
20991                 error "$file is not on MDT${MDTIDX}"
20992
20993         local new_dir_flag=$(lsattr -a $migrate_dir | awk '/\/\.$/ {print $1}')
20994         [ "$old_dir_flag" = "$new_dir_flag" ] ||
20995                 error " expect $old_dir_flag get $new_dir_flag"
20996
20997         local new_file_flag=$(lsattr $migrate_dir/$tfile | awk '{print $1}')
20998         [ "$old_file_flag" = "$new_file_flag" ] ||
20999                 error " expect $old_file_flag get $new_file_flag"
21000
21001         local new_dir_mode=$(stat -c%f $migrate_dir)
21002         [ "$old_dir_mode" = "$new_dir_mode" ] ||
21003                 error "expect mode $old_dir_mode get $new_dir_mode"
21004
21005         local new_file_mode=$(stat -c%f $migrate_dir/$tfile)
21006         [ "$old_file_mode" = "$new_file_mode" ] ||
21007                 error "expect mode $old_file_mode get $new_file_mode"
21008
21009         diff /etc/passwd $migrate_dir/$tfile ||
21010                 error "$tfile different after migration"
21011
21012         diff /etc/passwd $other_dir/luna ||
21013                 error "luna different after migration"
21014
21015         diff /etc/passwd $migrate_dir/sofia ||
21016                 error "sofia different after migration"
21017
21018         diff /etc/passwd $migrate_dir/david ||
21019                 error "david different after migration"
21020
21021         diff /etc/passwd $other_dir/zachary ||
21022                 error "zachary different after migration"
21023
21024         diff /etc/passwd $migrate_dir/${tfile}_ln ||
21025                 error "${tfile}_ln different after migration"
21026
21027         diff /etc/passwd $migrate_dir/${tfile}_ln_other ||
21028                 error "${tfile}_ln_other different after migration"
21029
21030         stripe_count=$($LFS getstripe -c $migrate_dir/dir_default_stripe2)
21031         [ $stripe_count = 2 ] ||
21032                 error "dir strpe_count $d != 2 after migration."
21033
21034         stripe_count=$($LFS getstripe -c $migrate_dir/${tfile}_stripe2)
21035         [ $stripe_count = 2 ] ||
21036                 error "file strpe_count $d != 2 after migration."
21037
21038         #migrate back to MDT0
21039         MDTIDX=0
21040
21041         $LFS migrate -m $MDTIDX $migrate_dir ||
21042                 error "fails on migrating remote dir to MDT0"
21043
21044         echo "migrate back to MDT0, checking.."
21045         for file in $(find $migrate_dir); do
21046                 mdt_index=$($LFS getstripe -m $file)
21047                 [ $mdt_index -ne $MDTIDX ] && stat -L $file &&
21048                         error "$file is not on MDT${MDTIDX}"
21049         done
21050
21051         local new_dir_flag=$(lsattr -a $migrate_dir | awk '/\/\.$/ {print $1}')
21052         [ "$old_dir_flag" = "$new_dir_flag" ] ||
21053                 error " expect $old_dir_flag get $new_dir_flag"
21054
21055         local new_file_flag=$(lsattr $migrate_dir/$tfile | awk '{print $1}')
21056         [ "$old_file_flag" = "$new_file_flag" ] ||
21057                 error " expect $old_file_flag get $new_file_flag"
21058
21059         local new_dir_mode=$(stat -c%f $migrate_dir)
21060         [ "$old_dir_mode" = "$new_dir_mode" ] ||
21061                 error "expect mode $old_dir_mode get $new_dir_mode"
21062
21063         local new_file_mode=$(stat -c%f $migrate_dir/$tfile)
21064         [ "$old_file_mode" = "$new_file_mode" ] ||
21065                 error "expect mode $old_file_mode get $new_file_mode"
21066
21067         diff /etc/passwd ${migrate_dir}/$tfile ||
21068                 error "$tfile different after migration"
21069
21070         diff /etc/passwd ${other_dir}/luna ||
21071                 error "luna different after migration"
21072
21073         diff /etc/passwd ${migrate_dir}/sofia ||
21074                 error "sofia different after migration"
21075
21076         diff /etc/passwd ${other_dir}/zachary ||
21077                 error "zachary different after migration"
21078
21079         diff /etc/passwd $migrate_dir/${tfile}_ln ||
21080                 error "${tfile}_ln different after migration"
21081
21082         diff /etc/passwd $migrate_dir/${tfile}_ln_other ||
21083                 error "${tfile}_ln_other different after migration"
21084
21085         stripe_count=$($LFS getstripe -c ${migrate_dir}/dir_default_stripe2)
21086         [ $stripe_count = 2 ] ||
21087                 error "dir strpe_count $d != 2 after migration."
21088
21089         stripe_count=$($LFS getstripe -c ${migrate_dir}/${tfile}_stripe2)
21090         [ $stripe_count = 2 ] ||
21091                 error "file strpe_count $d != 2 after migration."
21092
21093         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21094 }
21095 run_test 230b "migrate directory"
21096
21097 test_230c() {
21098         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21099         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21100         remote_mds_nodsh && skip "remote MDS with nodsh"
21101         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21102                 skip "Need MDS version at least 2.11.52"
21103
21104         local MDTIDX=1
21105         local total=3
21106         local mdt_index
21107         local file
21108         local migrate_dir=$DIR/$tdir/migrate_dir
21109
21110         #If migrating directory fails in the middle, all entries of
21111         #the directory is still accessiable.
21112         test_mkdir $DIR/$tdir
21113         test_mkdir -i0 -c1 $migrate_dir
21114         test_mkdir -i1 -c1 $DIR/$tdir/remote_dir
21115         stat $migrate_dir
21116         createmany -o $migrate_dir/f $total ||
21117                 error "create files under ${migrate_dir} failed"
21118
21119         # fail after migrating top dir, and this will fail only once, so the
21120         # first sub file migration will fail (currently f3), others succeed.
21121         #OBD_FAIL_MIGRATE_ENTRIES       0x1801
21122         do_facet mds1 lctl set_param fail_loc=0x1801
21123         local t=$(ls $migrate_dir | wc -l)
21124         $LFS migrate --mdt-index $MDTIDX $migrate_dir &&
21125                 error "migrate should fail"
21126         local u=$(ls $migrate_dir | wc -l)
21127         [ "$u" == "$t" ] || error "$u != $t during migration"
21128
21129         # add new dir/file should succeed
21130         mkdir $migrate_dir/dir ||
21131                 error "mkdir failed under migrating directory"
21132         touch $migrate_dir/file ||
21133                 error "create file failed under migrating directory"
21134
21135         # add file with existing name should fail
21136         for file in $migrate_dir/f*; do
21137                 stat $file > /dev/null || error "stat $file failed"
21138                 $OPENFILE -f O_CREAT:O_EXCL $file &&
21139                         error "open(O_CREAT|O_EXCL) $file should fail"
21140                 $MULTIOP $file m && error "create $file should fail"
21141                 touch $DIR/$tdir/remote_dir/$tfile ||
21142                         error "touch $tfile failed"
21143                 ln $DIR/$tdir/remote_dir/$tfile $file &&
21144                         error "link $file should fail"
21145                 mdt_index=$($LFS getstripe -m $file)
21146                 if [ $mdt_index == 0 ]; then
21147                         # file failed to migrate is not allowed to rename to
21148                         mv $DIR/$tdir/remote_dir/$tfile $file &&
21149                                 error "rename to $file should fail"
21150                 else
21151                         mv $DIR/$tdir/remote_dir/$tfile $file ||
21152                                 error "rename to $file failed"
21153                 fi
21154                 echo hello >> $file || error "write $file failed"
21155         done
21156
21157         # resume migration with different options should fail
21158         $LFS migrate -m 0 $migrate_dir &&
21159                 error "migrate -m 0 $migrate_dir should fail"
21160
21161         $LFS migrate -m $MDTIDX -c 2 $migrate_dir &&
21162                 error "migrate -c 2 $migrate_dir should fail"
21163
21164         # resume migration should succeed
21165         $LFS migrate -m $MDTIDX $migrate_dir ||
21166                 error "migrate $migrate_dir failed"
21167
21168         echo "Finish migration, then checking.."
21169         for file in $(find $migrate_dir); do
21170                 mdt_index=$($LFS getstripe -m $file)
21171                 [ $mdt_index == $MDTIDX ] ||
21172                         error "$file is not on MDT${MDTIDX}"
21173         done
21174
21175         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21176 }
21177 run_test 230c "check directory accessiblity if migration failed"
21178
21179 test_230d() {
21180         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21181         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21182         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21183                 skip "Need MDS version at least 2.11.52"
21184         # LU-11235
21185         [ "$mds1_FSTYPE" == "zfs" ] && skip "skip ZFS backend"
21186
21187         local migrate_dir=$DIR/$tdir/migrate_dir
21188         local old_index
21189         local new_index
21190         local old_count
21191         local new_count
21192         local new_hash
21193         local mdt_index
21194         local i
21195         local j
21196
21197         old_index=$((RANDOM % MDSCOUNT))
21198         old_count=$((MDSCOUNT - old_index))
21199         new_index=$((RANDOM % MDSCOUNT))
21200         new_count=$((MDSCOUNT - new_index))
21201         new_hash=1 # for all_char
21202
21203         [ $old_count -gt 1 ] && old_count=$((old_count - RANDOM % old_count))
21204         [ $new_count -gt 1 ] && new_count=$((new_count - RANDOM % new_count))
21205
21206         test_mkdir $DIR/$tdir
21207         test_mkdir -i $old_index -c $old_count $migrate_dir
21208
21209         for ((i=0; i<100; i++)); do
21210                 test_mkdir -i0 -c1 $migrate_dir/dir_${i}
21211                 createmany -o $migrate_dir/dir_${i}/f 100 ||
21212                         error "create files under remote dir failed $i"
21213         done
21214
21215         echo -n "Migrate from MDT$old_index "
21216         [ $old_count -gt 1 ] && echo -n "... MDT$((old_index + old_count - 1)) "
21217         echo -n "to MDT$new_index"
21218         [ $new_count -gt 1 ] && echo -n " ... MDT$((new_index + new_count - 1))"
21219         echo
21220
21221         echo "$LFS migrate -m$new_index -c$new_count -H $new_hash $migrate_dir"
21222         $LFS migrate -m $new_index -c $new_count -H $new_hash $migrate_dir ||
21223                 error "migrate remote dir error"
21224
21225         echo "Finish migration, then checking.."
21226         for file in $(find $migrate_dir -maxdepth 1); do
21227                 mdt_index=$($LFS getstripe -m $file)
21228                 if [ $mdt_index -lt $new_index ] ||
21229                    [ $mdt_index -gt $((new_index + new_count - 1)) ]; then
21230                         error "$file is on MDT$mdt_index"
21231                 fi
21232         done
21233
21234         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21235 }
21236 run_test 230d "check migrate big directory"
21237
21238 test_230e() {
21239         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21240         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21241         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21242                 skip "Need MDS version at least 2.11.52"
21243
21244         local i
21245         local j
21246         local a_fid
21247         local b_fid
21248
21249         mkdir_on_mdt0 $DIR/$tdir
21250         mkdir $DIR/$tdir/migrate_dir
21251         mkdir $DIR/$tdir/other_dir
21252         touch $DIR/$tdir/migrate_dir/a
21253         ln $DIR/$tdir/migrate_dir/a $DIR/$tdir/other_dir/b
21254         ls $DIR/$tdir/other_dir
21255
21256         $LFS migrate -m 1 $DIR/$tdir/migrate_dir ||
21257                 error "migrate dir fails"
21258
21259         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir)
21260         [ $mdt_index == 1 ] || error "migrate_dir is not on MDT1"
21261
21262         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir/a)
21263         [ $mdt_index == 0 ] || error "a is not on MDT0"
21264
21265         $LFS migrate -m 1 $DIR/$tdir/other_dir ||
21266                 error "migrate dir fails"
21267
21268         mdt_index=$($LFS getstripe -m $DIR/$tdir/other_dir)
21269         [ $mdt_index == 1 ] || error "other_dir is not on MDT1"
21270
21271         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir/a)
21272         [ $mdt_index == 1 ] || error "a is not on MDT1"
21273
21274         mdt_index=$($LFS getstripe -m $DIR/$tdir/other_dir/b)
21275         [ $mdt_index == 1 ] || error "b is not on MDT1"
21276
21277         a_fid=$($LFS path2fid $DIR/$tdir/migrate_dir/a)
21278         b_fid=$($LFS path2fid $DIR/$tdir/other_dir/b)
21279
21280         [ "$a_fid" = "$b_fid" ] || error "different fid after migration"
21281
21282         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21283 }
21284 run_test 230e "migrate mulitple local link files"
21285
21286 test_230f() {
21287         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21288         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21289         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21290                 skip "Need MDS version at least 2.11.52"
21291
21292         local a_fid
21293         local ln_fid
21294
21295         mkdir -p $DIR/$tdir
21296         mkdir $DIR/$tdir/migrate_dir
21297         $LFS mkdir -i1 $DIR/$tdir/other_dir
21298         touch $DIR/$tdir/migrate_dir/a
21299         ln $DIR/$tdir/migrate_dir/a $DIR/$tdir/other_dir/ln1
21300         ln $DIR/$tdir/migrate_dir/a $DIR/$tdir/other_dir/ln2
21301         ls $DIR/$tdir/other_dir
21302
21303         # a should be migrated to MDT1, since no other links on MDT0
21304         $LFS migrate -m 1 $DIR/$tdir/migrate_dir ||
21305                 error "#1 migrate dir fails"
21306         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir)
21307         [ $mdt_index == 1 ] || error "migrate_dir is not on MDT1"
21308         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir/a)
21309         [ $mdt_index == 1 ] || error "a is not on MDT1"
21310
21311         # a should stay on MDT1, because it is a mulitple link file
21312         $LFS migrate -m 0 $DIR/$tdir/migrate_dir ||
21313                 error "#2 migrate dir fails"
21314         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir/a)
21315         [ $mdt_index == 1 ] || error "a is not on MDT1"
21316
21317         $LFS migrate -m 1 $DIR/$tdir/migrate_dir ||
21318                 error "#3 migrate dir fails"
21319
21320         a_fid=$($LFS path2fid $DIR/$tdir/migrate_dir/a)
21321         ln_fid=$($LFS path2fid $DIR/$tdir/other_dir/ln1)
21322         [ "$a_fid" = "$ln_fid" ] || error "different fid after migrate to MDT1"
21323
21324         rm -rf $DIR/$tdir/other_dir/ln1 || error "unlink ln1 fails"
21325         rm -rf $DIR/$tdir/other_dir/ln2 || error "unlink ln2 fails"
21326
21327         # a should be migrated to MDT0, since no other links on MDT1
21328         $LFS migrate -m 0 $DIR/$tdir/migrate_dir ||
21329                 error "#4 migrate dir fails"
21330         mdt_index=$($LFS getstripe -m $DIR/$tdir/migrate_dir/a)
21331         [ $mdt_index == 0 ] || error "a is not on MDT0"
21332
21333         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21334 }
21335 run_test 230f "migrate mulitple remote link files"
21336
21337 test_230g() {
21338         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21339         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21340         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21341                 skip "Need MDS version at least 2.11.52"
21342
21343         mkdir -p $DIR/$tdir/migrate_dir
21344
21345         $LFS migrate -m 1000 $DIR/$tdir/migrate_dir &&
21346                 error "migrating dir to non-exist MDT succeeds"
21347         true
21348 }
21349 run_test 230g "migrate dir to non-exist MDT"
21350
21351 test_230h() {
21352         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21353         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21354         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21355                 skip "Need MDS version at least 2.11.52"
21356
21357         local mdt_index
21358
21359         mkdir -p $DIR/$tdir/migrate_dir
21360
21361         $LFS migrate -m1 $DIR &&
21362                 error "migrating mountpoint1 should fail"
21363
21364         $LFS migrate -m1 $DIR/$tdir/.. &&
21365                 error "migrating mountpoint2 should fail"
21366
21367         # same as mv
21368         $LFS migrate -m1 $DIR/$tdir/migrate_dir/.. &&
21369                 error "migrating $tdir/migrate_dir/.. should fail"
21370
21371         true
21372 }
21373 run_test 230h "migrate .. and root"
21374
21375 test_230i() {
21376         [ $PARALLEL == "yes" ] && skip "skip parallel run"
21377         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
21378         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
21379                 skip "Need MDS version at least 2.11.52"
21380
21381         mkdir -p $DIR/$tdir/migrate_dir
21382
21383         $LFS migrate -m 1 $DIR/$tdir/migrate_dir/ ||
21384                 error "migration fails with a tailing slash"
21385
21386         $LFS migrate -m 0 $DIR/$tdir/migrate_dir// ||
21387                 error "migration fails with two tailing slashes"
21388 }
21389 run_test 230i "lfs migrate -m tolerates trailing slashes"
21390
21391 test_230j() {
21392         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
21393         [ $MDS1_VERSION -lt $(version_code 2.13.52) ] &&
21394                 skip "Need MDS version at least 2.11.52"
21395
21396         $LFS mkdir -i 0 -c 1 $DIR/$tdir || error "mkdir $tdir failed"
21397         $LFS setstripe -E 1M -L mdt $DIR/$tdir/$tfile ||
21398                 error "create $tfile failed"
21399         cat /etc/passwd > $DIR/$tdir/$tfile
21400
21401         $LFS migrate -m 1 $DIR/$tdir || error "migrate failed"
21402
21403         cmp /etc/passwd $DIR/$tdir/$tfile ||
21404                 error "DoM file mismatch after migration"
21405 }
21406 run_test 230j "DoM file data not changed after dir migration"
21407
21408 test_230k() {
21409         [ $MDSCOUNT -lt 4 ] && skip "needs >= 4 MDTs"
21410         [ $MDS1_VERSION -lt $(version_code 2.11.56) ] &&
21411                 skip "Need MDS version at least 2.11.56"
21412
21413         local total=20
21414         local files_on_starting_mdt=0
21415
21416         $LFS mkdir -i -1 -c 2 $DIR/$tdir || error "mkdir failed"
21417         $LFS getdirstripe $DIR/$tdir
21418         for i in $(seq $total); do
21419                 echo $((i*i - i)) > $DIR/$tdir/$tfile.$i || error "write failed"
21420                 [[ $($LFS getstripe -m $DIR/$tdir/$tfile.$i) -eq 0 ]] &&
21421                         files_on_starting_mdt=$((files_on_starting_mdt + 1))
21422         done
21423
21424         echo "$files_on_starting_mdt files on MDT0"
21425
21426         $LFS migrate -m 1,3 $DIR/$tdir || error "migrate -m 1,3 failed"
21427         $LFS getdirstripe $DIR/$tdir
21428
21429         files_on_starting_mdt=0
21430         for i in $(seq $total); do
21431                 $(echo $((i*i - i)) | cmp $DIR/$tdir/$tfile.$i -) ||
21432                         error "file $tfile.$i mismatch after migration"
21433                 [[ $($LFS getstripe -m $DIR/$tdir/$tfile.$i) -eq 1 ]] &&
21434                         files_on_starting_mdt=$((files_on_starting_mdt + 1))
21435         done
21436
21437         echo "$files_on_starting_mdt files on MDT1 after migration"
21438         [[ $files_on_starting_mdt -eq $total ]] && error "all files on MDT1"
21439
21440         $LFS migrate -m 0 -c 2 $DIR/$tdir || error "migrate -m 0 -c 2 failed"
21441         $LFS getdirstripe $DIR/$tdir
21442
21443         files_on_starting_mdt=0
21444         for i in $(seq $total); do
21445                 $(echo $((i*i - i)) | cmp $DIR/$tdir/$tfile.$i -) ||
21446                         error "file $tfile.$i mismatch after 2nd migration"
21447                 [[ $($LFS getstripe -m $DIR/$tdir/$tfile.$i) -eq 0 ]] &&
21448                         files_on_starting_mdt=$((files_on_starting_mdt + 1))
21449         done
21450
21451         echo "$files_on_starting_mdt files on MDT0 after 2nd migration"
21452         [[ $files_on_starting_mdt -eq $total ]] && error "all files on MDT0"
21453
21454         true
21455 }
21456 run_test 230k "file data not changed after dir migration"
21457
21458 test_230l() {
21459         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
21460         [ $MDS1_VERSION -lt $(version_code 2.11.56) ] &&
21461                 skip "Need MDS version at least 2.11.56"
21462
21463         $LFS mkdir -i 0 -c 1 $DIR/$tdir || error "mkdir failed"
21464         createmany -o $DIR/$tdir/f___________________________________ 1000 ||
21465                 error "create files under remote dir failed $i"
21466         $LFS migrate -m 1 $DIR/$tdir || error "migrate failed"
21467 }
21468 run_test 230l "readdir between MDTs won't crash"
21469
21470 test_230m() {
21471         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
21472         [ $MDS1_VERSION -lt $(version_code 2.11.56) ] &&
21473                 skip "Need MDS version at least 2.11.56"
21474
21475         local MDTIDX=1
21476         local mig_dir=$DIR/$tdir/migrate_dir
21477         local longstr="aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa"
21478         local shortstr="b"
21479         local val
21480
21481         echo "Creating files and dirs with xattrs"
21482         test_mkdir $DIR/$tdir
21483         test_mkdir -i0 -c1 $mig_dir
21484         mkdir $mig_dir/dir
21485         setfattr -n user.attr1 -v $longstr $mig_dir/dir ||
21486                 error "cannot set xattr attr1 on dir"
21487         setfattr -n user.attr2 -v $shortstr $mig_dir/dir ||
21488                 error "cannot set xattr attr2 on dir"
21489         touch $mig_dir/dir/f0
21490         setfattr -n user.attr1 -v $longstr $mig_dir/dir/f0 ||
21491                 error "cannot set xattr attr1 on file"
21492         setfattr -n user.attr2 -v $shortstr $mig_dir/dir/f0 ||
21493                 error "cannot set xattr attr2 on file"
21494         sync ; sync ; echo 3 > /proc/sys/vm/drop_caches
21495         val=$(getfattr --only-values -n user.attr1 $mig_dir/dir 2>/dev/null)
21496         [ "$val" = $longstr ] || error "xattr attr1 not set properly on dir"
21497         val=$(getfattr --only-values -n user.attr2 $mig_dir/dir 2>/dev/null)
21498         [ "$val" = $shortstr ] || error "xattr attr2 not set properly on dir"
21499         val=$(getfattr --only-values -n user.attr1 $mig_dir/dir/f0 2>/dev/null)
21500         [ "$val" = $longstr ] || error "xattr attr1 not set properly on file"
21501         val=$(getfattr --only-values -n user.attr2 $mig_dir/dir/f0 2>/dev/null)
21502         [ "$val" = $shortstr ] || error "xattr attr2 not set properly on file"
21503
21504         echo "Migrating to MDT1"
21505         $LFS migrate -m $MDTIDX $mig_dir ||
21506                 error "fails on migrating dir to MDT1"
21507
21508         sync ; sync ; echo 3 > /proc/sys/vm/drop_caches
21509         echo "Checking xattrs"
21510         val=$(getfattr --only-values -n user.attr1 $mig_dir/dir 2>/dev/null)
21511         [ "$val" = $longstr ] ||
21512                 error "expecting xattr1 $longstr on dir, found $val"
21513         val=$(getfattr --only-values -n user.attr2 $mig_dir/dir 2>/dev/null)
21514         [ "$val" = $shortstr ] ||
21515                 error "expecting xattr2 $shortstr on dir, found $val"
21516         val=$(getfattr --only-values -n user.attr1 $mig_dir/dir/f0 2>/dev/null)
21517         [ "$val" = $longstr ] ||
21518                 error "expecting xattr1 $longstr on file, found $val"
21519         val=$(getfattr --only-values -n user.attr2 $mig_dir/dir/f0 2>/dev/null)
21520         [ "$val" = $shortstr ] ||
21521                 error "expecting xattr2 $shortstr on file, found $val"
21522 }
21523 run_test 230m "xattrs not changed after dir migration"
21524
21525 test_230n() {
21526         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
21527         [[ $MDS1_VERSION -ge $(version_code 2.13.53) ]] ||
21528                 skip "Need MDS version at least 2.13.53"
21529
21530         $LFS mkdir -i 0 $DIR/$tdir || error "mkdir $tdir failed"
21531         cat /etc/hosts > $DIR/$tdir/$tfile
21532         $LFS mirror extend -N1 $DIR/$tdir/$tfile || error "Mirroring failed"
21533         $LFS migrate -m 1 $DIR/$tdir || error "Migration failed"
21534
21535         cmp /etc/hosts $DIR/$tdir/$tfile ||
21536                 error "File data mismatch after migration"
21537 }
21538 run_test 230n "Dir migration with mirrored file"
21539
21540 test_230o() {
21541         [ $MDSCOUNT -ge 2 ] || skip "needs >= 2 MDTs"
21542         [ $MDS1_VERSION -ge $(version_code 2.13.52) ] ||
21543                 skip "Need MDS version at least 2.13.52"
21544
21545         local mdts=$(comma_list $(mdts_nodes))
21546         local timeout=100
21547         local restripe_status
21548         local delta
21549         local i
21550
21551         [[ $mds1_FSTYPE == zfs ]] && timeout=300
21552
21553         # in case "crush" hash type is not set
21554         do_nodes $mdts "$LCTL set_param lod.*.mdt_hash=crush"
21555
21556         restripe_status=$(do_facet mds1 $LCTL get_param -n \
21557                            mdt.*MDT0000.enable_dir_restripe)
21558         do_nodes $mdts "$LCTL set_param mdt.*.enable_dir_restripe=1"
21559         stack_trap "do_nodes $mdts $LCTL set_param \
21560                     mdt.*.enable_dir_restripe=$restripe_status"
21561
21562         mkdir $DIR/$tdir
21563         createmany -m $DIR/$tdir/f 100 ||
21564                 error "create files under remote dir failed $i"
21565         createmany -d $DIR/$tdir/d 100 ||
21566                 error "create dirs under remote dir failed $i"
21567
21568         for i in $(seq 2 $MDSCOUNT); do
21569                 do_nodes $mdts "$LCTL set_param mdt.*.md_stats=clear >/dev/null"
21570                 $LFS setdirstripe -c $i $DIR/$tdir ||
21571                         error "split -c $i $tdir failed"
21572                 wait_update $HOSTNAME \
21573                         "$LFS getdirstripe -H $DIR/$tdir" "crush" $timeout ||
21574                         error "dir split not finished"
21575                 delta=$(do_nodes $mdts "lctl get_param -n mdt.*MDT*.md_stats" |
21576                         awk '/migrate/ {sum += $2} END { print sum }')
21577                 echo "$delta migrated when dir split $((i - 1)) to $i stripes"
21578                 # delta is around total_files/stripe_count
21579                 (( $delta < 200 / (i - 1) + 4 )) ||
21580                         error "$delta files migrated >= $((200 / (i - 1) + 4))"
21581         done
21582 }
21583 run_test 230o "dir split"
21584
21585 test_230p() {
21586         (( MDSCOUNT > 1 )) || skip "needs >= 2 MDTs"
21587         (( MDS1_VERSION >= $(version_code 2.13.52) )) ||
21588                 skip "Need MDS version at least 2.13.52"
21589
21590         local mdts=$(comma_list $(mdts_nodes))
21591         local timeout=100
21592         local restripe_status
21593         local delta
21594         local c
21595
21596         [[ $mds1_FSTYPE == zfs ]] && timeout=300
21597
21598         do_nodes $mdts "$LCTL set_param lod.*.mdt_hash=crush"
21599
21600         restripe_status=$(do_facet mds1 $LCTL get_param -n \
21601                            mdt.*MDT0000.enable_dir_restripe)
21602         do_nodes $mdts "$LCTL set_param mdt.*.enable_dir_restripe=1"
21603         stack_trap "do_nodes $mdts $LCTL set_param \
21604                     mdt.*.enable_dir_restripe=$restripe_status"
21605
21606         test_mkdir -c $MDSCOUNT -H crush $DIR/$tdir
21607         createmany -m $DIR/$tdir/f 100 ||
21608                 error "create files under remote dir failed"
21609         createmany -d $DIR/$tdir/d 100 ||
21610                 error "create dirs under remote dir failed"
21611
21612         for c in $(seq $((MDSCOUNT - 1)) -1 1); do
21613                 local mdt_hash="crush"
21614
21615                 do_nodes $mdts "$LCTL set_param mdt.*.md_stats=clear >/dev/null"
21616                 $LFS setdirstripe -c $c $DIR/$tdir ||
21617                         error "split -c $c $tdir failed"
21618                 if (( MDS1_VERSION >= $(version_code 2.14.51) )); then
21619                         mdt_hash="$mdt_hash,fixed"
21620                 elif [ $c -eq 1 ]; then
21621                         mdt_hash="none"
21622                 fi
21623                 wait_update $HOSTNAME \
21624                         "$LFS getdirstripe -H $DIR/$tdir" $mdt_hash $timeout ||
21625                         error "dir merge not finished"
21626                 delta=$(do_nodes $mdts "lctl get_param -n mdt.*MDT*.md_stats" |
21627                         awk '/migrate/ {sum += $2} END { print sum }')
21628                 echo "$delta migrated when dir merge $((c + 1)) to $c stripes"
21629                 # delta is around total_files/stripe_count
21630                 (( delta < 200 / c + 4 )) ||
21631                         error "$delta files migrated >= $((200 / c + 4))"
21632         done
21633 }
21634 run_test 230p "dir merge"
21635
21636 test_230q() {
21637         (( MDSCOUNT > 1)) || skip "needs >= 2 MDTs"
21638         (( MDS1_VERSION >= $(version_code 2.13.52) )) ||
21639                 skip "Need MDS version at least 2.13.52"
21640
21641         local mdts=$(comma_list $(mdts_nodes))
21642         local saved_threshold=$(do_facet mds1 \
21643                         $LCTL get_param -n mdt.*-MDT0000.dir_split_count)
21644         local saved_delta=$(do_facet mds1 \
21645                         $LCTL get_param -n mdt.*-MDT0000.dir_split_delta)
21646         local threshold=100
21647         local delta=2
21648         local total=0
21649         local stripe_count=0
21650         local stripe_index
21651         local nr_files
21652         local create
21653
21654         # test with fewer files on ZFS
21655         [ "$mds1_FSTYPE" == "zfs" ] && threshold=40
21656
21657         stack_trap "do_nodes $mdts $LCTL set_param \
21658                     mdt.*.dir_split_count=$saved_threshold"
21659         stack_trap "do_nodes $mdts $LCTL set_param \
21660                     mdt.*.dir_split_delta=$saved_delta"
21661         stack_trap "do_nodes $mdts $LCTL set_param mdt.*.dir_restripe_nsonly=1"
21662         do_nodes $mdts "$LCTL set_param mdt.*.enable_dir_auto_split=1"
21663         do_nodes $mdts "$LCTL set_param mdt.*.dir_split_count=$threshold"
21664         do_nodes $mdts "$LCTL set_param mdt.*.dir_split_delta=$delta"
21665         do_nodes $mdts "$LCTL set_param mdt.*.dir_restripe_nsonly=0"
21666         do_nodes $mdts "$LCTL set_param lod.*.mdt_hash=crush"
21667
21668         $LFS mkdir -i -1 -c 1 $DIR/$tdir || error "mkdir $tdir failed"
21669         stripe_index=$($LFS getdirstripe -i $DIR/$tdir)
21670
21671         create=$((threshold * 3 / 2))
21672         while [ $stripe_count -lt $MDSCOUNT ]; do
21673                 createmany -m $DIR/$tdir/f $total $create ||
21674                         error "create sub files failed"
21675                 stat $DIR/$tdir > /dev/null
21676                 total=$((total + create))
21677                 stripe_count=$((stripe_count + delta))
21678                 [ $stripe_count -gt $MDSCOUNT ] && stripe_count=$MDSCOUNT
21679
21680                 wait_update $HOSTNAME \
21681                         "$LFS getdirstripe -c $DIR/$tdir" "$stripe_count" 40 ||
21682                         error "stripe count $($LFS getdirstripe -c $DIR/$tdir) != $stripe_count"
21683
21684                 wait_update $HOSTNAME \
21685                         "$LFS getdirstripe -H $DIR/$tdir" "crush" 200 ||
21686                         error "stripe hash $($LFS getdirstripe -H $DIR/$tdir) != crush"
21687
21688                 nr_files=$($LFS find -m 1 $DIR/$tdir | grep -c -w $stripe_index)
21689                 echo "$nr_files/$total files on MDT$stripe_index after split"
21690                 # allow 10% margin of imbalance with crush hash
21691                 (( $nr_files <= $total / $stripe_count + $create / 10)) ||
21692                         error "$nr_files files on MDT$stripe_index after split"
21693
21694                 nr_files=$($LFS find -type f $DIR/$tdir | wc -l)
21695                 [ $nr_files -eq $total ] ||
21696                         error "total sub files $nr_files != $total"
21697         done
21698
21699         (( MDS1_VERSION >= $(version_code 2.14.51) )) || return 0
21700
21701         echo "fixed layout directory won't auto split"
21702         $LFS migrate -m 0 $DIR/$tdir || error "migrate $tdir failed"
21703         wait_update $HOSTNAME "$LFS getdirstripe -H $DIR/$tdir" "crush,fixed" \
21704                 10 || error "stripe hash $($LFS getdirstripe -H $DIR/$tdir)"
21705         wait_update $HOSTNAME "$LFS getdirstripe -c $DIR/$tdir" 1 10 ||
21706                 error "stripe count $($LFS getdirstripe -c $DIR/$tdir)"
21707 }
21708 run_test 230q "dir auto split"
21709
21710 test_230r() {
21711         [[ $PARALLEL != "yes" ]] || skip "skip parallel run"
21712         [[ $MDSCOUNT -ge 2 ]] || skip_env "needs >= 2 MDTs"
21713         [[ $MDS1_VERSION -ge $(version_code 2.13.54) ]] ||
21714                 skip "Need MDS version at least 2.13.54"
21715
21716         # maximum amount of local locks:
21717         # parent striped dir - 2 locks
21718         # new stripe in parent to migrate to - 1 lock
21719         # source and target - 2 locks
21720         # Total 5 locks for regular file
21721         mkdir -p $DIR/$tdir
21722         $LFS mkdir -i1 -c2 $DIR/$tdir/dir1
21723         touch $DIR/$tdir/dir1/eee
21724
21725         # create 4 hardlink for 4 more locks
21726         # Total: 9 locks > RS_MAX_LOCKS (8)
21727         $LFS mkdir -i1 -c1 $DIR/$tdir/dir2
21728         $LFS mkdir -i1 -c1 $DIR/$tdir/dir3
21729         $LFS mkdir -i1 -c1 $DIR/$tdir/dir4
21730         $LFS mkdir -i1 -c1 $DIR/$tdir/dir5
21731         ln $DIR/$tdir/dir1/eee $DIR/$tdir/dir2/eee
21732         ln $DIR/$tdir/dir1/eee $DIR/$tdir/dir3/eee
21733         ln $DIR/$tdir/dir1/eee $DIR/$tdir/dir4/eee
21734         ln $DIR/$tdir/dir1/eee $DIR/$tdir/dir5/eee
21735
21736         cancel_lru_locks mdc
21737
21738         $LFS migrate -m1 -c1 $DIR/$tdir/dir1 ||
21739                 error "migrate dir fails"
21740
21741         rm -rf $DIR/$tdir || error "rm dir failed after migration"
21742 }
21743 run_test 230r "migrate with too many local locks"
21744
21745 test_230s() {
21746         (( $MDS1_VERSION >= $(version_code 2.14.52) )) ||
21747                 skip "Need MDS version at least 2.14.52"
21748
21749         local mdts=$(comma_list $(mdts_nodes))
21750         local restripe_status=$(do_facet mds1 $LCTL get_param -n \
21751                                 mdt.*MDT0000.enable_dir_restripe)
21752
21753         stack_trap "do_nodes $mdts $LCTL set_param \
21754                     mdt.*.enable_dir_restripe=$restripe_status"
21755
21756         local st
21757         for st in 0 1; do
21758                 do_nodes $mdts "$LCTL set_param mdt.*.enable_dir_restripe=$st"
21759                 test_mkdir $DIR/$tdir
21760                 $LFS mkdir $DIR/$tdir |& grep "File exists" ||
21761                         error "$LFS mkdir should return EEXIST if target exists"
21762                 rmdir $DIR/$tdir
21763         done
21764 }
21765 run_test 230s "lfs mkdir should return -EEXIST if target exists"
21766
21767 test_230t()
21768 {
21769         [[ $MDSCOUNT -ge 2 ]] || skip_env "needs >= 2 MDTs"
21770         [[ $MDS1_VERSION -ge $(version_code 2.14.50) ]] ||
21771                 skip "Need MDS version at least 2.14.50"
21772
21773         test_mkdir $DIR/$tdir || error "mkdir $tdir failed"
21774         test_mkdir $DIR/$tdir/subdir || error "mkdir subdir failed"
21775         $LFS project -p 1 -s $DIR/$tdir ||
21776                 error "set $tdir project id failed"
21777         $LFS project -p 2 -s $DIR/$tdir/subdir ||
21778                 error "set subdir project id failed"
21779         $LFS migrate -m 1 -c $MDSCOUNT $DIR/$tdir || error "migrate failed"
21780 }
21781 run_test 230t "migrate directory with project ID set"
21782
21783 test_230u()
21784 {
21785         (( MDSCOUNT > 3 )) || skip_env "needs >= 4 MDTs"
21786         (( MDS1_VERSION >= $(version_code 2.14.53) )) ||
21787                 skip "Need MDS version at least 2.14.53"
21788
21789         local count
21790
21791         mkdir_on_mdt0 $DIR/$tdir || error "mkdir $tdir failed"
21792         mkdir $DIR/$tdir/sub{0..99} || error "mkdir sub failed"
21793         $LFS migrate -m -1 $DIR/$tdir/sub{0..99} || error "migrate sub failed"
21794         for i in $(seq 0 $((MDSCOUNT - 1))); do
21795                 count=$($LFS getstripe -m $DIR/$tdir/sub* | grep -c ^$i)
21796                 echo "$count dirs migrated to MDT$i"
21797         done
21798         count=$($LFS getstripe -m $DIR/$tdir/sub* | sort -u | wc -l)
21799         (( count >= MDSCOUNT - 1 )) || error "dirs migrated to $count MDTs"
21800 }
21801 run_test 230u "migrate directory by QOS"
21802
21803 test_230v()
21804 {
21805         (( MDSCOUNT > 3 )) || skip_env "needs >= 4 MDTs"
21806         (( MDS1_VERSION >= $(version_code 2.14.53) )) ||
21807                 skip "Need MDS version at least 2.14.53"
21808
21809         local count
21810
21811         mkdir $DIR/$tdir || error "mkdir $tdir failed"
21812         mkdir $DIR/$tdir/sub{0..99} || error "mkdir sub failed"
21813         $LFS migrate -m 0,2,1 $DIR/$tdir || error "migrate $tdir failed"
21814         for i in $(seq 0 $((MDSCOUNT - 1))); do
21815                 count=$($LFS getstripe -m $DIR/$tdir/sub* | grep -c ^$i)
21816                 echo "$count subdirs migrated to MDT$i"
21817                 (( i == 3 )) && (( count > 0 )) &&
21818                         error "subdir shouldn't be migrated to MDT3"
21819         done
21820         count=$($LFS getstripe -m $DIR/$tdir/sub* | sort -u | wc -l)
21821         (( count == 3 )) || error "dirs migrated to $count MDTs"
21822 }
21823 run_test 230v "subdir migrated to the MDT where its parent is located"
21824
21825 test_230w() {
21826         (( MDSCOUNT > 1 )) || skip "needs >= 2 MDTs"
21827         (( MDS1_VERSION >= $(version_code 2.15.0) )) ||
21828                 skip "Need MDS version at least 2.15.0"
21829
21830         mkdir -p $DIR/$tdir || error "mkdir $tdir failed"
21831         createmany -o $DIR/$tdir/f 10 || error "create files failed"
21832         createmany -d $DIR/$tdir/d 10 || error "create dirs failed"
21833
21834         $LFS migrate -m 1 -c $MDSCOUNT -d $DIR/$tdir ||
21835                 error "migrate failed"
21836
21837         (( $($LFS getdirstripe -c $DIR/$tdir) == MDSCOUNT )) ||
21838                 error "$tdir stripe count mismatch"
21839
21840         for i in $(seq 0 9); do
21841                 (( $($LFS getdirstripe -c $DIR/$tdir/d$i) == 0 )) ||
21842                         error "d$i is striped"
21843         done
21844 }
21845 run_test 230w "non-recursive mode dir migration"
21846
21847 test_230x() {
21848         (( MDSCOUNT > 1 )) || skip "needs >= 2 MDTs"
21849         (( MDS1_VERSION >= $(version_code 2.15.0) )) ||
21850                 skip "Need MDS version at least 2.15.0"
21851
21852         mkdir -p $DIR/$tdir || error "mkdir failed"
21853         createmany -d $DIR/$tdir/sub 100 || error "createmany failed"
21854
21855         local mdt_name=$(mdtname_from_index 0)
21856         local low=$(do_facet mds2 $LCTL get_param -n \
21857                 osp.*$mdt_name-osp-MDT0001.reserved_ino_low)
21858         local high=$(do_facet mds2 $LCTL get_param -n \
21859                 osp.*$mdt_name-osp-MDT0001.reserved_ino_high)
21860         local ffree=$($LFS df -i $MOUNT | awk "/$mdt_name/ { print \$4 }")
21861         local maxage=$(do_facet mds2 $LCTL get_param -n \
21862                 osp.*$mdt_name-osp-MDT0001.maxage)
21863
21864         stack_trap "do_facet mds2 $LCTL set_param -n \
21865                 osp.*$mdt_name-osp-MDT0001.reserved_ino_low=$low \
21866                 osp.*$mdt_name-osp-MDT0001.reserved_ino_high=$high" EXIT
21867         stack_trap "do_facet mds2 $LCTL set_param -n \
21868                 osp.*$mdt_name-osp-MDT0001.maxage=$maxage" EXIT
21869
21870         do_facet mds2 $LCTL set_param -n \
21871                 osp.*$mdt_name-osp-MDT0001.reserved_ino_low=$((ffree + 1))
21872         do_facet mds2 $LCTL set_param -n osp.*$mdt_name-osp-MDT0001.maxage=1
21873         sleep 4
21874         $LFS migrate -m 1 -c $MDSCOUNT $DIR/$tdir &&
21875                 error "migrate $tdir should fail"
21876
21877         do_facet mds2 $LCTL set_param -n \
21878                 osp.*$mdt_name-osp-MDT0001.reserved_ino_low=$low
21879         do_facet mds2 $LCTL set_param -n \
21880                 osp.*$mdt_name-osp-MDT0001.reserved_ino_high=$high
21881         sleep 4
21882         $LFS migrate -m 1 -c $MDSCOUNT $DIR/$tdir ||
21883                 error "migrate failed"
21884         (( $($LFS getdirstripe -c $DIR/$tdir) == $MDSCOUNT )) ||
21885                 error "$tdir stripe count mismatch"
21886 }
21887 run_test 230x "dir migration check space"
21888
21889 test_230y() {
21890         (( MDSCOUNT > 1 )) || skip "needs >= 2 MDTs"
21891         (( MDS1_VERSION >= $(version_code 2.15.55.45) )) ||
21892                 skip "Need MDS version at least 2.15.55.45"
21893
21894         local pid
21895
21896         test_mkdir -c -1 $DIR/$tdir || error "mkdir $tdir failed"
21897         $LFS getdirstripe $DIR/$tdir
21898         createmany -d $DIR/$tdir/d 100 || error "createmany failed"
21899         $LFS migrate -m 1 -c 2 $DIR/$tdir &
21900         pid=$!
21901         sleep 1
21902
21903         #OBD_FAIL_MIGRATE_BAD_HASH      0x1802
21904         do_facet mds2 lctl set_param fail_loc=0x1802
21905
21906         wait $pid
21907         do_facet mds2 lctl set_param fail_loc=0
21908         $LFS getdirstripe $DIR/$tdir
21909         unlinkmany -d $DIR/$tdir/d 100 || error "unlinkmany failed"
21910         rmdir $DIR/$tdir || error "rmdir $tdir failed"
21911 }
21912 run_test 230y "unlink dir with bad hash type"
21913
21914 test_230z() {
21915         (( MDSCOUNT > 1 )) || skip "needs >= 2 MDTs"
21916         (( MDS1_VERSION >= $(version_code 2.15.55.45) )) ||
21917                 skip "Need MDS version at least 2.15.55.45"
21918
21919         local pid
21920
21921         test_mkdir -c -1 $DIR/$tdir || error "mkdir $tdir failed"
21922         $LFS getdirstripe $DIR/$tdir
21923         createmany -d $DIR/$tdir/d 100 || error "createmany failed"
21924         $LFS migrate -m 1 -c 2 -H fnv_1a_64 $DIR/$tdir &
21925         pid=$!
21926         sleep 1
21927
21928         #OBD_FAIL_MIGRATE_BAD_HASH      0x1802
21929         do_facet mds2 lctl set_param fail_loc=0x1802
21930
21931         wait $pid
21932         do_facet mds2 lctl set_param fail_loc=0
21933         $LFS getdirstripe $DIR/$tdir
21934
21935         # resume migration
21936         $LFS migrate -m 1 -c 2 -H fnv_1a_64 $DIR/$tdir ||
21937                 error "resume migration failed"
21938         $LFS getdirstripe $DIR/$tdir
21939         [ $($LFS getdirstripe -H $DIR/$tdir) == "fnv_1a_64,fixed" ] ||
21940                 error "migration is not finished"
21941 }
21942 run_test 230z "resume dir migration with bad hash type"
21943
21944 test_231a()
21945 {
21946         # For simplicity this test assumes that max_pages_per_rpc
21947         # is the same across all OSCs
21948         local max_pages=$($LCTL get_param -n osc.*.max_pages_per_rpc | head -n1)
21949         local bulk_size=$((max_pages * PAGE_SIZE))
21950         local brw_size=$(do_facet ost1 $LCTL get_param -n obdfilter.*.brw_size |
21951                                        head -n 1)
21952
21953         mkdir -p $DIR/$tdir
21954         $LFS setstripe -S ${brw_size}M $DIR/$tdir ||
21955                 error "failed to set stripe with -S ${brw_size}M option"
21956         stack_trap "rm -rf $DIR/$tdir"
21957
21958         # clear the OSC stats
21959         $LCTL set_param osc.*.stats=0 &>/dev/null
21960         stop_writeback
21961
21962         # Client writes $bulk_size - there must be 1 rpc for $max_pages.
21963         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=$bulk_size count=1 \
21964                 oflag=direct &>/dev/null || error "dd failed"
21965
21966         sync; sleep 1; sync # just to be safe
21967         local nrpcs=$($LCTL get_param osc.*.stats |awk '/ost_write/ {print $2}')
21968         if [ x$nrpcs != "x1" ]; then
21969                 $LCTL get_param osc.*.stats
21970                 error "found $nrpcs ost_write RPCs, not 1 as expected"
21971         fi
21972
21973         start_writeback
21974         # Drop the OSC cache, otherwise we will read from it
21975         cancel_lru_locks osc
21976
21977         # clear the OSC stats
21978         $LCTL set_param osc.*.stats=0 &>/dev/null
21979
21980         # Client reads $bulk_size.
21981         dd if=$DIR/$tdir/$tfile of=/dev/null bs=$bulk_size count=1 \
21982                 iflag=direct &>/dev/null || error "dd failed"
21983
21984         nrpcs=$($LCTL get_param osc.*.stats | awk '/ost_read/ { print $2 }')
21985         if [ x$nrpcs != "x1" ]; then
21986                 $LCTL get_param osc.*.stats
21987                 error "found $nrpcs ost_read RPCs, not 1 as expected"
21988         fi
21989 }
21990 run_test 231a "checking that reading/writing of BRW RPC size results in one RPC"
21991
21992 test_231b() {
21993         mkdir -p $DIR/$tdir
21994         stack_trap "rm -rf $DIR/$tdir"
21995         local i
21996         for i in {0..1023}; do
21997                 dd if=/dev/zero of=$DIR/$tdir/$tfile conv=notrunc \
21998                         seek=$((2 * i)) bs=4096 count=1 &>/dev/null ||
21999                         error "dd of=$DIR/$tdir/$tfile seek=$((2 * i)) failed"
22000         done
22001         sync
22002 }
22003 run_test 231b "must not assert on fully utilized OST request buffer"
22004
22005 test_232a() {
22006         mkdir -p $DIR/$tdir
22007         $LFS setstripe -c1 -i0 $DIR/$tdir/$tfile
22008
22009         #define OBD_FAIL_LDLM_OST_LVB            0x31c
22010         do_facet ost1 $LCTL set_param fail_loc=0x31c
22011
22012         # ignore dd failure
22013         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=1 || true
22014         stack_trap "rm -f $DIR/$tdir/$tfile"
22015
22016         do_facet ost1 $LCTL set_param fail_loc=0
22017         umount_client $MOUNT || error "umount failed"
22018         mount_client $MOUNT || error "mount failed"
22019         stop ost1 || error "cannot stop ost1"
22020         start ost1 $(ostdevname 1) $OST_MOUNT_OPTS || error "cannot start ost1"
22021 }
22022 run_test 232a "failed lock should not block umount"
22023
22024 test_232b() {
22025         [ $MDS1_VERSION -ge $(version_code 2.10.58) ] ||
22026                 skip "Need MDS version at least 2.10.58"
22027
22028         mkdir -p $DIR/$tdir
22029         $LFS setstripe -c1 -i0 $DIR/$tdir/$tfile
22030         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=1
22031         stack_trap "rm -f $DIR/$tdir/$tfile"
22032         sync
22033         cancel_lru_locks osc
22034
22035         #define OBD_FAIL_LDLM_OST_LVB            0x31c
22036         do_facet ost1 $LCTL set_param fail_loc=0x31c
22037
22038         # ignore failure
22039         $LFS data_version $DIR/$tdir/$tfile || true
22040
22041         do_facet ost1 $LCTL set_param fail_loc=0
22042         umount_client $MOUNT || error "umount failed"
22043         mount_client $MOUNT || error "mount failed"
22044         stop ost1 || error "cannot stop ost1"
22045         start ost1 $(ostdevname 1) $OST_MOUNT_OPTS || error "cannot start ost1"
22046 }
22047 run_test 232b "failed data version lock should not block umount"
22048
22049 test_233a() {
22050         [ $MDS1_VERSION -ge $(version_code 2.3.64) ] ||
22051                 skip "Need MDS version at least 2.3.64"
22052         [ -n "$FILESET" ] && skip_env "SKIP due to FILESET set"
22053
22054         local fid=$($LFS path2fid $MOUNT)
22055
22056         stat $MOUNT/.lustre/fid/$fid > /dev/null ||
22057                 error "cannot access $MOUNT using its FID '$fid'"
22058 }
22059 run_test 233a "checking that OBF of the FS root succeeds"
22060
22061 test_233b() {
22062         [ $MDS1_VERSION -ge $(version_code 2.5.90) ] ||
22063                 skip "Need MDS version at least 2.5.90"
22064         [ -n "$FILESET" ] && skip_env "SKIP due to FILESET set"
22065
22066         local fid=$($LFS path2fid $MOUNT/.lustre)
22067
22068         stat $MOUNT/.lustre/fid/$fid > /dev/null ||
22069                 error "cannot access $MOUNT/.lustre using its FID '$fid'"
22070
22071         fid=$($LFS path2fid $MOUNT/.lustre/fid)
22072         stat $MOUNT/.lustre/fid/$fid > /dev/null ||
22073                 error "cannot access $MOUNT/.lustre/fid using its FID '$fid'"
22074 }
22075 run_test 233b "checking that OBF of the FS .lustre succeeds"
22076
22077 test_234() {
22078         local p="$TMP/sanityN-$TESTNAME.parameters"
22079         save_lustre_params client "llite.*.xattr_cache" > $p
22080         lctl set_param llite.*.xattr_cache 1 ||
22081                 skip_env "xattr cache is not supported"
22082
22083         mkdir -p $DIR/$tdir || error "mkdir failed"
22084         touch $DIR/$tdir/$tfile || error "touch failed"
22085         # OBD_FAIL_LLITE_XATTR_ENOMEM
22086         $LCTL set_param fail_loc=0x1405
22087         getfattr -n user.attr $DIR/$tdir/$tfile &&
22088                 error "getfattr should have failed with ENOMEM"
22089         $LCTL set_param fail_loc=0x0
22090         rm -rf $DIR/$tdir
22091
22092         restore_lustre_params < $p
22093         rm -f $p
22094 }
22095 run_test 234 "xattr cache should not crash on ENOMEM"
22096
22097 test_235() {
22098         [ $MDS1_VERSION -lt $(version_code 2.4.52) ] &&
22099                 skip "Need MDS version at least 2.4.52"
22100
22101         flock_deadlock $DIR/$tfile
22102         local RC=$?
22103         case $RC in
22104                 0)
22105                 ;;
22106                 124) error "process hangs on a deadlock"
22107                 ;;
22108                 *) error "error executing flock_deadlock $DIR/$tfile"
22109                 ;;
22110         esac
22111 }
22112 run_test 235 "LU-1715: flock deadlock detection does not work properly"
22113
22114 #LU-2935
22115 test_236() {
22116         check_swap_layouts_support
22117
22118         local ref1=/etc/passwd
22119         local ref2=/etc/group
22120         local file1=$DIR/$tdir/f1
22121         local file2=$DIR/$tdir/f2
22122
22123         test_mkdir -c1 $DIR/$tdir
22124         $LFS setstripe -c 1 $file1 || error "cannot setstripe on '$file1': rc = $?"
22125         cp $ref1 $file1 || error "cp $ref1 $file1 failed: rc = $?"
22126         $LFS setstripe -c 2 $file2 || error "cannot setstripe on '$file2': rc = $?"
22127         cp $ref2 $file2 || error "cp $ref2 $file2 failed: rc = $?"
22128         local fd=$(free_fd)
22129         local cmd="exec $fd<>$file2"
22130         eval $cmd
22131         rm $file2
22132         $LFS swap_layouts $file1 /proc/self/fd/${fd} ||
22133                 error "cannot swap layouts of '$file1' and /proc/self/fd/${fd}"
22134         cmd="exec $fd>&-"
22135         eval $cmd
22136         cmp $ref2 $file1 || error "content compare failed ($ref2 != $file1)"
22137
22138         #cleanup
22139         rm -rf $DIR/$tdir
22140 }
22141 run_test 236 "Layout swap on open unlinked file"
22142
22143 # LU-4659 linkea consistency
22144 test_238() {
22145         [[ $MDS1_VERSION -gt $(version_code 2.5.57) ]] ||
22146                 [[ $MDS1_VERSION -gt $(version_code 2.5.1) &&
22147                    $MDS1_VERSION -lt $(version_code 2.5.50) ]] ||
22148                 skip "Need MDS version at least 2.5.58 or 2.5.2+"
22149
22150         touch $DIR/$tfile
22151         ln $DIR/$tfile $DIR/$tfile.lnk
22152         touch $DIR/$tfile.new
22153         mv $DIR/$tfile.new $DIR/$tfile
22154         local fid1=$($LFS path2fid $DIR/$tfile)
22155         local fid2=$($LFS path2fid $DIR/$tfile.lnk)
22156         local path1=$($LFS fid2path $FSNAME "$fid1")
22157         [ $tfile == $path1 ] || error "linkea inconsistent: $tfile $fid1 $path1"
22158         local path2=$($LFS fid2path $FSNAME "$fid2")
22159         [ $tfile.lnk == $path2 ] ||
22160                 error "linkea inconsistent: $tfile.lnk $fid2 $path2!"
22161         rm -f $DIR/$tfile*
22162 }
22163 run_test 238 "Verify linkea consistency"
22164
22165 test_239A() { # was test_239
22166         [ $MDS1_VERSION -lt $(version_code 2.5.60) ] &&
22167                 skip "Need MDS version at least 2.5.60"
22168
22169         local list=$(comma_list $(mdts_nodes))
22170
22171         mkdir -p $DIR/$tdir
22172         createmany -o $DIR/$tdir/f- 5000
22173         unlinkmany $DIR/$tdir/f- 5000
22174         [ $MDS1_VERSION -gt $(version_code 2.10.4) ] &&
22175                 do_nodes $list "lctl set_param -n osp.*.force_sync=1"
22176         changes=$(do_nodes $list "lctl get_param -n osp.*MDT*.sync_changes \
22177                         osp.*MDT*.sync_in_flight" | calc_sum)
22178         [ "$changes" -eq 0 ] || error "$changes not synced"
22179 }
22180 run_test 239A "osp_sync test"
22181
22182 test_239a() { #LU-5297
22183         remote_mds_nodsh && skip "remote MDS with nodsh"
22184
22185         touch $DIR/$tfile
22186         #define OBD_FAIL_OSP_CHECK_INVALID_REC     0x2100
22187         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x2100
22188         chgrp $RUNAS_GID $DIR/$tfile
22189         wait_delete_completed
22190 }
22191 run_test 239a "process invalid osp sync record correctly"
22192
22193 test_239b() { #LU-5297
22194         remote_mds_nodsh && skip "remote MDS with nodsh"
22195
22196         touch $DIR/$tfile1
22197         #define OBD_FAIL_OSP_CHECK_ENOMEM     0x2101
22198         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x2101
22199         chgrp $RUNAS_GID $DIR/$tfile1
22200         wait_delete_completed
22201         do_facet $SINGLEMDS $LCTL set_param fail_loc=0
22202         touch $DIR/$tfile2
22203         chgrp $RUNAS_GID $DIR/$tfile2
22204         wait_delete_completed
22205 }
22206 run_test 239b "process osp sync record with ENOMEM error correctly"
22207
22208 test_240() {
22209         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
22210         remote_mds_nodsh && skip "remote MDS with nodsh"
22211
22212         mkdir -p $DIR/$tdir
22213
22214         $LFS mkdir -i 0 $DIR/$tdir/d0 ||
22215                 error "failed to mkdir $DIR/$tdir/d0 on MDT0"
22216         $LFS mkdir -i 1 $DIR/$tdir/d0/d1 ||
22217                 error "failed to mkdir $DIR/$tdir/d0/d1 on MDT1"
22218
22219         umount_client $MOUNT || error "umount failed"
22220         #define OBD_FAIL_TGT_DELAY_CONDITIONAL   0x713
22221         do_facet mds2 lctl set_param fail_loc=0x713 fail_val=1
22222         mount_client $MOUNT || error "failed to mount client"
22223
22224         echo "stat $DIR/$tdir/d0/d1, should not fail/ASSERT"
22225         stat $DIR/$tdir/d0/d1 || error "fail to stat $DIR/$tdir/d0/d1"
22226 }
22227 run_test 240 "race between ldlm enqueue and the connection RPC (no ASSERT)"
22228
22229 test_241_bio() {
22230         local count=$1
22231         local bsize=$2
22232
22233         for LOOP in $(seq $count); do
22234                 dd if=$DIR/$tfile of=/dev/null bs=$bsize count=1 2>/dev/null
22235                 cancel_lru_locks $OSC || true
22236         done
22237 }
22238
22239 test_241_dio() {
22240         local count=$1
22241         local bsize=$2
22242
22243         for LOOP in $(seq $1); do
22244                 dd if=$DIR/$tfile of=/dev/null bs=$bsize count=1 iflag=direct \
22245                         2>/dev/null
22246         done
22247 }
22248
22249 test_241a() { # was test_241
22250         local bsize=$PAGE_SIZE
22251
22252         (( bsize < 40960 )) && bsize=40960
22253         dd if=/dev/zero of=$DIR/$tfile count=1 bs=$bsize
22254         ls -la $DIR/$tfile
22255         cancel_lru_locks $OSC
22256         test_241_bio 1000 $bsize &
22257         PID=$!
22258         test_241_dio 1000 $bsize
22259         wait $PID
22260 }
22261 run_test 241a "bio vs dio"
22262
22263 test_241b() {
22264         local bsize=$PAGE_SIZE
22265
22266         (( bsize < 40960 )) && bsize=40960
22267         dd if=/dev/zero of=$DIR/$tfile count=1 bs=$bsize
22268         ls -la $DIR/$tfile
22269         test_241_dio 1000 $bsize &
22270         PID=$!
22271         test_241_dio 1000 $bsize
22272         wait $PID
22273 }
22274 run_test 241b "dio vs dio"
22275
22276 test_242() {
22277         remote_mds_nodsh && skip "remote MDS with nodsh"
22278
22279         mkdir_on_mdt0 $DIR/$tdir
22280         touch $DIR/$tdir/$tfile
22281
22282         #define OBD_FAIL_MDS_READPAGE_PACK      0x105
22283         do_facet mds1 lctl set_param fail_loc=0x105
22284         /bin/ls $DIR/$tdir && error "ls $DIR/$tdir should fail"
22285
22286         do_facet mds1 lctl set_param fail_loc=0
22287         /bin/ls $DIR/$tdir || error "ls $DIR/$tdir failed"
22288 }
22289 run_test 242 "mdt_readpage failure should not cause directory unreadable"
22290
22291 test_243()
22292 {
22293         test_mkdir $DIR/$tdir
22294         group_lock_test -d $DIR/$tdir || error "A group lock test failed"
22295 }
22296 run_test 243 "various group lock tests"
22297
22298 test_244a()
22299 {
22300         test_mkdir $DIR/$tdir
22301         dd if=/dev/zero of=$DIR/$tdir/$tfile bs=1M count=35
22302         sendfile_grouplock $DIR/$tdir/$tfile || \
22303                 error "sendfile+grouplock failed"
22304         rm -rf $DIR/$tdir
22305 }
22306 run_test 244a "sendfile with group lock tests"
22307
22308 test_244b()
22309 {
22310         [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
22311
22312         local threads=50
22313         local size=$((1024*1024))
22314
22315         test_mkdir $DIR/$tdir
22316         for i in $(seq 1 $threads); do
22317                 local file=$DIR/$tdir/file_$((i / 10))
22318                 $MULTIOP $file OG1234w$size_$((i % 3))w$size_$((i % 4))g1234c &
22319                 local pids[$i]=$!
22320         done
22321         for i in $(seq 1 $threads); do
22322                 wait ${pids[$i]}
22323         done
22324 }
22325 run_test 244b "multi-threaded write with group lock"
22326
22327 test_245a() {
22328         local flagname="multi_mod_rpcs"
22329         local connect_data_name="max_mod_rpcs"
22330         local out
22331
22332         # check if multiple modify RPCs flag is set
22333         out=$($LCTL get_param mdc.$FSNAME-MDT0000-*.import |
22334                 grep "connect_flags:")
22335         echo "$out"
22336
22337         echo "$out" | grep -qw $flagname
22338         if [ $? -ne 0 ]; then
22339                 echo "connect flag $flagname is not set"
22340                 return
22341         fi
22342
22343         # check if multiple modify RPCs data is set
22344         out=$($LCTL get_param mdc.$FSNAME-MDT0000-*.import)
22345         echo "$out"
22346
22347         echo "$out" | grep -qw $connect_data_name ||
22348                 error "import should have connect data $connect_data_name"
22349 }
22350 run_test 245a "check mdc connection flag/data: multiple modify RPCs"
22351
22352 test_245b() {
22353         local flagname="multi_mod_rpcs"
22354         local connect_data_name="max_mod_rpcs"
22355         local out
22356
22357         remote_mds_nodsh && skip "remote MDS with nodsh"
22358         [[ $MDSCOUNT -ge 2 ]] || skip "needs >= 2 MDTs"
22359
22360         # check if multiple modify RPCs flag is set
22361         out=$(do_facet mds1 \
22362               $LCTL get_param osp.$FSNAME-MDT0001-osp-MDT0000.import |
22363               grep "connect_flags:")
22364         echo "$out"
22365
22366         [[ "$out" =~ $flagname ]] || skip "connect flag $flagname is not set"
22367
22368         # check if multiple modify RPCs data is set
22369         out=$(do_facet mds1 \
22370               $LCTL get_param osp.$FSNAME-MDT0001-osp-MDT0000.import)
22371
22372         [[ "$out" =~ $connect_data_name ]] ||
22373                 {
22374                         echo "$out"
22375                         error "missing connect data $connect_data_name"
22376                 }
22377 }
22378 run_test 245b "check osp connection flag/data: multiple modify RPCs"
22379
22380 cleanup_247() {
22381         local submount=$1
22382
22383         trap 0
22384         umount_client $submount
22385         rmdir $submount
22386 }
22387
22388 test_247a() {
22389         lctl get_param -n mdc.$FSNAME-MDT0000*.import |
22390                 grep -q subtree ||
22391                 skip_env "Fileset feature is not supported"
22392
22393         local submount=${MOUNT}_$tdir
22394
22395         mkdir $MOUNT/$tdir
22396         mkdir -p $submount || error "mkdir $submount failed"
22397         FILESET="$FILESET/$tdir" mount_client $submount ||
22398                 error "mount $submount failed"
22399         trap "cleanup_247 $submount" EXIT
22400         echo foo > $submount/$tfile || error "write $submount/$tfile failed"
22401         [ $(cat $MOUNT/$tdir/$tfile) = "foo" ] ||
22402                 error "read $MOUNT/$tdir/$tfile failed"
22403         cleanup_247 $submount
22404 }
22405 run_test 247a "mount subdir as fileset"
22406
22407 test_247b() {
22408         lctl get_param -n mdc.$FSNAME-MDT0000*.import | grep -q subtree ||
22409                 skip_env "Fileset feature is not supported"
22410
22411         local submount=${MOUNT}_$tdir
22412
22413         rm -rf $MOUNT/$tdir
22414         mkdir -p $submount || error "mkdir $submount failed"
22415         SKIP_FILESET=1
22416         FILESET="$FILESET/$tdir" mount_client $submount &&
22417                 error "mount $submount should fail"
22418         rmdir $submount
22419 }
22420 run_test 247b "mount subdir that dose not exist"
22421
22422 test_247c() {
22423         lctl get_param -n mdc.$FSNAME-MDT0000*.import | grep -q subtree ||
22424                 skip_env "Fileset feature is not supported"
22425
22426         local submount=${MOUNT}_$tdir
22427
22428         mkdir -p $MOUNT/$tdir/dir1
22429         mkdir -p $submount || error "mkdir $submount failed"
22430         trap "cleanup_247 $submount" EXIT
22431         FILESET="$FILESET/$tdir" mount_client $submount ||
22432                 error "mount $submount failed"
22433         local fid=$($LFS path2fid $MOUNT/)
22434         $LFS fid2path $submount $fid && error "fid2path should fail"
22435         cleanup_247 $submount
22436 }
22437 run_test 247c "running fid2path outside subdirectory root"
22438
22439 test_247d() {
22440         lctl get_param -n mdc.$FSNAME-MDT0000*.import | grep -q subtree ||
22441                 skip "Fileset feature is not supported"
22442
22443         local submount=${MOUNT}_$tdir
22444
22445         mkdir -p $MOUNT/$tdir/dir1
22446         mkdir -p $submount || error "mkdir $submount failed"
22447         FILESET="$FILESET/$tdir" mount_client $submount ||
22448                 error "mount $submount failed"
22449         trap "cleanup_247 $submount" EXIT
22450
22451         local td=$submount/dir1
22452         local fid=$($LFS path2fid $td)
22453         [ -z "$fid" ] && error "path2fid unable to get $td FID"
22454
22455         # check that we get the same pathname back
22456         local rootpath
22457         local found
22458         for rootpath in "$submount" "$submount///" "$submount/dir1"; do
22459                 echo "$rootpath $fid"
22460                 found=$($LFS fid2path $rootpath "$fid")
22461                 [ -n "$found" ] || error "fid2path should succeed"
22462                 [ "$found" == "$td" ] || error "fid2path $found != $td"
22463         done
22464         # check wrong root path format
22465         rootpath=$submount"_wrong"
22466         found=$($LFS fid2path $rootpath "$fid")
22467         [ -z "$found" ] || error "fid2path should fail ($rootpath != $submount)"
22468
22469         cleanup_247 $submount
22470 }
22471 run_test 247d "running fid2path inside subdirectory root"
22472
22473 # LU-8037
22474 test_247e() {
22475         lctl get_param -n mdc.$FSNAME-MDT0000*.import |
22476                 grep -q subtree ||
22477                 skip "Fileset feature is not supported"
22478
22479         local submount=${MOUNT}_$tdir
22480
22481         mkdir $MOUNT/$tdir
22482         mkdir -p $submount || error "mkdir $submount failed"
22483         FILESET="$FILESET/.." mount_client $submount &&
22484                 error "mount $submount should fail"
22485         rmdir $submount
22486 }
22487 run_test 247e "mount .. as fileset"
22488
22489 test_247f() {
22490         (( $MDSCOUNT > 1 )) || skip_env "needs >= 2 MDTs"
22491         (( $MDS1_VERSION >= $(version_code 2.14.50.162) )) ||
22492                 skip "Need at least version 2.14.50.162"
22493         lctl get_param -n mdc.$FSNAME-MDT0000*.import | grep -q subtree ||
22494                 skip "Fileset feature is not supported"
22495
22496         mkdir_on_mdt0 $DIR/$tdir || error "mkdir $tdir failed"
22497         $LFS mkdir -i $((MDSCOUNT - 1)) $DIR/$tdir/remote ||
22498                 error "mkdir remote failed"
22499         $LFS mkdir -i $((MDSCOUNT - 1)) $DIR/$tdir/remote/subdir ||
22500                 error "mkdir remote/subdir failed"
22501         $LFS mkdir -i 0 -c $MDSCOUNT $DIR/$tdir/striped ||
22502                 error "mkdir striped failed"
22503         mkdir $DIR/$tdir/striped/subdir || error "mkdir striped/subdir failed"
22504
22505         local submount=${MOUNT}_$tdir
22506
22507         mkdir -p $submount || error "mkdir $submount failed"
22508         stack_trap "rmdir $submount"
22509
22510         local dir
22511         local fileset=$FILESET
22512         local mdts=$(comma_list $(mdts_nodes))
22513
22514         do_nodes $mdts "$LCTL set_param mdt.*.enable_remote_subdir_mount=1"
22515         for dir in $tdir/remote $tdir/remote/subdir $tdir/striped \
22516                 $tdir/striped/subdir $tdir/striped/.; do
22517                 FILESET="$fileset/$dir" mount_client $submount ||
22518                         error "mount $dir failed"
22519                 umount_client $submount
22520         done
22521 }
22522 run_test 247f "mount striped or remote directory as fileset"
22523
22524 test_subdir_mount_lock()
22525 {
22526         local testdir=$1
22527         local submount=${MOUNT}_$(basename $testdir)
22528
22529         touch $DIR/$testdir/$tfile || error "touch $tfile failed"
22530
22531         mkdir -p $submount || error "mkdir $submount failed"
22532         stack_trap "rmdir $submount"
22533
22534         FILESET="$fileset/$testdir" mount_client $submount ||
22535                 error "mount $FILESET failed"
22536         stack_trap "umount $submount"
22537
22538         local mdts=$(comma_list $(mdts_nodes))
22539
22540         local nrpcs
22541
22542         stat $submount > /dev/null || error "stat $submount failed"
22543         cancel_lru_locks $MDC
22544         stat $submount > /dev/null || error "stat $submount failed"
22545         stat $submount/$tfile > /dev/null || error "stat $tfile failed"
22546         do_nodes $mdts "$LCTL set_param mdt.*.md_stats=clear > /dev/null"
22547         stat $submount/$tfile > /dev/null || error "stat $tfile failed"
22548         nrpcs=$(do_nodes $mdts "lctl get_param -n mdt.*.md_stats" |
22549                 awk '/getattr/ {sum += $2} END {print sum}')
22550
22551         [ -z "$nrpcs" ] || error "$nrpcs extra getattr sent"
22552 }
22553
22554 test_247g() {
22555         (( $MDSCOUNT > 1 )) || skip_env "needs > 1 MDTs"
22556
22557         $LFS mkdir -i 0 -c 4 -H fnv_1a_64 $DIR/$tdir ||
22558                 error "mkdir $tdir failed"
22559         test_subdir_mount_lock $tdir
22560 }
22561 run_test 247g "striped directory submount revalidate ROOT from cache"
22562
22563 test_247h() {
22564         (( $MDSCOUNT > 1 )) || skip_env "needs > 1 MDTs"
22565         (( $MDS1_VERSION >= $(version_code 2.15.51) )) ||
22566                 skip "Need MDS version at least 2.15.51"
22567
22568         $LFS mkdir -i 1 -c $MDSCOUNT $DIR/$tdir || error "mkdir $tdir failed"
22569         test_subdir_mount_lock $tdir
22570         mkdir_on_mdt -i 0 $DIR/$tdir/$tdir.0 || error "mkdir $tdir.0 failed"
22571         mkdir_on_mdt -i 1 $DIR/$tdir/$tdir.0/$tdir.1 ||
22572                 error "mkdir $tdir.1 failed"
22573         test_subdir_mount_lock $tdir/$tdir.0/$tdir.1
22574 }
22575 run_test 247h "remote directory submount revalidate ROOT from cache"
22576
22577 test_248a() {
22578         local fast_read_sav=$($LCTL get_param -n llite.*.fast_read 2>/dev/null)
22579         [ -z "$fast_read_sav" ] && skip "no fast read support"
22580
22581         # create a large file for fast read verification
22582         dd if=/dev/zero of=$DIR/$tfile bs=1M count=128 > /dev/null 2>&1
22583
22584         # make sure the file is created correctly
22585         $CHECKSTAT -s $((128*1024*1024)) $DIR/$tfile ||
22586                 { rm -f $DIR/$tfile; skip "file creation error"; }
22587
22588         echo "Test 1: verify that fast read is 4 times faster on cache read"
22589
22590         # small read with fast read enabled
22591         $LCTL set_param -n llite.*.fast_read=1
22592         local t_fast=$(dd if=$DIR/$tfile of=/dev/null bs=4k 2>&1 |
22593                 egrep -o '([[:digit:]\.\,e-]+) s' | cut -d's' -f1 |
22594                 sed -e 's/,/./' -e 's/[eE]+*/\*10\^/')
22595         # small read with fast read disabled
22596         $LCTL set_param -n llite.*.fast_read=0
22597         local t_slow=$(dd if=$DIR/$tfile of=/dev/null bs=4k 2>&1 |
22598                 egrep -o '([[:digit:]\.\,e-]+) s' | cut -d's' -f1 |
22599                 sed -e 's/,/./' -e 's/[eE]+*/\*10\^/')
22600
22601         # verify that fast read is 4 times faster for cache read
22602         [ $(bc <<< "4 * $t_fast < $t_slow") -eq 1 ] ||
22603                 error_not_in_vm "fast read was not 4 times faster: " \
22604                            "$t_fast vs $t_slow"
22605
22606         echo "Test 2: verify the performance between big and small read"
22607         $LCTL set_param -n llite.*.fast_read=1
22608
22609         # 1k non-cache read
22610         cancel_lru_locks osc
22611         local t_1k=$(dd if=$DIR/$tfile of=/dev/null bs=1k 2>&1 |
22612                 egrep -o '([[:digit:]\.\,e-]+) s' | cut -d's' -f1 |
22613                 sed -e 's/,/./' -e 's/[eE]+*/\*10\^/')
22614
22615         # 1M non-cache read
22616         cancel_lru_locks osc
22617         local t_1m=$(dd if=$DIR/$tfile of=/dev/null bs=1k 2>&1 |
22618                 egrep -o '([[:digit:]\.\,e-]+) s' | cut -d's' -f1 |
22619                 sed -e 's/,/./' -e 's/[eE]+*/\*10\^/')
22620
22621         # verify that big IO is not 4 times faster than small IO
22622         [ $(bc <<< "4 * $t_1k >= $t_1m") -eq 1 ] ||
22623                 error_not_in_vm "bigger IO is way too fast: $t_1k vs $t_1m"
22624
22625         $LCTL set_param -n llite.*.fast_read=$fast_read_sav
22626         rm -f $DIR/$tfile
22627 }
22628 run_test 248a "fast read verification"
22629
22630 test_248b() {
22631         # Default short_io_bytes=16384, try both smaller and larger sizes.
22632         # Lustre O_DIRECT read and write needs to be a multiple of PAGE_SIZE.
22633         # 6017024 = 2^12*13*113 = 47008*128 = 11752*512 = 4096*1469 = 53248*113
22634         echo "bs=53248 count=113 normal buffered write"
22635         dd if=/dev/urandom of=$TMP/$tfile.0 bs=53248 count=113 ||
22636                 error "dd of initial data file failed"
22637         stack_trap "rm -f $DIR/$tfile.[0-3] $TMP/$tfile.[0-3]" EXIT
22638
22639         echo "bs=47008 count=128 oflag=dsync normal write $tfile.0"
22640         dd if=$TMP/$tfile.0 of=$DIR/$tfile.0 bs=47008 count=128 oflag=dsync ||
22641                 error "dd with sync normal writes failed"
22642         cmp $TMP/$tfile.0 $DIR/$tfile.0 || error "compare $DIR/$tfile.0 failed"
22643
22644         echo "bs=11752 count=512 oflag=dsync small write $tfile.1"
22645         dd if=$TMP/$tfile.0 of=$DIR/$tfile.1 bs=11752 count=512 oflag=dsync ||
22646                 error "dd with sync small writes failed"
22647         cmp $TMP/$tfile.0 $DIR/$tfile.1 || error "compare $DIR/$tfile.1 failed"
22648
22649         cancel_lru_locks osc
22650
22651         # calculate the small O_DIRECT size and count for the client PAGE_SIZE
22652         local num=$((13 * 113 / (PAGE_SIZE / 4096)))
22653         echo "bs=$PAGE_SIZE count=$num iflag=direct small read $tfile.1"
22654         dd if=$DIR/$tfile.1 of=$TMP/$tfile.1 bs=$PAGE_SIZE count=$num \
22655                 iflag=direct || error "dd with O_DIRECT small read failed"
22656         # adjust bytes checked to handle larger PAGE_SIZE for ARM/PPC
22657         cmp --bytes=$((PAGE_SIZE * num)) $TMP/$tfile.0 $TMP/$tfile.1 ||
22658                 error "compare $TMP/$tfile.1 failed"
22659
22660         local save=$($LCTL get_param -n osc.*OST000*.short_io_bytes | head -n 1)
22661         stack_trap "$LCTL set_param osc.$FSNAME-*.short_io_bytes=$save" EXIT
22662
22663         # just to see what the maximum tunable value is, and test parsing
22664         echo "test invalid parameter 2MB"
22665         $LCTL set_param osc.$FSNAME-OST0000*.short_io_bytes=2M &&
22666                 error "too-large short_io_bytes allowed"
22667         echo "test maximum parameter 512KB"
22668         # if we can set a larger short_io_bytes, run test regardless of version
22669         if ! $LCTL set_param osc.$FSNAME-OST0000*.short_io_bytes=512K; then
22670                 # older clients may not allow setting it this large, that's OK
22671                 [ $CLIENT_VERSION -ge $(version_code 2.13.50) ] ||
22672                         skip "Need at least client version 2.13.50"
22673                 error "medium short_io_bytes failed"
22674         fi
22675         $LCTL get_param osc.$FSNAME-OST0000*.short_io_bytes
22676         size=$($LCTL get_param -n osc.$FSNAME-OST0000*.short_io_bytes)
22677
22678         echo "test large parameter 64KB"
22679         $LCTL set_param osc.$FSNAME-*.short_io_bytes=65536
22680         $LCTL get_param osc.$FSNAME-OST0000*.short_io_bytes
22681
22682         echo "bs=47008 count=128 oflag=dsync large write $tfile.2"
22683         dd if=$TMP/$tfile.0 of=$DIR/$tfile.2 bs=47008 count=128 oflag=dsync ||
22684                 error "dd with sync large writes failed"
22685         cmp $TMP/$tfile.0 $DIR/$tfile.2 || error "compare $DIR/$tfile.2 failed"
22686
22687         # calculate the large O_DIRECT size and count for the client PAGE_SIZE
22688         local size=$(((4096 * 13 + PAGE_SIZE - 1) / PAGE_SIZE * PAGE_SIZE))
22689         num=$((113 * 4096 / PAGE_SIZE))
22690         echo "bs=$size count=$num oflag=direct large write $tfile.3"
22691         dd if=$TMP/$tfile.0 of=$DIR/$tfile.3 bs=$size count=$num oflag=direct ||
22692                 error "dd with O_DIRECT large writes failed"
22693         cmp --bytes=$((size * num)) $TMP/$tfile.0 $DIR/$tfile.3 ||
22694                 error "compare $DIR/$tfile.3 failed"
22695
22696         cancel_lru_locks osc
22697
22698         echo "bs=$size count=$num iflag=direct large read $tfile.2"
22699         dd if=$DIR/$tfile.2 of=$TMP/$tfile.2 bs=$size count=$num iflag=direct ||
22700                 error "dd with O_DIRECT large read failed"
22701         cmp --bytes=$((size * num)) $TMP/$tfile.0 $TMP/$tfile.2 ||
22702                 error "compare $TMP/$tfile.2 failed"
22703
22704         echo "bs=$size count=$num iflag=direct large read $tfile.3"
22705         dd if=$DIR/$tfile.3 of=$TMP/$tfile.3 bs=$size count=$num iflag=direct ||
22706                 error "dd with O_DIRECT large read failed"
22707         cmp --bytes=$((size * num)) $TMP/$tfile.0 $TMP/$tfile.3 ||
22708                 error "compare $TMP/$tfile.3 failed"
22709 }
22710 run_test 248b "test short_io read and write for both small and large sizes"
22711
22712 test_249() { # LU-7890
22713         [ $MDS1_VERSION -lt $(version_code 2.8.53) ] &&
22714                 skip "Need at least version 2.8.54"
22715
22716         rm -f $DIR/$tfile
22717         $LFS setstripe -c 1 $DIR/$tfile
22718         # Offset 2T == 4k * 512M
22719         dd if=/dev/zero of=$DIR/$tfile bs=4k count=1 seek=512M ||
22720                 error "dd to 2T offset failed"
22721 }
22722 run_test 249 "Write above 2T file size"
22723
22724 test_250() {
22725         [ "$(facet_fstype ost$(($($LFS getstripe -i $DIR/$tfile) + 1)))" = "zfs" ] \
22726          && skip "no 16TB file size limit on ZFS"
22727
22728         $LFS setstripe -c 1 $DIR/$tfile
22729         # ldiskfs extent file size limit is (16TB - 4KB - 1) bytes
22730         local size=$((16 * 1024 * 1024 * 1024 * 1024 - 4096 - 1))
22731         $TRUNCATE $DIR/$tfile $size || error "truncate $tfile to $size failed"
22732         dd if=/dev/zero of=$DIR/$tfile bs=10 count=1 oflag=append \
22733                 conv=notrunc,fsync && error "append succeeded"
22734         return 0
22735 }
22736 run_test 250 "Write above 16T limit"
22737
22738 test_251() {
22739         $LFS setstripe -c -1 -S 1048576 $DIR/$tfile
22740
22741         #define OBD_FAIL_LLITE_LOST_LAYOUT 0x1407
22742         #Skip once - writing the first stripe will succeed
22743         $LCTL set_param fail_loc=0xa0001407 fail_val=1
22744         $MULTIOP $DIR/$tfile o:O_RDWR:w2097152c 2>&1 | grep -q "short write" &&
22745                 error "short write happened"
22746
22747         $LCTL set_param fail_loc=0xa0001407 fail_val=1
22748         $MULTIOP $DIR/$tfile or2097152c 2>&1 | grep -q "short read" &&
22749                 error "short read happened"
22750
22751         rm -f $DIR/$tfile
22752 }
22753 run_test 251 "Handling short read and write correctly"
22754
22755 test_252() {
22756         remote_mds_nodsh && skip "remote MDS with nodsh"
22757         remote_ost_nodsh && skip "remote OST with nodsh"
22758         if [ "$ost1_FSTYPE" != ldiskfs ] || [ "$mds1_FSTYPE" != ldiskfs ]; then
22759                 skip_env "ldiskfs only test"
22760         fi
22761
22762         local tgt
22763         local dev
22764         local out
22765         local uuid
22766         local num
22767         local gen
22768
22769         # check lr_reader on OST0000
22770         tgt=ost1
22771         dev=$(facet_device $tgt)
22772         out=$(do_facet $tgt $LR_READER $dev)
22773         [ $? -eq 0 ] || error "$LR_READER failed on target $tgt device $dev"
22774         echo "$out"
22775         uuid=$(echo "$out" | grep -i uuid | awk '{ print $2 }')
22776         [ "$uuid" == "$(ostuuid_from_index 0)" ] ||
22777                 error "Invalid uuid returned by $LR_READER on target $tgt"
22778         echo -e "uuid returned by $LR_READER is '$uuid'\n"
22779
22780         # check lr_reader -c on MDT0000
22781         tgt=mds1
22782         dev=$(facet_device $tgt)
22783         if ! do_facet $tgt $LR_READER -h | grep -q OPTIONS; then
22784                 skip "$LR_READER does not support additional options"
22785         fi
22786         out=$(do_facet $tgt $LR_READER -c $dev)
22787         [ $? -eq 0 ] || error "$LR_READER failed on target $tgt device $dev"
22788         echo "$out"
22789         num=$(echo "$out" | grep -c "mdtlov")
22790         [ "$num" -eq $((MDSCOUNT - 1)) ] ||
22791                 error "Invalid number of mdtlov clients returned by $LR_READER"
22792         echo -e "Number of mdtlov clients returned by $LR_READER is '$num'\n"
22793
22794         # check lr_reader -cr on MDT0000
22795         out=$(do_facet $tgt $LR_READER -cr $dev)
22796         [ $? -eq 0 ] || error "$LR_READER failed on target $tgt device $dev"
22797         echo "$out"
22798         echo "$out" | grep -q "^reply_data:$" ||
22799                 error "$LR_READER should have returned 'reply_data' section"
22800         num=$(echo "$out" | grep -c "client_generation")
22801         echo -e "Number of reply data returned by $LR_READER is '$num'\n"
22802 }
22803 run_test 252 "check lr_reader tool"
22804
22805 test_253() {
22806         [ $PARALLEL == "yes" ] && skip "skip parallel run"
22807         remote_mds_nodsh && skip "remote MDS with nodsh"
22808         remote_mgs_nodsh && skip "remote MGS with nodsh"
22809
22810         local ostidx=0
22811         local rc=0
22812         local ost_name=$(ostname_from_index $ostidx)
22813
22814         # on the mdt's osc
22815         local mdtosc_proc1=$(get_mdtosc_proc_path $SINGLEMDS $ost_name)
22816         do_facet $SINGLEMDS $LCTL get_param -n \
22817                 osp.$mdtosc_proc1.reserved_mb_high ||
22818                 skip  "remote MDS does not support reserved_mb_high"
22819
22820         rm -rf $DIR/$tdir
22821         wait_mds_ost_sync
22822         wait_delete_completed
22823         mkdir $DIR/$tdir
22824         stack_trap "rm -rf $DIR/$tdir"
22825
22826         pool_add $TESTNAME || error "Pool creation failed"
22827         pool_add_targets $TESTNAME 0 || error "Pool add targets failed"
22828
22829         $LFS setstripe $DIR/$tdir -i $ostidx -c 1 -p $FSNAME.$TESTNAME ||
22830                 error "Setstripe failed"
22831
22832         dd if=/dev/zero of=$DIR/$tdir/$tfile.0 bs=1M count=10
22833
22834         local wms=$(ost_watermarks_set_enospc $tfile $ostidx |
22835                     grep "watermarks")
22836         stack_trap "ost_watermarks_clear_enospc $tfile $ostidx $wms" EXIT
22837
22838         local oa_status=$(do_facet $SINGLEMDS $LCTL get_param -n \
22839                         osp.$mdtosc_proc1.prealloc_status)
22840         echo "prealloc_status $oa_status"
22841
22842         dd if=/dev/zero of=$DIR/$tdir/$tfile.1 bs=1M count=1 &&
22843                 error "File creation should fail"
22844
22845         #object allocation was stopped, but we still able to append files
22846         dd if=/dev/zero of=$DIR/$tdir/$tfile.0 bs=1M seek=6 count=5 \
22847                 oflag=append || error "Append failed"
22848
22849         rm -f $DIR/$tdir/$tfile.0
22850
22851         # For this test, we want to delete the files we created to go out of
22852         # space but leave the watermark, so we remain nearly out of space
22853         ost_watermarks_enospc_delete_files $tfile $ostidx
22854
22855         wait_delete_completed
22856
22857         sleep_maxage
22858
22859         for i in $(seq 10 12); do
22860                 dd if=/dev/zero of=$DIR/$tdir/$tfile.$i bs=1M count=1 \
22861                         2>/dev/null || error "File creation failed after rm"
22862         done
22863
22864         oa_status=$(do_facet $SINGLEMDS $LCTL get_param -n \
22865                         osp.$mdtosc_proc1.prealloc_status)
22866         echo "prealloc_status $oa_status"
22867
22868         if (( oa_status != 0 )); then
22869                 error "Object allocation still disable after rm"
22870         fi
22871 }
22872 run_test 253 "Check object allocation limit"
22873
22874 test_254() {
22875         [ $PARALLEL == "yes" ] && skip "skip parallel run"
22876         remote_mds_nodsh && skip "remote MDS with nodsh"
22877
22878         local mdt=$(facet_svc $SINGLEMDS)
22879
22880         do_facet $SINGLEMDS $LCTL get_param -n mdd.$mdt.changelog_size ||
22881                 skip "MDS does not support changelog_size"
22882
22883         local cl_user
22884
22885         changelog_register || error "changelog_register failed"
22886
22887         changelog_clear 0 || error "changelog_clear failed"
22888
22889         local size1=$(do_facet $SINGLEMDS \
22890                       $LCTL get_param -n mdd.$mdt.changelog_size)
22891         echo "Changelog size $size1"
22892
22893         rm -rf $DIR/$tdir
22894         $LFS mkdir -i 0 $DIR/$tdir
22895         # change something
22896         mkdir -p $DIR/$tdir/pics/2008/zachy
22897         touch $DIR/$tdir/pics/2008/zachy/timestamp
22898         cp /etc/hosts $DIR/$tdir/pics/2008/zachy/pic1.jpg
22899         mv $DIR/$tdir/pics/2008/zachy $DIR/$tdir/pics/zach
22900         ln $DIR/$tdir/pics/zach/pic1.jpg $DIR/$tdir/pics/2008/portland.jpg
22901         ln -s $DIR/$tdir/pics/2008/portland.jpg $DIR/$tdir/pics/desktop.jpg
22902         rm $DIR/$tdir/pics/desktop.jpg
22903
22904         local size2=$(do_facet $SINGLEMDS \
22905                       $LCTL get_param -n mdd.$mdt.changelog_size)
22906         echo "Changelog size after work $size2"
22907
22908         (( $size2 > $size1 )) ||
22909                 error "new Changelog size=$size2 less than old size=$size1"
22910 }
22911 run_test 254 "Check changelog size"
22912
22913 ladvise_no_type()
22914 {
22915         local type=$1
22916         local file=$2
22917
22918         lfs ladvise -a invalid $file 2>&1 | grep "Valid types" |
22919                 awk -F: '{print $2}' | grep $type > /dev/null
22920         if [ $? -ne 0 ]; then
22921                 return 0
22922         fi
22923         return 1
22924 }
22925
22926 ladvise_no_ioctl()
22927 {
22928         local file=$1
22929
22930         lfs ladvise -a willread $file > /dev/null 2>&1
22931         if [ $? -eq 0 ]; then
22932                 return 1
22933         fi
22934
22935         lfs ladvise -a willread $file 2>&1 |
22936                 grep "Inappropriate ioctl for device" > /dev/null
22937         if [ $? -eq 0 ]; then
22938                 return 0
22939         fi
22940         return 1
22941 }
22942
22943 percent() {
22944         bc <<<"scale=2; ($1 - $2) * 100 / $2"
22945 }
22946
22947 # run a random read IO workload
22948 # usage: random_read_iops <filename> <filesize> <iosize>
22949 random_read_iops() {
22950         local file=$1
22951         local fsize=$2
22952         local iosize=${3:-4096}
22953
22954         $READS -f $file -s $fsize -b $iosize -n $((fsize / iosize)) -t 60 |
22955                 sed -e '/^$/d' -e 's#.*s, ##' -e 's#MB/s##'
22956 }
22957
22958 drop_file_oss_cache() {
22959         local file="$1"
22960         local nodes="$2"
22961
22962         $LFS ladvise -a dontneed $file 2>/dev/null ||
22963                 do_nodes $nodes "echo 3 > /proc/sys/vm/drop_caches"
22964 }
22965
22966 ladvise_willread_performance()
22967 {
22968         local repeat=10
22969         local average_origin=0
22970         local average_cache=0
22971         local average_ladvise=0
22972
22973         for ((i = 1; i <= $repeat; i++)); do
22974                 echo "Iter $i/$repeat: reading without willread hint"
22975                 cancel_lru_locks osc
22976                 drop_file_oss_cache $DIR/$tfile $(comma_list $(osts_nodes))
22977                 local speed_origin=$(random_read_iops $DIR/$tfile $size)
22978                 echo "Iter $i/$repeat: uncached speed: $speed_origin"
22979                 average_origin=$(bc <<<"$average_origin + $speed_origin")
22980
22981                 cancel_lru_locks osc
22982                 local speed_cache=$(random_read_iops $DIR/$tfile $size)
22983                 echo "Iter $i/$repeat: OSS cache speed: $speed_cache"
22984                 average_cache=$(bc <<<"$average_cache + $speed_cache")
22985
22986                 cancel_lru_locks osc
22987                 drop_file_oss_cache $DIR/$tfile $(comma_list $(osts_nodes))
22988                 $LFS ladvise -a willread $DIR/$tfile || error "ladvise failed"
22989                 local speed_ladvise=$(random_read_iops $DIR/$tfile $size)
22990                 echo "Iter $i/$repeat: ladvise speed: $speed_ladvise"
22991                 average_ladvise=$(bc <<<"$average_ladvise + $speed_ladvise")
22992         done
22993         average_origin=$(bc <<<"scale=2; $average_origin / $repeat")
22994         average_cache=$(bc <<<"scale=2; $average_cache / $repeat")
22995         average_ladvise=$(bc <<<"scale=2; $average_ladvise / $repeat")
22996
22997         speedup_cache=$(percent $average_cache $average_origin)
22998         speedup_ladvise=$(percent $average_ladvise $average_origin)
22999
23000         echo "Average uncached read: $average_origin"
23001         echo "Average speedup with OSS cached read: " \
23002                 "$average_cache = +$speedup_cache%"
23003         echo "Average speedup with ladvise willread: " \
23004                 "$average_ladvise = +$speedup_ladvise%"
23005
23006         local lowest_speedup=20
23007         if (( ${average_cache%.*} < $lowest_speedup )); then
23008                 echo "Speedup with OSS cached read less than $lowest_speedup%,"\
23009                      " got $average_cache%. Skipping ladvise willread check."
23010                 return 0
23011         fi
23012
23013         # the test won't work on ZFS until it supports 'ladvise dontneed', but
23014         # it is still good to run until then to exercise 'ladvise willread'
23015         ! $LFS ladvise -a dontneed $DIR/$tfile &&
23016                 [ "$ost1_FSTYPE" = "zfs" ] &&
23017                 echo "osd-zfs does not support dontneed or drop_caches" &&
23018                 return 0
23019
23020         lowest_speedup=$(bc <<<"scale=2; $average_cache / 2")
23021         (( ${average_ladvise%.*} > ${lowest_speedup%.*} )) ||
23022                 error_not_in_vm "Speedup with willread is less than " \
23023                         "$lowest_speedup%, got $average_ladvise%"
23024 }
23025
23026 test_255a() {
23027         [ $OST1_VERSION -lt $(version_code 2.8.54) ] &&
23028                 skip "lustre < 2.8.54 does not support ladvise "
23029         remote_ost_nodsh && skip "remote OST with nodsh"
23030
23031         stack_trap "rm -f $DIR/$tfile"
23032         lfs setstripe -c -1 -i 0 $DIR/$tfile || error "$tfile failed"
23033
23034         ladvise_no_type willread $DIR/$tfile &&
23035                 skip "willread ladvise is not supported"
23036
23037         ladvise_no_ioctl $DIR/$tfile &&
23038                 skip "ladvise ioctl is not supported"
23039
23040         local size_mb=100
23041         local size=$((size_mb * 1048576))
23042         dd if=/dev/zero of=$DIR/$tfile bs=1048576 count=$size_mb ||
23043                 error "dd to $DIR/$tfile failed"
23044
23045         lfs ladvise -a willread $DIR/$tfile ||
23046                 error "Ladvise failed with no range argument"
23047
23048         lfs ladvise -a willread -s 0 $DIR/$tfile ||
23049                 error "Ladvise failed with no -l or -e argument"
23050
23051         lfs ladvise -a willread -e 1 $DIR/$tfile ||
23052                 error "Ladvise failed with only -e argument"
23053
23054         lfs ladvise -a willread -l 1 $DIR/$tfile ||
23055                 error "Ladvise failed with only -l argument"
23056
23057         lfs ladvise -a willread -s 2 -e 1 $DIR/$tfile &&
23058                 error "End offset should not be smaller than start offset"
23059
23060         lfs ladvise -a willread -s 2 -e 2 $DIR/$tfile &&
23061                 error "End offset should not be equal to start offset"
23062
23063         lfs ladvise -a willread -s $size -l 1 $DIR/$tfile ||
23064                 error "Ladvise failed with overflowing -s argument"
23065
23066         lfs ladvise -a willread -s 1 -e $((size + 1)) $DIR/$tfile ||
23067                 error "Ladvise failed with overflowing -e argument"
23068
23069         lfs ladvise -a willread -s 1 -l $size $DIR/$tfile ||
23070                 error "Ladvise failed with overflowing -l argument"
23071
23072         lfs ladvise -a willread -l 1 -e 2 $DIR/$tfile &&
23073                 error "Ladvise succeeded with conflicting -l and -e arguments"
23074
23075         echo "Synchronous ladvise should wait"
23076         local delay=4
23077 #define OBD_FAIL_OST_LADVISE_PAUSE       0x237
23078         do_nodes $(comma_list $(osts_nodes)) \
23079                 $LCTL set_param fail_val=$delay fail_loc=0x237
23080
23081         local start_ts=$SECONDS
23082         lfs ladvise -a willread $DIR/$tfile ||
23083                 error "Ladvise failed with no range argument"
23084         local end_ts=$SECONDS
23085         local inteval_ts=$((end_ts - start_ts))
23086
23087         if [ $inteval_ts -lt $(($delay - 1)) ]; then
23088                 error "Synchronous advice didn't wait reply"
23089         fi
23090
23091         echo "Asynchronous ladvise shouldn't wait"
23092         local start_ts=$SECONDS
23093         lfs ladvise -a willread -b $DIR/$tfile ||
23094                 error "Ladvise failed with no range argument"
23095         local end_ts=$SECONDS
23096         local inteval_ts=$((end_ts - start_ts))
23097
23098         if [ $inteval_ts -gt $(($delay / 2)) ]; then
23099                 error "Asynchronous advice blocked"
23100         fi
23101
23102         do_nodes $(comma_list $(osts_nodes)) $LCTL set_param fail_loc=0
23103         ladvise_willread_performance
23104 }
23105 run_test 255a "check 'lfs ladvise -a willread'"
23106
23107 facet_meminfo() {
23108         local facet=$1
23109         local info=$2
23110
23111         do_facet $facet "cat /proc/meminfo | grep ^${info}:" | awk '{print $2}'
23112 }
23113
23114 test_255b() {
23115         [ $OST1_VERSION -lt $(version_code 2.8.54) ] &&
23116                 skip "lustre < 2.8.54 does not support ladvise "
23117         remote_ost_nodsh && skip "remote OST with nodsh"
23118
23119         stack_trap "rm -f $DIR/$tfile"
23120         lfs setstripe -c 1 -i 0 $DIR/$tfile
23121
23122         ladvise_no_type dontneed $DIR/$tfile &&
23123                 skip "dontneed ladvise is not supported"
23124
23125         ladvise_no_ioctl $DIR/$tfile &&
23126                 skip "ladvise ioctl is not supported"
23127
23128         ! $LFS ladvise -a dontneed $DIR/$tfile &&
23129                 [ "$ost1_FSTYPE" = "zfs" ] &&
23130                 skip "zfs-osd does not support 'ladvise dontneed'"
23131
23132         local size_mb=100
23133         local size=$((size_mb * 1048576))
23134         # In order to prevent disturbance of other processes, only check 3/4
23135         # of the memory usage
23136         local kibibytes=$((size_mb * 1024 * 3 / 4))
23137
23138         dd if=/dev/zero of=$DIR/$tfile bs=1048576 count=$size_mb ||
23139                 error "dd to $DIR/$tfile failed"
23140
23141         #force write to complete before dropping OST cache & checking memory
23142         sync
23143
23144         local total=$(facet_meminfo ost1 MemTotal)
23145         echo "Total memory: $total KiB"
23146
23147         do_facet ost1 "sync && echo 3 > /proc/sys/vm/drop_caches"
23148         local before_read=$(facet_meminfo ost1 Cached)
23149         echo "Cache used before read: $before_read KiB"
23150
23151         lfs ladvise -a willread $DIR/$tfile ||
23152                 error "Ladvise willread failed"
23153         local after_read=$(facet_meminfo ost1 Cached)
23154         echo "Cache used after read: $after_read KiB"
23155
23156         lfs ladvise -a dontneed $DIR/$tfile ||
23157                 error "Ladvise dontneed again failed"
23158         local no_read=$(facet_meminfo ost1 Cached)
23159         echo "Cache used after dontneed ladvise: $no_read KiB"
23160
23161         if [ $total -lt $((before_read + kibibytes)) ]; then
23162                 echo "Memory is too small, abort checking"
23163                 return 0
23164         fi
23165
23166         if [ $((before_read + kibibytes)) -gt $after_read ]; then
23167                 error "Ladvise willread should use more memory" \
23168                         "than $kibibytes KiB"
23169         fi
23170
23171         if [ $((no_read + kibibytes)) -gt $after_read ]; then
23172                 error "Ladvise dontneed should release more memory" \
23173                         "than $kibibytes KiB"
23174         fi
23175 }
23176 run_test 255b "check 'lfs ladvise -a dontneed'"
23177
23178 test_255c() {
23179         [ $OST1_VERSION -lt $(version_code 2.10.50) ] &&
23180                 skip "lustre < 2.10.50 does not support lockahead"
23181
23182         local ost1_imp=$(get_osc_import_name client ost1)
23183         local imp_name=$($LCTL list_param osc.$ost1_imp | head -n1 |
23184                          cut -d'.' -f2)
23185         local count
23186         local new_count
23187         local difference
23188         local i
23189         local rc
23190
23191         test_mkdir -p $DIR/$tdir
23192         $LFS setstripe -i 0 -c 1 $DIR/$tdir
23193
23194         #test 10 returns only success/failure
23195         i=10
23196         lockahead_test -d $DIR/$tdir -t $i -f $tfile
23197         rc=$?
23198         if [ $rc -eq 255 ]; then
23199                 error "Ladvise test${i} failed, ${rc}"
23200         fi
23201
23202         #test 11 counts lock enqueue requests, all others count new locks
23203         i=11
23204         count=$(do_facet ost1 \
23205                 $LCTL get_param -n ost.OSS.ost.stats)
23206         count=$(echo "$count" | grep ldlm_extent_enqueue | awk '{ print $2 }')
23207
23208         lockahead_test -d $DIR/$tdir -t $i -f $tfile
23209         rc=$?
23210         if [ $rc -eq 255 ]; then
23211                 error "Ladvise test${i} failed, ${rc}"
23212         fi
23213
23214         new_count=$(do_facet ost1 \
23215                 $LCTL get_param -n ost.OSS.ost.stats)
23216         new_count=$(echo "$new_count" | grep ldlm_extent_enqueue | \
23217                    awk '{ print $2 }')
23218
23219         difference="$((new_count - count))"
23220         if [ $difference -ne $rc ]; then
23221                 error "Ladvise test${i}, bad enqueue count, returned " \
23222                       "${rc}, actual ${difference}"
23223         fi
23224
23225         for i in $(seq 12 21); do
23226                 # If we do not do this, we run the risk of having too many
23227                 # locks and starting lock cancellation while we are checking
23228                 # lock counts.
23229                 cancel_lru_locks osc
23230
23231                 count=$($LCTL get_param -n \
23232                        ldlm.namespaces.$imp_name.lock_unused_count)
23233
23234                 lockahead_test -d $DIR/$tdir -t $i -f $tfile
23235                 rc=$?
23236                 if [ $rc -eq 255 ]; then
23237                         error "Ladvise test ${i} failed, ${rc}"
23238                 fi
23239
23240                 new_count=$($LCTL get_param -n \
23241                        ldlm.namespaces.$imp_name.lock_unused_count)
23242                 difference="$((new_count - count))"
23243
23244                 # Test 15 output is divided by 100 to map down to valid return
23245                 if [ $i -eq 15 ]; then
23246                         rc="$((rc * 100))"
23247                 fi
23248
23249                 if [ $difference -ne $rc ]; then
23250                         error "Ladvise test ${i}, bad lock count, returned " \
23251                               "${rc}, actual ${difference}"
23252                 fi
23253         done
23254
23255         #test 22 returns only success/failure
23256         i=22
23257         lockahead_test -d $DIR/$tdir -t $i -f $tfile
23258         rc=$?
23259         if [ $rc -eq 255 ]; then
23260                 error "Ladvise test${i} failed, ${rc}"
23261         fi
23262 }
23263 run_test 255c "suite of ladvise lockahead tests"
23264
23265 test_256() {
23266         [ $PARALLEL == "yes" ] && skip "skip parallel run"
23267         remote_mds_nodsh && skip "remote MDS with nodsh"
23268         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip "ldiskfs only test"
23269         changelog_users $SINGLEMDS | grep "^cl" &&
23270                 skip "active changelog user"
23271
23272         local cl_user
23273         local cat_sl
23274         local mdt_dev
23275
23276         mdt_dev=$(facet_device $SINGLEMDS)
23277         echo $mdt_dev
23278
23279         changelog_register || error "changelog_register failed"
23280
23281         rm -rf $DIR/$tdir
23282         mkdir_on_mdt -i$(($(facet_number $SINGLEMDS) - 1)) $DIR/$tdir
23283
23284         changelog_clear 0 || error "changelog_clear failed"
23285
23286         # change something
23287         touch $DIR/$tdir/{1..10}
23288
23289         # stop the MDT
23290         stop $SINGLEMDS || error "Fail to stop MDT"
23291
23292         # remount the MDT
23293         start $SINGLEMDS $(facet_device $SINGLEMDS) $MDS_MOUNT_OPTS ||
23294                 error "Fail to start MDT"
23295
23296         #after mount new plainllog is used
23297         touch $DIR/$tdir/{11..19}
23298         local tmpfile="$(mktemp --tmpdir -u $tfile.XXXXXX)"
23299         stack_trap "rm -f $tmpfile"
23300         cat_sl=$(do_facet $SINGLEMDS "sync; \
23301                  $DEBUGFS -c -R 'dump changelog_catalog $tmpfile' $mdt_dev; \
23302                  llog_reader $tmpfile | grep -c type=1064553b")
23303         do_facet $SINGLEMDS llog_reader $tmpfile
23304
23305         [ $cat_sl != 2 ] && error "Changelog catalog has $cat_sl != 2 slots"
23306
23307         changelog_clear 0 || error "changelog_clear failed"
23308
23309         cat_sl=$(do_facet $SINGLEMDS "sync; \
23310                  $DEBUGFS -c -R 'dump changelog_catalog $tmpfile' $mdt_dev; \
23311                  llog_reader $tmpfile | grep -c type=1064553b")
23312
23313         if (( cat_sl == 2 )); then
23314                 error "Empty plain llog was not deleted from changelog catalog"
23315         elif (( cat_sl != 1 )); then
23316                 error "Active plain llog shouldn't be deleted from catalog"
23317         fi
23318 }
23319 run_test 256 "Check llog delete for empty and not full state"
23320
23321 test_257() {
23322         remote_mds_nodsh && skip "remote MDS with nodsh"
23323         [[ $MDS1_VERSION -lt $(version_code 2.8.55) ]] &&
23324                 skip "Need MDS version at least 2.8.55"
23325
23326         test_mkdir $DIR/$tdir
23327
23328         setfattr -n trusted.name1 -v value1 $DIR/$tdir ||
23329                 error "setfattr -n trusted.name1=value1 $DIR/$tdir failed"
23330         stat $DIR/$tdir
23331
23332 #define OBD_FAIL_MDS_XATTR_REP                  0x161
23333         local mdtidx=$($LFS getstripe -m $DIR/$tdir)
23334         local facet=mds$((mdtidx + 1))
23335         set_nodes_failloc $(facet_active_host $facet) 0x80000161
23336         getfattr -n trusted.name1 $DIR/$tdir 2> /dev/null
23337
23338         stop $facet || error "stop MDS failed"
23339         start $facet $(mdsdevname $((mdtidx + 1))) $MDS_MOUNT_OPTS ||
23340                 error "start MDS fail"
23341         wait_recovery_complete $facet
23342 }
23343 run_test 257 "xattr locks are not lost"
23344
23345 # Verify we take the i_mutex when security requires it
23346 test_258a() {
23347 #define OBD_FAIL_IMUTEX_SEC 0x141c
23348         $LCTL set_param fail_loc=0x141c
23349         touch $DIR/$tfile
23350         chmod u+s $DIR/$tfile
23351         chmod a+rwx $DIR/$tfile
23352         $RUNAS dd if=/dev/zero of=$DIR/$tfile bs=4k count=1 oflag=append
23353         RC=$?
23354         if [ $RC -ne 0 ]; then
23355                 error "error, failed to take i_mutex, rc=$?"
23356         fi
23357         rm -f $DIR/$tfile
23358 }
23359 run_test 258a "verify i_mutex security behavior when suid attributes is set"
23360
23361 # Verify we do NOT take the i_mutex in the normal case
23362 test_258b() {
23363 #define OBD_FAIL_IMUTEX_NOSEC 0x141d
23364         $LCTL set_param fail_loc=0x141d
23365         touch $DIR/$tfile
23366         chmod a+rwx $DIR
23367         chmod a+rw $DIR/$tfile
23368         $RUNAS dd if=/dev/zero of=$DIR/$tfile bs=4k count=1 oflag=append
23369         RC=$?
23370         if [ $RC -ne 0 ]; then
23371                 error "error, took i_mutex unnecessarily, rc=$?"
23372         fi
23373         rm -f $DIR/$tfile
23374
23375 }
23376 run_test 258b "verify i_mutex security behavior"
23377
23378 test_259() {
23379         local file=$DIR/$tfile
23380         local before
23381         local after
23382
23383         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip "ldiskfs only test"
23384
23385         stack_trap "rm -f $file" EXIT
23386
23387         wait_delete_completed
23388         before=$(do_facet ost1 "$LCTL get_param -n osd-*.*OST0000.kbytesfree")
23389         echo "before: $before"
23390
23391         $LFS setstripe -i 0 -c 1 $file
23392         dd if=/dev/zero of=$file bs=1M count=10 || error "couldn't write"
23393         sync_all_data
23394         after=$(do_facet ost1 "$LCTL get_param -n osd-*.*OST0000.kbytesfree")
23395         echo "after write: $after"
23396
23397 #define OBD_FAIL_OSD_FAIL_AT_TRUNCATE          0x2301
23398         do_facet ost1 $LCTL set_param fail_loc=0x2301
23399         $TRUNCATE $file 0
23400         after=$(do_facet ost1 "$LCTL get_param -n osd-*.*OST0000.kbytesfree")
23401         echo "after truncate: $after"
23402
23403         stop ost1
23404         do_facet ost1 $LCTL set_param fail_loc=0
23405         start ost1 $(ostdevname 1) $OST_MOUNT_OPTS || error "cannot start ost1"
23406         sleep 2
23407         after=$(do_facet ost1 "$LCTL get_param -n osd-*.*OST0000.kbytesfree")
23408         echo "after restart: $after"
23409         [ $((after - before)) -ge $(fs_log_size ost1) ] &&
23410                 error "missing truncate?"
23411
23412         return 0
23413 }
23414 run_test 259 "crash at delayed truncate"
23415
23416 test_260() {
23417 #define OBD_FAIL_MDC_CLOSE               0x806
23418         $LCTL set_param fail_loc=0x80000806
23419         touch $DIR/$tfile
23420
23421 }
23422 run_test 260 "Check mdc_close fail"
23423
23424 ### Data-on-MDT sanity tests ###
23425 test_270a() {
23426         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23427                 skip "Need MDS version at least 2.10.55 for DoM"
23428
23429         # create DoM file
23430         local dom=$DIR/$tdir/dom_file
23431         local tmp=$DIR/$tdir/tmp_file
23432
23433         mkdir_on_mdt0 $DIR/$tdir
23434
23435         # basic checks for DoM component creation
23436         $LFS setstripe -E 1024K -E 2048K -L mdt $dom 2>/dev/null &&
23437                 error "Can set MDT layout to non-first entry"
23438
23439         $LFS setstripe -E 1024K -L mdt -E 2048K -L mdt $dom 2>/dev/null &&
23440                 error "Can define multiple entries as MDT layout"
23441
23442         $LFS setstripe -E 1M -L mdt $dom || error "Can't create DoM layout"
23443
23444         [ $($LFS getstripe -L $dom) == "mdt" ] || error "bad pattern"
23445         [ $($LFS getstripe -c $dom) == 0 ] || error "bad stripe count"
23446         [ $($LFS getstripe -S $dom) == 1048576 ] || error "bad stripe size"
23447
23448         local mdtidx=$($LFS getstripe -m $dom)
23449         local mdtname=MDT$(printf %04x $mdtidx)
23450         local facet=mds$((mdtidx + 1))
23451         local space_check=1
23452
23453         # Skip free space checks with ZFS
23454         [ "$(facet_fstype $facet)" == "zfs" ] && space_check=0
23455
23456         # write
23457         sync
23458         local size_tmp=$((65536 * 3))
23459         local mdtfree1=$(do_facet $facet \
23460                          lctl get_param -n osd*.*$mdtname.kbytesfree)
23461
23462         dd if=/dev/urandom of=$tmp bs=1024 count=$((size_tmp / 1024))
23463         # check also direct IO along write
23464         # IO size must be a multiple of PAGE_SIZE on all platforms (ARM=64KB)
23465         dd if=$tmp of=$dom bs=65536 count=$((size_tmp / 65536)) oflag=direct
23466         sync
23467         cmp $tmp $dom || error "file data is different"
23468         [ $(stat -c%s $dom) == $size_tmp ] ||
23469                 error "bad size after write: $(stat -c%s $dom) != $size_tmp"
23470         if [ $space_check == 1 ]; then
23471                 local mdtfree2=$(do_facet $facet \
23472                                  lctl get_param -n osd*.*$mdtname.kbytesfree)
23473
23474                 # increase in usage from by $size_tmp
23475                 [ $(($mdtfree1 - $mdtfree2)) -ge $((size_tmp / 1024)) ] ||
23476                         error "MDT free space wrong after write: " \
23477                               "$mdtfree1 >= $mdtfree2 + $size_tmp/1024"
23478         fi
23479
23480         # truncate
23481         local size_dom=10000
23482
23483         $TRUNCATE $dom $size_dom
23484         [ $(stat -c%s $dom) == $size_dom ] ||
23485                 error "bad size after truncate: $(stat -c%s $dom) != $size_dom"
23486         if [ $space_check == 1 ]; then
23487                 mdtfree1=$(do_facet $facet \
23488                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
23489                 # decrease in usage from $size_tmp to new $size_dom
23490                 [ $(($mdtfree1 - $mdtfree2)) -ge \
23491                   $(((size_tmp - size_dom) / 1024)) ] ||
23492                         error "MDT free space is wrong after truncate: " \
23493                               "$mdtfree1 >= $mdtfree2 + ($size_tmp - $size_dom) / 1024"
23494         fi
23495
23496         # append
23497         cat $tmp >> $dom
23498         sync
23499         size_dom=$((size_dom + size_tmp))
23500         [ $(stat -c%s $dom) == $size_dom ] ||
23501                 error "bad size after append: $(stat -c%s $dom) != $size_dom"
23502         if [ $space_check == 1 ]; then
23503                 mdtfree2=$(do_facet $facet \
23504                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
23505                 # increase in usage by $size_tmp from previous
23506                 [ $(($mdtfree1 - $mdtfree2)) -ge $((size_tmp / 1024)) ] ||
23507                         error "MDT free space is wrong after append: " \
23508                               "$mdtfree1 >= $mdtfree2 + $size_tmp/1024"
23509         fi
23510
23511         # delete
23512         rm $dom
23513         if [ $space_check == 1 ]; then
23514                 mdtfree1=$(do_facet $facet \
23515                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
23516                 # decrease in usage by $size_dom from previous
23517                 [ $(($mdtfree1 - $mdtfree2)) -ge $((size_dom / 1024)) ] ||
23518                         error "MDT free space is wrong after removal: " \
23519                               "$mdtfree1 >= $mdtfree2 + $size_dom/1024"
23520         fi
23521
23522         # combined striping
23523         $LFS setstripe -E 1024K -L mdt -E EOF $dom ||
23524                 error "Can't create DoM + OST striping"
23525
23526         size_tmp=2031616 # must be a multiple of PAGE_SIZE=65536 on ARM
23527         dd if=/dev/urandom of=$tmp bs=1024 count=$((size_tmp / 1024))
23528         # check also direct IO along write
23529         dd if=$tmp of=$dom bs=65536 count=$((size_tmp / 65536)) oflag=direct
23530         sync
23531         cmp $tmp $dom || error "file data is different"
23532         [ $(stat -c%s $dom) == $size_tmp ] ||
23533                 error "bad size after write: $(stat -c%s $dom) != $size_tmp"
23534         rm $dom $tmp
23535
23536         return 0
23537 }
23538 run_test 270a "DoM: basic functionality tests"
23539
23540 test_270b() {
23541         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23542                 skip "Need MDS version at least 2.10.55"
23543
23544         local dom=$DIR/$tdir/dom_file
23545         local max_size=1048576
23546
23547         mkdir -p $DIR/$tdir
23548         $LFS setstripe -E $max_size -L mdt $dom
23549
23550         # truncate over the limit
23551         $TRUNCATE $dom $(($max_size + 1)) &&
23552                 error "successful truncate over the maximum size"
23553         # write over the limit
23554         dd if=/dev/zero of=$dom bs=$max_size seek=1 count=1 &&
23555                 error "successful write over the maximum size"
23556         # append over the limit
23557         dd if=/dev/zero of=$dom bs=$(($max_size - 3)) count=1
23558         echo "12345" >> $dom && error "successful append over the maximum size"
23559         rm $dom
23560
23561         return 0
23562 }
23563 run_test 270b "DoM: maximum size overflow checks for DoM-only file"
23564
23565 test_270c() {
23566         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23567                 skip "Need MDS version at least 2.10.55"
23568
23569         mkdir -p $DIR/$tdir
23570         $LFS setstripe -E 1024K -L mdt $DIR/$tdir
23571
23572         # check files inherit DoM EA
23573         touch $DIR/$tdir/first
23574         [ $($LFS getstripe -L $DIR/$tdir/first) == "mdt" ] ||
23575                 error "bad pattern"
23576         [ $($LFS getstripe -c $DIR/$tdir/first) == 0 ] ||
23577                 error "bad stripe count"
23578         [ $($LFS getstripe -S $DIR/$tdir/first) == 1048576 ] ||
23579                 error "bad stripe size"
23580
23581         # check directory inherits DoM EA and uses it as default
23582         mkdir $DIR/$tdir/subdir
23583         touch $DIR/$tdir/subdir/second
23584         [ $($LFS getstripe -L $DIR/$tdir/subdir/second) == "mdt" ] ||
23585                 error "bad pattern in sub-directory"
23586         [ $($LFS getstripe -c $DIR/$tdir/subdir/second) == 0 ] ||
23587                 error "bad stripe count in sub-directory"
23588         [ $($LFS getstripe -S $DIR/$tdir/subdir/second) == 1048576 ] ||
23589                 error "bad stripe size in sub-directory"
23590         return 0
23591 }
23592 run_test 270c "DoM: DoM EA inheritance tests"
23593
23594 test_270d() {
23595         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23596                 skip "Need MDS version at least 2.10.55"
23597
23598         mkdir -p $DIR/$tdir
23599         $LFS setstripe -E 1024K -L mdt $DIR/$tdir
23600
23601         # inherit default DoM striping
23602         mkdir $DIR/$tdir/subdir
23603         touch $DIR/$tdir/subdir/f1
23604
23605         # change default directory striping
23606         $LFS setstripe -c 1 $DIR/$tdir/subdir
23607         touch $DIR/$tdir/subdir/f2
23608         [ $($LFS getstripe -c $DIR/$tdir/subdir/f2) == 1 ] ||
23609                 error "wrong default striping in file 2"
23610         [ $($LFS getstripe -L $DIR/$tdir/subdir/f2) == "raid0" ] ||
23611                 error "bad pattern in file 2"
23612         return 0
23613 }
23614 run_test 270d "DoM: change striping from DoM to RAID0"
23615
23616 test_270e() {
23617         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23618                 skip "Need MDS version at least 2.10.55"
23619
23620         mkdir -p $DIR/$tdir/dom
23621         mkdir -p $DIR/$tdir/norm
23622         DOMFILES=20
23623         NORMFILES=10
23624         $LFS setstripe -E 1M -L mdt $DIR/$tdir/dom
23625         $LFS setstripe -i 0 -S 2M $DIR/$tdir/norm
23626
23627         createmany -o $DIR/$tdir/dom/dom- $DOMFILES
23628         createmany -o $DIR/$tdir/norm/norm- $NORMFILES
23629
23630         # find DoM files by layout
23631         NUM=$($LFS find -L mdt -type f $DIR/$tdir 2>/dev/null | wc -l)
23632         [ $NUM -eq  $DOMFILES ] ||
23633                 error "lfs find -L: found $NUM, expected $DOMFILES"
23634         echo "Test 1: lfs find 20 DOM files by layout: OK"
23635
23636         # there should be 1 dir with default DOM striping
23637         NUM=$($LFS find -L mdt -type d $DIR/$tdir 2>/dev/null | wc -l)
23638         [ $NUM -eq  1 ] ||
23639                 error "lfs find -L: found $NUM, expected 1 dir"
23640         echo "Test 2: lfs find 1 DOM dir by layout: OK"
23641
23642         # find DoM files by stripe size
23643         NUM=$($LFS find -S -1200K -type f $DIR/$tdir 2>/dev/null | wc -l)
23644         [ $NUM -eq  $DOMFILES ] ||
23645                 error "lfs find -S: found $NUM, expected $DOMFILES"
23646         echo "Test 4: lfs find 20 DOM files by stripe size: OK"
23647
23648         # find files by stripe offset except DoM files
23649         NUM=$($LFS find -i 0 -type f $DIR/$tdir 2>/dev/null | wc -l)
23650         [ $NUM -eq  $NORMFILES ] ||
23651                 error "lfs find -i: found $NUM, expected $NORMFILES"
23652         echo "Test 5: lfs find no DOM files by stripe index: OK"
23653         return 0
23654 }
23655 run_test 270e "DoM: lfs find with DoM files test"
23656
23657 test_270f() {
23658         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23659                 skip "Need MDS version at least 2.10.55"
23660
23661         local mdtname=${FSNAME}-MDT0000-mdtlov
23662         local dom=$DIR/$tdir/dom_file
23663         local dom_limit_saved=$(do_facet mds1 $LCTL get_param -n \
23664                                                 lod.$mdtname.dom_stripesize)
23665         local dom_limit=131072
23666
23667         do_facet mds1 $LCTL set_param -n lod.$mdtname.dom_stripesize=$dom_limit
23668         local dom_current=$(do_facet mds1 $LCTL get_param -n \
23669                                                 lod.$mdtname.dom_stripesize)
23670         [ ${dom_limit} -eq ${dom_current} ] ||
23671                 error "Cannot change per-MDT DoM stripe limit to $dom_limit"
23672
23673         $LFS mkdir -i 0 -c 1 $DIR/$tdir
23674         $LFS setstripe -d $DIR/$tdir
23675         $LFS setstripe -E $dom_limit -L mdt $DIR/$tdir ||
23676                 error "Can't set directory default striping"
23677
23678         # exceed maximum stripe size
23679         $LFS setstripe -E $((dom_limit * 2)) -L mdt $dom ||
23680                 error "Can't create file with $((dom_limit * 2)) DoM stripe"
23681         [ $($LFS getstripe -S $dom) -eq $((dom_limit * 2)) ] &&
23682                 error "Able to create DoM component size more than LOD limit"
23683
23684         do_facet mds1 $LCTL set_param -n lod.$mdtname.dom_stripesize=0
23685         dom_current=$(do_facet mds1 $LCTL get_param -n \
23686                                                 lod.$mdtname.dom_stripesize)
23687         [ 0 -eq ${dom_current} ] ||
23688                 error "Can't set zero DoM stripe limit"
23689         rm $dom
23690
23691         # attempt to create DoM file on server with disabled DoM should
23692         # remove DoM entry from layout and be succeed
23693         $LFS setstripe -E $dom_limit -L mdt -E -1 $dom ||
23694                 error "Can't create DoM file (DoM is disabled)"
23695         [ $($LFS getstripe -L $dom) == "mdt" ] &&
23696                 error "File has DoM component while DoM is disabled"
23697         rm $dom
23698
23699         # attempt to create DoM file with only DoM stripe should return error
23700         $LFS setstripe -E $dom_limit -L mdt $dom &&
23701                 error "Able to create DoM-only file while DoM is disabled"
23702
23703         # too low values to be aligned with smallest stripe size 64K
23704         do_facet mds1 $LCTL set_param -n lod.$mdtname.dom_stripesize=30000
23705         dom_current=$(do_facet mds1 $LCTL get_param -n \
23706                                                 lod.$mdtname.dom_stripesize)
23707         [ 30000 -eq ${dom_current} ] &&
23708                 error "Can set too small DoM stripe limit"
23709
23710         # 64K is a minimal stripe size in Lustre, expect limit of that size
23711         [ 65536 -eq ${dom_current} ] ||
23712                 error "Limit is not set to 64K but ${dom_current}"
23713
23714         do_facet mds1 $LCTL set_param -n lod.$mdtname.dom_stripesize=2147483648
23715         dom_current=$(do_facet mds1 $LCTL get_param -n \
23716                                                 lod.$mdtname.dom_stripesize)
23717         echo $dom_current
23718         [ 2147483648 -eq ${dom_current} ] &&
23719                 error "Can set too large DoM stripe limit"
23720
23721         do_facet mds1 $LCTL set_param -n \
23722                                 lod.$mdtname.dom_stripesize=$((dom_limit * 2))
23723         $LFS setstripe -E $((dom_limit * 2)) -L mdt $dom ||
23724                 error "Can't create DoM component size after limit change"
23725         do_facet mds1 $LCTL set_param -n \
23726                                 lod.$mdtname.dom_stripesize=$((dom_limit / 2))
23727         $LFS setstripe -E $dom_limit -L mdt ${dom}_big ||
23728                 error "Can't create DoM file after limit decrease"
23729         [ $($LFS getstripe -S ${dom}_big) -eq $((dom_limit / 2)) ] ||
23730                 error "Can create big DoM component after limit decrease"
23731         touch ${dom}_def ||
23732                 error "Can't create file with old default layout"
23733
23734         do_facet mds1 $LCTL set_param -n lod.*.dom_stripesize=$dom_limit_saved
23735         return 0
23736 }
23737 run_test 270f "DoM: maximum DoM stripe size checks"
23738
23739 test_270g() {
23740         [ $MDS1_VERSION -ge $(version_code 2.13.52) ] ||
23741                 skip "Need MDS version at least 2.13.52"
23742         local dom=$DIR/$tdir/$tfile
23743
23744         $LFS mkdir -i 0 -c 1 $DIR/$tdir
23745         local lodname=${FSNAME}-MDT0000-mdtlov
23746
23747         local save="$TMP/$TESTSUITE-$TESTNAME.parameters"
23748         save_lustre_params mds1 "lod.${lodname}.dom_stripesize_max_kb" > $save
23749         save_lustre_params mds1 "lod.${lodname}.dom_threshold_free_mb" >> $save
23750         stack_trap "restore_lustre_params < $save; rm -f $save" EXIT
23751
23752         local dom_limit=1024
23753         local dom_threshold="50%"
23754
23755         $LFS setstripe -d $DIR/$tdir
23756         $LFS setstripe -E ${dom_limit}K -L mdt $DIR/$tdir ||
23757                 error "Can't set directory default striping"
23758
23759         do_facet mds1 $LCTL set_param -n \
23760                                 lod.${lodname}.dom_stripesize_max_kb=$dom_limit
23761         # set 0 threshold and create DOM file to change tunable stripesize
23762         do_facet mds1 $LCTL set_param -n lod.${lodname}.dom_threshold_free_mb=0
23763         $LFS setstripe -E ${dom_limit}K -L mdt -E -1 $dom ||
23764                 error "Failed to create $dom file"
23765         # now tunable dom_cur_stripesize should reach maximum
23766         local dom_current=$(do_facet mds1 $LCTL get_param -n \
23767                                         lod.${lodname}.dom_stripesize_cur_kb)
23768         [[ $dom_current == $dom_limit ]] ||
23769                 error "Current DOM stripesize is not maximum"
23770         rm $dom
23771
23772         # set threshold for further tests
23773         do_facet mds1 $LCTL set_param -n \
23774                         lod.${lodname}.dom_threshold_free_mb=$dom_threshold
23775         echo "DOM threshold is $dom_threshold free space"
23776         local dom_def
23777         local dom_set
23778         # Spoof bfree to exceed threshold
23779         #define OBD_FAIL_MDS_STATFS_SPOOF   0x168
23780         do_facet mds1 $LCTL set_param -n fail_loc=0x0168
23781         for spfree in 40 20 0 15 30 55; do
23782                 do_facet mds1 $LCTL set_param -n fail_val=$spfree
23783                 $LFS setstripe -E ${dom_limit}K -L mdt -E -1 $dom ||
23784                         error "Failed to create $dom file"
23785                 dom_def=$(do_facet mds1 $LCTL get_param -n \
23786                                         lod.${lodname}.dom_stripesize_cur_kb)
23787                 echo "Free space: ${spfree}%, default DOM stripe: ${dom_def}K"
23788                 [[ $dom_def != $dom_current ]] ||
23789                         error "Default stripe size was not changed"
23790                 if (( spfree > 0 )) ; then
23791                         dom_set=$($LFS getstripe -S $dom)
23792                         (( dom_set == dom_def * 1024 )) ||
23793                                 error "DOM component size is still old"
23794                 else
23795                         [[ $($LFS getstripe -L $dom) != "mdt" ]] ||
23796                                 error "DoM component is set with no free space"
23797                 fi
23798                 rm $dom
23799                 dom_current=$dom_def
23800         done
23801 }
23802 run_test 270g "DoM: default DoM stripe size depends on free space"
23803
23804 test_270h() {
23805         [[ $MDS1_VERSION -ge $(version_code 2.13.53) ]] ||
23806                 skip "Need MDS version at least 2.13.53"
23807
23808         local mdtname=${FSNAME}-MDT0000-mdtlov
23809         local dom=$DIR/$tdir/$tfile
23810         local save="$TMP/$TESTSUITE-$TESTNAME.parameters"
23811
23812         save_lustre_params mds1 "lod.*.dom_stripesize" > $save
23813         stack_trap "restore_lustre_params < $save; rm -f $save" EXIT
23814
23815         $LFS mkdir -i 0 -c 1 $DIR/$tdir
23816         $LFS setstripe -E 1M -c1  -E -1 -c2 ${dom}_1 ||
23817                 error "can't create OST file"
23818         # mirrored file with DOM entry in the second mirror
23819         $LFS mirror extend -N -E 1M -L mdt -E eof -c2 ${dom}_1 ||
23820                 error "can't create mirror with DoM component"
23821
23822         do_facet mds1 $LCTL set_param -n lod.$mdtname.dom_stripesize=0
23823
23824         # DOM component in the middle and has other enries in the same mirror,
23825         # should succeed but lost DoM component
23826         $LFS setstripe --copy=${dom}_1 $dom ||
23827                 error "Can't create file from OST|DOM mirror layout"
23828         # check new file has no DoM layout after all
23829         [[ $($LFS getstripe -L $dom) != "mdt" ]] ||
23830                 error "File has DoM component while DoM is disabled"
23831 }
23832 run_test 270h "DoM: DoM stripe removal when disabled on server"
23833
23834 test_270i() {
23835         (( $MDS1_VERSION >= $(version_code 2.14.54) )) ||
23836                 skip "Need MDS version at least 2.14.54"
23837
23838         mkdir $DIR/$tdir
23839         # DoM with plain layout
23840         $LFS setstripe -L mdt -S 128k -c -1 $DIR/$tdir &&
23841                 error "default plain layout with DoM must fail"
23842         $LFS setstripe -L mdt -S 128k -c -1 $DIR/$tdir/$tfile &&
23843                 error "setstripe plain file layout with DoM must fail"
23844         $LFS setstripe -E 1M -L mdt -S 128k -c -1 -E eof $DIR/$tdir &&
23845                 error "default DoM layout with bad striping must fail"
23846         $LFS setstripe -E 1M -L mdt -S 128k -c -1 -E eof $DIR/$tdir/$tfile &&
23847                 error "setstripe to DoM layout with bad striping must fail"
23848         return 0
23849 }
23850 run_test 270i "DoM: setting invalid DoM striping should fail"
23851
23852 test_271a() {
23853         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23854                 skip "Need MDS version at least 2.10.55"
23855
23856         local dom=$DIR/$tdir/dom
23857
23858         mkdir -p $DIR/$tdir
23859
23860         $LFS setstripe -E 1024K -L mdt $dom
23861
23862         lctl set_param -n mdc.*.stats=clear
23863         dd if=/dev/zero of=$dom bs=4096 count=1 || return 1
23864         cat $dom > /dev/null
23865         local reads=$(lctl get_param -n mdc.*.stats | grep -c ost_read)
23866         [ $reads -eq 0 ] || error "Unexpected $reads READ RPCs"
23867         ls $dom
23868         rm -f $dom
23869 }
23870 run_test 271a "DoM: data is cached for read after write"
23871
23872 test_271b() {
23873         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23874                 skip "Need MDS version at least 2.10.55"
23875
23876         local dom=$DIR/$tdir/dom
23877
23878         mkdir -p $DIR/$tdir
23879
23880         $LFS setstripe -E 1024K -L mdt -E EOF $dom
23881
23882         lctl set_param -n mdc.*.stats=clear
23883         dd if=/dev/zero of=$dom bs=4096 count=1 || return 1
23884         cancel_lru_locks mdc
23885         $CHECKSTAT -t file -s 4096 $dom || error "stat #1 fails"
23886         # second stat to check size is cached on client
23887         $CHECKSTAT -t file -s 4096 $dom || error "stat #2 fails"
23888         local gls=$(lctl get_param -n mdc.*.stats | grep -c ldlm_glimpse)
23889         [ $gls -eq 0 ] || error "Unexpected $gls glimpse RPCs"
23890         rm -f $dom
23891 }
23892 run_test 271b "DoM: no glimpse RPC for stat (DoM only file)"
23893
23894 test_271ba() {
23895         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23896                 skip "Need MDS version at least 2.10.55"
23897
23898         local dom=$DIR/$tdir/dom
23899
23900         mkdir -p $DIR/$tdir
23901
23902         $LFS setstripe -E 1024K -L mdt -E EOF $dom
23903
23904         lctl set_param -n mdc.*.stats=clear
23905         lctl set_param -n osc.*.stats=clear
23906         dd if=/dev/zero of=$dom bs=2048K count=1 || return 1
23907         cancel_lru_locks mdc
23908         $CHECKSTAT -t file -s 2097152 $dom || error "stat"
23909         # second stat to check size is cached on client
23910         $CHECKSTAT -t file -s 2097152 $dom || error "stat"
23911         local gls=$(lctl get_param -n mdc.*.stats | grep -c ldlm_glimpse)
23912         [ $gls == 0 ] || error "Unexpected $gls glimpse RPCs"
23913         local gls=$(lctl get_param -n osc.*.stats | grep -c ldlm_glimpse)
23914         [ $gls == 0 ] || error "Unexpected $gls OSC glimpse RPCs"
23915         rm -f $dom
23916 }
23917 run_test 271ba "DoM: no glimpse RPC for stat (combined file)"
23918
23919
23920 get_mdc_stats() {
23921         local mdtidx=$1
23922         local param=$2
23923         local mdt=MDT$(printf %04x $mdtidx)
23924
23925         if [ -z $param ]; then
23926                 lctl get_param -n mdc.*$mdt*.stats
23927         else
23928                 lctl get_param -n mdc.*$mdt*.stats | awk "/$param/"'{print $2}'
23929         fi
23930 }
23931
23932 test_271c() {
23933         [ $MDS1_VERSION -lt $(version_code 2.10.55) ] &&
23934                 skip "Need MDS version at least 2.10.55"
23935
23936         local dom=$DIR/$tdir/dom
23937
23938         mkdir -p $DIR/$tdir
23939
23940         $LFS setstripe -E 1024K -L mdt $DIR/$tdir
23941
23942         local mdtidx=$($LFS getstripe -m $DIR/$tdir)
23943         local facet=mds$((mdtidx + 1))
23944
23945         cancel_lru_locks mdc
23946         do_facet $facet lctl set_param -n mdt.*.dom_lock=0
23947         createmany -o $dom 1000
23948         lctl set_param -n mdc.*.stats=clear
23949         smalliomany -w $dom 1000 200
23950         get_mdc_stats $mdtidx
23951         local enq=$(get_mdc_stats $mdtidx ldlm_ibits_enqueue)
23952         # Each file has 1 open, 1 IO enqueues, total 2000
23953         # but now we have also +1 getxattr for security.capability, total 3000
23954         [ $enq -ge 2000 ] || error "Too few enqueues $enq, expected > 2000"
23955         unlinkmany $dom 1000
23956
23957         cancel_lru_locks mdc
23958         do_facet $facet lctl set_param -n mdt.*.dom_lock=1
23959         createmany -o $dom 1000
23960         lctl set_param -n mdc.*.stats=clear
23961         smalliomany -w $dom 1000 200
23962         local enq_2=$(get_mdc_stats $mdtidx ldlm_ibits_enqueue)
23963         # Expect to see reduced amount of RPCs by 1000 due to single enqueue
23964         # for OPEN and IO lock.
23965         [ $((enq - enq_2)) -ge 1000 ] ||
23966                 error "Too many enqueues $enq_2, expected about $((enq - 1000))"
23967         unlinkmany $dom 1000
23968         return 0
23969 }
23970 run_test 271c "DoM: IO lock at open saves enqueue RPCs"
23971
23972 cleanup_271def_tests() {
23973         trap 0
23974         rm -f $1
23975 }
23976
23977 test_271d() {
23978         [ $MDS1_VERSION -lt $(version_code 2.10.57) ] &&
23979                 skip "Need MDS version at least 2.10.57"
23980
23981         local dom=$DIR/$tdir/dom
23982         local tmp=$TMP/$tfile
23983         trap "cleanup_271def_tests $tmp" EXIT
23984
23985         mkdir -p $DIR/$tdir
23986
23987         $LFS setstripe -E 1024K -L mdt $DIR/$tdir
23988
23989         local mdtidx=$($LFS getstripe --mdt-index $DIR/$tdir)
23990
23991         cancel_lru_locks mdc
23992         dd if=/dev/urandom of=$tmp bs=1000 count=1
23993         dd if=$tmp of=$dom bs=1000 count=1
23994         cancel_lru_locks mdc
23995
23996         cat /etc/hosts >> $tmp
23997         lctl set_param -n mdc.*.stats=clear
23998
23999         # append data to the same file it should update local page
24000         echo "Append to the same page"
24001         cat /etc/hosts >> $dom
24002         local num=$(get_mdc_stats $mdtidx ost_read)
24003         local ra=$(get_mdc_stats $mdtidx req_active)
24004         local rw=$(get_mdc_stats $mdtidx req_waittime)
24005
24006         [ -z $num ] || error "$num READ RPC occured"
24007         [ $ra == $rw ] || error "$((ra - rw)) resend occured"
24008         echo "... DONE"
24009
24010         # compare content
24011         cmp $tmp $dom || error "file miscompare"
24012
24013         cancel_lru_locks mdc
24014         lctl set_param -n mdc.*.stats=clear
24015
24016         echo "Open and read file"
24017         cat $dom > /dev/null
24018         local num=$(get_mdc_stats $mdtidx ost_read)
24019         local ra=$(get_mdc_stats $mdtidx req_active)
24020         local rw=$(get_mdc_stats $mdtidx req_waittime)
24021
24022         [ -z $num ] || error "$num READ RPC occured"
24023         [ $ra == $rw ] || error "$((ra - rw)) resend occured"
24024         echo "... DONE"
24025
24026         # compare content
24027         cmp $tmp $dom || error "file miscompare"
24028
24029         return 0
24030 }
24031 run_test 271d "DoM: read on open (1K file in reply buffer)"
24032
24033 test_271f() {
24034         [ $MDS1_VERSION -lt $(version_code 2.10.57) ] &&
24035                 skip "Need MDS version at least 2.10.57"
24036
24037         local dom=$DIR/$tdir/dom
24038         local tmp=$TMP/$tfile
24039         trap "cleanup_271def_tests $tmp" EXIT
24040
24041         mkdir -p $DIR/$tdir
24042
24043         $LFS setstripe -E 1024K -L mdt $DIR/$tdir
24044
24045         local mdtidx=$($LFS getstripe --mdt-index $DIR/$tdir)
24046
24047         cancel_lru_locks mdc
24048         dd if=/dev/urandom of=$tmp bs=265000 count=1
24049         dd if=$tmp of=$dom bs=265000 count=1
24050         cancel_lru_locks mdc
24051         cat /etc/hosts >> $tmp
24052         lctl set_param -n mdc.*.stats=clear
24053
24054         echo "Append to the same page"
24055         cat /etc/hosts >> $dom
24056         local num=$(get_mdc_stats $mdtidx ost_read)
24057         local ra=$(get_mdc_stats $mdtidx req_active)
24058         local rw=$(get_mdc_stats $mdtidx req_waittime)
24059
24060         [ -z $num ] || error "$num READ RPC occured"
24061         [ $ra == $rw ] || error "$((ra - rw)) resend occured"
24062         echo "... DONE"
24063
24064         # compare content
24065         cmp $tmp $dom || error "file miscompare"
24066
24067         cancel_lru_locks mdc
24068         lctl set_param -n mdc.*.stats=clear
24069
24070         echo "Open and read file"
24071         cat $dom > /dev/null
24072         local num=$(get_mdc_stats $mdtidx ost_read)
24073         local ra=$(get_mdc_stats $mdtidx req_active)
24074         local rw=$(get_mdc_stats $mdtidx req_waittime)
24075
24076         [ -z $num ] && num=0
24077         [ $num -eq 1 ] || error "expect 1 READ RPC, $num occured"
24078         [ $ra == $rw ] || error "$((ra - rw)) resend occured"
24079         echo "... DONE"
24080
24081         # compare content
24082         cmp $tmp $dom || error "file miscompare"
24083
24084         return 0
24085 }
24086 run_test 271f "DoM: read on open (200K file and read tail)"
24087
24088 test_271g() {
24089         [[ $($LCTL get_param mdc.*.import) =~ async_discard ]] ||
24090                 skip "Skipping due to old client or server version"
24091
24092         $LFS setstripe -E 1024K -L mdt -E EOF $DIR1/$tfile
24093         # to get layout
24094         $CHECKSTAT -t file $DIR1/$tfile
24095
24096         $MULTIOP $DIR1/$tfile Ow40960_w4096c &
24097         MULTIOP_PID=$!
24098         sleep 1
24099         #define OBD_FAIL_LDLM_CANCEL_BL_CB_RACE
24100         $LCTL set_param fail_loc=0x80000314
24101         rm $DIR1/$tfile || error "Unlink fails"
24102         RC=$?
24103         kill -USR1 $MULTIOP_PID && wait $MULTIOP_PID || error "multiop failure"
24104         [ $RC -eq 0 ] || error "Failed write to stale object"
24105 }
24106 run_test 271g "Discard DoM data vs client flush race"
24107
24108 test_272a() {
24109         [ $MDS1_VERSION -lt $(version_code 2.11.50) ] &&
24110                 skip "Need MDS version at least 2.11.50"
24111
24112         local dom=$DIR/$tdir/dom
24113         mkdir -p $DIR/$tdir
24114
24115         $LFS setstripe -E 256K -L mdt -E -1 -c1 $dom
24116         dd if=/dev/urandom of=$dom bs=512K count=1 ||
24117                 error "failed to write data into $dom"
24118         local old_md5=$(md5sum $dom)
24119
24120         $LFS migrate -E 256K -L mdt -E -1 -c2 $dom ||
24121                 error "failed to migrate to the same DoM component"
24122
24123         local new_md5=$(md5sum $dom)
24124
24125         [ "$old_md5" == "$new_md5" ] ||
24126                 error "md5sum differ: $old_md5, $new_md5"
24127
24128         [ $($LFS getstripe -c $dom) -eq 2 ] ||
24129                 error "bad final stripe count: $($LFS getstripe -c $dom) != 2"
24130 }
24131 run_test 272a "DoM migration: new layout with the same DOM component"
24132
24133 test_272b() {
24134         [ $MDS1_VERSION -lt $(version_code 2.11.50) ] &&
24135                 skip "Need MDS version at least 2.11.50"
24136
24137         local dom=$DIR/$tdir/dom
24138         mkdir -p $DIR/$tdir
24139         $LFS setstripe -E 1M -L mdt -E -1 -c1 $dom
24140         stack_trap "rm -rf $DIR/$tdir"
24141
24142         local mdtidx=$($LFS getstripe -m $dom)
24143         local mdtname=MDT$(printf %04x $mdtidx)
24144         local facet=mds$((mdtidx + 1))
24145
24146         local mdtfree1=$(do_facet $facet \
24147                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24148         dd if=/dev/urandom of=$dom bs=2M count=1 ||
24149                 error "failed to write data into $dom"
24150         local old_md5=$(md5sum $dom)
24151         cancel_lru_locks mdc
24152         local mdtfree1=$(do_facet $facet \
24153                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24154
24155         $LFS migrate -c2 $dom ||
24156                 error "failed to migrate to the new composite layout"
24157         [ $($LFS getstripe -L $dom) != 'mdt' ] ||
24158                 error "MDT stripe was not removed"
24159
24160         cancel_lru_locks mdc
24161         local new_md5=$(md5sum $dom)
24162         [ "$old_md5" == "$new_md5" ] ||
24163                 error "$old_md5 != $new_md5"
24164
24165         # Skip free space checks with ZFS
24166         if [ "$(facet_fstype $facet)" != "zfs" ]; then
24167                 local mdtfree2=$(do_facet $facet \
24168                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24169                 [ $mdtfree2 -gt $mdtfree1 ] ||
24170                         error "MDT space is not freed after migration"
24171         fi
24172         return 0
24173 }
24174 run_test 272b "DoM migration: DOM file to the OST-striped file (plain)"
24175
24176 test_272c() {
24177         [ $MDS1_VERSION -lt $(version_code 2.11.50) ] &&
24178                 skip "Need MDS version at least 2.11.50"
24179
24180         local dom=$DIR/$tdir/$tfile
24181         mkdir -p $DIR/$tdir
24182         $LFS setstripe -E 1M -L mdt -E -1 -c1 $dom
24183         stack_trap "rm -rf $DIR/$tdir"
24184
24185         local mdtidx=$($LFS getstripe -m $dom)
24186         local mdtname=MDT$(printf %04x $mdtidx)
24187         local facet=mds$((mdtidx + 1))
24188
24189         dd if=/dev/urandom of=$dom bs=2M count=1 oflag=direct ||
24190                 error "failed to write data into $dom"
24191         local old_md5=$(md5sum $dom)
24192         cancel_lru_locks mdc
24193         local mdtfree1=$(do_facet $facet \
24194                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24195
24196         $LFS migrate -E 2M -c1 -E -1 -c2 $dom ||
24197                 error "failed to migrate to the new composite layout"
24198         [ $($LFS getstripe -L $dom) == 'mdt' ] &&
24199                 error "MDT stripe was not removed"
24200
24201         cancel_lru_locks mdc
24202         local new_md5=$(md5sum $dom)
24203         [ "$old_md5" == "$new_md5" ] ||
24204                 error "$old_md5 != $new_md5"
24205
24206         # Skip free space checks with ZFS
24207         if [ "$(facet_fstype $facet)" != "zfs" ]; then
24208                 local mdtfree2=$(do_facet $facet \
24209                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24210                 [ $mdtfree2 -gt $mdtfree1 ] ||
24211                         error "MDS space is not freed after migration"
24212         fi
24213         return 0
24214 }
24215 run_test 272c "DoM migration: DOM file to the OST-striped file (composite)"
24216
24217 test_272d() {
24218         [ $MDS1_VERSION -lt $(version_code 2.12.55) ] &&
24219                 skip "Need MDS version at least 2.12.55"
24220
24221         local dom=$DIR/$tdir/$tfile
24222         mkdir -p $DIR/$tdir
24223         $LFS setstripe -E 1M -L mdt -E -1 -c1 $dom
24224
24225         local mdtidx=$($LFS getstripe -m $dom)
24226         local mdtname=MDT$(printf %04x $mdtidx)
24227         local facet=mds$((mdtidx + 1))
24228
24229         dd if=/dev/urandom of=$dom bs=2M count=1 oflag=direct ||
24230                 error "failed to write data into $dom"
24231         local old_md5=$(md5sum $dom)
24232         cancel_lru_locks mdc
24233         local mdtfree1=$(do_facet $facet \
24234                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24235
24236         $LFS mirror extend -N -E 2M -c1 -E -1 -c2 $dom ||
24237                 error "failed mirroring to the new composite layout"
24238         $LFS mirror resync $dom ||
24239                 error "failed mirror resync"
24240         $LFS mirror split --mirror-id 1 -d $dom ||
24241                 error "failed mirror split"
24242
24243         [ $($LFS getstripe -L $dom) != 'mdt' ] ||
24244                 error "MDT stripe was not removed"
24245
24246         cancel_lru_locks mdc
24247         local new_md5=$(md5sum $dom)
24248         [ "$old_md5" == "$new_md5" ] ||
24249                 error "$old_md5 != $new_md5"
24250
24251         # Skip free space checks with ZFS
24252         if [ "$(facet_fstype $facet)" != "zfs" ]; then
24253                 local mdtfree2=$(do_facet $facet \
24254                                 lctl get_param -n osd*.*$mdtname.kbytesfree)
24255                 [ $mdtfree2 -gt $mdtfree1 ] ||
24256                         error "MDS space is not freed after DOM mirror deletion"
24257         fi
24258         return 0
24259 }
24260 run_test 272d "DoM mirroring: OST-striped mirror to DOM file"
24261
24262 test_272e() {
24263         [ $MDS1_VERSION -lt $(version_code 2.12.55) ] &&
24264                 skip "Need MDS version at least 2.12.55"
24265
24266         local dom=$DIR/$tdir/$tfile
24267         mkdir -p $DIR/$tdir
24268         $LFS setstripe -c 2 $dom
24269
24270         dd if=/dev/urandom of=$dom bs=2M count=1 oflag=direct ||
24271                 error "failed to write data into $dom"
24272         local old_md5=$(md5sum $dom)
24273         cancel_lru_locks
24274
24275         $LFS mirror extend -N -E 1M -L mdt -E eof -c2 $dom ||
24276                 error "failed mirroring to the DOM layout"
24277         $LFS mirror resync $dom ||
24278                 error "failed mirror resync"
24279         $LFS mirror split --mirror-id 1 -d $dom ||
24280                 error "failed mirror split"
24281
24282         [[ $($LFS getstripe -L --component-start=0 $dom) == 'mdt' ]] ||
24283                 error "MDT stripe wasn't set"
24284
24285         cancel_lru_locks
24286         local new_md5=$(md5sum $dom)
24287         [ "$old_md5" == "$new_md5" ] ||
24288                 error "$old_md5 != $new_md5"
24289
24290         return 0
24291 }
24292 run_test 272e "DoM mirroring: DOM mirror to the OST-striped file"
24293
24294 test_272f() {
24295         [ $MDS1_VERSION -lt $(version_code 2.12.55) ] &&
24296                 skip "Need MDS version at least 2.12.55"
24297
24298         local dom=$DIR/$tdir/$tfile
24299         mkdir -p $DIR/$tdir
24300         $LFS setstripe -c 2 $dom
24301
24302         dd if=/dev/urandom of=$dom bs=2M count=1 oflag=direct ||
24303                 error "failed to write data into $dom"
24304         local old_md5=$(md5sum $dom)
24305         cancel_lru_locks
24306
24307         $LFS migrate -E 1M -L mdt -E eof -c2 -v $dom ||
24308                 error "failed migrating to the DOM file"
24309
24310         [[ $($LFS getstripe -L --component-start=0 $dom) == 'mdt' ]] ||
24311                 error "MDT stripe wasn't set"
24312
24313         cancel_lru_locks
24314         local new_md5=$(md5sum $dom)
24315         [ "$old_md5" != "$new_md5" ] &&
24316                 error "$old_md5 != $new_md5"
24317
24318         return 0
24319 }
24320 run_test 272f "DoM migration: OST-striped file to DOM file"
24321
24322 test_273a() {
24323         [ $MDS1_VERSION -lt $(version_code 2.11.50) ] &&
24324                 skip "Need MDS version at least 2.11.50"
24325
24326         # Layout swap cannot be done if either file has DOM component,
24327         # this will never be supported, migration should be used instead
24328
24329         local dom=$DIR/$tdir/$tfile
24330         mkdir -p $DIR/$tdir
24331
24332         $LFS setstripe -c2 ${dom}_plain
24333         $LFS setstripe -E 1M -L mdt -E -1 -c2 ${dom}_dom
24334         $LFS swap_layouts ${dom}_plain ${dom}_dom &&
24335                 error "can swap layout with DoM component"
24336         $LFS swap_layouts ${dom}_dom ${dom}_plain &&
24337                 error "can swap layout with DoM component"
24338
24339         $LFS setstripe -E 1M -c1 -E -1 -c2 ${dom}_comp
24340         $LFS swap_layouts ${dom}_comp ${dom}_dom &&
24341                 error "can swap layout with DoM component"
24342         $LFS swap_layouts ${dom}_dom ${dom}_comp &&
24343                 error "can swap layout with DoM component"
24344         return 0
24345 }
24346 run_test 273a "DoM: layout swapping should fail with DOM"
24347
24348 test_273b() {
24349         mkdir -p $DIR/$tdir
24350         $LFS setstripe -E 1M -L mdt -E -1 -c -1 $DIR/$tdir
24351
24352 #define OBD_FAIL_MDS_COMMITRW_DELAY      0x16b
24353         do_facet mds1 $LCTL set_param fail_loc=0x8000016b fail_val=2
24354
24355         $MULTIOP $DIR/$tdir/$tfile Ouw2097152c
24356 }
24357 run_test 273b "DoM: race writeback and object destroy"
24358
24359 test_273c() {
24360         mkdir -p $DIR/$tdir
24361         $LFS setstripe -E 1M -E-1 -c-1 $DIR/$tdir
24362
24363         #define OBD_FAIL_OFD_COMMITRW_DELAY      0x1e1
24364         do_facet ost1 $LCTL set_param fail_loc=0x800001e1 fail_val=2
24365
24366         $MULTIOP $DIR/$tdir/$tfile Ouw2097152c
24367 }
24368 run_test 273c "race writeback and object destroy"
24369
24370 test_275() {
24371         remote_ost_nodsh && skip "remote OST with nodsh"
24372         [ $OST1_VERSION -lt $(version_code 2.10.57) ] &&
24373                 skip "Need OST version >= 2.10.57"
24374
24375         local file=$DIR/$tfile
24376         local oss
24377
24378         oss=$(comma_list $(osts_nodes))
24379
24380         dd if=/dev/urandom of=$file bs=1M count=2 ||
24381                 error "failed to create a file"
24382         stack_trap "rm -f $file"
24383         cancel_lru_locks osc
24384
24385         #lock 1
24386         dd if=$file of=/dev/null bs=1M count=1 iflag=direct ||
24387                 error "failed to read a file"
24388
24389 #define OBD_FAIL_LDLM_PAUSE_CANCEL2      0x31f
24390         $LCTL set_param fail_loc=0x8000031f
24391
24392         cancel_lru_locks osc &
24393         sleep 1
24394
24395 #define OBD_FAIL_LDLM_PROLONG_PAUSE      0x32b
24396         do_nodes $oss $LCTL set_param fail_loc=0x8000032b
24397         #IO takes another lock, but matches the PENDING one
24398         #and places it to the IO RPC
24399         dd if=$file of=/dev/null bs=1M count=1 iflag=direct ||
24400                 error "failed to read a file with PENDING lock"
24401 }
24402 run_test 275 "Read on a canceled duplicate lock"
24403
24404 test_276() {
24405         remote_ost_nodsh && skip "remote OST with nodsh"
24406         local pid
24407
24408         do_facet ost1 "(while true; do \
24409                 $LCTL get_param obdfilter.*.filesfree > /dev/null 2>&1; \
24410                 done) & pid=\\\$!; echo \\\$pid > $TMP/sanity_276_pid" &
24411         pid=$!
24412
24413         for LOOP in $(seq 20); do
24414                 stop ost1
24415                 start ost1 $(ostdevname 1) $OST_MOUNT_OPTS
24416         done
24417         kill -9 $pid
24418         do_facet ost1 "pid=\\\$(cat $TMP/sanity_276_pid); kill -9 \\\$pid; \
24419                 rm $TMP/sanity_276_pid"
24420 }
24421 run_test 276 "Race between mount and obd_statfs"
24422
24423 test_277() {
24424         $LCTL set_param ldlm.namespaces.*.lru_size=0
24425         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
24426         local cached_mb=$($LCTL get_param llite.*.max_cached_mb |
24427                         grep ^used_mb | awk '{print $2}')
24428         [ $cached_mb -eq 1 ] || error "expected mb 1 got $cached_mb"
24429         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 \
24430                 oflag=direct conv=notrunc
24431         cached_mb=$($LCTL get_param llite.*.max_cached_mb |
24432                         grep ^used_mb | awk '{print $2}')
24433         [ $cached_mb -eq 0 ] || error "expected mb 0 got $cached_mb"
24434 }
24435 run_test 277 "Direct IO shall drop page cache"
24436
24437 test_278() {
24438         [ $PARALLEL == "yes" ] && skip "skip parallel run" && return
24439         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
24440         [[ "$(facet_host mds1)" != "$(facet_host mds2)" ]] &&
24441                 skip "needs the same host for mdt1 mdt2" && return
24442
24443         local pid1
24444         local pid2
24445
24446 #define OBD_FAIL_OBD_STOP_MDS_RACE     0x60b
24447         do_facet mds2 $LCTL set_param fail_loc=0x8000060c
24448         stop mds2 &
24449         pid2=$!
24450
24451         stop mds1
24452
24453         echo "Starting MDTs"
24454         start mds1 $(mdsdevname 1) $MDS_MOUNT_OPTS
24455         wait $pid2
24456 #For the error assertion will happen. lu_env_get_key(..., &mdt_thread_key)
24457 #will return NULL
24458         do_facet mds2 $LCTL set_param fail_loc=0
24459
24460         start mds2 $(mdsdevname 2) $MDS_MOUNT_OPTS
24461         wait_recovery_complete mds2
24462 }
24463 run_test 278 "Race starting MDS between MDTs stop/start"
24464
24465 test_280() {
24466         [ $MGS_VERSION -lt $(version_code 2.13.52) ] &&
24467                 skip "Need MGS version at least 2.13.52"
24468         [ $PARALLEL == "yes" ] && skip "skip parallel run"
24469         combined_mgs_mds || skip "needs combined MGS/MDT"
24470
24471         umount_client $MOUNT
24472 #define OBD_FAIL_MDS_LLOG_UMOUNT_RACE   0x15e
24473         do_facet mgs $LCTL set_param fail_loc=0x8000015e fail_val=0
24474
24475         mount_client $MOUNT &
24476         sleep 1
24477         stop mgs || error "stop mgs failed"
24478         #for a race mgs would crash
24479         start mgs $(mgsdevname) $MGS_MOUNT_OPTS || error "start mgs failed"
24480         # make sure we unmount client before remounting
24481         wait
24482         umount_client $MOUNT
24483         mount_client $MOUNT || error "mount client failed"
24484 }
24485 run_test 280 "Race between MGS umount and client llog processing"
24486
24487 cleanup_test_300() {
24488         trap 0
24489         umask $SAVE_UMASK
24490 }
24491 test_striped_dir() {
24492         local mdt_index=$1
24493         local stripe_count
24494         local stripe_index
24495
24496         mkdir -p $DIR/$tdir
24497
24498         SAVE_UMASK=$(umask)
24499         trap cleanup_test_300 RETURN EXIT
24500
24501         $LFS setdirstripe -i $mdt_index -c 2 -H all_char -o 755 \
24502                                                 $DIR/$tdir/striped_dir ||
24503                 error "set striped dir error"
24504
24505         local mode=$(stat -c%a $DIR/$tdir/striped_dir)
24506         [ "$mode" = "755" ] || error "expect 755 got $mode"
24507
24508         $LFS getdirstripe $DIR/$tdir/striped_dir > /dev/null 2>&1 ||
24509                 error "getdirstripe failed"
24510         stripe_count=$($LFS getdirstripe -c $DIR/$tdir/striped_dir)
24511         if [ "$stripe_count" != "2" ]; then
24512                 error "1:stripe_count is $stripe_count, expect 2"
24513         fi
24514         stripe_count=$($LFS getdirstripe -T $DIR/$tdir/striped_dir)
24515         if [ "$stripe_count" != "2" ]; then
24516                 error "2:stripe_count is $stripe_count, expect 2"
24517         fi
24518
24519         stripe_index=$($LFS getdirstripe -i $DIR/$tdir/striped_dir)
24520         if [ "$stripe_index" != "$mdt_index" ]; then
24521                 error "stripe_index is $stripe_index, expect $mdt_index"
24522         fi
24523
24524         [ $(stat -c%h $DIR/$tdir/striped_dir) == '2' ] ||
24525                 error "nlink error after create striped dir"
24526
24527         mkdir $DIR/$tdir/striped_dir/a
24528         mkdir $DIR/$tdir/striped_dir/b
24529
24530         stat $DIR/$tdir/striped_dir/a ||
24531                 error "create dir under striped dir failed"
24532         stat $DIR/$tdir/striped_dir/b ||
24533                 error "create dir under striped dir failed"
24534
24535         [ $(stat -c%h $DIR/$tdir/striped_dir) == '4' ] ||
24536                 error "nlink error after mkdir"
24537
24538         rmdir $DIR/$tdir/striped_dir/a
24539         [ $(stat -c%h $DIR/$tdir/striped_dir) == '3' ] ||
24540                 error "nlink error after rmdir"
24541
24542         rmdir $DIR/$tdir/striped_dir/b
24543         [ $(stat -c%h $DIR/$tdir/striped_dir) == '2' ] ||
24544                 error "nlink error after rmdir"
24545
24546         chattr +i $DIR/$tdir/striped_dir
24547         createmany -o $DIR/$tdir/striped_dir/f 10 &&
24548                 error "immutable flags not working under striped dir!"
24549         chattr -i $DIR/$tdir/striped_dir
24550
24551         rmdir $DIR/$tdir/striped_dir ||
24552                 error "rmdir striped dir error"
24553
24554         cleanup_test_300
24555
24556         true
24557 }
24558
24559 test_300a() {
24560         [ $MDS1_VERSION -lt $(version_code 2.7.0) ] &&
24561                 skip "skipped for lustre < 2.7.0"
24562         [ $PARALLEL == "yes" ] && skip "skip parallel run"
24563         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
24564
24565         test_striped_dir 0 || error "failed on striped dir on MDT0"
24566         test_striped_dir 1 || error "failed on striped dir on MDT0"
24567 }
24568 run_test 300a "basic striped dir sanity test"
24569
24570 test_300b() {
24571         [ $MDS1_VERSION -lt $(version_code 2.7.0) ] &&
24572                 skip "skipped for lustre < 2.7.0"
24573         [ $PARALLEL == "yes" ] && skip "skip parallel run"
24574         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
24575
24576         local i
24577         local mtime1
24578         local mtime2
24579         local mtime3
24580
24581         test_mkdir $DIR/$tdir || error "mkdir fail"
24582         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir ||
24583                 error "set striped dir error"
24584         for i in {0..9}; do
24585                 mtime1=$(stat -c %Y $DIR/$tdir/striped_dir)
24586                 sleep 1
24587                 touch $DIR/$tdir/striped_dir/file_$i || error "touch error $i"
24588                 mtime2=$(stat -c %Y $DIR/$tdir/striped_dir)
24589                 [ $mtime1 -eq $mtime2 ] && error "mtime unchanged after create"
24590                 sleep 1
24591                 rm -f $DIR/$tdir/striped_dir/file_$i || error "unlink error $i"
24592                 mtime3=$(stat -c %Y $DIR/$tdir/striped_dir)
24593                 [ $mtime2 -eq $mtime3 ] && error "mtime unchanged after unlink"
24594         done
24595         true
24596 }
24597 run_test 300b "check ctime/mtime for striped dir"
24598
24599 test_300c() {
24600         [ $MDS1_VERSION -lt $(version_code 2.7.0) ] &&
24601                 skip "skipped for lustre < 2.7.0"
24602         [ $PARALLEL == "yes" ] && skip "skip parallel run"
24603         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
24604
24605         local file_count
24606
24607         mkdir_on_mdt0 $DIR/$tdir
24608         $LFS setdirstripe -i 0 -c 2 $DIR/$tdir/striped_dir ||
24609                 error "set striped dir error"
24610
24611         chown $RUNAS_ID:$RUNAS_GID $DIR/$tdir/striped_dir ||
24612                 error "chown striped dir failed"
24613
24614         $RUNAS createmany -o $DIR/$tdir/striped_dir/f 5000 ||
24615                 error "create 5k files failed"
24616
24617         file_count=$(ls $DIR/$tdir/striped_dir | wc -l)
24618
24619         [ "$file_count" = 5000 ] || error "file count $file_count != 5000"
24620
24621         rm -rf $DIR/$tdir
24622 }
24623 run_test 300c "chown && check ls under striped directory"
24624
24625 test_300d() {
24626         [ $MDS1_VERSION -lt $(version_code 2.7.0) ] &&
24627                 skip "skipped for lustre < 2.7.0"
24628         [ $PARALLEL == "yes" ] && skip "skip parallel run"
24629         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
24630
24631         local stripe_count
24632         local file
24633
24634         mkdir -p $DIR/$tdir
24635         $LFS setstripe -c 2 $DIR/$tdir
24636
24637         #local striped directory
24638         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir ||
24639                 error "set striped dir error"
24640         #look at the directories for debug purposes
24641         ls -l $DIR/$tdir
24642         $LFS getdirstripe $DIR/$tdir
24643         ls -l $DIR/$tdir/striped_dir
24644         $LFS getdirstripe $DIR/$tdir/striped_dir
24645         createmany -o $DIR/$tdir/striped_dir/f 10 ||
24646                 error "create 10 files failed"
24647
24648         #remote striped directory
24649         $LFS setdirstripe -i 1 -c 2 $DIR/$tdir/remote_striped_dir ||
24650                 error "set striped dir error"
24651         #look at the directories for debug purposes
24652         ls -l $DIR/$tdir
24653         $LFS getdirstripe $DIR/$tdir
24654         ls -l $DIR/$tdir/remote_striped_dir
24655         $LFS getdirstripe $DIR/$tdir/remote_striped_dir
24656         createmany -o $DIR/$tdir/remote_striped_dir/f 10 ||
24657                 error "create 10 files failed"
24658
24659         for file in $(find $DIR/$tdir); do
24660                 stripe_count=$($LFS getstripe -c $file)
24661                 [ $stripe_count -eq 2 ] ||
24662                         error "wrong stripe $stripe_count for $file"
24663         done
24664
24665         rm -rf $DIR/$tdir
24666 }
24667 run_test 300d "check default stripe under striped directory"
24668
24669 test_300e() {
24670         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
24671                 skip "Need MDS version at least 2.7.55"
24672         [ $PARALLEL == "yes" ] && skip "skip parallel run"
24673         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
24674
24675         local stripe_count
24676         local file
24677
24678         mkdir -p $DIR/$tdir
24679
24680         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir ||
24681                 error "set striped dir error"
24682
24683         touch $DIR/$tdir/striped_dir/a
24684         touch $DIR/$tdir/striped_dir/b
24685         touch $DIR/$tdir/striped_dir/c
24686
24687         mkdir $DIR/$tdir/striped_dir/dir_a
24688         mkdir $DIR/$tdir/striped_dir/dir_b
24689         mkdir $DIR/$tdir/striped_dir/dir_c
24690
24691         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir/stp_a ||
24692                 error "set striped adir under striped dir error"
24693
24694         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir/stp_b ||
24695                 error "set striped bdir under striped dir error"
24696
24697         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir/stp_c ||
24698                 error "set striped cdir under striped dir error"
24699
24700         mrename $DIR/$tdir/striped_dir/dir_a $DIR/$tdir/striped_dir/dir_b ||
24701                 error "rename dir under striped dir fails"
24702
24703         mrename $DIR/$tdir/striped_dir/stp_a $DIR/$tdir/striped_dir/stp_b ||
24704                 error "rename dir under different stripes fails"
24705
24706         mrename $DIR/$tdir/striped_dir/a $DIR/$tdir/striped_dir/c ||
24707                 error "rename file under striped dir should succeed"
24708
24709         mrename $DIR/$tdir/striped_dir/dir_b $DIR/$tdir/striped_dir/dir_c ||
24710                 error "rename dir under striped dir should succeed"
24711
24712         rm -rf $DIR/$tdir
24713 }
24714 run_test 300e "check rename under striped directory"
24715
24716 test_300f() {
24717         [ $PARALLEL == "yes" ] && skip "skip parallel run"
24718         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
24719         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
24720                 skip "Need MDS version at least 2.7.55"
24721
24722         local stripe_count
24723         local file
24724
24725         rm -rf $DIR/$tdir
24726         mkdir -p $DIR/$tdir
24727
24728         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir ||
24729                 error "set striped dir error"
24730
24731         $LFS setdirstripe -i 0 -c 2 -H all_char $DIR/$tdir/striped_dir1 ||
24732                 error "set striped dir error"
24733
24734         touch $DIR/$tdir/striped_dir/a
24735         mkdir $DIR/$tdir/striped_dir/dir_a
24736         $LFS setdirstripe -i 0 -c 2 $DIR/$tdir/striped_dir/stp_a ||
24737                 error "create striped dir under striped dir fails"
24738
24739         touch $DIR/$tdir/striped_dir1/b
24740         mkdir $DIR/$tdir/striped_dir1/dir_b
24741         $LFS setdirstripe -i 0 -c 2 $DIR/$tdir/striped_dir/stp_b ||
24742                 error "create striped dir under striped dir fails"
24743
24744         mrename $DIR/$tdir/striped_dir/dir_a $DIR/$tdir/striped_dir1/dir_b ||
24745                 error "rename dir under different striped dir should fail"
24746
24747         mrename $DIR/$tdir/striped_dir/stp_a $DIR/$tdir/striped_dir1/stp_b ||
24748                 error "rename striped dir under diff striped dir should fail"
24749
24750         mrename $DIR/$tdir/striped_dir/a $DIR/$tdir/striped_dir1/a ||
24751                 error "rename file under diff striped dirs fails"
24752
24753         rm -rf $DIR/$tdir
24754 }
24755 run_test 300f "check rename cross striped directory"
24756
24757 test_300_check_default_striped_dir()
24758 {
24759         local dirname=$1
24760         local default_count=$2
24761         local default_index=$3
24762         local stripe_count
24763         local stripe_index
24764         local dir_stripe_index
24765         local dir
24766
24767         echo "checking $dirname $default_count $default_index"
24768         $LFS setdirstripe -D -c $default_count -i $default_index \
24769                                 -H all_char $DIR/$tdir/$dirname ||
24770                 error "set default stripe on striped dir error"
24771         stripe_count=$($LFS getdirstripe -D -c $DIR/$tdir/$dirname)
24772         [ $stripe_count -eq $default_count ] ||
24773                 error "expect $default_count get $stripe_count for $dirname"
24774
24775         stripe_index=$($LFS getdirstripe -D -i $DIR/$tdir/$dirname)
24776         [ $stripe_index -eq $default_index ] ||
24777                 error "expect $default_index get $stripe_index for $dirname"
24778
24779         mkdir $DIR/$tdir/$dirname/{test1,test2,test3,test4} ||
24780                                                 error "create dirs failed"
24781
24782         createmany -o $DIR/$tdir/$dirname/f- 10 || error "create files failed"
24783         unlinkmany $DIR/$tdir/$dirname/f- 10    || error "unlink files failed"
24784         for dir in $(find $DIR/$tdir/$dirname/*); do
24785                 stripe_count=$($LFS getdirstripe -c $dir)
24786                 (( $stripe_count == $default_count )) ||
24787                 (( $stripe_count == $MDSCOUNT && $default_count == -1 )) ||
24788                 (( $stripe_count == 0 )) || (( $default_count == 1 )) ||
24789                 error "stripe count $default_count != $stripe_count for $dir"
24790
24791                 stripe_index=$($LFS getdirstripe -i $dir)
24792                 [ $default_index -eq -1 ] ||
24793                         [ $stripe_index -eq $default_index ] ||
24794                         error "$stripe_index != $default_index for $dir"
24795
24796                 #check default stripe
24797                 stripe_count=$($LFS getdirstripe -D -c $dir)
24798                 [ $stripe_count -eq $default_count ] ||
24799                 error "default count $default_count != $stripe_count for $dir"
24800
24801                 stripe_index=$($LFS getdirstripe -D -i $dir)
24802                 [ $stripe_index -eq $default_index ] ||
24803                 error "default index $default_index != $stripe_index for $dir"
24804         done
24805         rmdir $DIR/$tdir/$dirname/* || error "rmdir failed"
24806 }
24807
24808 test_300g() {
24809         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
24810         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
24811                 skip "Need MDS version at least 2.7.55"
24812
24813         local dir
24814         local stripe_count
24815         local stripe_index
24816
24817         mkdir_on_mdt0 $DIR/$tdir
24818         mkdir $DIR/$tdir/normal_dir
24819
24820         #Checking when client cache stripe index
24821         $LFS setdirstripe -c$MDSCOUNT $DIR/$tdir/striped_dir
24822         $LFS setdirstripe -D -i1 $DIR/$tdir/striped_dir ||
24823                 error "create striped_dir failed"
24824
24825         $LFS setdirstripe -i0 $DIR/$tdir/striped_dir/dir0 ||
24826                 error "create dir0 fails"
24827         stripe_index=$($LFS getdirstripe -i $DIR/$tdir/striped_dir/dir0)
24828         [ $stripe_index -eq 0 ] ||
24829                 error "dir0 expect index 0 got $stripe_index"
24830
24831         mkdir $DIR/$tdir/striped_dir/dir1 ||
24832                 error "create dir1 fails"
24833         stripe_index=$($LFS getdirstripe -i $DIR/$tdir/striped_dir/dir1)
24834         [ $stripe_index -eq 1 ] ||
24835                 error "dir1 expect index 1 got $stripe_index"
24836
24837         #check default stripe count/stripe index
24838         test_300_check_default_striped_dir normal_dir $MDSCOUNT 1
24839         test_300_check_default_striped_dir normal_dir 1 0
24840         test_300_check_default_striped_dir normal_dir -1 1
24841         test_300_check_default_striped_dir normal_dir 2 -1
24842
24843         #delete default stripe information
24844         echo "delete default stripeEA"
24845         $LFS setdirstripe -d $DIR/$tdir/normal_dir ||
24846                 error "set default stripe on striped dir error"
24847
24848         mkdir -p $DIR/$tdir/normal_dir/{test1,test2,test3,test4}
24849         for dir in $(find $DIR/$tdir/normal_dir/*); do
24850                 stripe_count=$($LFS getdirstripe -c $dir)
24851                 [ $stripe_count -eq 0 ] ||
24852                         error "expect 1 get $stripe_count for $dir"
24853         done
24854 }
24855 run_test 300g "check default striped directory for normal directory"
24856
24857 test_300h() {
24858         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
24859         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
24860                 skip "Need MDS version at least 2.7.55"
24861
24862         local dir
24863         local stripe_count
24864
24865         mkdir $DIR/$tdir
24866         $LFS setdirstripe -i0 -c$MDSCOUNT -H all_char $DIR/$tdir/striped_dir ||
24867                 error "set striped dir error"
24868
24869         test_300_check_default_striped_dir striped_dir $MDSCOUNT 1
24870         test_300_check_default_striped_dir striped_dir 1 0
24871         test_300_check_default_striped_dir striped_dir -1 1
24872         test_300_check_default_striped_dir striped_dir 2 -1
24873
24874         #delete default stripe information
24875         $LFS setdirstripe -d $DIR/$tdir/striped_dir ||
24876                 error "set default stripe on striped dir error"
24877
24878         mkdir -p $DIR/$tdir/striped_dir/{test1,test2,test3,test4}
24879         for dir in $(find $DIR/$tdir/striped_dir/*); do
24880                 stripe_count=$($LFS getdirstripe -c $dir)
24881                 [ $stripe_count -eq 0 ] ||
24882                         error "expect 1 get $stripe_count for $dir"
24883         done
24884 }
24885 run_test 300h "check default striped directory for striped directory"
24886
24887 test_300i() {
24888         [[ $PARALLEL == "yes" ]] && skip "skip parallel run"
24889         (( $MDSCOUNT >= 2 )) || skip_env "needs >= 2 MDTs"
24890         (( $MDS1_VERSION >= $(version_code 2.7.55) )) ||
24891                 skip "Need MDS version at least 2.7.55"
24892
24893         local stripe_count
24894         local file
24895
24896         mkdir $DIR/$tdir
24897
24898         $LFS setdirstripe -i 0 -c$MDSCOUNT -H all_char $DIR/$tdir/striped_dir ||
24899                 error "set striped dir error"
24900
24901         createmany -o $DIR/$tdir/striped_dir/f- 10 ||
24902                 error "create files under striped dir failed"
24903
24904         $LFS setdirstripe -i0 -c$MDSCOUNT -H all_char $DIR/$tdir/hashdir ||
24905                 error "set striped hashdir error"
24906
24907         $LFS setdirstripe -i0 -c$MDSCOUNT -H all_char $DIR/$tdir/hashdir/d0 ||
24908                 error "create dir0 under hash dir failed"
24909         $LFS setdirstripe -i0 -c$MDSCOUNT -H fnv_1a_64 $DIR/$tdir/hashdir/d1 ||
24910                 error "create dir1 under hash dir failed"
24911         $LFS setdirstripe -i0 -c$MDSCOUNT -H crush $DIR/$tdir/hashdir/d2 ||
24912                 error "create dir2 under hash dir failed"
24913
24914         # unfortunately, we need to umount to clear dir layout cache for now
24915         # once we fully implement dir layout, we can drop this
24916         umount_client $MOUNT || error "umount failed"
24917         mount_client $MOUNT || error "mount failed"
24918
24919         $LFS find -H fnv_1a_64,crush $DIR/$tdir/hashdir
24920         local dircnt=$($LFS find -H fnv_1a_64,crush $DIR/$tdir/hashdir | wc -l)
24921         (( $dircnt == 2 )) || error "lfs find striped dir got $dircnt != 2"
24922
24923         if (( $MDS1_VERSION > $(version_code 2.15.0) )); then
24924                 $LFS mkdir -i0 -c$MDSCOUNT -H crush2 $DIR/$tdir/hashdir/d3 ||
24925                         error "create crush2 dir $tdir/hashdir/d3 failed"
24926                 $LFS find -H crush2 $DIR/$tdir/hashdir
24927                 dircnt=$($LFS find -H crush2 $DIR/$tdir/hashdir | wc -l)
24928                 (( $dircnt == 1 )) || error "find crush2 dir got $dircnt != 1"
24929
24930                 # mkdir with an invalid hash type (hash=fail_val) from client
24931                 # should be replaced on MDS with a valid (default) hash type
24932                 #define OBD_FAIL_LMV_UNKNOWN_STRIPE     0x1901
24933                 $LCTL set_param fail_loc=0x1901 fail_val=99
24934                 $LFS mkdir -c2 $DIR/$tdir/hashdir/d99
24935
24936                 local hash=$($LFS getdirstripe -H $DIR/$tdir/hashdir/d99)
24937                 local expect=$(do_facet mds1 \
24938                         $LCTL get_param -n lod.$FSNAME-MDT0000-mdtlov.mdt_hash)
24939                 [[ $hash == $expect ]] ||
24940                         error "d99 hash '$hash' != expected hash '$expect'"
24941         fi
24942
24943         #set the stripe to be unknown hash type on read
24944         #define OBD_FAIL_LMV_UNKNOWN_STRIPE     0x1901
24945         $LCTL set_param fail_loc=0x1901 fail_val=99
24946         for ((i = 0; i < 10; i++)); do
24947                 $CHECKSTAT -t file $DIR/$tdir/striped_dir/f-$i ||
24948                         error "stat f-$i failed"
24949                 rm $DIR/$tdir/striped_dir/f-$i || error "unlink f-$i failed"
24950         done
24951
24952         touch $DIR/$tdir/striped_dir/f0 &&
24953                 error "create under striped dir with unknown hash should fail"
24954
24955         $LCTL set_param fail_loc=0
24956
24957         umount_client $MOUNT || error "umount failed"
24958         mount_client $MOUNT || error "mount failed"
24959
24960         return 0
24961 }
24962 run_test 300i "client handle unknown hash type striped directory"
24963
24964 test_300j() {
24965         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
24966         [ $PARALLEL == "yes" ] && skip "skip parallel run"
24967         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
24968                 skip "Need MDS version at least 2.7.55"
24969
24970         local stripe_count
24971         local file
24972
24973         mkdir $DIR/$tdir
24974
24975         #define OBD_FAIL_SPLIT_UPDATE_REC       0x1702
24976         $LCTL set_param fail_loc=0x1702
24977         $LFS setdirstripe -i 0 -c$MDSCOUNT -H all_char $DIR/$tdir/striped_dir ||
24978                 error "set striped dir error"
24979
24980         createmany -o $DIR/$tdir/striped_dir/f- 10 ||
24981                 error "create files under striped dir failed"
24982
24983         $LCTL set_param fail_loc=0
24984
24985         rm -rf $DIR/$tdir || error "unlink striped dir fails"
24986
24987         return 0
24988 }
24989 run_test 300j "test large update record"
24990
24991 test_300k() {
24992         [ $PARALLEL == "yes" ] && skip "skip parallel run"
24993         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
24994         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
24995                 skip "Need MDS version at least 2.7.55"
24996
24997         # this test needs a huge transaction
24998         local kb
24999         kb=$(do_facet $SINGLEMDS "$LCTL get_param -n \
25000              osd*.$FSNAME-MDT0000.kbytestotal")
25001         [ $kb -lt $((1024*1024)) ] && skip "MDT0 too small: $kb"
25002
25003         local stripe_count
25004         local file
25005
25006         mkdir $DIR/$tdir
25007
25008         #define OBD_FAIL_LARGE_STRIPE   0x1703
25009         $LCTL set_param fail_loc=0x1703
25010         $LFS setdirstripe -i 0 -c192 $DIR/$tdir/striped_dir ||
25011                 error "set striped dir error"
25012         $LCTL set_param fail_loc=0
25013
25014         $LFS getdirstripe $DIR/$tdir/striped_dir ||
25015                 error "getstripeddir fails"
25016         rm -rf $DIR/$tdir/striped_dir ||
25017                 error "unlink striped dir fails"
25018
25019         return 0
25020 }
25021 run_test 300k "test large striped directory"
25022
25023 test_300l() {
25024         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25025         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25026         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25027                 skip "Need MDS version at least 2.7.55"
25028
25029         local stripe_index
25030
25031         test_mkdir -p $DIR/$tdir/striped_dir
25032         chown $RUNAS_ID $DIR/$tdir/striped_dir ||
25033                         error "chown $RUNAS_ID failed"
25034         $LFS setdirstripe -i 1 -D $DIR/$tdir/striped_dir ||
25035                 error "set default striped dir failed"
25036
25037         #define OBD_FAIL_MDS_STALE_DIR_LAYOUT    0x158
25038         $LCTL set_param fail_loc=0x80000158
25039         $RUNAS mkdir $DIR/$tdir/striped_dir/test_dir || error "create dir fails"
25040
25041         stripe_index=$($LFS getdirstripe -i $DIR/$tdir/striped_dir/test_dir)
25042         [ $stripe_index -eq 1 ] ||
25043                 error "expect 1 get $stripe_index for $dir"
25044 }
25045 run_test 300l "non-root user to create dir under striped dir with stale layout"
25046
25047 test_300m() {
25048         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25049         [ $MDSCOUNT -ge 2 ] && skip_env "Only for single MDT"
25050         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25051                 skip "Need MDS version at least 2.7.55"
25052
25053         mkdir -p $DIR/$tdir/striped_dir
25054         $LFS setdirstripe -D -c 1 $DIR/$tdir/striped_dir ||
25055                 error "set default stripes dir error"
25056
25057         mkdir $DIR/$tdir/striped_dir/a || error "mkdir a fails"
25058
25059         stripe_count=$($LFS getdirstripe -c $DIR/$tdir/striped_dir/a)
25060         [ $stripe_count -eq 0 ] ||
25061                         error "expect 0 get $stripe_count for a"
25062
25063         $LFS setdirstripe -D -c 2 $DIR/$tdir/striped_dir ||
25064                 error "set default stripes dir error"
25065
25066         mkdir $DIR/$tdir/striped_dir/b || error "mkdir b fails"
25067
25068         stripe_count=$($LFS getdirstripe -c $DIR/$tdir/striped_dir/b)
25069         [ $stripe_count -eq 0 ] ||
25070                         error "expect 0 get $stripe_count for b"
25071
25072         $LFS setdirstripe -D -c1 -i2 $DIR/$tdir/striped_dir ||
25073                 error "set default stripes dir error"
25074
25075         mkdir $DIR/$tdir/striped_dir/c &&
25076                 error "default stripe_index is invalid, mkdir c should fails"
25077
25078         rm -rf $DIR/$tdir || error "rmdir fails"
25079 }
25080 run_test 300m "setstriped directory on single MDT FS"
25081
25082 cleanup_300n() {
25083         local list=$(comma_list $(mdts_nodes))
25084
25085         trap 0
25086         do_nodes $list $LCTL set_param -n mdt.*.enable_remote_dir_gid=0
25087 }
25088
25089 test_300n() {
25090         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25091         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25092         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25093                 skip "Need MDS version at least 2.7.55"
25094         remote_mds_nodsh && skip "remote MDS with nodsh"
25095
25096         local stripe_index
25097         local list=$(comma_list $(mdts_nodes))
25098
25099         trap cleanup_300n RETURN EXIT
25100         mkdir -p $DIR/$tdir
25101         chmod 777 $DIR/$tdir
25102         $RUNAS $LFS setdirstripe -i0 -c$MDSCOUNT \
25103                                 $DIR/$tdir/striped_dir > /dev/null 2>&1 &&
25104                 error "create striped dir succeeds with gid=0"
25105
25106         do_nodes $list $LCTL set_param -n mdt.*.enable_remote_dir_gid=-1
25107         $RUNAS $LFS setdirstripe -i0 -c$MDSCOUNT $DIR/$tdir/striped_dir ||
25108                 error "create striped dir fails with gid=-1"
25109
25110         do_nodes $list $LCTL set_param -n mdt.*.enable_remote_dir_gid=0
25111         $RUNAS $LFS setdirstripe -i 1 -c$MDSCOUNT -D \
25112                                 $DIR/$tdir/striped_dir > /dev/null 2>&1 &&
25113                 error "set default striped dir succeeds with gid=0"
25114
25115
25116         do_nodes $list $LCTL set_param -n mdt.*.enable_remote_dir_gid=-1
25117         $RUNAS $LFS setdirstripe -i 1 -c$MDSCOUNT -D $DIR/$tdir/striped_dir ||
25118                 error "set default striped dir fails with gid=-1"
25119
25120
25121         do_nodes $list $LCTL set_param -n mdt.*.enable_remote_dir_gid=0
25122         $RUNAS mkdir $DIR/$tdir/striped_dir/test_dir ||
25123                                         error "create test_dir fails"
25124         $RUNAS mkdir $DIR/$tdir/striped_dir/test_dir1 ||
25125                                         error "create test_dir1 fails"
25126         $RUNAS mkdir $DIR/$tdir/striped_dir/test_dir2 ||
25127                                         error "create test_dir2 fails"
25128         cleanup_300n
25129 }
25130 run_test 300n "non-root user to create dir under striped dir with default EA"
25131
25132 test_300o() {
25133         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25134         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25135         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25136                 skip "Need MDS version at least 2.7.55"
25137
25138         local numfree1
25139         local numfree2
25140
25141         mkdir -p $DIR/$tdir
25142
25143         numfree1=$(lctl get_param -n mdc.*MDT0000*.filesfree)
25144         numfree2=$(lctl get_param -n mdc.*MDT0001*.filesfree)
25145         if [ $numfree1 -lt 66000 ] || [ $numfree2 -lt 66000 ]; then
25146                 skip "not enough free inodes $numfree1 $numfree2"
25147         fi
25148
25149         numfree1=$(lctl get_param -n mdc.*MDT0000-mdc-*.kbytesfree)
25150         numfree2=$(lctl get_param -n mdc.*MDT0001-mdc-*.kbytesfree)
25151         if [ $numfree1 -lt 300000 ] || [ $numfree2 -lt 300000 ]; then
25152                 skip "not enough free space $numfree1 $numfree2"
25153         fi
25154
25155         $LFS setdirstripe -c2 $DIR/$tdir/striped_dir ||
25156                 error "setdirstripe fails"
25157
25158         createmany -d $DIR/$tdir/striped_dir/d 131000 ||
25159                 error "create dirs fails"
25160
25161         $LCTL set_param ldlm.namespaces.*mdc-*.lru_size=0
25162         ls $DIR/$tdir/striped_dir > /dev/null ||
25163                 error "ls striped dir fails"
25164         unlinkmany -d $DIR/$tdir/striped_dir/d 131000 ||
25165                 error "unlink big striped dir fails"
25166 }
25167 run_test 300o "unlink big sub stripe(> 65000 subdirs)"
25168
25169 test_300p() {
25170         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25171         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25172         remote_mds_nodsh && skip "remote MDS with nodsh"
25173
25174         mkdir_on_mdt0 $DIR/$tdir
25175
25176         #define OBD_FAIL_OUT_ENOSPC     0x1704
25177         do_facet mds2 lctl set_param fail_loc=0x80001704
25178         $LFS setdirstripe -i 0 -c2 $DIR/$tdir/bad_striped_dir > /dev/null 2>&1 \
25179                  && error "create striped directory should fail"
25180
25181         [ -e $DIR/$tdir/bad_striped_dir ] && error "striped dir exists"
25182
25183         $LFS setdirstripe -c2 $DIR/$tdir/bad_striped_dir
25184         true
25185 }
25186 run_test 300p "create striped directory without space"
25187
25188 test_300q() {
25189         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25190         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
25191
25192         local fd=$(free_fd)
25193         local cmd="exec $fd<$tdir"
25194         cd $DIR
25195         $LFS mkdir -c $MDSCOUNT $tdir || error "create $tdir fails"
25196         eval $cmd
25197         cmd="exec $fd<&-"
25198         trap "eval $cmd" EXIT
25199         cd $tdir || error "cd $tdir fails"
25200         rmdir  ../$tdir || error "rmdir $tdir fails"
25201         mkdir local_dir && error "create dir succeeds"
25202         $LFS setdirstripe -i1 remote_dir && error "create remote dir succeeds"
25203         eval $cmd
25204         return 0
25205 }
25206 run_test 300q "create remote directory under orphan directory"
25207
25208 test_300r() {
25209         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25210                 skip "Need MDS version at least 2.7.55" && return
25211         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
25212
25213         mkdir $DIR/$tdir
25214
25215         $LFS setdirstripe -i 0 -c -1 $DIR/$tdir/striped_dir ||
25216                 error "set striped dir error"
25217
25218         $LFS getdirstripe $DIR/$tdir/striped_dir ||
25219                 error "getstripeddir fails"
25220
25221         local stripe_count
25222         stripe_count=$($LFS getdirstripe $DIR/$tdir/striped_dir |
25223                       awk '/lmv_stripe_count:/ { print $2 }')
25224
25225         [ $MDSCOUNT -ne $stripe_count ] &&
25226                 error "wrong stripe count $stripe_count expected $MDSCOUNT"
25227
25228         rm -rf $DIR/$tdir/striped_dir ||
25229                 error "unlink striped dir fails"
25230 }
25231 run_test 300r "test -1 striped directory"
25232
25233 test_300s_helper() {
25234         local count=$1
25235
25236         local stripe_dir=$DIR/$tdir/striped_dir.$count
25237
25238         $LFS mkdir -c $count $stripe_dir ||
25239                 error "lfs mkdir -c error"
25240
25241         $LFS getdirstripe $stripe_dir ||
25242                 error "lfs getdirstripe fails"
25243
25244         local stripe_count
25245         stripe_count=$($LFS getdirstripe $stripe_dir |
25246                       awk '/lmv_stripe_count:/ { print $2 }')
25247
25248         [ $count -ne $stripe_count ] &&
25249                 error_noexit "bad stripe count $stripe_count expected $count"
25250
25251         local dupe_stripes
25252         dupe_stripes=$($LFS getdirstripe $stripe_dir |
25253                 awk '/0x/ {count[$1] += 1}; END {
25254                         for (idx in count) {
25255                                 if (count[idx]>1) {
25256                                         print "index " idx " count " count[idx]
25257                                 }
25258                         }
25259                 }')
25260
25261         if [[ -n "$dupe_stripes" ]] ; then
25262                 lfs getdirstripe $stripe_dir
25263                 error_noexit "Dupe MDT above: $dupe_stripes "
25264         fi
25265
25266         rm -rf $stripe_dir ||
25267                 error_noexit "unlink $stripe_dir fails"
25268 }
25269
25270 test_300s() {
25271         [ $MDS1_VERSION -lt $(version_code 2.7.55) ] &&
25272                 skip "Need MDS version at least 2.7.55" && return
25273         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs" && return
25274
25275         mkdir $DIR/$tdir
25276         for count in $(seq 2 $MDSCOUNT); do
25277                 test_300s_helper $count
25278         done
25279 }
25280 run_test 300s "test lfs mkdir -c without -i"
25281
25282 test_300t() {
25283         (( $MDS1_VERSION >= $(version_code 2.14.55) )) ||
25284                 skip "need MDS 2.14.55 or later"
25285         (( $MDSCOUNT >= 2 )) || skip "needs at least 2 MDTs"
25286
25287         local testdir="$DIR/$tdir/striped_dir"
25288         local dir1=$testdir/dir1
25289         local dir2=$testdir/dir2
25290
25291         mkdir -p $testdir
25292
25293         $LFS setdirstripe -D -c -1 --max-inherit=3 $testdir ||
25294                 error "failed to set default stripe count for $testdir"
25295
25296         mkdir $dir1
25297         local stripe_count=$($LFS getdirstripe -c $dir1)
25298
25299         (( $stripe_count == $MDSCOUNT )) || error "wrong stripe count"
25300
25301         local max_count=$((MDSCOUNT - 1))
25302         local mdts=$(comma_list $(mdts_nodes))
25303
25304         do_nodes $mdts $LCTL set_param lod.*.max_mdt_stripecount=$max_count
25305         stack_trap "do_nodes $mdts $LCTL set_param lod.*.max_mdt_stripecount=0"
25306
25307         mkdir $dir2
25308         stripe_count=$($LFS getdirstripe -c $dir2)
25309
25310         (( $stripe_count == $max_count )) || error "wrong stripe count"
25311 }
25312 run_test 300t "test max_mdt_stripecount"
25313
25314 prepare_remote_file() {
25315         mkdir $DIR/$tdir/src_dir ||
25316                 error "create remote source failed"
25317
25318         cp /etc/hosts $DIR/$tdir/src_dir/a ||
25319                  error "cp to remote source failed"
25320         touch $DIR/$tdir/src_dir/a
25321
25322         $LFS mkdir -i 1 $DIR/$tdir/tgt_dir ||
25323                 error "create remote target dir failed"
25324
25325         touch $DIR/$tdir/tgt_dir/b
25326
25327         mrename $DIR/$tdir/src_dir/a $DIR/$tdir/tgt_dir/b ||
25328                 error "rename dir cross MDT failed!"
25329
25330         $CHECKSTAT -t file $DIR/$tdir/src_dir/a &&
25331                 error "src_child still exists after rename"
25332
25333         $CHECKSTAT -t file $DIR/$tdir/tgt_dir/b ||
25334                 error "missing file(a) after rename"
25335
25336         diff /etc/hosts $DIR/$tdir/tgt_dir/b ||
25337                 error "diff after rename"
25338 }
25339
25340 test_310a() {
25341         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 4 MDTs"
25342         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25343
25344         local remote_file=$DIR/$tdir/tgt_dir/b
25345
25346         mkdir -p $DIR/$tdir
25347
25348         prepare_remote_file || error "prepare remote file failed"
25349
25350         #open-unlink file
25351         $OPENUNLINK $remote_file $remote_file ||
25352                 error "openunlink $remote_file failed"
25353         $CHECKSTAT -a $remote_file || error "$remote_file exists"
25354 }
25355 run_test 310a "open unlink remote file"
25356
25357 test_310b() {
25358         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 4 MDTs"
25359         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25360
25361         local remote_file=$DIR/$tdir/tgt_dir/b
25362
25363         mkdir -p $DIR/$tdir
25364
25365         prepare_remote_file || error "prepare remote file failed"
25366
25367         ln $remote_file $DIR/$tfile || error "link failed for remote file"
25368         $MULTIOP $DIR/$tfile Ouc || error "mulitop failed"
25369         $CHECKSTAT -t file $remote_file || error "check file failed"
25370 }
25371 run_test 310b "unlink remote file with multiple links while open"
25372
25373 test_310c() {
25374         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25375         [[ $MDSCOUNT -lt 4 ]] && skip_env "needs >= 4 MDTs"
25376
25377         local remote_file=$DIR/$tdir/tgt_dir/b
25378
25379         mkdir -p $DIR/$tdir
25380
25381         prepare_remote_file || error "prepare remote file failed"
25382
25383         ln $remote_file $DIR/$tfile || error "link failed for remote file"
25384         multiop_bg_pause $remote_file O_uc ||
25385                         error "mulitop failed for remote file"
25386         MULTIPID=$!
25387         $MULTIOP $DIR/$tfile Ouc
25388         kill -USR1 $MULTIPID
25389         wait $MULTIPID
25390 }
25391 run_test 310c "open-unlink remote file with multiple links"
25392
25393 #LU-4825
25394 test_311() {
25395         [ $PARALLEL == "yes" ] && skip "skip parallel run"
25396         [ $OSTCOUNT -lt 2 ] && skip "needs >= 2 OSTs"
25397         [ $MDS1_VERSION -lt $(version_code 2.8.54) ] &&
25398                 skip "lustre < 2.8.54 does not contain LU-4825 fix"
25399         remote_mds_nodsh && skip "remote MDS with nodsh"
25400
25401         local old_iused=$($LFS df -i | awk '/OST0000/ { print $3; exit; }')
25402         local mdts=$(comma_list $(mdts_nodes))
25403
25404         mkdir -p $DIR/$tdir
25405         $LFS setstripe -i 0 -c 1 $DIR/$tdir
25406         createmany -o $DIR/$tdir/$tfile. 1000
25407
25408         # statfs data is not real time, let's just calculate it
25409         old_iused=$((old_iused + 1000))
25410
25411         local count=$(do_facet $SINGLEMDS "$LCTL get_param -n \
25412                         osp.*OST0000*MDT0000.create_count")
25413         local max_count=$(do_facet $SINGLEMDS "$LCTL get_param -n \
25414                                 osp.*OST0000*MDT0000.max_create_count")
25415         do_nodes $mdts "$LCTL set_param -n osp.*OST0000*.max_create_count=0"
25416
25417         $LFS setstripe -i 0 $DIR/$tdir/$tfile || error "setstripe failed"
25418         local index=$($LFS getstripe -i $DIR/$tdir/$tfile)
25419         [ $index -ne 0 ] || error "$tfile stripe index is 0"
25420
25421         unlinkmany $DIR/$tdir/$tfile. 1000
25422
25423         do_nodes $mdts "$LCTL set_param -n \
25424                         osp.*OST0000*.max_create_count=$max_count"
25425         [ $MDS1_VERSION -lt $(version_code 2.12.51) ] &&
25426                 do_nodes $mdts "$LCTL set_param -n \
25427                                 osp.*OST0000*.create_count=$count"
25428         do_nodes $mdts "$LCTL get_param osp.*OST0000*.create_count" |
25429                         grep "=0" && error "create_count is zero"
25430
25431         local new_iused
25432         for i in $(seq 120); do
25433                 new_iused=$($LFS df -i | awk '/OST0000/ { print $3; exit; }')
25434                 # system may be too busy to destroy all objs in time, use
25435                 # a somewhat small value to not fail autotest
25436                 [ $((old_iused - new_iused)) -gt 400 ] && break
25437                 sleep 1
25438         done
25439
25440         echo "waited $i sec, old Iused $old_iused, new Iused $new_iused"
25441         [ $((old_iused - new_iused)) -gt 400 ] ||
25442                 error "objs not destroyed after unlink"
25443 }
25444 run_test 311 "disable OSP precreate, and unlink should destroy objs"
25445
25446 zfs_get_objid()
25447 {
25448         local ost=$1
25449         local tf=$2
25450         local fid=($($LFS getstripe $tf | grep 0x))
25451         local seq=${fid[3]#0x}
25452         local objid=${fid[1]}
25453
25454         local vdevdir=$(dirname $(facet_vdevice $ost))
25455         local cmd="$ZDB -e -p $vdevdir -ddddd $(facet_device $ost)"
25456         local zfs_zapid=$(do_facet $ost $cmd |
25457                           grep -w "/O/$seq/d$((objid%32))" -C 5 |
25458                           awk '/Object/{getline; print $1}')
25459         local zfs_objid=$(do_facet $ost $cmd $zfs_zapid |
25460                           awk "/$objid = /"'{printf $3}')
25461
25462         echo $zfs_objid
25463 }
25464
25465 zfs_object_blksz() {
25466         local ost=$1
25467         local objid=$2
25468
25469         local vdevdir=$(dirname $(facet_vdevice $ost))
25470         local cmd="$ZDB -e -p $vdevdir -dddd $(facet_device $ost)"
25471         local blksz=$(do_facet $ost $cmd $objid |
25472                       awk '/dblk/{getline; printf $4}')
25473
25474         case "${blksz: -1}" in
25475                 k|K) blksz=$((${blksz:0:$((${#blksz} - 1))}*1024)) ;;
25476                 m|M) blksz=$((${blksz:0:$((${#blksz} - 1))}*1024*1024)) ;;
25477                 *) ;;
25478         esac
25479
25480         echo $blksz
25481 }
25482
25483 test_312() { # LU-4856
25484         remote_ost_nodsh && skip "remote OST with nodsh"
25485         [[ "$ost1_FSTYPE" == "zfs" ]] || skip "the test only applies to zfs"
25486
25487         local max_blksz=$(do_facet ost1 \
25488                           $ZFS get -p recordsize $(facet_device ost1) |
25489                           awk '!/VALUE/{print $3}')
25490         local tf=$DIR/$tfile
25491
25492         $LFS setstripe -c1 $tf
25493         local facet="ost$(($($LFS getstripe -i $tf) + 1))"
25494
25495         # Get ZFS object id
25496         local zfs_objid=$(zfs_get_objid $facet $tf)
25497         # block size change by sequential overwrite
25498         local bs
25499
25500         for ((bs=$PAGE_SIZE; bs <= max_blksz; bs *= 4)) ; do
25501                 dd if=/dev/zero of=$tf bs=$bs count=1 oflag=sync conv=notrunc
25502
25503                 local blksz=$(zfs_object_blksz $facet $zfs_objid)
25504                 [[ $blksz -eq $bs ]] || error "blksz error: $blksz, expected: $bs"
25505         done
25506         rm -f $tf
25507
25508         $LFS setstripe -c1 $tf
25509         facet="ost$(($($LFS getstripe -i $tf) + 1))"
25510
25511         # block size change by sequential append write
25512         dd if=/dev/zero of=$tf bs=$PAGE_SIZE count=1 oflag=sync conv=notrunc
25513         zfs_objid=$(zfs_get_objid $facet $tf)
25514         local count
25515
25516         for ((count = 1; count < $((max_blksz / PAGE_SIZE)); count *= 2)); do
25517                 dd if=/dev/zero of=$tf bs=$PAGE_SIZE count=$count seek=$count \
25518                         oflag=sync conv=notrunc
25519
25520                 blksz=$(zfs_object_blksz $facet $zfs_objid)
25521                 (( $blksz == 2 * count * PAGE_SIZE )) ||
25522                         error "blksz error, actual $blksz, " \
25523                                 "expected: 2 * $count * $PAGE_SIZE"
25524         done
25525         rm -f $tf
25526
25527         # random write
25528         $LFS setstripe -c1 $tf
25529         facet="ost$(($($LFS getstripe -i $tf) + 1))"
25530         zfs_objid=$(zfs_get_objid $facet $tf)
25531
25532         dd if=/dev/zero of=$tf bs=1K count=1 oflag=sync conv=notrunc
25533         blksz=$(zfs_object_blksz $facet $zfs_objid)
25534         (( blksz == PAGE_SIZE )) ||
25535                 error "blksz error: $blksz, expected: $PAGE_SIZE"
25536
25537         dd if=/dev/zero of=$tf bs=64K count=1 oflag=sync conv=notrunc seek=128
25538         blksz=$(zfs_object_blksz $facet $zfs_objid)
25539         (( blksz == 65536 )) || error "blksz error: $blksz, expected: 64k"
25540
25541         dd if=/dev/zero of=$tf bs=1M count=1 oflag=sync conv=notrunc
25542         blksz=$(zfs_object_blksz $facet $zfs_objid)
25543         (( blksz == 65536 )) || error "rewrite error: $blksz, expected: 64k"
25544 }
25545 run_test 312 "make sure ZFS adjusts its block size by write pattern"
25546
25547 test_313() {
25548         remote_ost_nodsh && skip "remote OST with nodsh"
25549
25550         local file=$DIR/$tfile
25551
25552         rm -f $file
25553         $LFS setstripe -c 1 -i 0 $file || error "setstripe failed"
25554
25555         # define OBD_FAIL_TGT_RCVD_EIO           0x720
25556         do_facet ost1 "$LCTL set_param fail_loc=0x720"
25557         dd if=/dev/zero of=$file bs=$PAGE_SIZE oflag=direct count=1 &&
25558                 error "write should failed"
25559         do_facet ost1 "$LCTL set_param fail_loc=0"
25560         rm -f $file
25561 }
25562 run_test 313 "io should fail after last_rcvd update fail"
25563
25564 test_314() {
25565         [ $OSTCOUNT -lt 2 ] && skip "needs >= 2 OSTs"
25566
25567         $LFS setstripe -c 2 -i 0 $DIR/$tfile || error "setstripe failed"
25568         do_facet ost1 "$LCTL set_param fail_loc=0x720"
25569         rm -f $DIR/$tfile
25570         wait_delete_completed
25571         do_facet ost1 "$LCTL set_param fail_loc=0"
25572 }
25573 run_test 314 "OSP shouldn't fail after last_rcvd update failure"
25574
25575 test_315() { # LU-618
25576         [ -f /proc/$$/io ] || skip_env "no IO accounting in kernel"
25577
25578         local file=$DIR/$tfile
25579         rm -f $file
25580
25581         $MULTIOP $file oO_CREAT:O_DIRECT:O_RDWR:w4063232c ||
25582                 error "multiop file write failed"
25583         $MULTIOP $file oO_RDONLY:r4063232_c &
25584         PID=$!
25585
25586         sleep 2
25587
25588         local rbytes=$(awk '/read_bytes/ { print $2 }' /proc/$PID/io)
25589         kill -USR1 $PID
25590
25591         [ $rbytes -gt 4000000 ] || error "read is not accounted ($rbytes)"
25592         rm -f $file
25593 }
25594 run_test 315 "read should be accounted"
25595
25596 test_316() {
25597         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
25598         large_xattr_enabled || skip "ea_inode feature disabled"
25599
25600         mkdir_on_mdt0 $DIR/$tdir || error "mkdir $tdir failed"
25601         mkdir $DIR/$tdir/d || error "mkdir $tdir/d failed"
25602         chown nobody $DIR/$tdir/d || error "chown $tdir/d failed"
25603         touch $DIR/$tdir/d/$tfile || error "touch $tdir/d/$tfile failed"
25604
25605         $LFS migrate -m1 $DIR/$tdir/d || error "lfs migrate -m1 failed"
25606 }
25607 run_test 316 "lfs migrate of file with large_xattr enabled"
25608
25609 test_317() {
25610         [ $MDS1_VERSION -lt $(version_code 2.11.53) ] &&
25611                 skip "Need MDS version at least 2.11.53"
25612         if [ "$ost1_FSTYPE" == "zfs" ]; then
25613                 skip "LU-10370: no implementation for ZFS"
25614         fi
25615
25616         local trunc_sz
25617         local grant_blk_size
25618
25619         grant_blk_size=$($LCTL get_param osc.$FSNAME*.import |
25620                         awk '/grant_block_size:/ { print $2; exit; }')
25621         #
25622         # Create File of size 5M. Truncate it to below size's and verify
25623         # blocks count.
25624         #
25625         dd if=/dev/zero of=$DIR/$tfile bs=5M count=1 conv=fsync ||
25626                 error "Create file $DIR/$tfile failed"
25627         stack_trap "rm -f $DIR/$tfile" EXIT
25628
25629         for trunc_sz in 2097152 4097 4000 509 0; do
25630                 $TRUNCATE $DIR/$tfile $trunc_sz ||
25631                         error "truncate $tfile to $trunc_sz failed"
25632                 local sz=$(stat --format=%s $DIR/$tfile)
25633                 local blk=$(stat --format=%b $DIR/$tfile)
25634                 local trunc_blk=$((((trunc_sz + (grant_blk_size - 1) ) /
25635                                      grant_blk_size) * 8))
25636
25637                 if [[ $blk -ne $trunc_blk ]]; then
25638                         $(which stat) $DIR/$tfile
25639                         error "Expected Block $trunc_blk got $blk for $tfile"
25640                 fi
25641
25642                 $CHECKSTAT -s $trunc_sz $DIR/$tfile ||
25643                         error "Expected Size $trunc_sz got $sz for $tfile"
25644         done
25645
25646         #
25647         # sparse file test
25648         # Create file with a hole and write actual 65536 bytes which aligned
25649         # with 4K and 64K PAGE_SIZE. Block count must be 128.
25650         #
25651         local bs=65536
25652         dd if=/dev/zero of=$DIR/$tfile bs=$bs count=1 seek=5 conv=fsync ||
25653                 error "Create file : $DIR/$tfile"
25654
25655         #
25656         # Truncate to size $trunc_sz bytes. Strip tail blocks and leave only 8
25657         # blocks. The block count must drop to 8.
25658         #
25659         trunc_sz=$(($(stat --format=%s $DIR/$tfile) -
25660                 ((bs - grant_blk_size) + 1)))
25661         $TRUNCATE $DIR/$tfile $trunc_sz ||
25662                 error "truncate $tfile to $trunc_sz failed"
25663
25664         local trunc_bsz=$((grant_blk_size / $(stat --format=%B $DIR/$tfile)))
25665         sz=$(stat --format=%s $DIR/$tfile)
25666         blk=$(stat --format=%b $DIR/$tfile)
25667
25668         if [[ $blk -ne $trunc_bsz ]]; then
25669                 $(which stat) $DIR/$tfile
25670                 error "Expected Block $trunc_bsz got $blk for $tfile"
25671         fi
25672
25673         $CHECKSTAT -s $trunc_sz $DIR/$tfile ||
25674                 error "Expected Size $trunc_sz got $sz for $tfile"
25675 }
25676 run_test 317 "Verify blocks get correctly update after truncate"
25677
25678 test_318() {
25679         local llite_name="llite.$($LFS getname $MOUNT | awk '{print $1}')"
25680         local old_max_active=$($LCTL get_param -n \
25681                             ${llite_name}.max_read_ahead_async_active \
25682                             2>/dev/null)
25683
25684         $LCTL set_param llite.*.max_read_ahead_async_active=256
25685         local max_active=$($LCTL get_param -n \
25686                            ${llite_name}.max_read_ahead_async_active \
25687                            2>/dev/null)
25688         [ $max_active -ne 256 ] && error "expected 256 but got $max_active"
25689
25690         $LCTL set_param llite.*.max_read_ahead_async_active=0 ||
25691                 error "set max_read_ahead_async_active should succeed"
25692
25693         $LCTL set_param llite.*.max_read_ahead_async_active=512
25694         max_active=$($LCTL get_param -n \
25695                      ${llite_name}.max_read_ahead_async_active 2>/dev/null)
25696         [ $max_active -eq 512 ] || error "expected 512 but got $max_active"
25697
25698         # restore @max_active
25699         [ $old_max_active -ne 0 ] && $LCTL set_param \
25700                 llite.*.max_read_ahead_async_active=$old_max_active
25701
25702         local old_threshold=$($LCTL get_param -n \
25703                 ${llite_name}.read_ahead_async_file_threshold_mb 2>/dev/null)
25704         local max_per_file_mb=$($LCTL get_param -n \
25705                 ${llite_name}.max_read_ahead_per_file_mb 2>/dev/null)
25706
25707         local invalid=$(($max_per_file_mb + 1))
25708         $LCTL set_param \
25709                 llite.*.read_ahead_async_file_threshold_mb=$invalid\
25710                         && error "set $invalid should fail"
25711
25712         local valid=$(($invalid - 1))
25713         $LCTL set_param \
25714                 llite.*.read_ahead_async_file_threshold_mb=$valid ||
25715                         error "set $valid should succeed"
25716         local threshold=$($LCTL get_param -n \
25717                 ${llite_name}.read_ahead_async_file_threshold_mb 2>/dev/null)
25718         [ $threshold -eq $valid ] || error \
25719                 "expect threshold $valid got $threshold"
25720         $LCTL set_param \
25721                 llite.*.read_ahead_async_file_threshold_mb=$old_threshold
25722 }
25723 run_test 318 "Verify async readahead tunables"
25724
25725 test_319() {
25726         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
25727
25728         local before=$(date +%s)
25729         local evict
25730         local mdir=$DIR/$tdir
25731         local file=$mdir/xxx
25732
25733         $LFS mkdir -i0 $mdir || error "mkdir $mdir fails"
25734         touch $file
25735
25736 #define OBD_FAIL_LDLM_LOCAL_CANCEL_PAUSE 0x32c
25737         $LCTL set_param fail_val=5 fail_loc=0x8000032c
25738         $LFS migrate -m1 $mdir &
25739
25740         sleep 1
25741         dd if=$file of=/dev/null
25742         wait
25743         evict=$($LCTL get_param mdc.$FSNAME-MDT*.state |
25744           awk -F"[ [,]" '/EVICTED ]$/ { if (mx<$5) {mx=$5;} } END { print mx }')
25745
25746         [ -z "$evict" ] || [[ $evict -le $before ]] || error "eviction happened"
25747 }
25748 run_test 319 "lost lease lock on migrate error"
25749
25750 test_398a() { # LU-4198
25751         local ost1_imp=$(get_osc_import_name client ost1)
25752         local imp_name=$($LCTL list_param osc.$ost1_imp | head -n1 |
25753                          cut -d'.' -f2)
25754
25755         $LFS setstripe -c 1 -i 0 $DIR/$tfile
25756         stack_trap "rm -f $DIR/$tfile"
25757         $LCTL set_param ldlm.namespaces.*.lru_size=clear
25758
25759         # request a new lock on client
25760         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
25761
25762         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 oflag=direct conv=notrunc
25763         local lock_count=$($LCTL get_param -n \
25764                            ldlm.namespaces.$imp_name.lru_size)
25765         [[ $lock_count -eq 0 ]] || error "lock should be cancelled by direct IO"
25766
25767         $LCTL set_param ldlm.namespaces.*-OST0000-osc-ffff*.lru_size=clear
25768
25769         # no lock cached, should use lockless DIO and not enqueue new lock
25770         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 oflag=direct conv=notrunc
25771         lock_count=$($LCTL get_param -n \
25772                      ldlm.namespaces.$imp_name.lru_size)
25773         [[ $lock_count -eq 0 ]] || error "no lock should be held by direct IO"
25774
25775         $LCTL set_param ldlm.namespaces.*-OST0000-osc-ffff*.lru_size=clear
25776
25777         # no lock cached, should use locked DIO append
25778         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1 oflag=direct oflag=append \
25779                 conv=notrunc || error "DIO append failed"
25780         lock_count=$($LCTL get_param -n \
25781                      ldlm.namespaces.*-OST0000-osc-ffff*.lru_size)
25782         [[ $lock_count -ne 0 ]] || error "lock still must be held by DIO append"
25783 }
25784 run_test 398a "direct IO should cancel lock otherwise lockless"
25785
25786 test_398b() { # LU-4198
25787         local before=$(date +%s)
25788         local njobs=4
25789         local size=48
25790
25791         which fio || skip_env "no fio installed"
25792         $LFS setstripe -c -1 -S 1M $DIR/$tfile
25793         dd if=/dev/zero of=$DIR/$tfile bs=1M count=$size
25794
25795         # Single page, multiple pages, stripe size, 4*stripe size
25796         for bsize in $(( $PAGE_SIZE )) $(( 4*$PAGE_SIZE )) 1048576 4194304; do
25797                 echo "mix direct rw ${bsize} by fio with $njobs jobs..."
25798                 fio --name=rand-rw --rw=randrw --bs=$bsize --direct=1 \
25799                         --numjobs=$njobs --fallocate=none \
25800                         --iodepth=16 --allow_file_create=0 \
25801                         --size=$((size/njobs))M \
25802                         --filename=$DIR/$tfile &
25803                 bg_pid=$!
25804
25805                 echo "mix buffer rw ${bsize} by fio with $njobs jobs..."
25806                 fio --name=rand-rw --rw=randrw --bs=$bsize \
25807                         --numjobs=$njobs --fallocate=none \
25808                         --iodepth=16 --allow_file_create=0 \
25809                         --size=$((size/njobs))M \
25810                         --filename=$DIR/$tfile || true
25811                 wait $bg_pid
25812         done
25813
25814         evict=$(do_facet client $LCTL get_param \
25815                 osc.$FSNAME-OST*-osc-*/state |
25816             awk -F"[ [,]" '/EVICTED ]$/ { if (t<$5) {t=$5;} } END { print t }')
25817
25818         [ -z "$evict" ] || [[ $evict -le $before ]] ||
25819                 (do_facet client $LCTL get_param \
25820                         osc.$FSNAME-OST*-osc-*/state;
25821                     error "eviction happened: $evict before:$before")
25822
25823         rm -f $DIR/$tfile
25824 }
25825 run_test 398b "DIO and buffer IO race"
25826
25827 test_398c() { # LU-4198
25828         local ost1_imp=$(get_osc_import_name client ost1)
25829         local imp_name=$($LCTL list_param osc.$ost1_imp | head -n1 |
25830                          cut -d'.' -f2)
25831
25832         which fio || skip_env "no fio installed"
25833
25834         saved_debug=$($LCTL get_param -n debug)
25835         $LCTL set_param debug=0
25836
25837         local size=$(lctl get_param -n osc.$FSNAME-OST0000*.kbytesavail | head -1)
25838         ((size /= 1024)) # by megabytes
25839         ((size /= 2)) # write half of the OST at most
25840         [ $size -gt 40 ] && size=40 #reduce test time anyway
25841
25842         $LFS setstripe -c 1 $DIR/$tfile
25843
25844         # it seems like ldiskfs reserves more space than necessary if the
25845         # writing blocks are not mapped, so it extends the file firstly
25846         dd if=/dev/zero of=$DIR/$tfile bs=1M count=$size && sync
25847         cancel_lru_locks osc
25848
25849         # clear and verify rpc_stats later
25850         $LCTL set_param osc.${FSNAME}-OST0000-osc-ffff*.rpc_stats=clear
25851
25852         local njobs=4
25853         echo "writing ${size}M to OST0 by fio with $njobs jobs..."
25854         fio --name=rand-write --rw=randwrite --bs=$PAGE_SIZE --direct=1 \
25855                 --numjobs=$njobs --fallocate=none --ioengine=libaio \
25856                 --iodepth=16 --allow_file_create=0 --size=$((size/njobs))M \
25857                 --filename=$DIR/$tfile
25858         [ $? -eq 0 ] || error "fio write error"
25859
25860         [ $($LCTL get_param -n ldlm.namespaces.$imp_name.lock_count) -eq 0 ] ||
25861                 error "Locks were requested while doing AIO"
25862
25863         # get the percentage of 1-page I/O
25864         pct=$($LCTL get_param osc.${imp_name}.rpc_stats |
25865                 grep -A 1 'pages per rpc' | grep -v 'pages per rpc' |
25866                 awk '{print $7}')
25867         [ $pct -le 50 ] || error "$pct% of I/O are 1-page"
25868
25869         echo "mix rw ${size}M to OST0 by fio with $njobs jobs..."
25870         fio --name=rand-rw --rw=randrw --bs=$PAGE_SIZE --direct=1 \
25871                 --numjobs=$njobs --fallocate=none --ioengine=libaio \
25872                 --iodepth=16 --allow_file_create=0 --size=$((size/njobs))M \
25873                 --filename=$DIR/$tfile
25874         [ $? -eq 0 ] || error "fio mixed read write error"
25875
25876         echo "AIO with large block size ${size}M"
25877         fio --name=rand-rw --rw=randrw --bs=${size}M --direct=1 \
25878                 --numjobs=1 --fallocate=none --ioengine=libaio \
25879                 --iodepth=16 --allow_file_create=0 --size=${size}M \
25880                 --filename=$DIR/$tfile
25881         [ $? -eq 0 ] || error "fio large block size failed"
25882
25883         rm -f $DIR/$tfile
25884         $LCTL set_param debug="$saved_debug"
25885 }
25886 run_test 398c "run fio to test AIO"
25887
25888 test_398d() { #  LU-13846
25889         which aiocp || skip_env "no aiocp installed"
25890         local aio_file=$DIR/$tfile.aio
25891
25892         $LFS setstripe -c -1 -S 1M $DIR/$tfile $aio_file
25893
25894         dd if=/dev/urandom of=$DIR/$tfile bs=1M count=64
25895         aiocp -a $PAGE_SIZE -b 64M -s 64M -f O_DIRECT $DIR/$tfile $aio_file
25896         stack_trap "rm -f $DIR/$tfile $aio_file"
25897
25898         diff $DIR/$tfile $aio_file || error "file diff after aiocp"
25899
25900         # make sure we don't crash and fail properly
25901         aiocp -a 512 -b 64M -s 64M -f O_DIRECT $DIR/$tfile $aio_file &&
25902                 error "aio not aligned with PAGE SIZE should fail"
25903
25904         rm -f $DIR/$tfile $aio_file
25905 }
25906 run_test 398d "run aiocp to verify block size > stripe size"
25907
25908 test_398e() {
25909         dd if=/dev/zero of=$DIR/$tfile bs=1234 count=1
25910         touch $DIR/$tfile.new
25911         dd if=$DIR/$tfile of=$DIR/$tfile.new bs=1M count=1 oflag=direct
25912 }
25913 run_test 398e "O_Direct open cleared by fcntl doesn't cause hang"
25914
25915 test_398f() { #  LU-14687
25916         which aiocp || skip_env "no aiocp installed"
25917         local aio_file=$DIR/$tfile.aio
25918
25919         $LFS setstripe -c -1 -S 1M $DIR/$tfile $aio_file
25920
25921         dd if=/dev/zero of=$DIR/$tfile bs=1M count=64
25922         stack_trap "rm -f $DIR/$tfile $aio_file"
25923
25924         #define OBD_FAIL_LLITE_PAGE_ALLOC 0x1418
25925         $LCTL set_param fail_loc=0x1418
25926         # make sure we don't crash and fail properly
25927         aiocp -b 64M -s 64M -f O_DIRECT $DIR/$tfile $aio_file &&
25928                 error "aio with page allocation failure succeeded"
25929         $LCTL set_param fail_loc=0
25930         diff $DIR/$tfile $aio_file
25931         [[ $? != 0 ]] || error "no diff after failed aiocp"
25932 }
25933 run_test 398f "verify aio handles ll_direct_rw_pages errors correctly"
25934
25935 # NB: To get the parallel DIO behavior in LU-13798, there must be > 1
25936 # stripe and i/o size must be > stripe size
25937 # Old style synchronous DIO waits after submitting each chunk, resulting in a
25938 # single RPC in flight.  This test shows async DIO submission is working by
25939 # showing multiple RPCs in flight.
25940 test_398g() { #  LU-13798
25941         $LFS setstripe -o 0,0 -S 1M $DIR/$tfile
25942
25943         # We need to do some i/o first to acquire enough grant to put our RPCs
25944         # in flight; otherwise a new connection may not have enough grant
25945         # available
25946         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=1 oflag=direct ||
25947                 error "parallel dio failed"
25948         stack_trap "rm -f $DIR/$tfile"
25949
25950         # Reduce RPC size to 1M to avoid combination in to larger RPCs
25951         local pages_per_rpc=$($LCTL get_param osc.*-OST0000-*.max_pages_per_rpc)
25952         $LCTL set_param osc.*-OST0000-*.max_pages_per_rpc=1M
25953         stack_trap "$LCTL set_param -n $pages_per_rpc"
25954
25955         # Recreate file so it's empty
25956         rm -f $DIR/$tfile
25957         $LFS setstripe -o 0,0 -S 1M $DIR/$tfile
25958         #Pause rpc completion to guarantee we see multiple rpcs in flight
25959         #define OBD_FAIL_OST_BRW_PAUSE_BULK
25960         do_facet ost1 $LCTL set_param fail_loc=0x214 fail_val=2
25961         stack_trap "do_facet ost1 $LCTL set_param fail_loc=0"
25962
25963         # Clear rpc stats
25964         $LCTL set_param osc.*.rpc_stats=c
25965
25966         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=1 oflag=direct ||
25967                 error "parallel dio failed"
25968         stack_trap "rm -f $DIR/$tfile"
25969
25970         $LCTL get_param osc.*-OST0000-*.rpc_stats
25971         pct=$($LCTL get_param osc.*-OST0000-*.rpc_stats |
25972                 grep -A 8 'rpcs in flight' | grep -v 'rpcs in flight' |
25973                 grep "8:" | awk '{print $8}')
25974         # We look at the "8 rpcs in flight" field, and verify A) it is present
25975         # and B) it includes all RPCs.  This proves we had 8 RPCs in flight,
25976         # as expected for an 8M DIO to a file with 1M stripes.
25977         [ $pct -eq 100 ] || error "we should see 8 RPCs in flight"
25978
25979         # Verify turning off parallel dio works as expected
25980         # Clear rpc stats
25981         $LCTL set_param osc.*.rpc_stats=c
25982         $LCTL set_param llite.*.parallel_dio=0
25983         stack_trap '$LCTL set_param llite.*.parallel_dio=1'
25984
25985         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=1 oflag=direct ||
25986                 error "dio with parallel dio disabled failed"
25987
25988         # Ideally, we would see only one RPC in flight here, but there is an
25989         # unavoidable race between i/o completion and RPC in flight counting,
25990         # so while only 1 i/o is in flight at a time, the RPC in flight counter
25991         # will sometimes exceed 1 (3 or 4 is not rare on VM testing).
25992         # So instead we just verify it's always < 8.
25993         $LCTL get_param osc.*-OST0000-*.rpc_stats
25994         ret=$($LCTL get_param osc.*-OST0000-*.rpc_stats |
25995                 grep -A 8 'rpcs in flight' | grep -v 'rpcs in flight' |
25996                 grep '^$' -B1 | grep . | awk '{print $1}')
25997         [ $ret != "8:" ] ||
25998                 error "we should see fewer than 8 RPCs in flight (saw $ret)"
25999 }
26000 run_test 398g "verify parallel dio async RPC submission"
26001
26002 test_398h() { #  LU-13798
26003         local dio_file=$DIR/$tfile.dio
26004
26005         $LFS setstripe -C 2 -S 1M $DIR/$tfile $dio_file
26006
26007         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct
26008         stack_trap "rm -f $DIR/$tfile $dio_file"
26009
26010         dd if=$DIR/$tfile of=$dio_file bs=8M count=8 iflag=direct oflag=direct ||
26011                 error "parallel dio failed"
26012         diff $DIR/$tfile $dio_file
26013         [[ $? == 0 ]] || error "file diff after aiocp"
26014 }
26015 run_test 398h "verify correctness of read & write with i/o size >> stripe size"
26016
26017 test_398i() { #  LU-13798
26018         local dio_file=$DIR/$tfile.dio
26019
26020         $LFS setstripe -C 2 -S 1M $DIR/$tfile $dio_file
26021
26022         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct
26023         stack_trap "rm -f $DIR/$tfile $dio_file"
26024
26025         #define OBD_FAIL_LLITE_PAGE_ALLOC 0x1418
26026         $LCTL set_param fail_loc=0x1418
26027         # make sure we don't crash and fail properly
26028         dd if=$DIR/$tfile of=$dio_file bs=8M count=8 iflag=direct oflag=direct &&
26029                 error "parallel dio page allocation failure succeeded"
26030         diff $DIR/$tfile $dio_file
26031         [[ $? != 0 ]] || error "no diff after failed aiocp"
26032 }
26033 run_test 398i "verify parallel dio handles ll_direct_rw_pages errors correctly"
26034
26035 test_398j() { #  LU-13798
26036         # Stripe size > RPC size but less than i/o size tests split across
26037         # stripes and RPCs for individual i/o op
26038         $LFS setstripe -o 0,0 -S 4M $DIR/$tfile $DIR/$tfile.2
26039
26040         # Reduce RPC size to 1M to guarantee split to multiple RPCs per stripe
26041         local pages_per_rpc=$($LCTL get_param osc.*-OST0000-*.max_pages_per_rpc)
26042         $LCTL set_param osc.*-OST0000-*.max_pages_per_rpc=1M
26043         stack_trap "$LCTL set_param -n $pages_per_rpc"
26044
26045         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct ||
26046                 error "parallel dio write failed"
26047         stack_trap "rm -f $DIR/$tfile $DIR/$tfile.2"
26048
26049         dd if=$DIR/$tfile of=$DIR/$tfile.2 bs=8M count=8 iflag=direct ||
26050                 error "parallel dio read failed"
26051         diff $DIR/$tfile $DIR/$tfile.2
26052         [[ $? == 0 ]] || error "file diff after parallel dio read"
26053 }
26054 run_test 398j "test parallel dio where stripe size > rpc_size"
26055
26056 test_398k() { #  LU-13798
26057         wait_delete_completed
26058         wait_mds_ost_sync
26059
26060         # 4 stripe file; we will cause out of space on OST0
26061         $LFS setstripe -o 0,1,0,1 -S 1M $DIR/$tfile
26062
26063         # Fill OST0 (if it's not too large)
26064         ORIGFREE=$($LCTL get_param -n lov.$FSNAME-clilov-*.kbytesavail |
26065                    head -n1)
26066         if [[ $ORIGFREE -gt $MAXFREE ]]; then
26067                 skip "$ORIGFREE > $MAXFREE skipping out-of-space test on OST0"
26068         fi
26069         $LFS setstripe -i 0 -c 1 $DIR/$tfile.1
26070         dd if=/dev/zero of=$DIR/$tfile.1 bs=1024 count=$MAXFREE &&
26071                 error "dd should fill OST0"
26072         stack_trap "rm -f $DIR/$tfile.1"
26073
26074         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct
26075         err=$?
26076
26077         ls -la $DIR/$tfile
26078         $CHECKSTAT -t file -s 0 $DIR/$tfile ||
26079                 error "file is not 0 bytes in size"
26080
26081         # dd above should not succeed, but don't error until here so we can
26082         # get debug info above
26083         [[ $err != 0 ]] ||
26084                 error "parallel dio write with enospc succeeded"
26085         stack_trap "rm -f $DIR/$tfile"
26086 }
26087 run_test 398k "test enospc on first stripe"
26088
26089 test_398l() { #  LU-13798
26090         wait_delete_completed
26091         wait_mds_ost_sync
26092
26093         # 4 stripe file; we will cause out of space on OST0
26094         # Note the 1M stripe size and the > 1M i/o size mean this ENOSPC
26095         # happens on the second i/o chunk we issue
26096         $LFS setstripe -o 1,0,1,0 -S 1M $DIR/$tfile $DIR/$tfile.2
26097
26098         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=2 oflag=direct
26099         stack_trap "rm -f $DIR/$tfile"
26100
26101         # Fill OST0 (if it's not too large)
26102         ORIGFREE=$($LCTL get_param -n lov.$FSNAME-clilov-*.kbytesavail |
26103                    head -n1)
26104         if [[ $ORIGFREE -gt $MAXFREE ]]; then
26105                 skip "$ORIGFREE > $MAXFREE skipping out-of-space test on OST0"
26106         fi
26107         $LFS setstripe -i 0 -c 1 $DIR/$tfile.1
26108         dd if=/dev/zero of=$DIR/$tfile.1 bs=1024 count=$MAXFREE &&
26109                 error "dd should fill OST0"
26110         stack_trap "rm -f $DIR/$tfile.1"
26111
26112         dd if=$DIR/$tfile of=$DIR/$tfile.2 bs=8M count=8 oflag=direct
26113         err=$?
26114         stack_trap "rm -f $DIR/$tfile.2"
26115
26116         # Check that short write completed as expected
26117         ls -la $DIR/$tfile.2
26118         $CHECKSTAT -t file -s 1048576 $DIR/$tfile.2 ||
26119                 error "file is not 1M in size"
26120
26121         # dd above should not succeed, but don't error until here so we can
26122         # get debug info above
26123         [[ $err != 0 ]] ||
26124                 error "parallel dio write with enospc succeeded"
26125
26126         # Truncate source file to same length as output file and diff them
26127         $TRUNCATE $DIR/$tfile 1048576
26128         diff $DIR/$tfile $DIR/$tfile.2
26129         [[ $? == 0 ]] || error "data incorrect after short write"
26130 }
26131 run_test 398l "test enospc on intermediate stripe/RPC"
26132
26133 test_398m() { #  LU-13798
26134         $LFS setstripe -o 0,1,0,1 -S 1M $DIR/$tfile
26135
26136         # Set up failure on OST0, the first stripe:
26137         #define OBD_FAIL_OST_BRW_WRITE_BULK     0x20e
26138         #NB: Fail val is ost # + 1, because we cannot use cfs_fail_val = 0
26139         # OST0 is on ost1, OST1 is on ost2.
26140         # So this fail_val specifies OST0
26141         do_facet ost1 $LCTL set_param fail_loc=0x20e fail_val=1
26142         stack_trap "do_facet ost1 $LCTL set_param fail_loc=0"
26143
26144         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct &&
26145                 error "parallel dio write with failure on first stripe succeeded"
26146         stack_trap "rm -f $DIR/$tfile"
26147         do_facet ost1 $LCTL set_param fail_loc=0 fail_val=0
26148
26149         # Place data in file for read
26150         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct ||
26151                 error "parallel dio write failed"
26152
26153         # Fail read on OST0, first stripe
26154         #define OBD_FAIL_OST_BRW_READ_BULK       0x20f
26155         do_facet ost1 $LCTL set_param fail_loc=0x20f fail_val=1
26156         dd if=$DIR/$tfile of=$DIR/$tfile.2 bs=8M count=8 iflag=direct &&
26157                 error "parallel dio read with error on first stripe succeeded"
26158         rm -f $DIR/$tfile.2
26159         do_facet ost1 $LCTL set_param fail_loc=0 fail_val=0
26160
26161         # Switch to testing on OST1, second stripe
26162         # Clear file contents, maintain striping
26163         echo > $DIR/$tfile
26164         # Set up failure on OST1, second stripe:
26165         do_facet ost2 $LCTL set_param fail_loc=0x20e fail_val=2
26166         stack_trap "do_facet ost2 $LCTL set_param fail_loc=0"
26167
26168         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct &&
26169                 error "parallel dio write with failure on second stripe succeeded"
26170         stack_trap "rm -f $DIR/$tfile"
26171         do_facet ost2 $LCTL set_param fail_loc=0 fail_val=0
26172
26173         # Place data in file for read
26174         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 oflag=direct ||
26175                 error "parallel dio write failed"
26176
26177         # Fail read on OST1, second stripe
26178         #define OBD_FAIL_OST_BRW_READ_BULK       0x20f
26179         do_facet ost2 $LCTL set_param fail_loc=0x20f fail_val=2
26180         dd if=$DIR/$tfile of=$DIR/$tfile.2 bs=8M count=8 iflag=direct &&
26181                 error "parallel dio read with error on second stripe succeeded"
26182         rm -f $DIR/$tfile.2
26183         do_facet ost2 $LCTL set_param fail_loc=0 fail_val=0
26184 }
26185 run_test 398m "test RPC failures with parallel dio"
26186
26187 # Parallel submission of DIO should not cause problems for append, but it's
26188 # important to verify.
26189 test_398n() { #  LU-13798
26190         $LFS setstripe -C 2 -S 1M $DIR/$tfile
26191
26192         dd if=/dev/urandom of=$DIR/$tfile bs=8M count=8 ||
26193                 error "dd to create source file failed"
26194         stack_trap "rm -f $DIR/$tfile"
26195
26196         dd if=$DIR/$tfile of=$DIR/$tfile.1 bs=8M count=8 oflag=direct oflag=append ||
26197                 error "parallel dio write with failure on second stripe succeeded"
26198         stack_trap "rm -f $DIR/$tfile $DIR/$tfile.1"
26199         diff $DIR/$tfile $DIR/$tfile.1
26200         [[ $? == 0 ]] || error "data incorrect after append"
26201
26202 }
26203 run_test 398n "test append with parallel DIO"
26204
26205 test_398o() {
26206         directio rdwr $DIR/$tfile 0 1 1 || error "bad KMS"
26207 }
26208 run_test 398o "right kms with DIO"
26209
26210 test_398p()
26211 {
26212         (( $OSTCOUNT >= 2 )) || skip "needs >= 2 OSTs"
26213         which aiocp || skip_env "no aiocp installed"
26214
26215         local stripe_size=$((1024 * 1024)) #1 MiB
26216         # Max i/o below is ~ 4 * stripe_size, so this gives ~5 i/os
26217         local file_size=$((25 * stripe_size))
26218
26219         $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.1
26220         stack_trap "rm -f $DIR/$tfile*"
26221         # Just a bit bigger than the largest size in the test set below
26222         dd if=/dev/urandom bs=$file_size count=1 of=$DIR/$tfile.1 ||
26223                 error "buffered i/o to create file failed"
26224
26225         for bs in $PAGE_SIZE $((PAGE_SIZE * 4)) $stripe_size \
26226                 $((stripe_size * 4)); do
26227
26228                 $LFS setstripe -c 2 -S $stripe_size $DIR/$tfile.2
26229
26230                 echo "bs: $bs, file_size $file_size"
26231                 aiocp -a $PAGE_SIZE -b $bs -s $file_size -f O_DIRECT \
26232                         $DIR/$tfile.1 $DIR/$tfile.2 &
26233                 pid_dio1=$!
26234                 # Buffered I/O with similar but not the same block size
26235                 dd if=$DIR/$tfile.1 bs=$((bs * 2)) of=$DIR/$tfile.2 \
26236                         conv=notrunc &
26237                 pid_bio2=$!
26238                 wait $pid_dio1
26239                 rc1=$?
26240                 wait $pid_bio2
26241                 rc2=$?
26242                 if (( rc1 != 0 )); then
26243                         error "aio copy 1 w/bsize $bs failed: $rc1"
26244                 fi
26245                 if (( rc2 != 0 )); then
26246                         error "buffered copy 2 w/bsize $bs failed: $rc2"
26247                 fi
26248
26249                 $CHECKSTAT -t file -s $file_size $DIR/$tfile.2 ||
26250                         error "size incorrect"
26251                 cmp --verbose $DIR/$tfile.1 $DIR/$tfile.2 ||
26252                         error "files differ, bsize $bs"
26253                 rm -f $DIR/$tfile.2
26254         done
26255 }
26256 run_test 398p "race aio with buffered i/o"
26257
26258 test_fake_rw() {
26259         local read_write=$1
26260         if [ "$read_write" = "write" ]; then
26261                 local dd_cmd="dd if=/dev/zero of=$DIR/$tfile"
26262         elif [ "$read_write" = "read" ]; then
26263                 local dd_cmd="dd of=/dev/null if=$DIR/$tfile"
26264         else
26265                 error "argument error"
26266         fi
26267
26268         # turn off debug for performance testing
26269         local saved_debug=$($LCTL get_param -n debug)
26270         $LCTL set_param debug=0
26271
26272         $LFS setstripe -c 1 -i 0 $DIR/$tfile
26273
26274         # get ost1 size - $FSNAME-OST0000
26275         local ost1_avail_size=$($LFS df $DIR | awk /${ost1_svc}/'{ print $4 }')
26276         local blocks=$((ost1_avail_size/2/1024)) # half avail space by megabytes
26277         [ $blocks -gt 1000 ] && blocks=1000 # 1G in maximum
26278
26279         if [ "$read_write" = "read" ]; then
26280                 $TRUNCATE $DIR/$tfile $(expr 1048576 \* $blocks)
26281         fi
26282
26283         local start_time=$(date +%s.%N)
26284         $dd_cmd bs=1M count=$blocks oflag=sync ||
26285                 error "real dd $read_write error"
26286         local duration=$(bc <<< "$(date +%s.%N) - $start_time")
26287
26288         if [ "$read_write" = "write" ]; then
26289                 rm -f $DIR/$tfile
26290         fi
26291
26292         # define OBD_FAIL_OST_FAKE_RW           0x238
26293         do_facet ost1 $LCTL set_param fail_loc=0x238
26294
26295         local start_time=$(date +%s.%N)
26296         $dd_cmd bs=1M count=$blocks oflag=sync ||
26297                 error "fake dd $read_write error"
26298         local duration_fake=$(bc <<< "$(date +%s.%N) - $start_time")
26299
26300         if [ "$read_write" = "write" ]; then
26301                 # verify file size
26302                 cancel_lru_locks osc
26303                 $CHECKSTAT -t file -s $((blocks * 1024 * 1024)) $DIR/$tfile ||
26304                         error "$tfile size not $blocks MB"
26305         fi
26306         do_facet ost1 $LCTL set_param fail_loc=0
26307
26308         echo "fake $read_write $duration_fake vs. normal $read_write" \
26309                 "$duration in seconds"
26310         [ $(bc <<< "$duration_fake < $duration") -eq 1 ] ||
26311                 error_not_in_vm "fake write is slower"
26312
26313         $LCTL set_param -n debug="$saved_debug"
26314         rm -f $DIR/$tfile
26315 }
26316 test_399a() { # LU-7655 for OST fake write
26317         remote_ost_nodsh && skip "remote OST with nodsh"
26318
26319         test_fake_rw write
26320 }
26321 run_test 399a "fake write should not be slower than normal write"
26322
26323 test_399b() { # LU-8726 for OST fake read
26324         remote_ost_nodsh && skip "remote OST with nodsh"
26325         if [ "$ost1_FSTYPE" != "ldiskfs" ]; then
26326                 skip_env "ldiskfs only test"
26327         fi
26328
26329         test_fake_rw read
26330 }
26331 run_test 399b "fake read should not be slower than normal read"
26332
26333 test_400a() { # LU-1606, was conf-sanity test_74
26334         if ! which $CC > /dev/null 2>&1; then
26335                 skip_env "$CC is not installed"
26336         fi
26337
26338         local extra_flags=''
26339         local out=$TMP/$tfile
26340         local prefix=/usr/include/lustre
26341         local prog
26342
26343         # Oleg removes .c files in his test rig so test if any c files exist
26344         [[ -n "$(ls -A $LUSTRE_TESTS_API_DIR)" ]] ||
26345                 skip_env "Needed .c test files are missing"
26346
26347         if ! [[ -d $prefix ]]; then
26348                 # Assume we're running in tree and fixup the include path.
26349                 extra_flags+=" -I$LUSTRE/../lnet/include/uapi"
26350                 extra_flags+=" -I$LUSTRE/include/uapi -I$LUSTRE/include"
26351                 extra_flags+=" -L$LUSTRE/utils/.libs"
26352         fi
26353
26354         for prog in $LUSTRE_TESTS_API_DIR/*.c; do
26355                 $CC -Wall -Werror $extra_flags -o $out $prog -llustreapi ||
26356                         error "client api broken"
26357         done
26358         rm -f $out
26359 }
26360 run_test 400a "Lustre client api program can compile and link"
26361
26362 test_400b() { # LU-1606, LU-5011
26363         local header
26364         local out=$TMP/$tfile
26365         local prefix=/usr/include/linux/lustre
26366
26367         # We use a hard coded prefix so that this test will not fail
26368         # when run in tree. There are headers in lustre/include/lustre/
26369         # that are not packaged (like lustre_idl.h) and have more
26370         # complicated include dependencies (like config.h and lnet/types.h).
26371         # Since this test about correct packaging we just skip them when
26372         # they don't exist (see below) rather than try to fixup cppflags.
26373
26374         if ! which $CC > /dev/null 2>&1; then
26375                 skip_env "$CC is not installed"
26376         fi
26377
26378         for header in $prefix/*.h; do
26379                 if ! [[ -f "$header" ]]; then
26380                         continue
26381                 fi
26382
26383                 if [[ "$(basename $header)" == lustre_ioctl.h ]]; then
26384                         continue # lustre_ioctl.h is internal header
26385                 fi
26386
26387                 $CC -Wall -Werror -include $header -c -x c /dev/null -o $out ||
26388                         error "cannot compile '$header'"
26389         done
26390         rm -f $out
26391 }
26392 run_test 400b "packaged headers can be compiled"
26393
26394 test_401a() { #LU-7437
26395         local printf_arg=$(find -printf 2>&1 | grep "unrecognized:")
26396         [ -n "$printf_arg" ] && skip_env "find does not support -printf"
26397
26398         #count the number of parameters by "list_param -R"
26399         local params=$($LCTL list_param -R '*' 2>/dev/null | wc -l)
26400         #count the number of parameters by listing proc files
26401         local proc_dirs=$(eval \ls -d $proc_regexp 2>/dev/null)
26402         echo "proc_dirs='$proc_dirs'"
26403         [ -n "$proc_dirs" ] || error "no proc_dirs on $HOSTNAME"
26404         local procs=$(find -L $proc_dirs -mindepth 1 -printf '%P\n' 2>/dev/null|
26405                       sort -u | wc -l)
26406
26407         [ $params -eq $procs ] ||
26408                 error "found $params parameters vs. $procs proc files"
26409
26410         # test the list_param -D option only returns directories
26411         params=$($LCTL list_param -R -D '*' 2>/dev/null | wc -l)
26412         #count the number of parameters by listing proc directories
26413         procs=$(find -L $proc_dirs -mindepth 1 -type d -printf '%P\n' 2>/dev/null |
26414                 sort -u | wc -l)
26415
26416         [ $params -eq $procs ] ||
26417                 error "found $params parameters vs. $procs proc files"
26418 }
26419 run_test 401a "Verify if 'lctl list_param -R' can list parameters recursively"
26420
26421 test_401b() {
26422         # jobid_var may not allow arbitrary values, so use jobid_name
26423         # if available
26424         if $LCTL list_param jobid_name > /dev/null 2>&1; then
26425                 local testname=jobid_name tmp='testing%p'
26426         else
26427                 local testname=jobid_var tmp=testing
26428         fi
26429
26430         local save=$($LCTL get_param -n $testname)
26431
26432         $LCTL set_param foo=bar $testname=$tmp bar=baz &&
26433                 error "no error returned when setting bad parameters"
26434
26435         local jobid_new=$($LCTL get_param -n foe $testname baz)
26436         [[ "$jobid_new" == "$tmp" ]] || error "jobid tmp $jobid_new != $tmp"
26437
26438         $LCTL set_param -n fog=bam $testname=$save bat=fog
26439         local jobid_old=$($LCTL get_param -n foe $testname bag)
26440         [[ "$jobid_old" == "$save" ]] || error "jobid new $jobid_old != $save"
26441 }
26442 run_test 401b "Verify 'lctl {get,set}_param' continue after error"
26443
26444 test_401c() {
26445         # jobid_var may not allow arbitrary values, so use jobid_name
26446         # if available
26447         if $LCTL list_param jobid_name > /dev/null 2>&1; then
26448                 local testname=jobid_name
26449         else
26450                 local testname=jobid_var
26451         fi
26452
26453         local jobid_var_old=$($LCTL get_param -n $testname)
26454         local jobid_var_new
26455
26456         $LCTL set_param $testname= &&
26457                 error "no error returned for 'set_param a='"
26458
26459         jobid_var_new=$($LCTL get_param -n $testname)
26460         [[ "$jobid_var_old" == "$jobid_var_new" ]] ||
26461                 error "$testname was changed by setting without value"
26462
26463         $LCTL set_param $testname &&
26464                 error "no error returned for 'set_param a'"
26465
26466         jobid_var_new=$($LCTL get_param -n $testname)
26467         [[ "$jobid_var_old" == "$jobid_var_new" ]] ||
26468                 error "$testname was changed by setting without value"
26469 }
26470 run_test 401c "Verify 'lctl set_param' without value fails in either format."
26471
26472 test_401d() {
26473         # jobid_var may not allow arbitrary values, so use jobid_name
26474         # if available
26475         if $LCTL list_param jobid_name > /dev/null 2>&1; then
26476                 local testname=jobid_name new_value='foo=bar%p'
26477         else
26478                 local testname=jobid_var new_valuie=foo=bar
26479         fi
26480
26481         local jobid_var_old=$($LCTL get_param -n $testname)
26482         local jobid_var_new
26483
26484         $LCTL set_param $testname=$new_value ||
26485                 error "'set_param a=b' did not accept a value containing '='"
26486
26487         jobid_var_new=$($LCTL get_param -n $testname)
26488         [[ "$jobid_var_new" == "$new_value" ]] ||
26489                 error "'set_param a=b' failed on a value containing '='"
26490
26491         # Reset the $testname to test the other format
26492         $LCTL set_param $testname=$jobid_var_old
26493         jobid_var_new=$($LCTL get_param -n $testname)
26494         [[ "$jobid_var_new" == "$jobid_var_old" ]] ||
26495                 error "failed to reset $testname"
26496
26497         $LCTL set_param $testname $new_value ||
26498                 error "'set_param a b' did not accept a value containing '='"
26499
26500         jobid_var_new=$($LCTL get_param -n $testname)
26501         [[ "$jobid_var_new" == "$new_value" ]] ||
26502                 error "'set_param a b' failed on a value containing '='"
26503
26504         $LCTL set_param $testname $jobid_var_old
26505         jobid_var_new=$($LCTL get_param -n $testname)
26506         [[ "$jobid_var_new" == "$jobid_var_old" ]] ||
26507                 error "failed to reset $testname"
26508 }
26509 run_test 401d "Verify 'lctl set_param' accepts values containing '='"
26510
26511 test_401e() { # LU-14779
26512         $LCTL list_param -R "ldlm.namespaces.MGC*" ||
26513                 error "lctl list_param MGC* failed"
26514         $LCTL get_param "ldlm.namespaces.MGC*" || error "lctl get_param failed"
26515         $LCTL get_param "ldlm.namespaces.MGC*.lru_size" ||
26516                 error "lctl get_param lru_size failed"
26517 }
26518 run_test 401e "verify 'lctl get_param' works with NID in parameter"
26519
26520 test_402() {
26521         [[ $MDS1_VERSION -ge $(version_code 2.7.66) ]] ||
26522         [[ $MDS1_VERSION -ge $(version_code 2.7.18.4) &&
26523                 $MDS1_VERSION -lt $(version_code 2.7.50) ]] ||
26524         [[ $MDS1_VERSION -ge $(version_code 2.7.2) &&
26525                 $MDS1_VERSION -lt $(version_code 2.7.11) ]] ||
26526                 skip "Need MDS version 2.7.2+ or 2.7.18.4+ or 2.7.66+"
26527         remote_mds_nodsh && skip "remote MDS with nodsh"
26528
26529         $LFS setdirstripe -i 0 $DIR/$tdir || error "setdirstripe -i 0 failed"
26530 #define OBD_FAIL_MDS_FLD_LOOKUP 0x15c
26531         do_facet mds1 "lctl set_param fail_loc=0x8000015c"
26532         touch $DIR/$tdir/$tfile && error "touch should fail with ENOENT" ||
26533                 echo "Touch failed - OK"
26534 }
26535 run_test 402 "Return ENOENT to lod_generate_and_set_lovea"
26536
26537 test_403() {
26538         local file1=$DIR/$tfile.1
26539         local file2=$DIR/$tfile.2
26540         local tfile=$TMP/$tfile
26541
26542         rm -f $file1 $file2 $tfile
26543
26544         touch $file1
26545         ln $file1 $file2
26546
26547         # 30 sec OBD_TIMEOUT in ll_getattr()
26548         # right before populating st_nlink
26549         $LCTL set_param fail_loc=0x80001409
26550         stat -c %h $file1 > $tfile &
26551
26552         # create an alias, drop all locks and reclaim the dentry
26553         < $file2
26554         cancel_lru_locks mdc
26555         cancel_lru_locks osc
26556         sysctl -w vm.drop_caches=2
26557
26558         wait
26559
26560         [ $(cat $tfile) -gt 0 ] || error "wrong nlink count: $(cat $tfile)"
26561
26562         rm -f $tfile $file1 $file2
26563 }
26564 run_test 403 "i_nlink should not drop to zero due to aliasing"
26565
26566 test_404() { # LU-6601
26567         [[ $MDS1_VERSION -ge $(version_code 2.8.53) ]] ||
26568                 skip "Need server version newer than 2.8.52"
26569         remote_mds_nodsh && skip "remote MDS with nodsh"
26570
26571         local mosps=$(do_facet $SINGLEMDS $LCTL dl |
26572                 awk '/osp .*-osc-MDT/ { print $4}')
26573
26574         local osp
26575         for osp in $mosps; do
26576                 echo "Deactivate: " $osp
26577                 do_facet $SINGLEMDS $LCTL --device %$osp deactivate
26578                 local stat=$(do_facet $SINGLEMDS $LCTL dl |
26579                         awk -vp=$osp '$4 == p { print $2 }')
26580                 [ $stat = IN ] || {
26581                         do_facet $SINGLEMDS $LCTL dl | grep -w $osp
26582                         error "deactivate error"
26583                 }
26584                 echo "Activate: " $osp
26585                 do_facet $SINGLEMDS $LCTL --device %$osp activate
26586                 local stat=$(do_facet $SINGLEMDS $LCTL dl |
26587                         awk -vp=$osp '$4 == p { print $2 }')
26588                 [ $stat = UP ] || {
26589                         do_facet $SINGLEMDS $LCTL dl | grep -w $osp
26590                         error "activate error"
26591                 }
26592         done
26593 }
26594 run_test 404 "validate manual {de}activated works properly for OSPs"
26595
26596 test_405() {
26597         [ -n "$FILESET" ] && skip "Not functional for FILESET set"
26598         [ $MDS1_VERSION -lt $(version_code 2.6.92) ] ||
26599                 [ $CLIENT_VERSION -lt $(version_code 2.6.99) ] &&
26600                         skip "Layout swap lock is not supported"
26601
26602         check_swap_layouts_support
26603         check_swap_layout_no_dom $DIR
26604
26605         test_mkdir $DIR/$tdir
26606         swap_lock_test -d $DIR/$tdir ||
26607                 error "One layout swap locked test failed"
26608 }
26609 run_test 405 "Various layout swap lock tests"
26610
26611 test_406() {
26612         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
26613         [ $OSTCOUNT -lt 2 ] && skip_env "needs >= 2 OSTs"
26614         [ -n "$FILESET" ] && skip "SKIP due to FILESET set"
26615         [ $PARALLEL == "yes" ] && skip "skip parallel run"
26616         [ $MDS1_VERSION -lt $(version_code 2.8.50) ] &&
26617                 skip "Need MDS version at least 2.8.50"
26618
26619         local def_stripe_size=$($LFS getstripe -S $MOUNT)
26620         local test_pool=$TESTNAME
26621
26622         pool_add $test_pool || error "pool_add failed"
26623         pool_add_targets $test_pool 0 $(($OSTCOUNT - 1)) 1 ||
26624                 error "pool_add_targets failed"
26625
26626         save_layout_restore_at_exit $MOUNT
26627
26628         # parent set default stripe count only, child will stripe from both
26629         # parent and fs default
26630         $LFS setstripe -c 1 -i 1 -S $((def_stripe_size * 2)) -p $test_pool $MOUNT ||
26631                 error "setstripe $MOUNT failed"
26632         $LFS mkdir -c $MDSCOUNT $DIR/$tdir || error "mkdir $tdir failed"
26633         $LFS setstripe -c $OSTCOUNT $DIR/$tdir || error "setstripe $tdir failed"
26634         for i in $(seq 10); do
26635                 local f=$DIR/$tdir/$tfile.$i
26636                 touch $f || error "touch failed"
26637                 local count=$($LFS getstripe -c $f)
26638                 [ $count -eq $OSTCOUNT ] ||
26639                         error "$f stripe count $count != $OSTCOUNT"
26640                 local offset=$($LFS getstripe -i $f)
26641                 [ $offset -eq 1 ] || error "$f stripe offset $offset != 1"
26642                 local size=$($LFS getstripe -S $f)
26643                 [ $size -eq $((def_stripe_size * 2)) ] ||
26644                         error "$f stripe size $size != $((def_stripe_size * 2))"
26645                 local pool=$($LFS getstripe -p $f)
26646                 [ $pool == $test_pool ] || error "$f pool $pool != $test_pool"
26647         done
26648
26649         # change fs default striping, delete parent default striping, now child
26650         # will stripe from new fs default striping only
26651         $LFS setstripe -c 1 -S $def_stripe_size -i 0 $MOUNT ||
26652                 error "change $MOUNT default stripe failed"
26653         $LFS setstripe -c 0 $DIR/$tdir ||
26654                 error "delete $tdir default stripe failed"
26655         for i in $(seq 11 20); do
26656                 local f=$DIR/$tdir/$tfile.$i
26657                 touch $f || error "touch $f failed"
26658                 local count=$($LFS getstripe -c $f)
26659                 [ $count -eq 1 ] || error "$f stripe count $count != 1"
26660                 local offset=$($LFS getstripe -i $f)
26661                 [ $offset -eq 0 ] || error "$f stripe offset $offset != 0"
26662                 local size=$($LFS getstripe -S $f)
26663                 [ $size -eq $def_stripe_size ] ||
26664                         error "$f stripe size $size != $def_stripe_size"
26665                 local pool=$($LFS getstripe -p $f)
26666                 [ $pool == $test_pool ] || error "$f pool $pool isn't set"
26667         done
26668
26669         unlinkmany $DIR/$tdir/$tfile. 1 20
26670
26671         local f=$DIR/$tdir/$tfile
26672         pool_remove_all_targets $test_pool $f
26673         pool_remove $test_pool $f
26674 }
26675 run_test 406 "DNE support fs default striping"
26676
26677 test_407() {
26678         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
26679         [[ $MDS1_VERSION -lt $(version_code 2.8.55) ]] &&
26680                 skip "Need MDS version at least 2.8.55"
26681         remote_mds_nodsh && skip "remote MDS with nodsh"
26682
26683         $LFS mkdir -i 0 -c 1 $DIR/$tdir.0 ||
26684                 error "$LFS mkdir -i 0 -c 1 $tdir.0 failed"
26685         $LFS mkdir -i 1 -c 1 $DIR/$tdir.1 ||
26686                 error "$LFS mkdir -i 1 -c 1 $tdir.1 failed"
26687         touch $DIR/$tdir.0/$tfile.0 || error "touch $tdir.0/$tfile.0 failed"
26688
26689         #define OBD_FAIL_DT_TXN_STOP    0x2019
26690         for idx in $(seq $MDSCOUNT); do
26691                 do_facet mds$idx "lctl set_param fail_loc=0x2019"
26692         done
26693         $LFS mkdir -c 2 $DIR/$tdir && error "$LFS mkdir -c 2 $tdir should fail"
26694         mv $DIR/$tdir.0/$tfile.0 $DIR/$tdir.1/$tfile.1 &&
26695                 error "mv $tdir.0/$tfile.0 $tdir.1/$tfile.1 should fail"
26696         true
26697 }
26698 run_test 407 "transaction fail should cause operation fail"
26699
26700 test_408() {
26701         dd if=/dev/zero of=$DIR/$tfile bs=$PAGE_SIZE count=1 oflag=direct
26702
26703         #define OBD_FAIL_OSC_BRW_PREP_REQ2        0x40a
26704         lctl set_param fail_loc=0x8000040a
26705         # let ll_prepare_partial_page() fail
26706         dd if=/dev/zero of=$DIR/$tfile bs=2048 count=1 conv=notrunc || true
26707
26708         rm -f $DIR/$tfile
26709
26710         # create at least 100 unused inodes so that
26711         # shrink_icache_memory(0) should not return 0
26712         touch $DIR/$tfile-{0..100}
26713         rm -f $DIR/$tfile-{0..100}
26714         sync
26715
26716         echo 2 > /proc/sys/vm/drop_caches
26717 }
26718 run_test 408 "drop_caches should not hang due to page leaks"
26719
26720 test_409()
26721 {
26722         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
26723
26724         mkdir -p $DIR/$tdir || error "(0) Fail to mkdir"
26725         $LFS mkdir -i 1 -c 2 $DIR/$tdir/foo || error "(1) Fail to mkdir"
26726         touch $DIR/$tdir/guard || error "(2) Fail to create"
26727
26728         local PREFIX=$(str_repeat 'A' 128)
26729         echo "Create 1K hard links start at $(date)"
26730         createmany -l $DIR/$tdir/guard $DIR/$tdir/foo/${PREFIX}_ 1000 ||
26731                 error "(3) Fail to hard link"
26732
26733         echo "Links count should be right although linkEA overflow"
26734         stat $DIR/$tdir/guard || error "(4) Fail to stat"
26735         local linkcount=$(stat --format=%h $DIR/$tdir/guard)
26736         [ $linkcount -eq 1001 ] ||
26737                 error "(5) Unexpected hard links count: $linkcount"
26738
26739         echo "List all links start at $(date)"
26740         ls -l $DIR/$tdir/foo > /dev/null ||
26741                 error "(6) Fail to list $DIR/$tdir/foo"
26742
26743         echo "Unlink hard links start at $(date)"
26744         unlinkmany $DIR/$tdir/foo/${PREFIX}_ 1000 ||
26745                 error "(7) Fail to unlink"
26746         echo "Unlink hard links finished at $(date)"
26747 }
26748 run_test 409 "Large amount of cross-MDTs hard links on the same file"
26749
26750 test_410()
26751 {
26752         [[ $CLIENT_VERSION -lt $(version_code 2.9.59) ]] &&
26753                 skip "Need client version at least 2.9.59"
26754         [ -f $LUSTRE/tests/kernel/kinode.ko ] ||
26755                 skip "Need MODULES build"
26756
26757         # Create a file, and stat it from the kernel
26758         local testfile=$DIR/$tfile
26759         touch $testfile
26760
26761         local run_id=$RANDOM
26762         local my_ino=$(stat --format "%i" $testfile)
26763
26764         # Try to insert the module. This will always fail as the
26765         # module is designed to not be inserted.
26766         insmod $LUSTRE/tests/kernel/kinode.ko run_id=$run_id fname=$testfile \
26767             &> /dev/null
26768
26769         # Anything but success is a test failure
26770         dmesg | grep -q \
26771             "lustre_kinode_$run_id: inode numbers are identical: $my_ino" ||
26772             error "no inode match"
26773 }
26774 run_test 410 "Test inode number returned from kernel thread"
26775
26776 cleanup_test411_cgroup() {
26777         trap 0
26778         rmdir "$1"
26779 }
26780
26781 test_411() {
26782         local cg_basedir=/sys/fs/cgroup/memory
26783         # LU-9966
26784         test -f "$cg_basedir/memory.kmem.limit_in_bytes" ||
26785                 skip "no setup for cgroup"
26786
26787         dd if=/dev/zero of=$DIR/$tfile bs=1M count=100 conv=fsync ||
26788                 error "test file creation failed"
26789         cancel_lru_locks osc
26790
26791         # Create a very small memory cgroup to force a slab allocation error
26792         local cgdir=$cg_basedir/osc_slab_alloc
26793         mkdir $cgdir || error "cgroup mkdir '$cgdir' failed"
26794         trap "cleanup_test411_cgroup $cgdir" EXIT
26795         echo 2M > $cgdir/memory.kmem.limit_in_bytes
26796         echo 1M > $cgdir/memory.limit_in_bytes
26797
26798         # Should not LBUG, just be killed by oom-killer
26799         # dd will return 0 even allocation failure in some environment.
26800         # So don't check return value
26801         bash -c "echo \$$ > $cgdir/tasks && dd if=$DIR/$tfile of=/dev/null"
26802         cleanup_test411_cgroup $cgdir
26803
26804         return 0
26805 }
26806 run_test 411 "Slab allocation error with cgroup does not LBUG"
26807
26808 test_412() {
26809         (( $MDSCOUNT > 1 )) || skip_env "needs >= 2 MDTs"
26810         (( $MDS1_VERSION >= $(version_code 2.10.55) )) ||
26811                 skip "Need server version at least 2.10.55"
26812
26813         $LFS mkdir -i $((MDSCOUNT - 1)),$((MDSCOUNT - 2)) $DIR/$tdir ||
26814                 error "mkdir failed"
26815         $LFS getdirstripe $DIR/$tdir
26816         local stripe_index=$($LFS getdirstripe -i $DIR/$tdir)
26817         [ $stripe_index -eq $((MDSCOUNT - 1)) ] ||
26818                 error "expect $((MDSCOUT - 1)) get $stripe_index"
26819         local stripe_count=$($LFS getdirstripe -T $DIR/$tdir)
26820         [ $stripe_count -eq 2 ] ||
26821                 error "expect 2 get $stripe_count"
26822
26823         (( $MDS1_VERSION >= $(version_code 2.14.55) )) || return 0
26824
26825         local index
26826         local index2
26827
26828         # subdirs should be on the same MDT as parent
26829         for i in $(seq 0 $((MDSCOUNT - 1))); do
26830                 $LFS mkdir -i $i $DIR/$tdir/mdt$i || error "mkdir mdt$i failed"
26831                 mkdir $DIR/$tdir/mdt$i/sub || error "mkdir sub failed"
26832                 index=$($LFS getstripe -m $DIR/$tdir/mdt$i/sub)
26833                 (( index == i )) || error "mdt$i/sub on MDT$index"
26834         done
26835
26836         # stripe offset -1, ditto
26837         for i in {1..10}; do
26838                 $LFS mkdir -i -1 $DIR/$tdir/qos$i || error "mkdir qos$i failed"
26839                 index=$($LFS getstripe -m $DIR/$tdir/qos$i)
26840                 mkdir $DIR/$tdir/qos$i/sub || error "mkdir sub failed"
26841                 index2=$($LFS getstripe -m $DIR/$tdir/qos$i/sub)
26842                 (( index == index2 )) ||
26843                         error "qos$i on MDT$index, sub on MDT$index2"
26844         done
26845
26846         local testdir=$DIR/$tdir/inherit
26847
26848         $LFS mkdir -i 1 --max-inherit=3 $testdir || error "mkdir inherit failed"
26849         # inherit 2 levels
26850         for i in 1 2; do
26851                 testdir=$testdir/s$i
26852                 mkdir $testdir || error "mkdir $testdir failed"
26853                 index=$($LFS getstripe -m $testdir)
26854                 (( index == 1 )) ||
26855                         error "$testdir on MDT$index"
26856         done
26857
26858         # not inherit any more
26859         testdir=$testdir/s3
26860         mkdir $testdir || error "mkdir $testdir failed"
26861         getfattr -d -m dmv $testdir | grep dmv &&
26862                 error "default LMV set on $testdir" || true
26863 }
26864 run_test 412 "mkdir on specific MDTs"
26865
26866 TEST413_COUNT=${TEST413_COUNT:-200}
26867
26868 #
26869 # set_maxage() is used by test_413 only.
26870 # This is a helper function to set maxage. Does not return any value.
26871 # Input: maxage to set
26872 #
26873 set_maxage() {
26874         local lmv_qos_maxage
26875         local lod_qos_maxage
26876         local new_maxage=$1
26877
26878         lmv_qos_maxage=$($LCTL get_param -n lmv.*.qos_maxage)
26879         $LCTL set_param lmv.*.qos_maxage=$new_maxage
26880         stack_trap "$LCTL set_param \
26881                 lmv.*.qos_maxage=$lmv_qos_maxage > /dev/null"
26882         lod_qos_maxage=$(do_facet mds1 $LCTL get_param -n \
26883                 lod.$FSNAME-MDT0000-mdtlov.qos_maxage | awk '{ print $1 }')
26884         do_nodes $(comma_list $(mdts_nodes)) $LCTL set_param \
26885                 lod.*.mdt_qos_maxage=$new_maxage
26886         stack_trap "do_nodes $(comma_list $(mdts_nodes)) $LCTL set_param \
26887                 lod.*.mdt_qos_maxage=$lod_qos_maxage > /dev/null"
26888 }
26889
26890 generate_uneven_mdts() {
26891         local threshold=$1
26892         local ffree
26893         local bavail
26894         local max
26895         local min
26896         local max_index
26897         local min_index
26898         local tmp
26899         local i
26900
26901         echo
26902         echo "Check for uneven MDTs: "
26903
26904         ffree=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.filesfree))
26905         bavail=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.kbytesavail))
26906         bsize=$(lctl get_param -n mdc.*MDT0000*.blocksize)
26907
26908         max=$(((${ffree[0]} >> 8) * (${bavail[0]} * bsize >> 16)))
26909         min=$(((${ffree[0]} >> 8) * (${bavail[0]} * bsize >> 16)))
26910         max_index=0
26911         min_index=0
26912         for ((i = 1; i < ${#ffree[@]}; i++)); do
26913                 tmp=$(((${ffree[i]} >> 8) * (${bavail[i]} * bsize >> 16)))
26914                 if [ $tmp -gt $max ]; then
26915                         max=$tmp
26916                         max_index=$i
26917                 fi
26918                 if [ $tmp -lt $min ]; then
26919                         min=$tmp
26920                         min_index=$i
26921                 fi
26922         done
26923
26924         (( min > 0 )) || skip "low space on MDT$min_index"
26925         (( ${ffree[min_index]} > 0 )) ||
26926                 skip "no free files on MDT$min_index"
26927         (( ${ffree[min_index]} < 10000000 )) ||
26928                 skip "too many free files on MDT$min_index"
26929
26930         # Check if we need to generate uneven MDTs
26931         local diff=$(((max - min) * 100 / min))
26932         local testdirp=$DIR/$tdir-fillmdt # parent fill folder
26933         local testdir # individual folder within $testdirp
26934         local start
26935         local cmd
26936
26937         # fallocate is faster to consume space on MDT, if available
26938         if check_fallocate_supported mds$((min_index + 1)); then
26939                 cmd="fallocate -l 128K "
26940         else
26941                 cmd="dd if=/dev/zero bs=128K count=1 of="
26942         fi
26943
26944         echo "using cmd $cmd"
26945         for (( i = 0; diff < threshold; i++ )); do
26946                 testdir=${testdirp}/$i
26947                 [ -d $testdir ] && continue
26948
26949                 (( i % 10 > 0 )) || { $LFS df; $LFS df -i; }
26950
26951                 mkdir -p $testdirp
26952                 # generate uneven MDTs, create till $threshold% diff
26953                 echo -n "weight diff=$diff% must be > $threshold% ..."
26954                 echo "Fill MDT$min_index with $TEST413_COUNT files: loop $i"
26955                 $LFS mkdir -i $min_index $testdir ||
26956                         error "mkdir $testdir failed"
26957                 $LFS setstripe -E 1M -L mdt $testdir ||
26958                         error "setstripe $testdir failed"
26959                 start=$SECONDS
26960                 for (( f = 0; f < TEST413_COUNT; f++ )); do
26961                         $cmd$testdir/f.$f &> /dev/null || error "$cmd $f failed"
26962                 done
26963                 sync; sleep 1; sync
26964
26965                 # wait for QOS to update
26966                 (( SECONDS < start + 2 )) && sleep $((start + 2 - SECONDS))
26967
26968                 ffree=($(lctl get_param -n mdc.*[mM][dD][cC]-*.filesfree))
26969                 bavail=($(lctl get_param -n mdc.*[mM][dD][cC]-*.kbytesavail))
26970                 max=$(((${ffree[max_index]} >> 8) *
26971                         (${bavail[max_index]} * bsize >> 16)))
26972                 min=$(((${ffree[min_index]} >> 8) *
26973                         (${bavail[min_index]} * bsize >> 16)))
26974                 (( min > 0 )) || skip "low space on MDT$min_index"
26975                 diff=$(((max - min) * 100 / min))
26976         done
26977
26978         echo "MDT filesfree available: ${ffree[*]}"
26979         echo "MDT blocks available: ${bavail[*]}"
26980         echo "weight diff=$diff%"
26981 }
26982
26983 test_qos_mkdir() {
26984         local mkdir_cmd=$1
26985         local stripe_count=$2
26986         local mdts=$(comma_list $(mdts_nodes))
26987
26988         local testdir
26989         local lmv_qos_prio_free
26990         local lmv_qos_threshold_rr
26991         local lod_qos_prio_free
26992         local lod_qos_threshold_rr
26993         local total
26994         local count
26995         local i
26996
26997         # @total is total directories created if it's testing plain
26998         # directories, otherwise it's total stripe object count for
26999         # striped directories test.
27000         # remote/striped directory unlinking is slow on zfs and may
27001         # timeout, test with fewer directories
27002         [ "$mds1_FSTYPE" = "zfs" ] && total=120 || total=240
27003
27004         lmv_qos_prio_free=$($LCTL get_param -n lmv.*.qos_prio_free | head -n1)
27005         lmv_qos_prio_free=${lmv_qos_prio_free%%%}
27006         lmv_qos_threshold_rr=$($LCTL get_param -n lmv.*.qos_threshold_rr |
27007                 head -n1)
27008         lmv_qos_threshold_rr=${lmv_qos_threshold_rr%%%}
27009         stack_trap "$LCTL set_param \
27010                 lmv.*.qos_prio_free=$lmv_qos_prio_free > /dev/null"
27011         stack_trap "$LCTL set_param \
27012                 lmv.*.qos_threshold_rr=$lmv_qos_threshold_rr > /dev/null"
27013
27014         lod_qos_prio_free=$(do_facet mds1 $LCTL get_param -n \
27015                 lod.$FSNAME-MDT0000-mdtlov.mdt_qos_prio_free | head -n1)
27016         lod_qos_prio_free=${lod_qos_prio_free%%%}
27017         lod_qos_threshold_rr=$(do_facet mds1 $LCTL get_param -n \
27018                 lod.$FSNAME-MDT0000-mdtlov.mdt_qos_threshold_rr | head -n1)
27019         lod_qos_threshold_rr=${lod_qos_threshold_rr%%%}
27020         stack_trap "do_nodes $mdts $LCTL set_param \
27021                 lod.*.mdt_qos_prio_free=$lod_qos_prio_free > /dev/null"
27022         stack_trap "do_nodes $mdts $LCTL set_param \
27023                 lod.*.mdt_qos_threshold_rr=$lod_qos_threshold_rr > /dev/null"
27024
27025         $LCTL set_param lmv.*.qos_threshold_rr=100 > /dev/null
27026         do_nodes $mdts $LCTL set_param lod.*.mdt_qos_threshold_rr=100 > /dev/null
27027
27028         testdir=$DIR/$tdir-s$stripe_count/rr
27029
27030         local stripe_index=$($LFS getstripe -m $testdir)
27031         local test_mkdir_rr=true
27032
27033         getfattr -d -m dmv -e hex $testdir | grep dmv
27034         if (( $? == 0 && $MDS1_VERSION >= $(version_code 2.14.51) )); then
27035                 echo "defstripe: '$($LFS getdirstripe -D $testdir)'"
27036                 (( $($LFS getdirstripe -D --max-inherit-rr $testdir) == 0 )) &&
27037                         test_mkdir_rr=false
27038         fi
27039
27040         echo
27041         $test_mkdir_rr &&
27042                 echo "Mkdir (stripe_count $stripe_count) roundrobin:" ||
27043                 echo "Mkdir (stripe_count $stripe_count) on stripe $stripe_index"
27044
27045         stack_trap "unlinkmany -d $testdir/subdir $((total / stripe_count))"
27046         for (( i = 0; i < total / stripe_count; i++ )); do
27047                 eval $mkdir_cmd $testdir/subdir$i ||
27048                         error "$mkdir_cmd subdir$i failed"
27049         done
27050
27051         for (( i = 0; i < $MDSCOUNT; i++ )); do
27052                 count=$($LFS getdirstripe -i $testdir/* | grep -c "^$i$")
27053                 echo "$count directories created on MDT$i"
27054                 if $test_mkdir_rr; then
27055                         (( count == total / stripe_count / MDSCOUNT )) ||
27056                                 error "subdirs are not evenly distributed"
27057                 elif (( i == stripe_index )); then
27058                         (( count == total / stripe_count )) ||
27059                                 error "$count subdirs created on MDT$i"
27060                 else
27061                         (( count == 0 )) ||
27062                                 error "$count subdirs created on MDT$i"
27063                 fi
27064
27065                 if $test_mkdir_rr && [ $stripe_count -gt 1 ]; then
27066                         count=$($LFS getdirstripe $testdir/* |
27067                                 grep -c -P "^\s+$i\t")
27068                         echo "$count stripes created on MDT$i"
27069                         # deviation should < 5% of average
27070                         delta=$((count - total / MDSCOUNT))
27071                         (( ${delta#-} <= total / MDSCOUNT / 20 )) ||
27072                                 error "stripes are not evenly distributed"
27073                 fi
27074         done
27075
27076         echo
27077         echo "Check for uneven MDTs: "
27078
27079         local ffree
27080         local bavail
27081         local max
27082         local min
27083         local max_index
27084         local min_index
27085         local tmp
27086
27087         ffree=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.filesfree))
27088         bavail=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.kbytesavail))
27089         bsize=$(lctl get_param -n mdc.*MDT0000*.blocksize)
27090
27091         max=$(((${ffree[0]} >> 8) * (${bavail[0]} * bsize >> 16)))
27092         min=$(((${ffree[0]} >> 8) * (${bavail[0]} * bsize >> 16)))
27093         max_index=0
27094         min_index=0
27095         for ((i = 1; i < ${#ffree[@]}; i++)); do
27096                 tmp=$(((${ffree[i]} >> 8) * (${bavail[i]} * bsize >> 16)))
27097                 if [ $tmp -gt $max ]; then
27098                         max=$tmp
27099                         max_index=$i
27100                 fi
27101                 if [ $tmp -lt $min ]; then
27102                         min=$tmp
27103                         min_index=$i
27104                 fi
27105         done
27106         echo "stripe_count=$stripe_count min_idx=$min_index max_idx=$max_index"
27107
27108         (( min > 0 )) || skip "low space on MDT$min_index"
27109         (( ${ffree[min_index]} < 10000000 )) ||
27110                 skip "too many free files on MDT$min_index"
27111
27112         generate_uneven_mdts 120
27113
27114         echo "MDT filesfree available: ${ffree[*]}"
27115         echo "MDT blocks available: ${bavail[*]}"
27116         echo "weight diff=$(((max - min) * 100 / min))%"
27117         echo
27118         echo "Mkdir (stripe_count $stripe_count) with balanced space usage:"
27119
27120         $LCTL set_param lmv.*.qos_threshold_rr=0 > /dev/null
27121         $LCTL set_param lmv.*.qos_prio_free=100 > /dev/null
27122         do_nodes $mdts $LCTL set_param lod.*.mdt_qos_threshold_rr=0 > /dev/null
27123         do_nodes $mdts $LCTL set_param lod.*.mdt_qos_prio_free=100 > /dev/null
27124         # decrease statfs age, so that it can be updated in time
27125         $LCTL set_param lmv.*.qos_maxage=1 > /dev/null
27126         do_nodes $mdts $LCTL set_param lod.*.mdt_qos_maxage=1 > /dev/null
27127
27128         sleep 1
27129
27130         testdir=$DIR/$tdir-s$stripe_count/qos
27131
27132         stack_trap "unlinkmany -d $testdir/subdir $((total / stripe_count))"
27133         for (( i = 0; i < total / stripe_count; i++ )); do
27134                 eval $mkdir_cmd $testdir/subdir$i ||
27135                         error "$mkdir_cmd subdir$i failed"
27136         done
27137
27138         max=0
27139         for (( i = 0; i < $MDSCOUNT; i++ )); do
27140                 count=$($LFS getdirstripe -i $testdir/* | grep -c "^$i$")
27141                 (( count > max )) && max=$count
27142                 echo "$count directories created on MDT$i : curmax=$max"
27143         done
27144
27145         min=$($LFS getdirstripe -i $testdir/* | grep -c "^$min_index$")
27146
27147         # D-value should > 10% of average
27148         (( max - min > total / stripe_count / MDSCOUNT / 10 )) ||
27149                 error "subdirs shouldn't be evenly distributed: $max - $min <= $((total / stripe_count / MDSCOUNT / 10))"
27150
27151         # ditto for stripes
27152         if (( stripe_count > 1 )); then
27153                 max=0
27154                 for (( i = 0; i < $MDSCOUNT; i++ )); do
27155                         count=$($LFS getdirstripe $testdir/* |
27156                                 grep -c -P "^\s+$i\t")
27157                         (( count > max )) && max=$count
27158                         echo "$count stripes created on MDT$i"
27159                 done
27160
27161                 min=$($LFS getdirstripe $testdir/* |
27162                         grep -c -P "^\s+$min_index\t")
27163                 (( max - min > total / MDSCOUNT / 10 )) ||
27164                         error "stripes shouldn't be evenly distributed: $max - $min <= $((total / MDSCOUNT / 10))"
27165         fi
27166 }
27167
27168 most_full_mdt() {
27169         local ffree
27170         local bavail
27171         local bsize
27172         local min
27173         local min_index
27174         local tmp
27175
27176         ffree=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.filesfree))
27177         bavail=($(lctl get_param -n mdc.*[mM][dD][cC]-[^M]*.kbytesavail))
27178         bsize=$(lctl get_param -n mdc.*MDT0000*.blocksize)
27179
27180         min=$(((${ffree[0]} >> 8) * (${bavail[0]} * bsize >> 16)))
27181         min_index=0
27182         for ((i = 1; i < ${#ffree[@]}; i++)); do
27183                 tmp=$(((${ffree[i]} >> 8) * (${bavail[i]} * bsize >> 16)))
27184                 (( tmp < min )) && min=$tmp && min_index=$i
27185         done
27186
27187         echo -n $min_index
27188 }
27189
27190 test_413a() {
27191         [ $MDSCOUNT -lt 2 ] &&
27192                 skip "We need at least 2 MDTs for this test"
27193
27194         [ $MDS1_VERSION -lt $(version_code 2.12.52) ] &&
27195                 skip "Need server version at least 2.12.52"
27196
27197         local stripe_max=$((MDSCOUNT - 1))
27198         local stripe_count
27199
27200         # let caller set maxage for latest result
27201         set_maxage 1
27202
27203         # fill MDT unevenly
27204         generate_uneven_mdts 120
27205
27206         # test 4-stripe directory at most, otherwise it's too slow
27207         # We are being very defensive. Although Autotest uses 4 MDTs.
27208         # We make sure stripe_max does not go over 4.
27209         (( stripe_max > 4 )) && stripe_max=4
27210         # unlinking striped directory is slow on zfs, and may timeout, only test
27211         # plain directory
27212         [ "$mds1_FSTYPE" == "zfs" ] && stripe_max=1
27213         for stripe_count in $(seq 1 $stripe_max); do
27214                 mkdir $DIR/$tdir-s$stripe_count || error "mkdir failed"
27215                 mkdir $DIR/$tdir-s$stripe_count/rr || error "mkdir failed"
27216                 $LFS mkdir -i $(most_full_mdt) $DIR/$tdir-s$stripe_count/qos ||
27217                         error "mkdir failed"
27218                 test_qos_mkdir "$LFS mkdir -i -1 -c $stripe_count" $stripe_count
27219         done
27220 }
27221 run_test 413a "QoS mkdir with 'lfs mkdir -i -1'"
27222
27223 test_413b() {
27224         [ $MDSCOUNT -lt 2 ] &&
27225                 skip "We need at least 2 MDTs for this test"
27226
27227         [ $MDS1_VERSION -lt $(version_code 2.12.52) ] &&
27228                 skip "Need server version at least 2.12.52"
27229
27230         local stripe_max=$((MDSCOUNT - 1))
27231         local testdir
27232         local stripe_count
27233
27234         # let caller set maxage for latest result
27235         set_maxage 1
27236
27237         # fill MDT unevenly
27238         generate_uneven_mdts 120
27239
27240         # test 4-stripe directory at most, otherwise it's too slow
27241         # We are being very defensive. Although Autotest uses 4 MDTs.
27242         # We make sure stripe_max does not go over 4.
27243         (( stripe_max > 4 )) && stripe_max=4
27244         [ "$mds1_FSTYPE" == "zfs" ] && stripe_max=1
27245         for stripe_count in $(seq 1 $stripe_max); do
27246                 testdir=$DIR/$tdir-s$stripe_count
27247                 mkdir $testdir || error "mkdir $testdir failed"
27248                 mkdir $testdir/rr || error "mkdir rr failed"
27249                 $LFS mkdir -i $(most_full_mdt) $testdir/qos ||
27250                         error "mkdir qos failed"
27251                 $LFS setdirstripe -D -c $stripe_count --max-inherit-rr 2 \
27252                         $testdir/rr || error "setdirstripe rr failed"
27253                 $LFS setdirstripe -D -c $stripe_count $testdir/qos ||
27254                         error "setdirstripe failed"
27255                 test_qos_mkdir "mkdir" $stripe_count
27256         done
27257 }
27258 run_test 413b "QoS mkdir under dir whose default LMV starting MDT offset is -1"
27259
27260 test_413c() {
27261         (( $MDSCOUNT >= 2 )) ||
27262                 skip "We need at least 2 MDTs for this test"
27263
27264         (( $MDS1_VERSION >= $(version_code 2.14.51) )) ||
27265                 skip "Need server version at least 2.14.51"
27266
27267         local testdir
27268         local inherit
27269         local inherit_rr
27270         local lmv_qos_maxage
27271         local lod_qos_maxage
27272
27273         # let caller set maxage for latest result
27274         lmv_qos_maxage=$($LCTL get_param -n lmv.*.qos_maxage)
27275         $LCTL set_param lmv.*.qos_maxage=1
27276         stack_trap "$LCTL set_param \
27277                 lmv.*.qos_maxage=$lmv_qos_maxage > /dev/null" RETURN
27278         lod_qos_maxage=$(do_facet mds1 $LCTL get_param -n \
27279                 lod.$FSNAME-MDT0000-mdtlov.qos_maxage | awk '{ print $1 }')
27280         do_nodes $(comma_list $(mdts_nodes)) $LCTL set_param \
27281                 lod.*.mdt_qos_maxage=1
27282         stack_trap "do_nodes $(comma_list $(mdts_nodes)) $LCTL set_param \
27283                 lod.*.mdt_qos_maxage=$lod_qos_maxage > /dev/null" RETURN
27284
27285         # fill MDT unevenly
27286         generate_uneven_mdts 120
27287
27288         testdir=$DIR/${tdir}-s1
27289         mkdir $testdir || error "mkdir $testdir failed"
27290         mkdir $testdir/rr || error "mkdir rr failed"
27291         $LFS mkdir -i $(most_full_mdt) $testdir/qos || error "mkdir qos failed"
27292         # default max_inherit is -1, default max_inherit_rr is 0
27293         $LFS setdirstripe -D -c 1 $testdir/rr ||
27294                 error "setdirstripe rr failed"
27295         $LFS setdirstripe -D -c 1 -i -1 -X 2 --max-inherit-rr 1 $testdir/qos ||
27296                 error "setdirstripe qos failed"
27297         test_qos_mkdir "mkdir" 1
27298
27299         mkdir $testdir/rr/level1 || error "mkdir rr/level1 failed"
27300         inherit=$($LFS getdirstripe -D -X $testdir/rr/level1)
27301         (( $inherit == -1 )) || error "rr/level1 inherit $inherit != -1"
27302         inherit_rr=$($LFS getdirstripe -D --max-inherit-rr $testdir/rr/level1)
27303         (( $inherit_rr == 0 )) || error "rr/level1 inherit-rr $inherit_rr != 0"
27304
27305         mkdir $testdir/qos/level1 || error "mkdir qos/level1 failed"
27306         inherit=$($LFS getdirstripe -D -X $testdir/qos/level1)
27307         (( $inherit == 1 )) || error "qos/level1 inherit $inherit != 1"
27308         inherit_rr=$($LFS getdirstripe -D --max-inherit-rr $testdir/qos/level1)
27309         (( $inherit_rr == 0 )) || error "qos/level1 inherit-rr $inherit_rr != 0"
27310         mkdir $testdir/qos/level1/level2 || error "mkdir level2 failed"
27311         getfattr -d -m dmv -e hex $testdir/qos/level1/level2 | grep dmv &&
27312                 error "level2 shouldn't have default LMV" || true
27313 }
27314 run_test 413c "mkdir with default LMV max inherit rr"
27315
27316 test_413d() {
27317         (( MDSCOUNT >= 2 )) ||
27318                 skip "We need at least 2 MDTs for this test"
27319
27320         (( MDS1_VERSION >= $(version_code 2.14.51) )) ||
27321                 skip "Need server version at least 2.14.51"
27322
27323         local lmv_qos_threshold_rr
27324
27325         lmv_qos_threshold_rr=$($LCTL get_param -n lmv.*.qos_threshold_rr |
27326                 head -n1)
27327         stack_trap "$LCTL set_param \
27328                 lmv.*.qos_threshold_rr=$lmv_qos_threshold_rr > /dev/null" EXIT
27329
27330         $LCTL set_param lmv.*.qos_threshold_rr=100 > /dev/null
27331         mkdir -p $DIR/$tdir || error "mkdir $tdir failed"
27332         getfattr -d -m dmv -e hex $DIR/$tdir | grep dmv &&
27333                 error "$tdir shouldn't have default LMV"
27334         createmany -d $DIR/$tdir/sub $((100 * MDSCOUNT)) ||
27335                 error "mkdir sub failed"
27336
27337         local count=$($LFS getstripe -m $DIR/$tdir/* | grep -c ^0)
27338
27339         (( count == 100 )) || error "$count subdirs on MDT0"
27340 }
27341 run_test 413d "inherit ROOT default LMV"
27342
27343 test_413e() {
27344         (( MDSCOUNT >= 2 )) ||
27345                 skip "We need at least 2 MDTs for this test"
27346         (( MDS1_VERSION >= $(version_code 2.14.55) )) ||
27347                 skip "Need server version at least 2.14.55"
27348
27349         local testdir=$DIR/$tdir
27350         local tmpfile=$TMP/temp.setdirstripe.stderr.$$
27351         local max_inherit
27352         local sub_max_inherit
27353
27354         mkdir -p $testdir || error "failed to create $testdir"
27355
27356         # set default max-inherit to -1 if stripe count is 0 or 1
27357         $LFS setdirstripe -D -c 1 $testdir ||
27358                 error "failed to set default LMV"
27359         max_inherit=$($LFS getdirstripe -D --max-inherit $testdir)
27360         (( max_inherit == -1 )) ||
27361                 error "wrong max_inherit value $max_inherit"
27362
27363         # set default max_inherit to a fixed value if stripe count is not 0 or 1
27364         $LFS setdirstripe -D -c -1 $testdir ||
27365                 error "failed to set default LMV"
27366         max_inherit=$($LFS getdirstripe -D --max-inherit $testdir)
27367         (( max_inherit > 0 )) ||
27368                 error "wrong max_inherit value $max_inherit"
27369
27370         # and the subdir will decrease the max_inherit by 1
27371         mkdir -p $testdir/subdir-1 || error "failed to make subdir"
27372         sub_max_inherit=$($LFS getdirstripe -D --max-inherit $testdir/subdir-1)
27373         (( sub_max_inherit == max_inherit - 1)) ||
27374                 error "wrong max-inherit of subdir $sub_max_inherit"
27375
27376         # check specified --max-inherit and warning message
27377         stack_trap "rm -f $tmpfile"
27378         $LFS setdirstripe -D -c 2 --max-inherit=-1 $testdir 2> $tmpfile ||
27379                 error "failed to set default LMV"
27380         max_inherit=$($LFS getdirstripe -D --max-inherit $testdir)
27381         (( max_inherit == -1 )) ||
27382                 error "wrong max_inherit value $max_inherit"
27383
27384         # check the warning messages
27385         if ! [[ $(cat $tmpfile) =~ "max-inherit=" ]]; then
27386                 error "failed to detect warning string"
27387         fi
27388 }
27389 run_test 413e "check default max-inherit value"
27390
27391 test_fs_dmv_inherit()
27392 {
27393         local testdir=$DIR/$tdir
27394
27395         local count
27396         local inherit
27397         local inherit_rr
27398
27399         for i in 1 2; do
27400                 mkdir $testdir || error "mkdir $testdir failed"
27401                 count=$($LFS getdirstripe -D -c $testdir)
27402                 (( count == 1 )) ||
27403                         error "$testdir default LMV count mismatch $count != 1"
27404                 inherit=$($LFS getdirstripe -D -X $testdir)
27405                 (( inherit == 3 - i )) ||
27406                         error "$testdir default LMV max-inherit $inherit != $((3 - i))"
27407                 inherit_rr=$($LFS getdirstripe -D --max-inherit-rr $testdir)
27408                 (( inherit_rr == 3 - i )) ||
27409                         error "$testdir default LMV max-inherit-rr $inherit_rr != $((3 - i))"
27410                 testdir=$testdir/sub
27411         done
27412
27413         mkdir $testdir || error "mkdir $testdir failed"
27414         count=$($LFS getdirstripe -D -c $testdir)
27415         (( count == 0 )) ||
27416                 error "$testdir default LMV count not zero: $count"
27417 }
27418
27419 test_413f() {
27420         (( MDSCOUNT >= 2 )) || skip "We need at least 2 MDTs for this test"
27421
27422         (( MDS1_VERSION >= $(version_code 2.14.55) )) ||
27423                 skip "Need server version at least 2.14.55"
27424
27425         getfattr -d -m trusted.dmv --absolute-names $DIR > $TMP/dmv.ea ||
27426                 error "dump $DIR default LMV failed"
27427         stack_trap "setfattr --restore=$TMP/dmv.ea"
27428
27429         $LFS setdirstripe -D -i -1 -c 1 -X 3 --max-inherit-rr 3 $DIR ||
27430                 error "set $DIR default LMV failed"
27431
27432         test_fs_dmv_inherit
27433 }
27434 run_test 413f "lfs getdirstripe -D list ROOT default LMV if it's not set on dir"
27435
27436 test_413g() {
27437         (( MDSCOUNT >= 2 )) || skip "We need at least 2 MDTs for this test"
27438
27439         mkdir -p $DIR/$tdir/l2/l3/l4 || error "mkdir $tdir/l1/l2/l3 failed"
27440         getfattr -d -m trusted.dmv --absolute-names $DIR > $TMP/dmv.ea ||
27441                 error "dump $DIR default LMV failed"
27442         stack_trap "setfattr --restore=$TMP/dmv.ea"
27443
27444         $LFS setdirstripe -D -i -1 -c 1 -X 3 --max-inherit-rr 3 $DIR ||
27445                 error "set $DIR default LMV failed"
27446
27447         FILESET="$FILESET/$tdir/l2/l3/l4" mount_client $MOUNT2 ||
27448                 error "mount $MOUNT2 failed"
27449         stack_trap "umount_client $MOUNT2"
27450
27451         local saved_DIR=$DIR
27452
27453         export DIR=$MOUNT2
27454
27455         stack_trap "export DIR=$saved_DIR"
27456
27457         # first check filesystem-wide default LMV inheritance
27458         test_fs_dmv_inherit || error "incorrect fs default LMV inheritance"
27459
27460         # then check subdirs are spread to all MDTs
27461         createmany -d $DIR/s $((MDSCOUNT * 100)) || error "createmany failed"
27462
27463         local count=$($LFS getstripe -m $DIR/s* | sort -u | wc -l)
27464
27465         (( $count == $MDSCOUNT )) || error "dirs are spread to $count MDTs"
27466 }
27467 run_test 413g "enforce ROOT default LMV on subdir mount"
27468
27469 test_413h() {
27470         (( MDSCOUNT >= 2 )) ||
27471                 skip "We need at least 2 MDTs for this test"
27472
27473         (( MDS1_VERSION >= $(version_code 2.15.50.6) )) ||
27474                 skip "Need server version at least 2.15.50.6"
27475
27476         local lmv_qos_maxage=$($LCTL get_param -n lmv.*.qos_maxage)
27477
27478         stack_trap "$LCTL set_param \
27479                 lmv.*.qos_maxage=$lmv_qos_maxage > /dev/null"
27480         $LCTL set_param lmv.*.qos_maxage=1
27481
27482         local depth=5
27483         local rr_depth=4
27484         local dir=$DIR/$tdir/l1/l2/l3/l4/l5
27485         local count=$((MDSCOUNT * 20))
27486
27487         generate_uneven_mdts 50
27488
27489         mkdir -p $dir || error "mkdir $dir failed"
27490         stack_trap "rm -rf $dir"
27491         $LFS setdirstripe -D -c 1 -i -1 --max-inherit=$depth \
27492                 --max-inherit-rr=$rr_depth $dir
27493
27494         for ((d=0; d < depth + 2; d++)); do
27495                 log "dir=$dir:"
27496                 for ((sub=0; sub < count; sub++)); do
27497                         mkdir $dir/d$sub
27498                 done
27499                 $LFS getdirstripe -i $dir/d* | sort | uniq -c | sort -nr
27500                 local num=($($LFS getdirstripe -i $dir/d* | sort | uniq -c))
27501                 # subdirs within $rr_depth should be created round-robin
27502                 if (( d < rr_depth )); then
27503                         (( ${num[0]} != count )) ||
27504                                 error "all objects created on MDT ${num[1]}"
27505                 fi
27506
27507                 dir=$dir/d0
27508         done
27509 }
27510 run_test 413h "don't stick to parent for round-robin dirs"
27511
27512 test_413i() {
27513         [ $MDSCOUNT -lt 2 ] && skip_env "needs >= 2 MDTs"
27514
27515         (( MDS1_VERSION >= $(version_code 2.14.55) )) ||
27516                 skip "Need server version at least 2.14.55"
27517
27518         getfattr -d -m trusted.dmv --absolute-names $DIR > $TMP/dmv.ea ||
27519                 error "dump $DIR default LMV failed"
27520         stack_trap "setfattr --restore=$TMP/dmv.ea"
27521
27522         local testdir=$DIR/$tdir
27523         local def_max_rr=1
27524         local def_max=3
27525         local count
27526
27527         $LFS setdirstripe -D -i-1 -c1 --max-inherit=$def_max \
27528                 --max-inherit-rr=$def_max_rr $DIR ||
27529                 error "set $DIR default LMV failed"
27530
27531         for i in $(seq 2 3); do
27532                 def_max=$((def_max - 1))
27533                 (( def_max_rr == 0 )) || def_max_rr=$((def_max_rr - 1))
27534
27535                 mkdir $testdir
27536                 # RR is decremented and keeps zeroed once exhausted
27537                 count=$($LFS getdirstripe -D --max-inherit-rr $testdir)
27538                 (( count == def_max_rr )) ||
27539                         error_noexit "$testdir: max-inherit-rr $count != $def_max_rr"
27540
27541                 # max-inherit is decremented
27542                 count=$($LFS getdirstripe -D --max-inherit $testdir)
27543                 (( count == def_max )) ||
27544                         error_noexit "$testdir: max-inherit $count != $def_max"
27545
27546                 testdir=$testdir/d$i
27547         done
27548
27549         # d3 is the last inherited from ROOT, no inheritance anymore
27550         # i.e. no the default layout anymore
27551         mkdir -p $testdir/d4/d5
27552         count=$($LFS getdirstripe -D --max-inherit $testdir)
27553         (( count == -1 )) ||
27554                 error_noexit "$testdir: max-inherit $count != -1"
27555
27556         local p_count=$($LFS getdirstripe -i $testdir)
27557
27558         for i in $(seq 4 5); do
27559                 testdir=$testdir/d$i
27560
27561                 # the root default layout is not applied once exhausted
27562                 count=$($LFS getdirstripe -i $testdir)
27563                 (( count == p_count )) ||
27564                         error_noexit "$testdir: stripe-offset $count != parent offset $p_count"
27565         done
27566
27567         $LFS setdirstripe -i 0 $DIR/d2
27568         count=$($LFS getdirstripe -D --max-inherit $DIR/d2)
27569         (( count == -1 )) ||
27570                 error_noexit "$DIR/d2: max-inherit non-striped default $count != -1"
27571 }
27572 run_test 413i "check default layout inheritance"
27573
27574 test_413z() {
27575         local pids=""
27576         local subdir
27577         local pid
27578
27579         for subdir in $(\ls -1 -d $DIR/d413*-fillmdt/*); do
27580                 unlinkmany $subdir/f. $TEST413_COUNT &
27581                 pids="$pids $!"
27582         done
27583
27584         for pid in $pids; do
27585                 wait $pid
27586         done
27587
27588         true
27589 }
27590 run_test 413z "413 test cleanup"
27591
27592 test_414() {
27593 #define OBD_FAIL_PTLRPC_BULK_ATTACH      0x521
27594         $LCTL set_param fail_loc=0x80000521
27595         dd if=/dev/zero of=$DIR/$tfile bs=2M count=1 oflag=sync
27596         rm -f $DIR/$tfile
27597 }
27598 run_test 414 "simulate ENOMEM in ptlrpc_register_bulk()"
27599
27600 test_415() {
27601         [[ $PARALLEL == "yes" ]] && skip "skip parallel run"
27602         (( $MDS1_VERSION >= $(version_code 2.11.52) )) ||
27603                 skip "Need server version at least 2.11.52"
27604
27605         # LU-11102
27606         local total=500
27607         local max=120
27608
27609         # this test may be slow on ZFS
27610         [[ "$mds1_FSTYPE" == "zfs" ]] && total=50
27611
27612         # though this test is designed for striped directory, let's test normal
27613         # directory too since lock is always saved as CoS lock.
27614         test_mkdir $DIR/$tdir || error "mkdir $tdir"
27615         createmany -o $DIR/$tdir/$tfile. $total || error "createmany"
27616         stack_trap "unlinkmany $DIR/$tdir/$tfile. $total || true"
27617         # if looping with ONLY_REPEAT, wait for previous deletions to finish
27618         wait_delete_completed_mds
27619
27620         # run a loop without concurrent touch to measure rename duration.
27621         # only for test debug/robustness, NOT part of COS functional test.
27622         local start_time=$SECONDS
27623         for ((i = 0; i < total; i++)); do
27624                 mrename $DIR/$tdir/$tfile.$i $DIR/$tdir/$tfile-new.$i \
27625                         > /dev/null
27626         done
27627         local baseline=$((SECONDS - start_time))
27628         echo "rename $total files without 'touch' took $baseline sec"
27629
27630         (
27631                 while true; do
27632                         touch $DIR/$tdir
27633                 done
27634         ) &
27635         local setattr_pid=$!
27636
27637         # rename files back to original name so unlinkmany works
27638         start_time=$SECONDS
27639         for ((i = 0; i < total; i++)); do
27640                 mrename $DIR/$tdir/$tfile-new.$i $DIR/$tdir/$tfile.$i\
27641                         > /dev/null
27642         done
27643         local duration=$((SECONDS - start_time))
27644
27645         kill -9 $setattr_pid
27646
27647         echo "rename $total files with 'touch' took $duration sec"
27648         (( max > 2 * baseline )) || max=$((2 * baseline + 5))
27649         (( duration <= max )) ||
27650                 error_not_in_vm "rename took $duration > $max sec"
27651 }
27652 run_test 415 "lock revoke is not missing"
27653
27654 test_416() {
27655         [ $MDS1_VERSION -lt $(version_code 2.11.55) ] &&
27656                 skip "Need server version at least 2.11.55"
27657
27658         # define OBD_FAIL_OSD_TXN_START    0x19a
27659         do_facet mds1 lctl set_param fail_loc=0x19a
27660
27661         lfs mkdir -c $MDSCOUNT $DIR/$tdir
27662
27663         true
27664 }
27665 run_test 416 "transaction start failure won't cause system hung"
27666
27667 cleanup_417() {
27668         trap 0
27669         do_nodes $(comma_list $(mdts_nodes)) \
27670                 "$LCTL set_param -n mdt.*MDT*.enable_dir_migration=1"
27671         do_nodes $(comma_list $(mdts_nodes)) \
27672                 "$LCTL set_param -n mdt.*MDT*.enable_remote_dir=1"
27673         do_nodes $(comma_list $(mdts_nodes)) \
27674                 "$LCTL set_param -n mdt.*MDT*.enable_striped_dir=1"
27675 }
27676
27677 test_417() {
27678         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
27679         [[ $MDS1_VERSION -lt $(version_code 2.11.56) ]] &&
27680                 skip "Need MDS version at least 2.11.56"
27681
27682         trap cleanup_417 RETURN EXIT
27683
27684         $LFS mkdir -i 1 $DIR/$tdir.1 || error "create remote dir $tdir.1 failed"
27685         do_nodes $(comma_list $(mdts_nodes)) \
27686                 "$LCTL set_param -n mdt.*MDT*.enable_dir_migration=0"
27687         $LFS migrate -m 0 $DIR/$tdir.1 &&
27688                 error "migrate dir $tdir.1 should fail"
27689
27690         do_nodes $(comma_list $(mdts_nodes)) \
27691                 "$LCTL set_param -n mdt.*MDT*.enable_remote_dir=0"
27692         $LFS mkdir -i 1 $DIR/$tdir.2 &&
27693                 error "create remote dir $tdir.2 should fail"
27694
27695         do_nodes $(comma_list $(mdts_nodes)) \
27696                 "$LCTL set_param -n mdt.*MDT*.enable_striped_dir=0"
27697         $LFS mkdir -c 2 $DIR/$tdir.3 &&
27698                 error "create striped dir $tdir.3 should fail"
27699         true
27700 }
27701 run_test 417 "disable remote dir, striped dir and dir migration"
27702
27703 # Checks that the outputs of df [-i] and lfs df [-i] match
27704 #
27705 # usage: check_lfs_df <blocks | inodes> <mountpoint>
27706 check_lfs_df() {
27707         local dir=$2
27708         local inodes
27709         local df_out
27710         local lfs_df_out
27711         local count
27712         local passed=false
27713
27714         # blocks or inodes
27715         [ "$1" == "blocks" ] && inodes= || inodes="-i"
27716
27717         for count in {1..100}; do
27718                 do_nodes "$CLIENTS" \
27719                         $LCTL set_param ldlm.namespaces.*.lru_size=clear
27720                 sync; sleep 0.2
27721
27722                 # read the lines of interest
27723                 df_out=($(df -P $inodes $dir | tail -n +2)) ||
27724                         error "df $inodes $dir | tail -n +2 failed"
27725                 lfs_df_out=($($LFS df $inodes $dir | grep summary:)) ||
27726                         error "lfs df $inodes $dir | grep summary: failed"
27727
27728                 # skip first substrings of each output as they are different
27729                 # "<NID>:/<fsname>" for df, "filesystem_summary:" for lfs df
27730                 # compare the two outputs
27731                 passed=true
27732                 #  skip "available" on MDT until LU-13997 is fixed.
27733                 #for i in {1..5}; do
27734                 for i in 1 2 4 5; do
27735                         [ "${df_out[i]}" != "${lfs_df_out[i]}" ] && passed=false
27736                 done
27737                 $passed && break
27738         done
27739
27740         if ! $passed; then
27741                 df -P $inodes $dir
27742                 echo
27743                 lfs df $inodes $dir
27744                 error "df and lfs df $1 output mismatch: "      \
27745                       "df ${inodes}: ${df_out[*]}, "            \
27746                       "lfs df ${inodes}: ${lfs_df_out[*]}"
27747         fi
27748 }
27749
27750 test_418() {
27751         [ $PARALLEL == "yes" ] && skip "skip parallel run"
27752
27753         local dir=$DIR/$tdir
27754         local numfiles=$((RANDOM % 4096 + 2))
27755         local numblocks=$((RANDOM % 256 + 1))
27756
27757         wait_delete_completed
27758         test_mkdir $dir
27759
27760         # check block output
27761         check_lfs_df blocks $dir
27762         # check inode output
27763         check_lfs_df inodes $dir
27764
27765         # create a single file and retest
27766         echo "Creating a single file and testing"
27767         createmany -o $dir/$tfile- 1 &>/dev/null ||
27768                 error "creating 1 file in $dir failed"
27769         check_lfs_df blocks $dir
27770         check_lfs_df inodes $dir
27771
27772         # create a random number of files
27773         echo "Creating $((numfiles - 1)) files and testing"
27774         createmany -o $dir/$tfile- 1 $((numfiles - 1)) &>/dev/null ||
27775                 error "creating $((numfiles - 1)) files in $dir failed"
27776
27777         # write a random number of blocks to the first test file
27778         echo "Writing $numblocks 4K blocks and testing"
27779         dd if=/dev/urandom of=$dir/${tfile}-0 bs=4K conv=fsync \
27780                 count=$numblocks &>/dev/null ||
27781                 error "dd to $dir/${tfile}-0 failed"
27782
27783         # retest
27784         check_lfs_df blocks $dir
27785         check_lfs_df inodes $dir
27786
27787         unlinkmany $dir/$tfile- $numfiles &>/dev/null ||
27788                 error "unlinking $numfiles files in $dir failed"
27789 }
27790 run_test 418 "df and lfs df outputs match"
27791
27792 test_419()
27793 {
27794         local dir=$DIR/$tdir
27795
27796         mkdir -p $dir
27797         touch $dir/file
27798
27799         cancel_lru_locks mdc
27800
27801         #OBD_FAIL_LLITE_OPEN_BY_NAME    0x1410
27802         $LCTL set_param fail_loc=0x1410
27803         cat $dir/file
27804         $LCTL set_param fail_loc=0
27805         rm -rf $dir
27806 }
27807 run_test 419 "Verify open file by name doesn't crash kernel"
27808
27809 test_420()
27810 {
27811         [[ $MDS1_VERSION -ge $(version_code 2.12.53) ]] ||
27812                 skip "Need MDS version at least 2.12.53"
27813
27814         local SAVE_UMASK=$(umask)
27815         local dir=$DIR/$tdir
27816         local uname=$(getent passwd $RUNAS_ID | cut -d: -f1)
27817
27818         mkdir -p $dir
27819         umask 0000
27820         mkdir -m03777 $dir/testdir
27821         ls -dn $dir/testdir
27822         # Need to remove trailing '.' when SELinux is enabled
27823         local dirperms=$(ls -dn $dir/testdir |
27824                          awk '{ sub(/\.$/, "", $1); print $1}')
27825         [ $dirperms == "drwxrwsrwt" ] ||
27826                 error "incorrect perms on $dir/testdir"
27827
27828         su - $uname -c "PATH=$LUSTRE/tests:\$PATH; \
27829                 openfile -f O_RDONLY:O_CREAT -m 02755 $dir/testdir/testfile"
27830         ls -n $dir/testdir/testfile
27831         local fileperms=$(ls -n $dir/testdir/testfile |
27832                           awk '{ sub(/\.$/, "", $1); print $1}')
27833         [ $fileperms == "-rwxr-xr-x" ] ||
27834                 error "incorrect perms on $dir/testdir/testfile"
27835
27836         umask $SAVE_UMASK
27837 }
27838 run_test 420 "clear SGID bit on non-directories for non-members"
27839
27840 test_421a() {
27841         local cnt
27842         local fid1
27843         local fid2
27844
27845         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
27846                 skip "Need MDS version at least 2.12.54"
27847
27848         test_mkdir $DIR/$tdir
27849         createmany -o $DIR/$tdir/f 3
27850         cnt=$(ls -1 $DIR/$tdir | wc -l)
27851         [ $cnt != 3 ] && error "unexpected #files: $cnt"
27852
27853         fid1=$(lfs path2fid $DIR/$tdir/f1)
27854         fid2=$(lfs path2fid $DIR/$tdir/f2)
27855         $LFS rmfid $DIR $fid1 $fid2 || error "rmfid failed"
27856
27857         stat $DIR/$tdir/f1 && error "f1 still visible on the client"
27858         stat $DIR/$tdir/f2 && error "f2 still visible on the client"
27859
27860         cnt=$(ls -1 $DIR/$tdir | wc -l)
27861         [ $cnt == 1 ] || error "unexpected #files after: $cnt"
27862
27863         rm -f $DIR/$tdir/f3 || error "can't remove f3"
27864         createmany -o $DIR/$tdir/f 3
27865         cnt=$(ls -1 $DIR/$tdir | wc -l)
27866         [ $cnt != 3 ] && error "unexpected #files: $cnt"
27867
27868         fid1=$(lfs path2fid $DIR/$tdir/f1)
27869         fid2=$(lfs path2fid $DIR/$tdir/f2)
27870         echo "remove using fsname $FSNAME"
27871         $LFS rmfid $FSNAME $fid1 $fid2 || error "rmfid with fsname failed"
27872
27873         cnt=$(ls -1 $DIR/$tdir | wc -l)
27874         [ $cnt == 1 ] || error "unexpected #files after: $cnt"
27875 }
27876 run_test 421a "simple rm by fid"
27877
27878 test_421b() {
27879         local cnt
27880         local FID1
27881         local FID2
27882
27883         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
27884                 skip "Need MDS version at least 2.12.54"
27885
27886         test_mkdir $DIR/$tdir
27887         createmany -o $DIR/$tdir/f 3
27888         multiop_bg_pause $DIR/$tdir/f1 o_c || error "multiop failed to start"
27889         MULTIPID=$!
27890
27891         FID1=$(lfs path2fid $DIR/$tdir/f1)
27892         FID2=$(lfs path2fid $DIR/$tdir/f2)
27893         $LFS rmfid $DIR $FID1 $FID2 && error "rmfid didn't fail"
27894
27895         kill -USR1 $MULTIPID
27896         wait
27897
27898         cnt=$(ls $DIR/$tdir | wc -l)
27899         [ $cnt == 2 ] || error "unexpected #files after: $cnt"
27900 }
27901 run_test 421b "rm by fid on open file"
27902
27903 test_421c() {
27904         local cnt
27905         local FIDS
27906
27907         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
27908                 skip "Need MDS version at least 2.12.54"
27909
27910         test_mkdir $DIR/$tdir
27911         createmany -o $DIR/$tdir/f 3
27912         touch $DIR/$tdir/$tfile
27913         createmany -l$DIR/$tdir/$tfile $DIR/$tdir/h 180
27914         cnt=$(ls -1 $DIR/$tdir | wc -l)
27915         [ $cnt != 184 ] && error "unexpected #files: $cnt"
27916
27917         FID1=$(lfs path2fid $DIR/$tdir/$tfile)
27918         $LFS rmfid $DIR $FID1 || error "rmfid failed"
27919
27920         cnt=$(ls $DIR/$tdir | wc -l)
27921         [ $cnt == 3 ] || error "unexpected #files after: $cnt"
27922 }
27923 run_test 421c "rm by fid against hardlinked files"
27924
27925 test_421d() {
27926         local cnt
27927         local FIDS
27928
27929         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
27930                 skip "Need MDS version at least 2.12.54"
27931
27932         test_mkdir $DIR/$tdir
27933         createmany -o $DIR/$tdir/f 4097
27934         cnt=$(ls -1 $DIR/$tdir | wc -l)
27935         [ $cnt != 4097 ] && error "unexpected #files: $cnt"
27936
27937         FIDS=$(lfs path2fid $DIR/$tdir/f* | sed "s/[/][^:]*://g")
27938         $LFS rmfid $DIR $FIDS || error "rmfid failed"
27939
27940         cnt=$(ls $DIR/$tdir | wc -l)
27941         rm -rf $DIR/$tdir
27942         [ $cnt == 0 ] || error "unexpected #files after: $cnt"
27943 }
27944 run_test 421d "rmfid en masse"
27945
27946 test_421e() {
27947         local cnt
27948         local FID
27949
27950         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
27951         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
27952                 skip "Need MDS version at least 2.12.54"
27953
27954         mkdir -p $DIR/$tdir
27955         $LFS setdirstripe -c$MDSCOUNT $DIR/$tdir/striped_dir
27956         createmany -o $DIR/$tdir/striped_dir/f 512
27957         cnt=$(ls -1 $DIR/$tdir/striped_dir | wc -l)
27958         [ $cnt != 512 ] && error "unexpected #files: $cnt"
27959
27960         FIDS=$(lfs path2fid $DIR/$tdir/striped_dir/f* |
27961                 sed "s/[/][^:]*://g")
27962         $LFS rmfid $DIR $FIDS || error "rmfid failed"
27963
27964         cnt=$(ls $DIR/$tdir/striped_dir | wc -l)
27965         rm -rf $DIR/$tdir
27966         [ $cnt == 0 ] || error "unexpected #files after: $cnt"
27967 }
27968 run_test 421e "rmfid in DNE"
27969
27970 test_421f() {
27971         local cnt
27972         local FID
27973
27974         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
27975                 skip "Need MDS version at least 2.12.54"
27976
27977         test_mkdir $DIR/$tdir
27978         touch $DIR/$tdir/f
27979         cnt=$(ls -1 $DIR/$tdir | wc -l)
27980         [ $cnt != 1 ] && error "unexpected #files: $cnt"
27981
27982         FID=$(lfs path2fid $DIR/$tdir/f)
27983         $RUNAS $LFS rmfid $DIR $FID && error "rmfid didn't fail (1)"
27984         # rmfid should fail
27985         cnt=$(ls -1 $DIR/$tdir | wc -l)
27986         [ $cnt != 1 ] && error "unexpected #files after (2): $cnt"
27987
27988         chmod a+rw $DIR/$tdir
27989         ls -la $DIR/$tdir
27990         $RUNAS $LFS rmfid $DIR $FID && error "rmfid didn't fail (2)"
27991         # rmfid should fail
27992         cnt=$(ls -1 $DIR/$tdir | wc -l)
27993         [ $cnt != 1 ] && error "unexpected #files after (3): $cnt"
27994
27995         rm -f $DIR/$tdir/f
27996         $RUNAS touch $DIR/$tdir/f
27997         FID=$(lfs path2fid $DIR/$tdir/f)
27998         echo "rmfid as root"
27999         $LFS rmfid $DIR $FID || error "rmfid as root failed"
28000         cnt=$(ls -1 $DIR/$tdir | wc -l)
28001         [ $cnt == 0 ] || error "unexpected #files after (4): $cnt"
28002
28003         rm -f $DIR/$tdir/f
28004         $RUNAS touch $DIR/$tdir/f
28005         cnt=$(ls -1 $DIR/$tdir | wc -l)
28006         [ $cnt != 1 ] && error "unexpected #files (4): $cnt"
28007         FID=$(lfs path2fid $DIR/$tdir/f)
28008         # rmfid w/o user_fid2path mount option should fail
28009         $RUNAS $LFS rmfid $DIR $FID && error "rmfid didn't fail(3)"
28010         cnt=$(ls -1 $DIR/$tdir | wc -l)
28011         [ $cnt == 1 ] || error "unexpected #files after (5): $cnt"
28012
28013         tmpdir=$(mktemp -d /tmp/lustre-XXXXXX)
28014         stack_trap "rmdir $tmpdir"
28015         mount_client $tmpdir "$MOUNT_OPTS,user_fid2path" ||
28016                 error "failed to mount client'"
28017         stack_trap "umount_client $tmpdir"
28018
28019         $RUNAS $LFS rmfid $tmpdir $FID || error "rmfid failed"
28020         # rmfid should succeed
28021         cnt=$(ls -1 $tmpdir/$tdir | wc -l)
28022         [ $cnt == 0 ] || error "unexpected #files after (6): $cnt"
28023
28024         # rmfid shouldn't allow to remove files due to dir's permission
28025         chmod a+rwx $tmpdir/$tdir
28026         touch $tmpdir/$tdir/f
28027         ls -la $tmpdir/$tdir
28028         FID=$(lfs path2fid $tmpdir/$tdir/f)
28029         $RUNAS $LFS rmfid $tmpdir $FID && error "rmfid didn't fail"
28030         return 0
28031 }
28032 run_test 421f "rmfid checks permissions"
28033
28034 test_421g() {
28035         local cnt
28036         local FIDS
28037
28038         [ $MDSCOUNT -lt 2 ] && skip "needs >= 2 MDTs"
28039         [ $MDS1_VERSION -lt $(version_code 2.12.54) ] &&
28040                 skip "Need MDS version at least 2.12.54"
28041
28042         mkdir -p $DIR/$tdir
28043         $LFS setdirstripe -c$MDSCOUNT $DIR/$tdir/striped_dir
28044         createmany -o $DIR/$tdir/striped_dir/f 512
28045         cnt=$(ls -1 $DIR/$tdir/striped_dir | wc -l)
28046         [ $cnt != 512 ] && error "unexpected #files: $cnt"
28047
28048         FIDS=$(lfs path2fid $DIR/$tdir/striped_dir/f* |
28049                 sed "s/[/][^:]*://g")
28050
28051         rm -f $DIR/$tdir/striped_dir/f1*
28052         cnt=$(ls -1 $DIR/$tdir/striped_dir | wc -l)
28053         removed=$((512 - cnt))
28054
28055         # few files have been just removed, so we expect
28056         # rmfid to fail on their fids
28057         errors=$($LFS rmfid $DIR $FIDS 2>&1 | wc -l)
28058         [ $removed != $errors ] && error "$errors != $removed"
28059
28060         cnt=$(ls $DIR/$tdir/striped_dir | wc -l)
28061         rm -rf $DIR/$tdir
28062         [ $cnt == 0 ] || error "unexpected #files after: $cnt"
28063 }
28064 run_test 421g "rmfid to return errors properly"
28065
28066 test_421h() {
28067         local mount_other
28068         local mount_ret
28069         local rmfid_ret
28070         local old_fid
28071         local fidA
28072         local fidB
28073         local fidC
28074         local fidD
28075
28076         (( MDS1_VERSION >= $(version_code 2.15.53) )) ||
28077                 skip "Need MDS version at least 2.15.53"
28078
28079         test_mkdir $DIR/$tdir
28080         test_mkdir $DIR/$tdir/subdir
28081         touch $DIR/$tdir/subdir/file0
28082         old_fid=$(lfs path2fid $DIR/$tdir/subdir/file0 | sed "s/[/][^:]*://g")
28083         echo File $DIR/$tdir/subdir/file0 FID $old_fid
28084         rm -f $DIR/$tdir/subdir/file0
28085         touch $DIR/$tdir/subdir/fileA
28086         fidA=$(lfs path2fid $DIR/$tdir/subdir/fileA | sed "s/[/][^:]*://g")
28087         echo File $DIR/$tdir/subdir/fileA FID $fidA
28088         touch $DIR/$tdir/subdir/fileB
28089         fidB=$(lfs path2fid $DIR/$tdir/subdir/fileB | sed "s/[/][^:]*://g")
28090         echo File $DIR/$tdir/subdir/fileB FID $fidB
28091         ln $DIR/$tdir/subdir/fileB $DIR/$tdir/subdir/fileB_hl
28092         touch $DIR/$tdir/subdir/fileC
28093         fidC=$(lfs path2fid $DIR/$tdir/subdir/fileC | sed "s/[/][^:]*://g")
28094         echo File $DIR/$tdir/subdir/fileC FID $fidC
28095         ln $DIR/$tdir/subdir/fileC $DIR/$tdir/fileC
28096         touch $DIR/$tdir/fileD
28097         fidD=$(lfs path2fid $DIR/$tdir/fileD | sed "s/[/][^:]*://g")
28098         echo File $DIR/$tdir/fileD FID $fidD
28099
28100         # mount another client mount point with subdirectory mount
28101         export FILESET=/$tdir/subdir
28102         mount_other=${MOUNT}_other
28103         mount_client $mount_other ${MOUNT_OPTS}
28104         mount_ret=$?
28105         export FILESET=""
28106         (( mount_ret == 0 )) || error "mount $mount_other failed"
28107
28108         echo Removing FIDs:
28109         echo $LFS rmfid $mount_other $old_fid $fidA $fidD $fidB $fidC
28110         $LFS rmfid $mount_other $old_fid $fidA $fidD $fidB $fidC
28111         rmfid_ret=$?
28112
28113         umount_client $mount_other || error "umount $mount_other failed"
28114
28115         (( rmfid_ret != 0 )) || error "rmfid should have failed"
28116
28117         # fileA should have been deleted
28118         stat $DIR/$tdir/subdir/fileA && error "fileA not deleted"
28119
28120         # fileB should have been deleted
28121         stat $DIR/$tdir/subdir/fileB && error "fileB not deleted"
28122
28123         # fileC should not have been deleted, fid also exists outside of fileset
28124         stat $DIR/$tdir/subdir/fileC || error "fileC deleted"
28125
28126         # fileD should not have been deleted, it exists outside of fileset
28127         stat $DIR/$tdir/fileD || error "fileD deleted"
28128 }
28129 run_test 421h "rmfid with fileset mount"
28130
28131 test_422() {
28132         test_mkdir -i 0 -c 1 -p $DIR/$tdir/d1
28133         test_mkdir -i 0 -c 1 -p $DIR/$tdir/d2
28134         test_mkdir -i 0 -c 1 -p $DIR/$tdir/d3
28135         dd if=/dev/zero of=$DIR/$tdir/d1/file1 bs=1k count=1
28136         dd if=/dev/zero of=$DIR/$tdir/d2/file1 bs=1k count=1
28137
28138         local amc=$(at_max_get client)
28139         local amo=$(at_max_get mds1)
28140         local timeout=`lctl get_param -n timeout`
28141
28142         at_max_set 0 client
28143         at_max_set 0 mds1
28144
28145 #define OBD_FAIL_PTLRPC_PAUSE_REQ        0x50a
28146         do_facet mds1 $LCTL set_param fail_loc=0x8000050a \
28147                         fail_val=$(((2*timeout + 10)*1000))
28148         touch $DIR/$tdir/d3/file &
28149         sleep 2
28150 #define OBD_FAIL_TGT_REPLY_DATA_RACE     0x722
28151         do_facet mds1 $LCTL set_param fail_loc=0x80000722 \
28152                         fail_val=$((2*timeout + 5))
28153         mv $DIR/$tdir/d1/file1 $DIR/$tdir/d1/file2 &
28154         local pid=$!
28155         sleep 1
28156         kill -9 $pid
28157         sleep $((2 * timeout))
28158         echo kill $pid
28159         kill -9 $pid
28160         lctl mark touch
28161         touch $DIR/$tdir/d2/file3
28162         touch $DIR/$tdir/d2/file4
28163         touch $DIR/$tdir/d2/file5
28164
28165         wait
28166         at_max_set $amc client
28167         at_max_set $amo mds1
28168
28169         # LU-12838 - verify the ptlrpc thread watchdog is not always throttled
28170         do_facet mds1 "dmesg | grep 'Dumping the stack trace for debugging'" ||
28171                 error "Watchdog is always throttled"
28172 }
28173 run_test 422 "kill a process with RPC in progress"
28174
28175 stat_test() {
28176     df -h $MOUNT &
28177     df -h $MOUNT &
28178     df -h $MOUNT &
28179     df -h $MOUNT &
28180     df -h $MOUNT &
28181     df -h $MOUNT &
28182 }
28183
28184 test_423() {
28185     local _stats
28186     # ensure statfs cache is expired
28187     sleep 2;
28188
28189     _stats=$(stat_test | grep $MOUNT | sort -u | wc -l)
28190     [[ ${_stats} -ne 1 ]] && error "statfs wrong"
28191
28192     return 0
28193 }
28194 run_test 423 "statfs should return a right data"
28195
28196 test_424() {
28197 #define OBD_FAIL_PTLRPC_BULK_REPLY_ATTACH      0x522 | CFS_FAIL_ONCE
28198         $LCTL set_param fail_loc=0x80000522
28199         dd if=/dev/zero of=$DIR/$tfile bs=2M count=1 oflag=sync
28200         rm -f $DIR/$tfile
28201 }
28202 run_test 424 "simulate ENOMEM in ptl_send_rpc bulk reply ME attach"
28203
28204 test_425() {
28205         test_mkdir -c -1 $DIR/$tdir
28206         $LFS setstripe -c -1 $DIR/$tdir
28207
28208         lru_resize_disable "" 100
28209         stack_trap "lru_resize_enable" EXIT
28210
28211         sleep 5
28212
28213         for i in $(seq $((MDSCOUNT * 125))); do
28214                 local t=$DIR/$tdir/$tfile_$i
28215
28216                 dd if=/dev/zero of=$t bs=4K count=1 > /dev/null 2>&1 ||
28217                         error_noexit "Create file $t"
28218         done
28219         stack_trap "rm -rf $DIR/$tdir" EXIT
28220
28221         for oscparam in $($LCTL list_param ldlm.namespaces.*osc-[-0-9a-f]*); do
28222                 local lru_size=$($LCTL get_param -n $oscparam.lru_size)
28223                 local lock_count=$($LCTL get_param -n $oscparam.lock_count)
28224
28225                 [ $lock_count -le $lru_size ] ||
28226                         error "osc lock count $lock_count > lru size $lru_size"
28227         done
28228
28229         for mdcparam in $($LCTL list_param ldlm.namespaces.*mdc-*); do
28230                 local lru_size=$($LCTL get_param -n $mdcparam.lru_size)
28231                 local lock_count=$($LCTL get_param -n $mdcparam.lock_count)
28232
28233                 [ $lock_count -le $lru_size ] ||
28234                         error "mdc lock count $lock_count > lru size $lru_size"
28235         done
28236 }
28237 run_test 425 "lock count should not exceed lru size"
28238
28239 test_426() {
28240         splice-test -r $DIR/$tfile
28241         splice-test -rd $DIR/$tfile
28242         splice-test $DIR/$tfile
28243         splice-test -d $DIR/$tfile
28244 }
28245 run_test 426 "splice test on Lustre"
28246
28247 test_427() {
28248         [ $MDSCOUNT -ge 2 ] || skip "needs >= 2 MDTs"
28249         (( $MDS1_VERSION >= $(version_code 2.12.4) )) ||
28250                 skip "Need MDS version at least 2.12.4"
28251         local log
28252
28253         mkdir $DIR/$tdir
28254         mkdir $DIR/$tdir/1
28255         mkdir $DIR/$tdir/2
28256         test_mkdir -c $MDSCOUNT -i 1 $DIR/$tdir/1/dir
28257         test_mkdir -c $MDSCOUNT -i 1 $DIR/$tdir/2/dir2
28258
28259         $LFS getdirstripe $DIR/$tdir/1/dir
28260
28261         #first setfattr for creating updatelog
28262         setfattr -n user.attr0 -v "some text" $DIR/$tdir/1/dir
28263
28264 #define OBD_FAIL_OUT_OBJECT_MISS        0x1708
28265         do_nodes $(comma_list $(mdts_nodes)) $LCTL set_param fail_loc=0x80001708
28266         setfattr -n user.attr1 -v "some text" $DIR/$tdir/1/dir &
28267         setfattr -n user.attr2 -v "another attr"  $DIR/$tdir/2/dir2 &
28268
28269         sleep 2
28270         fail mds2
28271         wait_recovery_complete mds2 $((2*TIMEOUT))
28272
28273         log=$(do_facet mds1 dmesg | tac | sed "/${TESTNAME//_/ }/,$ d")
28274         echo $log | grep "get update log failed" &&
28275                 error "update log corruption is detected" || true
28276 }
28277 run_test 427 "Failed DNE2 update request shouldn't corrupt updatelog"
28278
28279 test_428() {
28280         [ $PARALLEL == "yes" ] && skip "skip parallel run"
28281         local cache_limit=$CACHE_MAX
28282
28283         stack_trap "$LCTL set_param -n llite.*.max_cached_mb=$cache_limit"
28284         $LCTL set_param -n llite.*.max_cached_mb=64
28285
28286         mkdir $DIR/$tdir
28287         $LFS setstripe -c 1 $DIR/$tdir
28288         eval touch $DIR/$tdir/$tfile.{1..$OSTCOUNT}
28289         stack_trap "rm -f $DIR/$tdir/$tfile.*"
28290         #test write
28291         for f in $(seq 4); do
28292                 dd if=/dev/zero of=$DIR/$tdir/$tfile.$f bs=128M count=1 &
28293         done
28294         wait
28295
28296         cancel_lru_locks osc
28297         # Test read
28298         for f in $(seq 4); do
28299                 dd if=$DIR/$tdir/$tfile.$f of=/dev/null bs=128M count=1 &
28300         done
28301         wait
28302 }
28303 run_test 428 "large block size IO should not hang"
28304
28305 test_429() { # LU-7915 / LU-10948
28306         local ll_opencache_threshold_count="llite.*.opencache_threshold_count"
28307         local testfile=$DIR/$tfile
28308         local mdc_rpcstats="mdc.$FSNAME-MDT0000-*.stats"
28309         local new_flag=1
28310         local first_rpc
28311         local second_rpc
28312         local third_rpc
28313
28314         $LCTL get_param $ll_opencache_threshold_count ||
28315                 skip "client does not have opencache parameter"
28316
28317         set_opencache $new_flag
28318         stack_trap "restore_opencache"
28319         [ $($LCTL get_param -n $ll_opencache_threshold_count) == $new_flag ] ||
28320                 error "enable opencache failed"
28321         touch $testfile
28322         # drop MDC DLM locks
28323         cancel_lru_locks mdc
28324         # clear MDC RPC stats counters
28325         $LCTL set_param $mdc_rpcstats=clear
28326
28327         # According to the current implementation, we need to run 3 times
28328         # open & close file to verify if opencache is enabled correctly.
28329         # 1st, RPCs are sent for lookup/open and open handle is released on
28330         #      close finally.
28331         # 2nd, RPC is sent for open, MDS_OPEN_LOCK is fetched automatically,
28332         #      so open handle won't be released thereafter.
28333         # 3rd, No RPC is sent out.
28334         $MULTIOP $testfile oc || error "multiop failed"
28335         first_rpc=$(calc_stats $mdc_rpcstats ldlm_ibits_enqueue)
28336         echo "1st: $first_rpc RPCs in flight"
28337
28338         $MULTIOP $testfile oc || error "multiop failed"
28339         second_rpc=$(calc_stats $mdc_rpcstats ldlm_ibits_enqueue)
28340         echo "2nd: $second_rpc RPCs in flight"
28341
28342         $MULTIOP $testfile oc || error "multiop failed"
28343         third_rpc=$(calc_stats $mdc_rpcstats ldlm_ibits_enqueue)
28344         echo "3rd: $third_rpc RPCs in flight"
28345
28346         #verify no MDC RPC is sent
28347         [[ $second_rpc == $third_rpc ]] || error "MDC RPC is still sent"
28348 }
28349 run_test 429 "verify if opencache flag on client side does work"
28350
28351 lseek_test_430() {
28352         local offset
28353         local file=$1
28354
28355         # data at [200K, 400K)
28356         dd if=/dev/urandom of=$file bs=256K count=1 seek=1 ||
28357                 error "256K->512K dd fails"
28358         # data at [2M, 3M)
28359         dd if=/dev/urandom of=$file bs=1M count=1 seek=2 ||
28360                 error "2M->3M dd fails"
28361         # data at [4M, 5M)
28362         dd if=/dev/urandom of=$file bs=1M count=1 seek=4 ||
28363                 error "4M->5M dd fails"
28364         echo "Data at 256K...512K, 2M...3M and 4M...5M"
28365         # start at first component hole #1
28366         printf "Seeking hole from 1000 ... "
28367         offset=$(lseek_test -l 1000 $file)
28368         echo $offset
28369         [[ $offset == 1000 ]] || error "offset $offset != 1000"
28370         printf "Seeking data from 1000 ... "
28371         offset=$(lseek_test -d 1000 $file)
28372         echo $offset
28373         [[ $offset == 262144 ]] || error "offset $offset != 262144"
28374
28375         # start at first component data block
28376         printf "Seeking hole from 300000 ... "
28377         offset=$(lseek_test -l 300000 $file)
28378         echo $offset
28379         [[ $offset == 524288 ]] || error "offset $offset != 524288"
28380         printf "Seeking data from 300000 ... "
28381         offset=$(lseek_test -d 300000 $file)
28382         echo $offset
28383         [[ $offset == 300000 ]] || error "offset $offset != 300000"
28384
28385         # start at the first component but beyond end of object size
28386         printf "Seeking hole from 1000000 ... "
28387         offset=$(lseek_test -l 1000000 $file)
28388         echo $offset
28389         [[ $offset == 1000000 ]] || error "offset $offset != 1000000"
28390         printf "Seeking data from 1000000 ... "
28391         offset=$(lseek_test -d 1000000 $file)
28392         echo $offset
28393         [[ $offset == 2097152 ]] || error "offset $offset != 2097152"
28394
28395         # start at second component stripe 2 (empty file)
28396         printf "Seeking hole from 1500000 ... "
28397         offset=$(lseek_test -l 1500000 $file)
28398         echo $offset
28399         [[ $offset == 1500000 ]] || error "offset $offset != 1500000"
28400         printf "Seeking data from 1500000 ... "
28401         offset=$(lseek_test -d 1500000 $file)
28402         echo $offset
28403         [[ $offset == 2097152 ]] || error "offset $offset != 2097152"
28404
28405         # start at second component stripe 1 (all data)
28406         printf "Seeking hole from 3000000 ... "
28407         offset=$(lseek_test -l 3000000 $file)
28408         echo $offset
28409         [[ $offset == 3145728 ]] || error "offset $offset != 3145728"
28410         printf "Seeking data from 3000000 ... "
28411         offset=$(lseek_test -d 3000000 $file)
28412         echo $offset
28413         [[ $offset == 3000000 ]] || error "offset $offset != 3000000"
28414
28415         dd if=/dev/urandom of=$file bs=640K count=1 seek=1 ||
28416                 error "2nd dd fails"
28417         echo "Add data block at 640K...1280K"
28418
28419         # start at before new data block, in hole
28420         printf "Seeking hole from 600000 ... "
28421         offset=$(lseek_test -l 600000 $file)
28422         echo $offset
28423         [[ $offset == 600000 ]] || error "offset $offset != 600000"
28424         printf "Seeking data from 600000 ... "
28425         offset=$(lseek_test -d 600000 $file)
28426         echo $offset
28427         [[ $offset == 655360 ]] || error "offset $offset != 655360"
28428
28429         # start at the first component new data block
28430         printf "Seeking hole from 1000000 ... "
28431         offset=$(lseek_test -l 1000000 $file)
28432         echo $offset
28433         [[ $offset == 1310720 ]] || error "offset $offset != 1310720"
28434         printf "Seeking data from 1000000 ... "
28435         offset=$(lseek_test -d 1000000 $file)
28436         echo $offset
28437         [[ $offset == 1000000 ]] || error "offset $offset != 1000000"
28438
28439         # start at second component stripe 2, new data
28440         printf "Seeking hole from 1200000 ... "
28441         offset=$(lseek_test -l 1200000 $file)
28442         echo $offset
28443         [[ $offset == 1310720 ]] || error "offset $offset != 1310720"
28444         printf "Seeking data from 1200000 ... "
28445         offset=$(lseek_test -d 1200000 $file)
28446         echo $offset
28447         [[ $offset == 1200000 ]] || error "offset $offset != 1200000"
28448
28449         # start beyond file end
28450         printf "Using offset > filesize ... "
28451         lseek_test -l 4000000 $file && error "lseek should fail"
28452         printf "Using offset > filesize ... "
28453         lseek_test -d 4000000 $file && error "lseek should fail"
28454
28455         printf "Done\n\n"
28456 }
28457
28458 test_430a() {
28459         $LCTL get_param mdc.*.import | grep -q 'connect_flags:.*seek' ||
28460                 skip "MDT does not support SEEK_HOLE"
28461
28462         $LCTL get_param osc.*.import | grep -q 'connect_flags:.*seek' ||
28463                 skip "OST does not support SEEK_HOLE"
28464
28465         local file=$DIR/$tdir/$tfile
28466
28467         mkdir -p $DIR/$tdir
28468
28469         $LFS setstripe -E 1M -L mdt -E eof -c2 $file
28470         # OST stripe #1 will have continuous data at [1M, 3M)
28471         # OST stripe #2 is empty
28472         echo "Component #1: 1M DoM, component #2: EOF, 2 stripes 1M"
28473         lseek_test_430 $file
28474         rm $file
28475         $LFS setstripe -E 1M -c2 -S 64K -E 10M -c2 -S 1M $file
28476         echo "Component #1: 1M, 2 stripes 64K, component #2: EOF, 2 stripes 1M"
28477         lseek_test_430 $file
28478         rm $file
28479         $LFS setstripe -c2 -S 512K $file
28480         echo "Two stripes, stripe size 512K"
28481         lseek_test_430 $file
28482         rm $file
28483         # FLR with stale mirror
28484         $LFS setstripe -N -E 512K -c1 -S 64K -E eof -c2 -S 512K \
28485                        -N -c2 -S 1M $file
28486         echo "Mirrored file:"
28487         echo "Component #1: 512K, stripe 64K, component #2: EOF, 2 stripes 512K"
28488         echo "Plain 2 stripes 1M"
28489         lseek_test_430 $file
28490         rm $file
28491 }
28492 run_test 430a "lseek: SEEK_DATA/SEEK_HOLE basic functionality"
28493
28494 test_430b() {
28495         $LCTL get_param osc.*.import | grep -q 'connect_flags:.*seek' ||
28496                 skip "OST does not support SEEK_HOLE"
28497
28498         local offset
28499         local file=$DIR/$tdir/$tfile
28500
28501         mkdir -p $DIR/$tdir
28502         # Empty layout lseek should fail
28503         $MCREATE $file
28504         # seek from 0
28505         printf "Seeking hole from 0 ... "
28506         lseek_test -l 0 $file && error "lseek should fail"
28507         printf "Seeking data from 0 ... "
28508         lseek_test -d 0 $file && error "lseek should fail"
28509         rm $file
28510
28511         # 1M-hole file
28512         $LFS setstripe -E 1M -c2 -E eof $file
28513         $TRUNCATE $file 1048576
28514         printf "Seeking hole from 1000000 ... "
28515         offset=$(lseek_test -l 1000000 $file)
28516         echo $offset
28517         [[ $offset == 1000000 ]] || error "offset $offset != 1000000"
28518         printf "Seeking data from 1000000 ... "
28519         lseek_test -d 1000000 $file && error "lseek should fail"
28520         rm $file
28521
28522         # full component followed by non-inited one
28523         $LFS setstripe -E 1M -c2 -E eof $file
28524         dd if=/dev/urandom of=$file bs=1M count=1
28525         printf "Seeking hole from 1000000 ... "
28526         offset=$(lseek_test -l 1000000 $file)
28527         echo $offset
28528         [[ $offset == 1048576 ]] || error "offset $offset != 1048576"
28529         printf "Seeking hole from 1048576 ... "
28530         lseek_test -l 1048576 $file && error "lseek should fail"
28531         # init second component and truncate back
28532         echo "123" >> $file
28533         $TRUNCATE $file 1048576
28534         printf "Seeking hole from 1000000 ... "
28535         offset=$(lseek_test -l 1000000 $file)
28536         echo $offset
28537         [[ $offset == 1048576 ]] || error "offset $offset != 1048576"
28538         printf "Seeking hole from 1048576 ... "
28539         lseek_test -l 1048576 $file && error "lseek should fail"
28540         # boundary checks for big values
28541         dd if=/dev/urandom of=$file.10g bs=1 count=1 seek=10G
28542         offset=$(lseek_test -d 0 $file.10g)
28543         [[ $offset == 10737418240 ]] || error "offset $offset != 10737418240"
28544         dd if=/dev/urandom of=$file.100g bs=1 count=1 seek=100G
28545         offset=$(lseek_test -d 0 $file.100g)
28546         [[ $offset == 107374182400 ]] || error "offset $offset != 107374182400"
28547         return 0
28548 }
28549 run_test 430b "lseek: SEEK_DATA/SEEK_HOLE special cases"
28550
28551 test_430c() {
28552         $LCTL get_param osc.*.import | grep -q 'connect_flags:.*seek' ||
28553                 skip "OST does not support SEEK_HOLE"
28554
28555         local file=$DIR/$tdir/$tfile
28556         local start
28557
28558         mkdir -p $DIR/$tdir
28559         stack_trap "rm -f $file $file.tmp"
28560         dd if=/dev/urandom of=$file bs=1k count=1 seek=5M || error "dd failed"
28561
28562         # cp version 8.33+ prefers lseek over fiemap
28563         local ver=$(cp --version | awk '{ print $4; exit; }')
28564
28565         echo "cp $ver installed"
28566         if (( $(version_code $ver) >= $(version_code 8.33) )); then
28567                 start=$SECONDS
28568                 time cp -v $file $file.tmp || error "cp $file failed"
28569                 (( SECONDS - start < 5 )) || {
28570                         strace cp $file $file.tmp |&
28571                                 grep -E "open|read|seek|FIEMAP" |
28572                                 grep -A 100 $file
28573                         error "cp: too long runtime $((SECONDS - start))"
28574                 }
28575         else
28576                 echo "cp test skipped due to $ver < 8.33"
28577         fi
28578
28579         # tar version 1.29+ supports SEEK_HOLE/DATA
28580         ver=$(tar --version | awk '{ print $4; exit; }')
28581         echo "tar $ver installed"
28582         if (( $(version_code $ver) >= $(version_code 1.29) )); then
28583                 start=$SECONDS
28584                 time tar cvf $file.tmp --sparse $file || error "tar $file error"
28585                 (( SECONDS - start < 5 )) || {
28586                         strace tar cf $file.tmp --sparse $file |&
28587                                 grep -E "open|read|seek|FIEMAP" |
28588                                 grep -A 100 $file
28589                         error "tar: too long runtime $((SECONDS - start))"
28590                 }
28591         else
28592                 echo "tar test skipped due to $ver < 1.29"
28593         fi
28594 }
28595 run_test 430c "lseek: external tools check"
28596
28597 test_431() { # LU-14187
28598         local file=$DIR/$tdir/$tfile
28599
28600         mkdir -p $DIR/$tdir
28601         $LFS setstripe -c 1 -i 0 $file || error "lfs setstripe failed"
28602         dd if=/dev/urandom of=$file bs=4k count=1
28603         dd if=/dev/urandom of=$file bs=4k count=1 seek=10 conv=notrunc
28604         dd if=/dev/urandom of=$file bs=4k count=1 seek=12 conv=notrunc
28605         #define OBD_FAIL_OST_RESTART_IO 0x251
28606         do_facet ost1 "$LCTL set_param fail_loc=0x251"
28607         $LFS setstripe -c 1 -i 0 $file.0 || error "lfs setstripe failed"
28608         cp $file $file.0
28609         cancel_lru_locks
28610         sync_all_data
28611         echo 3 > /proc/sys/vm/drop_caches
28612         diff  $file $file.0 || error "data diff"
28613 }
28614 run_test 431 "Restart transaction for IO"
28615
28616 cleanup_test_432() {
28617         do_facet mgs $LCTL nodemap_activate 0
28618         wait_nm_sync active
28619 }
28620
28621 test_432() {
28622         local tmpdir=$TMP/dir432
28623
28624         (( $MDS1_VERSION >= $(version_code 2.14.52) )) ||
28625                 skip "Need MDS version at least 2.14.52"
28626
28627         stack_trap cleanup_test_432 EXIT
28628         mkdir $DIR/$tdir
28629         mkdir $tmpdir
28630
28631         do_facet mgs $LCTL nodemap_activate 1
28632         wait_nm_sync active
28633         do_facet mgs $LCTL nodemap_modify --name default \
28634                 --property admin --value 1
28635         do_facet mgs $LCTL nodemap_modify --name default \
28636                 --property trusted --value 1
28637         cancel_lru_locks mdc
28638         wait_nm_sync default admin_nodemap
28639         wait_nm_sync default trusted_nodemap
28640
28641         if [ $(mv $tmpdir $DIR/$tdir/ 2>&1 |
28642                grep -ci "Operation not permitted") -ne 0 ]; then
28643                 error "mv $tmpdir $DIR/$tdir/ hits 'Operation not permitted'"
28644         fi
28645 }
28646 run_test 432 "mv dir from outside Lustre"
28647
28648 test_433() {
28649         [ $PARALLEL == "yes" ] && skip "skip parallel run"
28650
28651         [[ -n "$($LCTL list_param llite.*.inode_cache 2>/dev/null)" ]] ||
28652                 skip "inode cache not supported"
28653
28654         $LCTL set_param llite.*.inode_cache=0
28655         stack_trap "$LCTL set_param llite.*.inode_cache=1"
28656
28657         local count=256
28658         local before
28659         local after
28660
28661         cancel_lru_locks mdc
28662         test_mkdir $DIR/$tdir || error "mkdir $tdir"
28663         createmany -m $DIR/$tdir/f $count
28664         createmany -d $DIR/$tdir/d $count
28665         ls -l $DIR/$tdir > /dev/null
28666         stack_trap "rm -rf $DIR/$tdir"
28667
28668         before=$(num_objects)
28669         cancel_lru_locks mdc
28670         after=$(num_objects)
28671
28672         # sometimes even @before is less than 2 * count
28673         while (( before - after < count )); do
28674                 sleep 1
28675                 after=$(num_objects)
28676                 wait=$((wait + 1))
28677                 (( wait % 5 == 0 )) && echo "wait $wait seconds objects: $after"
28678                 if (( wait > 60 )); then
28679                         error "inode slab grew from $before to $after"
28680                 fi
28681         done
28682
28683         echo "lustre_inode_cache $before objs before lock cancel, $after after"
28684 }
28685 run_test 433 "ldlm lock cancel releases dentries and inodes"
28686
28687 test_434() {
28688         local file
28689         local getxattr_count
28690         local mdc_stat_param="mdc.$FSNAME-MDT0000*.md_stats"
28691         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
28692
28693         [[ $(getenforce) == "Disabled" ]] ||
28694                 skip "lsm selinux module have to be disabled for this test"
28695
28696         test_mkdir -i 0 -c1 $DIR/$tdir/ ||
28697                 error "fail to create $DIR/$tdir/ on MDT0000"
28698
28699         touch $DIR/$tdir/$tfile-{001..100}
28700
28701         # disable the xattr cache
28702         save_lustre_params client "llite.*.xattr_cache" > $p
28703         lctl set_param llite.*.xattr_cache=0
28704         stack_trap "restore_lustre_params < $p; rm -f $p" EXIT
28705
28706         # clear clients mdc stats
28707         clear_stats $mdc_stat_param ||
28708                 error "fail to clear stats on mdc MDT0000"
28709
28710         for file in $DIR/$tdir/$tfile-{001..100}; do
28711                 getfattr -n security.selinux $file |&
28712                         grep -q "Operation not supported" ||
28713                         error "getxattr on security.selinux should return EOPNOTSUPP"
28714         done
28715
28716         getxattr_count=$(calc_stats $mdc_stat_param "getxattr")
28717         (( getxattr_count < 100 )) ||
28718                 error "client sent $getxattr_count getxattr RPCs to the MDS"
28719 }
28720 run_test 434 "Client should not send RPCs for security.selinux with SElinux disabled"
28721
28722 test_440() {
28723         if [[ -f $LUSTRE/scripts/bash-completion/lustre ]]; then
28724                 source $LUSTRE/scripts/bash-completion/lustre
28725         elif [[ -f /usr/share/bash-completion/completions/lustre ]]; then
28726                 source /usr/share/bash-completion/completions/lustre
28727         else
28728                 skip "bash completion scripts not found"
28729         fi
28730
28731         local lctl_completions
28732         local lfs_completions
28733
28734         lctl_completions=$(_lustre_cmds lctl)
28735         if [[ ! $lctl_completions =~ "get_param" ]]; then
28736                 error "lctl bash completion failed"
28737         fi
28738
28739         lfs_completions=$(_lustre_cmds lfs)
28740         if [[ ! $lfs_completions =~ "setstripe" ]]; then
28741                 error "lfs bash completion failed"
28742         fi
28743 }
28744 run_test 440 "bash completion for lfs, lctl"
28745
28746 prep_801() {
28747         [[ $MDS1_VERSION -lt $(version_code 2.9.55) ]] ||
28748         [[ $OST1_VERSION -lt $(version_code 2.9.55) ]] &&
28749                 skip "Need server version at least 2.9.55"
28750
28751         start_full_debug_logging
28752 }
28753
28754 post_801() {
28755         stop_full_debug_logging
28756 }
28757
28758 barrier_stat() {
28759         if [ $MGS_VERSION -le $(version_code 2.10.0) ]; then
28760                 local st=$(do_facet mgs $LCTL barrier_stat $FSNAME |
28761                            awk '/The barrier for/ { print $7 }')
28762                 echo $st
28763         else
28764                 local st=$(do_facet mgs $LCTL barrier_stat -s $FSNAME)
28765                 echo \'$st\'
28766         fi
28767 }
28768
28769 barrier_expired() {
28770         local expired
28771
28772         if [ $MGS_VERSION -le $(version_code 2.10.0) ]; then
28773                 expired=$(do_facet mgs $LCTL barrier_stat $FSNAME |
28774                           awk '/will be expired/ { print $7 }')
28775         else
28776                 expired=$(do_facet mgs $LCTL barrier_stat -t $FSNAME)
28777         fi
28778
28779         echo $expired
28780 }
28781
28782 test_801a() {
28783         prep_801
28784
28785         echo "Start barrier_freeze at: $(date)"
28786         #define OBD_FAIL_BARRIER_DELAY          0x2202
28787         do_facet mgs $LCTL set_param fail_val=5 fail_loc=0x2202
28788         # Do not reduce barrier time - See LU-11873
28789         do_facet mgs $LCTL barrier_freeze $FSNAME 20 &
28790
28791         sleep 2
28792         local b_status=$(barrier_stat)
28793         echo "Got barrier status at: $(date)"
28794         [ "$b_status" = "'freezing_p1'" ] ||
28795                 error "(1) unexpected barrier status $b_status"
28796
28797         do_facet mgs $LCTL set_param fail_val=0 fail_loc=0
28798         wait
28799         b_status=$(barrier_stat)
28800         [ "$b_status" = "'frozen'" ] ||
28801                 error "(2) unexpected barrier status $b_status"
28802
28803         local expired=$(barrier_expired)
28804         echo "sleep $((expired + 3)) seconds, then the barrier will be expired"
28805         sleep $((expired + 3))
28806
28807         b_status=$(barrier_stat)
28808         [ "$b_status" = "'expired'" ] ||
28809                 error "(3) unexpected barrier status $b_status"
28810
28811         # Do not reduce barrier time - See LU-11873
28812         do_facet mgs $LCTL barrier_freeze $FSNAME 20 ||
28813                 error "(4) fail to freeze barrier"
28814
28815         b_status=$(barrier_stat)
28816         [ "$b_status" = "'frozen'" ] ||
28817                 error "(5) unexpected barrier status $b_status"
28818
28819         echo "Start barrier_thaw at: $(date)"
28820         #define OBD_FAIL_BARRIER_DELAY          0x2202
28821         do_facet mgs $LCTL set_param fail_val=5 fail_loc=0x2202
28822         do_facet mgs $LCTL barrier_thaw $FSNAME &
28823
28824         sleep 2
28825         b_status=$(barrier_stat)
28826         echo "Got barrier status at: $(date)"
28827         [ "$b_status" = "'thawing'" ] ||
28828                 error "(6) unexpected barrier status $b_status"
28829
28830         do_facet mgs $LCTL set_param fail_val=0 fail_loc=0
28831         wait
28832         b_status=$(barrier_stat)
28833         [ "$b_status" = "'thawed'" ] ||
28834                 error "(7) unexpected barrier status $b_status"
28835
28836         #define OBD_FAIL_BARRIER_FAILURE        0x2203
28837         do_facet $SINGLEMDS $LCTL set_param fail_loc=0x2203
28838         do_facet mgs $LCTL barrier_freeze $FSNAME
28839
28840         b_status=$(barrier_stat)
28841         [ "$b_status" = "'failed'" ] ||
28842                 error "(8) unexpected barrier status $b_status"
28843
28844         do_facet $SINGLEMDS $LCTL set_param fail_loc=0
28845         do_facet mgs $LCTL barrier_thaw $FSNAME
28846
28847         post_801
28848 }
28849 run_test 801a "write barrier user interfaces and stat machine"
28850
28851 test_801b() {
28852         prep_801
28853
28854         mkdir $DIR/$tdir || error "(1) fail to mkdir"
28855         createmany -d $DIR/$tdir/d 6 || error "(2) fail to mkdir"
28856         touch $DIR/$tdir/d2/f10 || error "(3) fail to touch"
28857         touch $DIR/$tdir/d3/f11 || error "(4) fail to touch"
28858         touch $DIR/$tdir/d4/f12 || error "(5) fail to touch"
28859
28860         cancel_lru_locks mdc
28861
28862         # 180 seconds should be long enough
28863         do_facet mgs $LCTL barrier_freeze $FSNAME 180
28864
28865         local b_status=$(barrier_stat)
28866         [ "$b_status" = "'frozen'" ] ||
28867                 error "(6) unexpected barrier status $b_status"
28868
28869         mkdir $DIR/$tdir/d0/d10 &
28870         mkdir_pid=$!
28871
28872         touch $DIR/$tdir/d1/f13 &
28873         touch_pid=$!
28874
28875         ln $DIR/$tdir/d2/f10 $DIR/$tdir/d2/f14 &
28876         ln_pid=$!
28877
28878         mv $DIR/$tdir/d3/f11 $DIR/$tdir/d3/f15 &
28879         mv_pid=$!
28880
28881         rm -f $DIR/$tdir/d4/f12 &
28882         rm_pid=$!
28883
28884         stat $DIR/$tdir/d5 || error "(7) stat should succeed"
28885
28886         # To guarantee taht the 'stat' is not blocked
28887         b_status=$(barrier_stat)
28888         [ "$b_status" = "'frozen'" ] ||
28889                 error "(8) unexpected barrier status $b_status"
28890
28891         # let above commands to run at background
28892         sleep 5
28893
28894         ps -p $mkdir_pid || error "(9) mkdir should be blocked"
28895         ps -p $touch_pid || error "(10) touch should be blocked"
28896         ps -p $ln_pid || error "(11) link should be blocked"
28897         ps -p $mv_pid || error "(12) rename should be blocked"
28898         ps -p $rm_pid || error "(13) unlink should be blocked"
28899
28900         b_status=$(barrier_stat)
28901         [ "$b_status" = "'frozen'" ] ||
28902                 error "(14) unexpected barrier status $b_status"
28903
28904         do_facet mgs $LCTL barrier_thaw $FSNAME
28905         b_status=$(barrier_stat)
28906         [ "$b_status" = "'thawed'" ] ||
28907                 error "(15) unexpected barrier status $b_status"
28908
28909         wait $mkdir_pid || error "(16) mkdir should succeed"
28910         wait $touch_pid || error "(17) touch should succeed"
28911         wait $ln_pid || error "(18) link should succeed"
28912         wait $mv_pid || error "(19) rename should succeed"
28913         wait $rm_pid || error "(20) unlink should succeed"
28914
28915         post_801
28916 }
28917 run_test 801b "modification will be blocked by write barrier"
28918
28919 test_801c() {
28920         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
28921
28922         prep_801
28923
28924         stop mds2 || error "(1) Fail to stop mds2"
28925
28926         do_facet mgs $LCTL barrier_freeze $FSNAME 30
28927
28928         local b_status=$(barrier_stat)
28929         [ "$b_status" = "'expired'" ] || [ "$b_status" = "'failed'" ] || {
28930                 do_facet mgs $LCTL barrier_thaw $FSNAME
28931                 error "(2) unexpected barrier status $b_status"
28932         }
28933
28934         do_facet mgs $LCTL barrier_rescan $FSNAME ||
28935                 error "(3) Fail to rescan barrier bitmap"
28936
28937         # Do not reduce barrier time - See LU-11873
28938         do_facet mgs $LCTL barrier_freeze $FSNAME 20
28939
28940         b_status=$(barrier_stat)
28941         [ "$b_status" = "'frozen'" ] ||
28942                 error "(4) unexpected barrier status $b_status"
28943
28944         do_facet mgs $LCTL barrier_thaw $FSNAME
28945         b_status=$(barrier_stat)
28946         [ "$b_status" = "'thawed'" ] ||
28947                 error "(5) unexpected barrier status $b_status"
28948
28949         local devname=$(mdsdevname 2)
28950
28951         start mds2 $devname $MDS_MOUNT_OPTS || error "(6) Fail to start mds2"
28952
28953         do_facet mgs $LCTL barrier_rescan $FSNAME ||
28954                 error "(7) Fail to rescan barrier bitmap"
28955
28956         post_801
28957 }
28958 run_test 801c "rescan barrier bitmap"
28959
28960 test_802b() {
28961         [ $PARALLEL == "yes" ] && skip "skip parallel run"
28962         remote_mds_nodsh && skip "remote MDS with nodsh"
28963
28964         do_facet $SINGLEMDS $LCTL get_param mdt.*.readonly ||
28965                 skip "readonly option not available"
28966
28967         $LFS mkdir -i 0 -c 1 $DIR/$tdir || error "(1) fail to mkdir"
28968
28969         cp $LUSTRE/tests/test-framework.sh $DIR/$tdir/ ||
28970                 error "(2) Fail to copy"
28971
28972         # write back all cached data before setting MDT to readonly
28973         cancel_lru_locks
28974         sync_all_data
28975
28976         do_facet $SINGLEMDS $LCTL set_param mdt.*.readonly=1
28977         stack_trap "do_facet $SINGLEMDS $LCTL set_param mdt.*.readonly=0" EXIT
28978
28979         echo "Modify should be refused"
28980         touch $DIR/$tdir/guard && error "(6) Touch should fail under ro mode"
28981
28982         echo "Read should be allowed"
28983         diff $LUSTRE/tests/test-framework.sh $DIR/$tdir/test-framework.sh ||
28984                 error "(7) Read should succeed under ro mode"
28985
28986         # disable readonly
28987         do_facet $SINGLEMDS $LCTL set_param mdt.*.readonly=0
28988 }
28989 run_test 802b "be able to set MDTs to readonly"
28990
28991 test_803a() {
28992         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
28993         [ $MDS1_VERSION -lt $(version_code 2.10.54) ] &&
28994                 skip "MDS needs to be newer than 2.10.54"
28995
28996         mkdir_on_mdt0 $DIR/$tdir
28997         # Create some objects on all MDTs to trigger related logs objects
28998         for idx in $(seq $MDSCOUNT); do
28999                 $LFS mkdir -c $MDSCOUNT -i $((idx % $MDSCOUNT)) \
29000                         $DIR/$tdir/dir${idx} ||
29001                         error "Fail to create $DIR/$tdir/dir${idx}"
29002         done
29003
29004         wait_delete_completed # ensure old test cleanups are finished
29005         sleep 3
29006         echo "before create:"
29007         $LFS df -i $MOUNT
29008         local before_used=$($LFS df -i | grep MDT0000_UUID | awk '{print $3}')
29009
29010         for i in {1..10}; do
29011                 $LFS mkdir -c 1 -i 1 $DIR/$tdir/foo$i ||
29012                         error "Fail to create $DIR/$tdir/foo$i"
29013         done
29014
29015         # sync ZFS-on-MDS to refresh statfs data
29016         wait_zfs_commit mds1
29017         sleep 3
29018         echo "after create:"
29019         $LFS df -i $MOUNT
29020         local after_used=$($LFS df -i | grep MDT0000_UUID | awk '{print $3}')
29021
29022         # allow for an llog to be cleaned up during the test
29023         [ $after_used -ge $((before_used + 10 - 1)) ] ||
29024                 error "before ($before_used) + 10 > after ($after_used)"
29025
29026         for i in {1..10}; do
29027                 rm -rf $DIR/$tdir/foo$i ||
29028                         error "Fail to remove $DIR/$tdir/foo$i"
29029         done
29030
29031         # sync ZFS-on-MDS to refresh statfs data
29032         wait_zfs_commit mds1
29033         wait_delete_completed
29034         sleep 3 # avoid MDT return cached statfs
29035         echo "after unlink:"
29036         $LFS df -i $MOUNT
29037         after_used=$($LFS df -i | grep MDT0000_UUID | awk '{print $3}')
29038
29039         # allow for an llog to be created during the test
29040         [ $after_used -le $((before_used + 1)) ] ||
29041                 error "after ($after_used) > before ($before_used) + 1"
29042 }
29043 run_test 803a "verify agent object for remote object"
29044
29045 test_803b() {
29046         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
29047         [ $MDS1_VERSION -lt $(version_code 2.13.56) ] &&
29048                 skip "MDS needs to be newer than 2.13.56"
29049         [ $PARALLEL == "yes" ] && skip "skip parallel run"
29050
29051         for i in $(seq 0 $((MDSCOUNT - 1))); do
29052                 $LFS mkdir -i $i $DIR/$tdir.$i || error "mkdir $tdir.$i"
29053         done
29054
29055         local before=0
29056         local after=0
29057
29058         local tmp
29059
29060         stat $DIR/$tdir.* >/dev/null || error "stat $tdir.*"
29061         for i in $(seq 0 $((MDSCOUNT - 1))); do
29062                 tmp=$(do_facet mds$i $LCTL get_param mdt.*-MDT000$i.md_stats |
29063                         awk '/getattr/ { print $2 }')
29064                 before=$((before + tmp))
29065         done
29066         stat $DIR/$tdir.* >/dev/null || error "stat $tdir.*"
29067         for i in $(seq 0 $((MDSCOUNT - 1))); do
29068                 tmp=$(do_facet mds$i $LCTL get_param mdt.*-MDT000$i.md_stats |
29069                         awk '/getattr/ { print $2 }')
29070                 after=$((after + tmp))
29071         done
29072
29073         [ $before -eq $after ] || error "getattr count $before != $after"
29074 }
29075 run_test 803b "remote object can getattr from cache"
29076
29077 test_804() {
29078         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
29079         [ $MDS1_VERSION -lt $(version_code 2.10.54) ] &&
29080                 skip "MDS needs to be newer than 2.10.54"
29081         [ "$mds1_FSTYPE" != "ldiskfs" ] && skip_env "ldiskfs only test"
29082
29083         mkdir -p $DIR/$tdir
29084         $LFS mkdir -c 1 -i 1 $DIR/$tdir/dir0 ||
29085                 error "Fail to create $DIR/$tdir/dir0"
29086
29087         local fid=$($LFS path2fid $DIR/$tdir/dir0)
29088         local dev=$(mdsdevname 2)
29089
29090         do_facet mds2 "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
29091                 grep ${fid} || error "NOT found agent entry for dir0"
29092
29093         $LFS mkdir -c $MDSCOUNT -i 0 $DIR/$tdir/dir1 ||
29094                 error "Fail to create $DIR/$tdir/dir1"
29095
29096         touch $DIR/$tdir/dir1/foo0 ||
29097                 error "Fail to create $DIR/$tdir/dir1/foo0"
29098         fid=$($LFS path2fid $DIR/$tdir/dir1/foo0)
29099         local rc=0
29100
29101         for idx in $(seq $MDSCOUNT); do
29102                 dev=$(mdsdevname $idx)
29103                 do_facet mds${idx} \
29104                         "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
29105                         grep ${fid} && rc=$idx
29106         done
29107
29108         mv $DIR/$tdir/dir1/foo0 $DIR/$tdir/dir1/foo1 ||
29109                 error "Fail to rename foo0 to foo1"
29110         if [ $rc -eq 0 ]; then
29111                 for idx in $(seq $MDSCOUNT); do
29112                         dev=$(mdsdevname $idx)
29113                         do_facet mds${idx} \
29114                         "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
29115                         grep ${fid} && rc=$idx
29116                 done
29117         fi
29118
29119         mv $DIR/$tdir/dir1/foo1 $DIR/$tdir/dir1/foo2 ||
29120                 error "Fail to rename foo1 to foo2"
29121         if [ $rc -eq 0 ]; then
29122                 for idx in $(seq $MDSCOUNT); do
29123                         dev=$(mdsdevname $idx)
29124                         do_facet mds${idx} \
29125                         "$DEBUGFS -c -R 'ls /REMOTE_PARENT_DIR' $dev" |
29126                         grep ${fid} && rc=$idx
29127                 done
29128         fi
29129
29130         [ $rc -ne 0 ] || error "NOT found agent entry for foo"
29131
29132         ln $DIR/$tdir/dir1/foo2 $DIR/$tdir/dir0/guard ||
29133                 error "Fail to link to $DIR/$tdir/dir1/foo2"
29134         mv $DIR/$tdir/dir1/foo2 $DIR/$tdir/dir1/foo0 ||
29135                 error "Fail to rename foo2 to foo0"
29136         unlink $DIR/$tdir/dir1/foo0 ||
29137                 error "Fail to unlink $DIR/$tdir/dir1/foo0"
29138         rm -rf $DIR/$tdir/dir0 ||
29139                 error "Fail to rm $DIR/$tdir/dir0"
29140
29141         for idx in $(seq $MDSCOUNT); do
29142                 rc=0
29143
29144                 stop mds${idx}
29145                 dev=$(mdsdevname $idx)
29146                 run_e2fsck $(facet_active_host mds$idx) $dev -n ||
29147                         rc=$?
29148                 start mds${idx} $dev $MDS_MOUNT_OPTS ||
29149                         error "mount mds$idx failed"
29150                 df $MOUNT > /dev/null 2>&1
29151
29152                 # e2fsck should not return error
29153                 [ $rc -eq 0 ] ||
29154                         error "e2fsck detected error on MDT${idx}: rc=$rc"
29155         done
29156 }
29157 run_test 804 "verify agent entry for remote entry"
29158
29159 cleanup_805() {
29160         do_facet $SINGLEMDS zfs set quota=$old $fsset
29161         unlinkmany $DIR/$tdir/f- 1000000
29162         trap 0
29163 }
29164
29165 test_805() {
29166         local zfs_version=$(do_facet mds1 cat /sys/module/zfs/version)
29167         [ "$mds1_FSTYPE" != "zfs" ] && skip "ZFS specific test"
29168         [ $(version_code $zfs_version) -lt $(version_code 0.7.2) ] &&
29169                 skip "netfree not implemented before 0.7"
29170         [[ $MDS1_VERSION -ge $(version_code 2.10.57) ]] ||
29171                 skip "Need MDS version at least 2.10.57"
29172
29173         local fsset
29174         local freekb
29175         local usedkb
29176         local old
29177         local quota
29178         local pref="osd-zfs.$FSNAME-MDT0000."
29179
29180         # limit available space on MDS dataset to meet nospace issue
29181         # quickly. then ZFS 0.7.2 can use reserved space if asked
29182         # properly (using netfree flag in osd_declare_destroy()
29183         fsset=$(do_facet $SINGLEMDS lctl get_param -n $pref.mntdev)
29184         old=$(do_facet $SINGLEMDS zfs get -H quota $fsset | \
29185                 gawk '{print $3}')
29186         freekb=$(do_facet $SINGLEMDS lctl get_param -n $pref.kbytesfree)
29187         usedkb=$(do_facet $SINGLEMDS lctl get_param -n $pref.kbytestotal)
29188         let "usedkb=usedkb-freekb"
29189         let "freekb=freekb/2"
29190         if let "freekb > 5000"; then
29191                 let "freekb=5000"
29192         fi
29193         do_facet $SINGLEMDS zfs set quota=$(((usedkb+freekb)*1024)) $fsset
29194         trap cleanup_805 EXIT
29195         mkdir_on_mdt0 $DIR/$tdir
29196         $LFS setstripe -E 1M -c2 -E 4M -c2 -E -1 -c2 $DIR/$tdir ||
29197                 error "Can't set PFL layout"
29198         createmany -m $DIR/$tdir/f- 1000000 && error "ENOSPC wasn't met"
29199         rm -rf $DIR/$tdir || error "not able to remove"
29200         do_facet $SINGLEMDS zfs set quota=$old $fsset
29201         trap 0
29202 }
29203 run_test 805 "ZFS can remove from full fs"
29204
29205 # Size-on-MDS test
29206 check_lsom_data()
29207 {
29208         local file=$1
29209         local expect=$(stat -c %s $file)
29210
29211         check_lsom_size $1 $expect
29212
29213         local blocks=$($LFS getsom -b $file)
29214         expect=$(stat -c %b $file)
29215         [[ $blocks == $expect ]] ||
29216                 error "$file expected blocks: $expect, got: $blocks"
29217 }
29218
29219 check_lsom_size()
29220 {
29221         local size
29222         local expect=$2
29223
29224         cancel_lru_locks mdc
29225
29226         size=$($LFS getsom -s $1)
29227         [[ $size == $expect ]] ||
29228                 error "$file expected size: $expect, got: $size"
29229 }
29230
29231 test_806() {
29232         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
29233                 skip "Need MDS version at least 2.11.52"
29234
29235         local bs=1048576
29236
29237         $LFS setstripe -c-1 $DIR/$tfile || error "setstripe $tfile failed"
29238
29239         disable_opencache
29240         stack_trap "restore_opencache"
29241
29242         # single-threaded write
29243         echo "Test SOM for single-threaded write"
29244         dd if=/dev/zero of=$DIR/$tfile bs=$bs count=1 ||
29245                 error "write $tfile failed"
29246         check_lsom_size $DIR/$tfile $bs
29247
29248         local num=32
29249         local size=$(($num * $bs))
29250         local offset=0
29251         local i
29252
29253         echo "Test SOM for single client multi-threaded($num) write"
29254         $TRUNCATE $DIR/$tfile 0
29255         for ((i = 0; i < $num; i++)); do
29256                 $MULTIOP $DIR/$tfile Oz${offset}w${bs}c &
29257                 local pids[$i]=$!
29258                 offset=$((offset + $bs))
29259         done
29260         for (( i=0; i < $num; i++ )); do
29261                 wait ${pids[$i]}
29262         done
29263         check_lsom_size $DIR/$tfile $size
29264
29265         $TRUNCATE $DIR/$tfile 0
29266         for ((i = 0; i < $num; i++)); do
29267                 offset=$((offset - $bs))
29268                 $MULTIOP $DIR/$tfile Oz${offset}w${bs}c &
29269                 local pids[$i]=$!
29270         done
29271         for (( i=0; i < $num; i++ )); do
29272                 wait ${pids[$i]}
29273         done
29274         check_lsom_size $DIR/$tfile $size
29275
29276         # multi-client writes
29277         num=$(get_node_count ${CLIENTS//,/ })
29278         size=$(($num * $bs))
29279         offset=0
29280         i=0
29281
29282         echo "Test SOM for multi-client ($num) writes"
29283         $TRUNCATE $DIR/$tfile 0
29284         for client in ${CLIENTS//,/ }; do
29285                 do_node $client $MULTIOP $DIR/$tfile Oz${offset}w${bs}c &
29286                 local pids[$i]=$!
29287                 i=$((i + 1))
29288                 offset=$((offset + $bs))
29289         done
29290         for (( i=0; i < $num; i++ )); do
29291                 wait ${pids[$i]}
29292         done
29293         check_lsom_size $DIR/$tfile $offset
29294
29295         i=0
29296         $TRUNCATE $DIR/$tfile 0
29297         for client in ${CLIENTS//,/ }; do
29298                 offset=$((offset - $bs))
29299                 do_node $client $MULTIOP $DIR/$tfile Oz${offset}w${bs}c &
29300                 local pids[$i]=$!
29301                 i=$((i + 1))
29302         done
29303         for (( i=0; i < $num; i++ )); do
29304                 wait ${pids[$i]}
29305         done
29306         check_lsom_size $DIR/$tfile $size
29307
29308         # verify SOM blocks count
29309         echo "Verify SOM block count"
29310         $TRUNCATE $DIR/$tfile 0
29311         $MULTIOP $DIR/$tfile oO_TRUNC:O_RDWR:w$((bs))YSc ||
29312                 error "failed to write file $tfile with fdatasync and fstat"
29313         check_lsom_data $DIR/$tfile
29314
29315         $TRUNCATE $DIR/$tfile 0
29316         $MULTIOP $DIR/$tfile oO_TRUNC:O_RDWR:w$((bs * 2))Yc ||
29317                 error "failed to write file $tfile with fdatasync"
29318         check_lsom_data $DIR/$tfile
29319
29320         $TRUNCATE $DIR/$tfile 0
29321         $MULTIOP $DIR/$tfile oO_TRUNC:O_RDWR:O_SYNC:w$((bs * 3))c ||
29322                 error "failed to write file $tfile with sync IO"
29323         check_lsom_data $DIR/$tfile
29324
29325         # verify truncate
29326         echo "Test SOM for truncate"
29327         # use ftruncate to sync blocks on close request
29328         $MULTIOP $DIR/$tfile oO_WRONLY:T16384c
29329         check_lsom_size $DIR/$tfile 16384
29330         check_lsom_data $DIR/$tfile
29331
29332         $TRUNCATE $DIR/$tfile 1234
29333         check_lsom_size $DIR/$tfile 1234
29334         # sync blocks on the MDT
29335         $MULTIOP $DIR/$tfile oc
29336         check_lsom_data $DIR/$tfile
29337 }
29338 run_test 806 "Verify Lazy Size on MDS"
29339
29340 test_807() {
29341         [ -n "$FILESET" ] && skip "Not functional for FILESET set"
29342         [ $MDS1_VERSION -lt $(version_code 2.11.52) ] &&
29343                 skip "Need MDS version at least 2.11.52"
29344
29345         # Registration step
29346         changelog_register || error "changelog_register failed"
29347         local cl_user="${CL_USERS[$SINGLEMDS]%% *}"
29348         changelog_users $SINGLEMDS | grep -q $cl_user ||
29349                 error "User $cl_user not found in changelog_users"
29350
29351         rm -rf $DIR/$tdir || error "rm $tdir failed"
29352         mkdir_on_mdt0 $DIR/$tdir || error "mkdir $tdir failed"
29353         touch $DIR/$tdir/trunc || error "touch $tdir/trunc failed"
29354         $TRUNCATE $DIR/$tdir/trunc 1024 || error "truncate $tdir/trunc failed"
29355         $TRUNCATE $DIR/$tdir/trunc 1048576 ||
29356                 error "truncate $tdir/trunc failed"
29357
29358         local bs=1048576
29359         echo "Test SOM for single-threaded write with fsync"
29360         dd if=/dev/zero of=$DIR/$tdir/single_dd bs=$bs count=1 ||
29361                 error "write $tfile failed"
29362         sync;sync;sync
29363
29364         # multi-client wirtes
29365         local num=$(get_node_count ${CLIENTS//,/ })
29366         local offset=0
29367         local i=0
29368
29369         echo "Test SOM for multi-client ($num) writes"
29370         touch $DIR/$tfile || error "touch $tfile failed"
29371         $TRUNCATE $DIR/$tfile 0
29372         for client in ${CLIENTS//,/ }; do
29373                 do_node $client $MULTIOP $DIR/$tfile Oz${offset}w${bs}c &
29374                 local pids[$i]=$!
29375                 i=$((i + 1))
29376                 offset=$((offset + $bs))
29377         done
29378         for (( i=0; i < $num; i++ )); do
29379                 wait ${pids[$i]}
29380         done
29381
29382         do_rpc_nodes "$CLIENTS" cancel_lru_locks osc
29383         do_nodes "$CLIENTS" "sync ; sleep 5 ; sync"
29384         $LSOM_SYNC -u $cl_user -m $FSNAME-MDT0000 $MOUNT
29385         check_lsom_data $DIR/$tdir/trunc
29386         check_lsom_data $DIR/$tdir/single_dd
29387         check_lsom_data $DIR/$tfile
29388
29389         rm -rf $DIR/$tdir
29390         # Deregistration step
29391         changelog_deregister || error "changelog_deregister failed"
29392 }
29393 run_test 807 "verify LSOM syncing tool"
29394
29395 check_som_nologged()
29396 {
29397         local lines=$($LFS changelog $FSNAME-MDT0000 |
29398                 grep 'x=trusted.som' | wc -l)
29399         [ $lines -ne 0 ] && error "trusted.som xattr is logged in Changelogs"
29400 }
29401
29402 test_808() {
29403         [ $MDS1_VERSION -lt $(version_code 2.11.55) ] &&
29404                 skip "Need MDS version at least 2.11.55"
29405
29406         # Registration step
29407         changelog_register || error "changelog_register failed"
29408
29409         touch $DIR/$tfile || error "touch $tfile failed"
29410         check_som_nologged
29411
29412         dd if=/dev/zero of=$DIR/$tfile bs=1048576 count=1 ||
29413                 error "write $tfile failed"
29414         check_som_nologged
29415
29416         $TRUNCATE $DIR/$tfile 1234
29417         check_som_nologged
29418
29419         $TRUNCATE $DIR/$tfile 1048576
29420         check_som_nologged
29421
29422         # Deregistration step
29423         changelog_deregister || error "changelog_deregister failed"
29424 }
29425 run_test 808 "Check trusted.som xattr not logged in Changelogs"
29426
29427 check_som_nodata()
29428 {
29429         $LFS getsom $1
29430         [[ $? -eq 61 ]] || error "DoM-only file $1 has SOM xattr"
29431 }
29432
29433 test_809() {
29434         [ $MDS1_VERSION -lt $(version_code 2.11.56) ] &&
29435                 skip "Need MDS version at least 2.11.56"
29436
29437         $LFS setstripe -E 1M -L mdt $DIR/$tfile ||
29438                 error "failed to create DoM-only file $DIR/$tfile"
29439         touch $DIR/$tfile || error "touch $tfile failed"
29440         check_som_nodata $DIR/$tfile
29441
29442         dd if=/dev/zero of=$DIR/$tfile bs=2048 count=1 ||
29443                 error "write $tfile failed"
29444         check_som_nodata $DIR/$tfile
29445
29446         $TRUNCATE $DIR/$tfile 1234
29447         check_som_nodata $DIR/$tfile
29448
29449         $TRUNCATE $DIR/$tfile 4097
29450         check_som_nodata $DIR/$file
29451 }
29452 run_test 809 "Verify no SOM xattr store for DoM-only files"
29453
29454 test_810() {
29455         [ $PARALLEL == "yes" ] && skip "skip parallel run"
29456         $GSS && skip_env "could not run with gss"
29457         [[ $OST1_VERSION -gt $(version_code 2.12.58) ]] ||
29458                 skip "OST < 2.12.58 doesn't align checksum"
29459
29460         set_checksums 1
29461         stack_trap "set_checksums $ORIG_CSUM" EXIT
29462         stack_trap "set_checksum_type $ORIG_CSUM_TYPE" EXIT
29463
29464         local csum
29465         local before
29466         local after
29467         for csum in $CKSUM_TYPES; do
29468                 #define OBD_FAIL_OSC_NO_GRANT   0x411
29469                 $LCTL set_param osc.*.checksum_type=$csum fail_loc=0x411
29470                 for i in "10240 0" "10000 0" "4000 1" "500 1"; do
29471                         eval set -- $i
29472                         dd if=/dev/urandom of=$DIR/$tfile bs=$1 count=2 seek=$2
29473                         before=$(md5sum $DIR/$tfile)
29474                         $LCTL set_param ldlm.namespaces.*osc*.lru_size=clear
29475                         after=$(md5sum $DIR/$tfile)
29476                         [ "$before" == "$after" ] ||
29477                                 error "$csum: $before != $after bs=$1 seek=$2"
29478                 done
29479         done
29480 }
29481 run_test 810 "partial page writes on ZFS (LU-11663)"
29482
29483 test_812a() {
29484         [ $OST1_VERSION -lt $(version_code 2.12.51) ] &&
29485                 skip "OST < 2.12.51 doesn't support this fail_loc"
29486
29487         $LFS setstripe -c 1 -i 0 $DIR/$tfile
29488         # ensure ost1 is connected
29489         stat $DIR/$tfile >/dev/null || error "can't stat"
29490         wait_osc_import_state client ost1 FULL
29491         # no locks, no reqs to let the connection idle
29492         cancel_lru_locks osc
29493
29494         # delay OST_DISCONNECT on OST1 to put OSC into intermediate state
29495 #define OBD_FAIL_OST_DISCONNECT_DELAY    0x245
29496         do_facet ost1 "$LCTL set_param fail_loc=0x245 fail_val=8"
29497         wait_osc_import_state client ost1 CONNECTING
29498         do_facet ost1 "$LCTL set_param fail_loc=0 fail_val=0"
29499
29500         stat $DIR/$tfile >/dev/null || error "can't stat file"
29501 }
29502 run_test 812a "do not drop reqs generated when imp is going to idle (LU-11951)"
29503
29504 test_812b() { # LU-12378
29505         [ $OST1_VERSION -lt $(version_code 2.12.51) ] &&
29506                 skip "OST < 2.12.51 doesn't support this fail_loc"
29507
29508         $LFS setstripe -c 1 -i 0 $DIR/$tfile || error "setstripe failed"
29509         # ensure ost1 is connected
29510         stat $DIR/$tfile >/dev/null || error "can't stat"
29511         wait_osc_import_state client ost1 FULL
29512         # no locks, no reqs to let the connection idle
29513         cancel_lru_locks osc
29514
29515         # delay OST_DISCONNECT on OST1 to put OSC into intermediate state
29516 #define OBD_FAIL_OST_DISCONNECT_DELAY    0x245
29517         do_facet ost1 "$LCTL set_param fail_loc=0x245 fail_val=8"
29518         wait_osc_import_state client ost1 CONNECTING
29519         do_facet ost1 "$LCTL set_param fail_loc=0 fail_val=0"
29520
29521         $LFS quota -u 0 $DIR/ || error "lfs quota should succeed"
29522         wait_osc_import_state client ost1 IDLE
29523 }
29524 run_test 812b "do not drop no resend request for idle connect"
29525
29526 test_812c() {
29527         local old
29528
29529         old=$($LCTL get_param -n osc.*.idle_timeout | head -n 1)
29530
29531         $LFS setstripe -c 1 -o 0 $DIR/$tfile
29532         $LFS getstripe $DIR/$tfile
29533         $LCTL set_param osc.*.idle_timeout=10
29534         stack_trap "$LCTL set_param osc.*.idle_timeout=$old" EXIT
29535         # ensure ost1 is connected
29536         stat $DIR/$tfile >/dev/null || error "can't stat"
29537         wait_osc_import_state client ost1 FULL
29538         # no locks, no reqs to let the connection idle
29539         cancel_lru_locks osc
29540
29541 #define OBD_FAIL_PTLRPC_IDLE_RACE        0x533
29542         $LCTL set_param fail_loc=0x80000533
29543         sleep 15
29544         dd if=/dev/zero of=$DIR/$tfile count=1 conv=sync || error "dd failed"
29545 }
29546 run_test 812c "idle import vs lock enqueue race"
29547
29548 test_813() {
29549         local file_heat_sav=$($LCTL get_param -n llite.*.file_heat 2>/dev/null)
29550         [ -z "$file_heat_sav" ] && skip "no file heat support"
29551
29552         local readsample
29553         local writesample
29554         local readbyte
29555         local writebyte
29556         local readsample1
29557         local writesample1
29558         local readbyte1
29559         local writebyte1
29560
29561         local period_second=$($LCTL get_param -n llite.*.heat_period_second)
29562         local decay_pct=$($LCTL get_param -n llite.*.heat_decay_percentage)
29563
29564         $LCTL set_param -n llite.*.file_heat=1
29565         echo "Turn on file heat"
29566         echo "Period second: $period_second, Decay percentage: $decay_pct"
29567
29568         echo "QQQQ" > $DIR/$tfile
29569         echo "QQQQ" > $DIR/$tfile
29570         echo "QQQQ" > $DIR/$tfile
29571         cat $DIR/$tfile > /dev/null
29572         cat $DIR/$tfile > /dev/null
29573         cat $DIR/$tfile > /dev/null
29574         cat $DIR/$tfile > /dev/null
29575
29576         local out=$($LFS heat_get $DIR/$tfile)
29577
29578         $LFS heat_get $DIR/$tfile
29579         readsample=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
29580         writesample=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
29581         readbyte=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
29582         writebyte=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
29583
29584         [ $readsample -le 4 ] || error "read sample ($readsample) is wrong"
29585         [ $writesample -le 3 ] || error "write sample ($writesample) is wrong"
29586         [ $readbyte -le 20 ] || error "read bytes ($readbyte) is wrong"
29587         [ $writebyte -le 15 ] || error "write bytes ($writebyte) is wrong"
29588
29589         sleep $((period_second + 3))
29590         echo "Sleep $((period_second + 3)) seconds..."
29591         # The recursion formula to calculate the heat of the file f is as
29592         # follow:
29593         # Hi+1(f) = (1-P)*Hi(f)+ P*Ci
29594         # Where Hi is the heat value in the period between time points i*I and
29595         # (i+1)*I; Ci is the access count in the period; the symbol P refers
29596         # to the weight of Ci.
29597         out=$($LFS heat_get $DIR/$tfile)
29598         $LFS heat_get $DIR/$tfile
29599         readsample=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
29600         writesample=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
29601         readbyte=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
29602         writebyte=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
29603
29604         [ $(bc <<< "$readsample <= 4 * $decay_pct / 100") -eq 1 ] ||
29605                 error "read sample ($readsample) is wrong"
29606         [ $(bc <<< "$writesample <= 3 * $decay_pct / 100") -eq 1 ] ||
29607                 error "write sample ($writesample) is wrong"
29608         [ $(bc <<< "$readbyte <= 20 * $decay_pct / 100") -eq 1 ] ||
29609                 error "read bytes ($readbyte) is wrong"
29610         [ $(bc <<< "$writebyte <= 15 * $decay_pct / 100") -eq 1 ] ||
29611                 error "write bytes ($writebyte) is wrong"
29612
29613         echo "QQQQ" > $DIR/$tfile
29614         echo "QQQQ" > $DIR/$tfile
29615         echo "QQQQ" > $DIR/$tfile
29616         cat $DIR/$tfile > /dev/null
29617         cat $DIR/$tfile > /dev/null
29618         cat $DIR/$tfile > /dev/null
29619         cat $DIR/$tfile > /dev/null
29620
29621         sleep $((period_second + 3))
29622         echo "Sleep $((period_second + 3)) seconds..."
29623
29624         out=$($LFS heat_get $DIR/$tfile)
29625         $LFS heat_get $DIR/$tfile
29626         readsample1=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
29627         writesample1=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
29628         readbyte1=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
29629         writebyte1=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
29630
29631         [ $(bc <<< "$readsample1 <= ($readsample * (100 - $decay_pct) + \
29632                 4 * $decay_pct) / 100") -eq 1 ] ||
29633                 error "read sample ($readsample1) is wrong"
29634         [ $(bc <<< "$writesample1 <= ($writesample * (100 - $decay_pct) + \
29635                 3 * $decay_pct) / 100") -eq 1 ] ||
29636                 error "write sample ($writesample1) is wrong"
29637         [ $(bc <<< "$readbyte1 <= ($readbyte * (100 - $decay_pct) + \
29638                 20 * $decay_pct) / 100") -eq 1 ] ||
29639                 error "read bytes ($readbyte1) is wrong"
29640         [ $(bc <<< "$writebyte1 <= ($writebyte * (100 - $decay_pct) + \
29641                 15 * $decay_pct) / 100") -eq 1 ] ||
29642                 error "write bytes ($writebyte1) is wrong"
29643
29644         echo "Turn off file heat for the file $DIR/$tfile"
29645         $LFS heat_set -o $DIR/$tfile
29646
29647         echo "QQQQ" > $DIR/$tfile
29648         echo "QQQQ" > $DIR/$tfile
29649         echo "QQQQ" > $DIR/$tfile
29650         cat $DIR/$tfile > /dev/null
29651         cat $DIR/$tfile > /dev/null
29652         cat $DIR/$tfile > /dev/null
29653         cat $DIR/$tfile > /dev/null
29654
29655         out=$($LFS heat_get $DIR/$tfile)
29656         $LFS heat_get $DIR/$tfile
29657         readsample=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
29658         writesample=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
29659         readbyte=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
29660         writebyte=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
29661
29662         [ $readsample -eq 0 ] || error "read sample ($readsample) is wrong"
29663         [ $writesample -eq 0 ] || error "write sample ($writesample) is wrong"
29664         [ $readbyte -eq 0 ] || error "read bytes ($readbyte) is wrong"
29665         [ $writebyte -eq 0 ] || error "write bytes ($writebyte) is wrong"
29666
29667         echo "Trun on file heat for the file $DIR/$tfile"
29668         $LFS heat_set -O $DIR/$tfile
29669
29670         echo "QQQQ" > $DIR/$tfile
29671         echo "QQQQ" > $DIR/$tfile
29672         echo "QQQQ" > $DIR/$tfile
29673         cat $DIR/$tfile > /dev/null
29674         cat $DIR/$tfile > /dev/null
29675         cat $DIR/$tfile > /dev/null
29676         cat $DIR/$tfile > /dev/null
29677
29678         out=$($LFS heat_get $DIR/$tfile)
29679         $LFS heat_get $DIR/$tfile
29680         readsample=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
29681         writesample=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
29682         readbyte=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
29683         writebyte=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
29684
29685         [ $readsample -gt 0 ] || error "read sample ($readsample) is wrong"
29686         [ $writesample -gt 0 ] || error "write sample ($writesample) is wrong"
29687         [ $readbyte -gt 0 ] || error "read bytes ($readbyte) is wrong"
29688         [ $writebyte -gt 0 ] || error "write bytes ($writebyte) is wrong"
29689
29690         $LFS heat_set -c $DIR/$tfile
29691         $LCTL set_param -n llite.*.file_heat=0
29692         echo "Turn off file heat support for the Lustre filesystem"
29693
29694         echo "QQQQ" > $DIR/$tfile
29695         echo "QQQQ" > $DIR/$tfile
29696         echo "QQQQ" > $DIR/$tfile
29697         cat $DIR/$tfile > /dev/null
29698         cat $DIR/$tfile > /dev/null
29699         cat $DIR/$tfile > /dev/null
29700         cat $DIR/$tfile > /dev/null
29701
29702         out=$($LFS heat_get $DIR/$tfile)
29703         $LFS heat_get $DIR/$tfile
29704         readsample=$(echo "$out" | grep 'readsample' | awk '{ print $2 }')
29705         writesample=$(echo "$out" | grep 'writesample' | awk '{ print $2 }')
29706         readbyte=$(echo "$out" | grep 'readbyte' | awk '{ print $2 }')
29707         writebyte=$(echo "$out" | grep 'writebyte' | awk '{ print $2 }')
29708
29709         [ $readsample -eq 0 ] || error "read sample ($readsample) is wrong"
29710         [ $writesample -eq 0 ] || error "write sample ($writesample) is wrong"
29711         [ $readbyte -eq 0 ] || error "read bytes ($readbyte) is wrong"
29712         [ $writebyte -eq 0 ] || error "write bytes ($writebyte) is wrong"
29713
29714         $LCTL set_param -n llite.*.file_heat=$file_heat_sav
29715         rm -f $DIR/$tfile
29716 }
29717 run_test 813 "File heat verfication"
29718
29719 test_814()
29720 {
29721         dd of=$DIR/$tfile seek=128 bs=1k < /dev/null
29722         echo -n y >> $DIR/$tfile
29723         cp --sparse=always $DIR/$tfile $DIR/${tfile}.cp || error "copy failed"
29724         diff $DIR/$tfile $DIR/${tfile}.cp || error "files should be same"
29725 }
29726 run_test 814 "sparse cp works as expected (LU-12361)"
29727
29728 test_815()
29729 {
29730         writeme -b 100 $DIR/$tfile || error "write 100 bytes failed"
29731         writeme -b 0 $DIR/$tfile || error "write 0 byte failed"
29732 }
29733 run_test 815 "zero byte tiny write doesn't hang (LU-12382)"
29734
29735 test_816() {
29736         local ost1_imp=$(get_osc_import_name client ost1)
29737         local imp_name=$($LCTL list_param osc.$ost1_imp | head -n1 |
29738                          cut -d'.' -f2)
29739
29740         $LFS setstripe -c 1 -i 0 $DIR/$tfile
29741         # ensure ost1 is connected
29742
29743         stat $DIR/$tfile >/dev/null || error "can't stat"
29744         wait_osc_import_state client ost1 FULL
29745         # no locks, no reqs to let the connection idle
29746         cancel_lru_locks osc
29747         lru_resize_disable osc
29748         local before
29749         local now
29750         before=$($LCTL get_param -n \
29751                  ldlm.namespaces.$imp_name.lru_size)
29752
29753         wait_osc_import_state client ost1 IDLE
29754         dd if=/dev/null of=$DIR/$tfile bs=1k count=1 conv=sync
29755         now=$($LCTL get_param -n \
29756               ldlm.namespaces.$imp_name.lru_size)
29757         [ $before == $now ] || error "lru_size changed $before != $now"
29758 }
29759 run_test 816 "do not reset lru_resize on idle reconnect"
29760
29761 cleanup_817() {
29762         umount $tmpdir
29763         exportfs -u localhost:$DIR/nfsexp
29764         rm -rf $DIR/nfsexp
29765 }
29766
29767 test_817() {
29768         systemctl restart nfs-server.service || skip "failed to restart nfsd"
29769
29770         mkdir -p $DIR/nfsexp
29771         exportfs -orw,no_root_squash localhost:$DIR/nfsexp ||
29772                 error "failed to export nfs"
29773
29774         tmpdir=$(mktemp -d /tmp/nfs-XXXXXX)
29775         stack_trap cleanup_817 EXIT
29776
29777         mount -t nfs -orw localhost:$DIR/nfsexp $tmpdir ||
29778                 error "failed to mount nfs to $tmpdir"
29779
29780         cp /bin/true $tmpdir
29781         $DIR/nfsexp/true || error "failed to execute 'true' command"
29782 }
29783 run_test 817 "nfsd won't cache write lock for exec file"
29784
29785 test_818() {
29786         test_mkdir -i0 -c1 $DIR/$tdir
29787         $LFS setstripe -c1 -i0 $DIR/$tdir/$tfile
29788         $LFS setstripe -c1 -i1 $DIR/$tdir/$tfile
29789         stop $SINGLEMDS
29790
29791         # restore osp-syn threads
29792         stack_trap "fail $SINGLEMDS"
29793
29794         #define OBD_FAIL_OSP_CANT_PROCESS_LLOG          0x2105
29795         do_facet $SINGLEMDS lctl set_param fail_loc=0x80002105
29796         start $SINGLEMDS $(mdsdevname ${SINGLEMDS//mds/}) $MDS_MOUNT_OPTS ||
29797                 error "start $SINGLEMDS failed"
29798         rm -rf $DIR/$tdir
29799
29800         local testid=$(echo $TESTNAME | tr '_' ' ')
29801
29802         do_facet mds1 dmesg | tac | sed "/$testid/,$ d" |
29803                 grep "run LFSCK" || error "run LFSCK is not suggested"
29804 }
29805 run_test 818 "unlink with failed llog"
29806
29807 test_819a() {
29808         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
29809         cancel_lru_locks osc
29810         #define OBD_FAIL_OST_2BIG_NIOBUF                0x248
29811         do_facet $SINGLEMDS lctl set_param fail_loc=0x80000248
29812         dd if=$DIR/$tfile of=/dev/null bs=1M count=1
29813         rm -f $TDIR/$tfile
29814 }
29815 run_test 819a "too big niobuf in read"
29816
29817 test_819b() {
29818         #define OBD_FAIL_OST_2BIG_NIOBUF                0x248
29819         do_facet $SINGLEMDS lctl set_param fail_loc=0x80000248
29820         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
29821         cancel_lru_locks osc
29822         sleep 1
29823         rm -f $TDIR/$tfile
29824 }
29825 run_test 819b "too big niobuf in write"
29826
29827
29828 function test_820_start_ost() {
29829         sleep 5
29830
29831         for num in $(seq $OSTCOUNT); do
29832                 start ost$num $(ostdevname $num) $OST_MOUNT_OPTS
29833         done
29834 }
29835
29836 test_820() {
29837         [[ $MDSCOUNT -lt 2 ]] && skip_env "needs >= 2 MDTs"
29838
29839         mkdir $DIR/$tdir
29840         umount_client $MOUNT || error "umount failed"
29841         for num in $(seq $OSTCOUNT); do
29842                 stop ost$num
29843         done
29844
29845         # mount client with no active OSTs
29846         # so that the client can't initialize max LOV EA size
29847         # from OSC notifications
29848         mount_client $MOUNT || error "mount failed"
29849         # delay OST starting to keep this 0 max EA size for a while
29850         test_820_start_ost &
29851
29852         # create a directory on MDS2
29853         test_mkdir -i 1 -c1 $DIR/$tdir/mds2 ||
29854                 error "Failed to create directory"
29855         # open intent should update default EA size
29856         # see mdc_update_max_ea_from_body()
29857         # notice this is the very first RPC to MDS2
29858         out=$(cp /etc/services $DIR/$tdir/mds2 2>&1)
29859         ret=$?
29860         echo $out
29861         # With SSK, this situation can lead to -EPERM being returned.
29862         # In that case, simply retry.
29863         if [ $ret -ne 0 ] && $SHARED_KEY; then
29864                 if echo "$out" | grep -q "not permitted"; then
29865                         cp /etc/services $DIR/$tdir/mds2
29866                         ret=$?
29867                 fi
29868         fi
29869         [ $ret -eq 0 ] || error "Failed to copy files to mds$n"
29870 }
29871 run_test 820 "update max EA from open intent"
29872
29873 test_823() {
29874         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
29875         local OST_MAX_PRECREATE=20000
29876
29877         (( $MDS1_VERSION >= $(version_code 2.14.56) )) ||
29878                 skip "Need MDS version at least 2.14.56"
29879
29880         save_lustre_params mds1 \
29881                 "osp.$FSNAME-OST*-osc-MDT0000.max_create_count" > $p
29882         do_facet $SINGLEMDS "$LCTL set_param -n \
29883                 osp.$FSNAME-OST*MDT0000.max_create_count=0"
29884         do_facet $SINGLEMDS "$LCTL set_param -n \
29885                 osp.$FSNAME-OST0000*MDT0000.max_create_count=$OST_MAX_PRECREATE"
29886
29887         stack_trap "restore_lustre_params < $p; rm $p"
29888
29889         do_facet $SINGLEMDS "$LCTL set_param -n \
29890                 osp.$FSNAME-OST*-osc-MDT*.create_count=100200"
29891
29892         local count=$(do_facet $SINGLEMDS "$LCTL get_param -n \
29893                       osp.$FSNAME-OST0000*MDT0000.create_count")
29894         local max=$(do_facet $SINGLEMDS "$LCTL get_param -n \
29895                     osp.$FSNAME-OST0000*MDT0000.max_create_count")
29896         local expect_count=$(((($max/2)/256) * 256))
29897
29898         log "setting create_count to 100200:"
29899         log " -result- count: $count with max: $max, expecting: $expect_count"
29900
29901         [[ $count -eq expect_count ]] ||
29902                 error "Create count not set to max precreate."
29903 }
29904 run_test 823 "Setting create_count > OST_MAX_PRECREATE is lowered to maximum"
29905
29906 test_831() {
29907         [[ $MDS1_VERSION -lt $(version_code 2.14.56) ]] &&
29908                 skip "Need MDS version 2.14.56"
29909
29910         local sync_changes=$(do_facet $SINGLEMDS \
29911                 $LCTL get_param -n osp.$FSNAME-OST0000-osc-MDT0000.sync_changes)
29912
29913         [ "$sync_changes" -gt 100 ] &&
29914                 skip "Sync changes $sync_changes > 100 already"
29915
29916         local p="$TMP/$TESTSUITE-$TESTNAME.parameters"
29917
29918         $LFS mkdir -i 0 $DIR/$tdir
29919         $LFS setstripe -c 1 -i 0 $DIR/$tdir
29920
29921         save_lustre_params mds1 \
29922                 "osp.$FSNAME-OST*-osc-MDT0000.max_sync_changes" > $p
29923         save_lustre_params mds1 \
29924                 "osp.$FSNAME-OST*-osc-MDT0000.max_rpcs_in_progress" >> $p
29925
29926         do_facet mds1 "$LCTL set_param -n \
29927                 osp.$FSNAME-OST*-osc-MDT0000.max_sync_changes=100 \
29928                 osp.$FSNAME-OST*-osc-MDT0000.max_rpcs_in_progress=128"
29929         stack_trap "restore_lustre_params < $p" EXIT
29930
29931         createmany -o $DIR/$tdir/f- 1000
29932         unlinkmany $DIR/$tdir/f- 1000 &
29933         local UNLINK_PID=$!
29934
29935         while sleep 1; do
29936                 sync_changes=$(do_facet mds1 \
29937                 $LCTL get_param -n osp.$FSNAME-OST0000-osc-MDT0000.sync_changes)
29938                 # the check in the code is racy, fail the test
29939                 # if the value above the limit by 10.
29940                 [ $sync_changes -gt 110 ] && {
29941                         kill -2 $UNLINK_PID
29942                         wait
29943                         error "osp changes throttling failed, $sync_changes>110"
29944                 }
29945                 kill -0 $UNLINK_PID 2> /dev/null || break
29946         done
29947         wait
29948 }
29949 run_test 831 "throttling unlink/setattr queuing on OSP"
29950
29951 test_832() {
29952         (( $MDSCOUNT >= 2 )) || skip "needs >= 2 MDTs"
29953         (( $MDS1_VERSION >= $(version_code 2.15.52) )) ||
29954                 skip "Need MDS version 2.15.52+"
29955         is_rmentry_supported || skip "rm_entry not supported"
29956
29957         mkdir_on_mdt0 $DIR/$tdir || error "mkdir $tdir failed"
29958         mkdir $DIR/$tdir/local_dir || error "mkdir local_dir failed"
29959         mkdir_on_mdt -i 1 $DIR/$tdir/remote_dir ||
29960                 error "mkdir remote_dir failed"
29961         $LFS mkdir -c $MDSCOUNT $DIR/$tdir/striped_dir ||
29962                 error "mkdir striped_dir failed"
29963         touch $DIR/$tdir/file || error "touch file failed"
29964         $LFS rm_entry $DIR/$tdir/* || error "lfs rm_entry $tdir/* failed"
29965         [ -z "$(ls -A $DIR/$tdir)" ] || error "$tdir not empty"
29966 }
29967 run_test 832 "lfs rm_entry"
29968
29969 #
29970 # tests that do cleanup/setup should be run at the end
29971 #
29972
29973 test_900() {
29974         [ $PARALLEL == "yes" ] && skip "skip parallel run"
29975         local ls
29976
29977         #define OBD_FAIL_MGC_PAUSE_PROCESS_LOG   0x903
29978         $LCTL set_param fail_loc=0x903
29979
29980         cancel_lru_locks MGC
29981
29982         FAIL_ON_ERROR=true cleanup
29983         FAIL_ON_ERROR=true setup
29984 }
29985 run_test 900 "umount should not race with any mgc requeue thread"
29986
29987 # LUS-6253/LU-11185
29988 test_901() {
29989         local old
29990         local count
29991         local oldc
29992         local newc
29993         local olds
29994         local news
29995         [ $PARALLEL == "yes" ] && skip "skip parallel run"
29996
29997         # some get_param have a bug to handle dot in param name
29998         cancel_lru_locks MGC
29999         old=$(mount -t lustre | wc -l)
30000         # 1 config+sptlrpc
30001         # 2 params
30002         # 3 nodemap
30003         # 4 IR
30004         old=$((old * 4))
30005         oldc=0
30006         count=0
30007         while [ $old -ne $oldc ]; do
30008                 oldc=$($LCTL get_param -n 'ldlm.namespaces.MGC*.lock_count')
30009                 sleep 1
30010                 ((count++))
30011                 if [ $count -ge $TIMEOUT ]; then
30012                         error "too large timeout"
30013                 fi
30014         done
30015         umount_client $MOUNT || error "umount failed"
30016         mount_client $MOUNT || error "mount failed"
30017         cancel_lru_locks MGC
30018         newc=$($LCTL get_param -n 'ldlm.namespaces.MGC*.lock_count')
30019
30020         [ $oldc -lt $newc ] && error "mgc lock leak ($oldc != $newc)"
30021
30022         return 0
30023 }
30024 run_test 901 "don't leak a mgc lock on client umount"
30025
30026 # LU-13377
30027 test_902() {
30028         [ $CLIENT_VERSION -lt $(version_code 2.13.52) ] &&
30029                 skip "client does not have LU-13377 fix"
30030         #define OBD_FAIL_LLITE_SHORT_COMMIT 0x1415
30031         $LCTL set_param fail_loc=0x1415
30032         dd if=/dev/zero of=$DIR/$tfile bs=1M count=1
30033         cancel_lru_locks osc
30034         rm -f $DIR/$tfile
30035 }
30036 run_test 902 "test short write doesn't hang lustre"
30037
30038 # LU-14711
30039 test_903() {
30040         $LFS setstripe -i 0 -c 1 $DIR/$tfile $DIR/${tfile}-2
30041         echo "blah" > $DIR/${tfile}-2
30042         dd if=/dev/zero of=$DIR/$tfile bs=1M count=6 conv=fsync
30043         #define OBD_FAIL_OSC_SLOW_PAGE_EVICT 0x417
30044         $LCTL set_param fail_loc=0x417 fail_val=20
30045
30046         mv $DIR/${tfile}-2 $DIR/$tfile # Destroys the big object
30047         sleep 1 # To start the destroy
30048         wait_destroy_complete 150 || error "Destroy taking too long"
30049         cat $DIR/$tfile > /dev/null || error "Evicted"
30050 }
30051 run_test 903 "Test long page discard does not cause evictions"
30052
30053 test_904() {
30054         [ "$mds1_FSTYPE" == "ldiskfs" ] || skip "ldiskfs only test"
30055         do_facet mds1 $DEBUGFS -R features $(mdsdevname 1) |
30056                 grep -q project || skip "skip project quota not supported"
30057
30058         local testfile="$DIR/$tdir/$tfile"
30059         local xattr="trusted.projid"
30060         local projid
30061         local mdts=$(comma_list $(mdts_nodes))
30062         local saved=$(do_facet mds1 $LCTL get_param -n \
30063                 osd-ldiskfs.*MDT0000.enable_projid_xattr)
30064
30065         do_nodes $mdts $LCTL set_param osd-ldiskfs.*MDT*.enable_projid_xattr=0
30066         stack_trap "do_nodes $mdts $LCTL set_param \
30067                 osd-ldiskfs.*MDT*.enable_projid_xattr=$saved"
30068
30069         mkdir -p $DIR/$tdir
30070         touch $testfile
30071         #hide projid xattr on server
30072         $LFS project -p 1 $testfile ||
30073                 error "set $testfile project id failed"
30074         getfattr -m - $testfile | grep $xattr &&
30075                 error "do not show trusted.projid when disabled on server"
30076         do_nodes $mdts $LCTL set_param osd-ldiskfs.*MDT*.enable_projid_xattr=1
30077         #should be hidden when projid is 0
30078         $LFS project -p 0 $testfile ||
30079                 error "set $testfile project id failed"
30080         getfattr -m - $testfile | grep $xattr &&
30081                 error "do not show trusted.projid with project ID 0"
30082
30083         #still can getxattr explicitly
30084         projid=$(getfattr -n $xattr $testfile |
30085                 sed -n 's/^trusted\.projid="\(.*\)"/\1/p')
30086         [ $projid == "0" ] ||
30087                 error "projid expected 0 not $projid"
30088
30089         #set the projid via setxattr
30090         setfattr -n $xattr -v "1000" $testfile ||
30091                 error "setattr failed with $?"
30092         projid=($($LFS project $testfile))
30093         [ ${projid[0]} == "1000" ] ||
30094                 error "projid expected 1000 not $projid"
30095
30096         #check the new projid via getxattr
30097         $LFS project -p 1001 $testfile ||
30098                 error "set $testfile project id failed"
30099         getfattr -m - $testfile | grep $xattr ||
30100                 error "should show trusted.projid when project ID != 0"
30101         projid=$(getfattr -n $xattr $testfile |
30102                 sed -n 's/^trusted\.projid="\(.*\)"/\1/p')
30103         [ $projid == "1001" ] ||
30104                 error "projid expected 1001 not $projid"
30105
30106         #try to set invalid projid
30107         setfattr -n $xattr -v "4294967295" $testfile &&
30108                 error "set invalid projid should fail"
30109
30110         #remove the xattr means setting projid to 0
30111         setfattr -x $xattr $testfile ||
30112                 error "setfattr failed with $?"
30113         projid=($($LFS project $testfile))
30114         [ ${projid[0]} == "0" ] ||
30115                 error "projid expected 0 not $projid"
30116
30117         #should be hidden when parent has inherit flag and same projid
30118         $LFS project -srp 1002 $DIR/$tdir ||
30119                 error "set $tdir project id failed"
30120         getfattr -m - $testfile | grep $xattr &&
30121                 error "do not show trusted.projid with inherit flag"
30122
30123         #still can getxattr explicitly
30124         projid=$(getfattr -n $xattr $testfile |
30125                 sed -n 's/^trusted\.projid="\(.*\)"/\1/p')
30126         [ $projid == "1002" ] ||
30127                 error "projid expected 1002 not $projid"
30128 }
30129 run_test 904 "virtual project ID xattr"
30130
30131 # LU-8582
30132 test_905() {
30133         (( $OST1_VERSION >= $(version_code 2.8.54) )) ||
30134                 skip "lustre < 2.8.54 does not support ladvise"
30135
30136         remote_ost_nodsh && skip "remote OST with nodsh"
30137         $LFS setstripe -c -1 -i 0 $DIR/$tfile || error "setstripe failed"
30138
30139         $LFS ladvise -a willread $DIR/$tfile || error "ladvise does not work"
30140
30141         #define OBD_FAIL_OST_OPCODE 0x253
30142         # OST_LADVISE = 21
30143         do_facet ost1 "$LCTL set_param fail_val=21 fail_loc=0x0253"
30144         $LFS ladvise -a willread $DIR/$tfile &&
30145                 error "unexpected success of ladvise with fault injection"
30146         $LFS ladvise -a willread $DIR/$tfile |&
30147                 grep -q "Operation not supported"
30148         (( $? == 0 )) || error "unexpected stderr of ladvise with fault injection"
30149 }
30150 run_test 905 "bad or new opcode should not stuck client"
30151
30152 test_906() {
30153         grep -q io_uring_setup /proc/kallsyms ||
30154                 skip "Client OS does not support io_uring I/O engine"
30155         io_uring_probe || skip "kernel does not support io_uring fully"
30156         which fio || skip_env "no fio installed"
30157         fio --enghelp | grep -q io_uring ||
30158                 skip_env "fio does not support io_uring I/O engine"
30159
30160         local file=$DIR/$tfile
30161         local ioengine="io_uring"
30162         local numjobs=2
30163         local size=50M
30164
30165         fio --name=seqwrite --ioengine=$ioengine        \
30166                 --bs=$PAGE_SIZE --direct=1 --numjobs=$numjobs   \
30167                 --iodepth=64 --size=$size --filename=$file --rw=write ||
30168                 error "fio seqwrite $file failed"
30169
30170         fio --name=seqread --ioengine=$ioengine \
30171                 --bs=$PAGE_SIZE --direct=1 --numjobs=$numjobs   \
30172                 --iodepth=64 --size=$size --filename=$file --rw=read ||
30173                 error "fio seqread $file failed"
30174
30175         rm -f $file || error "rm -f $file failed"
30176 }
30177 run_test 906 "Simple test for io_uring I/O engine via fio"
30178
30179 complete $SECONDS
30180 [ -f $EXT2_DEV ] && rm $EXT2_DEV || true
30181 check_and_cleanup_lustre
30182 if [ "$I_MOUNTED" != "yes" ]; then
30183         lctl set_param debug="$OLDDEBUG" 2> /dev/null || true
30184 fi
30185 exit_status