Whamcloud - gitweb
c4d0562efac3884f594f1b6fc2ad1bc4efe427f4
[fs/lustre-release.git] / lustre / tests / sanity-gss.sh
1 #!/bin/bash
2 # vim:expandtab:shiftwidth=4:softtabstop=4:tabstop=4:
3 #
4 # Run select tests by setting ONLY, or as arguments to the script.
5 # Skip specific tests by setting EXCEPT.
6 #
7 # e.g. ONLY="22 23" or ONLY="`seq 32 39`" or EXCEPT="31"
8 set -e
9
10 ONLY=${ONLY:-"$*"}
11 # bug number for skipped test:
12 ALWAYS_EXCEPT=${ALWAYS_EXCEPT:-"$SANITY_GSS_EXCEPT"}
13 # UPDATE THE COMMENT ABOVE WITH BUG NUMBERS WHEN CHANGING ALWAYS_EXCEPT!
14
15 # Tests that fail on uml
16 CPU=`awk '/model/ {print $4}' /proc/cpuinfo`
17 [ "$CPU" = "UML" ] && EXCEPT="$EXCEPT"
18
19 case `uname -r` in
20 2.6*) FSTYPE=${FSTYPE:-ldiskfs}; ALWAYS_EXCEPT="$ALWAYS_EXCEPT " ;;
21 *) error "unsupported kernel (gss only works with 2.6.x)" ;;
22 esac
23
24 SRCDIR=`dirname $0`
25 export PATH=$PWD/$SRCDIR:$SRCDIR:$SRCDIR/../utils:$SRCDIR/../utils/gss:$PATH:/sbin
26 export NAME=${NAME:-local}
27 SAVE_PWD=$PWD
28
29 CLEANUP=${CLEANUP:-""}
30 SETUP=${SETUP:-""}
31
32 LUSTRE=${LUSTRE:-`dirname $0`/..}
33 . $LUSTRE/tests/test-framework.sh
34 init_test_env $@
35 . ${CONFIG:=$LUSTRE/tests/cfg/$NAME.sh}
36
37 remote_mds_nodsh && skip "remote MDS with nodsh" && exit 0
38
39 [ "$SLOW" = "no" ] && EXCEPT_SLOW="100 101"
40
41 # $RUNAS_ID may get set incorrectly somewhere else
42 [ $UID -eq 0 -a $RUNAS_ID -eq 0 ] && error "\$RUNAS_ID set to 0, but \$UID is also 0!"
43
44 # remove $SEC, we'd like to control everything by ourselves
45 unset SEC
46
47 #
48 # global variables of this sanity
49 #
50 KRB5_CCACHE_DIR=/tmp
51 KRB5_CRED=$KRB5_CCACHE_DIR/krb5cc_$RUNAS_ID
52 KRB5_CRED_SAVE=$KRB5_CCACHE_DIR/krb5cc.sanity.save
53 CLICOUNT=2
54 cnt_mdt2ost=0
55 cnt_mdt2mdt=0
56 cnt_cli2ost=0
57 cnt_cli2mdt=0
58 cnt_all2ost=0
59 cnt_all2mdt=0
60 cnt_all2all=0
61 DBENCH_PID=0
62 PROC_CLI="srpc_info"
63
64 # set manually
65 GSS=true
66 GSS_KRB5=true
67
68 prepare_krb5_creds() {
69     echo prepare krb5 cred
70     rm -f $KRB5_CRED_SAVE
71     echo RUNAS=$RUNAS
72     $RUNAS krb5_login.sh || exit 1
73     [ -f $KRB5_CRED ] || exit 2
74     echo CRED=$KRB5_CRED
75     cp $KRB5_CRED $KRB5_CRED_SAVE
76 }
77
78 prepare_krb5_creds
79
80 # we want double mount
81 MOUNT_2=${MOUNT_2:-"yes"}
82 check_and_setup_lustre
83
84 rm -rf $DIR/[df][0-9]*
85
86 check_runas_id $RUNAS_ID $RUNAS_ID $RUNAS
87
88 build_test_filter
89
90 combination()
91 {
92     local M=$1
93     local N=$2
94     local R=1
95
96     if [ $M -lt $N ]; then
97         R=0
98     else
99         N=$((N + 1))
100         while [ $N -le $M ]; do
101             R=$((R * N))
102             N=$((N + 1))
103         done
104     fi
105
106     echo $R
107     return 0
108 }
109
110 calc_connection_cnt() {
111     # MDT->MDT = 2 * C(M, 2)
112     # MDT->OST = M * O
113     # CLI->OST = C * O
114     # CLI->MDT = C * M
115     comb_m2=$(combination $MDSCOUNT 2)
116
117     cnt_mdt2mdt=$((comb_m2 * 2))
118     cnt_mdt2ost=$((MDSCOUNT * OSTCOUNT))
119     cnt_cli2ost=$((CLICOUNT * OSTCOUNT))
120     cnt_cli2mdt=$((CLICOUNT * MDSCOUNT))
121     cnt_all2ost=$((cnt_mdt2ost + cnt_cli2ost))
122     cnt_all2mdt=$((cnt_mdt2mdt + cnt_cli2mdt))
123     cnt_all2all=$((cnt_mdt2ost + cnt_mdt2mdt + cnt_cli2ost + cnt_cli2mdt))
124 }
125
126 set_rule()
127 {
128     local tgt=$1
129     local net=$2
130     local dir=$3
131     local flavor=$4
132     local cmd="$tgt.srpc.flavor"
133
134     if [ $net == "any" ]; then
135         net="default"
136     fi
137     cmd="$cmd.$net"
138
139     if [ $dir != "any" ]; then
140         cmd="$cmd.$dir"
141     fi
142
143     cmd="$cmd=$flavor"
144     log "Setting sptlrpc rule: $cmd"
145     do_facet mgs "$LCTL conf_param $cmd"
146 }
147
148 count_flvr()
149 {
150     local output=$1
151     local flavor=$2
152     local count=0
153
154     rpc_flvr=`echo $flavor | awk -F - '{ print $1 }'`
155     bulkspec=`echo $flavor | awk -F - '{ print $2 }'`
156
157     count=`echo "$output" | grep "rpc flavor" | grep $rpc_flvr | wc -l`
158
159     if [ "x$bulkspec" != "x" ]; then
160         algs=`echo $bulkspec | awk -F : '{ print $2 }'`
161
162         if [ "x$algs" != "x" ]; then
163             bulk_count=`echo "$output" | grep "bulk flavor" | grep $algs | wc -l`
164         else
165             bulk=`echo $bulkspec | awk -F : '{ print $1 }'`
166             if [ $bulk == "bulkn" ]; then
167                 bulk_count=`echo "$output" | grep "bulk flavor" \
168                             | grep "null/null" | wc -l`
169             elif [ $bulk == "bulki" ]; then
170                 bulk_count=`echo "$output" | grep "bulk flavor" \
171                             | grep "/null" | grep -v "null/" | wc -l`
172             else
173                 bulk_count=`echo "$output" | grep "bulk flavor" \
174                             | grep -v "/null" | grep -v "null/" | wc -l`
175             fi
176         fi
177
178         [ $bulk_count -lt $count ] && count=$bulk_count
179     fi
180
181     echo $count
182 }
183
184 flvr_cnt_cli2mdt()
185 {
186     local flavor=$1
187
188     output=`do_facet client lctl get_param -n mdc.*-MDT*-mdc-*.$PROC_CLI 2>/dev/null`
189     count_flvr "$output" $flavor
190 }
191
192 flvr_cnt_cli2ost()
193 {
194     local flavor=$1
195
196     output=`do_facet client lctl get_param -n osc.*OST*-osc-[^M][^D][^T]*.$PROC_CLI 2>/dev/null`
197     count_flvr "$output" $flavor
198 }
199
200 flvr_cnt_mdt2mdt()
201 {
202     local flavor=$1
203     local cnt=0
204
205     if [ $MDSCOUNT -le 1 ]; then
206         echo 0
207         return
208     fi
209
210     for num in `seq $MDSCOUNT`; do
211         output=`do_facet mds$num lctl get_param -n mdc.*-MDT*-mdc[0-9]*.$PROC_CLI 2>/dev/null`
212         tmpcnt=`count_flvr "$output" $flavor`
213         cnt=$((cnt + tmpcnt))
214     done
215     echo $cnt;
216 }
217
218 flvr_cnt_mdt2ost()
219 {
220     local flavor=$1
221     local cnt=0
222
223     for num in `seq $MDSCOUNT`; do
224         output=`do_facet mds$num lctl get_param -n osc.*OST*-osc-MDT*.$PROC_CLI 2>/dev/null`
225         tmpcnt=`count_flvr "$output" $flavor`
226         cnt=$((cnt + tmpcnt))
227     done
228     echo $cnt;
229 }
230
231 flvr_cnt_mgc2mgs()
232 {
233     local flavor=$1
234
235     output=`do_facet client lctl get_param -n mgc.*.$PROC_CLI 2>/dev/null`
236     count_flvr "$output" $flavor
237 }
238
239 do_check_flavor()
240 {
241     local dir=$1        # from to
242     local flavor=$2     # flavor expected
243     local res=0
244
245     if [ $dir == "cli2mdt" ]; then
246         res=`flvr_cnt_cli2mdt $flavor`
247     elif [ $dir == "cli2ost" ]; then
248         res=`flvr_cnt_cli2ost $flavor`
249     elif [ $dir == "mdt2mdt" ]; then
250         res=`flvr_cnt_mdt2mdt $flavor`
251     elif [ $dir == "mdt2ost" ]; then
252         res=`flvr_cnt_mdt2ost $flavor`
253     elif [ $dir == "all2ost" ]; then
254         res1=`flvr_cnt_mdt2ost $flavor`
255         res2=`flvr_cnt_cli2ost $flavor`
256         res=$((res1 + res2))
257     elif [ $dir == "all2mdt" ]; then
258         res1=`flvr_cnt_mdt2mdt $flavor`
259         res2=`flvr_cnt_cli2mdt $flavor`
260         res=$((res1 + res2))
261     elif [ $dir == "all2all" ]; then
262         res1=`flvr_cnt_mdt2ost $flavor`
263         res2=`flvr_cnt_cli2ost $flavor`
264         res3=`flvr_cnt_mdt2mdt $flavor`
265         res4=`flvr_cnt_cli2mdt $flavor`
266         res=$((res1 + res2 + res3 + res4))
267     fi
268
269     echo $res
270 }
271
272 wait_flavor()
273 {
274     local dir=$1        # from to
275     local flavor=$2     # flavor expected
276     local expect=$3     # number expected
277     local res=0
278
279     for ((i=0;i<20;i++)); do
280         echo -n "checking..."
281         res=$(do_check_flavor $dir $flavor)
282         if [ $res -eq $expect ]; then
283             echo "found $res $flavor connections of $dir, OK"
284             return 0
285         else
286             echo "found $res $flavor connections of $dir, not ready ($expect)"
287             sleep 4
288         fi
289     done
290
291     echo "Error checking $flavor of $dir: expect $expect, actual $res"
292     return 1
293 }
294
295 restore_to_default_flavor()
296 {
297     local proc="mgs.MGS.live.$FSNAME"
298
299     echo "restoring to default flavor..."
300
301     nrule=`do_facet mgs lctl get_param -n $proc 2>/dev/null | grep ".srpc.flavor." | wc -l`
302
303     # remove all existing rules if any
304     if [ $nrule -ne 0 ]; then
305         echo "$nrule existing rules"
306         for rule in `do_facet mgs lctl get_param -n $proc 2>/dev/null | grep ".srpc.flavor."`; do
307             echo "remove rule: $rule"
308             spec=`echo $rule | awk -F = '{print $1}'`
309             do_facet mgs "$LCTL conf_param $spec="
310         done
311     fi
312
313     # verify no rules left
314     nrule=`do_facet mgs lctl get_param -n $proc 2>/dev/null | grep ".srpc.flavor." | wc -l`
315     [ $nrule -ne 0 ] && error "still $nrule rules left"
316
317     # wait for default flavor to be applied
318     # currently default flavor for all connections are 'null'
319     wait_flavor all2all null $cnt_all2all
320     echo "now at default flavor settings"
321 }
322
323 set_flavor_all()
324 {
325     local flavor=$1
326
327     echo "setting all flavor to $flavor"
328
329     res=$(do_check_flavor all2all $flavor)
330     if [ $res -eq $cnt_all2all ]; then
331         echo "already have total $res $flavor connections"
332         return
333     fi
334
335     echo "found $res $flavor out of total $cnt_all2all connections"
336     restore_to_default_flavor
337
338     set_rule $FSNAME any any $flavor
339     wait_flavor all2all $flavor $cnt_all2all
340 }
341
342 start_dbench()
343 {
344     NPROC=`cat /proc/cpuinfo 2>/dev/null | grep ^processor | wc -l`
345     [ $NPROC -gt 2 ] && NPROC=2
346     sh rundbench $NPROC 1>/dev/null &
347     DBENCH_PID=$!
348     sleep 2
349
350     num=`ps --no-headers -p $DBENCH_PID 2>/dev/null | wc -l`
351     if [ $num -ne 1 ]; then
352         error "failed to start dbench $NPROC"
353     else
354         echo "started dbench with $NPROC processes at background"
355     fi
356
357     return 0
358 }
359
360 check_dbench()
361 {
362     num=`ps --no-headers -p $DBENCH_PID 2>/dev/null | wc -l`
363     if [ $num -eq 0 ]; then
364         echo "dbench $DBENCH_PID already finished"
365         wait $DBENCH_PID || error "dbench $PID exit with error"
366         start_dbench
367     elif [ $num -ne 1 ]; then
368         killall -9 dbench
369         error "found $num instance of pid $DBENCH_PID ???"
370     fi
371
372     return 0
373 }
374
375 stop_dbench()
376 {
377     for ((;;)); do
378         killall dbench 2>/dev/null
379         num=`ps --no-headers -p $DBENCH_PID | wc -l`
380         if [ $num -eq 0 ]; then
381             echo "dbench finished"
382             break
383         fi
384         echo "dbench $DBENCH_PID is still running, waiting 2s..."
385         sleep 2
386     done
387
388     wait $DBENCH_PID || true
389     sync || true
390 }
391
392 restore_krb5_cred() {
393     cp $KRB5_CRED_SAVE $KRB5_CRED
394     chown $RUNAS_ID:$RUNAS_ID $KRB5_CRED
395     chmod 0600 $KRB5_CRED
396 }
397
398 check_multiple_gss_daemons() {
399     local facet=$1
400     local gssd=$2
401     local gssd_name=`basename $gssd`
402
403     for ((i=0;i<10;i++)); do
404         do_facet $facet "$gssd -v &"
405     done
406
407     # wait daemons entering "stable" status
408     sleep 5
409
410     num=`do_facet $facet ps -o cmd -C $gssd_name | grep $gssd_name | wc -l`
411     echo "$num instance(s) of $gssd_name are running"
412
413     if [ $num -ne 1 ]; then
414         error "$gssd_name not unique"
415     fi
416 }
417
418 calc_connection_cnt
419 umask 077
420
421 test_0() {
422     local my_facet=mds
423
424     echo "bring up gss daemons..."
425     start_gss_daemons
426
427     echo "check with someone already running..."
428     check_multiple_gss_daemons $my_facet $LSVCGSSD
429     if $GSS_PIPEFS; then
430         check_multiple_gss_daemons $my_facet $LGSSD
431     fi
432
433     echo "check with someone run & finished..."
434     do_facet $my_facet killall -q -2 lgssd lsvcgssd || true
435     sleep 5 # wait fully exit
436     check_multiple_gss_daemons $my_facet $LSVCGSSD
437     if $GSS_PIPEFS; then
438         check_multiple_gss_daemons $my_facet $LGSSD
439     fi
440
441     echo "check refresh..."
442     do_facet $my_facet killall -q -2 lgssd lsvcgssd || true
443     sleep 5 # wait fully exit
444     do_facet $my_facet ipcrm -S 0x3b92d473
445     check_multiple_gss_daemons $my_facet $LSVCGSSD
446     if $GSS_PIPEFS; then
447         do_facet $my_facet ipcrm -S 0x3a92d473
448         check_multiple_gss_daemons $my_facet $LGSSD
449     fi
450 }
451 run_test 0 "start multiple gss daemons"
452
453 set_flavor_all krb5p
454
455 test_1() {
456     local file=$DIR/$tfile
457
458     chmod 0777 $DIR || error "chmod $DIR failed"
459     # access w/o cred
460     $RUNAS kdestroy
461     $RUNAS $LFS flushctx $MOUNT || error "can't flush context on $MOUNT"
462     $RUNAS touch $file && error "unexpected success"
463
464     # access w/ cred
465     restore_krb5_cred
466     $RUNAS touch $file || error "should not fail"
467     [ -f $file ] || error "$file not found"
468 }
469 run_test 1 "access with or without krb5 credential"
470
471 test_2() {
472     local file1=$DIR/$tfile-1
473     local file2=$DIR/$tfile-2
474
475     chmod 0777 $DIR || error "chmod $DIR failed"
476     # current access should be ok
477     $RUNAS touch $file1 || error "can't touch $file1"
478     [ -f $file1 ] || error "$file1 not found"
479
480     # cleanup all cred/ctx and touch
481     $RUNAS kdestroy
482     $RUNAS $LFS flushctx $MOUNT || error "can't flush context on $MOUNT"
483     $RUNAS touch $file2 && error "unexpected success"
484
485     # restore and touch
486     restore_krb5_cred
487     $RUNAS touch $file2 || error "should not fail"
488     [ -f $file2 ] || error "$file2 not found"
489 }
490 run_test 2 "lfs flushctx"
491
492 test_3() {
493     local file=$DIR/$tfile
494
495     # create file
496     echo "aaaaaaaaaaaaaaaaa" > $file
497     chmod 0666 $file
498     $CHECKSTAT -p 0666 $file || error "$UID checkstat error"
499     $RUNAS $CHECKSTAT -p 0666 $file || error "$RUNAS_ID checkstat error"
500     $RUNAS cat $file > /dev/null || error "$RUNAS_ID cat error"
501
502     # start multiop
503     $RUNAS multiop $file o_r &
504     OPPID=$!
505     # wait multiop finish its open()
506     sleep 1
507
508     # cleanup all cred/ctx and check
509     # metadata check should fail, but file data check should success
510     # because we always use root credential to OSTs
511     $RUNAS kdestroy
512     $RUNAS $LFS flushctx $MOUNT || error "can't flush context on $MOUNT"
513     echo "destroied credentials/contexs for $RUNAS_ID"
514     $RUNAS $CHECKSTAT -p 0666 $file && error "checkstat succeed"
515     kill -s 10 $OPPID
516     wait $OPPID || error "read file data failed"
517     echo "read file data OK"
518
519     # restore and check again
520     restore_krb5_cred
521     echo "restored credentials for $RUNAS_ID"
522     $RUNAS $CHECKSTAT -p 0666 $file || error "$RUNAS_ID checkstat (2) error"
523     echo "$RUNAS_ID checkstat OK"
524     $CHECKSTAT -p 0666 $file || error "$UID checkstat (2) error"
525     echo "$UID checkstat OK"
526     $RUNAS cat $file > /dev/null || error "$RUNAS_ID cat (2) error"
527     echo "$RUNAS_ID read file data OK"
528 }
529 run_test 3 "local cache under DLM lock"
530
531 test_4() {
532     local file1=$DIR/$tfile-1
533     local file2=$DIR/$tfile-2
534
535     ! $GSS_PIPEFS && skip "pipefs not used" && return
536
537     chmod 0777 $DIR || error "chmod $DIR failed"
538     # current access should be ok
539     $RUNAS touch $file1 || error "can't touch $file1"
540     [ -f $file1 ] || error "$file1 not found"
541
542     # stop lgssd
543     send_sigint client lgssd
544     sleep 5
545     check_gss_daemon_facet client lgssd && error "lgssd still running"
546
547     # flush context, and touch
548     $RUNAS $LFS flushctx $MOUNT || error "can't flush context on $MOUNT"
549     $RUNAS touch $file2 &
550     TOUCHPID=$!
551     echo "waiting touch pid $TOUCHPID"
552     wait $TOUCHPID && error "touch should fail"
553
554     # restart lgssd
555     do_facet client "$LGSSD -v"
556     sleep 5
557     check_gss_daemon_facet client lgssd
558
559     # touch new should succeed
560     $RUNAS touch $file2 || error "can't touch $file2"
561     [ -f $file2 ] || error "$file2 not found"
562 }
563 run_test 4 "lgssd dead, operations should wait timeout and fail"
564
565 test_5() {
566     local file1=$DIR/$tfile-1
567     local file2=$DIR/$tfile-2
568     local wait_time=$((TIMEOUT + TIMEOUT / 2))
569
570     chmod 0777 $DIR || error "chmod $DIR failed"
571     # current access should be ok
572     $RUNAS touch $file1 || error "can't touch $file1"
573     [ -f $file1 ] || error "$file1 not found"
574
575     # stop lsvcgssd
576     send_sigint mds lsvcgssd
577     sleep 5
578     check_gss_daemon_facet mds lsvcgssd && error "lsvcgssd still running"
579
580     # flush context, and touch
581     $RUNAS $LFS flushctx $MOUNT || error "can't flush context on $MOUNT"
582     $RUNAS touch $file2 &
583     TOUCHPID=$!
584
585     # wait certain time
586     echo "waiting $wait_time seconds for touch pid $TOUCHPID"
587     sleep $wait_time
588     num=`ps --no-headers -p $TOUCHPID | wc -l`
589     [ $num -eq 1 ] || error "touch already ended ($num)"
590     echo "process $TOUCHPID still hanging there... OK"
591
592     # restart lsvcgssd, expect touch suceed
593     echo "restart lsvcgssd and recovering"
594     do_facet mds "$LSVCGSSD -v"
595     sleep 5
596     check_gss_daemon_facet mds lsvcgssd
597     wait $TOUCHPID || error "touch fail"
598     [ -f $file2 ] || error "$file2 not found"
599 }
600 run_test 5 "lsvcgssd dead, operations lead to recovery"
601
602 test_6() {
603     local nfile=10
604
605     mkdir $DIR/d6 || error "mkdir $DIR/d6 failed"
606     for ((i=0; i<$nfile; i++)); do
607         dd if=/dev/zero of=$DIR/d6/file$i bs=8k count=1 || error "dd file$i failed"
608     done
609     ls -l $DIR/d6/* > /dev/null || error "ls failed"
610     rm -rf $DIR2/d6/* || error "rm failed"
611     rmdir $DIR2/d6/ || error "rmdir failed"
612 }
613 run_test 6 "test basic DLM callback works"
614
615 test_7() {
616     local tdir=$DIR/d7
617     local num_osts
618
619     #
620     # for open(), client only reserve space for default stripe count lovea,
621     # and server may return larger lovea in reply (because of larger stripe
622     # count), client need call enlarge_reqbuf() and save the replied lovea
623     # in request for future possible replay.
624     #
625     # Note: current script does NOT guarantee enlarge_reqbuf() will be in
626     # the path, however it does work in local test which has 2 OSTs and
627     # default stripe count is 1.
628     #
629     num_osts=`$LFS getstripe $MOUNT | egrep "^[0-9]*:.*ACTIVE" | wc -l`
630     echo "found $num_osts active OSTs"
631     [ $num_osts -lt 2 ] && echo "skipping $TESTNAME (must have >= 2 OSTs)" && return
632
633     mkdir $tdir || error
634     $LFS setstripe -c $num_osts $tdir || error
635
636     echo "creating..."
637     for ((i=0;i<20;i++)); do
638         dd if=/dev/zero of=$tdir/f$i bs=4k count=16 2>/dev/null
639     done
640     echo "reading..."
641     for ((i=0;i<20;i++)); do
642         dd if=$tdir/f$i of=/dev/null bs=4k count=16 2>/dev/null
643     done
644     rm -rf $tdir
645 }
646 run_test 7 "exercise enlarge_reqbuf()"
647
648 test_8()
649 {
650     local ATHISTORY=$(do_facet mds "find /sys/ -name at_history")
651     local ATOLDBASE=$(do_facet mds "cat $ATHISTORY")
652     do_facet mds "echo 8 >> $ATHISTORY"
653
654     $LCTL dk > /dev/null
655     debugsave
656     sysctl -w lnet.debug="+other"
657
658     mkdir -p $DIR/d8
659     chmod a+w $DIR/d8
660
661     REQ_DELAY=`lctl get_param -n mdc.${FSNAME}-MDT0000-mdc-*.timeouts |
662                awk '/portal 12/ {print $5}' | tail -1`
663     REQ_DELAY=$((${REQ_DELAY} + ${REQ_DELAY} / 4 + 5))
664
665     # sleep sometime in ctx handle
666     do_facet mds lctl set_param fail_val=$REQ_DELAY
667 #define OBD_FAIL_SEC_CTX_HDL_PAUSE       0x1204
668     do_facet mds lctl set_param fail_loc=0x1204
669
670     $RUNAS $LFS flushctx $MOUNT || error "can't flush context on $MOUNT"
671
672     $RUNAS touch $DIR/d8/f &
673     TOUCHPID=$!
674     echo "waiting for touch (pid $TOUCHPID) to finish..."
675     sleep 2 # give it a chance to really trigger context init rpc
676     do_facet mds sysctl -w lustre.fail_loc=0
677     wait $TOUCHPID || error "touch should have succeeded"
678
679     $LCTL dk | grep "Early reply #" || error "No early reply"
680
681     debugrestore
682     do_facet mds "echo $ATOLDBASE >> $ATHISTORY" || true
683 }
684 run_test 8 "Early reply sent for slow gss context negotiation"
685
686 #
687 # following tests will manipulate flavors and may end with any flavor set,
688 # so each test should not assume any start flavor.
689 #
690
691 test_90() {
692     if [ "$SLOW" = "no" ]; then
693         total=10
694     else
695         total=60
696     fi
697
698     restore_to_default_flavor
699     set_rule $FSNAME any any krb5p
700     wait_flavor all2all krb5p $cnt_all2all
701
702     start_dbench
703
704     for ((n=0;n<$total;n++)); do
705         sleep 2
706         check_dbench
707         echo "flush ctx ($n/$total) ..."
708         $LFS flushctx $MOUNT || error "can't flush context on $MOUNT"
709     done
710     check_dbench
711     #sleep to let ctxs be re-established
712     sleep 10
713     stop_dbench
714 }
715 run_test 90 "recoverable from losing contexts under load"
716
717 test_99() {
718     local nrule_old=0
719     local nrule_new=0
720     local max=64
721
722     #
723     # general rules
724     #
725     nrule_old=`do_facet mgs lctl get_param -n mgs.MGS.live.$FSNAME 2>/dev/null \
726                | grep "$FSNAME.srpc.flavor." | wc -l`
727     echo "original general rules: $nrule_old"
728
729     for ((i = $nrule_old; i < $max; i++)); do
730         set_rule $FSNAME elan$i any krb5n || error "set rule $i"
731     done
732     for ((i = $nrule_old; i < $max; i++)); do
733         set_rule $FSNAME elan$i any || error "remove rule $i"
734     done
735
736     nrule_new=`do_facet mgs lctl get_param -n mgs.MGS.live.$FSNAME 2>/dev/null \
737                | grep "$FSNAME.srpc.flavor." | wc -l`
738     if [ $nrule_new != $nrule_old ]; then
739         error "general rule: $nrule_new != $nrule_old"
740     fi
741
742     #
743     # target-specific rules
744     #
745     nrule_old=`do_facet mgs lctl get_param -n mgs.MGS.live.$FSNAME 2>/dev/null \
746                | grep "$FSNAME-MDT0000.srpc.flavor." | wc -l`
747     echo "original target rules: $nrule_old"
748
749     for ((i = $nrule_old; i < $max; i++)); do
750         set_rule $FSNAME-MDT0000 elan$i any krb5i || error "set rule $i"
751     done
752     for ((i = $nrule_old; i < $max; i++)); do
753         set_rule $FSNAME-MDT0000 elan$i any || error "remove rule $i"
754     done
755
756     nrule_new=`do_facet mgs lctl get_param -n mgs.MGS.live.$FSNAME 2>/dev/null \
757                | grep "$FSNAME-MDT0000.srpc.flavor." | wc -l`
758     if [ $nrule_new != $nrule_old ]; then
759         error "general rule: $nrule_new != $nrule_old"
760     fi
761 }
762 run_test 99 "set large number of sptlrpc rules"
763
764 error_dbench()
765 {
766     local err_str=$1
767
768     killall -9 dbench
769     sleep 1
770
771     error $err_str
772 }
773
774 test_100() {
775     # started from default flavors
776     restore_to_default_flavor
777
778     # running dbench background
779     start_dbench
780
781     #
782     # all: null -> krb5n -> krb5a -> krb5i -> krb5p -> plain
783     #
784     set_rule $FSNAME any any krb5n
785     wait_flavor all2all krb5n $cnt_all2all || error_dbench "1"
786     check_dbench
787
788     set_rule $FSNAME any any krb5a
789     wait_flavor all2all krb5a $cnt_all2all || error_dbench "2"
790     check_dbench
791
792     set_rule $FSNAME any any krb5i
793     wait_flavor all2all krb5i $cnt_all2all || error_dbench "3"
794     check_dbench
795
796     set_rule $FSNAME any any krb5p
797     wait_flavor all2all krb5p $cnt_all2all || error_dbench "4"
798     check_dbench
799
800     set_rule $FSNAME any any plain
801     wait_flavor all2all plain $cnt_all2all || error_dbench "5"
802     check_dbench
803
804     #
805     # M - M: krb5a
806     # C - M: krb5i
807     # M - O: krb5p
808     # C - O: krb5n
809     #
810     set_rule $FSNAME any mdt2mdt krb5a
811     wait_flavor mdt2mdt krb5a $cnt_mdt2mdt || error_dbench "6"
812     check_dbench
813
814     set_rule $FSNAME any cli2mdt krb5i
815     wait_flavor cli2mdt krb5i $cnt_cli2mdt || error_dbench "7"
816     check_dbench
817
818     set_rule $FSNAME any mdt2ost krb5p
819     wait_flavor mdt2ost krb5p $cnt_mdt2ost || error_dbench "8"
820     check_dbench
821
822     set_rule $FSNAME any cli2ost krb5n
823     wait_flavor cli2ost krb5n $cnt_cli2ost || error_dbench "9"
824     check_dbench
825
826     #
827     # * - MDT0: krb5p
828     # * - OST0: krb5i
829     #
830     # nothing should be changed because they are override by above dir rules
831     #
832     set_rule $FSNAME-MDT0000 any any krb5p
833     set_rule $FSNAME-OST0000 any any krb5i
834     wait_flavor mdt2mdt krb5a $cnt_mdt2mdt || error_dbench "10"
835     wait_flavor cli2mdt krb5i $cnt_cli2mdt || error_dbench "11"
836     check_dbench
837     wait_flavor mdt2ost krb5p $cnt_mdt2ost || error_dbench "12"
838     wait_flavor cli2ost krb5n $cnt_cli2ost || error_dbench "13"
839
840     #
841     # delete all dir-specific rules
842     #
843     set_rule $FSNAME any mdt2mdt
844     set_rule $FSNAME any cli2mdt
845     set_rule $FSNAME any mdt2ost
846     set_rule $FSNAME any cli2ost
847     wait_flavor mdt2mdt krb5p $((MDSCOUNT - 1)) || error_dbench "14"
848     wait_flavor cli2mdt krb5p $CLICOUNT || error_dbench "15"
849     check_dbench
850     wait_flavor mdt2ost krb5i $MDSCOUNT || error_dbench "16"
851     wait_flavor cli2ost krb5i $CLICOUNT || error_dbench "17"
852     check_dbench
853
854     #
855     # remove:
856     #  * - MDT0: krb5p
857     #  * - OST0: krb5i
858     #
859     set_rule $FSNAME-MDT0000 any any
860     set_rule $FSNAME-OST0000 any any || error_dbench "18"
861     wait_flavor all2all plain $cnt_all2all || error_dbench "19"
862     check_dbench
863
864     stop_dbench
865 }
866 run_test 100 "change security flavor on the fly under load"
867
868 switch_sec_test()
869 {
870     local flavor0=$1
871     local flavor1=$2
872     local filename=$DIR/$tfile
873     local multiop_pid
874     local num
875
876     #
877     # after set to flavor0, start multop which use flavor0 rpc, and let
878     # server drop the reply; then switch to flavor1, the resend should be
879     # completed using flavor1. To exercise the code of switching ctx/sec
880     # for a resend request.
881     #
882     log ">>>>>>>>>>>>>>> Testing $flavor0 -> $flavor1 <<<<<<<<<<<<<<<<<<<"
883
884     set_rule $FSNAME any cli2mdt $flavor0
885     wait_flavor cli2mdt $flavor0 $cnt_cli2mdt
886     rm -f $filename || error "remove old $filename failed"
887
888 #MDS_REINT = 36
889 #define OBD_FAIL_PTLRPC_DROP_REQ_OPC     0x513
890     do_facet $SINGLEMDS lctl set_param fail_val=36
891     do_facet $SINGLEMDS lctl set_param fail_loc=0x513
892     log "starting multiop"
893     multiop $filename m &
894     multiop_pid=$!
895     echo "multiop pid=$multiop_pid"
896     sleep 1
897
898     set_rule $FSNAME any cli2mdt $flavor1
899     wait_flavor cli2mdt $flavor1 $cnt_cli2mdt
900
901     num=`ps --no-headers -p $multiop_pid 2>/dev/null | wc -l`
902     [ $num -eq 1 ] || error "multiop($multiop_pid) already ended ($num)"
903     echo "process $multiop_pid is still hanging there... OK"
904
905     do_facet $SINGLEMDS lctl set_param fail_loc=0
906     log "waiting for multiop ($multiop_pid) to finish"
907     wait $multiop_pid || error "multiop returned error"
908 }
909
910 test_101()
911 {
912     # started from default flavors
913     restore_to_default_flavor
914
915     switch_sec_test null  plain
916     switch_sec_test plain krb5n
917     switch_sec_test krb5n krb5a
918     switch_sec_test krb5a krb5i
919     switch_sec_test krb5i krb5p
920     switch_sec_test krb5p null
921     switch_sec_test null  krb5p
922     switch_sec_test krb5p krb5i
923     switch_sec_test krb5i plain
924     switch_sec_test plain krb5p
925 }
926 run_test 101 "switch ctx/sec for resending request"
927
928 error_102()
929 {
930     local err_str=$1
931
932     killall -9 dbench
933     sleep 1
934
935     error $err_str
936 }
937
938 test_102() {
939     # started from default flavors
940     restore_to_default_flavor
941
942     # run dbench background
943     start_dbench
944
945     echo "Testing null->krb5n->krb5a->krb5i->krb5p->plain->null"
946     set_rule $FSNAME any any krb5n
947     set_rule $FSNAME any any krb5a
948     set_rule $FSNAME any any krb5i
949     set_rule $FSNAME any any krb5p
950     set_rule $FSNAME any any plain
951     set_rule $FSNAME any any null
952
953     check_dbench
954     wait_flavor all2all null $cnt_all2all || error_dbench "1"
955     check_dbench
956
957     echo "waiting for 15s and check again"
958     sleep 15
959     check_dbench
960
961     echo "Testing null->krb5i->null->krb5i->null..."
962     for ((i=0; i<10; i++)); do
963         set_rule $FSNAME any any krb5i
964         set_rule $FSNAME any any null
965     done
966     set_rule $FSNAME any any krb5i
967
968     check_dbench
969     wait_flavor all2all krb5i $cnt_all2all || error_dbench "2"
970     check_dbench
971
972     echo "waiting for 15s and check again"
973     sleep 15
974     check_dbench
975
976     stop_dbench
977 }
978 run_test 102 "survive from insanely fast flavor switch"
979
980 test_150() {
981     local save_opts
982     local count
983     local clients=$CLIENTS
984
985     [ -z $clients ] && clients=$HOSTNAME
986
987     # started from default flavors
988     restore_to_default_flavor
989
990     # at this time no rules has been set on mgs; mgc use null
991     # flavor connect to mgs.
992     count=`flvr_cnt_mgc2mgs null`
993     [ $count -eq 1 ] || error "$count mgc connection use null flavor"
994
995     zconf_umount_clients $clients $MOUNT || return 1
996
997     # mount client with conflict flavor - should fail
998     save_opts=$MOUNTOPT
999     MOUNTOPT="$MOUNTOPT,mgssec=krb5p"
1000     zconf_mount_clients $clients $MOUNT && \
1001         error "mount with conflict flavor should have failed"
1002     MOUNTOPT=$save_opts
1003
1004     # mount client with same flavor - should succeed
1005     save_opts=$MOUNTOPT
1006     MOUNTOPT="$MOUNTOPT,mgssec=null"
1007     zconf_mount_clients $clients $MOUNT || \
1008         error "mount with same flavor should have succeeded"
1009     MOUNTOPT=$save_opts
1010     zconf_umount_clients $clients $MOUNT || return 2
1011
1012     # mount client with default flavor - should succeed
1013     zconf_mount_clients $clients $MOUNT || \
1014         error "mount with default flavor should have succeeded"
1015 }
1016 run_test 150 "secure mgs connection: client flavor setting"
1017
1018 test_151() {
1019     local save_opts
1020
1021     # set mgs only accept krb5p
1022     set_rule _mgs any any krb5p
1023
1024     # umount everything, modules still loaded
1025     stopall
1026
1027     # mount mgs with default flavor, in current framework it means mgs+mdt1.
1028     # the connection of mgc of mdt1 to mgs is expected fail.
1029     DEVNAME=$(mdsdevname 1)
1030     start mds1 $DEVNAME $MDS_MOUNT_OPTS && error "mount with default flavor should have failed"
1031
1032     # mount with unauthorized flavor should fail
1033     save_opts=$MDS_MOUNT_OPTS
1034     MDS_MOUNT_OPTS="$MDS_MOUNT_OPTS,mgssec=null"
1035     start mds1 $DEVNAME $MDS_MOUNT_OPTS && error "mount with unauthorized flavor should have failed"
1036     MDS_MOUNT_OPTS=$save_opts
1037
1038     # mount with designated flavor should succeed
1039     save_opts=$MDS_MOUNT_OPTS
1040     MDS_MOUNT_OPTS="$MDS_MOUNT_OPTS,mgssec=krb5p"
1041     start mds1 $DEVNAME $MDS_MOUNT_OPTS || error "mount with designated flavor should have succeeded"
1042     MDS_MOUNT_OPTS=$save_opts
1043
1044     stop mds1 -f
1045 }
1046 run_test 151 "secure mgs connection: server flavor control"
1047
1048 equals_msg `basename $0`: test complete, cleaning up
1049 check_and_cleanup_lustre
1050 [ -f "$TESTSUITELOG" ] && cat $TESTSUITELOG && grep -q FAIL $TESTSUITELOG && exit 1 || true