Whamcloud - gitweb
landing smfs.
[fs/lustre-release.git] / lustre / tests / oos.sh
1 #!/bin/bash
2
3 set -e
4 set -vx
5
6 export PATH=`dirname $0`/../utils:$PATH
7 LFS=${LFS:-lfs}
8 MOUNT=${MOUNT:-$1}
9 MOUNT=${MOUNT:-/mnt/lustre}
10 OOS=$MOUNT/oosfile
11 TMP=${TMP:-/tmp}
12 LOG=$TMP/ooslog
13
14 SUCCESS=1
15
16 rm -f $OOS
17
18 sleep 1 # to ensure we get up-to-date statfs info
19
20 #echo -1 > /proc/sys/portals/debug
21 #echo 0x40a8 > /proc/sys/portals/subsystem_debug
22 #lctl clear
23 #lctl debug_daemon start /r/tmp/debug 1024
24
25 STRIPECOUNT=`cat /proc/fs/lustre/lov/*/activeobd | head -n 1`
26 ORIGFREE=`cat /proc/fs/lustre/llite/*/kbytesavail | head -n 1`
27 MAXFREE=${MAXFREE:-$((200000 * $STRIPECOUNT))}
28 if [ $ORIGFREE -gt $MAXFREE ]; then
29         echo "skipping out-of-space test on $OSC"
30         echo "reports ${ORIGFREE}kB free, more tham MAXFREE ${MAXFREE}kB"
31         echo "increase $MAXFREE (or reduce test fs size) to proceed"
32         exit 0
33 fi
34
35 export LANG=C LC_LANG=C # for "No space left on device" message
36
37 # make sure, that log file will be removed. Somehow it was possible 
38 # to me, that log file had +a and could not be rewritten, what led
39 # to test fail.
40 chattr -ai $LOG >/dev/null 2>&1
41 rm -f $LOG >/dev/null 2>&1
42
43 # make sure we stripe over all OSTs to avoid OOS on only a subset of OSTs
44 $LFS setstripe $OOS 65536 0 $STRIPECOUNT
45 if dd if=/dev/zero of=$OOS count=$(($ORIGFREE + 100)) bs=1k 2> $LOG; then
46         echo "ERROR: dd did not fail"
47         SUCCESS=0
48 fi
49
50 if [ "`grep -c 'No space left on device' $LOG`" -ne 1 ]; then
51         echo "ERROR: dd not return ENOSPC"
52         SUCCESS=0
53 fi
54
55 # flush cache to OST(s) so avail numbers are correct
56 sync; sleep 1 ; sync
57
58 for OSC in /proc/fs/lustre/osc/OSC*MNT*; do
59         AVAIL=`cat $OSC/kbytesavail`
60         GRANT=`cat $OSC/cur_grant_bytes`
61         [ $(($AVAIL - $GRANT / 1024)) -lt 400 ] && OSCFULL=full
62 done
63
64 if [ -z "$OSCFULL" ]; then
65         echo "no OSTs are close to full"
66         grep [0-9] /proc/fs/lustre/osc/OSC*MNT*/{kbytesavail,cur*}
67         SUCCESS=0
68 fi
69
70 RECORDSOUT=`grep "records out" $LOG | cut -d + -f1`
71
72 FILESIZE=`ls -l $OOS | awk '{ print $5 }'`
73 if [ $RECORDSOUT -ne $(($FILESIZE / 1024)) ]; then
74         echo "ERROR: blocks written by dd not equal to the size of file"
75         SUCCESS=0
76 fi
77
78 #lctl debug_daemon stop
79
80 rm -f $OOS
81
82 if [ $SUCCESS -eq 1 ]; then
83         echo "Success!"
84 else
85         exit 1
86 fi