Whamcloud - gitweb
FIX: removed redundant anchors
[doc/manual.git] / ConfiguringQuotas.xml
1 <?xml version="1.0" encoding="UTF-8"?>
2 <chapter version="5.0" xml:lang="en-US" xmlns="http://docbook.org/ns/docbook" xmlns:xl="http://www.w3.org/1999/xlink" xml:id='configuringquotas'>
3   <info>
4     <title xml:id='configuringquotas.title'>Configuring and Managing Quotas</title>
5   </info>
6
7   <para>This chapter describes how to configure quotas and includes the following sections:</para>
8
9   <itemizedlist><listitem>
10       <para><xref linkend="dbdoclet.50438217_54945"/></para>
11     </listitem>
12 <listitem>
13       <para><xref linkend="dbdoclet.50438217_31982"/></para>
14     </listitem>
15 <listitem>
16       <para><xref linkend="dbdoclet.50438217_49939"/></para>
17     </listitem>
18 <listitem>
19       <para><xref linkend="dbdoclet.50438217_15106"/></para>
20     </listitem>
21 <listitem>
22       <para><xref linkend="dbdoclet.50438217_27895"/></para>
23     </listitem>
24 <listitem>
25       <para><xref linkend="dbdoclet.50438217_20772"/></para>
26     </listitem>
27 </itemizedlist>
28
29     <section xml:id="dbdoclet.50438217_54945">
30       <title>21.1 Working with <anchor xml:id="dbdoclet.50438217_marker-1290118" xreflabel=""/>Quotas</title>
31       <para>Quotas allow a system administrator to limit the amount of disk space a user or group can use in a directory. Quotas are set by root, and can be specified for individual users and/or groups. Before a file is written to a partition where quotas are set, the quota of the creator&apos;s group is checked. If a quota exists, then the file size counts towards the group&apos;s quota. If no quota exists, then the owner&apos;s user quota is checked before the file is written. Similarly, inode usage for specific functions can be controlled if a user over-uses the allocated space.</para>
32       <para>Lustre quota enforcement differs from standard Linux quota enforcement in several ways:</para>
33       <itemizedlist><listitem>
34           <para> Quotas are administered via the lfs command (post-mount).</para>
35         </listitem>
36 <listitem>
37           <para> Quotas are distributed (as Lustre is a distributed file system), which has several ramifications.</para>
38         </listitem>
39 <listitem>
40           <para> Quotas are allocated and consumed in a quantized fashion.</para>
41         </listitem>
42
43 <listitem>
44           <para> Client does not set the usrquota or grpquota options to mount. When quota is enabled, it is enabled for all clients of the file system; started automatically using quota_type or started manually with lfs quotaon.</para>
45         </listitem>
46
47 </itemizedlist>
48               <caution><para>Although quotas are available in Lustre, root quotas are NOT enforced.</para><para>lfs setquota -u root (limits are not enforced)</para><para>lfs quota -u root (usage includes internal Lustre data that is dynamic in size and does not accurately reflect mount point visible block and inode usage).</para></caution>
49
50     </section>
51     <section xml:id="dbdoclet.50438217_31982">
52       <title>21.2 Enabling <anchor xml:id="dbdoclet.50438217_marker-1290128" xreflabel=""/>Disk Quotas</title>
53       <para>Use this procedure to enable (configure) disk quotas in Lustre.</para>
54       <orderedlist><listitem>
55       <para> 1. If you have re-complied your Linux kernel, be sure that CONFIG_QUOTA and CONFIG_QUOTACTL are enabled. Also, verify that CONFIG_QFMT_V1 and/or CONFIG_QFMT_V2 are enabled.</para>
56       <para>Quota is enabled in all Linux 2.6 kernels supplied for Lustre.</para>
57
58   </listitem><listitem>
59       <para> 2. Start the server.</para>
60   </listitem><listitem>
61       <para> 3. Mount the Lustre file system on the client and verify that the lquota module has loaded properly by using the lsmod command.</para>
62       <screen>$ lsmod
63 [root@oss161 ~]# lsmod
64 Module                     Size                    Used by
65 obdfilter          220532                  1
66 fsfilt_ldiskfs             52228                   1
67 ost                        96712                   1
68 mgc                        60384                   1
69 ldiskfs                    186896                  2 fsfilt_ldiskfs
70 lustre                     401744                  0
71 lov                        289064                  1 lustre
72 lquota                     107048                  4 obdfilter
73 mdc                        95016                   1 lustre
74 ksocklnd           111812                  1
75 </screen>
76   </listitem></orderedlist>
77
78       <para>The Lustre mount command no longer recognizes the usrquota and grpquota options. If they were previously specified, remove them from /etc/fstab.</para>
79       <para>When quota is enabled, it is enabled for all file system clients (started automatically using quota_type or manually with lfs quotaon).</para>
80
81               <note><para>Lustre with the Linux kernel 2.4 does <emphasis>not</emphasis> support quotas.</para></note>
82
83       <para>To enable quotas automatically when the file system is started, you must set the mdt.quota_type and ost.quota_type parameters, respectively, on the MDT and OSTs. The parameters can be set to the string u (user), g (group) or ug for both users and groups.</para>
84       <para>You can enable quotas at mkfs time (mkfs.lustre --param mdt.quota_type=ug) or with tunefs.lustre. As an example:</para>
85       <screen>tunefs.lustre --param ost.quota_type=ug $ost_dev
86 </screen>
87               <caution><para>If you are using mkfs.lustre --param mdt.quota_type=ug or tunefs.lustre --param ost.quota_type=ug, be sure to run the command on all OSTs and the MDT. Otherwise, abnormal results may occur.</para></caution>
88
89       <section remap="h4">
90         <title>21.2.0.1 Administrative and Operational Quotas</title>
91         <para>Lustre has two kinds of quota files:</para>
92         <itemizedlist><listitem>
93             <para> Administrative quotas (for the MDT), which contain limits for users/groups for the entire cluster.</para>
94           </listitem>
95
96 <listitem>
97             <para> Operational quotas (for the MDT and OSTs), which contain quota information dedicated to a cluster node.</para>
98           </listitem>
99
100 </itemizedlist>
101         <para>Lustre 1.6.5 introduced the v2 file format for administrative quota files, with continued support for the old file format (v1). The mdt.quota_type parameter also handles '1' and '2' options, to specify the Lustre quota versions that will be used. For example:</para>
102         <screen>--param mdt.quota_type=ug1
103 --param mdt.quota_type=u2
104 </screen>
105         <para>Lustre 1.6.6 introduced the v2 file format for operational quotas, with continued support for the old file format (v1). The ost.quota_type parameter handles '1' and '2' options, to specify the Lustre quota versions that will be used. For example:</para>
106         <screen>--param ost.quota_type=ug2
107 --param ost.quota_type=u1
108 </screen>
109         <para>For more information about the v1 and v2 formats, see <link xl:href="ConfiguringQuotas.html#50438217_66360">Quota File Formats</link>.</para>
110       </section>
111     </section>
112     <section xml:id="dbdoclet.50438217_49939">
113       <title>21.3 Creating Quota <anchor xml:id="dbdoclet.50438217_marker-1290170" xreflabel=""/>Files and Quota Administration</title>
114       <para>Once each quota-enabled file system is remounted, it is capable of working with disk quotas. However, the file system is not yet ready to support quotas. If umount has been done regularly, run the lfs command with the quotaon option. If umount has not been done, perform these steps:</para>
115       <orderedlist><listitem>
116       <para> 1. Take Lustre &apos;&apos;offline&apos;&apos;.</para>
117       <para>That is, verify that no write operations (append, write, truncate, create or delete) are being performed (preparing to run lfs quotacheck). Operations that do not change Lustre files (such as read or mount) are okay to run.</para>
118
119               <caution><para>When lfsquotacheck is run, Lustre must NOT be performing any write operations. Failure to follow this caution may cause the statistic information of quota to be inaccurate. For example, the number of blocks used by OSTs for users or groups will be inaccurate, which can cause unexpected quota problems.</para></caution>
120
121           </listitem><listitem>
122        <para> 2. Run the <emphasis role="bold">lfs</emphasis> command with the <emphasis role="bold">quotacheck</emphasis> option:</para>
123       <screen># lfs quotacheck -ug /mnt/lustre
124 </screen>
125       <para>By default, quota is turned on after quotacheck completes. Available options are:</para>
126       <itemizedlist><listitem>
127           <para>u  -- checks the user disk quota information</para>
128         </listitem>
129
130 <listitem>
131           <para>g  -- checks the group disk quota information</para>
132         </listitem>
133
134 </itemizedlist>
135           </listitem></orderedlist>
136
137       <para>The lfsquotacheck command checks all objects on all OSTs and the MDS to sum up for every UID/GID. It reads all Lustre metadata and re-computes the number of blocks/inodes that each UID/GID has used. If there are many files in Lustre, it may take a long time to complete.</para>
138
139               <note><para>User and group quotas are separate. If either quota limit is reached, a process with the corresponding UID/GID cannot allocate more space on the file system.</para></note>
140
141               <note><para>When lfsquotacheck runs, it creates a quota file -- a sparse file with a size proportional to the highest UID in use and UID/GID distribution. As a general rule, if the highest UID in use is large, then the sparse file will be large, which may affect functions such as creating a snapshot.</para></note>
142
143               <note><para>For Lustre 1.6 releases before version 1.6.5, and 1.4 releases before version 1.4.12, if the underlying ldiskfs file system has not unmounted gracefully (due to a crash, for example), re-run quotacheck to obtain accurate quota information. Lustre 1.6.5 and 1.4.12 use journaled quota, so it is not necessary to run quotacheck after an unclean shutdown.</para><para> In certain failure situations (e.g., when a broken Lustre installation or build is used), re-run quotacheck after checking the server kernel logs and fixing the root problem.</para></note>
144
145       <para>The lfs command includes several command options to work with quotas:</para>
146       <itemizedlist><listitem>
147               <para><varname>quotaon</varname>  -- enables disk quotas on the specified file system. The file system quota files must be present in the root directory of the file system.</para>
148         </listitem>
149
150 <listitem>
151     <para><varname>quotaoff</varname>  -- disables disk quotas on the specified file system.</para>
152         </listitem>
153
154 <listitem>
155     <para><varname>quota</varname>  -- displays general quota information (disk usage and limits)</para>
156         </listitem>
157
158 <listitem>
159     <para><varname>setquota</varname>  -- specifies quota limits and tunes the grace period. By default, the grace period is one week.</para>
160         </listitem>
161
162 </itemizedlist>
163       <para> Usage:</para>
164       <screen>lfs quotaon [-ugf] &lt;filesystem&gt;
165 lfs quotaoff [-ug] &lt;filesystem&gt;
166 lfs quota [-q] [-v] [-o obd_uuid] [-u|-g &lt;uname&gt;|uid|gname|gid&gt;]  &lt;filesystem&gt;
167 lfs quota -t &lt;-u|-g&gt; &lt;filesystem&gt;
168 lfs setquota &lt;-u|--user|-g|--group&gt; &lt;username|groupname&gt; [-b &lt;block-softlimit&gt;] [\
169 -B &lt;block-hardlimit&gt;] [-i &lt;inode-softlimit&gt;] [-I &lt;inode-hardlimit&gt;] &lt;filesystem&gt;
170 </screen>
171       <para>Examples:</para>
172       <para>In all of the examples below, the file system is /mnt lustre.</para>
173       <para>To turn on user and group quotas, run:</para>
174       <screen>$ lfs quotaon -ug /mnt/lustre
175 </screen>
176       <para>To turn off user and group quotas, run:</para>
177       <screen>$ lfs quotaoff -ug /mnt/lustre
178 </screen>
179       <para>To display general quota information (disk usage and limits) for the user running the command and his primary group, run:</para>
180       <screen>$ lfs quota /mnt/lustre 
181 </screen>
182       <para>To display general quota information for a specific user (&quot;bob&quot; in this example), run:</para>
183       <screen>$ lfs quota -u bob /mnt/lustre
184 </screen>
185       <para>To display general quota information for a specific user (&quot;bob&quot; in this example) and detailed quota statistics for each MDT and OST, run:</para>
186       <screen>$ lfs quota -u bob -v /mnt/lustre
187 </screen>
188       <para>To display general quota information for a specific group (&quot;eng&quot; in this example), run:</para>
189       <screen>$ lfs quota -g eng /mnt/lustre
190 </screen>
191       <para>To display block and inode grace times for user quotas, run:</para>
192       <screen>$ lfs quota -t -u /mnt/lustre
193 </screen>
194       <para>To set user and group quotas for a specific user (&quot;bob&quot; in this example), run:</para>
195       <screen>$ lfs setquota -u bob 307200 309200 10000 11000 /mnt/lustre
196 </screen>
197       <para>In this example, the quota for user &quot;bob&quot; is set to 300 MB (309200*1024) and the hard limit is 11,000 files. Therefore, the inode hard limit should be 11000.</para>
198
199               <note><para>For the Lustre command $lfssetquota/quota ... the qunit for block is KB (1024) and the qunit for inode is 1.</para></note>
200
201       <para>The quota command displays the quota allocated and consumed for each Lustre device. Using the previous setquota example, running this lfs quota command:</para>
202       <screen>$ lfs quota -u bob -v /mnt/lustre 
203 </screen>
204       <para>displays this command output:</para>
205       <screen>Disk quotas for user bob (uid 6000):
206 Filesystem         kbytes          quota           limit           grace   \
207         files           quota           limit           grace
208 /mnt/lustre                0               30720           30920           \
209 -               0               10000           11000           -
210 lustre-MDT0000_UUID        0               -               16384           \
211 -               0               -               2560            -
212 lustre-OST0000_UUID        0               -               16384           \
213 -               0               -               0               -
214 lustre-OST0001_UUID        0               -               16384           \
215 -               0               -               0               -
216 </screen>
217     </section>
218     <section xml:id="dbdoclet.50438217_15106">
219       <title>21.4 Quota<anchor xml:id="dbdoclet.50438217_marker-1290226" xreflabel=""/> Allocation</title>
220       <para>In Lustre, quota must be properly allocated or users may experience unnecessary failures. The file system block quota is divided up among the OSTs within the file system. Each OST requests an allocation which is increased up to the quota limit. The quota allocation is then quantized to reduce the number of quota-related request traffic. By default, Lustre supports both user and group quotas to limit disk usage and file counts.</para>
221       <para>The quota system in Lustre is completely compatible with the quota systems used on other file systems. The Lustre quota system distributes quotas from the quota master. Generally, the MDS is the quota master for both inodes and blocks. All OSTs and the MDS are quota slaves to the OSS nodes. To reduce quota requests and get reasonably accurate quota distribution, the transfer quota unit (qunit) between quota master and quota slaves is changed dynamically by the lquota module. The default minimum value of qunit is 1 MB for blocks and 2 for inodes. The proc entries to set these values are: /proc/fs/lustre/mds/lustre-MDT*/quota_least_bunit and /proc/fs/lustre/mds/lustre-MDT*/quota_least_iunit. The default maximum value of qunit is 128 MB for blocks and 5120 for inodes. The proc entries to set these values are quota_bunit_sz and quota_iunit_sz in the MDT and OSTs.</para>
222               <note><para>In general, the quota_bunit_sz value should be larger than 1 MB. For testing purposes, it can be set to 4 KB, if necessary.</para></note>
223       <para>The file system block quota is divided up among the OSTs and the MDS within the file system. Only the MDS uses the file system inode quota.</para>
224       <para>This means that the minimum quota for block is 1 MB* (the number of OSTs + the number of MDSs), which is 1 MB* (number of OSTs + 1). If you attempt to assign a smaller quota, users maybe not be able to create files. As noted, the default minimum quota for inodes is 2. The default is established at file system creation time, but can be tuned via /proc values (described below). The inode quota is also allocated in a quantized manner on the MDS.</para>
225       <para>If we look at the setquota example again, running this lfsquota command:</para>
226       <screen># lfs quota -u bob -v /mnt/lustre
227 </screen>
228       <para>displays this command output:</para>
229       <screen>Disk quotas for user bob (uid 500):
230 Filesystem         kbytes          quota           limit           grace   \
231         files           quota           limit           grace
232 /mnt/lustre                30720*          30720           30920           \
233 6d23h56m44s     10101*          10000           11000           6d23h59m50s
234 lustre-MDT0000_UUID        0               -               1024            \
235 -               10101           -               10240
236 lustre-OST0000_UUID        0               -               1024            \
237 -               -               -               -
238 lustre-OST0001_UUID        30720*          -               28872           \
239 -               -               -               -
240 </screen>
241       <para>The total quota limit of 30,920 is allotted to user bob, which is further distributed to two OSTs and one MDS.</para>
242               <note><para>Values appended with '*' show the limit that has been over-used (exceeding the quota), and receives this message Disk quota exceeded. For example:</para><para> \</para><para>$ cp: writing `/mnt/lustre/var/cache/fontconfig/ beeeeb3dfe132a8a0633a017c99ce0-x86.cache': Disk quota exceeded.</para></note>
243       <para>The requested quota of 300 MB is divided across the OSTs.</para>
244               <note><para>It is very important to note that the block quota is consumed per OST and the MDS per block and inode (there is only one MDS for inodes). Therefore, when the quota is consumed on one OST, the client may not be able to create files regardless of the quota available on other OSTs.</para></note>
245       <section remap="h5">
246         <title>Additional information:</title>
247         <para><emphasis role="bold">Grace period</emphasis> -- The period of time (in seconds) within which users are allowed to exceed their soft limit. There are four types of grace periods:</para>
248         <itemizedlist><listitem>
249             <para> user block soft limit</para>
250           </listitem>
251
252 <listitem>
253             <para> user inode soft limit</para>
254           </listitem>
255
256 <listitem>
257             <para> group block soft limit</para>
258           </listitem>
259
260 <listitem>
261             <para> group inode soft limit</para>
262           </listitem>
263
264 </itemizedlist>
265         <para>The grace periods are applied to all users. The user block soft limit is for all users who are using a blocks quota.</para>
266         <para><emphasis role="bold">Soft limit</emphasis> -- Once you are beyond the soft limit, the quota module begins to time, but you still can write block and inode. When you are always beyond the soft limit and use up your grace time, you get the same result as the hard limit. For inodes and blocks, it is the same. Usually, the soft limit MUST be less than the hard limit; if not, the quota module never triggers the timing. If the soft limit is not needed, leave it as zero (0).</para>
267         <para><emphasis role="bold">Hard limit</emphasis> -- When you are beyond the hard limit, you get -EQUOTA and cannot write inode/block any more. The hard limit is the absolute limit. When a grace period is set, you can exceed the soft limit within the grace period if are under the hard limits.</para>
268         <para>Lustre quota allocation is controlled by two variables, quota_bunit_sz and quota_iunit_sz referring to KBs and inodes, respectively. These values can be accessed on the MDS as /proc/fs/lustre/mds/*/quota_* and on the OST as /proc/fs/lustre/obdfilter/*/quota_*. The quota_bunit_sz and quota_iunit_sz variables are the maximum qunit values for blocks and inodes, respectively. At any time, module lquota chooses a reasonable qunit between the minimum and maximum values.</para>
269         <para>The /proc values are bounded by two other variables quota_btune_sz and quota_itune_sz. By default, the *tune_sz variables are set at 1/2 the *unit_sz variables, and you cannot set *tune_sz larger than *unit_sz. You must set bunit_sz first if it is increasing by more than 2x, and btune_sz first if it is decreasing by more than 2x.</para>
270         <para><emphasis role="bold">Total number of inodes</emphasis> -- To determine the total number of inodes, use lfsdf-i (and also /proc/fs/lustre/*/*/filestotal). For more information on using the lfsdf-i command and the command output, see <link xl:href="ManagingStripingFreeSpace.html#50438209_35838">Checking File System Free Space</link>.</para>
271         <para>Unfortunately, the statfs interface does not report the free inode count directly, but instead reports the total inode and used inode counts. The free inode count is calculated for df from (total inodes - used inodes).</para>
272         <para>It is not critical to know a file system's total inode count. Instead, you should know (accurately), the free inode count and the used inode count for a file system. Lustre manipulates the total inode count in order to accurately report the other two values.</para>
273         <para>The values set for the MDS must match the values set on the OSTs.</para>
274         <para>The quota_bunit_sz parameter displays bytes, however lfs setquota uses KBs. The quota_bunit_sz parameter must be a multiple of 1024. A proper minimum KB size for lfs setquota can be calculated as:</para>
275         <para><emphasis role="bold">Size in KBs = minimum_quota_bunit_sz * (number of OSTS + 1) = 1024 * (number of OSTs +1)</emphasis></para>
276         <para>We add one (1) to the number of OSTs as the MDS also consumes KBs. As inodes are only consumed on the MDS, the minimum inode size for lfs setquota is equal to quota_iunit_sz.</para>
277                 <note><para>Setting the quota below this limit may prevent the user from all file creation.</para></note>
278       </section>
279     </section>
280     <section xml:id="dbdoclet.50438217_27895">
281       <title>21.5 Known Issues <anchor xml:id="dbdoclet.50438217_marker-1290269" xreflabel=""/>with Quotas</title>
282       <para>Using quotas in Lustre can be complex and there are several known issues.</para>
283       <section remap="h3">
284         <title>21.5.1 Granted<anchor xml:id="dbdoclet.50438217_marker-1290272" xreflabel=""/> Cache and Quota Limits</title>
285         <para>In Lustre, granted cache does not respect quota limits. In this situation, OSTs grant cache to Lustre client to accelerate I/O. Granting cache causes writes to be successful in OSTs, even if they exceed the quota limits, and will overwrite them.</para>
286         <para>The sequence is:</para>
287         <orderedlist><listitem>
288         <para>A user writes files to Lustre.</para>
289     </listitem><listitem>
290         <para>If the Lustre client has enough granted cache, then it returns 'success' to users and arranges the writes to the OSTs.</para>
291     </listitem><listitem>
292         <para>Because Lustre clients have delivered success to users, the OSTs cannot fail these writes.</para>
293     </listitem></orderedlist>
294         <para>Because of granted cache, writes always overwrite quota limitations. For example, if you set a 400 GB quota on user A and use IOR to write for user A from a bundle of clients, you will write much more data than 400 GB, and cause an out-of-quota error (-EDQUOT).</para>
295                 <note><para>The effect of granted cache on quota limits can be mitigated, but not eradicated. Reduce the max_dirty_buffer in the clients (can be set from 0 to 512). To set max_dirty_buffer to 0:</para><para> * In releases after Lustre 1.6.5, lctl set_param osc.*.max_dirty_mb=0.</para><para> * In releases before Lustre 1.6.5, proc/fs/lustre/osc/*/max_dirty_mb; do echo 512 &gt; $O</para></note>
296       </section>
297       <section remap="h3">
298         <title>21.5.2 <anchor xml:id="dbdoclet.50438217_50442" xreflabel=""/>Quota <anchor xml:id="dbdoclet.50438217_marker-1290282" xreflabel=""/>Limits</title>
299         <para>Available quota limits depend on the Lustre version you are using.</para>
300         <itemizedlist><listitem>
301             <para> Lustre version 1.4.11 and earlier (for 1.4.x releases) and Lustre version 1.6.4 and earlier (for 1.6.x releases) support quota limits less than 4 TB.</para>
302           </listitem>
303
304 <listitem>
305             <para> Lustre versions 1.4.12, 1.6.5 and later support quota limits of 4 TB and greater in Lustre configurations with OST storage limits of 4 TB and less.</para>
306           </listitem>
307
308 <listitem>
309             <para> Future Lustre versions are expected to support quota limits of 4 TB and greater with no OST storage limits.</para>
310           </listitem>
311 <listitem>
312             <informaltable frame="all">
313               <tgroup cols="3">
314                 <colspec colname="c1" colwidth="33*"/>
315                 <colspec colname="c2" colwidth="33*"/>
316                 <colspec colname="c3" colwidth="33*"/>
317                 <thead>
318                   <row>
319                     <entry><para><emphasis role="bold">Lustre Version</emphasis></para></entry>
320                     <entry><para><emphasis role="bold">Quota Limit Per User/Per Group</emphasis></para></entry>
321                     <entry><para><emphasis role="bold">OST Storage Limit</emphasis></para></entry>
322                   </row>
323                 </thead>
324                 <tbody>
325                   <row>
326                     <entry><para> 1.4.11 and earlier</para></entry>
327                     <entry><para> &lt; 4TB</para></entry>
328                     <entry><para> n/a</para></entry>
329                   </row>
330                   <row>
331                     <entry><para> 1.4.12</para></entry>
332                     <entry><para> =&gt; 4TB</para></entry>
333                     <entry><para> &lt;= 4TB of storage</para></entry>
334                   </row>
335                   <row>
336                     <entry><para> 1.6.4 and earlier</para></entry>
337                     <entry><para> &lt; 4TB</para></entry>
338                     <entry><para> n/a</para></entry>
339                   </row>
340                   <row>
341                     <entry><para> 1.6.5</para></entry>
342                     <entry><para> =&gt; 4TB</para></entry>
343                     <entry><para> &lt;= 4TB of storage</para></entry>
344                   </row>
345                   <row>
346                     <entry><para> Future Lustre versions</para></entry>
347                     <entry><para> =&gt; 4TB</para></entry>
348                     <entry><para> No storage limit</para></entry>
349                   </row>
350                 </tbody>
351               </tgroup>
352             </informaltable>
353           </listitem>
354 </itemizedlist>
355       </section>
356       <section remap="h3">
357         <title>21.5.3 <anchor xml:id="dbdoclet.50438217_66360" xreflabel=""/>Quota <anchor xml:id="dbdoclet.50438217_marker-1290326" xreflabel=""/>File Formats</title>
358         <para>Lustre 1.6.5 introduced the v2 file format for administrative quotas, with 64-bit limits that support large-limits handling. The old quota file format (v1), with 32-bit limits, is also supported. Lustre 1.6.6 introduced the v2 file format for operational quotas. A few notes regarding the current quota file formats:</para>
359         <para>Lustre 1.6.5 and later use mdt.quota_type to force a specific administrative quota version (v2 or v1).</para>
360         <itemizedlist><listitem>
361             <para> For the v2 quota file format, (OBJECTS/admin_quotafile_v2.{usr,grp})</para>
362           </listitem>
363
364 <listitem>
365             <para> For the v1 quota file format, (OBJECTS/admin_quotafile.{usr,grp})</para>
366           </listitem>
367
368 </itemizedlist>
369         <para>Lustre 1.6.6 and later use ost.quota_type to force a specific operational quota version (v2 or v1).</para>
370         <itemizedlist><listitem>
371             <para> For the v2 quota file format, (lquota_v2.{user,group})</para>
372           </listitem>
373
374 <listitem>
375             <para> For the v1 quota file format, (lquota.{user,group})</para>
376           </listitem>
377
378 </itemizedlist>
379         <para>The quota_type specifier can be used to set different combinations of administrative/operational quota file versions on a Lustre node:</para>
380         <itemizedlist><listitem>
381             <para> &quot;1&quot; - v1 (32-bit) administrative quota file, v1 (32-bit) operational quota file (default in releases before Lustre 1.6.5)</para>
382           </listitem>
383
384 <listitem>
385             <para> &quot;2&quot; - v2 (64-bit) administrative quota file, v1 (32-bit) operational quota file (default in Lustre 1.6.5)</para>
386           </listitem>
387
388 <listitem>
389             <para> &quot;3&quot; - v2 (64-bit) administrative quota file, v2 (64-bit) operational quota file (default in releases after Lustre 1.6.5)</para>
390           </listitem>
391
392 </itemizedlist>
393         <para>If quotas do not exist or look broken, then quotacheck creates quota files of a required name and format.</para>
394         <para>If Lustre is using the v2 quota file format when only v1 quota files exist, then quotacheck converts old v1 quota files to new v2 quota files. This conversion is triggered automatically, and is transparent to users. If an old quota file does not exist or looks broken, then the new v2 quota file will be empty. In case of an error, details can be found in the kernel log of the corresponding MDS/OST. During conversion of a v1 quota file to a v2 quota file, the v2 quota file is marked as broken, to avoid it being used if a crash occurs. The quota module does not use broken quota files (keeping quota off).</para>
395         <para>In most situations, Lustre administrators do not need to set specific versioning options. Upgrading Lustre without using quota_type to force specific quota file versions results in quota files being upgraded automatically to the latest version. The option ensures backward compatibility, preventing a quota file upgrade to a version which is not supported by earlier Lustre versions.</para>
396       </section>
397     </section>
398     <section xml:id="dbdoclet.50438217_20772">
399       <title>21.6 Lustre <anchor xml:id="dbdoclet.50438217_marker-1290343" xreflabel=""/>Quota Statistics</title>
400       <para>Lustre includes statistics that monitor quota activity, such as the kinds of quota RPCs sent during a specific period, the average time to complete the RPCs, etc. These statistics are useful to measure performance of a Lustre file system.</para>
401       <para>Each quota statistic consists of a quota event and min_time, max_time and sum_time values for the event.</para>
402       <informaltable frame="all">
403         <tgroup cols="2">
404           <colspec colname="c1" colwidth="50*"/>
405           <colspec colname="c2" colwidth="50*"/>
406           <thead>
407             <row>
408               <entry><para><emphasis role="bold">Quota Event</emphasis></para></entry>
409               <entry><para><emphasis role="bold">Description</emphasis></para></entry>
410             </row>
411           </thead>
412           <tbody>
413             <row>
414               <entry><para> <emphasis role="bold">sync_acq_req</emphasis></para></entry>
415               <entry><para> Quota slaves send a acquiring_quota request and wait for its return.</para></entry>
416             </row>
417             <row>
418               <entry><para> <emphasis role="bold">sync_rel_req</emphasis></para></entry>
419               <entry><para> Quota slaves send a releasing_quota request and wait for its return.</para></entry>
420             </row>
421             <row>
422               <entry><para> <emphasis role="bold">async_acq_req</emphasis></para></entry>
423               <entry><para> Quota slaves send an acquiring_quota request and do not wait for its return.</para></entry>
424             </row>
425             <row>
426               <entry><para> <emphasis role="bold">async_rel_req</emphasis></para></entry>
427               <entry><para> Quota slaves send a releasing_quota request and do not wait for its return.</para></entry>
428             </row>
429             <row>
430               <entry><para> <emphasis role="bold">wait_for_blk_quota (lquota_chkquota)</emphasis></para></entry>
431               <entry><para> Before data is written to OSTs, the OSTs check if the remaining block quota is sufficient. This is done in the lquota_chkquota function.</para></entry>
432             </row>
433             <row>
434               <entry><para> <emphasis role="bold">wait_for_ino_quota (lquota_chkquota)</emphasis></para></entry>
435               <entry><para> Before files are created on the MDS, the MDS checks if the remaining inode quota is sufficient. This is done in the lquota_chkquota function.</para></entry>
436             </row>
437             <row>
438               <entry><para> <emphasis role="bold">wait_for_blk_quota (lquota_pending_commit)</emphasis></para></entry>
439               <entry><para> After blocks are written to OSTs, relative quota information is updated. This is done in the lquota_pending_commit function.</para></entry>
440             </row>
441             <row>
442               <entry><para> <emphasis role="bold">wait_for_ino_quota (lquota_pending_commit)</emphasis></para></entry>
443               <entry><para> After files are created, relative quota information is updated. This is done in the lquota_pending_commit function.</para></entry>
444             </row>
445             <row>
446               <entry><para> <emphasis role="bold">wait_for_pending_blk_quota_req (qctxt_wait_pending_dqacq)</emphasis></para></entry>
447               <entry><para> On the MDS or OSTs, there is one thread sending a quota request for a specific UID/GID for block quota at any time. At that time, if other threads need to do this too, they should wait. This is done in the qctxt_wait_pending_dqacq function.</para></entry>
448             </row>
449             <row>
450               <entry><para> <emphasis role="bold">wait_for_pending_ino_quota_req (qctxt_wait_pending_dqacq)</emphasis></para></entry>
451               <entry><para> On the MDS, there is one thread sending a quota request for a specific UID/GID for inode quota at any time. If other threads need to do this too, they should wait. This is done in the qctxt_wait_pending_dqacq function.</para></entry>
452             </row>
453             <row>
454               <entry><para> <emphasis role="bold">nowait_for_pending_blk_quota_req (qctxt_wait_pending_dqacq)</emphasis></para></entry>
455               <entry><para> On the MDS or OSTs, there is one thread sending a quota request for a specific UID/GID for block quota at any time. When threads enter qctxt_wait_pending_dqacq, they do not need to wait. This is done in the qctxt_wait_pending_dqacq function.</para></entry>
456             </row>
457             <row>
458               <entry><para> <emphasis role="bold">nowait_for_pending_ino_quota_req (qctxt_wait_pending_dqacq)</emphasis></para></entry>
459               <entry><para> On the MDS, there is one thread sending a quota request for a specific UID/GID for inode quota at any time. When threads enter qctxt_wait_pending_dqacq, they do not need to wait. This is done in the qctxt_wait_pending_dqacq function.</para></entry>
460             </row>
461             <row>
462               <entry><para> <emphasis role="bold">quota_ctl</emphasis></para></entry>
463               <entry><para> The quota_ctl statistic is generated when lfs setquota, lfs quota and so on, are issued.</para></entry>
464             </row>
465             <row>
466               <entry><para> <emphasis role="bold">adjust_qunit</emphasis></para></entry>
467               <entry><para> Each time qunit is adjusted, it is counted.</para></entry>
468             </row>
469           </tbody>
470         </tgroup>
471       </informaltable>
472       <section remap="h3">
473         <title>21.6.1 Interpreting Quota Statistics</title>
474         <para>Quota statistics are an important measure of a Lustre file system's performance. Interpreting these statistics correctly can help you diagnose problems with quotas, and may indicate adjustments to improve system performance.</para>
475         <para>For example, if you run this command on the OSTs:</para>
476         <screen>cat /proc/fs/lustre/lquota/lustre-OST0000/stats
477 </screen>
478         <para>You will get a result similar to this:</para>
479         <screen>snapshot_time                                1219908615.506895 secs.usecs
480 async_acq_req                              1 samples [us]  32 32 32
481 async_rel_req                              1 samples [us]  5 5 5
482 nowait_for_pending_blk_quota_req(qctxt_wait_pending_dqacq) 1 samples [us] 2\
483  2 2
484 quota_ctl                          4 samples [us]  80 3470 4293
485 adjust_qunit                               1 samples [us]  70 70 70
486 ....
487 </screen>
488         <para>In the first line, snapshot_time indicates when the statistics were taken. The remaining lines list the quota events and their associated data.</para>
489         <para>In the second line, the async_acq_req event occurs one time. The min_time, max_time and sum_time statistics for this event are 32, 32 and 32, respectively. The unit is microseconds (s).</para>
490         <para>In the fifth line, the quota_ctl event occurs four times. The min_time, max_time and sum_time statistics for this event are 80, 3470 and 4293, respectively. The unit is microseconds (s).</para>
491       </section>
492     </section>
493 </chapter>