Whamcloud - gitweb
LU-15048 quota: check that qti_lqes has been inited
[fs/lustre-release.git] / lustre / quota / qmt_handler.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; if not, write to the
18  * Free Software Foundation, Inc., 59 Temple Place - Suite 330,
19  * Boston, MA 021110-1307, USA
20  *
21  * GPL HEADER END
22  */
23 /*
24  * Copyright (c) 2012, 2017, Intel Corporation.
25  * Use is subject to license terms.
26  *
27  * Author: Johann Lombardi <johann.lombardi@intel.com>
28  * Author: Niu    Yawei    <yawei.niu@intel.com>
29  */
30
31 #define DEBUG_SUBSYSTEM S_LQUOTA
32
33 #include <obd_class.h>
34 #include "qmt_internal.h"
35
36 /*
37  * Retrieve quota settings for a given identifier.
38  *
39  * \param env     - is the environment passed by the caller
40  * \param qmt     - is the quota master target
41  * \param restype - is the pool type, either block (i.e. LQUOTA_RES_DT) or inode
42  *                  (i.e. LQUOTA_RES_MD)
43  * \param qtype   - is the quota type
44  * \param id      - is the quota indentifier for which we want to acces quota
45  *                  settings.
46  * \param hard    - is the output variable where to copy the hard limit
47  * \param soft    - is the output variable where to copy the soft limit
48  * \param time    - is the output variable where to copy the grace time
49  */
50 static int qmt_get(const struct lu_env *env, struct qmt_device *qmt,
51                    __u8 restype, __u8 qtype, union lquota_id *id,
52                    __u64 *hard, __u64 *soft, __u64 *time, bool is_default,
53                    char *pool_name)
54 {
55         struct lquota_entry     *lqe;
56         ENTRY;
57
58         LASSERT(!is_default || id->qid_uid == 0);
59         if (pool_name && !strnlen(pool_name, LOV_MAXPOOLNAME))
60                 pool_name = NULL;
61
62         /* look-up lqe structure containing quota settings */
63         lqe = qmt_pool_lqe_lookup(env, qmt, restype, qtype, id, pool_name);
64         if (IS_ERR(lqe))
65                 RETURN(PTR_ERR(lqe));
66
67         /* copy quota settings */
68         lqe_read_lock(lqe);
69         LQUOTA_DEBUG(lqe, "fetch settings");
70         if (hard != NULL)
71                 *hard = lqe->lqe_hardlimit;
72         if (soft != NULL)
73                 *soft = lqe->lqe_softlimit;
74         if (time != NULL) {
75                 *time = lqe->lqe_gracetime;
76                 if (lqe->lqe_is_default)
77                         *time |= (__u64)LQUOTA_FLAG_DEFAULT <<
78                                                         LQUOTA_GRACE_BITS;
79         }
80         lqe_read_unlock(lqe);
81
82         lqe_putref(lqe);
83         RETURN(0);
84 }
85
86 struct qmt_entry_iter_data {
87         const struct lu_env *qeid_env;
88         struct qmt_device   *qeid_qmt;
89 };
90
91 static int qmt_entry_iter_cb(struct cfs_hash *hs, struct cfs_hash_bd *bd,
92                              struct hlist_node *hnode, void *d)
93 {
94         struct qmt_entry_iter_data *iter = (struct qmt_entry_iter_data *)d;
95         struct lquota_entry     *lqe;
96
97         lqe = hlist_entry(hnode, struct lquota_entry, lqe_hash);
98         LASSERT(atomic_read(&lqe->lqe_ref) > 0);
99
100         if (lqe->lqe_id.qid_uid == 0 || !lqe->lqe_is_default)
101                 return 0;
102
103         return qmt_set_with_lqe(iter->qeid_env, iter->qeid_qmt, lqe, 0, 0, 0, 0,
104                                 true, true);
105 }
106
107 static void qmt_set_id_notify(const struct lu_env *env, struct qmt_device *qmt,
108                               struct lquota_entry *lqe)
109 {
110         struct lquota_entry *lqe_gl;
111         int rc;
112
113         lqe_gl = lqe->lqe_is_global ? lqe : NULL;
114         rc = qmt_pool_lqes_lookup_spec(env, qmt, lqe_rtype(lqe),
115                                        lqe_qtype(lqe), &lqe->lqe_id);
116         if (!qti_lqes_cnt(env))
117                 GOTO(lqes_fini, rc);
118
119         if (!lqe_gl && qti_lqes_glbl(env)->lqe_is_global)
120                 lqe_gl = qti_lqes_glbl(env);
121
122         if (!lqe_gl)
123                 GOTO(lqes_fini, rc);
124
125         if (lqe_gl->lqe_glbl_data)
126                 qmt_seed_glbe(env, lqe_gl->lqe_glbl_data);
127         /* Even if slaves haven't enqueued quota lock yet,
128          * it is needed to set lqe_revoke_time in qmt_id_lock_glimpse
129          * in case of reaching qpi_least_qunit */
130         qmt_id_lock_notify(qmt, lqe_gl);
131 lqes_fini:
132         qti_lqes_fini(env);
133 }
134
135 /*
136  * Update quota settings for a given lqe.
137  *
138  * \param env        - is the environment passed by the caller
139  * \param qmt        - is the quota master target
140  * \param lqe        - is the lquota_entry for which we want to modify quota
141  *                     settings.
142  * \param hard       - is the new hard limit
143  * \param soft       - is the new soft limit
144  * \param time       - is the new grace time
145  * \param valid      - is the list of settings to change
146  * \param is_default - true for default quota setting
147  * \param is_updated - true if the lqe is updated and no need to write back
148  */
149
150 int qmt_set_with_lqe(const struct lu_env *env, struct qmt_device *qmt,
151                      struct lquota_entry *lqe, __u64 hard, __u64 soft,
152                      __u64 time, __u32 valid, bool is_default, bool is_updated)
153 {
154         struct thandle *th = NULL;
155         time64_t now = 0;
156         __u64 ver;
157         bool dirtied = false;
158         int rc = 0;
159         bool need_id_notify = false;
160         ENTRY;
161
162         /* need to write back to global quota file? */
163         if (!is_updated) {
164                 /* By default we should have here only 1 lqe,
165                  * so no allocations should be done. */
166                 if (qti_lqes_restore_init(env))
167                         GOTO(out_nolock, rc = -ENOMEM);
168                 /* allocate & start transaction with enough credits to update
169                  * quota  settings in the global index file */
170                 th = qmt_trans_start(env, lqe);
171                 if (IS_ERR(th))
172                         GOTO(out_nolock, rc = PTR_ERR(th));
173         }
174
175         now = ktime_get_real_seconds();
176
177         lqe_write_lock(lqe);
178         LQUOTA_DEBUG(lqe,
179                      "changing quota settings valid:%x hard:%llu soft:%llu time:%llu",
180                      valid, hard, soft, time);
181
182         if (is_default && lqe->lqe_id.qid_uid != 0) {
183                 LQUOTA_DEBUG(lqe, "set qid %llu to use default quota setting",
184                              lqe->lqe_id.qid_uid);
185
186                 qmt_lqe_set_default(env, lqe->lqe_site->lqs_parent, lqe, false);
187                 GOTO(quota_set, 0);
188         }
189
190         if ((valid & QIF_TIMES) != 0 && lqe->lqe_gracetime != time) {
191                 /* change time settings */
192                 lqe->lqe_gracetime = time;
193                 dirtied            = true;
194         }
195
196         if ((valid & QIF_LIMITS) != 0 &&
197             (lqe->lqe_hardlimit != hard || lqe->lqe_softlimit != soft)) {
198                 rc = qmt_validate_limits(lqe, hard, soft);
199                 if (rc)
200                         GOTO(out, rc);
201
202                 /* change quota limits */
203                 lqe->lqe_hardlimit = hard;
204                 lqe->lqe_softlimit = soft;
205
206 quota_set:
207                 /* recompute qunit in case it was never initialized */
208                 if (qmt_revalidate(env, lqe))
209                         need_id_notify = true;
210
211                 /* clear grace time */
212                 if (lqe->lqe_softlimit == 0 ||
213                     lqe->lqe_granted <= lqe->lqe_softlimit)
214                         /* no soft limit or below soft limit, let's clear grace
215                          * time */
216                         lqe->lqe_gracetime = 0;
217                 else if ((valid & QIF_TIMES) == 0)
218                         /* set grace only if user hasn't provided his own */
219                          lqe->lqe_gracetime = now + qmt_lqe_grace(lqe);
220
221                 /* change enforced status based on new parameters */
222                 if (lqe->lqe_id.qid_uid == 0 || (lqe->lqe_hardlimit == 0 &&
223                     lqe->lqe_softlimit == 0))
224                         lqe->lqe_enforced = false;
225                 else
226                         lqe->lqe_enforced = true;
227
228                 dirtied = true;
229         }
230
231         if (!is_default && lqe->lqe_is_default) {
232                 LQUOTA_DEBUG(lqe, "the qid %llu has been set quota"
233                              " explicitly, clear the default flag",
234                              lqe->lqe_id.qid_uid);
235
236                 qmt_lqe_clear_default(lqe);
237                 dirtied = true;
238         }
239
240         if (dirtied) {
241                 if (!is_updated) {
242                         /* write new quota settings to disk */
243                         rc = qmt_glb_write(env, th, lqe, LQUOTA_BUMP_VER, &ver);
244                         if (rc) {
245                                 /* restore initial quota settings */
246                                 qmt_restore(lqe, &qti_lqes_rstr(env)[0]);
247                                 GOTO(out, rc);
248                         }
249                 } else {
250                         ver = dt_version_get(env, LQE_GLB_OBJ(lqe));
251                 }
252
253                 /* compute new qunit value now that we have modified the quota
254                  * settings or clear/set edquot flag if needed */
255                 need_id_notify |= qmt_adjust_qunit(env, lqe);
256                 need_id_notify |= qmt_adjust_edquot(lqe, now);
257         }
258         EXIT;
259 out:
260         lqe_write_unlock(lqe);
261
262 out_nolock:
263         if (!is_updated) {
264                 if (th != NULL && !IS_ERR(th))
265                         dt_trans_stop(env, qmt->qmt_child, th);
266                 qti_lqes_restore_fini(env);
267         }
268
269         if (rc == 0 && dirtied) {
270                 qmt_glb_lock_notify(env, lqe, ver);
271                 if (lqe->lqe_id.qid_uid == 0) {
272                         struct qmt_entry_iter_data iter_data;
273
274                         LQUOTA_DEBUG(lqe, "notify all lqe with default quota");
275                         iter_data.qeid_env = env;
276                         iter_data.qeid_qmt = qmt;
277                         cfs_hash_for_each(lqe->lqe_site->lqs_hash,
278                                                qmt_entry_iter_cb, &iter_data);
279                         /* Always notify slaves with default values. Don't
280                          * care about overhead as will be sent only not changed
281                          * values(see qmt_id_lock_cb for details).*/
282                         need_id_notify = true;
283                 }
284                 /* qti_lqes_inited > 0 means we came here from another
285                  * qmt_pool_lqes_lookup(qmt_dqacq, intent_policy ...). Thus
286                  * we can't init and add new lqes to don't overwrite already
287                  * added.
288                  */
289                 if (!qti_lqes_inited(env) && need_id_notify)
290                         qmt_set_id_notify(env, qmt, lqe);
291         }
292
293         return rc;
294 }
295
296 /*
297  * Update quota settings for a given identifier.
298  *
299  * \param env        - is the environment passed by the caller
300  * \param qmt        - is the quota master target
301  * \param restype    - is the pool type, either block (i.e. LQUOTA_RES_DT) or
302  *                     inode (i.e. LQUOTA_RES_MD)
303  * \param qtype      - is the quota type
304  * \param id         - is the quota indentifier for which we want to modify
305  *                     quota settings.
306  * \param hard       - is the new hard limit
307  * \param soft       - is the new soft limit
308  * \param time       - is the new grace time
309  * \param valid      - is the list of settings to change
310  * \param is_default - true for default quota setting
311  * \param is_updated - true if the lqe is updated and no need to write back
312  */
313 static int qmt_set(const struct lu_env *env, struct qmt_device *qmt,
314                    __u8 restype, __u8 qtype, union lquota_id *id,
315                    __u64 hard, __u64 soft, __u64 time, __u32 valid,
316                    bool is_default, bool is_updated, char *pool_name)
317 {
318         struct lquota_entry *lqe;
319         int rc;
320         ENTRY;
321
322         if (pool_name && !strnlen(pool_name, LOV_MAXPOOLNAME))
323                 pool_name = NULL;
324
325         /* look-up quota entry associated with this ID */
326         lqe = qmt_pool_lqe_lookup(env, qmt, restype, qtype, id, pool_name);
327         if (IS_ERR(lqe))
328                         RETURN(PTR_ERR(lqe));
329
330         rc = qmt_set_with_lqe(env, qmt, lqe, hard, soft, time, valid,
331                               is_default, is_updated);
332         lqe_putref(lqe);
333         RETURN(rc);
334 }
335
336 /*
337  * Handle quotactl request.
338  *
339  * \param env   - is the environment passed by the caller
340  * \param ld    - is the lu device associated with the qmt
341  * \param oqctl - is the quotactl request
342  */
343 static int qmt_quotactl(const struct lu_env *env, struct lu_device *ld,
344                         struct obd_quotactl *oqctl)
345 {
346         struct qmt_thread_info *qti = qmt_info(env);
347         union lquota_id *id  = &qti->qti_id;
348         struct qmt_device *qmt = lu2qmt_dev(ld);
349         struct obd_dqblk *dqb = &oqctl->qc_dqblk;
350         char *poolname;
351         int rc = 0;
352         bool is_default = false;
353         ENTRY;
354
355         LASSERT(qmt != NULL);
356
357         if (oqctl->qc_type >= LL_MAXQUOTAS)
358                 /* invalid quota type */
359                 RETURN(-EINVAL);
360
361         poolname = LUSTRE_Q_CMD_IS_POOL(oqctl->qc_cmd) ?
362                         oqctl->qc_poolname : NULL;
363
364         switch (oqctl->qc_cmd) {
365
366         case Q_GETINFO:  /* read grace times */
367         case LUSTRE_Q_GETINFOPOOL:
368                 /* Global grace time is stored in quota settings of ID 0. */
369                 id->qid_uid = 0;
370
371                 /* read inode grace time */
372                 rc = qmt_get(env, qmt, LQUOTA_RES_MD, oqctl->qc_type, id, NULL,
373                              NULL, &oqctl->qc_dqinfo.dqi_igrace,
374                              false, poolname);
375                 /* There could be no MD pool, so try to find DT pool */
376                 if (rc && rc != -ENOENT)
377                         break;
378
379                 /* read block grace time */
380                 rc = qmt_get(env, qmt, LQUOTA_RES_DT, oqctl->qc_type, id, NULL,
381                              NULL, &oqctl->qc_dqinfo.dqi_bgrace,
382                              false, poolname);
383                 break;
384
385         case Q_SETINFO:  /* modify grace times */
386         case LUSTRE_Q_SETINFOPOOL:
387                 /* setinfo should be using dqi->dqi_valid, but lfs incorrectly
388                  * sets the valid flags in dqb->dqb_valid instead, try to live
389                  * with that ... */
390
391                 /* Global grace time is stored in quota settings of ID 0. */
392                 id->qid_uid = 0;
393
394                 if ((dqb->dqb_valid & QIF_ITIME) != 0) {
395                         /* set inode grace time */
396                         rc = qmt_set(env, qmt, LQUOTA_RES_MD, oqctl->qc_type,
397                                      id, 0, 0, oqctl->qc_dqinfo.dqi_igrace,
398                                      QIF_TIMES, false, false,
399                                      poolname);
400                         if (rc)
401                                 break;
402                 }
403
404                 if ((dqb->dqb_valid & QIF_BTIME) != 0)
405                         /* set block grace time */
406                         rc = qmt_set(env, qmt, LQUOTA_RES_DT, oqctl->qc_type,
407                                      id, 0, 0, oqctl->qc_dqinfo.dqi_bgrace,
408                                      QIF_TIMES, false, false,
409                                      poolname);
410                 break;
411
412         case LUSTRE_Q_GETDEFAULT:
413         case LUSTRE_Q_GETDEFAULT_POOL:
414                 is_default = true;
415                 /* fallthrough */
416
417         case Q_GETQUOTA: /* consult quota limit */
418         case LUSTRE_Q_GETQUOTAPOOL:
419                 /* extract quota ID from quotactl request */
420                 id->qid_uid = oqctl->qc_id;
421
422                 /* look-up inode quota settings */
423                 rc = qmt_get(env, qmt, LQUOTA_RES_MD, oqctl->qc_type, id,
424                              &dqb->dqb_ihardlimit, &dqb->dqb_isoftlimit,
425                              &dqb->dqb_itime, is_default, poolname);
426                 /* There could be no MD pool, so try to find DT pool */
427                 if (rc && rc != -ENOENT)
428                         break;
429                 else
430                         dqb->dqb_valid |= QIF_ILIMITS | QIF_ITIME;
431
432                 /* master isn't aware of actual inode usage */
433                 dqb->dqb_curinodes = 0;
434
435                 /* look-up block quota settings */
436                 rc = qmt_get(env, qmt, LQUOTA_RES_DT, oqctl->qc_type, id,
437                              &dqb->dqb_bhardlimit, &dqb->dqb_bsoftlimit,
438                              &dqb->dqb_btime, is_default, poolname);
439                 if (rc)
440                         break;
441
442                 dqb->dqb_valid |= QIF_BLIMITS | QIF_BTIME;
443                 /* master doesn't know the actual block usage */
444                 dqb->dqb_curspace = 0;
445                 break;
446
447         case LUSTRE_Q_SETDEFAULT:
448         case LUSTRE_Q_SETDEFAULT_POOL:
449                 is_default = true;
450                 /* fallthrough */
451
452         case Q_SETQUOTA: /* change quota limits */
453         case LUSTRE_Q_SETQUOTAPOOL:
454                 /* extract quota ID from quotactl request */
455                 id->qid_uid = oqctl->qc_id;
456
457                 if ((dqb->dqb_valid & QIF_IFLAGS) != 0) {
458                         /* update inode quota settings */
459                         rc = qmt_set(env, qmt, LQUOTA_RES_MD, oqctl->qc_type,
460                                      id, dqb->dqb_ihardlimit,
461                                      dqb->dqb_isoftlimit, dqb->dqb_itime,
462                                      dqb->dqb_valid & QIF_IFLAGS, is_default,
463                                      false, poolname);
464                         if (rc)
465                                 break;
466                 }
467
468                 if ((dqb->dqb_valid & QIF_BFLAGS) != 0)
469                         /* update block quota settings */
470                         rc = qmt_set(env, qmt, LQUOTA_RES_DT, oqctl->qc_type,
471                                      id, dqb->dqb_bhardlimit,
472                                      dqb->dqb_bsoftlimit, dqb->dqb_btime,
473                                      dqb->dqb_valid & QIF_BFLAGS, is_default,
474                                      false, poolname);
475                 break;
476
477         default:
478                 CERROR("%s: unsupported quotactl command: %d\n",
479                        qmt->qmt_svname, oqctl->qc_cmd);
480                 RETURN(-ENOTSUPP);
481         }
482
483         RETURN(rc);
484 }
485
486 static inline
487 void qmt_grant_lqes(const struct lu_env *env, __u64 *slv, __u64 cnt)
488 {
489         int i;
490
491         for (i = 0; i < qti_lqes_cnt(env); i++)
492                 qti_lqe_granted(env, i) += cnt;
493
494         *slv += cnt;
495 }
496
497 static inline bool qmt_lqes_can_rel(const struct lu_env *env, __u64 cnt)
498 {
499         bool can_release = true;
500         int i;
501
502         for (i = 0; i < qti_lqes_cnt(env); i++) {
503                 if (cnt > qti_lqe_granted(env, i)) {
504                         LQUOTA_ERROR(qti_lqes(env)[i],
505                                      "Can't release %llu that is larger than lqe_granted.\n",
506                                      cnt);
507                         can_release = false;
508                 }
509         }
510         return can_release;
511 }
512
513 static inline void qmt_rel_lqes(const struct lu_env *env, __u64 *slv, __u64 cnt)
514 {
515         int i;
516
517         for (i = 0; i < qti_lqes_cnt(env); i++)
518                 qti_lqe_granted(env, i) -= cnt;
519
520         *slv -= cnt;
521 }
522
523 static inline bool qmt_lqes_cannot_grant(const struct lu_env *env, __u64 cnt)
524 {
525         bool cannot_grant = false;
526         int i;
527
528         for (i = 0; i < qti_lqes_cnt(env); i++) {
529                 if (qti_lqe_hard(env, i) != 0 &&
530                     qti_lqe_granted(env, i) + cnt > qti_lqe_hard(env, i)) {
531                         cannot_grant = true;
532                         break;
533                 }
534         }
535         return cannot_grant;
536 }
537
538 static inline __u64 qmt_lqes_grant_some_quota(const struct lu_env *env)
539 {
540         __u64 min_count, tmp;
541         bool flag = false;
542         int i;
543
544         for (i = 0, min_count = 0; i < qti_lqes_cnt(env); i++) {
545                 if (!qti_lqes(env)[i]->lqe_enforced &&
546                     !qti_lqes(env)[i]->lqe_is_global)
547                         continue;
548
549                 tmp = qti_lqe_hard(env, i) - qti_lqe_granted(env, i);
550                 if (flag) {
551                         min_count = tmp < min_count ? tmp : min_count;
552                 } else {
553                         flag = true;
554                         min_count = tmp;
555                 }
556         }
557         return min_count;
558 }
559
560 static inline __u64 qmt_lqes_alloc_expand(const struct lu_env *env,
561                                           __u64 slv_granted, __u64 spare)
562 {
563         __u64 min_count, tmp;
564         bool flag = false;
565         int i;
566
567         for (i = 0, min_count = 0; i < qti_lqes_cnt(env); i++) {
568                 /* Don't take into account not enforced lqes that belong
569                  * to non global pool. These lqes present in array to
570                  * support actual lqe_granted even for lqes without limits. */
571                 if (!qti_lqes(env)[i]->lqe_enforced &&
572                     !qti_lqes(env)[i]->lqe_is_global)
573                         continue;
574
575                 tmp = qmt_alloc_expand(qti_lqes(env)[i], slv_granted, spare);
576                 if (flag) {
577                         min_count = tmp < min_count ? tmp : min_count;
578                 } else {
579                         flag = true;
580                         min_count = tmp;
581                 }
582         }
583         return min_count;
584 }
585
586 static inline void qmt_lqes_tune_grace(const struct lu_env *env, __u64 now)
587 {
588         int i;
589
590         for (i = 0; i < qti_lqes_cnt(env); i++) {
591                 struct lquota_entry *lqe;
592
593                 lqe = qti_lqes(env)[i];
594                 if (lqe->lqe_softlimit != 0) {
595                         if (lqe->lqe_granted > lqe->lqe_softlimit &&
596                             lqe->lqe_gracetime == 0) {
597                                 /* First time over soft limit, let's start grace
598                                  * timer */
599                                 lqe->lqe_gracetime = now + qmt_lqe_grace(lqe);
600                         } else if (lqe->lqe_granted <= lqe->lqe_softlimit &&
601                                    lqe->lqe_gracetime != 0) {
602                                 /* Clear grace timer */
603                                 lqe->lqe_gracetime = 0;
604                         }
605                 }
606         }
607 }
608
609 /*
610  * Helper function to handle quota request from slave.
611  *
612  * \param env     - is the environment passed by the caller
613  * \param qmt     - is the master device
614  * \param uuid    - is the uuid associated with the slave
615  * \param qb_flags - are the quota request flags as packed in the quota_body
616  * \param qb_count - is the amount of quota space the slave wants to
617  *                   acquire/release
618  * \param qb_usage - is the current space usage on the slave
619  * \param repbody - is the quota_body of reply
620  *
621  * \retval 0            : success
622  * \retval -EDQUOT      : out of quota
623  *         -EINPROGRESS : inform client to retry write/create
624  *         -ve          : other appropriate errors
625  */
626 int qmt_dqacq0(const struct lu_env *env, struct qmt_device *qmt,
627                struct obd_uuid *uuid, __u32 qb_flags, __u64 qb_count,
628                __u64 qb_usage, struct quota_body *repbody)
629 {
630         __u64                    now, count;
631         struct dt_object        *slv_obj = NULL;
632         __u64                    slv_granted, slv_granted_bck;
633         struct thandle          *th = NULL;
634         int                      rc, ret;
635         struct lquota_entry *lqe = qti_lqes_glbl(env);
636         ENTRY;
637
638         LASSERT(uuid != NULL);
639
640         /* initialize reply */
641         memset(repbody, 0, sizeof(*repbody));
642         memcpy(&repbody->qb_id, &lqe->lqe_id, sizeof(repbody->qb_id));
643
644         if (OBD_FAIL_CHECK(OBD_FAIL_QUOTA_RECOVERABLE_ERR))
645                 RETURN(-cfs_fail_val);
646
647         if (qti_lqes_restore_init(env))
648                 RETURN(-ENOMEM);
649
650         /* look-up index file associated with acquiring slave */
651         slv_obj = lquota_disk_slv_find(env, qmt->qmt_child, LQE_ROOT(lqe),
652                                        lu_object_fid(&LQE_GLB_OBJ(lqe)->do_lu),
653                                        uuid);
654         if (IS_ERR(slv_obj))
655                 GOTO(out, rc = PTR_ERR(slv_obj));
656
657         /* pack slave fid in reply just for sanity check */
658         memcpy(&repbody->qb_slv_fid, lu_object_fid(&slv_obj->do_lu),
659                sizeof(struct lu_fid));
660
661         /* allocate & start transaction with enough credits to update
662          * global & slave indexes */
663         th = qmt_trans_start_with_slv(env, NULL, slv_obj, false);
664         if (IS_ERR(th))
665                 GOTO(out, rc = PTR_ERR(th));
666
667         qti_lqes_write_lock(env);
668
669         LQUOTA_DEBUG_LQES(env, "dqacq starts uuid:%s flags:0x%x wanted:%llu"
670                      " usage:%llu", obd_uuid2str(uuid), qb_flags, qb_count,
671                      qb_usage);
672
673         /* Legal race, limits have been removed on master, but slave didn't
674          * receive the change yet. Just return EINPROGRESS until the slave gets
675          * notified. */
676         if (!lqe->lqe_enforced && !req_is_rel(qb_flags))
677                 GOTO(out_locked, rc = -ESRCH);
678
679         /* recompute qunit in case it was never initialized */
680         qmt_revalidate_lqes(env, qmt, qb_flags);
681
682         /* slave just wants to acquire per-ID lock */
683         if (req_is_acq(qb_flags) && qb_count == 0)
684                 GOTO(out_locked, rc = 0);
685
686         /* fetch how much quota space is already granted to this slave */
687         rc = qmt_slv_read(env, &lqe->lqe_id, slv_obj, &slv_granted);
688         if (rc) {
689                 LQUOTA_ERROR(lqe, "Failed to get granted for slave %s, rc=%d",
690                              obd_uuid2str(uuid), rc);
691                 GOTO(out_locked, rc);
692         }
693         /* recall how much space this slave currently owns in order to restore
694          * it in case of failure */
695         slv_granted_bck = slv_granted;
696
697         /* record current time for soft limit & grace time management */
698         now = ktime_get_real_seconds();
699
700         if (req_is_rel(qb_flags)) {
701                 /* Slave would like to release quota space */
702                 if (slv_granted < qb_count ||
703                     !qmt_lqes_can_rel(env, qb_count)) {
704                         /* can't release more than granted */
705                         LQUOTA_ERROR_LQES(env,
706                                           "Release too much! uuid:%s release: %llu granted:%llu, total:%llu",
707                                           obd_uuid2str(uuid), qb_count,
708                                           slv_granted, lqe->lqe_granted);
709                         GOTO(out_locked, rc = -EINVAL);
710                 }
711
712                 repbody->qb_count = qb_count;
713                 /* put released space back to global pool */
714                 qmt_rel_lqes(env, &slv_granted, qb_count);
715                 GOTO(out_write, rc = 0);
716         }
717
718         if (req_has_rep(qb_flags) && slv_granted < qb_usage) {
719                 /* Slave is reporting space usage in quota request and it turns
720                  * out to be using more quota space than owned, so we adjust
721                  * granted space regardless of the current state of affairs */
722                 repbody->qb_count = qb_usage - slv_granted;
723                 qmt_grant_lqes(env, &slv_granted, repbody->qb_count);
724         }
725
726         if (!req_is_acq(qb_flags) && !req_is_preacq(qb_flags))
727                 GOTO(out_write, rc = 0);
728
729         qmt_adjust_edquot_notify(env, qmt, now, qb_flags);
730         if (qti_lqes_edquot(env))
731                 /* no hope to claim further space back */
732                 GOTO(out_write, rc = -EDQUOT);
733
734         if (qmt_space_exhausted_lqes(env, now)) {
735                 /* might have some free space once rebalancing is completed */
736                 rc = req_is_acq(qb_flags) ? -EINPROGRESS : -EDQUOT;
737                 GOTO(out_write, rc);
738         }
739
740         if (req_is_preacq(qb_flags)) {
741                 /* slave would like to pre-acquire quota space. To do so, it
742                  * reports in qb_count how much spare quota space it owns and we
743                  * can grant back quota space which is consistent with qunit
744                  * value. */
745                 if (qb_count >= qti_lqes_min_qunit(env))
746                         /* slave already own the maximum it should */
747                         GOTO(out_write, rc = 0);
748
749                 count = qmt_lqes_alloc_expand(env, slv_granted, qb_count);
750                 if (count == 0)
751                         GOTO(out_write, rc = -EDQUOT);
752
753                 repbody->qb_count += count;
754                 qmt_grant_lqes(env, &slv_granted, count);
755                 GOTO(out_write, rc = 0);
756         }
757
758         /* processing acquire request with clients waiting */
759         if (qmt_lqes_cannot_grant(env, qb_count)) {
760                 /* cannot grant as much as asked, but can still afford to grant
761                  * some quota space back */
762                 count = qmt_lqes_grant_some_quota(env);
763                 repbody->qb_count += count;
764                 qmt_grant_lqes(env, &slv_granted, count);
765                 GOTO(out_write, rc = 0);
766         }
767
768         /* Whouhou! we can satisfy the slave request! */
769         repbody->qb_count += qb_count;
770         qmt_grant_lqes(env, &slv_granted, qb_count);
771
772         /* Try to expand the acquired count for DQACQ */
773         count = qmt_lqes_alloc_expand(env, slv_granted, 0);
774         if (count != 0) {
775                 /* can even grant more than asked, it is like xmas ... */
776                 repbody->qb_count += count;
777                 qmt_grant_lqes(env, &slv_granted, count);
778                 GOTO(out_write, rc = 0);
779         }
780
781         GOTO(out_write, rc = 0);
782 out_write:
783         if (repbody->qb_count == 0)
784                 GOTO(out_locked, rc);
785
786         /* start/stop grace timer if required */
787         qmt_lqes_tune_grace(env, now);
788
789         /* Update slave index first since it is easier to roll back */
790         ret = qmt_slv_write(env, th, lqe, slv_obj, LQUOTA_BUMP_VER,
791                             &repbody->qb_slv_ver, slv_granted);
792         if (ret) {
793                 /* restore initial quota settings */
794                 qmt_restore_lqes(env);
795                 /* reset qb_count */
796                 repbody->qb_count = 0;
797                 GOTO(out_locked, rc = ret);
798         }
799
800         /* Update global index, no version bump needed */
801         ret = qmt_glb_write_lqes(env, th, 0, NULL);
802         if (ret) {
803                 rc = ret;
804                 /* restore initial quota settings */
805                 qmt_restore_lqes(env);
806                 /* reset qb_count */
807                 repbody->qb_count = 0;
808
809                 /* restore previous granted value */
810                 ret = qmt_slv_write(env, th, lqe, slv_obj, 0, NULL,
811                                     slv_granted_bck);
812                 if (ret) {
813                         LQUOTA_ERROR(lqe, "failed to restore initial slave "
814                                      "value rc:%d ret%d", rc, ret);
815                         LBUG();
816                 }
817                 qmt_adjust_edquot_notify(env, qmt, now, qb_flags);
818                 GOTO(out_locked, rc);
819         }
820
821         /* Total granted has been changed, let's try to adjust the qunit
822          * size according to the total granted & limits. */
823
824         /* clear/set edquot flag and notify slaves via glimpse if needed */
825         qmt_adjust_and_notify(env, qmt, now, qb_flags);
826 out_locked:
827         LQUOTA_DEBUG_LQES(env, "dqacq ends count:%llu ver:%llu rc:%d",
828                      repbody->qb_count, repbody->qb_slv_ver, rc);
829         qti_lqes_write_unlock(env);
830 out:
831         qti_lqes_restore_fini(env);
832
833         if (th != NULL && !IS_ERR(th))
834                 dt_trans_stop(env, qmt->qmt_child, th);
835
836         if (slv_obj != NULL && !IS_ERR(slv_obj))
837                 dt_object_put(env, slv_obj);
838
839         if ((req_is_acq(qb_flags) || req_is_preacq(qb_flags)) &&
840             OBD_FAIL_CHECK(OBD_FAIL_QUOTA_EDQUOT)) {
841                 /* introduce inconsistency between granted value in slave index
842                  * and slave index copy of slave */
843                 repbody->qb_count = 0;
844                 rc = -EDQUOT;
845         }
846
847         RETURN(rc);
848 }
849
850 /*
851  * Extract index from uuid or quota index file name.
852  *
853  * \param[in] uuid      uuid or quota index name(0x1020000-OST0001_UUID)
854  * \param[out] idx      pointer to save index
855  *
856  * \retval              slave type(QMT_STYPE_MDT or QMT_STYPE_OST)
857  * \retval -EINVAL      wrong uuid
858  */
859 int qmt_uuid2idx(struct obd_uuid *uuid, int *idx)
860 {
861         char *uuid_str, *name, *dash;
862         int rc = -EINVAL;
863
864         uuid_str = (char *)uuid->uuid;
865
866         if (strnlen(uuid_str, UUID_MAX) >= UUID_MAX) {
867                 CERROR("quota: UUID '%.*s' missing trailing NUL: rc = %d\n",
868                        UUID_MAX, uuid_str, rc);
869                 return rc;
870         }
871
872         dash = strrchr(uuid_str, '-');
873         name = dash + 1;
874         /* Going to get index from MDTXXXX/OSTXXXX. Thus uuid should
875          * have at least 8 bytes after '-': 3 for MDT/OST, 4 for index
876          * and 1 byte for null character. */
877         if (*dash != '-' || ((uuid_str + UUID_MAX - name) < 8)) {
878                 CERROR("quota: wrong UUID format '%s': rc = %d\n",
879                        uuid_str, rc);
880                 return rc;
881         }
882
883         rc = target_name2index(name, idx, NULL);
884         switch (rc) {
885         case LDD_F_SV_TYPE_MDT:
886                 rc = QMT_STYPE_MDT;
887                 break;
888         case LDD_F_SV_TYPE_OST:
889                 rc = QMT_STYPE_OST;
890                 break;
891         default:
892                 CERROR("quota: wrong UUID type '%s': rc = %d\n", uuid_str, rc);
893                 rc = -EINVAL;
894         }
895
896         RETURN(rc);
897 }
898
899 /*
900  * Handle quota request from slave.
901  *
902  * \param env  - is the environment passed by the caller
903  * \param ld   - is the lu device associated with the qmt
904  * \param req  - is the quota acquire request
905  */
906 static int qmt_dqacq(const struct lu_env *env, struct lu_device *ld,
907                      struct ptlrpc_request *req)
908 {
909         struct qmt_device *qmt = lu2qmt_dev(ld);
910         struct quota_body *qbody, *repbody;
911         struct obd_uuid *uuid;
912         struct ldlm_lock *lock;
913         int rtype, qtype;
914         int rc, idx, stype;
915         ENTRY;
916
917         qbody = req_capsule_client_get(&req->rq_pill, &RMF_QUOTA_BODY);
918         if (qbody == NULL)
919                 RETURN(err_serious(-EPROTO));
920
921         repbody = req_capsule_server_get(&req->rq_pill, &RMF_QUOTA_BODY);
922         if (repbody == NULL)
923                 RETURN(err_serious(-EFAULT));
924
925         /* verify if global lock is stale */
926         if (!lustre_handle_is_used(&qbody->qb_glb_lockh))
927                 RETURN(-ENOLCK);
928
929         lock = ldlm_handle2lock(&qbody->qb_glb_lockh);
930         if (lock == NULL)
931                 RETURN(-ENOLCK);
932         LDLM_LOCK_PUT(lock);
933
934         uuid = &req->rq_export->exp_client_uuid;
935         stype = qmt_uuid2idx(uuid, &idx);
936         if (stype < 0)
937                 RETURN(stype);
938
939         if (req_is_rel(qbody->qb_flags) + req_is_acq(qbody->qb_flags) +
940             req_is_preacq(qbody->qb_flags) > 1) {
941                 CERROR("%s: malformed quota request with conflicting flags set "
942                        "(%x) from slave %s\n", qmt->qmt_svname,
943                        qbody->qb_flags, obd_uuid2str(uuid));
944                 RETURN(-EPROTO);
945         }
946
947         if (req_is_acq(qbody->qb_flags) || req_is_preacq(qbody->qb_flags)) {
948                 /* acquire and pre-acquire should use a valid ID lock */
949
950                 if (!lustre_handle_is_used(&qbody->qb_lockh))
951                         RETURN(-ENOLCK);
952
953                 lock = ldlm_handle2lock(&qbody->qb_lockh);
954                 if (lock == NULL)
955                         /* no lock associated with this handle */
956                         RETURN(-ENOLCK);
957
958                 LDLM_DEBUG(lock, "%sacquire request",
959                            req_is_preacq(qbody->qb_flags) ? "pre" : "");
960
961                 if (!obd_uuid_equals(&lock->l_export->exp_client_uuid, uuid)) {
962                         /* sorry, no way to cheat ... */
963                         LDLM_LOCK_PUT(lock);
964                         RETURN(-ENOLCK);
965                 }
966
967                 if (ldlm_is_ast_sent(lock)) {
968                         struct ptlrpc_service_part *svc;
969                         timeout_t timeout;
970
971                         svc = req->rq_rqbd->rqbd_svcpt;
972                         timeout = at_est2timeout(at_get(&svc->scp_at_estimate));
973                         timeout += (ldlm_bl_timeout(lock) >> 1);
974
975                         /* lock is being cancelled, prolong timeout */
976                         ldlm_refresh_waiting_lock(lock, timeout);
977                 }
978                 LDLM_LOCK_PUT(lock);
979         }
980
981         /* extract quota information from global index FID packed in the
982          * request */
983         rc = lquota_extract_fid(&qbody->qb_fid, &rtype, &qtype);
984         if (rc)
985                 RETURN(-EINVAL);
986
987         /* Find the quota entry associated with the quota id */
988         rc = qmt_pool_lqes_lookup(env, qmt, rtype, stype, qtype,
989                                   &qbody->qb_id, NULL, idx);
990         if (rc)
991                 RETURN(rc);
992
993         rc = qmt_dqacq0(env, qmt, uuid, qbody->qb_flags,
994                         qbody->qb_count, qbody->qb_usage, repbody);
995
996         if (lustre_handle_is_used(&qbody->qb_lockh))
997                 /* return current qunit value only to slaves owning an per-ID
998                  * quota lock. For enqueue, the qunit value will be returned in
999                  * the LVB */
1000                 repbody->qb_qunit = qti_lqes_min_qunit(env);
1001         CDEBUG(D_QUOTA, "qmt_dqacq return qb_qunit %llu qb_count %llu\n",
1002                repbody->qb_qunit, repbody->qb_count);
1003         qti_lqes_fini(env);
1004         RETURN(rc);
1005 }
1006
1007 /* Vector of quota request handlers. This vector is used by the MDT to forward
1008  * requests to the quota master. */
1009 struct qmt_handlers qmt_hdls = {
1010         /* quota request handlers */
1011         .qmth_quotactl          = qmt_quotactl,
1012         .qmth_dqacq             = qmt_dqacq,
1013
1014         /* ldlm handlers */
1015         .qmth_intent_policy     = qmt_intent_policy,
1016         .qmth_lvbo_init         = qmt_lvbo_init,
1017         .qmth_lvbo_update       = qmt_lvbo_update,
1018         .qmth_lvbo_size         = qmt_lvbo_size,
1019         .qmth_lvbo_fill         = qmt_lvbo_fill,
1020         .qmth_lvbo_free         = qmt_lvbo_free,
1021 };
1022 EXPORT_SYMBOL(qmt_hdls);