Whamcloud - gitweb
c2bb92750efae8761c27d965e181fa5da469c86e
[fs/lustre-release.git] / lustre / quota / qmt_entry.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; if not, write to the
18  * Free Software Foundation, Inc., 59 Temple Place - Suite 330,
19  * Boston, MA 021110-1307, USA
20  *
21  * GPL HEADER END
22  */
23 /*
24  * Copyright (c) 2012, 2016, Intel Corporation.
25  * Use is subject to license terms.
26  *
27  * Author: Johann Lombardi <johann.lombardi@intel.com>
28  * Author: Niu    Yawei    <yawei.niu@intel.com>
29  */
30
31 #define DEBUG_SUBSYSTEM S_LQUOTA
32
33 #include "qmt_internal.h"
34
35 /*
36  * Initialize qmt-specific fields of quota entry.
37  *
38  * \param lqe - is the quota entry to initialize
39  * \param arg - is the pointer to the qmt_pool_info structure
40  */
41 static void qmt_lqe_init(struct lquota_entry *lqe, void *arg)
42 {
43         LASSERT(lqe_is_master(lqe));
44
45         lqe->lqe_revoke_time = 0;
46         init_rwsem(&lqe->lqe_sem);
47 }
48
49 /* Apply the default quota setting to the specified quota entry
50  *
51  * \param env           - is the environment passed by the caller
52  * \param pool          - is the quota pool of the quota entry
53  * \param lqe           - is the lquota_entry object to apply default quota on
54  * \param create_record - if true, an global quota record will be created and
55  *                        write to the disk.
56  *
57  * \retval 0            : success
58  * \retval -ve          : other appropriate errors
59  */
60 int qmt_lqe_set_default(const struct lu_env *env, struct qmt_pool_info *pool,
61                         struct lquota_entry *lqe, bool create_record)
62 {
63         struct lquota_entry     *lqe_def;
64         int                     rc = 0;
65
66         ENTRY;
67
68         if (lqe->lqe_id.qid_uid == 0)
69                 RETURN(0);
70
71         lqe_def = pool->qpi_grace_lqe[lqe_qtype(lqe)];
72
73         LQUOTA_DEBUG(lqe, "inherit default quota");
74
75         lqe->lqe_is_default = true;
76         lqe->lqe_hardlimit = lqe_def->lqe_hardlimit;
77         lqe->lqe_softlimit = lqe_def->lqe_softlimit;
78
79         if (create_record) {
80                 lqe->lqe_uptodate = true;
81                 rc = qmt_set_with_lqe(env, pool->qpi_qmt, lqe, 0, 0,
82                                       LQUOTA_GRACE_FLAG(0, LQUOTA_FLAG_DEFAULT),
83                                       QIF_TIMES, true, false);
84
85                 if (rc != 0)
86                         LQUOTA_ERROR(lqe, "failed to create the global quota"
87                                      " record: %d", rc);
88         }
89
90         if (lqe->lqe_hardlimit == 0 && lqe->lqe_softlimit == 0)
91                 lqe->lqe_enforced = false;
92         else
93                 lqe->lqe_enforced = true;
94
95         RETURN(rc);
96 }
97
98 /*
99  * Update a lquota entry. This is done by reading quota settings from the global
100  * index. The lquota entry must be write locked.
101  *
102  * \param env - the environment passed by the caller
103  * \param lqe - is the quota entry to refresh
104  * \param arg - is the pointer to the qmt_pool_info structure
105  * \param find - don't create lqe on disk in case of ENOENT if true
106  */
107 static int qmt_lqe_read(const struct lu_env *env, struct lquota_entry *lqe,
108                         void *arg, bool find)
109 {
110         struct qmt_thread_info  *qti = qmt_info(env);
111         struct qmt_pool_info    *pool = (struct qmt_pool_info *)arg;
112         int                      rc;
113         ENTRY;
114
115         LASSERT(lqe_is_master(lqe));
116
117         /* read record from disk */
118         rc = lquota_disk_read(env, pool->qpi_glb_obj[lqe->lqe_site->lqs_qtype],
119                               &lqe->lqe_id, (struct dt_rec *)&qti->qti_glb_rec);
120
121         switch (rc) {
122         case -ENOENT:
123                 if (find)
124                         RETURN(-ENOENT);
125                 qmt_lqe_set_default(env, pool, lqe, true);
126                 break;
127         case 0:
128                 /* copy quota settings from on-disk record */
129                 lqe->lqe_granted   = qti->qti_glb_rec.qbr_granted;
130                 lqe->lqe_hardlimit = qti->qti_glb_rec.qbr_hardlimit;
131                 lqe->lqe_softlimit = qti->qti_glb_rec.qbr_softlimit;
132                 lqe->lqe_gracetime = LQUOTA_GRACE(qti->qti_glb_rec.qbr_time);
133
134                 if (lqe->lqe_hardlimit == 0 && lqe->lqe_softlimit == 0 &&
135                     (LQUOTA_FLAG(qti->qti_glb_rec.qbr_time) &
136                      LQUOTA_FLAG_DEFAULT))
137                         qmt_lqe_set_default(env, pool, lqe, false);
138                 break;
139         default:
140                 LQUOTA_ERROR(lqe, "failed to read quota entry from disk, rc:%d",
141                              rc);
142                 RETURN(rc);
143         }
144
145         if (lqe->lqe_id.qid_uid == 0 ||
146             (lqe->lqe_hardlimit == 0 && lqe->lqe_softlimit == 0))
147                 /* {hard,soft}limit=0 means no quota enforced */
148                 lqe->lqe_enforced = false;
149         else
150                 lqe->lqe_enforced  = true;
151
152         if (qmt_pool_global(pool))
153                 lqe->lqe_is_global = 1;
154
155         LQUOTA_DEBUG(lqe, "read");
156         RETURN(0);
157 }
158
159 /*
160  * Print lqe information for debugging.
161  *
162  * \param lqe - is the quota entry to debug
163  * \param arg - is the pointer to the qmt_pool_info structure
164  * \param msgdata - debug message
165  * \param fmt     - format of debug message
166  */
167 static void qmt_lqe_debug(struct lquota_entry *lqe, void *arg,
168                           struct libcfs_debug_msg_data *msgdata,
169                           struct va_format *vaf)
170 {
171         struct qmt_pool_info    *pool = (struct qmt_pool_info *)arg;
172
173         libcfs_debug_msg(msgdata,
174                          "%pV qmt:%s pool:%s-%s id:%llu enforced:%d hard:%llu soft:%llu granted:%llu time:%llu qunit: %llu edquot:%d may_rel:%llu revoke:%lld default:%s\n",
175                          vaf, pool->qpi_qmt->qmt_svname,
176                          RES_NAME(pool->qpi_rtype),
177                          pool->qpi_name,
178                          lqe->lqe_id.qid_uid, lqe->lqe_enforced,
179                          lqe->lqe_hardlimit, lqe->lqe_softlimit,
180                          lqe->lqe_granted, lqe->lqe_gracetime,
181                          lqe->lqe_qunit, lqe->lqe_edquot, lqe->lqe_may_rel,
182                          lqe->lqe_revoke_time,
183                          lqe->lqe_is_default ? "yes" : "no");
184 }
185
186 /*
187  * Vector of quota entry operations supported on the master
188  */
189 const struct lquota_entry_operations qmt_lqe_ops = {
190         .lqe_init       = qmt_lqe_init,
191         .lqe_read       = qmt_lqe_read,
192         .lqe_debug      = qmt_lqe_debug,
193 };
194
195 /*
196  * Reserve enough credits to update records in both the global index and
197  * the slave index identified by \slv_obj
198  *
199  * \param env     - is the environment passed by the caller
200  * \param lqe     - is the quota entry associated with the identifier
201  *                  subject to the change. If it is NULL lqes array is
202  *                  taken from env with qti_lqes_env(env).
203  * \param slv_obj - is the dt_object associated with the index file
204  * \param sync    - make transaction sync if true
205  */
206 struct thandle *qmt_trans_start_with_slv(const struct lu_env *env,
207                                          struct lquota_entry *lqe,
208                                          struct dt_object *slv_obj,
209                                          bool sync)
210 {
211         struct qmt_device       *qmt;
212         struct thandle          *th;
213         struct lquota_entry     **lqes;
214         struct qmt_lqe_restore  *restore;
215         int                      rc, i, lqes_cnt;
216         ENTRY;
217
218         restore = qti_lqes_rstr(env);
219         if (!lqe) {
220                 lqes_cnt = qti_lqes_cnt(env);
221                 lqes = qti_lqes(env);
222         } else {
223                 lqes_cnt = 1;
224                 lqes = &lqe;
225         }
226
227         /* qmt is the same for all lqes, so take it from the 1st */
228         qmt = lqe2qpi(lqes[0])->qpi_qmt;
229
230         if (slv_obj != NULL)
231                 LQUOTA_DEBUG(lqes[0], "declare write for slv "DFID,
232                              PFID(lu_object_fid(&slv_obj->do_lu)));
233
234         /* start transaction */
235         th = dt_trans_create(env, qmt->qmt_child);
236         if (IS_ERR(th))
237                 RETURN(th);
238
239         if (sync)
240                 /* quota settings on master are updated synchronously for the
241                  * time being */
242                 th->th_sync = 1;
243
244         /* reserve credits for global index update */
245         for (i = 0; i < lqes_cnt; i++) {
246                 rc = lquota_disk_declare_write(env, th,
247                                                LQE_GLB_OBJ(lqes[i]),
248                                                &lqes[i]->lqe_id);
249                 if (rc)
250                         GOTO(out, rc);
251         }
252
253         if (slv_obj != NULL) {
254                 /* reserve credits for slave index update */
255                 rc = lquota_disk_declare_write(env, th, slv_obj,
256                                                &lqes[0]->lqe_id);
257                 if (rc)
258                         GOTO(out, rc);
259         }
260
261         /* start transaction */
262         rc = dt_trans_start_local(env, qmt->qmt_child, th);
263         if (rc)
264                 GOTO(out, rc);
265
266         EXIT;
267 out:
268         if (rc) {
269                 dt_trans_stop(env, qmt->qmt_child, th);
270                 th = ERR_PTR(rc);
271                 LQUOTA_ERROR(lqes[0], "failed to slv declare write for "DFID
272                              ", rc:%d", PFID(lu_object_fid(&slv_obj->do_lu)),
273                              rc);
274         } else {
275                 for (i = 0; i < lqes_cnt; i++) {
276                         restore[i].qlr_hardlimit = lqes[i]->lqe_hardlimit;
277                         restore[i].qlr_softlimit = lqes[i]->lqe_softlimit;
278                         restore[i].qlr_gracetime = lqes[i]->lqe_gracetime;
279                         restore[i].qlr_granted   = lqes[i]->lqe_granted;
280                         restore[i].qlr_qunit     = lqes[i]->lqe_qunit;
281                 }
282         }
283         return th;
284 }
285
286 /*
287  * Reserve enough credits to update a record in the global index
288  *
289  * \param env     - is the environment passed by the caller
290  * \param lqe     - is the quota entry to be modified in the global index
291  * \param restore - is a temporary storage for current quota settings which will
292  *                  be restored if something goes wrong at index update time.
293  */
294 struct thandle *qmt_trans_start(const struct lu_env *env,
295                                 struct lquota_entry *lqe)
296 {
297         LQUOTA_DEBUG(lqe, "declare write");
298         return qmt_trans_start_with_slv(env, lqe, NULL, true);
299 }
300
301 int qmt_glb_write_lqes(const struct lu_env *env, struct thandle *th,
302                        __u32 flags, __u64 *ver)
303 {
304         int i, rc;
305         rc = 0;
306
307         for (i = 0; i < qti_lqes_cnt(env); i++) {
308                 rc = qmt_glb_write(env, th, qti_lqes(env)[i], flags, ver);
309                 if (rc)
310                         break;
311         }
312         return rc;
313 }
314
315 /*
316  * Update record associated with a quota entry in the global index.
317  * If LQUOTA_BUMP_VER is set, then the global index version must also be
318  * bumped.
319  * The entry must be at least read locked, dirty and up-to-date.
320  *
321  * \param env   - the environment passed by the caller
322  * \param th    - is the transaction handle to be used for the disk writes
323  * \param lqe   - is the quota entry to udpate
324  * \param obj   - is the dt_object associated with the index file
325  * \param flags - can be LQUOTA_BUMP_VER or LQUOTA_SET_VER.
326  * \param ver   - is used to return the new version of the index.
327  *
328  * \retval      - 0 on success and lqe dirty flag cleared,
329  *                appropriate error on failure and uptodate flag cleared.
330  */
331 int qmt_glb_write(const struct lu_env *env, struct thandle *th,
332                   struct lquota_entry *lqe, __u32 flags, __u64 *ver)
333 {
334         struct qmt_thread_info  *qti = qmt_info(env);
335         struct lquota_glb_rec   *rec;
336         int                      rc;
337         ENTRY;
338
339         LASSERT(lqe != NULL);
340         LASSERT(lqe_is_master(lqe));
341         LASSERT(lqe_is_locked(lqe));
342         LASSERT(lqe->lqe_uptodate);
343         LASSERT((flags & ~(LQUOTA_BUMP_VER | LQUOTA_SET_VER)) == 0);
344
345         LQUOTA_DEBUG(lqe, "write glb");
346
347         /* never delete the entry even when the id isn't enforced and
348          * no any guota granted, otherwise, this entry will not be
349          * synced to slave during the reintegration. */
350         rec = &qti->qti_glb_rec;
351
352         /* fill global index with updated quota settings */
353         rec->qbr_granted   = lqe->lqe_granted;
354         if (lqe->lqe_is_default) {
355                 rec->qbr_hardlimit = 0;
356                 rec->qbr_softlimit = 0;
357                 rec->qbr_time      = LQUOTA_GRACE_FLAG(0, LQUOTA_FLAG_DEFAULT);
358         } else {
359                 rec->qbr_hardlimit = lqe->lqe_hardlimit;
360                 rec->qbr_softlimit = lqe->lqe_softlimit;
361                 rec->qbr_time      = lqe->lqe_gracetime;
362         }
363
364         /* write new quota settings */
365         rc = lquota_disk_write(env, th, LQE_GLB_OBJ(lqe), &lqe->lqe_id,
366                                (struct dt_rec *)rec, flags, ver);
367         if (rc)
368                 /* we failed to write the new quota settings to disk, report
369                  * error to caller who will restore the initial value */
370                 LQUOTA_ERROR(lqe, "failed to update global index, rc:%d", rc);
371
372         RETURN(rc);
373 }
374
375 /*
376  * Read from disk how much quota space is allocated to a slave.
377  * This is done by reading records from the dedicated slave index file.
378  * Return in \granted how much quota space is currently allocated to the
379  * slave.
380  * The entry must be at least read locked.
381  *
382  * \param env - the environment passed by the caller
383  * \param lqe_id - is the quota id associated with the identifier to look-up
384  *              in the slave index
385  * \param slv_obj - is the dt_object associated with the slave index
386  * \param granted - is the output parameter where to return how much space
387  *                  is granted to the slave.
388  *
389  * \retval    - 0 on success, appropriate error on failure
390  */
391 int qmt_slv_read(const struct lu_env *env, union lquota_id *qid,
392                  struct dt_object *slv_obj, __u64 *granted)
393 {
394         struct qmt_thread_info  *qti = qmt_info(env);
395         struct lquota_slv_rec   *slv_rec = &qti->qti_slv_rec;
396         int                      rc;
397         ENTRY;
398
399         CDEBUG(D_QUOTA, "read id:%llu form slv "DFID"\n",
400                qid->qid_uid, PFID(lu_object_fid(&slv_obj->do_lu)));
401
402         /* read slave record from disk */
403         rc = lquota_disk_read(env, slv_obj, qid,
404                               (struct dt_rec *)slv_rec);
405         switch (rc) {
406         case -ENOENT:
407                 *granted = 0;
408                 break;
409         case 0:
410                 /* extract granted from on-disk record */
411                 *granted = slv_rec->qsr_granted;
412                 break;
413         default:
414                 CERROR("Failed to read slave record for %llu from "DFID"\n",
415                        qid->qid_uid, PFID(lu_object_fid(&slv_obj->do_lu)));
416                 RETURN(rc);
417         }
418
419         CDEBUG(D_QUOTA, "Successful slv read %llu\n", *granted);
420
421         RETURN(0);
422 }
423
424 /*
425  * Update record in slave index file.
426  * The entry must be at least read locked.
427  *
428  * \param env - the environment passed by the caller
429  * \param th  - is the transaction handle to be used for the disk writes
430  * \param lqe - is the dirty quota entry which will be updated at the same time
431  *              as the slave index
432  * \param slv_obj - is the dt_object associated with the slave index
433  * \param flags - can be LQUOTA_BUMP_VER or LQUOTA_SET_VER.
434  * \param ver   - is used to return the new version of the index.
435  * \param granted - is the new amount of quota space owned by the slave
436  *
437  * \retval    - 0 on success, appropriate error on failure
438  */
439 int qmt_slv_write(const struct lu_env *env, struct thandle *th,
440                   struct lquota_entry *lqe, struct dt_object *slv_obj,
441                   __u32 flags, __u64 *ver, __u64 granted)
442 {
443         struct qmt_thread_info  *qti = qmt_info(env);
444         struct lquota_slv_rec   *rec;
445         int                      rc;
446         ENTRY;
447
448         LASSERT(lqe != NULL);
449         LASSERT(lqe_is_master(lqe));
450         LASSERT(lqe_is_locked(lqe));
451
452         LQUOTA_DEBUG(lqe, "write slv "DFID" granted:%llu",
453                      PFID(lu_object_fid(&slv_obj->do_lu)), granted);
454
455         /* never delete the entry, otherwise, it'll not be transferred
456          * to slave during reintegration. */
457         rec = &qti->qti_slv_rec;
458
459         /* updated space granted to this slave */
460         rec->qsr_granted = granted;
461
462         /* write new granted space */
463         rc = lquota_disk_write(env, th, slv_obj, &lqe->lqe_id,
464                                (struct dt_rec *)rec, flags, ver);
465         if (rc) {
466                 LQUOTA_ERROR(lqe,
467                              "failed to update slave index "DFID" granted:%llu",
468                              PFID(lu_object_fid(&slv_obj->do_lu)),
469                              granted);
470                 RETURN(rc);
471         }
472
473         RETURN(0);
474 }
475
476 /*
477  * Check whether new limits are valid for this pool
478  *
479  * \param lqe  - is the quota entry subject to the setquota
480  * \param hard - is the new hard limit
481  * \param soft - is the new soft limit
482  */
483 int qmt_validate_limits(struct lquota_entry *lqe, __u64 hard, __u64 soft)
484 {
485         ENTRY;
486
487         if (hard != 0 && soft > hard)
488                 /* soft limit must be less than hard limit */
489                 RETURN(-EINVAL);
490         RETURN(0);
491 }
492
493 /*
494  * Set/clear edquot flag after quota space allocation/release or settings
495  * change. Slaves will be notified of changes via glimpse on per-ID lock
496  *
497  * \param lqe - is the quota entry to check
498  * \param now - is the current time in second used for grace time managment
499  */
500 bool qmt_adjust_edquot(struct lquota_entry *lqe, __u64 now)
501 {
502         struct qmt_pool_info    *pool = lqe2qpi(lqe);
503         ENTRY;
504
505         if (!lqe->lqe_enforced || lqe->lqe_id.qid_uid == 0)
506                 RETURN(false);
507
508         if (!lqe->lqe_edquot) {
509                 /* space exhausted flag not set, let's check whether it is time
510                  * to set the flag */
511
512                 if (!qmt_space_exhausted(lqe, now))
513                         /* the qmt still has available space */
514                         RETURN(false);
515
516                 /* See comment in qmt_adjust_qunit(). LU-4139 */
517                 if (qmt_hard_exhausted(lqe) ||
518                     pool->qpi_rtype != LQUOTA_RES_DT) {
519                         time64_t lapse;
520
521                         /* we haven't reached the minimal qunit yet so there is
522                          * still hope that the rebalancing process might free
523                          * up some quota space */
524                         if (lqe->lqe_qunit != pool->qpi_least_qunit)
525                                 RETURN(false);
526
527                         /* least qunit value not sent to all slaves yet */
528                         if (lqe->lqe_revoke_time == 0)
529                                 RETURN(false);
530
531                         /* Let's give more time to slave to release space */
532                         lapse = ktime_get_seconds() - QMT_REBA_TIMEOUT;
533                         if (lqe->lqe_may_rel != 0 && lqe->lqe_revoke_time > lapse)
534                                 RETURN(false);
535                 } else {
536                         if (lqe->lqe_qunit > pool->qpi_soft_least_qunit)
537                                 RETURN(false);
538                 }
539
540                 /* set edquot flag */
541                 lqe->lqe_edquot = true;
542         } else {
543                 /* space exhausted flag set, let's check whether it is time to
544                  * clear it */
545
546                 if (qmt_space_exhausted(lqe, now))
547                         /* the qmt still has not space */
548                         RETURN(false);
549
550                 if (lqe->lqe_hardlimit != 0 &&
551                     lqe->lqe_granted + pool->qpi_least_qunit >
552                                                         lqe->lqe_hardlimit)
553                         /* we clear the flag only once at least one least qunit
554                          * is available */
555                         RETURN(false);
556
557                 /* clear edquot flag */
558                 lqe->lqe_edquot = false;
559         }
560
561         LQUOTA_DEBUG(lqe, "changing edquot flag");
562
563         /* let's notify slave by issuing glimpse on per-ID lock.
564          * the rebalance thread will take care of this */
565         RETURN(true);
566 }
567
568 /* Using least_qunit when over block softlimit will seriously impact the
569  * write performance, we need to do some special tweaking on that. */
570 static __u64 qmt_calc_softlimit(struct lquota_entry *lqe, bool *oversoft)
571 {
572         struct qmt_pool_info *pool = lqe2qpi(lqe);
573
574         LASSERT(lqe->lqe_softlimit != 0);
575         *oversoft = false;
576         /* No need to do special tweaking for inode limit */
577         if (pool->qpi_rtype != LQUOTA_RES_DT)
578                 return lqe->lqe_softlimit;
579
580         if (lqe->lqe_granted <= lqe->lqe_softlimit +
581                                 pool->qpi_soft_least_qunit) {
582                 return lqe->lqe_softlimit;
583         } else if (lqe->lqe_hardlimit != 0) {
584                 *oversoft = true;
585                 return lqe->lqe_hardlimit;
586         } else {
587                 *oversoft = true;
588                 return 0;
589         }
590 }
591
592 /*
593  * Try to grant more quota space back to slave.
594  *
595  * \param lqe     - is the quota entry for which we would like to allocate more
596  *                  space
597  * \param granted - is how much was already granted as part of the request
598  *                  processing
599  * \param spare   - is how much unused quota space the slave already owns
600  *
601  * \retval return how additional space can be granted to the slave
602  */
603 __u64 qmt_alloc_expand(struct lquota_entry *lqe, __u64 granted, __u64 spare)
604 {
605         struct qmt_pool_info    *pool = lqe2qpi(lqe);
606         __u64                    remaining, qunit;
607         int                      slv_cnt;
608
609         LASSERT(lqe->lqe_enforced && lqe->lqe_qunit != 0);
610
611         slv_cnt = qpi_slv_nr(lqe2qpi(lqe), lqe_qtype(lqe));
612         qunit = lqe->lqe_qunit;
613
614         /* See comment in qmt_adjust_qunit(). LU-4139. */
615         if (lqe->lqe_softlimit != 0) {
616                 bool oversoft;
617                 remaining = qmt_calc_softlimit(lqe, &oversoft);
618                 if (remaining == 0)
619                         remaining = lqe->lqe_granted +
620                                     pool->qpi_soft_least_qunit;
621         } else {
622                 remaining = lqe->lqe_hardlimit;
623         }
624
625         if (lqe->lqe_granted >= remaining)
626                 RETURN(0);
627
628         remaining -= lqe->lqe_granted;
629
630         do {
631                 if (spare >= qunit)
632                         break;
633
634                 granted &= (qunit - 1);
635
636                 if (remaining > (slv_cnt * qunit) >> 1) {
637                         /* enough room to grant more space w/o additional
638                          * shrinking ... at least for now */
639                         remaining -= (slv_cnt * qunit) >> 1;
640                 } else if (qunit != pool->qpi_least_qunit) {
641                         qunit >>= 2;
642                         continue;
643                 }
644
645                 granted &= (qunit - 1);
646                 if (spare > 0)
647                         RETURN(min_t(__u64, qunit - spare, remaining));
648                 else
649                         RETURN(min_t(__u64, qunit - granted, remaining));
650         } while (qunit >= pool->qpi_least_qunit);
651
652         RETURN(0);
653 }
654
655 /*
656  * Adjust qunit size according to quota limits and total granted count.
657  * The caller must have locked the lqe.
658  *
659  * \param env - the environment passed by the caller
660  * \param lqe - is the qid entry to be adjusted
661  * \retval true - need reseed glbe array
662  */
663 bool qmt_adjust_qunit(const struct lu_env *env, struct lquota_entry *lqe)
664 {
665         struct qmt_pool_info    *pool = lqe2qpi(lqe);
666         bool                     need_reseed = false;
667         int                      slv_cnt;
668         __u64                    qunit, limit, qunit2 = 0;
669         ENTRY;
670
671         LASSERT(lqe_is_locked(lqe));
672
673         if (!lqe->lqe_enforced || lqe->lqe_id.qid_uid == 0)
674                 /* no quota limits */
675                 RETURN(need_reseed);
676
677         /* record how many slaves have already registered */
678         slv_cnt = qpi_slv_nr(pool, lqe_qtype(lqe));
679         if (slv_cnt == 0) {
680                 /* Pool hasn't slaves anymore. Qunit will be adjusted
681                  * again when new slaves would be added. */
682                 if (lqe->lqe_qunit) {
683                         qunit = 0;
684                         GOTO(done, qunit);
685                 }
686                 /* wait for at least one slave to join */
687                 RETURN(need_reseed);
688         }
689
690         /* Qunit calculation is based on soft limit, if any, hard limit
691          * otherwise. This means that qunit is shrunk to the minimum when
692          * beyond the soft limit. This will impact performance, but that's the
693          * price of an accurate grace time management. */
694         if (lqe->lqe_softlimit != 0) {
695                 bool oversoft;
696                 /* As a compromise of write performance and the grace time
697                  * accuracy, the block qunit size will be shrunk to
698                  * qpi_soft_least_qunit when over softlimit. LU-4139. */
699                 limit = qmt_calc_softlimit(lqe, &oversoft);
700                 if (oversoft)
701                         qunit2 = pool->qpi_soft_least_qunit;
702                 if (limit == 0)
703                         GOTO(done, qunit = qunit2);
704         } else if (lqe->lqe_hardlimit != 0) {
705                 limit = lqe->lqe_hardlimit;
706         } else {
707                 LQUOTA_ERROR(lqe, "enforced bit set, but neither hard nor soft "
708                              "limit are set");
709                 RETURN(need_reseed);
710         }
711
712         qunit = lqe->lqe_qunit == 0 ? pool->qpi_least_qunit : lqe->lqe_qunit;
713
714         /* The qunit value is computed as follows: limit / (2 * slv_cnt).
715          * Then 75% of the quota space can be granted with current qunit value.
716          * The remaining 25% are then used with reduced qunit size (by a factor
717          * of 4) which is then divided in a similar manner.
718          *
719          * |---------------------limit---------------------|
720          * |-------limit / 2-------|-limit / 4-|-limit / 4-|
721          * |qunit|qunit|qunit|qunit|           |           |
722          * |----slv_cnt * qunit----|           |           |
723          * |-grow limit-|          |           |           |
724          * |--------------shrink limit---------|           |
725          * |---space granted in qunit chunks---|-remaining-|
726          *                                    /             \
727          *                                   /               \
728          *                                  /                 \
729          *                                 /                   \
730          *                                /                     \
731          *     qunit >>= 2;            |qunit*slv_cnt|qunit*slv_cnt|
732          *                             |---space in qunit---|remain|
733          *                                  ...                               */
734         if (qunit == pool->qpi_least_qunit ||
735             limit >= lqe->lqe_granted + ((slv_cnt * qunit) >> 1)) {
736                 /* current qunit value still fits, let's see if we can afford to
737                  * increase qunit now ...
738                  * To increase qunit again, we have to be under 25% */
739                 while (qunit && limit >= lqe->lqe_granted + 6 * qunit * slv_cnt)
740                         qunit <<= 2;
741
742                 if (!qunit) {
743                         qunit = limit;
744                         do_div(qunit, 2 * slv_cnt);
745                 }
746
747         } else {
748                 /* shrink qunit until we find a suitable value */
749                 while (qunit > pool->qpi_least_qunit &&
750                        limit < lqe->lqe_granted + ((slv_cnt * qunit) >> 1))
751                         qunit >>= 2;
752         }
753
754         if (qunit2 && qunit > qunit2)
755                 qunit = qunit2;
756 done:
757         if (lqe->lqe_qunit == qunit)
758                 /* keep current qunit */
759                 RETURN(need_reseed);
760
761         LQUOTA_DEBUG(lqe, "%s qunit to %llu",
762                      lqe->lqe_qunit < qunit ? "increasing" : "decreasing",
763                      qunit);
764
765         /* store new qunit value */
766         swap(lqe->lqe_qunit, qunit);
767
768         /* reseed glbe array and notify
769          * slave if qunit was shrinked */
770         need_reseed = true;
771         /* reset revoke time */
772         lqe->lqe_revoke_time = 0;
773
774         if (lqe->lqe_qunit >= qunit &&
775             (lqe->lqe_qunit == pool->qpi_least_qunit)) {
776                 /* initial qunit value is the smallest one */
777                 lqe->lqe_revoke_time = ktime_get_seconds();
778         }
779         RETURN(need_reseed);
780 }
781
782 bool qmt_adjust_edquot_qunit_notify(const struct lu_env *env,
783                                     struct qmt_device *qmt,
784                                     __u64 now, bool edquot,
785                                     bool qunit, __u32 qb_flags)
786 {
787         struct lquota_entry *lqe_gl, *lqe;
788         bool need_reseed = false;
789         int i;
790
791         lqe_gl = qti_lqes_glbl(env);
792
793         for (i = 0; i < qti_lqes_cnt(env); i++) {
794                 lqe = qti_lqes(env)[i];
795                 if (qunit)
796                         need_reseed |= qmt_adjust_qunit(env, lqe);
797                 if (edquot)
798                         need_reseed |= qmt_adjust_edquot(lqe, now);
799         }
800
801         LASSERT(lqe_gl);
802         if (!lqe_gl->lqe_glbl_data &&
803             (req_has_rep(qb_flags) || req_is_rel(qb_flags))) {
804                 if (need_reseed)
805                         CDEBUG(D_QUOTA,
806                                "%s: can not notify - lge_glbl_data is not set\n",
807                                qmt->qmt_svname);
808                 return need_reseed;
809         }
810
811         if (lqe_gl->lqe_glbl_data && need_reseed) {
812                 qmt_seed_glbe_all(env, lqe_gl->lqe_glbl_data, qunit, edquot);
813                 qmt_id_lock_notify(qmt, lqe_gl);
814         }
815         return need_reseed;
816 }
817
818
819 /*
820  * Adjust qunit & edquot flag in case it wasn't initialized already (e.g.
821  * limit set while no slaves were connected yet)
822  */
823 bool qmt_revalidate(const struct lu_env *env, struct lquota_entry *lqe)
824 {
825         bool need_notify = false;
826
827         if (lqe->lqe_qunit == 0) {
828                 /* lqe was read from disk, but neither qunit, nor edquot flag
829                  * were initialized */
830                 need_notify = qmt_adjust_qunit(env, lqe);
831                 if (lqe->lqe_qunit != 0)
832                         need_notify |= qmt_adjust_edquot(lqe,
833                                                 ktime_get_real_seconds());
834         }
835
836         return need_notify;
837 }
838
839 void qmt_revalidate_lqes(const struct lu_env *env,
840                          struct qmt_device *qmt, __u32 qb_flags)
841 {
842         struct lquota_entry *lqe_gl = qti_lqes_glbl(env);
843         bool need_notify = false;
844         int i;
845
846         for (i = 0; i < qti_lqes_cnt(env); i++)
847                 need_notify |= qmt_revalidate(env, qti_lqes(env)[i]);
848
849         /* There could be no ID lock to the moment of reconciliation.
850          * As a result lqe global data is not initialised yet. It is ok
851          * for release and report requests. */
852         if (!lqe_gl->lqe_glbl_data &&
853             (req_is_rel(qb_flags) || req_has_rep(qb_flags)))
854                 return;
855
856         if (need_notify) {
857                 qmt_seed_glbe(env, lqe_gl->lqe_glbl_data);
858                 qmt_id_lock_notify(qmt, lqe_gl);
859         }
860 }
861
862 void qti_lqes_init(const struct lu_env *env)
863 {
864         struct qmt_thread_info  *qti = qmt_info(env);
865
866         qti->qti_lqes_cnt = 0;
867         qti->qti_glbl_lqe_idx = 0;
868         qti->qti_lqes_num = QMT_MAX_POOL_NUM;
869 }
870
871 int qti_lqes_add(const struct lu_env *env, struct lquota_entry *lqe)
872 {
873         struct qmt_thread_info  *qti = qmt_info(env);
874
875         if (qti->qti_lqes_cnt > qti->qti_lqes_num) {
876                 struct lquota_entry     **lqes;
877                 lqes = qti->qti_lqes;
878                 OBD_ALLOC(lqes, sizeof(lqe) * qti->qti_lqes_num * 2);
879                 if (!lqes)
880                         return -ENOMEM;
881                 memcpy(lqes, qti_lqes(env), qti->qti_lqes_cnt * sizeof(lqe));
882                 /* Don't need to free, if it is the very 1st allocation */
883                 if (qti->qti_lqes_num > QMT_MAX_POOL_NUM)
884                         OBD_FREE(qti->qti_lqes,
885                                  qti->qti_lqes_num * sizeof(lqe));
886                 qti->qti_lqes = lqes;
887                 qti->qti_lqes_num *= 2;
888         }
889
890         if (lqe->lqe_is_global)
891                 qti->qti_glbl_lqe_idx = qti->qti_lqes_cnt;
892         qti_lqes(env)[qti->qti_lqes_cnt++] = lqe;
893
894         /* The pool could be accessed directly from lqe, so take
895          * extra reference that is put in qti_lqes_fini */
896         qpi_getref(lqe2qpi(lqe));
897
898         CDEBUG(D_QUOTA, "LQE %p %lu is added, lqe_cnt %d lqes_num %d\n",
899                          lqe, (long unsigned)lqe->lqe_id.qid_uid,
900                          qti->qti_lqes_cnt, qti->qti_lqes_num);
901         LASSERT(qti->qti_lqes_num != 0);
902
903         return 0;
904 }
905
906 void qti_lqes_del(const struct lu_env *env, int index)
907 {
908         struct lquota_entry     **lqes;
909         int lqes_cnt = qti_lqes_cnt(env);
910         int lqep_size = sizeof(struct lquota_entry *);
911
912         if (index == 0) {
913                 /* We can't handle non global lqes correctly without
914                  * global lqe located at index 0. If we try to do so,
915                  * something goes wrong. */
916                 LQUOTA_ERROR(qti_lqes_glbl(env),
917                              "quota: cannot remove lqe at index 0 as it is global");
918                 LASSERT(qti_lqes_glbl(env)->lqe_is_global);
919                 return;
920         }
921         lqes = qti_lqes(env);
922         qpi_putref(env, lqe2qpi(lqes[index]));
923         lqe_putref(lqes[index]);
924         memcpy((unsigned char *)lqes + index * lqep_size,
925                (unsigned char *)lqes + (index + 1) * lqep_size,
926                (lqes_cnt - index - 1) * lqep_size);
927         qti_lqes_cnt(env)--;
928 }
929
930 void qti_lqes_fini(const struct lu_env *env)
931 {
932         struct qmt_thread_info  *qti = qmt_info(env);
933         struct lquota_entry     **lqes = qti->qti_lqes;
934         int i;
935
936         lqes = qti_lqes(env);
937         for (i = 0; i < qti->qti_lqes_cnt; i++) {
938                 qpi_putref(env, lqe2qpi(lqes[i]));
939                 lqe_putref(lqes[i]);
940         }
941
942         if (qti->qti_lqes_num > QMT_MAX_POOL_NUM)
943                 OBD_FREE(qti->qti_lqes,
944                          qti->qti_lqes_num * sizeof(struct lquota_entry *));
945
946         qti->qti_lqes_num = 0;
947 }
948
949 int qti_lqes_min_qunit(const struct lu_env *env)
950 {
951         int i, min, qunit;
952
953         for (i = 1, min = qti_lqe_qunit(env, 0); i < qti_lqes_cnt(env); i++) {
954                 qunit = qti_lqe_qunit(env, i);
955                 if (qunit < min)
956                         min = qunit;
957         }
958
959         return min;
960 }
961
962 int qti_lqes_edquot(const struct lu_env *env)
963 {
964         int i;
965
966         for (i = 0; i < qti_lqes_cnt(env); i++) {
967                 if (qti_lqes(env)[i]->lqe_edquot)
968                         return 1;
969         }
970
971         return 0;
972 }
973
974 int qti_lqes_restore_init(const struct lu_env *env)
975 {
976         int rc = 0;
977
978         if (qti_lqes_cnt(env) > QMT_MAX_POOL_NUM) {
979                 OBD_ALLOC(qmt_info(env)->qti_lqes_rstr,
980                           qti_lqes_cnt(env) * sizeof(struct qmt_lqe_restore));
981                 if (!qti_lqes_rstr(env))
982                         rc = -ENOMEM;
983         }
984
985         return rc;
986 }
987
988 void qti_lqes_restore_fini(const struct lu_env *env)
989 {
990         if (qti_lqes_cnt(env) > QMT_MAX_POOL_NUM)
991                 OBD_FREE(qmt_info(env)->qti_lqes_rstr,
992                          qti_lqes_cnt(env) * sizeof(struct qmt_lqe_restore));
993 }
994
995 void qti_lqes_write_lock(const struct lu_env *env)
996 {
997         int i;
998
999         for (i = 0; i < qti_lqes_cnt(env); i++)
1000                 lqe_write_lock(qti_lqes(env)[i]);
1001 }
1002
1003 void qti_lqes_write_unlock(const struct lu_env *env)
1004 {
1005         int i;
1006
1007         for (i = 0; i < qti_lqes_cnt(env); i++)
1008                 lqe_write_unlock(qti_lqes(env)[i]);
1009 }
1010
1011 #define QMT_INIT_SLV_CNT        64
1012 struct lqe_glbl_data *qmt_alloc_lqe_gd(struct qmt_pool_info *pool, int qtype)
1013 {
1014         struct lqe_glbl_data    *lgd;
1015         struct lqe_glbl_entry   *lqeg_arr;
1016         int                      slv_cnt, glbe_num;
1017
1018         OBD_ALLOC(lgd, sizeof(struct lqe_glbl_data));
1019         if (!lgd)
1020                 RETURN(NULL);
1021
1022         slv_cnt = qpi_slv_nr_by_rtype(pool, qtype);
1023
1024         glbe_num = slv_cnt < QMT_INIT_SLV_CNT ? QMT_INIT_SLV_CNT : slv_cnt;
1025         OBD_ALLOC(lqeg_arr, sizeof(struct lqe_glbl_entry) * glbe_num);
1026         if (!lqeg_arr) {
1027                 OBD_FREE(lgd, sizeof(struct lqe_glbl_data));
1028                 RETURN(NULL);
1029         }
1030
1031         CDEBUG(D_QUOTA, "slv_cnt %d glbe_num %d\n", slv_cnt, glbe_num);
1032
1033         lgd->lqeg_num_used = slv_cnt;
1034         lgd->lqeg_num_alloc = glbe_num;
1035         lgd->lqeg_arr = lqeg_arr;
1036
1037         RETURN(lgd);
1038 }
1039
1040 void qmt_free_lqe_gd(struct lqe_glbl_data *lgd)
1041 {
1042         OBD_FREE(lgd->lqeg_arr,
1043                  sizeof(struct lqe_glbl_entry) * lgd->lqeg_num_alloc);
1044         OBD_FREE(lgd, sizeof(struct lqe_glbl_data));
1045 }
1046
1047 void qmt_seed_glbe_all(const struct lu_env *env, struct lqe_glbl_data *lgd,
1048                        bool qunit, bool edquot)
1049 {
1050         struct rw_semaphore     *sem = NULL;
1051         struct qmt_pool_info    *qpi;
1052         int                      i, j, idx;
1053         ENTRY;
1054
1055         if (!qti_lqes_cnt(env))
1056                 RETURN_EXIT;
1057         /* lqes array is sorted by qunit - the first entry has minimum qunit.
1058          * Thus start seeding global qunit's array beginning from the 1st lqe
1059          * and appropriate pool. If pools overlapped, slaves from this
1060          * overlapping get minimum qunit value.
1061          * user1: pool1, pool2, pool_glbl;
1062          * pool1: OST1; user1_qunit = 10M;
1063          * pool2: OST0, OST1, OST2; user1_qunit = 30M;
1064          * pool_glbl: OST0, OST1, OST2, OST3; user1_qunit = 160M;
1065          * qunit array after seeding should be:
1066          * OST0: 30M; OST1: 10M; OST2: 30M; OST3: 160M; */
1067
1068         /* edquot resetup algorythm works fine
1069          * with not sorted lqes */
1070         if (qunit)
1071                 qmt_lqes_sort(env);
1072
1073         for (i = 0; i < lgd->lqeg_num_used; i++) {
1074                 lgd->lqeg_arr[i].lge_qunit_set = 0;
1075                 lgd->lqeg_arr[i].lge_qunit_nu = 0;
1076                 lgd->lqeg_arr[i].lge_edquot_nu = 0;
1077         }
1078
1079         for (i = 0; i < qti_lqes_cnt(env); i++) {
1080                 struct lquota_entry *lqe = qti_lqes(env)[i];
1081                 int slaves_cnt;
1082
1083                 CDEBUG(D_QUOTA, "lqes_cnt %d, i %d\n", qti_lqes_cnt(env), i);
1084                 qpi = lqe2qpi(lqe);
1085                 if (qmt_pool_global(qpi)) {
1086                         slaves_cnt = qpi_slv_nr_by_rtype(lqe2qpi(lqe),
1087                                                          lqe_qtype(lqe));
1088                 } else {
1089                         sem = qmt_sarr_rwsem(qpi);
1090                         down_read(sem);
1091                         slaves_cnt = qmt_sarr_count(qpi);
1092                 }
1093
1094                 for (j = 0; j < slaves_cnt; j++) {
1095                         idx = qmt_sarr_get_idx(qpi, j);
1096                         LASSERT(idx >= 0);
1097
1098                         if (edquot) {
1099                                 int lge_edquot, new_edquot, edquot_nu;
1100
1101                                 lge_edquot = lgd->lqeg_arr[idx].lge_edquot;
1102                                 edquot_nu = lgd->lqeg_arr[idx].lge_edquot_nu;
1103                                 new_edquot = lqe->lqe_edquot;
1104
1105                                 if (lge_edquot == new_edquot ||
1106                                     (edquot_nu && lge_edquot == 1))
1107                                         goto qunit_lbl;
1108                                 lgd->lqeg_arr[idx].lge_edquot = new_edquot;
1109                                 /* it is needed for the following case:
1110                                  * initial values for idx i -
1111                                  * lqe_edquot = 1, lqe_edquot_nu == 0;
1112                                  * 1: new_edquot == 0 ->
1113                                  *      lqe_edquot = 0, lqe_edquot_nu = 1;
1114                                  * 2: new_edquot == 1 ->
1115                                  *      lqe_edquot = 1, lqe_edquot_nu = 0;
1116                                  * At the 2nd iteration lge_edquot comes back
1117                                  * to 1, so no changes and we don't need
1118                                  * to notify slave. */
1119                                 lgd->lqeg_arr[idx].lge_edquot_nu = !edquot_nu;
1120                         }
1121 qunit_lbl:
1122                         if (qunit) {
1123                                 __u64 lge_qunit, new_qunit;
1124
1125                                 CDEBUG(D_QUOTA,
1126                                        "idx %d lge_qunit_set %d lge_qunit %llu new_qunit %llu\n",
1127                                        idx, lgd->lqeg_arr[idx].lge_qunit_set,
1128                                        lgd->lqeg_arr[idx].lge_qunit,
1129                                        lqe->lqe_qunit);
1130                                 /* lge for this idx is already set
1131                                  * on previous iteration */
1132                                 if (lgd->lqeg_arr[idx].lge_qunit_set)
1133                                         continue;
1134                                 lge_qunit = lgd->lqeg_arr[idx].lge_qunit;
1135                                 new_qunit = lqe->lqe_qunit;
1136                                 /* qunit could be not set,
1137                                  * so use global lqe's qunit */
1138                                 if (!new_qunit)
1139                                         continue;
1140
1141                                 if (lge_qunit != new_qunit)
1142                                         lgd->lqeg_arr[idx].lge_qunit =
1143                                                                 new_qunit;
1144
1145                                 /* TODO: initially slaves notification was done
1146                                  * only for qunit shrinking. Should we always
1147                                  * notify slaves with new qunit ? */
1148                                 if (lge_qunit > new_qunit)
1149                                         lgd->lqeg_arr[idx].lge_qunit_nu = 1;
1150                                 lgd->lqeg_arr[idx].lge_qunit_set = 1;
1151                         }
1152                 }
1153
1154                 if (!qmt_pool_global(qpi))
1155                         up_read(sem);
1156         }
1157         /* TODO: only for debug purposes - remove it later */
1158         for (i = 0; i < lgd->lqeg_num_used; i++)
1159                 CDEBUG(D_QUOTA,
1160                         "lgd ost %d, qunit %lu nu %d;  edquot %d nu %d\n",
1161                         i, (long unsigned)lgd->lqeg_arr[i].lge_qunit,
1162                         lgd->lqeg_arr[i].lge_qunit_nu,
1163                         lgd->lqeg_arr[i].lge_edquot,
1164                         lgd->lqeg_arr[i].lge_edquot_nu);
1165
1166         EXIT;
1167 }
1168
1169 void qmt_setup_lqe_gd(const struct lu_env *env, struct qmt_device *qmt,
1170                       struct lquota_entry *lqe, struct lqe_glbl_data *lgd,
1171                       int pool_type)
1172 {
1173         __u64                    qunit;
1174         bool                     edquot;
1175         int                      i;
1176
1177         qunit = lqe->lqe_qunit;
1178         edquot = lqe->lqe_edquot;
1179
1180         /* Firstly set all elements in array with
1181          * qunit and edquot of global pool */
1182         for (i = 0; i < lgd->lqeg_num_used; i++) {
1183                 lgd->lqeg_arr[i].lge_qunit = qunit;
1184                 lgd->lqeg_arr[i].lge_edquot = edquot;
1185                 /* It is the very first lvb setup - qunit and other flags
1186                  * will be sent to slaves during qmt_lvbo_fill. */
1187                 lgd->lqeg_arr[i].lge_qunit_nu = 0;
1188                 lgd->lqeg_arr[i].lge_edquot_nu = 0;
1189         }
1190
1191         qmt_pool_lqes_lookup_spec(env, qmt, pool_type,
1192                                   lqe_qtype(lqe), &lqe->lqe_id);
1193         qmt_seed_glbe(env, lgd);
1194
1195         lqe->lqe_glbl_data = lgd;
1196         qmt_id_lock_notify(qmt, lqe);
1197
1198         qti_lqes_fini(env);
1199 }