Whamcloud - gitweb
LU-601 mdd: Fix transaction credits
[fs/lustre-release.git] / lustre / mdd / mdd_trans.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
30  * Use is subject to license terms.
31  *
32  * Copyright (c) 2011 Whamcloud, Inc.
33  *
34  */
35 /*
36  * This file is part of Lustre, http://www.lustre.org/
37  * Lustre is a trademark of Sun Microsystems, Inc.
38  *
39  * lustre/mdd/mdd_trans.c
40  *
41  * Lustre Metadata Server (mdd) routines
42  *
43  * Author: Wang Di <wangdi@clusterfs.com>
44  */
45
46 #ifndef EXPORT_SYMTAB
47 # define EXPORT_SYMTAB
48 #endif
49 #define DEBUG_SUBSYSTEM S_MDS
50
51 #include <linux/module.h>
52 #ifdef HAVE_EXT4_LDISKFS
53 #include <ldiskfs/ldiskfs_jbd2.h>
54 #else
55 #include <linux/jbd.h>
56 #endif
57 #include <obd.h>
58 #include <obd_class.h>
59 #include <lustre_ver.h>
60 #include <obd_support.h>
61 #include <lprocfs_status.h>
62
63 #ifdef HAVE_EXT4_LDISKFS
64 #include <ldiskfs/ldiskfs.h>
65 #else
66 #include <linux/ldiskfs_fs.h>
67 #endif
68 #include <lustre_mds.h>
69 #include <lustre/lustre_idl.h>
70
71 #include "mdd_internal.h"
72
73 static int dto_txn_credits[DTO_NR];
74
75 int mdd_txn_start_cb(const struct lu_env *env, struct txn_param *param,
76                      void *cookie)
77 {
78         struct mdd_device *mdd = cookie;
79         struct obd_device *obd = mdd2obd_dev(mdd);
80         /* Each transaction updates lov objids, the credits should be added for
81          * this */
82         int blk, shift = mdd->mdd_dt_conf.ddp_block_shift;
83         blk = ((obd->u.mds.mds_lov_desc.ld_tgt_count * sizeof(obd_id) +
84                (1 << shift) - 1) >> shift) + 1;
85
86         /* add lov objids credits */
87         param->tp_credits += blk * dto_txn_credits[DTO_WRITE_BLOCK] +
88                              dto_txn_credits[DTO_WRITE_BASE];
89
90         return 0;
91 }
92
93 int mdd_txn_stop_cb(const struct lu_env *env, struct thandle *txn,
94                     void *cookie)
95 {
96         struct mdd_device *mdd = cookie;
97         struct obd_device *obd = mdd2obd_dev(mdd);
98
99         LASSERT(obd);
100         return mds_lov_write_objids(obd);
101 }
102
103 int mdd_txn_commit_cb(const struct lu_env *env, struct thandle *txn,
104                       void *cookie)
105 {
106         return 0;
107 }
108
109 void mdd_txn_param_build(const struct lu_env *env, struct mdd_device *mdd,
110                          enum mdd_txn_op op, int changelog_cnt)
111 {
112         LASSERT(0 <= op && op < MDD_TXN_LAST_OP);
113
114         txn_param_init(&mdd_env_info(env)->mti_param,
115                        mdd->mdd_tod[op].mod_credits);
116         if (changelog_cnt > 0) {
117                 txn_param_credit_add(&mdd_env_info(env)->mti_param,
118                                   changelog_cnt * dto_txn_credits[DTO_LOG_REC]);
119         }
120 }
121
122 int mdd_create_txn_param_build(const struct lu_env *env, struct mdd_device *mdd,
123                                struct lov_mds_md *lmm, enum mdd_txn_op op,
124                                int changelog_cnt)
125 {
126         int stripes = 0;
127         ENTRY;
128
129         LASSERT(op == MDD_TXN_CREATE_DATA_OP || op == MDD_TXN_MKDIR_OP);
130
131         if (lmm == NULL)
132                 GOTO(out, 0);
133         /* only replay create request will cause lov_objid update */
134         if (!mdd->mdd_obd_dev->obd_recovering)
135                 GOTO(out, 0);
136
137         /* add possible orphan unlink rec credits used in lov_objid update */
138         if (le32_to_cpu(lmm->lmm_magic) == LOV_MAGIC_V1) {
139                 stripes = le32_to_cpu(((struct lov_mds_md_v1*)lmm)
140                                       ->lmm_stripe_count);
141         } else if (le32_to_cpu(lmm->lmm_magic) == LOV_MAGIC_V3){
142                 stripes = le32_to_cpu(((struct lov_mds_md_v3*)lmm)
143                                       ->lmm_stripe_count);
144         } else {
145                 CERROR("Unknown lmm type %X\n", le32_to_cpu(lmm->lmm_magic));
146                 LBUG();
147         }
148 out:
149         mdd_txn_param_build(env, mdd, op, stripes + changelog_cnt);
150         RETURN(0);
151 }
152
153 int mdd_log_txn_param_build(const struct lu_env *env, struct md_object *obj,
154                             struct md_attr *ma, enum mdd_txn_op op,
155                             int changelog_cnt)
156 {
157         struct mdd_device *mdd = mdo2mdd(&md2mdd_obj(obj)->mod_obj);
158         int rc, stripe = 0;
159         ENTRY;
160
161         if (S_ISDIR(lu_object_attr(&obj->mo_lu)))
162                 GOTO(out, rc = 0);
163
164         LASSERT(op == MDD_TXN_UNLINK_OP || op == MDD_TXN_RENAME_OP ||
165                 op == MDD_TXN_RENAME_TGT_OP);
166         rc = mdd_lmm_get_locked(env, md2mdd_obj(obj), ma);
167         if (rc || !(ma->ma_valid & MA_LOV))
168                 GOTO(out, rc);
169
170         LASSERTF(le32_to_cpu(ma->ma_lmm->lmm_magic) == LOV_MAGIC_V1 ||
171                  le32_to_cpu(ma->ma_lmm->lmm_magic) == LOV_MAGIC_V3,
172                  "%08x", le32_to_cpu(ma->ma_lmm->lmm_magic));
173
174         if ((int)le32_to_cpu(ma->ma_lmm->lmm_stripe_count) < 0)
175                 stripe = mdd2obd_dev(mdd)->u.mds.mds_lov_desc.ld_tgt_count;
176         else
177                 stripe = le32_to_cpu(ma->ma_lmm->lmm_stripe_count);
178
179 out:
180         mdd_txn_param_build(env, mdd, op, stripe + changelog_cnt);
181
182         RETURN(rc);
183 }
184
185 int mdd_setattr_txn_param_build(const struct lu_env *env, struct md_object *obj,
186                                 struct md_attr *ma, enum mdd_txn_op op,
187                                 int changelog_cnt)
188 {
189         struct mdd_device *mdd = mdo2mdd(&md2mdd_obj(obj)->mod_obj);
190         ENTRY;
191
192         mdd_txn_param_build(env, mdd, op, changelog_cnt);
193         if (ma->ma_attr.la_valid & (LA_UID | LA_GID))
194                 txn_param_credit_add(&mdd_env_info(env)->mti_param,
195                                      dto_txn_credits[DTO_ATTR_SET_CHOWN]);
196
197         /* permission changes may require sync operation */
198         if (ma->ma_attr.la_valid & (LA_MODE|LA_UID|LA_GID) &&
199             mdd->mdd_sync_permission == 1)
200                 txn_param_sync(&mdd_env_info(env)->mti_param);
201
202         RETURN(0);
203 }
204
205 static void mdd_txn_init_dto_credits(const struct lu_env *env,
206                                      struct mdd_device *mdd, int *dto_credits)
207 {
208         int op, credits;
209         for (op = 0; op < DTO_NR; op++) {
210                 credits = mdd_child_ops(mdd)->dt_credit_get(env, mdd->mdd_child,
211                                                             op);
212                 LASSERT(credits >= 0);
213                 dto_txn_credits[op] = credits;
214         }
215 }
216
217 int mdd_txn_init_credits(const struct lu_env *env, struct mdd_device *mdd)
218 {
219         int op;
220
221         /* Init credits for each ops. */
222         mdd_txn_init_dto_credits(env, mdd, dto_txn_credits);
223
224         /* Calculate the mdd credits. */
225         for (op = MDD_TXN_OBJECT_DESTROY_OP; op < MDD_TXN_LAST_OP; op++) {
226                 int *c = &mdd->mdd_tod[op].mod_credits;
227                 int *dt = dto_txn_credits;
228                 mdd->mdd_tod[op].mod_op = op;
229                 switch(op) {
230                         case MDD_TXN_OBJECT_DESTROY_OP:
231                                 /* Unused now */
232                                 *c = dt[DTO_OBJECT_DELETE];
233                                 break;
234                         case MDD_TXN_OBJECT_CREATE_OP:
235                                 /* OI INSERT + CREATE OBJECT */
236                                 *c = dt[DTO_INDEX_INSERT] +
237                                      dt[DTO_OBJECT_CREATE];
238                                 break;
239                         case MDD_TXN_ATTR_SET_OP:
240                                 /* ATTR set + XATTR(lsm, lmv) set */
241                                 *c = dt[DTO_ATTR_SET_BASE] +
242                                      dt[DTO_XATTR_SET];
243                                 break;
244                         case MDD_TXN_XATTR_SET_OP:
245                                 *c = dt[DTO_XATTR_SET];
246                                 break;
247                         case MDD_TXN_INDEX_INSERT_OP:
248                                 *c = dt[DTO_INDEX_INSERT];
249                                 break;
250                         case MDD_TXN_INDEX_DELETE_OP:
251                                 *c = dt[DTO_INDEX_DELETE];
252                                 break;
253                         case MDD_TXN_LINK_OP:
254                                 *c = dt[DTO_INDEX_INSERT];
255                                 break;
256                         case MDD_TXN_UNLINK_OP:
257                                 /* delete index + Unlink log +
258                                  * mdd orphan handling */
259                                 *c = dt[DTO_INDEX_DELETE] +
260                                         dt[DTO_INDEX_DELETE] +
261                                         dt[DTO_INDEX_INSERT] * 2 +
262                                         dt[DTO_XATTR_SET] * 3;
263                                 break;
264                         case MDD_TXN_RENAME_OP:
265                                 /* 2 delete index + 1 insert + Unlink log */
266                                 *c = 2 * dt[DTO_INDEX_DELETE] +
267                                         dt[DTO_INDEX_INSERT] +
268                                         dt[DTO_INDEX_DELETE] +
269                                         dt[DTO_INDEX_INSERT] * 2 +
270                                         dt[DTO_XATTR_SET] * 3;
271                                 break;
272                         case MDD_TXN_RENAME_TGT_OP:
273                                 /* index insert + index delete */
274                                 *c = dt[DTO_INDEX_DELETE] +
275                                         dt[DTO_INDEX_INSERT] +
276                                         dt[DTO_INDEX_DELETE] +
277                                         dt[DTO_INDEX_INSERT] * 2 +
278                                         dt[DTO_XATTR_SET] * 3;
279                                 break;
280                         case MDD_TXN_CREATE_DATA_OP:
281                                 /* same as set xattr(lsm) */
282                                 *c = dt[DTO_XATTR_SET];
283                                 break;
284                         case MDD_TXN_MKDIR_OP:
285                                 /* INDEX INSERT + OI INSERT +
286                                  * CREATE_OBJECT_CREDITS
287                                  * SET_MD CREDITS is already counted in
288                                  * CREATE_OBJECT CREDITS
289                                  */
290                                  *c = 2 * dt[DTO_INDEX_INSERT] +
291                                           dt[DTO_OBJECT_CREATE];
292                                 break;
293                         default:
294                                 CERROR("Invalid op %d init its credit\n", op);
295                                 LBUG();
296                 }
297         }
298         RETURN(0);
299 }
300
301 struct thandle* mdd_trans_start(const struct lu_env *env,
302                                 struct mdd_device *mdd)
303 {
304         struct txn_param *p = &mdd_env_info(env)->mti_param;
305         struct thandle *th;
306
307         th = mdd_child_ops(mdd)->dt_trans_start(env, mdd->mdd_child, p);
308         return th;
309 }
310
311 void mdd_trans_stop(const struct lu_env *env, struct mdd_device *mdd,
312                     int result, struct thandle *handle)
313 {
314         handle->th_result = result;
315         mdd_child_ops(mdd)->dt_trans_stop(env, handle);
316 }