Whamcloud - gitweb
LU-1302 llog: modify llog_write/llog_add to support OSD
[fs/lustre-release.git] / lustre / mds / mds_log.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2003, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2012, Whamcloud, Inc.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/mds/mds_log.c
37  *
38  * Author: Peter Braam <braam@clusterfs.com>
39  * Author: Andreas Dilger <adilger@clusterfs.com>
40  * Author: Phil Schwan <phil@clusterfs.com>
41  */
42
43 #define DEBUG_SUBSYSTEM S_MDS
44
45 #include <linux/module.h>
46 #include <linux/version.h>
47
48 #include <libcfs/list.h>
49 #include <obd_class.h>
50 #include <lustre_fsfilt.h>
51 #include <lustre_mds.h>
52 #include <lustre_log.h>
53
54 #include "mds_internal.h"
55
56 static int mds_llog_origin_add(const struct lu_env *env,
57                                struct llog_ctxt *ctxt,
58                                struct llog_rec_hdr *rec,
59                                struct lov_stripe_md *lsm,
60                                struct llog_cookie *logcookies, int numcookies)
61 {
62         struct obd_device *obd = ctxt->loc_obd;
63         struct obd_device *lov_obd = obd->u.mds.mds_lov_obd;
64         struct llog_ctxt *lctxt;
65         int rc;
66         ENTRY;
67
68         lctxt = llog_get_context(lov_obd, ctxt->loc_idx);
69         rc = llog_obd_add(env, lctxt, rec, lsm, logcookies, numcookies);
70         llog_ctxt_put(lctxt);
71
72         RETURN(rc);
73 }
74
75 static int mds_llog_origin_connect(struct llog_ctxt *ctxt,
76                                    struct llog_logid *logid,
77                                    struct llog_gen *gen,
78                                    struct obd_uuid *uuid)
79 {
80         struct obd_device *obd = ctxt->loc_obd;
81         struct obd_device *lov_obd = obd->u.mds.mds_lov_obd;
82         struct llog_ctxt *lctxt;
83         int rc;
84         ENTRY;
85
86         lctxt = llog_get_context(lov_obd, ctxt->loc_idx);
87         rc = llog_connect(lctxt, logid, gen, uuid);
88         llog_ctxt_put(lctxt);
89         RETURN(rc);
90 }
91
92 static struct llog_operations mds_ost_orig_logops = {
93         .lop_obd_add    = mds_llog_origin_add,
94         .lop_connect    = mds_llog_origin_connect,
95 };
96
97 static int mds_llog_repl_cancel(const struct lu_env *env,
98                                 struct llog_ctxt *ctxt,
99                                 struct lov_stripe_md *lsm,
100                                 int count, struct llog_cookie *cookies,
101                                 int flags)
102 {
103         struct obd_device *obd = ctxt->loc_obd;
104         struct obd_device *lov_obd = obd->u.mds.mds_lov_obd;
105         struct llog_ctxt *lctxt;
106         int rc;
107         ENTRY;
108
109         lctxt = llog_get_context(lov_obd, ctxt->loc_idx);
110         rc = llog_cancel(env, lctxt, lsm, count, cookies, flags);
111         llog_ctxt_put(lctxt);
112         RETURN(rc);
113 }
114
115 static struct llog_operations mds_size_repl_logops = {
116         lop_cancel:     mds_llog_repl_cancel,
117 };
118
119 static struct llog_operations changelog_orig_logops;
120
121 static int llog_changelog_cancel_cb(const struct lu_env *env,
122                                     struct llog_handle *llh,
123                                     struct llog_rec_hdr *hdr, void *data)
124 {
125         struct llog_changelog_rec *rec = (struct llog_changelog_rec *)hdr;
126         struct llog_cookie cookie;
127         long long endrec = *(long long *)data;
128         int rc, err;
129         struct obd_device *obd;
130         void *trans_h;
131         struct inode *inode;
132         ENTRY;
133
134         /* This is always a (sub)log, not the catalog */
135         LASSERT(llh->lgh_hdr->llh_flags & LLOG_F_IS_PLAIN);
136
137         if (rec->cr.cr_index > endrec)
138                 /* records are in order, so we're done */
139                 RETURN(LLOG_PROC_BREAK);
140
141         cookie.lgc_lgl = llh->lgh_id;
142         cookie.lgc_index = hdr->lrh_index;
143         obd = llh->lgh_ctxt->loc_exp->exp_obd;
144         inode = llh->lgh_file->f_dentry->d_inode;
145
146         /* XXX This is a workaround for the deadlock of changelog adding vs.
147          * changelog cancelling. Changelog adding always start transaction
148          * before acquiring the catlog lock (lgh_lock), whereas, changelog
149          * cancelling do start transaction after holding catlog lock.
150          *
151          * We start the transaction earlier here to keep the locking ordering:
152          * 'start transaction -> catlog lock'. LU-81. */
153         trans_h = fsfilt_start_log(obd, inode, FSFILT_OP_CANCEL_UNLINK,
154                                    NULL, 1);
155         if (IS_ERR(trans_h)) {
156                 CERROR("fsfilt_start_log failed: %ld\n", PTR_ERR(trans_h));
157                 RETURN(PTR_ERR(trans_h));
158         }
159
160         /* cancel them one at a time.  I suppose we could store up the cookies
161            and cancel them all at once; probably more efficient, but this is
162            done as a user call, so who cares... */
163         rc = llog_cat_cancel_records(env, llh->u.phd.phd_cat_handle, 1,
164                                      &cookie);
165
166         err = fsfilt_commit(obd, inode, trans_h, 0);
167         if (err) {
168                 CERROR("fsfilt_commit failed: %d\n", err);
169                 rc = (rc >= 0) ? err : rc;
170         }
171
172         RETURN(rc < 0 ? rc : 0);
173 }
174
175 static int llog_changelog_cancel(const struct lu_env *env,
176                                  struct llog_ctxt *ctxt,
177                                  struct lov_stripe_md *lsm, int count,
178                                  struct llog_cookie *cookies, int flags)
179 {
180         struct llog_handle *cathandle = ctxt->loc_handle;
181         int rc;
182         ENTRY;
183
184         /* This should only be called with the catalog handle */
185         LASSERT(cathandle->lgh_hdr->llh_flags & LLOG_F_IS_CAT);
186
187         rc = llog_cat_process(env, cathandle, llog_changelog_cancel_cb,
188                               (void *)cookies, 0, 0);
189         if (rc >= 0)
190                 /* 0 or 1 means we're done */
191                 rc = 0;
192         else
193                 CERROR("cancel idx %u of catalog "LPX64" rc=%d\n",
194                        cathandle->lgh_last_idx, cathandle->lgh_id.lgl_oid, rc);
195
196         RETURN(rc);
197 }
198
199 int mds_changelog_llog_init(struct obd_device *obd, struct obd_device *tgt)
200 {
201         int rc;
202
203         /* see osc_llog_init */
204         changelog_orig_logops = llog_lvfs_ops;
205         changelog_orig_logops.lop_setup = llog_obd_origin_setup;
206         changelog_orig_logops.lop_cleanup = llog_obd_origin_cleanup;
207         changelog_orig_logops.lop_obd_add = llog_obd_origin_add;
208         changelog_orig_logops.lop_cancel = llog_changelog_cancel;
209
210         rc = llog_setup_named(obd, &obd->obd_olg, LLOG_CHANGELOG_ORIG_CTXT,
211                               tgt, 1, NULL, CHANGELOG_CATALOG,
212                               &changelog_orig_logops);
213         if (rc) {
214                 CERROR("changelog llog setup failed %d\n", rc);
215                 RETURN(rc);
216         }
217
218         rc = llog_setup_named(obd, &obd->obd_olg, LLOG_CHANGELOG_USER_ORIG_CTXT,
219                               tgt, 1, NULL, CHANGELOG_USERS,
220                               &changelog_orig_logops);
221         if (rc) {
222                 CERROR("changelog users llog setup failed %d\n", rc);
223                 RETURN(rc);
224         }
225
226         RETURN(rc);
227 }
228 EXPORT_SYMBOL(mds_changelog_llog_init);
229
230 int mds_llog_init(struct obd_device *obd, struct obd_llog_group *olg,
231                   struct obd_device *disk_obd, int *index)
232 {
233         struct obd_device *lov_obd = obd->u.mds.mds_lov_obd;
234         struct llog_ctxt *ctxt;
235         int rc;
236         ENTRY;
237
238         LASSERT(olg == &obd->obd_olg);
239         rc = llog_setup(obd, &obd->obd_olg, LLOG_MDS_OST_ORIG_CTXT, disk_obd,
240                         0, NULL, &mds_ost_orig_logops);
241         if (rc)
242                 RETURN(rc);
243
244         rc = llog_setup(obd, &obd->obd_olg, LLOG_SIZE_REPL_CTXT, disk_obd,
245                         0, NULL, &mds_size_repl_logops);
246         if (rc)
247                 GOTO(err_llog, rc);
248
249         rc = obd_llog_init(lov_obd, &lov_obd->obd_olg, disk_obd, index);
250         if (rc) {
251                 CERROR("lov_llog_init err %d\n", rc);
252                 GOTO(err_cleanup, rc);
253         }
254
255         RETURN(rc);
256 err_cleanup:
257         ctxt = llog_get_context(obd, LLOG_SIZE_REPL_CTXT);
258         if (ctxt)
259                 llog_cleanup(ctxt);
260 err_llog:
261         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
262         if (ctxt)
263                 llog_cleanup(ctxt);
264         return rc;
265 }
266
267 int mds_llog_finish(struct obd_device *obd, int count)
268 {
269         struct llog_ctxt *ctxt;
270         int rc = 0, rc2 = 0;
271         ENTRY;
272
273         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
274         if (ctxt)
275                 rc = llog_cleanup(ctxt);
276
277         ctxt = llog_get_context(obd, LLOG_SIZE_REPL_CTXT);
278         if (ctxt)
279                 rc2 = llog_cleanup(ctxt);
280         if (!rc)
281                 rc = rc2;
282
283         ctxt = llog_get_context(obd, LLOG_CHANGELOG_ORIG_CTXT);
284         if (ctxt)
285                 rc2 = llog_cleanup(ctxt);
286         if (!rc)
287                 rc = rc2;
288
289         ctxt = llog_get_context(obd, LLOG_CHANGELOG_USER_ORIG_CTXT);
290         if (ctxt)
291                 rc2 = llog_cleanup(ctxt);
292         if (!rc)
293                 rc = rc2;
294
295         RETURN(rc);
296 }
297
298 static int mds_llog_add_unlink(struct obd_device *obd,
299                                struct lov_stripe_md *lsm, obd_count count,
300                                struct llog_cookie *logcookie, int cookies)
301 {
302         struct llog_unlink_rec *lur;
303         struct llog_ctxt *ctxt;
304         int rc;
305
306         if (cookies < lsm->lsm_stripe_count)
307                 RETURN(rc = -EFBIG);
308
309         /* first prepare unlink log record */
310         OBD_ALLOC_PTR(lur);
311         if (!lur)
312                 RETURN(rc = -ENOMEM);
313         lur->lur_hdr.lrh_len = lur->lur_tail.lrt_len = sizeof(*lur);
314         lur->lur_hdr.lrh_type = MDS_UNLINK_REC;
315         lur->lur_count = count;
316
317         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
318         rc = llog_obd_add(NULL, ctxt, &lur->lur_hdr, lsm, logcookie, cookies);
319         llog_ctxt_put(ctxt);
320
321         OBD_FREE_PTR(lur);
322         RETURN(rc);
323 }
324
325 int mds_log_op_unlink(struct obd_device *obd,
326                       struct lov_mds_md *lmm, int lmm_size,
327                       struct llog_cookie *logcookies, int cookies_size)
328 {
329         struct mds_obd *mds = &obd->u.mds;
330         struct lov_stripe_md *lsm = NULL;
331         int rc;
332         ENTRY;
333
334         if (IS_ERR(mds->mds_lov_obd))
335                 RETURN(PTR_ERR(mds->mds_lov_obd));
336
337         rc = obd_unpackmd(mds->mds_lov_exp, &lsm, lmm, lmm_size);
338         if (rc < 0)
339                 RETURN(rc);
340         rc = mds_llog_add_unlink(obd, lsm, 0, logcookies,
341                                  cookies_size / sizeof(struct llog_cookie));
342         obd_free_memmd(mds->mds_lov_exp, &lsm);
343         RETURN(rc);
344 }
345 EXPORT_SYMBOL(mds_log_op_unlink);
346
347 int mds_log_op_orphan(struct obd_device *obd, struct lov_stripe_md *lsm,
348                       obd_count count)
349 {
350         struct mds_obd *mds = &obd->u.mds;
351         struct llog_cookie logcookie;
352         int rc;
353         ENTRY;
354
355         if (IS_ERR(mds->mds_lov_obd))
356                 RETURN(PTR_ERR(mds->mds_lov_obd));
357
358         rc = mds_llog_add_unlink(obd, lsm, count - 1, &logcookie, 1);
359         RETURN(rc);
360 }
361