Whamcloud - gitweb
8359cd66656f7080c855d070460f362630be14a0
[fs/lustre-release.git] / lustre / lov / lov_log.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2003, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  */
30 /*
31  * This file is part of Lustre, http://www.lustre.org/
32  * Lustre is a trademark of Sun Microsystems, Inc.
33  *
34  * lustre/lov/lov_log.c
35  *
36  * Author: Phil Schwan <phil@clusterfs.com>
37  * Author: Peter Braam <braam@clusterfs.com>
38  * Author: Mike Shaver <shaver@clusterfs.com>
39  */
40
41 #define DEBUG_SUBSYSTEM S_LOV
42 #ifdef __KERNEL__
43 #include <libcfs/libcfs.h>
44 #else
45 #include <liblustre.h>
46 #endif
47
48 #include <obd_support.h>
49 #include <lustre_lib.h>
50 #include <lustre_net.h>
51 #include <lustre/lustre_idl.h>
52 #include <lustre_dlm.h>
53 #include <lustre_mds.h>
54 #include <obd_class.h>
55 #include <obd_lov.h>
56 #include <obd_ost.h>
57 #include <lprocfs_status.h>
58
59 #include "lov_internal.h"
60
61 /* Add log records for each OSC that this object is striped over, and return
62  * cookies for each one.  We _would_ have nice abstraction here, except that
63  * we need to keep cookies in stripe order, even if some are NULL, so that
64  * the right cookies are passed back to the right OSTs at the client side.
65  * Unset cookies should be all-zero (which will never occur naturally). */
66 static int lov_llog_origin_add(struct llog_ctxt *ctxt, struct llog_rec_hdr *rec,
67                                struct lov_stripe_md *lsm,
68                                struct llog_cookie *logcookies, int numcookies)
69 {
70         struct obd_device *obd = ctxt->loc_obd;
71         struct lov_obd *lov = &obd->u.lov;
72         int i, rc = 0, cookies = 0;
73         ENTRY;
74
75         LASSERTF(logcookies && numcookies >= lsm->lsm_stripe_count,
76                  "logcookies %p, numcookies %d lsm->lsm_stripe_count %d \n",
77                  logcookies, numcookies, lsm->lsm_stripe_count);
78
79         for (i = 0; i < lsm->lsm_stripe_count; i++) {
80                 struct lov_oinfo *loi = lsm->lsm_oinfo[i];
81                 struct obd_device *child =
82                         lov->lov_tgts[loi->loi_ost_idx]->ltd_exp->exp_obd;
83                 struct llog_ctxt *cctxt = llog_get_context(child, ctxt->loc_idx);
84
85                 /* fill mds unlink/setattr log record */
86                 switch (rec->lrh_type) {
87                 case MDS_UNLINK_REC: {
88                         struct llog_unlink_rec *lur = (struct llog_unlink_rec *)rec;
89                         lur->lur_oid = loi->loi_id;
90                         lur->lur_oseq = loi->loi_seq;
91                         break;
92                 }
93                 case MDS_SETATTR64_REC: {
94                         struct llog_setattr64_rec *lsr = (struct llog_setattr64_rec *)rec;
95                         lsr->lsr_oid = loi->loi_id;
96                         lsr->lsr_oseq = loi->loi_seq;
97                         break;
98                 }
99                 default:
100                         break;
101                 }
102                 /* inject error in llog_add() below */
103                 if (OBD_FAIL_CHECK(OBD_FAIL_MDS_FAIL_LOV_LOG_ADD)) {
104                         llog_ctxt_put(cctxt);
105                         cctxt = NULL;
106                 }
107                 rc = llog_add(cctxt, rec, NULL, logcookies + cookies,
108                                numcookies - cookies);
109                 llog_ctxt_put(cctxt);
110                 if (rc < 0) {
111                         CERROR("Can't add llog (rc = %d) for stripe %d\n",
112                                rc, cookies);
113                         memset(logcookies + cookies, 0,
114                                sizeof(struct llog_cookie));
115                         rc = 1; /* skip this cookie */
116                 }
117                 /* Note that rc is always 1 if llog_add was successful */
118                 cookies += rc;
119         }
120         RETURN(cookies);
121 }
122
123 static int lov_llog_origin_connect(struct llog_ctxt *ctxt,
124                                    struct llog_logid *logid,
125                                    struct llog_gen *gen,
126                                    struct obd_uuid *uuid)
127 {
128         struct obd_device *obd = ctxt->loc_obd;
129         struct lov_obd *lov = &obd->u.lov;
130         int i, rc = 0, err = 0;
131         ENTRY;
132
133         obd_getref(obd);
134         for (i = 0; i < lov->desc.ld_tgt_count; i++) {
135                 struct obd_device *child;
136                 struct llog_ctxt *cctxt;
137
138                 if (!lov->lov_tgts[i] || !lov->lov_tgts[i]->ltd_active)
139                         continue;
140                 if (uuid && !obd_uuid_equals(uuid, &lov->lov_tgts[i]->ltd_uuid))
141                         continue;
142                 CDEBUG(D_CONFIG, "connect %d/%d\n", i, lov->desc.ld_tgt_count);
143                 child = lov->lov_tgts[i]->ltd_exp->exp_obd;
144                 cctxt = llog_get_context(child, ctxt->loc_idx);
145                 rc = llog_connect(cctxt, logid, gen, uuid);
146                 llog_ctxt_put(cctxt);
147
148                 if (rc) {
149                         CERROR("error osc_llog_connect tgt %d (%d)\n", i, rc);
150                         if (!err)
151                                 err = rc;
152                 }
153         }
154         obd_putref(obd);
155
156         RETURN(err);
157 }
158
159 /* the replicators commit callback */
160 static int lov_llog_repl_cancel(struct llog_ctxt *ctxt, struct lov_stripe_md *lsm,
161                           int count, struct llog_cookie *cookies, int flags)
162 {
163         struct lov_obd *lov;
164         struct obd_device *obd = ctxt->loc_obd;
165         int rc = 0, i;
166         ENTRY;
167
168         LASSERT(lsm != NULL);
169         LASSERT(count == lsm->lsm_stripe_count);
170
171         lov = &obd->u.lov;
172         obd_getref(obd);
173         for (i = 0; i < count; i++, cookies++) {
174                 struct lov_oinfo *loi = lsm->lsm_oinfo[i];
175                 struct obd_device *child =
176                         lov->lov_tgts[loi->loi_ost_idx]->ltd_exp->exp_obd;
177                 struct llog_ctxt *cctxt =
178                         llog_get_context(child, ctxt->loc_idx);
179                 int err;
180
181                 err = llog_cancel(cctxt, NULL, 1, cookies, flags);
182                 llog_ctxt_put(cctxt);
183                 if (err && lov->lov_tgts[loi->loi_ost_idx]->ltd_active) {
184                         CERROR("error: objid "LPX64" subobj "LPX64
185                                " on OST idx %d: rc = %d\n", lsm->lsm_object_id,
186                                loi->loi_id, loi->loi_ost_idx, err);
187                         if (!rc)
188                                 rc = err;
189                 }
190         }
191         obd_putref(obd);
192         RETURN(rc);
193 }
194
195 static struct llog_operations lov_mds_ost_orig_logops = {
196         lop_add: lov_llog_origin_add,
197         lop_connect: lov_llog_origin_connect
198 };
199
200 static struct llog_operations lov_size_repl_logops = {
201         lop_cancel: lov_llog_repl_cancel
202 };
203
204 int lov_llog_init(struct obd_device *obd, struct obd_llog_group *olg,
205                   struct obd_device *disk_obd, int *index)
206 {
207         struct lov_obd *lov = &obd->u.lov;
208         struct obd_device *child;
209         int i, rc = 0;
210         ENTRY;
211
212         LASSERT(olg == &obd->obd_olg);
213         rc = llog_setup(obd, olg, LLOG_MDS_OST_ORIG_CTXT, disk_obd, 0, NULL,
214                         &lov_mds_ost_orig_logops);
215         if (rc)
216                 RETURN(rc);
217
218         rc = llog_setup(obd, olg, LLOG_SIZE_REPL_CTXT, disk_obd, 0, NULL,
219                         &lov_size_repl_logops);
220         if (rc)
221                 GOTO(err_cleanup, rc);
222
223         obd_getref(obd);
224         /* count may not match lov->desc.ld_tgt_count during dynamic ost add */
225         for (i = 0; i < lov->desc.ld_tgt_count; i++) {
226                 if (!lov->lov_tgts[i])
227                         continue;
228
229                 if (index && i != *index)
230                         continue;
231
232                 child = lov->lov_tgts[i]->ltd_obd;
233                 rc = obd_llog_init(child, &child->obd_olg, disk_obd, &i);
234                 if (rc)
235                         CERROR("error osc_llog_init idx %d osc '%s' tgt '%s' "
236                                "(rc=%d)\n", i, child->obd_name,
237                                disk_obd->obd_name, rc);
238                 rc = 0;
239         }
240         obd_putref(obd);
241         GOTO(err_cleanup, rc);
242 err_cleanup:
243         if (rc) {
244                 struct llog_ctxt *ctxt =
245                         llog_get_context(obd, LLOG_SIZE_REPL_CTXT);
246                 if (ctxt)
247                         llog_cleanup(ctxt);
248                 ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
249                 if (ctxt)
250                         llog_cleanup(ctxt);
251         }
252         return rc;
253 }
254
255 int lov_llog_finish(struct obd_device *obd, int count)
256 {
257         struct llog_ctxt *ctxt;
258         int rc = 0, rc2 = 0;
259         ENTRY;
260
261         /* cleanup our llogs only if the ctxts have been setup
262          * (client lov doesn't setup, mds lov does). */
263         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
264         if (ctxt)
265                 rc = llog_cleanup(ctxt);
266
267         ctxt = llog_get_context(obd, LLOG_SIZE_REPL_CTXT);
268         if (ctxt)
269                 rc2 = llog_cleanup(ctxt);
270         if (!rc)
271                 rc = rc2;
272
273         /* lov->tgt llogs are cleaned during osc_cleanup. */
274         RETURN(rc);
275 }