Whamcloud - gitweb
Branch HEAD
[fs/lustre-release.git] / lustre / lov / lov_log.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/lov/lov_log.c
37  *
38  * Author: Phil Schwan <phil@clusterfs.com>
39  * Author: Peter Braam <braam@clusterfs.com>
40  * Author: Mike Shaver <shaver@clusterfs.com>
41  */
42
43 #ifndef EXPORT_SYMTAB
44 # define EXPORT_SYMTAB
45 #endif
46 #define DEBUG_SUBSYSTEM S_LOV
47 #ifdef __KERNEL__
48 #include <libcfs/libcfs.h>
49 #else
50 #include <liblustre.h>
51 #endif
52
53 #include <obd_support.h>
54 #include <lustre_lib.h>
55 #include <lustre_net.h>
56 #include <lustre/lustre_idl.h>
57 #include <lustre_dlm.h>
58 #include <lustre_mds.h>
59 #include <obd_class.h>
60 #include <obd_lov.h>
61 #include <obd_ost.h>
62 #include <lprocfs_status.h>
63
64 #include "lov_internal.h"
65
66 /* Add log records for each OSC that this object is striped over, and return
67  * cookies for each one.  We _would_ have nice abstraction here, except that
68  * we need to keep cookies in stripe order, even if some are NULL, so that
69  * the right cookies are passed back to the right OSTs at the client side.
70  * Unset cookies should be all-zero (which will never occur naturally). */
71 static int lov_llog_origin_add(struct llog_ctxt *ctxt, struct llog_rec_hdr *rec,
72                                struct lov_stripe_md *lsm,
73                                struct llog_cookie *logcookies, int numcookies)
74 {
75         struct obd_device *obd = ctxt->loc_obd;
76         struct lov_obd *lov = &obd->u.lov;
77         int i, rc = 0, cookies = 0;
78         ENTRY;
79
80         LASSERTF(logcookies && numcookies >= lsm->lsm_stripe_count,
81                  "logcookies %p, numcookies %d lsm->lsm_stripe_count %d \n",
82                  logcookies, numcookies, lsm->lsm_stripe_count);
83
84         for (i = 0; i < lsm->lsm_stripe_count; i++) {
85                 struct lov_oinfo *loi = lsm->lsm_oinfo[i];
86                 struct obd_device *child =
87                         lov->lov_tgts[loi->loi_ost_idx]->ltd_exp->exp_obd;
88                 struct llog_ctxt *cctxt = llog_get_context(child, ctxt->loc_idx);
89
90                 /* fill mds unlink/setattr log record */
91                 switch (rec->lrh_type) {
92                 case MDS_UNLINK_REC: {
93                         struct llog_unlink_rec *lur = (struct llog_unlink_rec *)rec;
94                         lur->lur_oid = loi->loi_id;
95                         lur->lur_ogr = loi->loi_gr;
96                         break;
97                 }
98                 case MDS_SETATTR_REC: {
99                         struct llog_setattr_rec *lsr = (struct llog_setattr_rec *)rec;
100                         lsr->lsr_oid = loi->loi_id;
101                         lsr->lsr_ogr = loi->loi_gr;
102                         break;
103                 }
104                 case MDS_SETATTR64_REC: {
105                         struct llog_setattr64_rec *lsr = (struct llog_setattr64_rec *)rec;
106                         lsr->lsr_oid = loi->loi_id;
107                         lsr->lsr_ogr = loi->loi_gr;
108                         break;
109                 }
110                 default:
111                         break;
112                 }
113                 LASSERT(lsm->lsm_object_gr == loi->loi_gr);
114                 /* inject error in llog_add() below */
115                 if (OBD_FAIL_CHECK(OBD_FAIL_MDS_FAIL_LOV_LOG_ADD)) {
116                         llog_ctxt_put(cctxt);
117                         cctxt = NULL;
118                 }
119                 rc = llog_add(cctxt, rec, NULL, logcookies + cookies,
120                                numcookies - cookies);
121                 llog_ctxt_put(cctxt);
122                 if (rc < 0) {
123                         CERROR("Can't add llog (rc = %d) for stripe %i\n",
124                                rc, cookies);
125                         memset(logcookies + cookies, 0,
126                                sizeof(struct llog_cookie));
127                         rc = 1; /* skip this cookie */
128                 }
129                 /* Note that rc is always 1 if llog_add was successful */
130                 cookies += rc;
131         }
132         RETURN(cookies);
133 }
134
135 static int lov_llog_origin_connect(struct llog_ctxt *ctxt,
136                                    struct llog_logid *logid,
137                                    struct llog_gen *gen,
138                                    struct obd_uuid *uuid)
139 {
140         struct obd_device *obd = ctxt->loc_obd;
141         struct lov_obd *lov = &obd->u.lov;
142         int i, rc = 0, err = 0;
143         ENTRY;
144
145         obd_getref(obd);
146         for (i = 0; i < lov->desc.ld_tgt_count; i++) {
147                 struct obd_device *child;
148                 struct llog_ctxt *cctxt;
149
150                 if (!lov->lov_tgts[i] || !lov->lov_tgts[i]->ltd_active)
151                         continue;
152                 if (uuid && !obd_uuid_equals(uuid, &lov->lov_tgts[i]->ltd_uuid))
153                         continue;
154                 CDEBUG(D_CONFIG, "connect %d/%d\n", i, lov->desc.ld_tgt_count);
155                 child = lov->lov_tgts[i]->ltd_exp->exp_obd;
156                 cctxt = llog_get_context(child, ctxt->loc_idx);
157                 rc = llog_connect(cctxt, logid, gen, uuid);
158                 llog_ctxt_put(cctxt);
159
160                 if (rc) {
161                         CERROR("error osc_llog_connect tgt %d (%d)\n", i, rc);
162                         if (!err)
163                                 err = rc;
164                 }
165         }
166         obd_putref(obd);
167
168         RETURN(err);
169 }
170
171 /* the replicators commit callback */
172 static int lov_llog_repl_cancel(struct llog_ctxt *ctxt, struct lov_stripe_md *lsm,
173                           int count, struct llog_cookie *cookies, int flags)
174 {
175         struct lov_obd *lov;
176         struct obd_device *obd = ctxt->loc_obd;
177         int rc = 0, i;
178         ENTRY;
179
180         LASSERT(lsm != NULL);
181         LASSERT(count == lsm->lsm_stripe_count);
182
183         lov = &obd->u.lov;
184         obd_getref(obd);
185         for (i = 0; i < count; i++, cookies++) {
186                 struct lov_oinfo *loi = lsm->lsm_oinfo[i];
187                 struct obd_device *child =
188                         lov->lov_tgts[loi->loi_ost_idx]->ltd_exp->exp_obd;
189                 struct llog_ctxt *cctxt =
190                         llog_get_context(child, ctxt->loc_idx);
191                 int err;
192
193                 err = llog_cancel(cctxt, NULL, 1, cookies, flags);
194                 llog_ctxt_put(cctxt);
195                 if (err && lov->lov_tgts[loi->loi_ost_idx]->ltd_active) {
196                         CERROR("error: objid "LPX64" subobj "LPX64
197                                " on OST idx %d: rc = %d\n", lsm->lsm_object_id,
198                                loi->loi_id, loi->loi_ost_idx, err);
199                         if (!rc)
200                                 rc = err;
201                 }
202         }
203         obd_putref(obd);
204         RETURN(rc);
205 }
206
207 static struct llog_operations lov_mds_ost_orig_logops = {
208         lop_add: lov_llog_origin_add,
209         lop_connect: lov_llog_origin_connect
210 };
211
212 static struct llog_operations lov_size_repl_logops = {
213         lop_cancel: lov_llog_repl_cancel
214 };
215
216 int lov_llog_init(struct obd_device *obd, struct obd_llog_group *olg,
217                   struct obd_device *disk_obd, int *index)
218 {
219         struct lov_obd *lov = &obd->u.lov;
220         struct obd_device *child;
221         int i, rc = 0;
222         ENTRY;
223
224         LASSERT(olg == &obd->obd_olg);
225         rc = llog_setup(obd, olg, LLOG_MDS_OST_ORIG_CTXT, disk_obd, 0, NULL,
226                         &lov_mds_ost_orig_logops);
227         if (rc)
228                 RETURN(rc);
229
230         rc = llog_setup(obd, olg, LLOG_SIZE_REPL_CTXT, disk_obd, 0, NULL,
231                         &lov_size_repl_logops);
232         if (rc)
233                 GOTO(err_cleanup, rc);
234
235         obd_getref(obd);
236         /* count may not match lov->desc.ld_tgt_count during dynamic ost add */
237         for (i = 0; i < lov->desc.ld_tgt_count; i++) {
238                 if (!lov->lov_tgts[i])
239                         continue;
240
241                 if (index && i != *index)
242                         continue;
243
244                 child = lov->lov_tgts[i]->ltd_obd;
245                 rc = obd_llog_init(child, &child->obd_olg, disk_obd, &i);
246                 if (rc)
247                         CERROR("error osc_llog_init idx %d osc '%s' tgt '%s' "
248                                "(rc=%d)\n", i, child->obd_name,
249                                disk_obd->obd_name, rc);
250                 rc = 0;
251         }
252         obd_putref(obd);
253         GOTO(err_cleanup, rc);
254 err_cleanup:
255         if (rc) {
256                 struct llog_ctxt *ctxt =
257                         llog_get_context(obd, LLOG_SIZE_REPL_CTXT);
258                 if (ctxt)
259                         llog_cleanup(ctxt);
260                 ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
261                 if (ctxt)
262                         llog_cleanup(ctxt);
263         }
264         return rc;
265 }
266
267 int lov_llog_finish(struct obd_device *obd, int count)
268 {
269         struct llog_ctxt *ctxt;
270         int rc = 0, rc2 = 0;
271         ENTRY;
272
273         /* cleanup our llogs only if the ctxts have been setup
274          * (client lov doesn't setup, mds lov does). */
275         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
276         if (ctxt)
277                 rc = llog_cleanup(ctxt);
278
279         ctxt = llog_get_context(obd, LLOG_SIZE_REPL_CTXT);
280         if (ctxt)
281                 rc2 = llog_cleanup(ctxt);
282         if (!rc)
283                 rc = rc2;
284
285         /* lov->tgt llogs are cleaned during osc_cleanup. */
286         RETURN(rc);
287 }