Whamcloud - gitweb
0300c0228f9529db947fbc81eca671f7913883c8
[fs/lustre-release.git] / lustre / lov / lov_log.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/lov/lov_log.c
37  *
38  * Author: Phil Schwan <phil@clusterfs.com>
39  * Author: Peter Braam <braam@clusterfs.com>
40  * Author: Mike Shaver <shaver@clusterfs.com>
41  */
42
43 #ifndef EXPORT_SYMTAB
44 # define EXPORT_SYMTAB
45 #endif
46 #define DEBUG_SUBSYSTEM S_LOV
47 #ifdef __KERNEL__
48 #include <libcfs/libcfs.h>
49 #else
50 #include <liblustre.h>
51 #endif
52
53 #include <obd_support.h>
54 #include <lustre_lib.h>
55 #include <lustre_net.h>
56 #include <lustre/lustre_idl.h>
57 #include <lustre_dlm.h>
58 #include <lustre_mds.h>
59 #include <obd_class.h>
60 #include <obd_lov.h>
61 #include <obd_ost.h>
62 #include <lprocfs_status.h>
63
64 #include "lov_internal.h"
65
66 /* Add log records for each OSC that this object is striped over, and return
67  * cookies for each one.  We _would_ have nice abstraction here, except that
68  * we need to keep cookies in stripe order, even if some are NULL, so that
69  * the right cookies are passed back to the right OSTs at the client side.
70  * Unset cookies should be all-zero (which will never occur naturally). */
71 static int lov_llog_origin_add(struct llog_ctxt *ctxt, struct llog_rec_hdr *rec,
72                                struct lov_stripe_md *lsm,
73                                struct llog_cookie *logcookies, int numcookies)
74 {
75         struct obd_device *obd = ctxt->loc_obd;
76         struct lov_obd *lov = &obd->u.lov;
77         int i, rc = 0, rc1;
78         ENTRY;
79
80         LASSERTF(logcookies && numcookies >= lsm->lsm_stripe_count,
81                  "logcookies %p, numcookies %d lsm->lsm_stripe_count %d \n",
82                  logcookies, numcookies, lsm->lsm_stripe_count);
83
84         for (i = 0; i < lsm->lsm_stripe_count; i++) {
85                 struct lov_oinfo *loi = lsm->lsm_oinfo[i];
86                 struct obd_device *child =
87                         lov->lov_tgts[loi->loi_ost_idx]->ltd_exp->exp_obd;
88                 struct llog_ctxt *cctxt = llog_get_context(child, ctxt->loc_idx);
89
90                 /* fill mds unlink/setattr log record */
91                 switch (rec->lrh_type) {
92                 case MDS_UNLINK_REC: {
93                         struct llog_unlink_rec *lur = (struct llog_unlink_rec *)rec;
94                         lur->lur_oid = loi->loi_id;
95                         lur->lur_ogr = loi->loi_gr;
96                         break;
97                 }
98                 case MDS_SETATTR_REC: {
99                         struct llog_setattr_rec *lsr = (struct llog_setattr_rec *)rec;
100                         lsr->lsr_oid = loi->loi_id;
101                         lsr->lsr_ogr = loi->loi_gr;
102                         break;
103                 }
104                 case MDS_SETATTR64_REC: {
105                         struct llog_setattr64_rec *lsr = (struct llog_setattr64_rec *)rec;
106                         lsr->lsr_oid = loi->loi_id;
107                         lsr->lsr_ogr = loi->loi_gr;
108                         break;
109                 }
110                 default:
111                         break;
112                 }
113                 LASSERT(lsm->lsm_object_gr == loi->loi_gr);
114                 rc1 = llog_add(cctxt, rec, NULL, logcookies + rc,
115                                numcookies - rc);
116                 llog_ctxt_put(cctxt);
117                 if (rc1 < 0)
118                         RETURN(rc1);
119                 rc += rc1;
120         }
121
122         RETURN(rc);
123 }
124
125 static int lov_llog_origin_connect(struct llog_ctxt *ctxt,
126                                    struct llog_logid *logid,
127                                    struct llog_gen *gen,
128                                    struct obd_uuid *uuid)
129 {
130         struct obd_device *obd = ctxt->loc_obd;
131         struct lov_obd *lov = &obd->u.lov;
132         int i, rc = 0, err = 0;
133         ENTRY;
134
135         obd_getref(obd);
136         for (i = 0; i < lov->desc.ld_tgt_count; i++) {
137                 struct obd_device *child;
138                 struct llog_ctxt *cctxt;
139
140                 if (!lov->lov_tgts[i] || !lov->lov_tgts[i]->ltd_active)
141                         continue;
142                 if (uuid && !obd_uuid_equals(uuid, &lov->lov_tgts[i]->ltd_uuid))
143                         continue;
144                 CDEBUG(D_CONFIG, "connect %d/%d\n", i, lov->desc.ld_tgt_count);
145                 child = lov->lov_tgts[i]->ltd_exp->exp_obd;
146                 cctxt = llog_get_context(child, ctxt->loc_idx);
147                 rc = llog_connect(cctxt, logid, gen, uuid);
148                 llog_ctxt_put(cctxt);
149
150                 if (rc) {
151                         CERROR("error osc_llog_connect tgt %d (%d)\n", i, rc);
152                         if (!err)
153                                 err = rc;
154                 }
155         }
156         obd_putref(obd);
157
158         RETURN(err);
159 }
160
161 /* the replicators commit callback */
162 static int lov_llog_repl_cancel(struct llog_ctxt *ctxt, struct lov_stripe_md *lsm,
163                           int count, struct llog_cookie *cookies, int flags)
164 {
165         struct lov_obd *lov;
166         struct obd_device *obd = ctxt->loc_obd;
167         int rc = 0, i;
168         ENTRY;
169
170         LASSERT(lsm != NULL);
171         LASSERT(count == lsm->lsm_stripe_count);
172
173         lov = &obd->u.lov;
174         obd_getref(obd);
175         for (i = 0; i < count; i++, cookies++) {
176                 struct lov_oinfo *loi = lsm->lsm_oinfo[i];
177                 struct obd_device *child =
178                         lov->lov_tgts[loi->loi_ost_idx]->ltd_exp->exp_obd;
179                 struct llog_ctxt *cctxt =
180                         llog_get_context(child, ctxt->loc_idx);
181                 int err;
182
183                 err = llog_cancel(cctxt, NULL, 1, cookies, flags);
184                 llog_ctxt_put(cctxt);
185                 if (err && lov->lov_tgts[loi->loi_ost_idx]->ltd_active) {
186                         CERROR("error: objid "LPX64" subobj "LPX64
187                                " on OST idx %d: rc = %d\n", lsm->lsm_object_id,
188                                loi->loi_id, loi->loi_ost_idx, err);
189                         if (!rc)
190                                 rc = err;
191                 }
192         }
193         obd_putref(obd);
194         RETURN(rc);
195 }
196
197 static struct llog_operations lov_mds_ost_orig_logops = {
198         lop_add: lov_llog_origin_add,
199         lop_connect: lov_llog_origin_connect
200 };
201
202 static struct llog_operations lov_size_repl_logops = {
203         lop_cancel: lov_llog_repl_cancel
204 };
205
206 int lov_llog_init(struct obd_device *obd, struct obd_llog_group *olg,
207                   struct obd_device *disk_obd, int *index)
208 {
209         struct lov_obd *lov = &obd->u.lov;
210         struct obd_device *child;
211         int i, rc = 0;
212         ENTRY;
213
214         LASSERT(olg == &obd->obd_olg);
215         rc = llog_setup(obd, olg, LLOG_MDS_OST_ORIG_CTXT, disk_obd, 0, NULL,
216                         &lov_mds_ost_orig_logops);
217         if (rc)
218                 RETURN(rc);
219
220         rc = llog_setup(obd, olg, LLOG_SIZE_REPL_CTXT, disk_obd, 0, NULL,
221                         &lov_size_repl_logops);
222         if (rc)
223                 GOTO(err_cleanup, rc);
224
225         obd_getref(obd);
226         /* count may not match lov->desc.ld_tgt_count during dynamic ost add */
227         for (i = 0; i < lov->desc.ld_tgt_count; i++) {
228                 if (!lov->lov_tgts[i])
229                         continue;
230
231                 if (index && i != *index)
232                         continue;
233
234                 child = lov->lov_tgts[i]->ltd_obd;
235                 rc = obd_llog_init(child, &child->obd_olg, disk_obd, &i);
236                 if (rc)
237                         CERROR("error osc_llog_init idx %d osc '%s' tgt '%s' "
238                                "(rc=%d)\n", i, child->obd_name,
239                                disk_obd->obd_name, rc);
240                 rc = 0;
241         }
242         obd_putref(obd);
243         GOTO(err_cleanup, rc);
244 err_cleanup:
245         if (rc) {
246                 struct llog_ctxt *ctxt =
247                         llog_get_context(obd, LLOG_SIZE_REPL_CTXT);
248                 if (ctxt)
249                         llog_cleanup(ctxt);
250                 ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
251                 if (ctxt)
252                         llog_cleanup(ctxt);
253         }
254         return rc;
255 }
256
257 int lov_llog_finish(struct obd_device *obd, int count)
258 {
259         struct llog_ctxt *ctxt;
260         int rc = 0, rc2 = 0;
261         ENTRY;
262
263         /* cleanup our llogs only if the ctxts have been setup
264          * (client lov doesn't setup, mds lov does). */
265         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
266         if (ctxt)
267                 rc = llog_cleanup(ctxt);
268
269         ctxt = llog_get_context(obd, LLOG_SIZE_REPL_CTXT);
270         if (ctxt)
271                 rc2 = llog_cleanup(ctxt);
272         if (!rc)
273                 rc = rc2;
274
275         /* lov->tgt llogs are cleaned during osc_cleanup. */
276         RETURN(rc);
277 }