Whamcloud - gitweb
LU-14182 lov: cancel layout lock on replay deadlock
[fs/lustre-release.git] / lustre / lov / lov_dev.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2008, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2012, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * Implementation of cl_device and cl_device_type for LOV layer.
33  *
34  *   Author: Nikita Danilov <nikita.danilov@sun.com>
35  */
36
37 #define DEBUG_SUBSYSTEM S_LOV
38
39 /* class_name2obd() */
40 #include <obd_class.h>
41
42 #include "lov_cl_internal.h"
43
44 struct kmem_cache *lov_lock_kmem;
45 struct kmem_cache *lov_object_kmem;
46 struct kmem_cache *lov_thread_kmem;
47 struct kmem_cache *lov_session_kmem;
48
49 struct kmem_cache *lovsub_object_kmem;
50
51 struct lu_kmem_descr lov_caches[] = {
52         {
53                 .ckd_cache = &lov_lock_kmem,
54                 .ckd_name  = "lov_lock_kmem",
55                 .ckd_size  = sizeof(struct lov_lock)
56         },
57         {
58                 .ckd_cache = &lov_object_kmem,
59                 .ckd_name  = "lov_object_kmem",
60                 .ckd_size  = sizeof(struct lov_object)
61         },
62         {
63                 .ckd_cache = &lov_thread_kmem,
64                 .ckd_name  = "lov_thread_kmem",
65                 .ckd_size  = sizeof(struct lov_thread_info)
66         },
67         {
68                 .ckd_cache = &lov_session_kmem,
69                 .ckd_name  = "lov_session_kmem",
70                 .ckd_size  = sizeof(struct lov_session)
71         },
72         {
73                 .ckd_cache = &lovsub_object_kmem,
74                 .ckd_name  = "lovsub_object_kmem",
75                 .ckd_size  = sizeof(struct lovsub_object)
76         },
77         {
78                 .ckd_cache = NULL
79         }
80 };
81
82 /*****************************************************************************
83  *
84  * Lov device and device type functions.
85  *
86  */
87
88 static void *lov_key_init(const struct lu_context *ctx,
89                           struct lu_context_key *key)
90 {
91         struct lov_thread_info *info;
92
93         OBD_SLAB_ALLOC_PTR_GFP(info, lov_thread_kmem, GFP_NOFS);
94         if (!info)
95                 info = ERR_PTR(-ENOMEM);
96         return info;
97 }
98
99 static void lov_key_fini(const struct lu_context *ctx,
100                          struct lu_context_key *key, void *data)
101 {
102         struct lov_thread_info *info = data;
103         OBD_SLAB_FREE_PTR(info, lov_thread_kmem);
104 }
105
106 struct lu_context_key lov_key = {
107         .lct_tags = LCT_CL_THREAD,
108         .lct_init = lov_key_init,
109         .lct_fini = lov_key_fini
110 };
111
112 static void *lov_session_key_init(const struct lu_context *ctx,
113                                   struct lu_context_key *key)
114 {
115         struct lov_session *info;
116
117         OBD_SLAB_ALLOC_PTR_GFP(info, lov_session_kmem, GFP_NOFS);
118         if (!info)
119                 info = ERR_PTR(-ENOMEM);
120         return info;
121 }
122
123 static void lov_session_key_fini(const struct lu_context *ctx,
124                                  struct lu_context_key *key, void *data)
125 {
126         struct lov_session *info = data;
127
128         OBD_SLAB_FREE_PTR(info, lov_session_kmem);
129 }
130
131 struct lu_context_key lov_session_key = {
132         .lct_tags = LCT_SESSION,
133         .lct_init = lov_session_key_init,
134         .lct_fini = lov_session_key_fini
135 };
136
137 /* type constructor/destructor: lov_type_{init,fini,start,stop}() */
138 LU_TYPE_INIT_FINI(lov, &lov_key, &lov_session_key);
139
140
141 static int lov_mdc_dev_init(const struct lu_env *env, struct lov_device *ld,
142                             struct lu_device *mdc_dev, __u32 idx, __u32 nr)
143 {
144         struct cl_device *cl;
145
146         ENTRY;
147         cl = cl_type_setup(env, &ld->ld_site, &lovsub_device_type,
148                            mdc_dev);
149         if (IS_ERR(cl))
150                 RETURN(PTR_ERR(cl));
151
152         ld->ld_md_tgts[nr].ldm_mdc = cl;
153         ld->ld_md_tgts[nr].ldm_idx = idx;
154         RETURN(0);
155 }
156
157 static struct lu_device *lov_device_fini(const struct lu_env *env,
158                                          struct lu_device *d)
159 {
160         struct lov_device *ld = lu2lov_dev(d);
161         int i;
162
163         LASSERT(ld->ld_lov != NULL);
164
165         if (ld->ld_lmv) {
166                 class_decref(ld->ld_lmv, "lov", d);
167                 ld->ld_lmv = NULL;
168         }
169
170         if (ld->ld_md_tgts) {
171                 for (i = 0; i < ld->ld_md_tgts_nr; i++) {
172                         if (!ld->ld_md_tgts[i].ldm_mdc)
173                                 continue;
174
175                         cl_stack_fini(env, ld->ld_md_tgts[i].ldm_mdc);
176                         ld->ld_md_tgts[i].ldm_mdc = NULL;
177                         ld->ld_lov->lov_mdc_tgts[i].lmtd_mdc = NULL;
178                 }
179         }
180
181         if (ld->ld_target) {
182                 lov_foreach_target(ld, i) {
183                         struct lovsub_device *lsd;
184
185                         lsd = ld->ld_target[i];
186                         if (lsd) {
187                                 cl_stack_fini(env, lovsub2cl_dev(lsd));
188                                 ld->ld_target[i] = NULL;
189                         }
190                 }
191         }
192         RETURN(NULL);
193 }
194
195 static int lov_device_init(const struct lu_env *env, struct lu_device *d,
196                            const char *name, struct lu_device *next)
197 {
198         struct lov_device *ld = lu2lov_dev(d);
199         int i;
200         int rc = 0;
201
202         /* check all added already MDC subdevices and initialize them */
203         for (i = 0; i < ld->ld_md_tgts_nr; i++) {
204                 struct obd_device *mdc;
205                 __u32 idx;
206
207                 mdc = ld->ld_lov->lov_mdc_tgts[i].lmtd_mdc;
208                 idx = ld->ld_lov->lov_mdc_tgts[i].lmtd_index;
209
210                 if (!mdc)
211                         continue;
212
213                 rc = lov_mdc_dev_init(env, ld, mdc->obd_lu_dev, idx, i);
214                 if (rc) {
215                         CERROR("%s: failed to add MDC %s as target: rc = %d\n",
216                                d->ld_obd->obd_name,
217                                obd_uuid2str(&mdc->obd_uuid), rc);
218                         GOTO(out_err, rc);
219                 }
220         }
221
222         if (!ld->ld_target)
223                 RETURN(0);
224
225         lov_foreach_target(ld, i) {
226                 struct lovsub_device *lsd;
227                 struct cl_device *cl;
228                 struct lov_tgt_desc *desc;
229
230                 desc = ld->ld_lov->lov_tgts[i];
231                 if (!desc)
232                         continue;
233
234                 cl = cl_type_setup(env, &ld->ld_site, &lovsub_device_type,
235                                    desc->ltd_obd->obd_lu_dev);
236                 if (IS_ERR(cl))
237                         GOTO(out_err, rc = PTR_ERR(cl));
238
239                 lsd = cl2lovsub_dev(cl);
240                 ld->ld_target[i] = lsd;
241         }
242         ld->ld_flags |= LOV_DEV_INITIALIZED;
243         RETURN(0);
244
245 out_err:
246         lu_device_fini(d);
247         RETURN(rc);
248 }
249
250 /* Free the lov specific data created for the back end lu_device. */
251 static struct lu_device *lov_device_free(const struct lu_env *env,
252                                          struct lu_device *d)
253 {
254         struct lov_device *ld = lu2lov_dev(d);
255         const int nr = ld->ld_target_nr;
256
257         lu_site_fini(&ld->ld_site);
258
259         cl_device_fini(lu2cl_dev(d));
260         if (ld->ld_target) {
261                 OBD_FREE_PTR_ARRAY(ld->ld_target, nr);
262                 ld->ld_target = NULL;
263         }
264         if (ld->ld_md_tgts) {
265                 OBD_FREE_PTR_ARRAY(ld->ld_md_tgts, LOV_MDC_TGT_MAX);
266                 ld->ld_md_tgts = NULL;
267         }
268         /* free array of MDCs */
269         if (ld->ld_lov->lov_mdc_tgts) {
270                 OBD_FREE_PTR_ARRAY(ld->ld_lov->lov_mdc_tgts, LOV_MDC_TGT_MAX);
271                 ld->ld_lov->lov_mdc_tgts = NULL;
272         }
273
274         OBD_FREE_PTR(ld);
275         return NULL;
276 }
277
278 static void lov_cl_del_target(const struct lu_env *env, struct lu_device *dev,
279                               __u32 index)
280 {
281         struct lov_device *ld = lu2lov_dev(dev);
282
283         ENTRY;
284
285         if (ld->ld_target[index]) {
286                 cl_stack_fini(env, lovsub2cl_dev(ld->ld_target[index]));
287                 ld->ld_target[index] = NULL;
288         }
289         EXIT;
290 }
291
292 static int lov_expand_targets(const struct lu_env *env, struct lov_device *dev)
293 {
294         int result;
295         __u32 tgt_size;
296         __u32 sub_size;
297
298         ENTRY;
299         result = 0;
300         tgt_size = dev->ld_lov->lov_tgt_size;
301         sub_size = dev->ld_target_nr;
302         if (sub_size < tgt_size) {
303                 struct lovsub_device **newd;
304                 const size_t sz = sizeof(newd[0]);
305
306                 OBD_ALLOC_PTR_ARRAY(newd, tgt_size);
307                 if (newd) {
308                         if (sub_size > 0) {
309                                 memcpy(newd, dev->ld_target, sub_size * sz);
310                                 OBD_FREE(dev->ld_target, sub_size * sz);
311                         }
312
313                         dev->ld_target = newd;
314                         dev->ld_target_nr = tgt_size;
315                 } else {
316                         result = -ENOMEM;
317                 }
318         }
319
320         RETURN(result);
321 }
322
323 static int lov_cl_add_target(const struct lu_env *env, struct lu_device *dev,
324                              __u32 index)
325 {
326         struct obd_device    *obd = dev->ld_obd;
327         struct lov_device    *ld  = lu2lov_dev(dev);
328         struct lov_tgt_desc  *tgt;
329         struct lovsub_device *lsd;
330         struct cl_device     *cl;
331         int rc;
332
333         ENTRY;
334
335         lov_tgts_getref(obd);
336
337         tgt = obd->u.lov.lov_tgts[index];
338         LASSERT(tgt != NULL);
339         LASSERT(tgt->ltd_obd != NULL);
340
341         if (!tgt->ltd_obd->obd_set_up) {
342                 CERROR("Target %s not set up\n", obd_uuid2str(&tgt->ltd_uuid));
343                 RETURN(-EINVAL);
344         }
345
346         rc = lov_expand_targets(env, ld);
347         if (rc == 0 && ld->ld_flags & LOV_DEV_INITIALIZED) {
348                 cl = cl_type_setup(env, &ld->ld_site, &lovsub_device_type,
349                                    tgt->ltd_obd->obd_lu_dev);
350                 if (!IS_ERR(cl)) {
351                         lsd = cl2lovsub_dev(cl);
352                         ld->ld_target[index] = lsd;
353                 } else {
354                         CERROR("add failed (%d), deleting %s\n", rc,
355                                obd_uuid2str(&tgt->ltd_uuid));
356                         lov_cl_del_target(env, dev, index);
357                         rc = PTR_ERR(cl);
358                 }
359         }
360
361         lov_tgts_putref(obd);
362
363         RETURN(rc);
364 }
365
366 /**
367  * Add new MDC target device in LOV.
368  *
369  * This function is part of the configuration log processing. It adds new MDC
370  * device to the MDC device array indexed by their indexes.
371  *
372  * \param[in] env       execution environment
373  * \param[in] d         LU device of LOV device
374  * \param[in] mdc       MDC device to add
375  * \param[in] idx       MDC device index
376  *
377  * \retval              0 if successful
378  * \retval              negative value on error
379  */
380 static int lov_add_mdc_target(const struct lu_env *env, struct lu_device *d,
381                               struct obd_device *mdc, __u32 idx)
382 {
383         struct lov_device *ld = lu2lov_dev(d);
384         struct obd_device *lov_obd = d->ld_obd;
385         struct obd_device *lmv_obd;
386         int next;
387         int rc = 0;
388
389         ENTRY;
390
391         LASSERT(mdc != NULL);
392         if (ld->ld_md_tgts_nr == LOV_MDC_TGT_MAX) {
393                 /*
394                  * If the maximum value of LOV_MDC_TGT_MAX will become too
395                  * small then all MD target handling must be rewritten in LOD
396                  * manner, check lod_add_device() and related functionality.
397                  */
398                 CERROR("%s: cannot serve more than %d MDC devices\n",
399                        lov_obd->obd_name, LOV_MDC_TGT_MAX);
400                 RETURN(-ERANGE);
401         }
402
403         /*
404          * grab FLD from lmv, do that here, when first MDC is added
405          * to be sure LMV is set up and can be found
406          */
407         if (!ld->ld_lmv) {
408                 next = 0;
409                 while ((lmv_obd = class_devices_in_group(&lov_obd->obd_uuid,
410                                                          &next)) != NULL) {
411                         if ((strncmp(lmv_obd->obd_type->typ_name,
412                                      LUSTRE_LMV_NAME,
413                                      strlen(LUSTRE_LMV_NAME)) == 0))
414                                 break;
415                 }
416                 if (!lmv_obd) {
417                         CERROR("%s: cannot find LMV OBD by UUID (%s)\n",
418                                lov_obd->obd_name,
419                                obd_uuid2str(&lmv_obd->obd_uuid));
420                         RETURN(-ENODEV);
421                 }
422                 spin_lock(&lmv_obd->obd_dev_lock);
423                 class_incref(lmv_obd, "lov", ld);
424                 spin_unlock(&lmv_obd->obd_dev_lock);
425                 ld->ld_lmv = lmv_obd;
426         }
427
428         LASSERT(lov_obd->u.lov.lov_mdc_tgts[ld->ld_md_tgts_nr].lmtd_mdc ==
429                 NULL);
430
431         if (ld->ld_flags & LOV_DEV_INITIALIZED) {
432                 rc = lov_mdc_dev_init(env, ld, mdc->obd_lu_dev, idx,
433                                       ld->ld_md_tgts_nr);
434                 if (rc) {
435                         CERROR("%s: failed to add MDC %s as target: rc = %d\n",
436                                lov_obd->obd_name, obd_uuid2str(&mdc->obd_uuid),
437                                rc);
438                         RETURN(rc);
439                 }
440         }
441
442         lov_obd->u.lov.lov_mdc_tgts[ld->ld_md_tgts_nr].lmtd_mdc = mdc;
443         lov_obd->u.lov.lov_mdc_tgts[ld->ld_md_tgts_nr].lmtd_index = idx;
444         ld->ld_md_tgts_nr++;
445
446         RETURN(rc);
447 }
448
449 static int lov_process_config(const struct lu_env *env,
450                               struct lu_device *d, struct lustre_cfg *cfg)
451 {
452         struct obd_device *obd = d->ld_obd;
453         int cmd;
454         int rc;
455         int gen;
456         u32 index;
457
458         lov_tgts_getref(obd);
459
460         cmd = cfg->lcfg_command;
461
462         rc = lov_process_config_base(d->ld_obd, cfg, &index, &gen);
463         if (rc < 0)
464                 GOTO(out, rc);
465
466         switch (cmd) {
467         case LCFG_LOV_ADD_OBD:
468         case LCFG_LOV_ADD_INA:
469                 rc = lov_cl_add_target(env, d, index);
470                 if (rc != 0)
471                         lov_del_target(d->ld_obd, index, NULL, 0);
472                 break;
473         case LCFG_LOV_DEL_OBD:
474                 lov_cl_del_target(env, d, index);
475                 break;
476         case LCFG_ADD_MDC:
477         {
478                 struct obd_device *mdc;
479                 struct obd_uuid tgt_uuid;
480
481                 /*
482                  * modify_mdc_tgts add 0:lustre-clilmv  1:lustre-MDT0000_UUID
483                  * 2:0  3:1  4:lustre-MDT0000-mdc_UUID
484                  */
485                 if (LUSTRE_CFG_BUFLEN(cfg, 1) > sizeof(tgt_uuid.uuid))
486                         GOTO(out, rc = -EINVAL);
487
488                 obd_str2uuid(&tgt_uuid, lustre_cfg_buf(cfg, 1));
489
490                 rc = kstrtou32(lustre_cfg_buf(cfg, 2), 10, &index);
491                 if (rc)
492                         GOTO(out, rc);
493
494                 mdc = class_find_client_obd(&tgt_uuid, LUSTRE_MDC_NAME,
495                                             &obd->obd_uuid);
496                 if (!mdc)
497                         GOTO(out, rc = -ENODEV);
498                 rc = lov_add_mdc_target(env, d, mdc, index);
499                 break;
500         }
501         }
502 out:
503         lov_tgts_putref(obd);
504         RETURN(rc);
505 }
506
507 static const struct lu_device_operations lov_lu_ops = {
508         .ldo_object_alloc      = lov_object_alloc,
509         .ldo_process_config    = lov_process_config,
510 };
511
512 static struct lu_device *lov_device_alloc(const struct lu_env *env,
513                                           struct lu_device_type *t,
514                                           struct lustre_cfg *cfg)
515 {
516         struct lu_device *d;
517         struct lov_device *ld;
518         struct obd_device *obd;
519         int rc;
520
521         OBD_ALLOC_PTR(ld);
522         if (!ld)
523                 RETURN(ERR_PTR(-ENOMEM));
524
525         cl_device_init(&ld->ld_cl, t);
526         d = lov2lu_dev(ld);
527         d->ld_ops = &lov_lu_ops;
528
529         /* setup the LOV OBD */
530         obd = class_name2obd(lustre_cfg_string(cfg, 0));
531         LASSERT(obd != NULL);
532         rc = lov_setup(obd, cfg);
533         if (rc)
534                 GOTO(out, rc);
535
536         /* Alloc MDC devices array */
537         /* XXX: need dynamic allocation at some moment */
538         OBD_ALLOC_PTR_ARRAY(ld->ld_md_tgts, LOV_MDC_TGT_MAX);
539         if (!ld->ld_md_tgts)
540                 GOTO(out, rc = -ENOMEM);
541
542         ld->ld_md_tgts_nr = 0;
543
544         ld->ld_lov = &obd->u.lov;
545         OBD_ALLOC_PTR_ARRAY(ld->ld_lov->lov_mdc_tgts, LOV_MDC_TGT_MAX);
546         if (!ld->ld_lov->lov_mdc_tgts)
547                 GOTO(out_md_tgts, rc = -ENOMEM);
548
549         rc = lu_site_init(&ld->ld_site, d);
550         if (rc != 0)
551                 GOTO(out_mdc_tgts, rc);
552
553         rc = lu_site_init_finish(&ld->ld_site);
554         if (rc != 0)
555                 GOTO(out_site, rc);
556
557         RETURN(d);
558 out_site:
559         lu_site_fini(&ld->ld_site);
560 out_mdc_tgts:
561         OBD_FREE_PTR_ARRAY(ld->ld_lov->lov_mdc_tgts, LOV_MDC_TGT_MAX);
562         ld->ld_lov->lov_mdc_tgts = NULL;
563 out_md_tgts:
564         OBD_FREE_PTR_ARRAY(ld->ld_md_tgts, LOV_MDC_TGT_MAX);
565         ld->ld_md_tgts = NULL;
566 out:
567         OBD_FREE_PTR(ld);
568
569         return ERR_PTR(rc);
570 }
571
572 static const struct lu_device_type_operations lov_device_type_ops = {
573         .ldto_init = lov_type_init,
574         .ldto_fini = lov_type_fini,
575
576         .ldto_start = lov_type_start,
577         .ldto_stop  = lov_type_stop,
578
579         .ldto_device_alloc = lov_device_alloc,
580         .ldto_device_free  = lov_device_free,
581
582         .ldto_device_init    = lov_device_init,
583         .ldto_device_fini    = lov_device_fini
584 };
585
586 struct lu_device_type lov_device_type = {
587         .ldt_tags     = LU_DEVICE_CL,
588         .ldt_name     = LUSTRE_LOV_NAME,
589         .ldt_ops      = &lov_device_type_ops,
590         .ldt_ctx_tags = LCT_CL_THREAD
591 };
592
593 /** @} lov */