Whamcloud - gitweb
LU-2675 lod: remove lov and lod stuff from obd.h
[fs/lustre-release.git] / lustre / lod / lod_internal.h
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9
10  * This program is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13  * GNU General Public License version 2 for more details.  A copy is
14  * included in the COPYING file that accompanied this code.
15
16  * You should have received a copy of the GNU General Public License
17  * along with this program; if not, write to the Free Software
18  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright  2009 Sun Microsystems, Inc. All rights reserved
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2012, 2013, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/lod/lod_internal.h
33  *
34  * Author: Alex Zhuravlev <alexey.zhuravlev@intel.com>
35  * Author: Mikhail Pershin <mike.pershin@intel.com>
36  */
37
38 #ifndef _LOD_INTERNAL_H
39 #define _LOD_INTERNAL_H
40
41 #include <libcfs/libcfs.h>
42 #include <obd.h>
43 #include <dt_object.h>
44
45 #define LOV_USES_ASSIGNED_STRIPE        0
46 #define LOV_USES_DEFAULT_STRIPE         1
47
48 struct lod_qos_rr {
49         __u32                    lqr_start_idx; /* start index of new inode */
50         __u32                    lqr_offset_idx; /* aliasing for start_idx */
51         int                      lqr_start_count; /* reseed counter */
52         struct ost_pool          lqr_pool;      /* round-robin optimized list */
53         unsigned long            lqr_dirty:1;   /* recalc round-robin list */
54 };
55
56 struct pool_desc {
57         char                     pool_name[LOV_MAXPOOLNAME + 1];
58         struct ost_pool          pool_obds;     /* pool members */
59         atomic_t                 pool_refcount;
60         struct lod_qos_rr        pool_rr;
61         cfs_hlist_node_t         pool_hash;     /* access by poolname */
62         struct list_head         pool_list;
63         struct proc_dir_entry   *pool_proc_entry;
64         struct obd_device       *pool_lobd;     /* owner */
65 };
66
67 #define pool_tgt_size(p) ((p)->pool_obds.op_size)
68 #define pool_tgt_count(p) ((p)->pool_obds.op_count)
69 #define pool_tgt_array(p)  ((p)->pool_obds.op_array)
70 #define pool_tgt_rw_sem(p) ((p)->pool_obds.op_rw_sem)
71
72 struct lod_qos {
73         struct list_head         lq_oss_list;
74         struct rw_semaphore      lq_rw_sem;
75         __u32                    lq_active_oss_count;
76         unsigned int             lq_prio_free;   /* priority for free space */
77         unsigned int             lq_threshold_rr;/* priority for rr */
78         struct lod_qos_rr        lq_rr;          /* round robin qos data */
79         bool                     lq_dirty:1,     /* recalc qos data */
80                                  lq_same_space:1,/* the ost's all have approx.
81                                                     the same space avail */
82                                  lq_reset:1;     /* zero current penalties */
83 };
84
85 struct lod_qos_oss {
86         struct obd_uuid          lqo_uuid;      /* ptlrpc's c_remote_uuid */
87         struct list_head         lqo_oss_list;  /* link to lov_qos */
88         __u64                    lqo_bavail;    /* total bytes avail on OSS */
89         __u64                    lqo_penalty;   /* current penalty */
90         __u64                    lqo_penalty_per_obj; /* penalty decrease
91                                                          every obj*/
92         time_t                   lqo_used;      /* last used time, seconds */
93         __u32                    lqo_ost_count; /* number of osts on this oss */
94 };
95
96 struct ltd_qos {
97         struct lod_qos_oss      *ltq_oss;       /* oss info */
98         __u64                    ltq_penalty;   /* current penalty */
99         __u64                    ltq_penalty_per_obj; /* penalty decrease
100                                                          every obj*/
101         __u64                    ltq_weight;    /* net weighting */
102         time_t                   ltq_used;      /* last used time, seconds */
103         bool                     ltq_usable:1;  /* usable for striping */
104 };
105
106 struct lod_tgt_desc {
107         struct dt_device  *ltd_tgt;
108         struct list_head   ltd_kill;
109         struct obd_export *ltd_exp;
110         struct obd_uuid    ltd_uuid;
111         __u32              ltd_gen;
112         __u32              ltd_index;
113         struct ltd_qos     ltd_qos; /* qos info per target */
114         struct obd_statfs  ltd_statfs;
115         unsigned long      ltd_active:1,/* is this target up for requests */
116                            ltd_activate:1,/* should  target be activated */
117                            ltd_reap:1;  /* should this target be deleted */
118 };
119
120 #define TGT_PTRS                256     /* number of pointers at 1st level */
121 #define TGT_PTRS_PER_BLOCK      256     /* number of pointers at 2nd level */
122
123 struct lod_tgt_desc_idx {
124         struct lod_tgt_desc *ldi_tgt[TGT_PTRS_PER_BLOCK];
125 };
126
127 #define LTD_TGT(ltd, index)      \
128          ((ltd)->ltd_tgt_idx[(index) / \
129          TGT_PTRS_PER_BLOCK]->ldi_tgt[(index) % TGT_PTRS_PER_BLOCK])
130
131 #define OST_TGT(lod, index)   LTD_TGT(&lod->lod_ost_descs, index)
132 struct lod_tgt_descs {
133         /* list of known TGTs */
134         struct lod_tgt_desc_idx *ltd_tgt_idx[TGT_PTRS];
135         /* Size of the lod_tgts array, granted to be a power of 2 */
136         __u32                   ltd_tgts_size;
137         /* number of registered TGTs */
138         int                     ltd_tgtnr;
139         /* bitmap of TGTs available */
140         cfs_bitmap_t            *ltd_tgt_bitmap;
141         /* TGTs scheduled to be deleted */
142         __u32                   ltd_death_row;
143         /* Table refcount used for delayed deletion */
144         int                     ltd_refcount;
145         /* mutex to serialize concurrent updates to the tgt table */
146         struct mutex            ltd_mutex;
147         /* read/write semaphore used for array relocation */
148         struct rw_semaphore     ltd_rw_sem;
149 };
150
151 struct lod_device {
152         struct dt_device      lod_dt_dev;
153         struct obd_export    *lod_child_exp;
154         struct dt_device     *lod_child;
155         cfs_proc_dir_entry_t *lod_proc_entry;
156         struct lprocfs_stats *lod_stats;
157         spinlock_t            lod_connects_lock;
158         int                   lod_connects;
159         unsigned int          lod_recovery_completed:1,
160                               lod_initialized:1;
161
162         /* lov settings descriptor storing static information */
163         struct lov_desc       lod_desc;
164
165         /* use to protect ld_active_tgt_count and all ltd_active */
166         spinlock_t           lod_desc_lock;
167
168         /* Description of OST */
169         struct lod_tgt_descs  lod_ost_descs;
170         /* Description of MDT */
171         struct lod_tgt_descs  lod_mdt_descs;
172
173         /* maximum EA size underlied OSD may have */
174         unsigned int          lod_osd_max_easize;
175
176         /*FIXME: When QOS and pool is implemented for MDT, probably these
177          * structure should be moved to lod_tgt_descs as well.
178          */
179         /* QoS info per LOD */
180         struct lod_qos        lod_qos; /* qos info per lod */
181
182         /* OST pool data */
183         struct ost_pool       lod_pool_info; /* all OSTs in a packed array */
184         int                   lod_pool_count;
185         cfs_hash_t           *lod_pools_hash_body; /* used for key access */
186         cfs_list_t            lod_pool_list; /* used for sequential access */
187         cfs_proc_dir_entry_t *lod_pool_proc_entry;
188
189         enum lustre_sec_part   lod_sp_me;
190
191         cfs_proc_dir_entry_t *lod_symlink;
192 };
193
194 #define lod_osts        lod_ost_descs.ltd_tgts
195 #define lod_ost_bitmap  lod_ost_descs.ltd_tgt_bitmap
196 #define lod_ostnr       lod_ost_descs.ltd_tgtnr
197 #define lod_osts_size   lod_ost_descs.ltd_tgts_size
198 #define ltd_ost         ltd_tgt
199 #define lod_ost_desc    lod_tgt_desc
200
201 /*
202  * XXX: shrink this structure, currently it's 72bytes on 32bit arch,
203  *      so, slab will be allocating 128bytes
204  */
205 struct lod_object {
206         struct dt_object   ldo_obj;
207
208         /* if object is striped, then the next fields describe stripes */
209         __u16              ldo_stripenr;
210         __u16              ldo_layout_gen;
211         __u32              ldo_stripe_size;
212         __u32              ldo_pattern;
213         __u16              ldo_released_stripenr;
214         char              *ldo_pool;
215         struct dt_object **ldo_stripe;
216         /* to know how much memory to free, ldo_stripenr can be less */
217         /* default striping for directory represented by this object
218          * is cached in stripenr/stripe_size */
219         unsigned int       ldo_stripes_allocated:16,
220                            ldo_striping_cached:1,
221                            ldo_def_striping_set:1;
222         __u32              ldo_def_stripe_size;
223         __u16              ldo_def_stripenr;
224         __u16              ldo_def_stripe_offset;
225         mdsno_t            ldo_mds_num;
226 };
227
228
229 struct lod_it {
230         struct dt_object        *lit_obj; /* object from the layer below */
231         struct dt_it            *lit_it;  /* iterator from the layer below */
232 };
233
234 struct lod_thread_info {
235         /* per-thread buffer for LOV EA */
236         void             *lti_ea_store;
237         int               lti_ea_store_size;
238         struct lu_buf     lti_buf;
239         struct ost_id     lti_ostid;
240         struct lu_fid     lti_fid;
241         struct obd_statfs lti_osfs;
242         struct lu_attr    lti_attr;
243         struct lod_it     lti_it;
244 };
245
246 extern const struct lu_device_operations lod_lu_ops;
247
248 static inline int lu_device_is_lod(struct lu_device *d)
249 {
250         return ergo(d != NULL && d->ld_ops != NULL, d->ld_ops == &lod_lu_ops);
251 }
252
253 static inline struct lod_device* lu2lod_dev(struct lu_device *d)
254 {
255         LASSERT(lu_device_is_lod(d));
256         return container_of0(d, struct lod_device, lod_dt_dev.dd_lu_dev);
257 }
258
259 static inline struct lu_device *lod2lu_dev(struct lod_device *d)
260 {
261         return &d->lod_dt_dev.dd_lu_dev;
262 }
263
264 static inline struct obd_device *lod2obd(struct lod_device *d)
265 {
266         return d->lod_dt_dev.dd_lu_dev.ld_obd;
267 }
268
269 static inline struct lod_device *dt2lod_dev(struct dt_device *d)
270 {
271         LASSERT(lu_device_is_lod(&d->dd_lu_dev));
272         return container_of0(d, struct lod_device, lod_dt_dev);
273 }
274
275 static inline struct lod_object *lu2lod_obj(struct lu_object *o)
276 {
277         LASSERT(ergo(o != NULL, lu_device_is_lod(o->lo_dev)));
278         return container_of0(o, struct lod_object, ldo_obj.do_lu);
279 }
280
281 static inline struct lu_object *lod2lu_obj(struct lod_object *obj)
282 {
283         return &obj->ldo_obj.do_lu;
284 }
285
286 static inline struct lod_object *lod_obj(const struct lu_object *o)
287 {
288         LASSERT(lu_device_is_lod(o->lo_dev));
289         return container_of0(o, struct lod_object, ldo_obj.do_lu);
290 }
291
292 static inline struct lod_object *lod_dt_obj(const struct dt_object *d)
293 {
294         return lod_obj(&d->do_lu);
295 }
296
297 static inline struct dt_object* lod_object_child(struct lod_object *o)
298 {
299         return container_of0(lu_object_next(lod2lu_obj(o)),
300                         struct dt_object, do_lu);
301 }
302
303 static inline struct dt_object *dt_object_child(struct dt_object *o)
304 {
305         return container_of0(lu_object_next(&(o)->do_lu),
306                         struct dt_object, do_lu);
307 }
308
309 extern struct lu_context_key lod_thread_key;
310
311 static inline struct lod_thread_info *lod_env_info(const struct lu_env *env)
312 {
313         struct lod_thread_info *info;
314         info = lu_context_key_get(&env->le_ctx, &lod_thread_key);
315         LASSERT(info);
316         return info;
317 }
318
319 #define lod_foreach_ost(__dev, index)   \
320         if ((__dev)->lod_osts_size > 0) \
321                 cfs_foreach_bit((__dev)->lod_ost_bitmap, (index))
322
323 /* lod_dev.c */
324 int lod_fld_lookup(const struct lu_env *env, struct lod_device *lod,
325                    const struct lu_fid *fid, mdsno_t *tgt, int flags);
326 /* lod_lov.c */
327 void lod_getref(struct lod_tgt_descs *ltd);
328 void lod_putref(struct lod_device *lod, struct lod_tgt_descs *ltd);
329 int lod_add_device(const struct lu_env *env, struct lod_device *lod,
330                    char *osp, unsigned index, unsigned gen, int mdt_index,
331                    char *type, int active);
332 int lod_del_device(const struct lu_env *env, struct lod_device *lod,
333                    struct lod_tgt_descs *ltd, char *osp, unsigned idx,
334                    unsigned gen);
335 int lod_fini_tgt(struct lod_device *lod, struct lod_tgt_descs *ltd);
336 int lod_load_striping(const struct lu_env *env, struct lod_object *mo);
337 int lod_get_lov_ea(const struct lu_env *env, struct lod_object *mo);
338 void lod_fix_desc(struct lov_desc *desc);
339 void lod_fix_desc_qos_maxage(__u32 *val);
340 void lod_fix_desc_pattern(__u32 *val);
341 void lod_fix_desc_stripe_count(__u32 *val);
342 void lod_fix_desc_stripe_size(__u64 *val);
343 int lod_pools_init(struct lod_device *m, struct lustre_cfg *cfg);
344 int lod_pools_fini(struct lod_device *m);
345 int lod_parse_striping(const struct lu_env *env, struct lod_object *mo,
346                        const struct lu_buf *buf);
347 int lod_initialize_objects(const struct lu_env *env, struct lod_object *mo,
348                            struct lov_ost_data_v1 *objs);
349 int lod_store_def_striping(const struct lu_env *env, struct dt_object *dt,
350                            struct thandle *th);
351 int lod_verify_striping(struct lod_device *d, const struct lu_buf *buf, int specific);
352 int lod_generate_and_set_lovea(const struct lu_env *env,
353                                struct lod_object *mo, struct thandle *th);
354
355 /* lod_pool.c */
356 int lod_ost_pool_add(struct ost_pool *op, __u32 idx, unsigned int min_count);
357 int lod_ost_pool_remove(struct ost_pool *op, __u32 idx);
358 int lod_ost_pool_extend(struct ost_pool *op, unsigned int min_count);
359 struct pool_desc *lod_find_pool(struct lod_device *lod, char *poolname);
360 void lod_pool_putref(struct pool_desc *pool);
361 int lod_ost_pool_free(struct ost_pool *op);
362 int lod_pool_del(struct obd_device *obd, char *poolname);
363 int lod_ost_pool_init(struct ost_pool *op, unsigned int count);
364 extern cfs_hash_ops_t pool_hash_operations;
365 int lod_check_index_in_pool(__u32 idx, struct pool_desc *pool);
366 int lod_pool_new(struct obd_device *obd, char *poolname);
367 int lod_pool_add(struct obd_device *obd, char *poolname, char *ostname);
368 int lod_pool_remove(struct obd_device *obd, char *poolname, char *ostname);
369
370 /* lod_qos.c */
371 int lod_qos_prep_create(const struct lu_env *env, struct lod_object *lo,
372                         struct lu_attr *attr, const struct lu_buf *buf,
373                         struct thandle *th);
374 int qos_add_tgt(struct lod_device*, struct lod_tgt_desc *);
375 int qos_del_tgt(struct lod_device *, struct lod_tgt_desc *);
376
377 /* lproc_lod.c */
378 void lprocfs_lod_init_vars(struct lprocfs_static_vars *lvars);
379 int lod_procfs_init(struct lod_device *lod);
380 void lod_procfs_fini(struct lod_device *lod);
381
382 /* lod_object.c */
383 int lod_object_set_pool(struct lod_object *o, char *pool);
384 int lod_declare_striped_object(const struct lu_env *env, struct dt_object *dt,
385                                struct lu_attr *attr,
386                                const struct lu_buf *lovea, struct thandle *th);
387 int lod_striping_create(const struct lu_env *env, struct dt_object *dt,
388                         struct lu_attr *attr, struct dt_object_format *dof,
389                         struct thandle *th);
390 void lod_object_free_striping(const struct lu_env *env, struct lod_object *lo);
391
392 #endif
393