Whamcloud - gitweb
LU-1303 lod: QoS allocation policy
[fs/lustre-release.git] / lustre / lod / lod_internal.h
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9
10  * This program is distributed in the hope that it will be useful,
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13  * GNU General Public License version 2 for more details.  A copy is
14  * included in the COPYING file that accompanied this code.
15
16  * You should have received a copy of the GNU General Public License
17  * along with this program; if not, write to the Free Software
18  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright  2009 Sun Microsystems, Inc. All rights reserved
24  * Use is subject to license terms.
25  */
26 /*
27  * This file is part of Lustre, http://www.lustre.org/
28  * Lustre is a trademark of Sun Microsystems, Inc.
29  *
30  * lustre/lod/lod_internal.h
31  *
32  * Author: Alex Zhuravlev <alexey.zhuravlev@intel.com>
33  * Author: Mikhail Pershin <mike.pershin@intel.com>
34  */
35
36 #ifndef _LOD_INTERNAL_H
37 #define _LOD_INTERNAL_H
38
39 #include <libcfs/libcfs.h>
40 #include <obd.h>
41 #include <dt_object.h>
42
43 #define LOV_USES_ASSIGNED_STRIPE        0
44 #define LOV_USES_DEFAULT_STRIPE         1
45
46 struct lod_ost_desc {
47         struct dt_device  *ltd_ost;
48         struct list_head   ltd_kill;
49         struct obd_export *ltd_exp;
50         struct obd_uuid    ltd_uuid;
51         __u32              ltd_gen;
52         __u32              ltd_index;
53         struct ltd_qos     ltd_qos; /* qos info per target */
54         struct obd_statfs  ltd_statfs;
55         unsigned long      ltd_active:1,/* is this target up for requests */
56                            ltd_activate:1,/* should  target be activated */
57                            ltd_reap:1;  /* should this target be deleted */
58 };
59
60 #define OST_PTRS                256     /* number of pointers at 1st level */
61 #define OST_PTRS_PER_BLOCK      256     /* number of pointers at 2nd level */
62
63 struct lod_ost_desc_idx {
64         struct lod_ost_desc *ldi_ost[OST_PTRS_PER_BLOCK];
65 };
66
67 #define OST_TGT(dev,index)      \
68         ((dev)->lod_ost_idx[(index) / \
69         OST_PTRS_PER_BLOCK]->ldi_ost[(index)%OST_PTRS_PER_BLOCK])
70
71 struct lod_device {
72         struct dt_device      lod_dt_dev;
73         struct obd_export    *lod_child_exp;
74         struct dt_device     *lod_child;
75         cfs_proc_dir_entry_t *lod_proc_entry;
76         struct lprocfs_stats *lod_stats;
77         int                   lod_connects;
78         int                   lod_recovery_completed;
79
80         /* lov settings descriptor storing static information */
81         struct lov_desc       lod_desc;
82
83         /* use to protect ld_active_tgt_count and all ltd_active */
84         cfs_spinlock_t        lod_desc_lock;
85
86         /* list of known OSTs */
87         struct lod_ost_desc_idx *lod_ost_idx[OST_PTRS];
88
89         /* Size of the lod_osts array, granted to be a power of 2 */
90         __u32                 lod_osts_size;
91         /* number of registered OSTs */
92         int                   lod_ostnr;
93         /* OSTs scheduled to be deleted */
94         __u32                 lod_death_row;
95         /* bitmap of OSTs available */
96         cfs_bitmap_t         *lod_ost_bitmap;
97
98         /* maximum EA size underlied OSD may have */
99         unsigned int          lod_osd_max_easize;
100
101         /* Table refcount used for delayed deletion */
102         int                   lod_refcount;
103         /* mutex to serialize concurrent updates to the ost table */
104         cfs_mutex_t           lod_mutex;
105         /* read/write semaphore used for array relocation */
106         cfs_rw_semaphore_t    lod_rw_sem;
107
108         /* QoS info per LOD */
109         struct lov_qos        lod_qos; /* qos info per lod */
110
111         /* OST pool data */
112         struct ost_pool       lod_pool_info; /* all OSTs in a packed array */
113         int                   lod_pool_count;
114         cfs_hash_t           *lod_pools_hash_body; /* used for key access */
115         cfs_list_t            lod_pool_list; /* used for sequential access */
116         cfs_proc_dir_entry_t *lod_pool_proc_entry;
117
118         enum lustre_sec_part   lod_sp_me;
119
120         cfs_proc_dir_entry_t *lod_symlink;
121 };
122
123 /*
124  * XXX: shrink this structure, currently it's 72bytes on 32bit arch,
125  *      so, slab will be allocating 128bytes
126  */
127 struct lod_object {
128         struct dt_object   ldo_obj;
129
130         /* if object is striped, then the next fields describe stripes */
131         __u16              ldo_stripenr;
132         __u16              ldo_layout_gen;
133         __u32              ldo_stripe_size;
134         char              *ldo_pool;
135         struct dt_object **ldo_stripe;
136         /* to know how much memory to free, ldo_stripenr can be less */
137         int                ldo_stripes_allocated;
138         /* default striping for directory represented by this object
139          * is cached in stripenr/stripe_size */
140         int                ldo_striping_cached:1;
141         int                ldo_def_striping_set:1;
142         __u32              ldo_def_stripe_size;
143         __u16              ldo_def_stripenr;
144         __u16              ldo_def_stripe_offset;
145 };
146
147
148 struct lod_thread_info {
149         /* per-thread buffer for LOV EA */
150         void             *lti_ea_store;
151         int               lti_ea_store_size;
152         struct lu_buf     lti_buf;
153         struct ost_id     lti_ostid;
154         struct lu_fid     lti_fid;
155         struct obd_statfs lti_osfs;
156         struct lu_attr    lti_attr;
157 };
158
159 extern const struct lu_device_operations lod_lu_ops;
160
161 static inline int lu_device_is_lod(struct lu_device *d)
162 {
163         return ergo(d != NULL && d->ld_ops != NULL, d->ld_ops == &lod_lu_ops);
164 }
165
166 static inline struct lod_device* lu2lod_dev(struct lu_device *d)
167 {
168         LASSERT(lu_device_is_lod(d));
169         return container_of0(d, struct lod_device, lod_dt_dev.dd_lu_dev);
170 }
171
172 static inline struct lu_device *lod2lu_dev(struct lod_device *d)
173 {
174         return &d->lod_dt_dev.dd_lu_dev;
175 }
176
177 static inline struct obd_device *lod2obd(struct lod_device *d)
178 {
179         return d->lod_dt_dev.dd_lu_dev.ld_obd;
180 }
181
182 static inline struct lod_device *dt2lod_dev(struct dt_device *d)
183 {
184         LASSERT(lu_device_is_lod(&d->dd_lu_dev));
185         return container_of0(d, struct lod_device, lod_dt_dev);
186 }
187
188 static inline struct lod_object *lu2lod_obj(struct lu_object *o)
189 {
190         LASSERT(ergo(o != NULL, lu_device_is_lod(o->lo_dev)));
191         return container_of0(o, struct lod_object, ldo_obj.do_lu);
192 }
193
194 static inline struct lu_object *lod2lu_obj(struct lod_object *obj)
195 {
196         return &obj->ldo_obj.do_lu;
197 }
198
199 static inline struct lod_object *lod_obj(const struct lu_object *o)
200 {
201         LASSERT(lu_device_is_lod(o->lo_dev));
202         return container_of0(o, struct lod_object, ldo_obj.do_lu);
203 }
204
205 static inline struct lod_object *lod_dt_obj(const struct dt_object *d)
206 {
207         return lod_obj(&d->do_lu);
208 }
209
210 static inline struct dt_object* lod_object_child(struct lod_object *o)
211 {
212         return container_of0(lu_object_next(lod2lu_obj(o)),
213                         struct dt_object, do_lu);
214 }
215
216 static inline struct dt_object *lu2dt_obj(struct lu_object *o)
217 {
218         LASSERT(ergo(o != NULL, lu_device_is_dt(o->lo_dev)));
219         return container_of0(o, struct dt_object, do_lu);
220 }
221
222 static inline struct dt_object *dt_object_child(struct dt_object *o)
223 {
224         return container_of0(lu_object_next(&(o)->do_lu),
225                         struct dt_object, do_lu);
226 }
227
228 extern struct lu_context_key lod_thread_key;
229
230 static inline struct lod_thread_info *lod_env_info(const struct lu_env *env)
231 {
232         struct lod_thread_info *info;
233         info = lu_context_key_get(&env->le_ctx, &lod_thread_key);
234         LASSERT(info);
235         return info;
236 }
237
238 #define lod_foreach_ost(__dev, index)   \
239         if ((__dev)->lod_osts_size > 0) \
240                 cfs_foreach_bit((__dev)->lod_ost_bitmap, (index))
241
242 /* lod_lov.c */
243 void lod_getref(struct lod_device *lod);
244 void lod_putref(struct lod_device *lod);
245 int lod_add_device(const struct lu_env *env, struct lod_device *m,
246                    char *osp, unsigned index, unsigned gen, int active);
247 int lod_del_device(const struct lu_env *env, struct lod_device *m,
248                    char *osp, unsigned index, unsigned gen);
249 int lod_load_striping(const struct lu_env *env, struct lod_object *mo);
250 int lod_get_lov_ea(const struct lu_env *env, struct lod_object *mo);
251 void lod_fix_desc(struct lov_desc *desc);
252 void lod_fix_desc_qos_maxage(__u32 *val);
253 void lod_fix_desc_pattern(__u32 *val);
254 void lod_fix_desc_stripe_count(__u32 *val);
255 void lod_fix_desc_stripe_size(__u64 *val);
256 int lod_pools_init(struct lod_device *m, struct lustre_cfg *cfg);
257 int lod_pools_fini(struct lod_device *m);
258 int lod_parse_striping(const struct lu_env *env, struct lod_object *mo,
259                        const struct lu_buf *buf);
260 int lod_initialize_objects(const struct lu_env *env, struct lod_object *mo,
261                            struct lov_ost_data_v1 *objs);
262 int lod_store_def_striping(const struct lu_env *env, struct dt_object *dt,
263                            struct thandle *th);
264 int lod_verify_striping(struct lod_device *d, const struct lu_buf *buf, int specific);
265 int lod_generate_and_set_lovea(const struct lu_env *env,
266                                struct lod_object *mo, struct thandle *th);
267
268 /* lod_pool.c */
269 int lod_ost_pool_add(struct ost_pool *op, __u32 idx, unsigned int min_count);
270 int lod_ost_pool_remove(struct ost_pool *op, __u32 idx);
271 int lod_ost_pool_extend(struct ost_pool *op, unsigned int min_count);
272 struct pool_desc *lod_find_pool(struct lod_device *lod, char *poolname);
273 void lod_pool_putref(struct pool_desc *pool);
274 int lod_ost_pool_free(struct ost_pool *op);
275 int lod_pool_del(struct obd_device *obd, char *poolname);
276 int lod_ost_pool_init(struct ost_pool *op, unsigned int count);
277 extern cfs_hash_ops_t pool_hash_operations;
278 int lod_check_index_in_pool(__u32 idx, struct pool_desc *pool);
279 int lod_pool_new(struct obd_device *obd, char *poolname);
280 int lod_pool_add(struct obd_device *obd, char *poolname, char *ostname);
281 int lod_pool_remove(struct obd_device *obd, char *poolname, char *ostname);
282
283 /* lod_qos.c */
284 int lod_qos_prep_create(const struct lu_env *env, struct lod_object *lo,
285                         struct lu_attr *attr, const struct lu_buf *buf,
286                         struct thandle *th);
287 int qos_add_tgt(struct lod_device*, struct lod_ost_desc *);
288 int qos_del_tgt(struct lod_device *, struct lod_ost_desc *);
289
290 /* lproc_lod.c */
291 extern struct file_operations lod_proc_target_fops;
292 void lprocfs_lod_init_vars(struct lprocfs_static_vars *lvars);
293
294 /* lod_object.c */
295 int lod_object_set_pool(struct lod_object *o, char *pool);
296 int lod_declare_striped_object(const struct lu_env *env, struct dt_object *dt,
297                                struct lu_attr *attr,
298                                const struct lu_buf *lovea, struct thandle *th);
299 int lod_striping_create(const struct lu_env *env, struct dt_object *dt,
300                         struct lu_attr *attr, struct dt_object_format *dof,
301                         struct thandle *th);
302 void lod_object_free_striping(const struct lu_env *env, struct lod_object *lo);
303
304 #endif
305