Whamcloud - gitweb
LU-1856 build: fix 'out-of-bounds write' errors
[fs/lustre-release.git] / lustre / mdt / mdt_internal.h
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2012, Whamcloud, Inc.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/mdt/mdt_internal.h
37  *
38  * Lustre Metadata Target (mdt) request handler
39  *
40  * Author: Peter Braam <braam@clusterfs.com>
41  * Author: Andreas Dilger <adilger@clusterfs.com>
42  * Author: Phil Schwan <phil@clusterfs.com>
43  * Author: Mike Shaver <shaver@clusterfs.com>
44  * Author: Nikita Danilov <nikita@clusterfs.com>
45  * Author: Huang Hua <huanghua@clusterfs.com>
46  */
47
48 #ifndef _MDT_INTERNAL_H
49 #define _MDT_INTERNAL_H
50
51 #if defined(__KERNEL__)
52
53 /*
54  * struct ptlrpc_client
55  */
56 #include <lustre_net.h>
57 #include <obd.h>
58 /*
59  * struct obd_connect_data
60  * struct lustre_handle
61  */
62 #include <lustre/lustre_idl.h>
63 #include <lustre_disk.h>
64 #include <lu_target.h>
65 #include <md_object.h>
66 #include <lustre_fid.h>
67 #include <lustre_fld.h>
68 #include <lustre_req_layout.h>
69 #include <lustre_sec.h>
70 #include <lvfs.h>
71 #include <lustre_idmap.h>
72 #include <lustre_eacl.h>
73 #include <lustre_fsfilt.h>
74
75 /* check if request's xid is equal to last one or not*/
76 static inline int req_xid_is_last(struct ptlrpc_request *req)
77 {
78         struct lsd_client_data *lcd = req->rq_export->exp_target_data.ted_lcd;
79         return (req->rq_xid == lcd->lcd_last_xid ||
80                 req->rq_xid == lcd->lcd_last_close_xid);
81 }
82
83 struct mdt_object;
84 /* file data for open files on MDS */
85 struct mdt_file_data {
86         struct portals_handle mfd_handle; /* must be first */
87         int                   mfd_mode;   /* open mode provided by client */
88         cfs_list_t            mfd_list;   /* protected by med_open_lock */
89         __u64                 mfd_xid;    /* xid of the open request */
90         struct lustre_handle  mfd_old_handle; /* old handle in replay case */
91         struct mdt_object    *mfd_object; /* point to opened object */
92 };
93
94 /* mdt state flag bits */
95 #define MDT_FL_CFGLOG 0
96 #define MDT_FL_SYNCED 1
97
98 struct mdt_device {
99         /* super-class */
100         struct md_device           mdt_md_dev;
101         struct md_site             mdt_mite;
102         struct ptlrpc_service     *mdt_regular_service;
103         struct ptlrpc_service     *mdt_readpage_service;
104         struct ptlrpc_service     *mdt_xmds_service;
105         struct ptlrpc_service     *mdt_setattr_service;
106         struct ptlrpc_service     *mdt_mdsc_service;
107         struct ptlrpc_service     *mdt_mdss_service;
108         struct ptlrpc_service     *mdt_dtss_service;
109         struct ptlrpc_service     *mdt_fld_service;
110         /* DLM name-space for meta-data locks maintained by this server */
111         struct ldlm_namespace     *mdt_namespace;
112         /* ptlrpc handle for MDS->client connections (for lock ASTs). */
113         struct ptlrpc_client      *mdt_ldlm_client;
114         /* underlying device */
115         struct obd_export         *mdt_child_exp;
116         struct md_device          *mdt_child;
117         struct dt_device          *mdt_bottom;
118         struct obd_export         *mdt_bottom_exp;
119         /** target device */
120         struct lu_target           mdt_lut;
121         /*
122          * Options bit-fields.
123          */
124         struct {
125                 signed int         mo_user_xattr :1,
126                                    mo_acl        :1,
127                                    mo_compat_resname:1,
128                                    mo_mds_capa   :1,
129                                    mo_oss_capa   :1,
130                                    mo_cos        :1;
131         } mdt_opts;
132         /* mdt state flags */
133         unsigned long              mdt_state;
134         /* lock to protect IOepoch */
135         cfs_spinlock_t             mdt_ioepoch_lock;
136         __u64                      mdt_ioepoch;
137
138         /* transaction callbacks */
139         struct dt_txn_callback     mdt_txn_cb;
140
141         /* these values should be updated from lov if necessary.
142          * or should be placed somewhere else. */
143         int                        mdt_max_mdsize;
144         int                        mdt_max_cookiesize;
145
146         struct upcall_cache        *mdt_identity_cache;
147
148         /* sptlrpc rules */
149         cfs_rwlock_t               mdt_sptlrpc_lock;
150         struct sptlrpc_rule_set    mdt_sptlrpc_rset;
151
152         /* capability keys */
153         unsigned long              mdt_capa_timeout;
154         __u32                      mdt_capa_alg;
155         struct dt_object          *mdt_ck_obj;
156         unsigned long              mdt_ck_timeout;
157         unsigned long              mdt_ck_expiry;
158         cfs_timer_t                mdt_ck_timer;
159         struct ptlrpc_thread       mdt_ck_thread;
160         struct lustre_capa_key     mdt_capa_keys[2];
161         unsigned int               mdt_capa_conf:1,
162                                    mdt_som_conf:1;
163
164         /* statfs optimization: we cache a bit  */
165         struct obd_statfs          mdt_osfs;
166         __u64                      mdt_osfs_age;
167         cfs_spinlock_t             mdt_osfs_lock;
168
169         /* root squash */
170         uid_t                      mdt_squash_uid;
171         gid_t                      mdt_squash_gid;
172         cfs_list_t                 mdt_nosquash_nids;
173         char                      *mdt_nosquash_str;
174         int                        mdt_nosquash_strlen;
175         cfs_rw_semaphore_t         mdt_squash_sem;
176
177         cfs_proc_dir_entry_t      *mdt_proc_entry;
178         struct lprocfs_stats      *mdt_stats;
179         int                        mdt_sec_level;
180         struct rename_stats        mdt_rename_stats;
181 };
182
183 #define MDT_SERVICE_WATCHDOG_FACTOR     (2)
184 #define MDT_ROCOMPAT_SUPP       (OBD_ROCOMPAT_LOVOBJID)
185 #define MDT_INCOMPAT_SUPP       (OBD_INCOMPAT_MDT | OBD_INCOMPAT_COMMON_LR | \
186                                  OBD_INCOMPAT_FID | OBD_INCOMPAT_IAM_DIR | \
187                                  OBD_INCOMPAT_LMM_VER | OBD_INCOMPAT_MULTI_OI)
188 #define MDT_COS_DEFAULT         (0)
189
190 struct mdt_object {
191         struct lu_object_header mot_header;
192         struct md_object        mot_obj;
193         __u64                   mot_ioepoch;
194         __u64                   mot_flags;
195         int                     mot_ioepoch_count;
196         int                     mot_writecount;
197         /* Lock to protect object's IO epoch. */
198         cfs_mutex_t             mot_ioepoch_mutex;
199         /* Lock to protect create_data */
200         cfs_mutex_t             mot_lov_mutex;
201 };
202
203 enum mdt_object_flags {
204         /** SOM attributes are changed. */
205         MOF_SOM_CHANGE  = (1 << 0),
206         /**
207          * The SOM recovery state for mdt object.
208          * This state is an in-memory equivalent of an absent SOM EA, used
209          * instead of invalidating SOM EA while IOEpoch is still opened when
210          * a client eviction occurs or a client fails to obtain SOM attributes.
211          * It indicates that the last IOEpoch holder will need to obtain SOM
212          * attributes under [0;EOF] extent lock to flush all the client's
213          * cached of evicted from MDS clients (but not necessary evicted from
214          * OST) before taking ost attributes.
215          */
216         MOF_SOM_RECOV   = (1 << 1),
217         /** File has been just created. */
218         MOF_SOM_CREATED = (1 << 2),
219         /** lov object has been created. */
220         MOF_LOV_CREATED = (1 << 3),
221 };
222
223 struct mdt_lock_handle {
224         /* Lock type, reg for cross-ref use or pdo lock. */
225         mdl_type_t              mlh_type;
226
227         /* Regular lock */
228         struct lustre_handle    mlh_reg_lh;
229         ldlm_mode_t             mlh_reg_mode;
230
231         /* Pdirops lock */
232         struct lustre_handle    mlh_pdo_lh;
233         ldlm_mode_t             mlh_pdo_mode;
234         unsigned int            mlh_pdo_hash;
235 };
236
237 enum {
238         MDT_LH_PARENT, /* parent lockh */
239         MDT_LH_CHILD,  /* child lockh */
240         MDT_LH_OLD,    /* old lockh for rename */
241         MDT_LH_NEW,    /* new lockh for rename */
242         MDT_LH_RMT,    /* used for return lh to caller */
243         MDT_LH_NR
244 };
245
246 enum {
247         MDT_LOCAL_LOCK,
248         MDT_CROSS_LOCK
249 };
250
251 struct mdt_reint_record {
252         mdt_reint_t             rr_opcode;
253         const struct lustre_handle *rr_handle;
254         const struct lu_fid    *rr_fid1;
255         const struct lu_fid    *rr_fid2;
256         const char             *rr_name;
257         int                     rr_namelen;
258         const char             *rr_tgt;
259         int                     rr_tgtlen;
260         const void             *rr_eadata;
261         int                     rr_eadatalen;
262         int                     rr_logcookielen;
263         const struct llog_cookie  *rr_logcookies;
264         __u32                   rr_flags;
265 };
266
267 enum mdt_reint_flag {
268         MRF_OPEN_TRUNC = 1 << 0,
269 };
270
271 /*
272  * Common data shared by mdt-level handlers. This is allocated per-thread to
273  * reduce stack consumption.
274  */
275 struct mdt_thread_info {
276         /*
277          * XXX: Part One:
278          * The following members will be filled explicitly
279          * with specific data in mdt_thread_info_init().
280          */
281         /* TODO: move this into mdt_session_key(with LCT_SESSION), because
282          * request handling may migrate from one server thread to another.
283          */
284         struct req_capsule        *mti_pill;
285
286         /* although we have export in req, there are cases when it is not
287          * available, e.g. closing files upon export destroy */
288         struct obd_export          *mti_exp;
289         /*
290          * A couple of lock handles.
291          */
292         struct mdt_lock_handle     mti_lh[MDT_LH_NR];
293
294         struct mdt_device         *mti_mdt;
295         const struct lu_env       *mti_env;
296
297         /*
298          * Additional fail id that can be set by handler. Passed to
299          * target_send_reply().
300          */
301         int                        mti_fail_id;
302
303         /* transaction number of current request */
304         __u64                      mti_transno;
305
306
307         /*
308          * XXX: Part Two:
309          * The following members will be filled expilictly
310          * with zero in mdt_thread_info_init(). These members may be used
311          * by all requests.
312          */
313
314         /*
315          * Object attributes.
316          */
317         struct md_attr             mti_attr;
318         /*
319          * Body for "habeo corpus" operations.
320          */
321         const struct mdt_body     *mti_body;
322         /*
323          * Host object. This is released at the end of mdt_handler().
324          */
325         struct mdt_object         *mti_object;
326         /*
327          * Lock request for "habeo clavis" operations.
328          */
329         const struct ldlm_request *mti_dlm_req;
330
331         __u32                      mti_has_trans:1, /* has txn already? */
332                                    mti_no_need_trans:1,
333                                    mti_cross_ref:1;
334
335         /* opdata for mdt_reint_open(), has the same as
336          * ldlm_reply:lock_policy_res1.  mdt_update_last_rcvd() stores this
337          * value onto disk for recovery when mdt_trans_stop_cb() is called.
338          */
339         __u64                      mti_opdata;
340
341         /*
342          * XXX: Part Three:
343          * The following members will be filled explicitly
344          * with zero in mdt_reint_unpack(), because they are only used
345          * by reint requests (including mdt_reint_open()).
346          */
347
348         /*
349          * reint record. contains information for reint operations.
350          */
351         struct mdt_reint_record    mti_rr;
352
353         /** md objects included in operation */
354         struct mdt_object         *mti_mos;
355         __u64                      mti_ver[PTLRPC_NUM_VERSIONS];
356         /*
357          * Operation specification (currently create and lookup)
358          */
359         struct md_op_spec          mti_spec;
360
361         /*
362          * XXX: Part Four:
363          * The following members will _NOT_ be initialized at all.
364          * DO NOT expect them to contain any valid value.
365          * They should be initialized explicitly by the user themselves.
366          */
367
368          /* XXX: If something is in a union, make sure they do not conflict */
369
370         struct lu_fid              mti_tmp_fid1;
371         struct lu_fid              mti_tmp_fid2;
372         ldlm_policy_data_t         mti_policy;    /* for mdt_object_lock() and
373                                                    * mdt_rename_lock() */
374         struct ldlm_res_id         mti_res_id;    /* for mdt_object_lock() and
375                                                      mdt_rename_lock()   */
376         union {
377                 struct obd_uuid    uuid[2];       /* for mdt_seq_init_cli()  */
378                 char               ns_name[48];   /* for mdt_init0()         */
379                 struct lustre_cfg_bufs bufs;      /* for mdt_stack_fini()    */
380                 struct obd_statfs  osfs;          /* for mdt_statfs()        */
381                 struct {
382                         /* for mdt_readpage()      */
383                         struct lu_rdpg     mti_rdpg;
384                         /* for mdt_sendpage()      */
385                         struct l_wait_info mti_wait_info;
386                 } rdpg;
387                 struct {
388                         struct md_attr attr;
389                         struct md_som_data data;
390                 } som;
391         } mti_u;
392
393         /* IO epoch related stuff. */
394         struct mdt_ioepoch        *mti_ioepoch;
395         __u64                      mti_replayepoch;
396
397         loff_t                     mti_off;
398         struct lu_buf              mti_buf;
399         struct lustre_capa_key     mti_capa_key;
400
401         /* Ops object filename */
402         struct lu_name             mti_name;
403 };
404
405 static inline const struct md_device_operations *
406 mdt_child_ops(struct mdt_device * m)
407 {
408         LASSERT(m->mdt_child);
409         return m->mdt_child->md_ops;
410 }
411
412 static inline struct md_object *mdt_object_child(struct mdt_object *o)
413 {
414         LASSERT(o);
415         return lu2md(lu_object_next(&o->mot_obj.mo_lu));
416 }
417
418 static inline struct ptlrpc_request *mdt_info_req(struct mdt_thread_info *info)
419 {
420          return info->mti_pill ? info->mti_pill->rc_req : NULL;
421 }
422
423 static inline int req_is_replay(struct ptlrpc_request *req)
424 {
425         LASSERT(req->rq_reqmsg);
426         return !!(lustre_msg_get_flags(req->rq_reqmsg) & MSG_REPLAY);
427 }
428
429 static inline __u64 mdt_conn_flags(struct mdt_thread_info *info)
430 {
431         LASSERT(info->mti_exp);
432         return info->mti_exp->exp_connect_flags;
433 }
434
435 static inline void mdt_object_get(const struct lu_env *env,
436                                   struct mdt_object *o)
437 {
438         ENTRY;
439         lu_object_get(&o->mot_obj.mo_lu);
440         EXIT;
441 }
442
443 static inline void mdt_object_put(const struct lu_env *env,
444                                   struct mdt_object *o)
445 {
446         ENTRY;
447         lu_object_put(env, &o->mot_obj.mo_lu);
448         EXIT;
449 }
450
451 static inline int mdt_object_exists(const struct mdt_object *o)
452 {
453         return lu_object_exists(&o->mot_obj.mo_lu);
454 }
455
456 static inline const struct lu_fid *mdt_object_fid(const struct mdt_object *o)
457 {
458         return lu_object_fid(&o->mot_obj.mo_lu);
459 }
460
461 static inline int mdt_object_obf(const struct mdt_object *o)
462 {
463         return lu_fid_eq(mdt_object_fid(o), &LU_OBF_FID);
464 }
465
466 static inline struct lu_site *mdt_lu_site(const struct mdt_device *mdt)
467 {
468         return mdt->mdt_md_dev.md_lu_dev.ld_site;
469 }
470
471 static inline struct md_site *mdt_md_site(struct mdt_device *mdt)
472 {
473         return &mdt->mdt_mite;
474 }
475
476 static inline void mdt_export_evict(struct obd_export *exp)
477 {
478         class_fail_export(exp);
479         class_export_put(exp);
480 }
481
482 int mdt_get_disposition(struct ldlm_reply *rep, int flag);
483 void mdt_set_disposition(struct mdt_thread_info *info,
484                         struct ldlm_reply *rep, int flag);
485 void mdt_clear_disposition(struct mdt_thread_info *info,
486                         struct ldlm_reply *rep, int flag);
487
488 void mdt_lock_pdo_init(struct mdt_lock_handle *lh,
489                        ldlm_mode_t lm, const char *name,
490                        int namelen);
491
492 void mdt_lock_reg_init(struct mdt_lock_handle *lh,
493                        ldlm_mode_t lm);
494
495 int mdt_lock_setup(struct mdt_thread_info *info,
496                    struct mdt_object *o,
497                    struct mdt_lock_handle *lh);
498
499 int mdt_object_lock(struct mdt_thread_info *,
500                     struct mdt_object *,
501                     struct mdt_lock_handle *,
502                     __u64, int);
503
504 void mdt_object_unlock(struct mdt_thread_info *,
505                        struct mdt_object *,
506                        struct mdt_lock_handle *,
507                        int decref);
508
509 struct mdt_object *mdt_object_new(const struct lu_env *,
510                                   struct mdt_device *,
511                                   const struct lu_fid *);
512 struct mdt_object *mdt_object_find(const struct lu_env *,
513                                    struct mdt_device *,
514                                    const struct lu_fid *);
515 struct mdt_object *mdt_object_find_lock(struct mdt_thread_info *,
516                                         const struct lu_fid *,
517                                         struct mdt_lock_handle *,
518                                         __u64);
519 void mdt_object_unlock_put(struct mdt_thread_info *,
520                            struct mdt_object *,
521                            struct mdt_lock_handle *,
522                            int decref);
523
524 void mdt_client_compatibility(struct mdt_thread_info *info);
525
526 int mdt_close_unpack(struct mdt_thread_info *info);
527 int mdt_reint_unpack(struct mdt_thread_info *info, __u32 op);
528 int mdt_reint_rec(struct mdt_thread_info *, struct mdt_lock_handle *);
529 void mdt_pack_attr2body(struct mdt_thread_info *info, struct mdt_body *b,
530                         const struct lu_attr *attr, const struct lu_fid *fid);
531
532 int mdt_getxattr(struct mdt_thread_info *info);
533 int mdt_reint_setxattr(struct mdt_thread_info *info,
534                        struct mdt_lock_handle *lh);
535
536 void mdt_lock_handle_init(struct mdt_lock_handle *lh);
537 void mdt_lock_handle_fini(struct mdt_lock_handle *lh);
538
539 void mdt_reconstruct(struct mdt_thread_info *, struct mdt_lock_handle *);
540 void mdt_reconstruct_generic(struct mdt_thread_info *mti,
541                              struct mdt_lock_handle *lhc);
542
543 extern void target_recovery_fini(struct obd_device *obd);
544 extern void target_recovery_init(struct lu_target *lut,
545                                  svc_handler_t handler);
546 int mdt_fs_setup(const struct lu_env *, struct mdt_device *,
547                  struct obd_device *, struct lustre_sb_info *lsi);
548 void mdt_fs_cleanup(const struct lu_env *, struct mdt_device *);
549
550 int mdt_export_stats_init(struct obd_device *obd,
551                           struct obd_export *exp,
552                           void *client_nid);
553
554 int mdt_pin(struct mdt_thread_info* info);
555
556 int mdt_lock_new_child(struct mdt_thread_info *info,
557                        struct mdt_object *o,
558                        struct mdt_lock_handle *child_lockh);
559
560 void mdt_mfd_set_mode(struct mdt_file_data *mfd,
561                       int mode);
562
563 int mdt_reint_open(struct mdt_thread_info *info,
564                    struct mdt_lock_handle *lhc);
565
566 struct mdt_file_data *mdt_handle2mfd(struct mdt_thread_info *,
567                                      const struct lustre_handle *);
568
569 enum {
570         MDT_IOEPOCH_CLOSED  = 0,
571         MDT_IOEPOCH_OPENED  = 1,
572         MDT_IOEPOCH_GETATTR = 2,
573 };
574
575 enum {
576         MDT_SOM_DISABLE = 0,
577         MDT_SOM_ENABLE  = 1,
578 };
579
580 int mdt_ioepoch_open(struct mdt_thread_info *info, struct mdt_object *o,
581                      int created);
582 int mdt_object_is_som_enabled(struct mdt_object *mo);
583 int mdt_write_get(struct mdt_object *o);
584 void mdt_write_put(struct mdt_object *o);
585 int mdt_write_read(struct mdt_object *o);
586 struct mdt_file_data *mdt_mfd_new(void);
587 int mdt_mfd_close(struct mdt_thread_info *info, struct mdt_file_data *mfd);
588 void mdt_mfd_free(struct mdt_file_data *mfd);
589 int mdt_close(struct mdt_thread_info *info);
590 int mdt_attr_set(struct mdt_thread_info *info, struct mdt_object *mo,
591                  struct md_attr *ma, int flags);
592 int mdt_done_writing(struct mdt_thread_info *info);
593 int mdt_fix_reply(struct mdt_thread_info *info);
594 int mdt_handle_last_unlink(struct mdt_thread_info *, struct mdt_object *,
595                            const struct md_attr *);
596 void mdt_reconstruct_open(struct mdt_thread_info *, struct mdt_lock_handle *);
597
598 struct lu_buf *mdt_buf(const struct lu_env *env, void *area, ssize_t len);
599 const struct lu_buf *mdt_buf_const(const struct lu_env *env,
600                                    const void *area, ssize_t len);
601
602 void mdt_dump_lmm(int level, const struct lov_mds_md *lmm);
603
604 int mdt_check_ucred(struct mdt_thread_info *);
605 int mdt_init_ucred(struct mdt_thread_info *, struct mdt_body *);
606 int mdt_init_ucred_reint(struct mdt_thread_info *);
607 void mdt_exit_ucred(struct mdt_thread_info *);
608 int mdt_version_get_check(struct mdt_thread_info *, struct mdt_object *, int);
609 void mdt_version_get_save(struct mdt_thread_info *, struct mdt_object *, int);
610 int mdt_version_get_check_save(struct mdt_thread_info *, struct mdt_object *,
611                                int);
612
613 /* mdt_idmap.c */
614 int mdt_init_sec_level(struct mdt_thread_info *);
615 int mdt_init_idmap(struct mdt_thread_info *);
616 void mdt_cleanup_idmap(struct mdt_export_data *);
617 int mdt_handle_idmap(struct mdt_thread_info *);
618 int ptlrpc_user_desc_do_idmap(struct ptlrpc_request *,
619                               struct ptlrpc_user_desc *);
620 void mdt_body_reverse_idmap(struct mdt_thread_info *,
621                             struct mdt_body *);
622 int mdt_remote_perm_reverse_idmap(struct ptlrpc_request *,
623                                   struct mdt_remote_perm *);
624 int mdt_fix_attr_ucred(struct mdt_thread_info *, __u32);
625
626 static inline struct mdt_device *mdt_dev(struct lu_device *d)
627 {
628 //        LASSERT(lu_device_is_mdt(d));
629         return container_of0(d, struct mdt_device, mdt_md_dev.md_lu_dev);
630 }
631
632 static inline struct dt_object *mdt_obj2dt(struct mdt_object *mo)
633 {
634         struct lu_object *lo;
635         struct mdt_device *mdt = mdt_dev(mo->mot_obj.mo_lu.lo_dev);
636
637         lo = lu_object_locate(mo->mot_obj.mo_lu.lo_header,
638                               mdt->mdt_bottom->dd_lu_dev.ld_type);
639         return lu2dt(lo);
640 }
641
642 /* mdt/mdt_identity.c */
643 #define MDT_IDENTITY_UPCALL_PATH        "/usr/sbin/l_getidentity"
644
645 extern struct upcall_cache_ops mdt_identity_upcall_cache_ops;
646
647 struct md_identity *mdt_identity_get(struct upcall_cache *, __u32);
648
649 void mdt_identity_put(struct upcall_cache *, struct md_identity *);
650
651 void mdt_flush_identity(struct upcall_cache *, int);
652
653 __u32 mdt_identity_get_perm(struct md_identity *, __u32, lnet_nid_t);
654
655 int mdt_pack_remote_perm(struct mdt_thread_info *, struct mdt_object *, void *);
656
657 extern struct lu_context_key       mdt_thread_key;
658 /* debug issues helper starts here*/
659 static inline int mdt_fail_write(const struct lu_env *env,
660                                  struct dt_device *dd, int id)
661 {
662         if (OBD_FAIL_CHECK_ORSET(id, OBD_FAIL_ONCE)) {
663                 CERROR(LUSTRE_MDT_NAME": cfs_fail_loc=%x, fail write ops\n",
664                        id);
665                 return dd->dd_ops->dt_ro(env, dd);
666                 /* We set FAIL_ONCE because we never "un-fail" a device */
667         }
668
669         return 0;
670 }
671
672 static inline struct mdt_export_data *mdt_req2med(struct ptlrpc_request *req)
673 {
674         return &req->rq_export->exp_mdt_data;
675 }
676
677 typedef void (*mdt_reconstruct_t)(struct mdt_thread_info *mti,
678                                   struct mdt_lock_handle *lhc);
679 static inline int mdt_check_resent(struct mdt_thread_info *info,
680                                    mdt_reconstruct_t reconstruct,
681                                    struct mdt_lock_handle *lhc)
682 {
683         struct ptlrpc_request *req = mdt_info_req(info);
684         ENTRY;
685
686         if (lustre_msg_get_flags(req->rq_reqmsg) & MSG_RESENT) {
687                 if (req_xid_is_last(req)) {
688                         reconstruct(info, lhc);
689                         RETURN(1);
690                 }
691                 DEBUG_REQ(D_HA, req, "no reply for RESENT req (have "LPD64")",
692                           req->rq_export->exp_target_data.ted_lcd->lcd_last_xid);
693         }
694         RETURN(0);
695 }
696
697 struct md_ucred *mdt_ucred(const struct mdt_thread_info *info);
698
699 static inline int is_identity_get_disabled(struct upcall_cache *cache)
700 {
701         return cache ? (strcmp(cache->uc_upcall, "NONE") == 0) : 1;
702 }
703
704 int mdt_blocking_ast(struct ldlm_lock*, struct ldlm_lock_desc*, void*, int);
705
706 /* Issues dlm lock on passed @ns, @f stores it lock handle into @lh. */
707 static inline int mdt_fid_lock(struct ldlm_namespace *ns,
708                                struct lustre_handle *lh,
709                                ldlm_mode_t mode,
710                                ldlm_policy_data_t *policy,
711                                const struct ldlm_res_id *res_id,
712                                int flags, const __u64 *client_cookie)
713 {
714         int rc;
715
716         LASSERT(ns != NULL);
717         LASSERT(lh != NULL);
718
719         rc = ldlm_cli_enqueue_local(ns, res_id, LDLM_IBITS, policy,
720                                     mode, &flags, mdt_blocking_ast,
721                                     ldlm_completion_ast, NULL, NULL, 0,
722                                     client_cookie, lh);
723         return rc == ELDLM_OK ? 0 : -EIO;
724 }
725
726 static inline void mdt_fid_unlock(struct lustre_handle *lh,
727                                   ldlm_mode_t mode)
728 {
729         ldlm_lock_decref(lh, mode);
730 }
731
732 extern mdl_mode_t mdt_mdl_lock_modes[];
733 extern ldlm_mode_t mdt_dlm_lock_modes[];
734
735 static inline mdl_mode_t mdt_dlm_mode2mdl_mode(ldlm_mode_t mode)
736 {
737         LASSERT(IS_PO2(mode));
738         return mdt_mdl_lock_modes[mode];
739 }
740
741 static inline ldlm_mode_t mdt_mdl_mode2dlm_mode(mdl_mode_t mode)
742 {
743         LASSERT(IS_PO2(mode));
744         return mdt_dlm_lock_modes[mode];
745 }
746
747 static inline struct lu_name *mdt_name(const struct lu_env *env,
748                                        char *name, int namelen)
749 {
750         struct lu_name *lname;
751         struct mdt_thread_info *mti;
752
753         LASSERT(namelen > 0);
754         /* trailing '\0' in buffer */
755         LASSERT(name[namelen] == '\0');
756
757         mti = lu_context_key_get(&env->le_ctx, &mdt_thread_key);
758         lname = &mti->mti_name;
759         lname->ln_name = name;
760         lname->ln_namelen = namelen;
761         return lname;
762 }
763
764 static inline struct lu_name *mdt_name_copy(struct lu_name *tlname,
765                                             struct lu_name *slname)
766 {
767         LASSERT(tlname);
768         LASSERT(slname);
769
770         tlname->ln_name = slname->ln_name;
771         tlname->ln_namelen = slname->ln_namelen;
772         return tlname;
773 }
774
775 void mdt_enable_cos(struct mdt_device *, int);
776 int mdt_cos_is_enabled(struct mdt_device *);
777 int mdt_hsm_copytool_send(struct obd_export *exp);
778
779 /* lprocfs stuff */
780 enum {
781         LPROC_MDT_OPEN = 0,
782         LPROC_MDT_CLOSE,
783         LPROC_MDT_MKNOD,
784         LPROC_MDT_LINK,
785         LPROC_MDT_UNLINK,
786         LPROC_MDT_MKDIR,
787         LPROC_MDT_RMDIR,
788         LPROC_MDT_RENAME,
789         LPROC_MDT_GETATTR,
790         LPROC_MDT_SETATTR,
791         LPROC_MDT_GETXATTR,
792         LPROC_MDT_SETXATTR,
793         LPROC_MDT_STATFS,
794         LPROC_MDT_SYNC,
795         LPROC_MDT_SAMEDIR_RENAME,
796         LPROC_MDT_CROSSDIR_RENAME,
797         LPROC_MDT_LAST,
798 };
799 void mdt_counter_incr(struct ptlrpc_request *req, int opcode);
800 void mdt_stats_counter_init(struct lprocfs_stats *stats);
801 void lprocfs_mdt_init_vars(struct lprocfs_static_vars *lvars);
802 int mdt_procfs_init(struct mdt_device *mdt, const char *name);
803 int mdt_procfs_fini(struct mdt_device *mdt);
804 void mdt_rename_counter_tally(struct mdt_thread_info *info,
805                               struct mdt_device *mdt,
806                               struct ptlrpc_request *req,
807                               struct mdt_object *src, struct mdt_object *tgt);
808
809 void mdt_time_start(const struct mdt_thread_info *info);
810 void mdt_time_end(const struct mdt_thread_info *info, int idx);
811
812 /* Capability */
813 int mdt_ck_thread_start(struct mdt_device *mdt);
814 void mdt_ck_thread_stop(struct mdt_device *mdt);
815 void mdt_ck_timer_callback(unsigned long castmeharder);
816 int mdt_capa_keys_init(const struct lu_env *env, struct mdt_device *mdt);
817
818 static inline void mdt_set_capainfo(struct mdt_thread_info *info, int offset,
819                                     const struct lu_fid *fid,
820                                     struct lustre_capa *capa)
821 {
822         struct md_capainfo *ci;
823
824         LASSERT(offset >= 0 && offset < MD_CAPAINFO_MAX);
825         if (!info->mti_mdt->mdt_opts.mo_mds_capa ||
826             !(info->mti_exp->exp_connect_flags & OBD_CONNECT_MDS_CAPA))
827                 return;
828
829         ci = md_capainfo(info->mti_env);
830         LASSERT(ci);
831         ci->mc_fid[offset]  = *fid;
832         ci->mc_capa[offset] = capa;
833 }
834
835 static inline void mdt_dump_capainfo(struct mdt_thread_info *info)
836 {
837         struct md_capainfo *ci = md_capainfo(info->mti_env);
838         int i;
839
840         if (!ci)
841                 return;
842         for (i = 0; i < MD_CAPAINFO_MAX; i++) {
843                 if (!ci->mc_capa[i]) {
844                         CERROR("no capa for index %d "DFID"\n",
845                                i, PFID(&ci->mc_fid[i]));
846                         continue;
847                 }
848                 if (ci->mc_capa[i] == BYPASS_CAPA) {
849                         CERROR("bypass for index %d "DFID"\n",
850                                i, PFID(&ci->mc_fid[i]));
851                         continue;
852                 }
853                 DEBUG_CAPA(D_ERROR, ci->mc_capa[i], "index %d", i);
854         }
855 }
856
857 static inline struct obd_device *mdt2obd_dev(const struct mdt_device *mdt)
858 {
859         return mdt->mdt_md_dev.md_lu_dev.ld_obd;
860 }
861 #endif /* __KERNEL__ */
862 #endif /* _MDT_H */