Whamcloud - gitweb
land b_colibri_devel on HEAD:
[fs/lustre-release.git] / lustre / mdt / mdt_internal.h
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  *  lustre/mdt/mdt_internal.h
5  *  Lustre Metadata Target (mdt) request handler
6  *
7  *  Copyright (c) 2006 Cluster File Systems, Inc.
8  *   Author: Peter Braam <braam@clusterfs.com>
9  *   Author: Andreas Dilger <adilger@clusterfs.com>
10  *   Author: Phil Schwan <phil@clusterfs.com>
11  *   Author: Mike Shaver <shaver@clusterfs.com>
12  *   Author: Nikita Danilov <nikita@clusterfs.com>
13  *   Author: Huang Hua <huanghua@clusterfs.com>
14  *
15  *   This file is part of the Lustre file system, http://www.lustre.org
16  *   Lustre is a trademark of Cluster File Systems, Inc.
17  *
18  *   You may have signed or agreed to another license before downloading
19  *   this software.  If so, you are bound by the terms and conditions
20  *   of that agreement, and the following does not apply to you.  See the
21  *   LICENSE file included with this distribution for more information.
22  *
23  *   If you did not agree to a different license, then this copy of Lustre
24  *   is open source software; you can redistribute it and/or modify it
25  *   under the terms of version 2 of the GNU General Public License as
26  *   published by the Free Software Foundation.
27  *
28  *   In either case, Lustre is distributed in the hope that it will be
29  *   useful, but WITHOUT ANY WARRANTY; without even the implied warranty
30  *   of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
31  *   license text for more details.
32  */
33
34 #ifndef _MDT_INTERNAL_H
35 #define _MDT_INTERNAL_H
36
37 #if defined(__KERNEL__)
38
39 /*
40  * struct ptlrpc_client
41  */
42 #include <lustre_net.h>
43 #include <obd.h>
44 /*
45  * struct obd_connect_data
46  * struct lustre_handle
47  */
48 #include <lustre/lustre_idl.h>
49 #include <md_object.h>
50 #include <dt_object.h>
51 #include <lustre_fid.h>
52 #include <lustre_fld.h>
53 #include <lustre_req_layout.h>
54 /* LR_CLIENT_SIZE, etc. */
55 #include <lustre_disk.h>
56 #include <lustre_sec.h>
57 #include <lvfs.h>
58 #include <lustre_idmap.h>
59 #include <lustre_eacl.h>
60
61
62 /* Data stored per client in the last_rcvd file.  In le32 order. */
63 struct mdt_client_data {
64         __u8  mcd_uuid[40];     /* client UUID */
65         __u64 mcd_last_transno; /* last completed transaction ID */
66         __u64 mcd_last_xid;     /* xid for the last transaction */
67         __u32 mcd_last_result;  /* result from last RPC */
68         __u32 mcd_last_data;    /* per-op data (disposition for open &c.) */
69         /* for MDS_CLOSE and MDS_DONE_WRITTING requests */
70         __u64 mcd_last_close_transno; /* last completed transaction ID */
71         __u64 mcd_last_close_xid;     /* xid for the last transaction */
72         __u32 mcd_last_close_result;  /* result from last RPC */
73         __u8 mcd_padding[LR_CLIENT_SIZE - 84];
74 };
75
76 static inline __u64 mcd_last_transno(struct mdt_client_data *mcd)
77 {
78         return max(mcd->mcd_last_transno, mcd->mcd_last_close_transno);
79 }
80
81 static inline __u64 mcd_last_xid(struct mdt_client_data *mcd)
82 {
83         return max(mcd->mcd_last_xid, mcd->mcd_last_close_xid);
84 }
85
86 /* check if request's xid is equal to last one or not*/
87 static inline int req_xid_is_last(struct ptlrpc_request *req)
88 {
89         struct mdt_client_data *mcd = req->rq_export->exp_mdt_data.med_mcd;
90         return (req->rq_xid == mcd->mcd_last_xid ||
91                 req->rq_xid == mcd->mcd_last_close_xid);
92 }
93
94 /* copied from lr_server_data.
95  * mds data stored at the head of last_rcvd file. In le32 order. */
96 struct mdt_server_data {
97         __u8  msd_uuid[40];        /* server UUID */
98         __u64 msd_last_transno;    /* last completed transaction ID */
99         __u64 msd_mount_count;     /* incarnation number */
100         __u32 msd_feature_compat;  /* compatible feature flags */
101         __u32 msd_feature_rocompat;/* read-only compatible feature flags */
102         __u32 msd_feature_incompat;/* incompatible feature flags */
103         __u32 msd_server_size;     /* size of server data area */
104         __u32 msd_client_start;    /* start of per-client data area */
105         __u16 msd_client_size;     /* size of per-client data area */
106         //__u16 msd_subdir_count;    /* number of subdirectories for objects */
107         //__u64 msd_catalog_oid;     /* recovery catalog object id */
108         //__u32 msd_catalog_ogen;    /* recovery catalog inode generation */
109         //__u8  msd_peeruuid[40];    /* UUID of MDS associated with this OST */
110         //__u32 msd_ost_index;       /* index number of OST in LOV */
111         //__u32 msd_mdt_index;       /* index number of MDT in LMV */
112         __u8  msd_padding[LR_SERVER_SIZE - 78];
113 };
114
115 struct mdt_object;
116 /* file data for open files on MDS */
117 struct mdt_file_data {
118         struct portals_handle mfd_handle; /* must be first */
119         struct list_head      mfd_list;   /* protected by med_open_lock */
120         __u64                 mfd_xid;    /* xid of the open request */
121         struct lustre_handle  mfd_old_handle; /* old handle in replay case */
122         int                   mfd_mode;   /* open mode provided by client */
123         struct mdt_object    *mfd_object; /* point to opened object */
124 };
125
126 struct mdt_device {
127         /* super-class */
128         struct md_device           mdt_md_dev;
129         struct ptlrpc_service     *mdt_regular_service;
130         struct ptlrpc_service     *mdt_readpage_service;
131         struct ptlrpc_service     *mdt_xmds_service;
132         struct ptlrpc_service     *mdt_setattr_service;
133         struct ptlrpc_service     *mdt_mdsc_service;
134         struct ptlrpc_service     *mdt_mdss_service;
135         struct ptlrpc_service     *mdt_dtss_service;
136         struct ptlrpc_service     *mdt_fld_service;
137         /* DLM name-space for meta-data locks maintained by this server */
138         struct ldlm_namespace     *mdt_namespace;
139         /* ptlrpc handle for MDS->client connections (for lock ASTs). */
140         struct ptlrpc_client      *mdt_ldlm_client;
141         /* underlying device */
142         struct md_device          *mdt_child;
143         struct dt_device          *mdt_bottom;
144         /*
145          * Options bit-fields.
146          */
147         struct {
148                 signed int         mo_user_xattr :1,
149                                    mo_acl        :1,
150                                    mo_compat_resname:1,
151                                    mo_mds_capa   :1,
152                                    mo_oss_capa   :1;
153         } mdt_opts;
154         /* mdt state flags */
155         __u32                      mdt_fl_cfglog:1,
156                                    mdt_fl_synced:1;
157         /* lock to pretect epoch and write count */
158         spinlock_t                 mdt_ioepoch_lock;
159         __u64                      mdt_ioepoch;
160
161         /* Transaction related stuff here */
162         spinlock_t                 mdt_transno_lock;
163         __u64                      mdt_last_transno;
164
165         /* transaction callbacks */
166         struct dt_txn_callback     mdt_txn_cb;
167         /* last_rcvd file */
168         struct dt_object          *mdt_last_rcvd;
169
170         /* these values should be updated from lov if necessary.
171          * or should be placed somewhere else. */
172         int                        mdt_max_mdsize;
173         int                        mdt_max_cookiesize;
174         __u64                      mdt_mount_count;
175
176         /* last_rcvd data */
177         struct mdt_server_data     mdt_msd;
178         spinlock_t                 mdt_client_bitmap_lock;
179         unsigned long              mdt_client_bitmap[(LR_MAX_CLIENTS >> 3) / sizeof(long)];
180
181         struct upcall_cache        *mdt_identity_cache;
182
183         /* sptlrpc rules */
184         rwlock_t                   mdt_sptlrpc_lock;
185         struct sptlrpc_rule_set    mdt_sptlrpc_rset;
186
187         /* capability keys */
188         unsigned long              mdt_capa_timeout;
189         __u32                      mdt_capa_alg;
190         struct dt_object          *mdt_ck_obj;
191         unsigned long              mdt_ck_timeout;
192         unsigned long              mdt_ck_expiry;
193         struct timer_list          mdt_ck_timer;
194         struct ptlrpc_thread       mdt_ck_thread;
195         struct lustre_capa_key     mdt_capa_keys[2];
196         unsigned int               mdt_capa_conf:1;
197
198         cfs_proc_dir_entry_t      *mdt_proc_entry;
199         struct lprocfs_stats      *mdt_stats;
200 };
201
202 /*XXX copied from mds_internal.h */
203 #define MDT_SERVICE_WATCHDOG_TIMEOUT (obd_timeout * 1000)
204 #define MDT_ROCOMPAT_SUPP       (OBD_ROCOMPAT_LOVOBJID)
205 #define MDT_INCOMPAT_SUPP       (OBD_INCOMPAT_MDT | OBD_INCOMPAT_COMMON_LR)
206
207 struct mdt_object {
208         struct lu_object_header mot_header;
209         struct md_object        mot_obj;
210         __u64                   mot_ioepoch;
211         __u64                   mot_flags;
212         int                     mot_epochcount;
213         int                     mot_writecount;
214 };
215
216 struct mdt_lock_handle {
217         /* Lock type, reg for cross-ref use or pdo lock. */
218         mdl_type_t              mlh_type;
219
220         /* Regular lock */
221         struct lustre_handle    mlh_reg_lh;
222         ldlm_mode_t             mlh_reg_mode;
223
224         /* Pdirops lock */
225         struct lustre_handle    mlh_pdo_lh;
226         ldlm_mode_t             mlh_pdo_mode;
227         unsigned int            mlh_pdo_hash;
228 };
229
230 enum {
231         MDT_LH_PARENT, /* parent lockh */
232         MDT_LH_CHILD,  /* child lockh */
233         MDT_LH_OLD,    /* old lockh for rename */
234         MDT_LH_NEW,    /* new lockh for rename */
235         MDT_LH_RMT,    /* used for return lh to caller */
236         MDT_LH_NR
237 };
238
239 enum {
240         MDT_LOCAL_LOCK,
241         MDT_CROSS_LOCK
242 };
243
244 struct mdt_reint_record {
245         mdt_reint_t             rr_opcode;
246         const struct lustre_handle *rr_handle;
247         const struct lu_fid    *rr_fid1;
248         const struct lu_fid    *rr_fid2;
249         const char             *rr_name;
250         int                     rr_namelen;
251         const char             *rr_tgt;
252         int                     rr_tgtlen;
253         const void             *rr_eadata;
254         int                     rr_eadatalen;
255         int                     rr_logcookielen;
256         const struct llog_cookie  *rr_logcookies;
257         __u32                   rr_flags;
258 };
259
260 enum mdt_reint_flag {
261         MRF_SETATTR_LOCKED = 1 << 0,
262 };
263
264 /*
265  * Common data shared by mdt-level handlers. This is allocated per-thread to
266  * reduce stack consumption.
267  */
268 struct mdt_thread_info {
269         /*
270          * XXX: Part One:
271          * The following members will be filled expilictly
272          * with specific data in mdt_thread_info_init().
273          */
274
275         /*
276          * for req-layout interface. This field should be first to be compatible
277          * with "struct com_thread_info" in seq and fld.
278          */
279         struct req_capsule         mti_pill;
280         /* although we have export in req, there are cases when it is not
281          * available, e.g. closing files upon export destroy */
282         struct obd_export          *mti_exp;
283         /*
284          * number of buffers in reply message.
285          */
286         int                        mti_rep_buf_nr;
287         /*
288          * sizes of reply buffers.
289          */
290         int                        mti_rep_buf_size[REQ_MAX_FIELD_NR];
291         /*
292          * A couple of lock handles.
293          */
294         struct mdt_lock_handle     mti_lh[MDT_LH_NR];
295
296         struct mdt_device         *mti_mdt;
297         const struct lu_env       *mti_env;
298
299         /*
300          * Additional fail id that can be set by handler. Passed to
301          * target_send_reply().
302          */
303         int                        mti_fail_id;
304
305         /* transaction number of current request */
306         __u64                      mti_transno;
307
308
309         /*
310          * XXX: Part Two:
311          * The following members will be filled expilictly
312          * with zero in mdt_thread_info_init(). These members may be used
313          * by all requests.
314          */
315
316         /*
317          * Object attributes.
318          */
319         struct md_attr             mti_attr;
320         /*
321          * Body for "habeo corpus" operations.
322          */
323         const struct mdt_body     *mti_body;
324         /*
325          * Host object. This is released at the end of mdt_handler().
326          */
327         struct mdt_object         *mti_object;
328         /*
329          * Lock request for "habeo clavis" operations.
330          */
331         const struct ldlm_request *mti_dlm_req;
332
333         __u32                      mti_has_trans:1, /* has txn already? */
334                                    mti_no_need_trans:1,
335                                    mti_cross_ref:1;
336
337         /* opdata for mdt_reint_open(), has the same as
338          * ldlm_reply:lock_policy_res1.  mdt_update_last_rcvd() stores this
339          * value onto disk for recovery when mdt_trans_stop_cb() is called.
340          */
341         __u64                      mti_opdata;
342
343         /*
344          * XXX: Part Three:
345          * The following members will be filled expilictly
346          * with zero in mdt_reint_unpack(), because they are only used
347          * by reint requests (including mdt_reint_open()).
348          */
349
350         /*
351          * reint record. contains information for reint operations.
352          */
353         struct mdt_reint_record    mti_rr;
354
355         /*
356          * Operation specification (currently create and lookup)
357          */
358         struct md_op_spec          mti_spec;
359
360         /*
361          * XXX: Part Four:
362          * The following members will _NOT_ be initialized at all.
363          * DO NOT expect them to contain any valid value.
364          * They should be initialized explicitly by the user themselves.
365          */
366
367          /* XXX: If something is in a union, make sure they do not conflict */
368
369         struct lu_fid              mti_tmp_fid1;
370         struct lu_fid              mti_tmp_fid2;
371         ldlm_policy_data_t         mti_policy;    /* for mdt_object_lock() and
372                                                    * mdt_rename_lock() */
373         struct ldlm_res_id         mti_res_id;    /* for mdt_object_lock() and
374                                                      mdt_rename_lock()   */
375         union {
376                 struct obd_uuid    uuid[2];       /* for mdt_seq_init_cli()  */
377                 char               ns_name[48];   /* for mdt_init0()         */
378                 struct lustre_cfg_bufs bufs;      /* for mdt_stack_fini()    */
379                 struct kstatfs     ksfs;          /* for mdt_statfs()        */
380                 struct {
381                         /* for mdt_readpage()      */
382                         struct lu_rdpg     mti_rdpg;
383                         /* for mdt_sendpage()      */
384                         struct l_wait_info mti_wait_info;
385                 } rdpg;
386         } mti_u;
387
388         /* IO epoch related stuff. */
389         struct mdt_epoch          *mti_epoch;
390         __u64                      mti_replayepoch;
391
392         /* server and client data buffers */
393         struct mdt_server_data     mti_msd;
394         struct mdt_client_data     mti_mcd;
395         loff_t                     mti_off;
396         struct txn_param           mti_txn_param;
397         struct lu_buf              mti_buf;
398         struct lustre_capa_key     mti_capa_key;
399
400         /* Ops object filename */
401         struct lu_name             mti_name;
402 };
403
404 typedef void (*mdt_cb_t)(const struct mdt_device *mdt, __u64 transno,
405                          void *data, int err);
406 struct mdt_commit_cb {
407         mdt_cb_t  mdt_cb_func;
408         void     *mdt_cb_data;
409 };
410
411 /*
412  * Info allocated per-transaction.
413  */
414 #define MDT_MAX_COMMIT_CB       4
415 struct mdt_txn_info {
416         __u64                 txi_transno;
417         unsigned int          txi_cb_count;
418         struct mdt_commit_cb  txi_cb[MDT_MAX_COMMIT_CB];
419 };
420
421 extern struct lu_context_key mdt_txn_key;
422
423 static inline void mdt_trans_add_cb(const struct thandle *th,
424                                     mdt_cb_t cb_func, void *cb_data) 
425 {
426         struct mdt_txn_info *txi;
427         
428         txi = lu_context_key_get(&th->th_ctx, &mdt_txn_key);
429         LASSERT(txi->txi_cb_count < ARRAY_SIZE(txi->txi_cb));
430
431         /* add new callback */
432         txi->txi_cb[txi->txi_cb_count].mdt_cb_func = cb_func;
433         txi->txi_cb[txi->txi_cb_count].mdt_cb_data = cb_data;
434         txi->txi_cb_count++;
435 }
436
437 static inline struct md_device_operations *mdt_child_ops(struct mdt_device * m)
438 {
439         LASSERT(m->mdt_child);
440         return m->mdt_child->md_ops;
441 }
442
443 static inline struct md_object *mdt_object_child(struct mdt_object *o)
444 {
445         return lu2md(lu_object_next(&o->mot_obj.mo_lu));
446 }
447
448 static inline struct ptlrpc_request *mdt_info_req(struct mdt_thread_info *info)
449 {
450          return info->mti_pill.rc_req;
451 }
452
453 static inline __u64 mdt_conn_flags(struct mdt_thread_info *info)
454 {
455         LASSERT(info->mti_exp);
456         return info->mti_exp->exp_connect_flags;
457 }
458
459 static inline void mdt_object_get(const struct lu_env *env,
460                                   struct mdt_object *o)
461 {
462         ENTRY;
463         lu_object_get(&o->mot_obj.mo_lu);
464         EXIT;
465 }
466
467 static inline void mdt_object_put(const struct lu_env *env,
468                                   struct mdt_object *o)
469 {
470         ENTRY;
471         lu_object_put(env, &o->mot_obj.mo_lu);
472         EXIT;
473 }
474
475 static inline int mdt_object_exists(const struct mdt_object *o)
476 {
477         return lu_object_exists(&o->mot_obj.mo_lu);
478 }
479
480 static inline const struct lu_fid *mdt_object_fid(struct mdt_object *o)
481 {
482         return lu_object_fid(&o->mot_obj.mo_lu);
483 }
484
485 int mdt_get_disposition(struct ldlm_reply *rep, int flag);
486 void mdt_set_disposition(struct mdt_thread_info *info,
487                         struct ldlm_reply *rep, int flag);
488 void mdt_clear_disposition(struct mdt_thread_info *info,
489                         struct ldlm_reply *rep, int flag);
490
491 void mdt_lock_pdo_init(struct mdt_lock_handle *lh,
492                        ldlm_mode_t lm, const char *name,
493                        int namelen);
494
495 void mdt_lock_reg_init(struct mdt_lock_handle *lh,
496                        ldlm_mode_t lm);
497
498 int mdt_lock_setup(struct mdt_thread_info *info,
499                    struct mdt_object *o,
500                    struct mdt_lock_handle *lh);
501
502 int mdt_object_lock(struct mdt_thread_info *,
503                     struct mdt_object *,
504                     struct mdt_lock_handle *,
505                     __u64, int);
506
507 void mdt_object_unlock(struct mdt_thread_info *,
508                        struct mdt_object *,
509                        struct mdt_lock_handle *,
510                        int decref);
511
512 struct mdt_object *mdt_object_find(const struct lu_env *,
513                                    struct mdt_device *,
514                                    const struct lu_fid *);
515 struct mdt_object *mdt_object_find_lock(struct mdt_thread_info *,
516                                         const struct lu_fid *,
517                                         struct mdt_lock_handle *,
518                                         __u64);
519 void mdt_object_unlock_put(struct mdt_thread_info *,
520                            struct mdt_object *,
521                            struct mdt_lock_handle *,
522                            int decref);
523
524 int mdt_close_unpack(struct mdt_thread_info *info);
525 int mdt_reint_unpack(struct mdt_thread_info *info, __u32 op);
526 int mdt_reint_rec(struct mdt_thread_info *, struct mdt_lock_handle *);
527 void mdt_pack_size2body(struct mdt_thread_info *info,
528                         struct mdt_object *o);
529 void mdt_pack_attr2body(struct mdt_thread_info *info, struct mdt_body *b,
530                         const struct lu_attr *attr, const struct lu_fid *fid);
531
532 int mdt_getxattr(struct mdt_thread_info *info);
533 int mdt_setxattr(struct mdt_thread_info *info);
534
535 void mdt_lock_handle_init(struct mdt_lock_handle *lh);
536 void mdt_lock_handle_fini(struct mdt_lock_handle *lh);
537
538 void mdt_reconstruct(struct mdt_thread_info *, struct mdt_lock_handle *);
539 void mdt_reconstruct_generic(struct mdt_thread_info *mti,
540                              struct mdt_lock_handle *lhc);
541
542 extern void target_recovery_fini(struct obd_device *obd);
543 extern void target_recovery_init(struct obd_device *obd,
544                                  svc_handler_t handler);
545 int mdt_fs_setup(const struct lu_env *, struct mdt_device *,
546                  struct obd_device *);
547 void mdt_fs_cleanup(const struct lu_env *, struct mdt_device *);
548
549 int mdt_client_del(const struct lu_env *env,
550                     struct mdt_device *mdt);
551 int mdt_client_add(const struct lu_env *env,
552                    struct mdt_device *mdt,
553                    int cl_idx);
554 int mdt_client_new(const struct lu_env *env,
555                    struct mdt_device *mdt);
556
557 int mdt_pin(struct mdt_thread_info* info);
558
559 int mdt_lock_new_child(struct mdt_thread_info *info,
560                        struct mdt_object *o,
561                        struct mdt_lock_handle *child_lockh);
562
563 void mdt_mfd_set_mode(struct mdt_file_data *mfd,
564                       int mode);
565
566 int mdt_reint_open(struct mdt_thread_info *info,
567                    struct mdt_lock_handle *lhc);
568
569 struct mdt_file_data *mdt_handle2mfd(struct mdt_thread_info *,
570                                      const struct lustre_handle *);
571 int mdt_epoch_open(struct mdt_thread_info *info, struct mdt_object *o);
572 void mdt_sizeonmds_enable(struct mdt_thread_info *info, struct mdt_object *mo);
573 int mdt_sizeonmds_enabled(struct mdt_object *mo);
574 int mdt_write_get(struct mdt_device *mdt, struct mdt_object *o);
575 int mdt_write_read(struct mdt_device *mdt, struct mdt_object *o);
576 struct mdt_file_data *mdt_mfd_new(void);
577 int mdt_mfd_close(struct mdt_thread_info *info, struct mdt_file_data *mfd);
578 void mdt_mfd_free(struct mdt_file_data *mfd);
579 int mdt_close(struct mdt_thread_info *info);
580 int mdt_attr_set(struct mdt_thread_info *info, struct mdt_object *mo,
581                  int flags);
582 int mdt_done_writing(struct mdt_thread_info *info);
583 void mdt_shrink_reply(struct mdt_thread_info *info);
584 int mdt_handle_last_unlink(struct mdt_thread_info *, struct mdt_object *,
585                            const struct md_attr *);
586 void mdt_reconstruct_open(struct mdt_thread_info *, struct mdt_lock_handle *);
587 struct thandle* mdt_trans_start(const struct lu_env *env,
588                                 struct mdt_device *mdt, int credits);
589 void mdt_trans_stop(const struct lu_env *env,
590                     struct mdt_device *mdt, struct thandle *th);
591 int mdt_record_write(const struct lu_env *env,
592                      struct dt_object *dt, const struct lu_buf *buf,
593                      loff_t *pos, struct thandle *th);
594 int mdt_record_read(const struct lu_env *env,
595                     struct dt_object *dt, struct lu_buf *buf, loff_t *pos);
596
597 struct lu_buf *mdt_buf(const struct lu_env *env, void *area, ssize_t len);
598 const struct lu_buf *mdt_buf_const(const struct lu_env *env,
599                                    const void *area, ssize_t len);
600
601 void mdt_dump_lmm(int level, const struct lov_mds_md *lmm);
602
603 int mdt_check_ucred(struct mdt_thread_info *);
604 int mdt_init_ucred(struct mdt_thread_info *, struct mdt_body *);
605 int mdt_init_ucred_reint(struct mdt_thread_info *);
606 void mdt_exit_ucred(struct mdt_thread_info *);
607
608 /* mdt_idmap.c */
609 int mdt_init_idmap(struct mdt_thread_info *);
610
611 void mdt_cleanup_idmap(struct mdt_export_data *);
612
613 int mdt_handle_idmap(struct mdt_thread_info *);
614
615 int ptlrpc_user_desc_do_idmap(struct ptlrpc_request *,
616                               struct ptlrpc_user_desc *);
617
618 void mdt_body_reverse_idmap(struct mdt_thread_info *,
619                             struct mdt_body *);
620
621 int mdt_remote_perm_reverse_idmap(struct ptlrpc_request *,
622                                   struct mdt_remote_perm *);
623
624 int mdt_fix_attr_ucred(struct mdt_thread_info *, __u32);
625
626 static inline struct mdt_device *mdt_dev(struct lu_device *d)
627 {
628 //        LASSERT(lu_device_is_mdt(d));
629         return container_of0(d, struct mdt_device, mdt_md_dev.md_lu_dev);
630 }
631
632 /* mdt/mdt_identity.c */
633 #define MDT_IDENTITY_UPCALL_PATH        "/usr/sbin/l_getidentity"
634
635 extern struct upcall_cache_ops mdt_identity_upcall_cache_ops;
636
637 struct md_identity *mdt_identity_get(struct upcall_cache *, __u32);
638
639 void mdt_identity_put(struct upcall_cache *, struct md_identity *);
640
641 void mdt_flush_identity(struct upcall_cache *, int);
642
643 __u32 mdt_identity_get_perm(struct md_identity *, __u32, lnet_nid_t);
644
645 int mdt_pack_remote_perm(struct mdt_thread_info *, struct mdt_object *, void *);
646
647 extern struct lu_context_key       mdt_thread_key;
648 /* debug issues helper starts here*/
649 static inline void mdt_fail_write(const struct lu_env *env,
650                                   struct dt_device *dd, int id)
651 {
652         if (OBD_FAIL_CHECK_ORSET(id, OBD_FAIL_ONCE)) {
653                 CERROR(LUSTRE_MDT_NAME": obd_fail_loc=%x, fail write ops\n",
654                        id);
655                 dd->dd_ops->dt_ro(env, dd);
656                 /* We set FAIL_ONCE because we never "un-fail" a device */
657         }
658 }
659
660 static inline struct mdt_export_data *mdt_req2med(struct ptlrpc_request *req)
661 {
662         return &req->rq_export->exp_mdt_data;
663 }
664
665 typedef void (*mdt_reconstruct_t)(struct mdt_thread_info *mti,
666                                   struct mdt_lock_handle *lhc);
667 static inline int mdt_check_resent(struct mdt_thread_info *info,
668                                    mdt_reconstruct_t reconstruct,
669                                    struct mdt_lock_handle *lhc)
670 {
671         struct ptlrpc_request *req = mdt_info_req(info);
672         ENTRY;
673
674         if (lustre_msg_get_flags(req->rq_reqmsg) & MSG_RESENT) {
675                 if (req_xid_is_last(req)) {
676                         reconstruct(info, lhc);
677                         RETURN(1);
678                 }
679                 DEBUG_REQ(D_HA, req, "no reply for RESENT req (have "LPD64")",
680                           req->rq_export->exp_mdt_data.med_mcd->mcd_last_xid);
681         }
682         RETURN(0);
683 }
684
685 struct md_ucred *mdt_ucred(const struct mdt_thread_info *info);
686
687 static inline int is_identity_get_disabled(struct upcall_cache *cache)
688 {
689         return cache ? (strcmp(cache->uc_upcall, "NONE") == 0) : 1;
690 }
691
692 /* Issues dlm lock on passed @ns, @f stores it lock handle into @lh. */
693 static inline int mdt_fid_lock(struct ldlm_namespace *ns,
694                                struct lustre_handle *lh,
695                                ldlm_mode_t mode,
696                                ldlm_policy_data_t *policy,
697                                const struct ldlm_res_id *res_id,
698                                int flags)
699 {
700         int rc;
701
702         LASSERT(ns != NULL);
703         LASSERT(lh != NULL);
704
705         rc = ldlm_cli_enqueue_local(ns, res_id, LDLM_IBITS, policy,
706                                     mode, &flags, ldlm_blocking_ast,
707                                     ldlm_completion_ast, NULL, NULL,
708                                     0, NULL, lh);
709         return rc == ELDLM_OK ? 0 : -EIO;
710 }
711
712 static inline void mdt_fid_unlock(struct lustre_handle *lh,
713                                   ldlm_mode_t mode)
714 {
715         ldlm_lock_decref(lh, mode);
716 }
717
718 extern mdl_mode_t mdt_mdl_lock_modes[];
719 extern ldlm_mode_t mdt_dlm_lock_modes[];
720
721 static inline mdl_mode_t mdt_dlm_mode2mdl_mode(ldlm_mode_t mode)
722 {
723         LASSERT(IS_PO2(mode));
724         return mdt_mdl_lock_modes[mode];
725 }
726
727 static inline ldlm_mode_t mdt_mdl_mode2dlm_mode(mdl_mode_t mode)
728 {
729         LASSERT(IS_PO2(mode));
730         return mdt_dlm_lock_modes[mode];
731 }
732
733 static inline struct lu_name *mdt_name(const struct lu_env *env,
734                                        char *name, int namelen)
735 {
736         struct lu_name *lname;
737         struct mdt_thread_info *mti;
738
739         LASSERT(namelen > 0);
740         /* trailing '\0' in buffer */
741         LASSERT(name[namelen] == '\0');
742
743         mti = lu_context_key_get(&env->le_ctx, &mdt_thread_key);
744         lname = &mti->mti_name;
745         lname->ln_name = name;
746         lname->ln_namelen = namelen;
747         return lname;
748 }
749
750 static inline struct lu_name *mdt_name_copy(struct lu_name *tlname,
751                                             struct lu_name *slname)
752 {
753         LASSERT(tlname);
754         LASSERT(slname);
755
756         tlname->ln_name = slname->ln_name;
757         tlname->ln_namelen = slname->ln_namelen;
758         return tlname;
759 }
760
761 /* lprocfs stuff */
762 void lprocfs_mdt_init_vars(struct lprocfs_static_vars *lvars);
763 int mdt_procfs_init(struct mdt_device *mdt, const char *name);
764 int mdt_procfs_fini(struct mdt_device *mdt);
765
766 void mdt_time_start(const struct mdt_thread_info *info);
767 void mdt_time_end(const struct mdt_thread_info *info, int idx);
768
769 enum {
770         LPROC_MDT_NR
771 };
772
773 /* Capability */
774 int mdt_ck_thread_start(struct mdt_device *mdt);
775 void mdt_ck_thread_stop(struct mdt_device *mdt);
776 void mdt_ck_timer_callback(unsigned long castmeharder);
777 int mdt_capa_keys_init(const struct lu_env *env, struct mdt_device *mdt);
778
779 static inline void mdt_set_capainfo(struct mdt_thread_info *info, int offset,
780                                     const struct lu_fid *fid,
781                                     struct lustre_capa *capa)
782 {
783         struct mdt_device *dev = info->mti_mdt;
784         struct md_capainfo *ci;
785
786         LASSERT(offset >= 0 && offset <= MD_CAPAINFO_MAX);
787         if (!dev->mdt_opts.mo_mds_capa)
788                 return;
789
790         ci = md_capainfo(info->mti_env);
791         LASSERT(ci);
792         ci->mc_fid[offset]  = fid;
793         ci->mc_capa[offset] = capa;
794 }
795
796 static inline void mdt_dump_capainfo(struct mdt_thread_info *info)
797 {
798         struct md_capainfo *ci = md_capainfo(info->mti_env);
799         int i;
800
801         if (!ci)
802                 return;
803         for (i = 0; i < MD_CAPAINFO_MAX; i++) {
804                 if (!ci->mc_fid[i])
805                         continue;
806                 if (!ci->mc_capa[i]) {
807                         CERROR("no capa for index %d "DFID"\n",
808                                i, PFID(ci->mc_fid[i]));
809                         continue;
810                 }
811                 if (ci->mc_capa[i] == BYPASS_CAPA) {
812                         CERROR("bypass for index %d "DFID"\n",
813                                i, PFID(ci->mc_fid[i]));
814                         continue;
815                 }
816                 DEBUG_CAPA(D_ERROR, ci->mc_capa[i], "index %d", i);
817         }
818 }
819
820 #endif /* __KERNEL__ */
821 #endif /* _MDT_H */