Whamcloud - gitweb
- landed b_hd_cray_merge3
[fs/lustre-release.git] / lustre / include / linux / lustre_mds.h
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  *  Copyright (C) 2001-2003 Cluster File Systems, Inc. <info@clusterfs.com>
5  *
6  *   This file is part of Lustre, http://www.lustre.org.
7  *
8  *   Lustre is free software; you can redistribute it and/or
9  *   modify it under the terms of version 2 of the GNU General Public
10  *   License as published by the Free Software Foundation.
11  *
12  *   Lustre is distributed in the hope that it will be useful,
13  *   but WITHOUT ANY WARRANTY; without even the implied warranty of
14  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  *   GNU General Public License for more details.
16  *
17  *   You should have received a copy of the GNU General Public License
18  *   along with Lustre; if not, write to the Free Software
19  *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
20  *
21  * MDS data structures.
22  * See also lustre_idl.h for wire formats of requests.
23  *
24  */
25
26 #ifndef _LUSTRE_MDS_H
27 #define _LUSTRE_MDS_H
28
29 #ifdef __KERNEL__
30 # include <linux/fs.h>
31 # include <linux/dcache.h>
32 #endif
33
34 #include <linux/lustre_handles.h>
35 #include <libcfs/kp30.h>
36 #include <linux/lustre_idl.h>
37 #include <linux/lustre_lib.h>
38 #include <linux/lustre_dlm.h>
39 #include <linux/lustre_log.h>
40 #include <linux/lustre_export.h>
41 #include <linux/lustre_ucache.h>
42
43 struct ldlm_lock_desc;
44 struct mds_obd;
45 struct ptlrpc_connection;
46 struct ptlrpc_client;
47 struct obd_export;
48 struct ptlrpc_request;
49 struct obd_device;
50 struct ll_file_data;
51
52 #define LUSTRE_MDS_NAME "mds"
53 #define LUSTRE_MDT_NAME "mdt"
54 #define LUSTRE_MDC_NAME "mdc"
55
56 struct mds_update_record {
57         __u32               ur_opcode;
58         struct lustre_id   *ur_id1;
59         struct lustre_id   *ur_id2;
60         int                 ur_namelen;
61         char               *ur_name;
62         int                 ur_tgtlen;
63         char               *ur_tgt;
64         int                 ur_eadatalen;
65         void               *ur_eadata;
66         int                 ur_ea2datalen;
67         void               *ur_ea2data;
68         int                 ur_cookielen;       /* obsolete? */
69         struct llog_cookie *ur_logcookies;      /* obsolete? */
70         struct iattr        ur_iattr;
71         struct lvfs_ucred   ur_uc;
72         __u64               ur_rdev;
73         __u32               ur_mode;
74         __u64               ur_time;
75         __u32               ur_flags;
76 };
77
78 #define ur_fsuid    ur_uc.luc_fsuid
79 #define ur_fsgid    ur_uc.luc_fsgid
80 #define ur_cap      ur_uc.luc_cap
81 #define ur_uid      ur_uc.luc_uid
82
83
84 #define MDS_LR_SERVER_SIZE    512
85
86 #define MDS_LR_CLIENT_START  8192
87 #define MDS_LR_CLIENT_SIZE    128
88 #if MDS_LR_CLIENT_START < MDS_LR_SERVER_SIZE
89 #error "Can't have MDS_LR_CLIENT_START < MDS_LR_SERVER_SIZE"
90 #endif
91
92 #define MDS_CLIENT_SLOTS 17
93
94 #define MDS_ROCOMPAT_LOVOBJID   0x00000001
95 #define MDS_ROCOMPAT_SUPP       (MDS_ROCOMPAT_LOVOBJID)
96
97 #define MDS_INCOMPAT_SUPP       (0)
98
99 #define MDS_MASTER_OBD           1
100 #define MDS_CACHE_OBD            0
101
102 /*flags for indicate the record are come from cmobd reint or 
103   mdc create */
104 #define REC_REINT_CREATE        0x0001
105
106 /* Data stored per server at the head of the last_rcvd file.  In le32 order.
107  * Try to keep this the same as fsd_server_data so we might one day merge. */
108 struct mds_server_data {
109         __u8  msd_uuid[40];        /* server UUID */
110         __u64 msd_last_transno;    /* last completed transaction ID */
111         __u64 msd_mount_count;     /* MDS incarnation number */
112         __u64 msd_unused;
113         __u32 msd_feature_compat;  /* compatible feature flags */
114         __u32 msd_feature_rocompat;/* read-only compatible feature flags */
115         __u32 msd_feature_incompat;/* incompatible feature flags */
116         __u32 msd_server_size;     /* size of server data area */
117         __u32 msd_client_start;    /* start of per-client data area */
118         __u16 msd_client_size;     /* size of per-client data area */
119         __u16 msd_subdir_count;    /* number of subdirectories for objects */
120         __u64 msd_catalog_oid;     /* recovery catalog object id */
121         __u32 msd_catalog_ogen;    /* recovery catalog inode generation */
122         __u8  msd_peeruuid[40];    /* UUID of LOV/OSC associated with MDS */
123         __u8  msd_padding[MDS_LR_SERVER_SIZE - 140];
124 };
125
126 /* Data stored per client in the last_rcvd file.  In le32 order. */
127 struct mds_client_data {
128         __u8 mcd_uuid[40];      /* client UUID */
129         __u64 mcd_last_transno; /* last completed transaction ID */
130         __u64 mcd_last_xid;     /* xid for the last transaction */
131         __u32 mcd_last_result;  /* result from last RPC */
132         __u32 mcd_last_data;    /* per-op data (disposition for open &c.) */
133         /* for MDS_CLOSE requests */
134         __u64 mcd_last_close_transno; /* last completed transaction ID */
135         __u64 mcd_last_close_xid;     /* xid for the last transaction */
136         __u32 mcd_last_close_result;  /* result from last RPC */
137         __u32 mcd_last_close_data;  /* per-op data (disposition for open &c.) */
138         __u8 mcd_padding[MDS_LR_CLIENT_SIZE - 88];
139 };
140
141 /* simple uid/gid mapping hash table */
142 struct mds_idmap_item {
143         struct list_head        hash;
144         __u32                   id1;
145         __u32                   id2;
146 };
147
148 #define MDS_IDMAP_HASHSIZE      (32)
149 struct mds_idmap_table {
150         struct list_head uidmap[MDS_IDMAP_HASHSIZE];
151         struct list_head gidmap[MDS_IDMAP_HASHSIZE];
152 };
153
154 /* file data for open files on MDS */
155 struct mds_file_data {
156         struct portals_handle mfd_handle; /* must be first */
157         atomic_t              mfd_refcount;
158         struct list_head      mfd_list;
159         __u64                 mfd_xid;
160         int                   mfd_mode;
161         struct dentry        *mfd_dentry;
162 };
163
164 /* group hash table */
165 struct mds_grp_hash_entry {
166         struct list_head        ge_hash;
167         struct group_info      *ge_group_info;
168         uid_t                   ge_uid;
169         int                     ge_flags;
170         atomic_t                ge_refcount;
171         wait_queue_head_t       ge_waitq;
172         long                    ge_acquisition_time;
173         unsigned long           ge_acquire_expire;
174         unsigned long           ge_expire;
175 };
176
177 #define MDSGRP_HASH_SIZE        (128)
178 #define MDSGRP_HASH_INDEX(id)   ((id) & (MDSGRP_HASH_SIZE - 1))
179 #define MDSGRP_UPCALL_MAXPATH   (1024)
180
181 struct mds_grp_hash {
182         struct list_head        gh_table[MDSGRP_HASH_SIZE];
183         spinlock_t              gh_lock;
184         char                    gh_upcall[MDSGRP_UPCALL_MAXPATH];
185         int                     gh_entry_expire;
186         int                     gh_acquire_expire;
187         unsigned int            gh_allow_setgroups:1;
188 };
189
190 /* lustre security descriptor */
191 struct lustre_sec_desc {
192         uid_t                   lsd_uid;
193         gid_t                   lsd_gid;
194         struct group_info      *lsd_ginfo;
195         unsigned int            lsd_allow_setuid:1,
196                                 lsd_allow_setgid:1,
197                                 lsd_allow_setgrp:1;
198 };
199
200 struct lsd_cache_entry {
201         struct upcall_cache_entry     base;
202         struct lustre_sec_desc        lsd;
203 };
204
205 struct lsd_downcall_args {
206         int     err;
207         uid_t   uid;
208         gid_t   gid;
209         __u32   ngroups;
210         gid_t  *groups;
211         __u32   allow_setuid;
212         __u32   allow_setgid;
213         __u32   allow_setgrp;
214 };
215
216 /* mds/mds_reint.c  */
217 int mds_reint_rec(struct mds_update_record *r, int offset,
218                   struct ptlrpc_request *req, struct lustre_handle *);
219
220 /* mds/handler.c */
221 #ifdef __KERNEL__
222 struct dentry *
223 mds_id2dentry(struct obd_device *obd, struct lustre_id *id,
224               struct vfsmount **mnt);
225
226 struct dentry *
227 mds_id2locked_dentry(struct obd_device *obd, struct lustre_id *id,
228                      struct vfsmount **mnt, int lock_mode,
229                      struct lustre_handle *lockh, int *pmode,
230                      char *name, int namelen, __u64 lockpart);
231 int mds_update_server_data(struct obd_device *, int force_sync);
232 int mds_update_last_fid(struct obd_device *obd, void *handle, 
233                         int force_sync);
234
235 /* mds/mds_fs.c */
236 int mds_fs_setup(struct obd_device *obddev, struct vfsmount *mnt);
237 int mds_fs_cleanup(struct obd_device *obddev, int failover);
238 #endif
239
240 /* mds/mds_lov.c */
241
242 /* mdc/mdc_locks.c */
243 int it_disposition(struct lookup_intent *it, int flag);
244 void it_set_disposition(struct lookup_intent *it, int flag);
245 int it_open_error(int phase, struct lookup_intent *it);
246 int mdc_set_lock_data(struct obd_export *exp, __u64 *lockh, void *data);
247 int mdc_change_cbdata(struct obd_export *exp, struct lustre_id *id, 
248                       ldlm_iterator_t it, void *data);
249 int mdc_intent_lock(struct obd_export *exp, struct lustre_id *parent, 
250                     const char *name, int len, void *lmm, int lmmsize, 
251                     struct lustre_id *child, struct lookup_intent *, int, 
252                     struct ptlrpc_request **reqp, 
253                     ldlm_blocking_callback cb_blocking);
254 int mdc_enqueue(struct obd_export *exp,
255                 int lock_type,
256                 struct lookup_intent *it,
257                 int lock_mode,
258                 struct mdc_op_data *data,
259                 struct lustre_handle *lockh,
260                 void *lmm,
261                 int lmmlen,
262                 ldlm_completion_callback cb_completion,
263                 ldlm_blocking_callback cb_blocking,
264                 void *cb_data);
265
266 /* mdc/mdc_request.c */
267 int mdc_get_secdesc_size(void);
268 void mdc_pack_secdesc(struct ptlrpc_request *req, int size);
269 int mdc_req2lustre_md(struct obd_export *exp_lmv, struct ptlrpc_request *req, 
270                       unsigned int offset, struct obd_export *exp_lov, 
271                       struct lustre_md *md);
272 int mdc_getstatus(struct obd_export *exp, struct lustre_id *rootid);
273 int mdc_getattr(struct obd_export *exp, struct lustre_id *id,
274                 __u64 valid, const char *ea_name, int ea_namelen,
275                 unsigned int ea_size, struct ptlrpc_request **request);
276 int mdc_getattr_lock(struct obd_export *exp, struct lustre_id *id,
277                      char *filename, int namelen, __u64 valid,
278                      unsigned int ea_size, struct ptlrpc_request **request);
279 int mdc_setattr(struct obd_export *exp, struct mdc_op_data *data,
280                 struct iattr *iattr, void *ea, int ealen, void *ea2, int ea2len,
281                 struct ptlrpc_request **request);
282 int mdc_open(struct obd_export *exp, obd_id ino, int type, int flags,
283              struct lov_mds_md *lmm, int lmm_size, struct lustre_handle *fh,
284              struct ptlrpc_request **);
285
286 struct obd_client_handle;
287
288 int mdc_set_open_replay_data(struct obd_export *exp, 
289                              struct obd_client_handle *och,
290                              struct ptlrpc_request *open_req);
291 int mdc_clear_open_replay_data(struct obd_export *exp, 
292                                struct obd_client_handle *och);
293 int mdc_close(struct obd_export *, struct obdo *, struct obd_client_handle *,
294               struct ptlrpc_request **);
295 int mdc_readpage(struct obd_export *exp, struct lustre_id *id,
296                  __u64, struct page *, struct ptlrpc_request **);
297 int mdc_create(struct obd_export *exp, struct mdc_op_data *op_data,
298                const void *data, int datalen, int mode, __u32 uid, __u32 gid,
299                __u64 rdev, struct ptlrpc_request **request);
300 int mdc_unlink(struct obd_export *exp, struct mdc_op_data *data,
301                struct ptlrpc_request **request);
302 int mdc_link(struct obd_export *exp, struct mdc_op_data *data,
303              struct ptlrpc_request **);
304 int mdc_rename(struct obd_export *exp, struct mdc_op_data *data,
305                const char *old, int oldlen, const char *new, int newlen,
306                struct ptlrpc_request **request);
307 int mdc_sync(struct obd_export *exp, struct lustre_id *id,
308              struct ptlrpc_request **);
309 int mdc_create_client(struct obd_uuid uuid, struct ptlrpc_client *cl);
310
311 /* store the generation of a newly-created inode in |req| for replay. */
312 int mdc_store_inode_generation(struct obd_export *exp,
313                                struct ptlrpc_request *req, 
314                                int reqoff, int repoff);
315
316 int mdc_llog_process(struct obd_export *, char *, llog_cb_t,
317                      void *);
318
319 int mdc_done_writing(struct obd_export *, struct obdo *);
320
321 /* ioctls for trying requests */
322 #define IOC_REQUEST_TYPE                 'f'
323 #define IOC_REQUEST_MIN_NR               30
324
325 #define IOC_REQUEST_GETATTR             _IOWR('f', 30, long)
326 #define IOC_REQUEST_READPAGE            _IOWR('f', 31, long)
327 #define IOC_REQUEST_SETATTR             _IOWR('f', 32, long)
328 #define IOC_REQUEST_CREATE              _IOWR('f', 33, long)
329 #define IOC_REQUEST_OPEN                _IOWR('f', 34, long)
330 #define IOC_REQUEST_CLOSE               _IOWR('f', 35, long)
331 #define IOC_REQUEST_MAX_NR               35
332
333 #define MDS_CHECK_RESENT(req, reconstruct)                              \
334 {                                                                       \
335         if (lustre_msg_get_flags(req->rq_reqmsg) & MSG_RESENT) {        \
336                 struct mds_client_data *mcd =                           \
337                         req->rq_export->exp_mds_data.med_mcd;           \
338                                                                         \
339                 if (le64_to_cpu(mcd->mcd_last_xid) == req->rq_xid) {    \
340                         reconstruct;                                    \
341                         RETURN(le32_to_cpu(mcd->mcd_last_result));      \
342                 }                                                       \
343                 if (le64_to_cpu(mcd->mcd_last_close_xid) == req->rq_xid) { \
344                         reconstruct;                                    \
345                         RETURN(le32_to_cpu(mcd->mcd_last_close_result));\
346                 }                                                       \
347                 DEBUG_REQ(D_HA, req, "no reply for RESENT req"          \
348                           "(have "LPD64", and "LPD64")",                \
349                           mcd->mcd_last_xid, mcd->mcd_last_close_xid);  \
350         }                                                               \
351 }
352
353 #endif