Whamcloud - gitweb
Branch: HEAD
[fs/lustre-release.git] / lustre / include / linux / lustre_idl.h
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  *  Copyright (C) 2001 Cluster File Systems, Inc. <braam@clusterfs.com>
5  *
6  *   This file is part of Lustre, http://www.lustre.org.
7  *
8  *   Lustre is free software; you can redistribute it and/or
9  *   modify it under the terms of version 2 of the GNU General Public
10  *   License as published by the Free Software Foundation.
11  *
12  *   Lustre is distributed in the hope that it will be useful,
13  *   but WITHOUT ANY WARRANTY; without even the implied warranty of
14  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  *   GNU General Public License for more details.
16  *
17  *   You should have received a copy of the GNU General Public License
18  *   along with Lustre; if not, write to the Free Software
19  *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
20  *
21  * Lustre wire protocol definitions.
22  *
23  * All structs passing over the wire should be declared here (lov_mds_md
24  * being the lone exception).  Structs must be properly aligned to put
25  * 64-bit values on an 8-byte boundary.  Any structs being added here
26  * must also be added to utils/wirecheck.c and "make newwiretest" run
27  * to regenerate the utils/wiretest.c sources.  This allows us to verify
28  * that wire structs have the proper alignment/size on all architectures.
29  *
30  * We assume all nodes are either little-endian or big-endian, and we
31  * always send messages in the sender's native format.  The receiver
32  * detects the message format by checking the 'magic' field of the message
33  * (see lustre_msg_swabbed() below).
34  *
35  * Each wire type has corresponding 'lustre_swab_xxxtypexxx()' routines,
36  * implemented either here, inline (trivial implementations) or in
37  * ptlrpc/pack_generic.c.  These 'swabbers' convert the type from "other"
38  * endian, in-place in the message buffer.
39  *
40  * A swabber takes a single pointer argument.  The caller must already have
41  * verified that the length of the message buffer >= sizeof (type).
42  *
43  * For variable length types, a second 'lustre_swab_v_xxxtypexxx()' routine
44  * may be defined that swabs just the variable part, after the caller has
45  * verified that the message buffer is large enough.
46  */
47
48 #ifndef _LUSTRE_IDL_H_
49 #define _LUSTRE_IDL_H_
50
51 #ifdef HAVE_ASM_TYPES_H
52 #include <asm/types.h>
53 #else
54 #include "types.h"
55 #endif
56
57
58 #ifdef __KERNEL__
59 # include <linux/ioctl.h>
60 # include <linux/types.h>
61 # include <linux/list.h>
62 # include <linux/string.h> /* for strncpy, below */
63 # include <linux/fs.h>     /* to check for FMODE_EXEC, dev_t, lest we redefine */
64 #else
65 #ifdef __CYGWIN__
66 # include <sys/types.h>
67 #else
68 # include <stdint.h>
69 #endif
70 # include <libcfs/list.h>
71 # include <string.h>
72 #endif
73
74 /* Defn's shared with user-space. */
75 #include <lustre/lustre_user.h>
76
77 /*
78  * this file contains all data structures used in Lustre interfaces:
79  * - obdo and obd_request records
80  * - mds_request records
81  * - ldlm data
82  * - ioctl's
83  */
84
85 /*
86  *  GENERAL STUFF
87  */
88 /* FOO_REQUEST_PORTAL is for incoming requests on the FOO
89  * FOO_REPLY_PORTAL   is for incoming replies on the FOO
90  * FOO_BULK_PORTAL    is for incoming bulk on the FOO
91  */
92
93 #define CONNMGR_REQUEST_PORTAL          1
94 #define CONNMGR_REPLY_PORTAL            2
95 //#define OSC_REQUEST_PORTAL            3
96 #define OSC_REPLY_PORTAL                4
97 //#define OSC_BULK_PORTAL               5
98 #define OST_REQUEST_PORTAL              6
99 #define OST_CREATE_PORTAL               7
100 #define OST_BULK_PORTAL                 8
101 //#define MDC_REQUEST_PORTAL            9
102 #define MDC_REPLY_PORTAL               10
103 //#define MDC_BULK_PORTAL              11
104 #define MDS_REQUEST_PORTAL             12
105 //#define MDS_REPLY_PORTAL             13
106 #define MDS_BULK_PORTAL                14
107 #define LDLM_CB_REQUEST_PORTAL         15
108 #define LDLM_CB_REPLY_PORTAL           16
109 #define LDLM_CANCEL_REQUEST_PORTAL     17
110 #define LDLM_CANCEL_REPLY_PORTAL       18
111 #define PTLBD_REQUEST_PORTAL           19
112 #define PTLBD_REPLY_PORTAL             20
113 #define PTLBD_BULK_PORTAL              21
114 #define MDS_SETATTR_PORTAL             22
115 #define MDS_READPAGE_PORTAL            23
116 #define MGMT_REQUEST_PORTAL            24
117 #define MGMT_REPLY_PORTAL              25
118 #define MGMT_CLI_REQUEST_PORTAL        26
119 #define MGMT_CLI_REPLY_PORTAL          27
120
121 #define SVC_KILLED               1
122 #define SVC_EVENT                2
123 #define SVC_SIGNAL               4
124 #define SVC_RUNNING              8
125 #define SVC_STOPPING            16
126 #define SVC_STOPPED             32
127
128 /* packet types */
129 #define PTL_RPC_MSG_REQUEST 4711
130 #define PTL_RPC_MSG_ERR     4712
131 #define PTL_RPC_MSG_REPLY   4713
132
133 #define PTLRPC_MSG_MAGIC    0x0BD00BD0
134
135
136 #define PTLRPC_MSG_VERSION  0x00000003
137 #define LUSTRE_VERSION_MASK 0xffff0000
138 #define LUSTRE_OBD_VERSION  0x00010000
139 #define LUSTRE_MDS_VERSION  0x00020000
140 #define LUSTRE_OST_VERSION  0x00030000
141 #define LUSTRE_DLM_VERSION  0x00040000
142 #define LUSTRE_LOG_VERSION  0x00050000
143 #define LUSTRE_PBD_VERSION  0x00060000
144
145 struct lustre_handle {
146         __u64 cookie;
147 };
148 #define DEAD_HANDLE_MAGIC 0xdeadbeefcafebabeULL
149
150 /* we depend on this structure to be 8-byte aligned */
151 /* this type is only endian-adjusted in lustre_unpack_msg() */
152 struct lustre_msg {
153         struct lustre_handle handle;
154         __u32 magic;
155         __u32 type;
156         __u32 version;
157         __u32 opc;
158         __u64 last_xid;
159         __u64 last_committed;
160         __u64 transno;
161         __u32 status;
162         __u32 flags;
163         __u32 conn_cnt;
164         __u32 bufcount;
165         __u32 buflens[0];
166 };
167
168 /* Flags that are operation-specific go in the top 16 bits. */
169 #define MSG_OP_FLAG_MASK   0xffff0000
170 #define MSG_OP_FLAG_SHIFT  16
171
172 /* Flags that apply to all requests are in the bottom 16 bits */
173 #define MSG_GEN_FLAG_MASK      0x0000ffff
174 #define MSG_LAST_REPLAY        1
175 #define MSG_RESENT             2
176 #define MSG_REPLAY             4
177 #define MSG_REQ_REPLAY_DONE    8
178 #define MSG_LOCK_REPLAY_DONE  16
179
180 static inline int lustre_msg_get_flags(struct lustre_msg *msg)
181 {
182         return (msg->flags & MSG_GEN_FLAG_MASK);
183 }
184
185 static inline void lustre_msg_add_flags(struct lustre_msg *msg, int flags)
186 {
187         msg->flags |= MSG_GEN_FLAG_MASK & flags;
188 }
189
190 static inline void lustre_msg_set_flags(struct lustre_msg *msg, int flags)
191 {
192         msg->flags &= ~MSG_GEN_FLAG_MASK;
193         lustre_msg_add_flags(msg, flags);
194 }
195
196 static inline void lustre_msg_clear_flags(struct lustre_msg *msg, int flags)
197 {
198         msg->flags &= ~(MSG_GEN_FLAG_MASK & flags);
199 }
200
201 static inline int lustre_msg_get_op_flags(struct lustre_msg *msg)
202 {
203         return (msg->flags >> MSG_OP_FLAG_SHIFT);
204 }
205
206 static inline void lustre_msg_add_op_flags(struct lustre_msg *msg, int flags)
207 {
208         msg->flags |= ((flags & MSG_GEN_FLAG_MASK) << MSG_OP_FLAG_SHIFT);
209 }
210
211 static inline void lustre_msg_set_op_flags(struct lustre_msg *msg, int flags)
212 {
213         msg->flags &= ~MSG_OP_FLAG_MASK;
214         lustre_msg_add_op_flags(msg, flags);
215 }
216
217 /*
218  * Flags for all connect opcodes (MDS_CONNECT, OST_CONNECT)
219  */
220
221 #define MSG_CONNECT_RECOVERING  0x1
222 #define MSG_CONNECT_RECONNECT   0x2
223 #define MSG_CONNECT_REPLAYABLE  0x4
224 #define MSG_CONNECT_PEER        0x8
225 #define MSG_CONNECT_LIBCLIENT   0x10
226 #define MSG_CONNECT_INITIAL     0x20
227 #define MSG_CONNECT_ASYNC       0x40
228
229 /* Connect flags */
230
231 #define OBD_CONNECT_RDONLY      (0x00000001LL)
232 #define OBD_CONNECT_REMOTE      (0x40000000LL)
233 #define OBD_CONNECT_LOCAL       (0x80000000LL)
234
235 #define OBD_CONNECT_SUPPORTED (OBD_CONNECT_RDONLY |     \
236                                OBD_CONNECT_REMOTE |     \
237                                OBD_CONNECT_LOCAL)
238
239 /* This structure is used for both request and reply.
240  *
241  * If we eventually have separate connect data for different types, which we
242  * almost certainly will, then perhaps we stick a union in here. */
243 struct obd_connect_data {
244         __u64 ocd_connect_flags;
245         __u32 ocd_nllu[2];
246         __u64 padding[6];
247 };
248
249 extern void lustre_swab_connect(struct obd_connect_data *ocd);
250
251 /*
252  *   OST requests: OBDO & OBD request records
253  */
254
255 /* opcodes */
256 typedef enum {
257         OST_REPLY      =  0,       /* reply ? */
258         OST_GETATTR    =  1,
259         OST_SETATTR    =  2,
260         OST_READ       =  3,
261         OST_WRITE      =  4,
262         OST_CREATE     =  5,
263         OST_DESTROY    =  6,
264         OST_GET_INFO   =  7,
265         OST_CONNECT    =  8,
266         OST_DISCONNECT =  9,
267         OST_PUNCH      = 10,
268         OST_OPEN       = 11,
269         OST_CLOSE      = 12,
270         OST_STATFS     = 13,
271         OST_SAN_READ   = 14,
272         OST_SAN_WRITE  = 15,
273         OST_SYNC       = 16,
274         OST_SET_INFO   = 17,
275         OST_LAST_OPC
276 } ost_cmd_t;
277 #define OST_FIRST_OPC  OST_REPLY
278
279 typedef uint64_t        obd_id;
280 typedef uint64_t        obd_gr;
281 typedef uint64_t        obd_time;
282 typedef uint64_t        obd_size;
283 typedef uint64_t        obd_off;
284 typedef uint64_t        obd_blocks;
285 typedef uint32_t        obd_blksize;
286 typedef uint32_t        obd_mode;
287 typedef uint32_t        obd_uid;
288 typedef uint32_t        obd_gid;
289 typedef uint32_t        obd_flags;
290 typedef uint64_t        obd_valid;
291 typedef uint32_t        obd_count;
292
293 #define OBD_FL_INLINEDATA    (0x00000001)
294 #define OBD_FL_OBDMDEXISTS   (0x00000002)
295 #define OBD_FL_DELORPHAN     (0x00000004) /* if set in o_flags delete orphans */
296 #define OBD_FL_NORPC         (0x00000008) // if set in o_flags set in OSC not OST
297 #define OBD_FL_IDONLY        (0x00000010) // if set in o_flags only adjust obj id
298 #define OBD_FL_RECREATE_OBJS (0x00000020) // recreate missing obj
299 #define OBD_FL_DEBUG_CHECK   (0x00000040) /* echo client/server debug check */
300
301 /* this should be sizeof(struct lustre_handle) + sizeof(struct llog_cookie) +
302  * sizeof(struct lustre_id). */
303 #define OBD_INLINESZ (80)
304
305 /* Note: 64-bit types are 64-bit aligned in structure */
306 struct obdo {
307         obd_id                  o_id;
308         obd_gr                  o_gr;
309         obd_size                o_size;
310         obd_time                o_mtime;
311         obd_time                o_atime;
312         obd_time                o_ctime;
313         obd_blocks              o_blocks;       /* brw: cli sent cached bytes */
314         obd_size                o_grant;
315         obd_blksize             o_blksize;      /* optimal IO blocksize */
316         obd_mode                o_mode;         /* brw: cli sent cache remain */
317         obd_uid                 o_uid;
318         obd_gid                 o_gid;
319         obd_flags               o_flags;
320         obd_count               o_nlink;        /* brw: checksum */
321         obd_count               o_generation;
322         obd_valid               o_valid;        /* hot fields in this obdo */
323         obd_count               o_misc;         /* brw: o_dropped */
324         __u32                   o_easize;       /* epoch in ost writes */
325         __u32                   o_mds;
326         __u64                   o_fid;
327         __u32                   o_padding;
328         char                    o_inline[OBD_INLINESZ]; /* fid in ost writes */
329 };
330
331 #define o_dirty   o_blocks
332 #define o_undirty o_mode
333 #define o_dropped o_misc
334 #define o_cksum   o_nlink
335
336 extern void lustre_swab_obdo (struct obdo *o);
337
338 #define LOV_MAGIC_V1      0x0BD10BD0
339 #define LOV_MAGIC         LOV_MAGIC_V1
340
341 #define LOV_PATTERN_RAID0 0x001   /* stripes are used round-robin */
342 #define LOV_PATTERN_RAID1 0x002   /* stripes are mirrors of each other */
343 #define LOV_PATTERN_FIRST 0x100   /* first stripe is not in round-robin */
344 #define LOV_PATTERN_CMOBD 0x200  
345  
346 #define lov_ost_data lov_ost_data_v1
347 struct lov_ost_data_v1 {          /* per-stripe data structure (little-endian)*/
348         __u64 l_object_id;        /* OST object ID */
349         __u64 l_object_gr;        /* OST object group (creating MDS number) */
350         __u32 l_ost_gen;          /* generation of this l_ost_idx */
351         __u32 l_ost_idx;          /* OST index in LOV (lov_tgt_desc->tgts) */
352 };
353
354 #define lov_mds_md lov_mds_md_v1
355 struct lov_mds_md_v1 {            /* LOV EA mds/wire data (little-endian) */
356         __u32 lmm_magic;          /* magic number = LOV_MAGIC_V1 */
357         __u32 lmm_pattern;        /* LOV_PATTERN_RAID0, LOV_PATTERN_RAID1 */
358         __u64 lmm_object_id;      /* LOV object ID */
359         __u64 lmm_object_gr;      /* LOV object group */
360         __u32 lmm_stripe_size;    /* size of stripe in bytes */
361         __u32 lmm_stripe_count;   /* num stripes in use for this object */
362         struct lov_ost_data_v1 lmm_objects[0]; /* per-stripe data */
363 };
364
365 #define LOV_MAGIC_V0      0x0BD00BD0
366
367 struct lov_ost_data_v0 {          /* per-stripe data structure (little-endian)*/
368         __u64 l_object_id;        /* OST object ID */
369 };
370
371 struct lov_mds_md_v0 {            /* LOV EA mds/wire data (little-endian) */
372         __u32 lmm_magic;          /* magic number = LOV_MAGIC_V0 */
373         __u64 lmm_object_id;      /* LOV object ID */
374         __u32 lmm_stripe_size;    /* size of the stripe in bytes (not RAID1) */
375         __u32 lmm_stripe_offset;  /* starting stripe offset in lmm_objects */
376         __u16 lmm_stripe_count;   /* number of stipes in use for this object */
377         __u16 lmm_ost_count;      /* how many OST idx are in this LOV md */
378         struct lov_ost_data_v0 lmm_objects[0];
379 } __attribute__((packed));
380
381 #define OBD_MD_FLALL    (0xffffffffffffffffLL)
382 #define OBD_MD_FLID     (0x0000000000000001LL)    /* object ID */
383 #define OBD_MD_FLATIME  (0x0000000000000002LL)    /* access time */
384 #define OBD_MD_FLMTIME  (0x0000000000000004LL)    /* data modification time */
385 #define OBD_MD_FLCTIME  (0x0000000000000008LL)    /* change time */
386 #define OBD_MD_FLSIZE   (0x0000000000000010LL)    /* size */
387 #define OBD_MD_FLBLOCKS (0x0000000000000020LL)    /* allocated blocks count */
388 #define OBD_MD_FLBLKSZ  (0x0000000000000040LL)    /* block size */
389 #define OBD_MD_FLMODE   (0x0000000000000080LL)    /* access bits (mode & ~S_IFMT) */
390 #define OBD_MD_FLTYPE   (0x0000000000000100LL)    /* object type (mode & S_IFMT) */
391 #define OBD_MD_FLUID    (0x0000000000000200LL)    /* user ID */
392 #define OBD_MD_FLGID    (0x0000000000000400LL)    /* group ID */
393 #define OBD_MD_FLFLAGS  (0x0000000000000800LL)    /* flags word */
394 #define OBD_MD_FLEA     (0x0000000000001000LL)    /* extended attributes */
395 #define OBD_MD_FLNLINK  (0x0000000000002000LL)    /* link count */
396 #define OBD_MD_FLGENER  (0x0000000000004000LL)    /* generation number */
397 #define OBD_MD_FLINLINE (0x0000000000008000LL)    /* inline data */
398 #define OBD_MD_FLRDEV   (0x0000000000010000LL)    /* device number */
399 #define OBD_MD_FLEASIZE (0x0000000000020000LL)    /* extended attribute data */
400 #define OBD_MD_LINKNAME (0x0000000000040000LL)    /* symbolic link target */
401 #define OBD_MD_FLHANDLE (0x0000000000080000LL)    /* file handle */
402 #define OBD_MD_FLCKSUM  (0x0000000000100000LL)    /* bulk data checksum */
403 #define OBD_MD_FLQOS    (0x0000000000200000LL)    /* quality of service stats */
404 #define OBD_MD_FLOSCOPQ (0x0000000000400000LL)    /* osc opaque data */
405 #define OBD_MD_FLCOOKIE (0x0000000000800000LL)    /* log cancellation cookie */
406 #define OBD_MD_FLGROUP  (0x0000000001000000LL)    /* group */
407 #define OBD_MD_FLIFID   (0x0000000002000000LL)    /* ->ost write inline fid */
408 #define OBD_MD_FLEPOCH  (0x0000000004000000LL)    /* ->ost write easize is epoch */
409 #define OBD_MD_FLGRANT  (0x0000000008000000LL)    /* ost preallocation space grant */
410 #define OBD_MD_MDS      (0x0000000010000000LL)    /* where an inode lives on */
411 #define OBD_MD_FLDIREA  (0x0000000020000000LL)    /* dir's extended attribute data */
412 #define OBD_MD_REINT    (0x0000000040000000LL)    /* reintegrate oa */
413 #define OBD_MD_FID      (0x0000000080000000LL)    /* lustre_id data */
414 #define OBD_MD_MEA      (0x0000000100000000LL)    /* shows we are interested in MEA */
415 #define OBD_MD_FLEALIST (0x0000000200000000LL)    /* list extended attributes */
416 #define OBD_MD_FLACL_ACCESS (0x0000000400000000LL) /*access acl*/
417
418 #define OBD_MD_FLNOTOBD (~(OBD_MD_FLBLOCKS | OBD_MD_LINKNAME |          \
419                            OBD_MD_FLEASIZE | OBD_MD_FLHANDLE |          \
420                            OBD_MD_FLCKSUM | OBD_MD_FLQOS |              \
421                            OBD_MD_FLOSCOPQ | OBD_MD_FLCOOKIE |          \
422                            OBD_MD_FLEA | OBD_MD_FLEALIST |              \
423                            OBD_MD_FLACL_ACCESS | OBD_MD_MDS))
424
425 static inline struct lustre_handle *obdo_handle(struct obdo *oa)
426 {
427         return (struct lustre_handle *)oa->o_inline;
428 }
429
430 static inline struct llog_cookie *obdo_logcookie(struct obdo *oa)
431 {
432         return (struct llog_cookie *)(oa->o_inline +
433                                       sizeof(struct lustre_handle));
434 }
435
436 /* don't forget obdo_fid which is way down at the bottom so it can come after
437  * the definition of llog_cookie */
438 struct obd_statfs {
439         __u64           os_type;
440         __u64           os_blocks;
441         __u64           os_bfree;
442         __u64           os_bavail;
443         __u64           os_files;
444         __u64           os_ffree;
445         __u8            os_fsid[40];
446         __u32           os_bsize;
447         __u32           os_namelen;
448         __u64           os_maxbytes;
449         __u32           os_spare[10];
450 };
451
452 extern void lustre_swab_obd_statfs (struct obd_statfs *os);
453
454 /* ost_body.data values for OST_BRW */
455
456 #define OBD_BRW_READ       0x01
457 #define OBD_BRW_WRITE      0x02
458 #define OBD_BRW_RWMASK     (OBD_BRW_READ | OBD_BRW_WRITE)
459 #define OBD_BRW_SYNC       0x08
460 #define OBD_BRW_CHECK      0x10
461 #define OBD_BRW_FROM_GRANT 0x20 /* the osc manages this under llite */
462 #define OBD_BRW_GRANTED    0x40 /* the ost manages this */
463
464 #define OBD_OBJECT_EOF 0xffffffffffffffffULL
465
466 #define OST_MIN_PRECREATE 32
467 #define OST_MAX_PRECREATE 20000
468
469 struct obd_ioobj {
470         obd_id               ioo_id;
471         obd_gr               ioo_gr;
472         __u32                ioo_type;
473         __u32                ioo_bufcnt;
474 };
475
476 extern void lustre_swab_obd_ioobj (struct obd_ioobj *ioo);
477
478 /* multiple of 8 bytes => can array */
479 struct niobuf_remote {
480         __u64 offset;
481         __u32 len;
482         __u32 flags;
483 };
484
485 extern void lustre_swab_niobuf_remote (struct niobuf_remote *nbr);
486
487 /* request structure for OST's */
488
489 #define OST_REQ_HAS_OA1  0x1
490
491 struct ost_body {
492         struct  obdo oa;
493 };
494
495 extern void lustre_swab_ost_body (struct ost_body *b);
496 extern void lustre_swab_ost_last_id(obd_id *id);
497 extern void lustre_swab_generic_32s(__u32 *val);
498
499 /* lock value block communicated between the filter and llite */
500
501 struct ost_lvb {
502         __u64 lvb_size;
503         __u64 lvb_mtime;
504         __u64 lvb_atime;
505         __u64 lvb_ctime;
506         __u64 lvb_blocks;
507 };
508
509 extern void lustre_swab_ost_lvb(struct ost_lvb *);
510
511 /*
512  *   MDS REQ RECORDS
513  */
514
515 /* offsets in the request */
516 #define MDS_REQ_SECDESC_OFF             0
517 #define MDS_REQ_REC_OFF                 1
518
519 #define MDS_REQ_INTENT_LOCKREQ_OFF      1
520 #define MDS_REQ_INTENT_IT_OFF           2
521 #define MDS_REQ_INTENT_REC_OFF          3
522
523 /* maximum supplementary groups */
524 #define LUSTRE_MAX_GROUPS               128
525
526 /* 
527  * security descriptor in mds request
528  */
529 struct mds_req_sec_desc {
530         __u32           rsd_uid;
531         __u32           rsd_gid;
532         __u32           rsd_fsuid;
533         __u32           rsd_fsgid;
534         __u32           rsd_cap;
535         __u32           rsd_ngroups;
536         __u32           rsd_groups[0];
537 };
538
539 struct ptlrpc_request;
540 struct mds_req_sec_desc *lustre_swab_mds_secdesc(struct ptlrpc_request *req,
541                                                  int offset);
542
543 /* opcodes */
544 typedef enum {
545         MDS_GETATTR      = 33,
546         MDS_GETATTR_LOCK = 34,
547         MDS_CLOSE        = 35,
548         MDS_REINT        = 36,
549         MDS_READPAGE     = 37,
550         MDS_CONNECT      = 38,
551         MDS_DISCONNECT   = 39,
552         MDS_GETSTATUS    = 40,
553         MDS_STATFS       = 41,
554         MDS_PIN          = 42,
555         MDS_UNPIN        = 43,
556         MDS_SYNC         = 44,
557         MDS_DONE_WRITING = 45,
558         MDS_LAST_OPC
559 } mds_cmd_t;
560
561 #define MDS_FIRST_OPC    MDS_GETATTR
562
563 /*
564  * Do not exceed 63
565  */
566
567 #define REINT_SETATTR      1
568 #define REINT_CREATE       2
569 #define REINT_LINK         3
570 #define REINT_UNLINK       4
571 #define REINT_RENAME       5
572 #define REINT_OPEN         6
573 #define REINT_CLOSE        7
574 #define REINT_WRITE        8
575 #define REINT_MAX          8
576
577 /* the disposition of the intent outlines what was executed */
578 #define DISP_IT_EXECD     (1 << 0)
579 #define DISP_LOOKUP_EXECD (1 << 1)
580 #define DISP_LOOKUP_NEG   (1 << 2)
581 #define DISP_LOOKUP_POS   (1 << 3)
582 #define DISP_OPEN_CREATE  (1 << 4)
583 #define DISP_OPEN_OPEN    (1 << 5)
584 #define DISP_ENQ_COMPLETE (1 << 6)
585
586 /* INODE LOCK PARTS */
587 #define MDS_INODELOCK_LOOKUP 0x000001  /* dentry, mode, owner, group */
588 #define MDS_INODELOCK_UPDATE 0x000002  /* size, links, timestamps */
589 #define MDS_INODELOCK_OPEN   0x000004  /* for opened files */
590
591 /* do not forget to increase MDS_INODELOCK_MAXSHIFT when adding new bits */
592 #define MDS_INODELOCK_MAXSHIFT 2
593
594 /* this FULL lock is useful to take on unlink sort of operations */
595 #define MDS_INODELOCK_FULL ((1 << (MDS_INODELOCK_MAXSHIFT + 1)) - 1)
596
597 /* lustre store cookie */
598 struct lustre_stc {
599         union {
600                 struct {
601                     __u64 l3s_ino;     /* inode number on local MDS */
602                     __u32 l3s_gen;     /* inode generation */
603                     __u32 l3s_type;    /* inode type */
604                 } e3s;
605         } u;
606 };
607
608 /* lustre file id */
609 struct lustre_fid {
610         __u64 lf_id;                   /* fid counter maintained on per 
611                                           group basis */
612         __u64 lf_group;                /* sequence group num */
613         __u32 lf_version;              /* what snapfs version of inode */
614         __u32 lf_padding;
615 };
616
617 struct lustre_id {
618         struct lustre_stc li_stc;      /* store cookie */
619         struct lustre_fid li_fid;      /* fid cookie */
620 };
621
622 struct mea_old {
623         __u32 mea_count;
624         __u32 mea_master;
625         struct lustre_id mea_ids[0];
626 };
627
628 #define MEA_MAGIC_LAST_CHAR      0xb2221ca1
629 #define MEA_MAGIC_ALL_CHARS      0xb222a11c
630
631 struct mea {
632         __u32 mea_magic;
633         __u32 mea_count;
634         __u32 mea_master;
635         struct lustre_id mea_ids[0];
636 };
637
638 #define MDS_STATUS_CONN 1
639 #define MDS_STATUS_LOV 2
640
641 struct mds_status_req {
642         __u32  flags;
643         __u32  repbuf;
644 };
645
646 extern void lustre_swab_lustre_id(struct lustre_id *id);
647 extern void lustre_swab_lustre_stc(struct lustre_stc *stc);
648 extern void lustre_swab_lustre_fid(struct lustre_fid *fid);
649 extern void lustre_swab_mds_status_req (struct mds_status_req *r);
650
651 #define MDS_BFLAG_UNCOMMITTED_WRITES   0x1
652
653 struct mds_body {
654         struct lustre_id id1;
655         struct lustre_id id2;
656         struct lustre_handle handle;
657         __u64          size;   /* Offset, in the case of MDS_READPAGE */
658         __u64          blocks; /* XID, in the case of MDS_READPAGE */
659         __u64          io_epoch;
660         __u64          valid;
661         __u32          mode;
662         __u32          uid;
663         __u32          gid;
664         __u32          mtime;
665         __u32          ctime;
666         __u32          atime;
667         __u32          flags;  /* from vfs for pin/unpin, MDS_BFLAG for close */
668         __u32          rdev;
669         __u32          nlink;  /* #bytes to read in the case of MDS_READPAGE */
670         __u32          eadatasize;
671 };
672
673 extern void lustre_swab_mds_body (struct mds_body *b);
674
675 struct lustre_md {
676         struct mds_body *body;
677         struct lov_stripe_md *lsm;
678         struct mea *mea;
679         struct posix_acl *acl_access;
680 };
681
682 struct mdc_op_data {
683         struct lustre_id id1;
684         struct lustre_id id2;
685         __u64            mod_time;
686         const char      *name;
687         int              namelen;
688         __u32            create_mode;
689         struct mea      *mea1;       /* mea of inode1 */
690         struct mea      *mea2;       /* mea of inode2 */
691         __u64            valid;
692 };
693
694 #define MDS_MODE_DONT_LOCK      (1 << 30)
695 #define MDS_MODE_REPLAY         (1 << 31)
696
697 struct mds_rec_setattr {
698         __u32            sa_opcode;
699         __u32            sa_valid;
700         struct lustre_id sa_id;
701         __u32            sa_mode;
702         __u32            sa_uid;
703         __u32            sa_gid;
704         __u32            sa_attr_flags;
705         __u64            sa_size;
706         __u64            sa_atime;
707         __u64            sa_mtime;
708         __u64            sa_ctime;
709 };
710
711 /* XXX Following ATTR_XXX should go to vfs patch...  */
712 #ifdef ATTR_CTIME_SET
713 #error "ATTR_CTIME_SET has been defined somewhere else"
714 #endif
715 #ifdef ATTR_EA
716 #error "ATTR_EA has been defined somewhere else"
717 #endif
718 #ifdef ATTR_EA_RM
719 #error "ATTR_EA_RM has been defined somewhere else"
720 #endif
721
722 #define ATTR_CTIME_SET  0x00002000
723 #define ATTR_EA         0x00040000
724 #define ATTR_EA_RM      0x00080000
725
726 extern void lustre_swab_mds_rec_setattr (struct mds_rec_setattr *sa);
727
728 #ifndef FMODE_READ
729 #define FMODE_READ               00000001
730 #define FMODE_WRITE              00000002
731 #endif
732 #ifndef FMODE_EXEC
733 #define FMODE_EXEC               00000004
734 #endif
735 #define MDS_OPEN_CREAT           00000100
736 #define MDS_OPEN_EXCL            00000200
737 #define MDS_OPEN_TRUNC           00001000
738 #define MDS_OPEN_APPEND          00002000
739 #define MDS_OPEN_SYNC            00010000
740 #define MDS_OPEN_DIRECTORY       00200000
741
742 #define MDS_OPEN_DELAY_CREATE    0100000000   /* delay initial object create */
743 #define MDS_OPEN_HAS_EA          010000000000 /* specify object create pattern */
744 #define MDS_OPEN_HAS_OBJS        020000000000 /* just set the EA the obj exist */
745
746 struct mds_rec_create {
747         __u32            cr_opcode;
748         __u32            cr_flags; /* for use with open */
749         __u32            cr_mode;
750         __u32            cr_padding;
751         struct lustre_id cr_id;
752         struct lustre_id cr_replayid;
753         __u64            cr_time;
754         __u64            cr_rdev;
755 };
756
757 extern void lustre_swab_mds_rec_create (struct mds_rec_create *cr);
758
759 struct mds_rec_link {
760         __u32            lk_opcode;
761         __u32            lk_padding;
762         struct lustre_id lk_id1;
763         struct lustre_id lk_id2;
764         __u64            lk_time;
765 };
766
767 extern void lustre_swab_mds_rec_link (struct mds_rec_link *lk);
768
769 struct mds_rec_unlink {
770         __u32            ul_opcode;
771         __u32            ul_mode;
772         struct lustre_id ul_id1;
773         struct lustre_id ul_id2;
774         __u64            ul_time;
775 };
776
777 extern void lustre_swab_mds_rec_unlink (struct mds_rec_unlink *ul);
778
779 struct mds_rec_rename {
780         __u32            rn_opcode;
781         __u32            rn_padding;
782         struct lustre_id rn_id1;
783         struct lustre_id rn_id2;
784         __u64            rn_time;
785 };
786
787 extern void lustre_swab_mds_rec_rename (struct mds_rec_rename *rn);
788
789 /*
790  *  LOV data structures
791  */
792
793 #define LOV_MAX_UUID_BUFFER_SIZE  8192
794 /* The size of the buffer the lov/mdc reserves for the
795  * array of UUIDs returned by the MDS.  With the current
796  * protocol, this will limit the max number of OSTs per LOV */
797
798 struct lov_desc {
799         __u32 ld_tgt_count;                /* how many OBD's */
800         __u32 ld_active_tgt_count;         /* how many active */
801         __u32 ld_default_stripe_count;     /* how many objects are used */
802         __u32 ld_pattern;                  /* PATTERN_RAID0, PATTERN_RAID1 */
803         __u64 ld_default_stripe_size;      /* in bytes */
804         __u64 ld_default_stripe_offset;    /* in bytes */
805         struct obd_uuid ld_uuid;
806 };
807
808 struct lmv_desc {
809         __u32 ld_tgt_count;                /* how many MDS's */
810         __u32 ld_active_tgt_count;         /* how many active */
811         struct obd_uuid ld_uuid;
812 };
813
814 extern void lustre_swab_lov_desc (struct lov_desc *ld);
815
816 /*
817  *   LDLM requests:
818  */
819 /* opcodes -- MUST be distinct from OST/MDS opcodes */
820 typedef enum {
821         LDLM_ENQUEUE     = 101,
822         LDLM_CONVERT     = 102,
823         LDLM_CANCEL      = 103,
824         LDLM_BL_CALLBACK = 104,
825         LDLM_CP_CALLBACK = 105,
826         LDLM_GL_CALLBACK = 106,
827         LDLM_LAST_OPC
828 } ldlm_cmd_t;
829 #define LDLM_FIRST_OPC LDLM_ENQUEUE
830
831 #define RES_NAME_SIZE 4
832 struct ldlm_res_id {
833         __u64 name[RES_NAME_SIZE];
834 };
835
836 extern void lustre_swab_ldlm_res_id (struct ldlm_res_id *id);
837
838 /* lock types */
839 typedef enum {
840         LCK_EX = 1,
841         LCK_PW = 2,
842         LCK_PR = 4,
843         LCK_CW = 8,
844         LCK_CR = 16,
845         LCK_NL = 32,
846         LCK_GROUP = 64
847 } ldlm_mode_t;
848
849 struct ldlm_extent {
850         __u64 start;
851         __u64 end;
852         __u64 gid;
853 };
854 struct ldlm_inodebits {
855         __u64 bits;
856 };
857
858 struct ldlm_flock {
859         __u64 start;
860         __u64 end;
861         __u64 pid;
862         __u64 blocking_pid;
863         __u64 blocking_export;
864 };
865
866 /* it's important that the fields of the ldlm_extent structure match
867  * the first fields of the ldlm_flock structure because there is only
868  * one ldlm_swab routine to process the ldlm_policy_data_t union. if
869  * this ever changes we will need to swab the union differently based
870  * on the resource type. */
871
872 typedef union {
873         struct ldlm_extent l_extent;
874         struct ldlm_flock  l_flock;
875         struct ldlm_inodebits l_inodebits;
876 } ldlm_policy_data_t;
877
878 extern void lustre_swab_ldlm_policy_data (ldlm_policy_data_t *d);
879
880 struct ldlm_intent {
881         __u64 opc;
882 };
883
884 extern void lustre_swab_ldlm_intent (struct ldlm_intent *i);
885
886 struct ldlm_resource_desc {
887         __u32 lr_type;
888         __u32 lr_padding;
889         struct ldlm_res_id lr_name;
890 };
891
892 extern void lustre_swab_ldlm_resource_desc (struct ldlm_resource_desc *r);
893
894 struct ldlm_lock_desc {
895         struct ldlm_resource_desc l_resource;
896         ldlm_mode_t l_req_mode;
897         ldlm_mode_t l_granted_mode;
898         ldlm_policy_data_t l_policy_data;
899 };
900
901 extern void lustre_swab_ldlm_lock_desc (struct ldlm_lock_desc *l);
902
903 struct ldlm_request {
904         __u32 lock_flags;
905         __u32 lock_padding;
906         struct ldlm_lock_desc lock_desc;
907         struct lustre_handle lock_handle1;
908         struct lustre_handle lock_handle2;
909 };
910
911 extern void lustre_swab_ldlm_request (struct ldlm_request *rq);
912
913 struct ldlm_reply {
914         __u32 lock_flags;
915         __u32 lock_padding;
916         struct ldlm_lock_desc lock_desc;
917         struct lustre_handle lock_handle;
918         __u64  lock_policy_res1;
919         __u64  lock_policy_res2;
920 };
921
922 extern void lustre_swab_ldlm_reply (struct ldlm_reply *r);
923
924 /*
925  * ptlbd, portal block device requests
926  */
927 typedef enum {
928         PTLBD_QUERY      = 200,
929         PTLBD_READ       = 201,
930         PTLBD_WRITE      = 202,
931         PTLBD_FLUSH      = 203,
932         PTLBD_CONNECT    = 204,
933         PTLBD_DISCONNECT = 205,
934         PTLBD_LAST_OPC
935 } ptlbd_cmd_t;
936 #define PTLBD_FIRST_OPC PTLBD_QUERY
937
938 struct ptlbd_op {
939         __u16 op_cmd;
940         __u16 op_lun;
941         __u16 op_niob_cnt;
942         __u16 op__padding;
943         __u32 op_block_cnt;
944 };
945
946 extern void lustre_swab_ptlbd_op (struct ptlbd_op *op);
947
948 struct ptlbd_niob {
949         __u64 n_xid;
950         __u64 n_block_nr;
951         __u32 n_offset;
952         __u32 n_length;
953 };
954
955 extern void lustre_swab_ptlbd_niob (struct ptlbd_niob *n);
956
957 struct ptlbd_rsp {
958         __u16 r_status;
959         __u16 r_error_cnt;
960 };
961
962 extern void lustre_swab_ptlbd_rsp (struct ptlbd_rsp *r);
963
964 /*
965  * Opcodes for management/monitoring node.
966  */
967 typedef enum {
968         MGMT_CONNECT = 250,
969         MGMT_DISCONNECT,
970         MGMT_EXCEPTION,         /* node died, etc. */
971         MGMT_LAST_OPC
972 } mgmt_cmd_t;
973 #define MGMT_FIRST_OPC MGMT_CONNECT
974
975 /*
976  * Opcodes for multiple servers.
977  */
978
979 typedef enum {
980         OBD_PING = 400,
981         OBD_LOG_CANCEL,
982         OBD_LAST_OPC
983 } obd_cmd_t;
984 #define OBD_FIRST_OPC OBD_PING
985
986 /* catalog of log objects */
987
988 /* Identifier for a single log object */
989 struct llog_logid {
990         __u64                   lgl_oid;
991         __u64                   lgl_ogr;
992         __u32                   lgl_ogen;
993 } __attribute__((packed));
994
995 /* Records written to the CATALOGS list */
996 #define CATLIST "CATALOGS"
997 struct llog_catid {
998         struct llog_logid       lci_logid;
999         __u32                   lci_padding[3];
1000 } __attribute__((packed));
1001
1002 /* Log data record types - there is no specific reason that these need to
1003  * be related to the RPC opcodes, but no reason not to (may be handy later?)
1004  */
1005 typedef enum {
1006         OST_SZ_REC       = 0x10600000 | (OST_SAN_WRITE << 8),
1007         OST_RAID1_REC    = 0x10600000 | ((OST_SAN_WRITE + 1) << 8),
1008         MDS_UNLINK_REC   = 0x10610000 | (MDS_REINT << 8) | REINT_UNLINK,
1009         OBD_CFG_REC      = 0x10620000,
1010         PTL_CFG_REC      = 0x10630000,
1011         LLOG_GEN_REC     = 0x10640000,
1012         LLOG_HDR_MAGIC   = 0x10645539,
1013         LLOG_LOGID_MAGIC = 0x1064553b,
1014         SMFS_UPDATE_REC  = 0x10650000,
1015         CACHE_LRU_REC    = 0x10660000,
1016 } llog_op_type;
1017
1018 /* Log record header - stored in little endian order.
1019  * Each record must start with this struct, end with a llog_rec_tail,
1020  * and be a multiple of 256 bits in size.
1021  */
1022 struct llog_rec_hdr {
1023         __u32                   lrh_len;
1024         __u32                   lrh_index;
1025         __u32                   lrh_type;
1026         __u32                   padding;
1027 };
1028
1029 struct llog_rec_tail {
1030         __u32 lrt_len;
1031         __u32 lrt_index;
1032 };
1033
1034 struct llog_logid_rec {
1035         struct llog_rec_hdr     lid_hdr;
1036         struct llog_logid       lid_id;
1037         __u32                   padding[5];
1038         struct llog_rec_tail    lid_tail;
1039 } __attribute__((packed));
1040
1041 struct llog_create_rec {
1042         struct llog_rec_hdr     lcr_hdr;
1043         struct lustre_id        lcr_id;
1044         obd_id                  lcr_oid;
1045         obd_count               lcr_ogen;
1046         __u32                   padding;
1047         struct llog_rec_tail    lcr_tail;
1048 } __attribute__((packed));
1049
1050 struct llog_orphan_rec {
1051         struct llog_rec_hdr     lor_hdr;
1052         obd_id                  lor_oid;
1053         obd_count               lor_ogen;
1054         __u32                   padding;
1055         struct llog_rec_tail    lor_tail;
1056 } __attribute__((packed));
1057
1058 struct llog_unlink_rec {
1059         struct llog_rec_hdr     lur_hdr;
1060         obd_id                  lur_oid;
1061         obd_count               lur_ogen;
1062         __u32                   padding;
1063         struct llog_rec_tail    lur_tail;
1064 } __attribute__((packed));
1065
1066 struct llog_size_change_rec {
1067         struct llog_rec_hdr     lsc_hdr;
1068         struct lustre_id        lsc_id;
1069         __u32                   lsc_io_epoch;
1070         __u32                   padding;
1071         struct llog_rec_tail    lsc_tail;
1072 } __attribute__((packed));
1073
1074 struct llog_gen {
1075         __u64 mnt_cnt;
1076         __u64 conn_cnt;
1077 };
1078
1079 struct llog_gen_rec {
1080         struct llog_rec_hdr     lgr_hdr;
1081         struct llog_gen         lgr_gen;
1082         struct llog_rec_tail    lgr_tail;
1083 } __attribute__((packed));
1084
1085 struct llog_lru_rec {
1086         struct llog_rec_hdr     llr_hdr;
1087         struct lustre_id        llr_cid;
1088         struct lustre_id        llr_pid;
1089         struct llog_rec_tail    llr_tail;
1090 } __attribute__((packed));
1091
1092 /* On-disk header structure of each log object, stored in little endian order */
1093 #define LLOG_CHUNK_SIZE         8192
1094 #define LLOG_HEADER_SIZE        (96)
1095 #define LLOG_BITMAP_BYTES       (LLOG_CHUNK_SIZE - LLOG_HEADER_SIZE)
1096
1097 #define LLOG_MIN_REC_SIZE       (24) /* round(llog_rec_hdr + llog_rec_tail) */
1098
1099 /* flags for the logs */
1100 #define LLOG_F_ZAP_WHEN_EMPTY   0x1
1101 #define LLOG_F_IS_CAT           0x2
1102 #define LLOG_F_IS_PLAIN         0x4
1103
1104 struct llog_log_hdr {
1105         struct llog_rec_hdr     llh_hdr;
1106         __u64                   llh_timestamp;
1107         __u32                   llh_count;
1108         __u32                   llh_bitmap_offset;
1109         __u32                   llh_size;
1110         __u32                   llh_flags;
1111         __u32                   llh_cat_idx;
1112         /* for a catalog the first plain slot is next to it */
1113         struct obd_uuid         llh_tgtuuid;
1114         __u32                 llh_reserved[LLOG_HEADER_SIZE/sizeof(__u32) - 23];
1115         __u32                   llh_bitmap[LLOG_BITMAP_BYTES/sizeof(__u32)];
1116         struct llog_rec_tail    llh_tail;
1117 } __attribute__((packed));
1118
1119 #define LLOG_BITMAP_SIZE(llh)  ((llh->llh_hdr.lrh_len -         \
1120                                  llh->llh_bitmap_offset -       \
1121                                  sizeof(llh->llh_tail)) * 8)
1122
1123 /* log cookies are used to reference a specific log file and a record therein */
1124 struct llog_cookie {
1125         struct llog_logid       lgc_lgl;
1126         __u32                   lgc_subsys;
1127         __u32                   lgc_index;
1128         __u32                   lgc_flags;
1129 } __attribute__((packed));
1130
1131 /* llog protocol */
1132 enum llogd_rpc_ops {
1133         LLOG_ORIGIN_HANDLE_OPEN         = 501,
1134         LLOG_ORIGIN_HANDLE_NEXT_BLOCK   = 502,
1135         LLOG_ORIGIN_HANDLE_READ_HEADER  = 503,
1136         LLOG_ORIGIN_HANDLE_WRITE_REC    = 504,
1137         LLOG_ORIGIN_HANDLE_CLOSE        = 505,
1138         LLOG_ORIGIN_CONNECT             = 506,
1139         LLOG_CATINFO                    = 507,  /* for lfs catinfo */
1140         LLOG_ORIGIN_HANDLE_PREV_BLOCK   = 508,
1141 };
1142
1143 struct llogd_body {
1144         struct llog_logid  lgd_logid;
1145         __u32 lgd_ctxt_idx;
1146         __u32 lgd_llh_flags;
1147         __u32 lgd_index;
1148         __u32 lgd_saved_index;
1149         __u32 lgd_len;
1150         __u64 lgd_cur_offset;
1151 } __attribute__((packed));
1152
1153 struct llogd_conn_body {
1154         struct llog_gen         lgdc_gen;
1155         struct llog_logid       lgdc_logid;
1156         __u32                   lgdc_ctxt_idx;
1157 } __attribute__((packed));
1158
1159 extern void lustre_swab_llogd_body (struct llogd_body *d);
1160 extern void lustre_swab_llog_hdr (struct llog_log_hdr *h);
1161 extern void lustre_swab_llogd_conn_body (struct llogd_conn_body *d);
1162
1163 struct lustre_cfg;
1164 extern void lustre_swab_lustre_cfg(struct lustre_cfg *lcfg);
1165
1166 static inline struct lustre_id *obdo_id(struct obdo *oa)
1167 {
1168         void *raw_id = oa->o_inline + sizeof(struct lustre_handle) +
1169                 sizeof(struct llog_cookie);
1170         
1171         return (struct lustre_id *)raw_id;
1172 }
1173
1174 /* security negotiate */
1175 typedef enum {
1176         SEC_INIT                = 600,
1177         SEC_INIT_CONTINUE       = 601,
1178         SEC_FINI                = 602,
1179         SEC_LAST_OPC
1180 } sec_cmd_t;
1181 #define SEC_FIRST_OPC SEC_INIT
1182
1183 #endif