Whamcloud - gitweb
LU-14090 mgs: no local logs flag
[fs/lustre-release.git] / lustre / include / lustre_disk.h
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.gnu.org/licenses/gpl-2.0.html
19  *
20  * GPL HEADER END
21  */
22 /*
23  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
24  * Use is subject to license terms.
25  *
26  * Copyright (c) 2011, 2017, Intel Corporation.
27  */
28 /*
29  * This file is part of Lustre, http://www.lustre.org/
30  * Lustre is a trademark of Sun Microsystems, Inc.
31  *
32  * lustre/include/lustre_disk.h
33  *
34  * Lustre disk format definitions.
35  *
36  * Author: Nathan Rutman <nathan@clusterfs.com>
37  */
38
39 #ifndef _LUSTRE_DISK_H
40 #define _LUSTRE_DISK_H
41
42 /** \defgroup disk disk
43  *
44  * @{
45  */
46 #include <asm/byteorder.h>
47 #include <linux/types.h>
48 #include <linux/backing-dev.h>
49 #include <linux/list.h>
50 #include <libcfs/libcfs.h>
51 #include <uapi/linux/lustre/lustre_disk.h>
52 #include <uapi/linux/lustre/lustre_idl.h>
53
54 #define IS_MDT(data)            ((data)->lsi_flags & LDD_F_SV_TYPE_MDT)
55 #define IS_OST(data)            ((data)->lsi_flags & LDD_F_SV_TYPE_OST)
56 #define IS_MGS(data)            ((data)->lsi_flags & LDD_F_SV_TYPE_MGS)
57 #define IS_SERVER(data)         ((data)->lsi_flags & (LDD_F_SV_TYPE_MGS | \
58                                                       LDD_F_SV_TYPE_MDT | \
59                                                       LDD_F_SV_TYPE_OST))
60 #define MT_STR(data)            mt_str((data)->ldd_mount_type)
61
62 /****************** mount command *********************/
63
64 /* The lmd is only used internally by Lustre; mount simply passes
65  * everything as string options
66  */
67 #define LMD_MAGIC               0xbdacbd03
68 #define LMD_PARAMS_MAXLEN       4096
69
70 /* gleaned from the mount command - no persistent info here */
71 struct lustre_mount_data {
72         u32     lmd_magic;
73         u32     lmd_flags;      /* lustre mount flags */
74         int     lmd_mgs_failnodes; /* mgs failover node count */
75         int     lmd_exclude_count;
76         int     lmd_recovery_time_soft;
77         int     lmd_recovery_time_hard;
78         char   *lmd_dev;        /* device name */
79         char   *lmd_profile;    /* client only */
80         char   *lmd_fileset;    /* mount fileset */
81         char   *lmd_mgssec;     /* sptlrpc flavor to mgs */
82         char   *lmd_opts;       /* lustre mount options (as opposed to
83                                  * device_ mount options) */
84         char   *lmd_params;     /* lustre params */
85         u32    *lmd_exclude;    /* array of OSTs to ignore */
86         char   *lmd_mgs;        /* MGS nid */
87         char   *lmd_osd_type;   /* OSD type */
88         char   *lmd_nidnet;     /* network to restrict this client to */
89 };
90
91 #define LMD_FLG_SERVER          0x0001  /* Mounting a server */
92 #define LMD_FLG_CLIENT          0x0002  /* Mounting a client */
93 #define LMD_FLG_SKIP_LFSCK      0x0004  /* NOT auto resume LFSCK when mount */
94 #define LMD_FLG_ABORT_RECOV     0x0008  /* Abort recovery */
95 #define LMD_FLG_NOSVC           0x0010  /* Only start MGS/MGC for servers,
96                                            no other services */
97 #define LMD_FLG_NOMGS           0x0020  /* Only start target for servers, reusing
98                                            existing MGS services */
99 #define LMD_FLG_WRITECONF       0x0040  /* Rewrite config log */
100 #define LMD_FLG_NOIR            0x0080  /* NO imperative recovery */
101 #define LMD_FLG_NOSCRUB         0x0100  /* Do not trigger scrub automatically */
102 #define LMD_FLG_MGS             0x0200  /* Also start MGS along with server */
103 #define LMD_FLG_IAM             0x0400  /* IAM dir */
104 #define LMD_FLG_NO_PRIMNODE     0x0800  /* all nodes are service nodes */
105 #define LMD_FLG_VIRGIN          0x1000  /* the service registers first time */
106 #define LMD_FLG_UPDATE          0x2000  /* update parameters */
107 #define LMD_FLG_HSM             0x4000  /* Start coordinator */
108 #define LMD_FLG_DEV_RDONLY      0x8000  /* discard modification quitely */
109 #define LMD_FLG_NO_PRECREATE    0x10000 /* do not allow OST object creation */
110 #define LMD_FLG_LOCAL_RECOV     0x20000 /* force recovery for local clients */
111 #define LMD_FLG_ABORT_RECOV_MDT 0x40000 /* Abort recovery between MDTs */
112 #define LMD_FLG_NO_LOCAL_LOGS   0x80000 /* Use config logs from MGS */
113
114 #define lmd_is_client(x) ((x)->lmd_flags & LMD_FLG_CLIENT)
115
116 /****************** superblock additional info *********************/
117 struct ll_sb_info;
118 struct kobject;
119
120 struct lustre_sb_info {
121         int                       lsi_flags;
122         struct obd_device        *lsi_mgc;     /* mgc obd */
123         struct lustre_mount_data *lsi_lmd;     /* mount command info */
124         struct ll_sb_info        *lsi_llsbi;   /* add'l client sbi info */
125         struct dt_device         *lsi_dt_dev;  /* dt device to access disk fs*/
126         atomic_t                  lsi_mounts;  /* references to the srv_mnt */
127         struct kobject           *lsi_kobj;
128         char                      lsi_svname[MTI_NAME_MAXLEN];
129         /* lsi_osd_obdname format = 'lsi->ls_svname'-osd */
130         char                      lsi_osd_obdname[MTI_NAME_MAXLEN + 4];
131         /* lsi_osd_uuid format = 'lsi->ls_osd_obdname'_UUID */
132         char                      lsi_osd_uuid[MTI_NAME_MAXLEN + 9];
133         struct obd_export        *lsi_osd_exp;
134         char                      lsi_osd_type[16];
135         char                      lsi_fstype[16];
136         struct backing_dev_info   lsi_bdi;     /* each client mountpoint needs
137                                                   own backing_dev_info */
138         /* protect lsi_lwp_list */
139         struct mutex              lsi_lwp_mutex;
140         struct list_head          lsi_lwp_list;
141         unsigned long             lsi_lwp_started:1,
142                                   lsi_server_started:1;
143 #ifdef CONFIG_LL_ENCRYPTION
144         const struct llcrypt_operations *lsi_cop;
145         struct key               *lsi_master_keys; /* master crypto keys used */
146 #endif
147 };
148
149 #define LSI_UMOUNT_FAILOVER              0x00200000
150
151 #define     s2lsi(sb)        ((struct lustre_sb_info *)((sb)->s_fs_info))
152 #define     s2lsi_nocast(sb) ((sb)->s_fs_info)
153
154 #define     get_profile_name(sb)   (s2lsi(sb)->lsi_lmd->lmd_profile)
155 #define     get_mount_fileset(sb)  (s2lsi(sb)->lsi_lmd->lmd_fileset)
156
157 # ifdef HAVE_SERVER_SUPPORT
158 /* opc for target register */
159 #define LDD_F_OPC_REG   0x10000000
160 #define LDD_F_OPC_UNREG 0x20000000
161 #define LDD_F_OPC_READY 0x40000000
162 #define LDD_F_OPC_MASK  0xf0000000
163
164 #define LDD_F_MASK      0xFFFF
165
166 /*
167  * This limit is arbitrary (131072 clients on x86), but it is convenient to use
168  * 2^n * PAGE_SIZE * 8 for the number of bits that fit an order-n allocation.
169  * If we need more than 131072 clients (order-2 allocation on x86) then this
170  * should become an array of single-page pointers that are allocated on demand.
171  */
172 #if (128 * 1024UL) > (PAGE_SIZE * 8)
173 #define LR_MAX_CLIENTS (128 * 1024UL)
174 #else
175 #define LR_MAX_CLIENTS (PAGE_SIZE * 8)
176 #endif
177
178 /** COMPAT_146: this is an OST (temporary) */
179 #define OBD_COMPAT_OST          0x00000002
180 /** COMPAT_146: this is an MDT (temporary) */
181 #define OBD_COMPAT_MDT          0x00000004
182 /** 2.0 server, interop flag to show server version is changed */
183 #define OBD_COMPAT_20           0x00000008
184
185 /** MDS handles LOV_OBJID file */
186 #define OBD_ROCOMPAT_LOVOBJID           0x00000001
187 /** store OST index in the IDIF */
188 #define OBD_ROCOMPAT_IDX_IN_IDIF        0x00000002
189
190 /** OST handles group subdirs */
191 #define OBD_INCOMPAT_GROUPS     0x00000001
192 /** this is an OST */
193 #define OBD_INCOMPAT_OST        0x00000002
194 /** this is an MDT */
195 #define OBD_INCOMPAT_MDT        0x00000004
196 /** common last_rvcd format */
197 #define OBD_INCOMPAT_COMMON_LR  0x00000008
198 /** FID is enabled */
199 #define OBD_INCOMPAT_FID        0x00000010
200 /** Size-on-MDS is enabled */
201 #define OBD_INCOMPAT_SOM        0x00000020
202 /** filesystem using iam format to store directory entries */
203 #define OBD_INCOMPAT_IAM_DIR    0x00000040
204 /** LMA attribute contains per-inode incompatible flags */
205 #define OBD_INCOMPAT_LMA        0x00000080
206 /** lmm_stripe_count has been shrunk from u32 to u16 and the remaining 16
207  * bits are now used to store a generation. Once we start changing the layout
208  * and bumping the generation, old versions expecting a 32-bit lmm_stripe_count
209  * will be confused by interpreting stripe_count | gen << 16 as the actual
210  * stripe count */
211 #define OBD_INCOMPAT_LMM_VER    0x00000100
212 /** multiple OI files for MDT */
213 #define OBD_INCOMPAT_MULTI_OI   0x00000200
214 /** multiple RPCs in flight */
215 #define OBD_INCOMPAT_MULTI_RPCS 0x00000400
216
217 /* last_rcvd handling */
218 static inline void lsd_le_to_cpu(struct lr_server_data *buf,
219                                  struct lr_server_data *lsd)
220 {
221         int i;
222
223         memcpy(lsd->lsd_uuid, buf->lsd_uuid, sizeof(lsd->lsd_uuid));
224         lsd->lsd_last_transno = le64_to_cpu(buf->lsd_last_transno);
225         lsd->lsd_compat14 = le64_to_cpu(buf->lsd_compat14);
226         lsd->lsd_mount_count = le64_to_cpu(buf->lsd_mount_count);
227         lsd->lsd_feature_compat = le32_to_cpu(buf->lsd_feature_compat);
228         lsd->lsd_feature_rocompat = le32_to_cpu(buf->lsd_feature_rocompat);
229         lsd->lsd_feature_incompat = le32_to_cpu(buf->lsd_feature_incompat);
230         lsd->lsd_server_size = le32_to_cpu(buf->lsd_server_size);
231         lsd->lsd_client_start = le32_to_cpu(buf->lsd_client_start);
232         lsd->lsd_client_size = le16_to_cpu(buf->lsd_client_size);
233         lsd->lsd_subdir_count = le16_to_cpu(buf->lsd_subdir_count);
234         lsd->lsd_catalog_oid = le64_to_cpu(buf->lsd_catalog_oid);
235         lsd->lsd_catalog_ogen = le32_to_cpu(buf->lsd_catalog_ogen);
236         memcpy(lsd->lsd_peeruuid, buf->lsd_peeruuid, sizeof(lsd->lsd_peeruuid));
237         lsd->lsd_osd_index = le32_to_cpu(buf->lsd_osd_index);
238         lsd->lsd_padding1 = le32_to_cpu(buf->lsd_padding1);
239         lsd->lsd_start_epoch = le32_to_cpu(buf->lsd_start_epoch);
240         for (i = 0; i < LR_EXPIRE_INTERVALS; i++)
241                 lsd->lsd_trans_table[i] = le64_to_cpu(buf->lsd_trans_table[i]);
242         lsd->lsd_trans_table_time = le32_to_cpu(buf->lsd_trans_table_time);
243         lsd->lsd_expire_intervals = le32_to_cpu(buf->lsd_expire_intervals);
244 }
245
246 static inline void lsd_cpu_to_le(struct lr_server_data *lsd,
247                                  struct lr_server_data *buf)
248 {
249         int i;
250
251         memcpy(buf->lsd_uuid, lsd->lsd_uuid, sizeof(buf->lsd_uuid));
252         buf->lsd_last_transno = cpu_to_le64(lsd->lsd_last_transno);
253         buf->lsd_compat14 = cpu_to_le64(lsd->lsd_compat14);
254         buf->lsd_mount_count = cpu_to_le64(lsd->lsd_mount_count);
255         buf->lsd_feature_compat = cpu_to_le32(lsd->lsd_feature_compat);
256         buf->lsd_feature_rocompat = cpu_to_le32(lsd->lsd_feature_rocompat);
257         buf->lsd_feature_incompat = cpu_to_le32(lsd->lsd_feature_incompat);
258         buf->lsd_server_size = cpu_to_le32(lsd->lsd_server_size);
259         buf->lsd_client_start = cpu_to_le32(lsd->lsd_client_start);
260         buf->lsd_client_size = cpu_to_le16(lsd->lsd_client_size);
261         buf->lsd_subdir_count = cpu_to_le16(lsd->lsd_subdir_count);
262         buf->lsd_catalog_oid = cpu_to_le64(lsd->lsd_catalog_oid);
263         buf->lsd_catalog_ogen = cpu_to_le32(lsd->lsd_catalog_ogen);
264         memcpy(buf->lsd_peeruuid, lsd->lsd_peeruuid, sizeof(buf->lsd_peeruuid));
265         buf->lsd_osd_index = cpu_to_le32(lsd->lsd_osd_index);
266         buf->lsd_padding1 = cpu_to_le32(lsd->lsd_padding1);
267         buf->lsd_start_epoch = cpu_to_le32(lsd->lsd_start_epoch);
268         for (i = 0; i < LR_EXPIRE_INTERVALS; i++)
269                 buf->lsd_trans_table[i] = cpu_to_le64(lsd->lsd_trans_table[i]);
270         buf->lsd_trans_table_time = cpu_to_le32(lsd->lsd_trans_table_time);
271         buf->lsd_expire_intervals = cpu_to_le32(lsd->lsd_expire_intervals);
272 }
273
274 static inline void lcd_le_to_cpu(struct lsd_client_data *buf,
275                                  struct lsd_client_data *lcd)
276 {
277         memcpy(lcd->lcd_uuid, buf->lcd_uuid, sizeof (lcd->lcd_uuid));
278         lcd->lcd_last_transno = le64_to_cpu(buf->lcd_last_transno);
279         lcd->lcd_last_xid = le64_to_cpu(buf->lcd_last_xid);
280         lcd->lcd_last_result = le32_to_cpu(buf->lcd_last_result);
281         lcd->lcd_last_data = le32_to_cpu(buf->lcd_last_data);
282         lcd->lcd_last_close_transno = le64_to_cpu(buf->lcd_last_close_transno);
283         lcd->lcd_last_close_xid = le64_to_cpu(buf->lcd_last_close_xid);
284         lcd->lcd_last_close_result = le32_to_cpu(buf->lcd_last_close_result);
285         lcd->lcd_last_close_data = le32_to_cpu(buf->lcd_last_close_data);
286         lcd->lcd_pre_versions[0] = le64_to_cpu(buf->lcd_pre_versions[0]);
287         lcd->lcd_pre_versions[1] = le64_to_cpu(buf->lcd_pre_versions[1]);
288         lcd->lcd_pre_versions[2] = le64_to_cpu(buf->lcd_pre_versions[2]);
289         lcd->lcd_pre_versions[3] = le64_to_cpu(buf->lcd_pre_versions[3]);
290         lcd->lcd_last_epoch = le32_to_cpu(buf->lcd_last_epoch);
291         lcd->lcd_generation = le32_to_cpu(buf->lcd_generation);
292 }
293
294 static inline void lcd_cpu_to_le(struct lsd_client_data *lcd,
295                                  struct lsd_client_data *buf)
296 {
297         memcpy(buf->lcd_uuid, lcd->lcd_uuid, sizeof (lcd->lcd_uuid));
298         buf->lcd_last_transno = cpu_to_le64(lcd->lcd_last_transno);
299         buf->lcd_last_xid = cpu_to_le64(lcd->lcd_last_xid);
300         buf->lcd_last_result = cpu_to_le32(lcd->lcd_last_result);
301         buf->lcd_last_data = cpu_to_le32(lcd->lcd_last_data);
302         buf->lcd_last_close_transno = cpu_to_le64(lcd->lcd_last_close_transno);
303         buf->lcd_last_close_xid = cpu_to_le64(lcd->lcd_last_close_xid);
304         buf->lcd_last_close_result = cpu_to_le32(lcd->lcd_last_close_result);
305         buf->lcd_last_close_data = cpu_to_le32(lcd->lcd_last_close_data);
306         buf->lcd_pre_versions[0] = cpu_to_le64(lcd->lcd_pre_versions[0]);
307         buf->lcd_pre_versions[1] = cpu_to_le64(lcd->lcd_pre_versions[1]);
308         buf->lcd_pre_versions[2] = cpu_to_le64(lcd->lcd_pre_versions[2]);
309         buf->lcd_pre_versions[3] = cpu_to_le64(lcd->lcd_pre_versions[3]);
310         buf->lcd_last_epoch = cpu_to_le32(lcd->lcd_last_epoch);
311         buf->lcd_generation = cpu_to_le32(lcd->lcd_generation);
312 }
313
314 static inline u64 lcd_last_transno(struct lsd_client_data *lcd)
315 {
316         return (lcd->lcd_last_transno > lcd->lcd_last_close_transno ?
317                 lcd->lcd_last_transno : lcd->lcd_last_close_transno);
318 }
319
320 static inline u64 lcd_last_xid(struct lsd_client_data *lcd)
321 {
322         return (lcd->lcd_last_xid > lcd->lcd_last_close_xid ?
323                 lcd->lcd_last_xid : lcd->lcd_last_close_xid);
324 }
325
326 /****************** mount lookup info *********************/
327
328 struct lustre_mount_info {
329         char                    *lmi_name;
330         struct super_block      *lmi_sb;
331         struct list_head         lmi_list_chain;
332 };
333
334 /****************** prototypes *********************/
335
336 /* obd_mount_server.c */
337 int server_fill_super(struct super_block *sb);
338 struct lustre_mount_info *server_get_mount(const char *name);
339 int server_put_mount(const char *name, bool dereg_mnt);
340 struct mgs_target_info;
341 int server_mti_print(const char *title, struct mgs_target_info *mti);
342 void server_calc_timeout(struct lustre_sb_info *lsi, struct obd_device *obd);
343
344 /* obd_mount.c */
345 int server_name2svname(const char *label, char *svname, const char **endptr,
346                        size_t svsize);
347
348 int server_name_is_ost(const char *svname);
349 int target_name2index(const char *svname, u32 *idx, const char **endptr);
350
351 int lustre_put_lsi(struct super_block *sb);
352 int lustre_start_simple(char *obdname, char *type, char *uuid,
353                         char *s1, char *s2, char *s3, char *s4);
354 #endif /* HAVE_SERVER_SUPPORT */
355 int server_name2fsname(const char *svname, char *fsname, const char **endptr);
356 void obdname2fsname(const char *tgt, char *fsname, size_t fslen);
357
358 int lustre_start_mgc(struct super_block *sb);
359 int lustre_common_put_super(struct super_block *sb);
360
361 struct lustre_sb_info *lustre_init_lsi(struct super_block *sb);
362 int lustre_put_lsi(struct super_block *sb);
363 int lmd_parse(char *options, struct lustre_mount_data *lmd);
364
365 /* mgc_request.c */
366 int mgc_fsname2resid(char *fsname, struct ldlm_res_id *res_id, int type);
367 int mgc_logname2resid(char *fsname, struct ldlm_res_id *res_id, int type);
368
369 /** @} disk */
370
371 #endif /* _LUSTRE_DISK_H */