Whamcloud - gitweb
b=16150
[fs/lustre-release.git] / libcfs / libcfs / tracefile.h
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  */
36
37 #ifndef __LIBCFS_TRACEFILE_H__
38 #define __LIBCFS_TRACEFILE_H__
39
40 #include <libcfs/libcfs.h>
41
42 /* trace file lock routines */
43
44 #define TRACEFILE_NAME_SIZE 1024
45 extern char      tracefile[TRACEFILE_NAME_SIZE];
46 extern long long tracefile_size;
47
48 extern void libcfs_run_debug_log_upcall(char *file);
49
50 int  tracefile_init_arch(void);
51 void tracefile_fini_arch(void);
52
53 void tracefile_read_lock(void);
54 void tracefile_read_unlock(void);
55 void tracefile_write_lock(void);
56 void tracefile_write_unlock(void);
57
58 int tracefile_dump_all_pages(char *filename);
59 void trace_debug_print(void);
60 void trace_flush_pages(void);
61 int trace_start_thread(void);
62 void trace_stop_thread(void);
63 int tracefile_init(int max_pages);
64 void tracefile_exit(void);
65
66
67
68 int trace_copyin_string(char *knl_buffer, int knl_buffer_nob,
69                         const char *usr_buffer, int usr_buffer_nob);
70 int trace_copyout_string(char *usr_buffer, int usr_buffer_nob,
71                          const char *knl_str, char *append);
72 int trace_allocate_string_buffer(char **str, int nob);
73 void trace_free_string_buffer(char *str, int nob);
74 int trace_dump_debug_buffer_usrstr(void *usr_str, int usr_str_nob);
75 int trace_daemon_command(char *str);
76 int trace_daemon_command_usrstr(void *usr_str, int usr_str_nob);
77 int trace_set_debug_mb(int mb);
78 int trace_set_debug_mb_usrstr(void *usr_str, int usr_str_nob);
79 int trace_get_debug_mb(void);
80
81 extern void libcfs_debug_dumplog_internal(void *arg);
82 extern void libcfs_register_panic_notifier(void);
83 extern void libcfs_unregister_panic_notifier(void);
84 extern int  libcfs_panic_in_progress;
85 extern int  trace_max_debug_mb(void);
86
87 #define TCD_MAX_PAGES (5 << (20 - CFS_PAGE_SHIFT))
88 #define TCD_STOCK_PAGES (TCD_MAX_PAGES)
89 #define TRACEFILE_SIZE (500 << 20)
90
91 #ifdef LUSTRE_TRACEFILE_PRIVATE
92
93 /*
94  * Private declare for tracefile
95  */
96 #define TCD_MAX_PAGES (5 << (20 - CFS_PAGE_SHIFT))
97 #define TCD_STOCK_PAGES (TCD_MAX_PAGES)
98
99 #define TRACEFILE_SIZE (500 << 20)
100
101 /* Size of a buffer for sprinting console messages if we can't get a page
102  * from system */
103 #define TRACE_CONSOLE_BUFFER_SIZE   1024
104
105 union trace_data_union {
106         struct trace_cpu_data {
107                 /*
108                  * pages with trace records not yet processed by tracefiled.
109                  */
110                 struct list_head        tcd_pages;
111                 /* number of pages on ->tcd_pages */
112                 unsigned long           tcd_cur_pages;
113
114                 /*
115                  * pages with trace records already processed by
116                  * tracefiled. These pages are kept in memory, so that some
117                  * portion of log can be written in the event of LBUG. This
118                  * list is maintained in LRU order.
119                  *
120                  * Pages are moved to ->tcd_daemon_pages by tracefiled()
121                  * (put_pages_on_daemon_list()). LRU pages from this list are
122                  * discarded when list grows too large.
123                  */
124                 struct list_head        tcd_daemon_pages;
125                 /* number of pages on ->tcd_daemon_pages */
126                 unsigned long           tcd_cur_daemon_pages;
127
128                 /*
129                  * Maximal number of pages allowed on ->tcd_pages and
130                  * ->tcd_daemon_pages each.
131                  * Always TCD_MAX_PAGES * tcd_pages_factor / 100 in current
132                  * implementation.
133                  */
134                 unsigned long           tcd_max_pages;
135
136                 /*
137                  * preallocated pages to write trace records into. Pages from
138                  * ->tcd_stock_pages are moved to ->tcd_pages by
139                  * portals_debug_msg().
140                  *
141                  * This list is necessary, because on some platforms it's
142                  * impossible to perform efficient atomic page allocation in a
143                  * non-blockable context.
144                  *
145                  * Such platforms fill ->tcd_stock_pages "on occasion", when
146                  * tracing code is entered in blockable context.
147                  *
148                  * trace_get_tage_try() tries to get a page from
149                  * ->tcd_stock_pages first and resorts to atomic page
150                  * allocation only if this queue is empty. ->tcd_stock_pages
151                  * is replenished when tracing code is entered in blocking
152                  * context (darwin-tracefile.c:trace_get_tcd()). We try to
153                  * maintain TCD_STOCK_PAGES (40 by default) pages in this
154                  * queue. Atomic allocation is only required if more than
155                  * TCD_STOCK_PAGES pagesful are consumed by trace records all
156                  * emitted in non-blocking contexts. Which is quite unlikely.
157                  */
158                 struct list_head        tcd_stock_pages;
159                 /* number of pages on ->tcd_stock_pages */
160                 unsigned long           tcd_cur_stock_pages;
161
162                 unsigned short          tcd_shutting_down;
163                 unsigned short          tcd_cpu;
164                 unsigned short          tcd_type;
165                 /* The factors to share debug memory. */
166                 unsigned short          tcd_pages_factor;
167         } tcd;
168         char __pad[L1_CACHE_ALIGN(sizeof(struct trace_cpu_data))];
169 };
170
171 #define TCD_MAX_TYPES      8
172 extern union trace_data_union (*trace_data[TCD_MAX_TYPES])[NR_CPUS];
173
174 #define tcd_for_each(tcd, i, j)                                       \
175     for (i = 0; trace_data[i] != NULL; i++)                           \
176         for (j = 0, ((tcd) = &(*trace_data[i])[j].tcd);               \
177              j < num_possible_cpus(); j++, (tcd) = &(*trace_data[i])[j].tcd)
178
179 #define tcd_for_each_type_lock(tcd, i)                                \
180     for (i = 0; trace_data[i] &&                                      \
181          (tcd = &(*trace_data[i])[smp_processor_id()].tcd) &&         \
182          trace_lock_tcd(tcd); trace_unlock_tcd(tcd), i++)
183
184 /* XXX nikita: this declaration is internal to tracefile.c and should probably
185  * be moved there */
186 struct page_collection {
187         struct list_head        pc_pages;
188         /*
189          * spin-lock protecting ->pc_pages. It is taken by smp_call_function()
190          * call-back functions. XXX nikita: Which is horrible: all processors
191          * receive NMI at the same time only to be serialized by this
192          * lock. Probably ->pc_pages should be replaced with an array of
193          * NR_CPUS elements accessed locklessly.
194          */
195         spinlock_t              pc_lock;
196         /*
197          * if this flag is set, collect_pages() will spill both
198          * ->tcd_daemon_pages and ->tcd_pages to the ->pc_pages. Otherwise,
199          * only ->tcd_pages are spilled.
200          */
201         int                     pc_want_daemon_pages;
202 };
203
204 /* XXX nikita: this declaration is internal to tracefile.c and should probably
205  * be moved there */
206 struct tracefiled_ctl {
207         struct completion       tctl_start;
208         struct completion       tctl_stop;
209         cfs_waitq_t             tctl_waitq;
210         pid_t                   tctl_pid;
211         atomic_t                tctl_shutdown;
212 };
213
214 /*
215  * small data-structure for each page owned by tracefiled.
216  */
217 /* XXX nikita: this declaration is internal to tracefile.c and should probably
218  * be moved there */
219 struct trace_page {
220         /*
221          * page itself
222          */
223         cfs_page_t      *page;
224         /*
225          * linkage into one of the lists in trace_data_union or
226          * page_collection
227          */
228         struct list_head linkage;
229         /*
230          * number of bytes used within this page
231          */
232         unsigned int     used;
233         /*
234          * cpu that owns this page
235          */
236         unsigned short   cpu;
237         /*
238          * type(context) of this page
239          */
240         unsigned short   type;
241 };
242
243 extern void set_ptldebug_header(struct ptldebug_header *header,
244                            int subsys, int mask, const int line,
245                            unsigned long stack);
246 extern void print_to_console(struct ptldebug_header *hdr, int mask, const char *buf,
247                              int len, const char *file, const char *fn);
248
249 extern struct trace_cpu_data *trace_get_tcd(void);
250 extern void trace_put_tcd(struct trace_cpu_data *tcd);
251 extern int trace_lock_tcd(struct trace_cpu_data *tcd);
252 extern void trace_unlock_tcd(struct trace_cpu_data *tcd);
253 extern char *trace_get_console_buffer(void);
254 extern void trace_put_console_buffer(char *buffer);
255
256 extern void trace_call_on_all_cpus(void (*fn)(void *arg), void *arg);
257
258 int trace_refill_stock(struct trace_cpu_data *tcd, int gfp,
259                        struct list_head *stock);
260
261
262 int tcd_owns_tage(struct trace_cpu_data *tcd, struct trace_page *tage);
263
264 extern void trace_assertion_failed(const char *str, const char *fn,
265                                    const char *file, int line);
266
267 /* ASSERTION that is safe to use within the debug system */
268 #define __LASSERT(cond)                                                 \
269     do {                                                                \
270         if (unlikely(!(cond))) {                                        \
271                 trace_assertion_failed("ASSERTION("#cond") failed",     \
272                                  __FUNCTION__, __FILE__, __LINE__);     \
273         }                                                               \
274     } while (0)
275
276 #define __LASSERT_TAGE_INVARIANT(tage)                                  \
277     do {                                                                \
278         __LASSERT(tage != NULL);                                        \
279         __LASSERT(tage->page != NULL);                                  \
280         __LASSERT(tage->used <= CFS_PAGE_SIZE);                         \
281         __LASSERT(cfs_page_count(tage->page) > 0);                      \
282     } while (0)
283
284 #endif  /* LUSTRE_TRACEFILE_PRIVATE */
285
286 #endif /* __LIBCFS_TRACEFILE_H__ */