Whamcloud - gitweb
b=16098
[fs/lustre-release.git] / libcfs / libcfs / tracefile.h
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see [sun.com URL with a
20  * copy of GPLv2].
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  */
36
37 #ifndef __LIBCFS_TRACEFILE_H__
38 #define __LIBCFS_TRACEFILE_H__
39
40 #include <libcfs/libcfs.h>
41
42 /* trace file lock routines */
43
44 #define TRACEFILE_NAME_SIZE 1024
45 extern char      tracefile[TRACEFILE_NAME_SIZE];
46 extern long long tracefile_size;
47
48 int  tracefile_init_arch(void);
49 void tracefile_fini_arch(void);
50
51 void tracefile_read_lock(void);
52 void tracefile_read_unlock(void);
53 void tracefile_write_lock(void);
54 void tracefile_write_unlock(void);
55
56 int tracefile_dump_all_pages(char *filename);
57 void trace_debug_print(void);
58 void trace_flush_pages(void);
59 int trace_start_thread(void);
60 void trace_stop_thread(void);
61 int tracefile_init(int max_pages);
62 void tracefile_exit(void);
63
64
65
66 int trace_copyin_string(char *knl_buffer, int knl_buffer_nob,
67                         const char *usr_buffer, int usr_buffer_nob);
68 int trace_copyout_string(char *usr_buffer, int usr_buffer_nob,
69                          const char *knl_str, char *append);
70 int trace_allocate_string_buffer(char **str, int nob);
71 void trace_free_string_buffer(char *str, int nob);
72 int trace_dump_debug_buffer_usrstr(void *usr_str, int usr_str_nob);
73 int trace_daemon_command(char *str);
74 int trace_daemon_command_usrstr(void *usr_str, int usr_str_nob);
75 int trace_set_debug_mb(int mb);
76 int trace_set_debug_mb_usrstr(void *usr_str, int usr_str_nob);
77 int trace_get_debug_mb(void);
78
79 extern void libcfs_debug_dumplog_internal(void *arg);
80 extern void libcfs_register_panic_notifier(void);
81 extern void libcfs_unregister_panic_notifier(void);
82 extern int  libcfs_panic_in_progress;
83 extern int  trace_max_debug_mb(void);
84
85 #define TCD_MAX_PAGES (5 << (20 - CFS_PAGE_SHIFT))
86 #define TCD_STOCK_PAGES (TCD_MAX_PAGES)
87 #define TRACEFILE_SIZE (500 << 20)
88
89 #ifdef LUSTRE_TRACEFILE_PRIVATE
90
91 /*
92  * Private declare for tracefile
93  */
94 #define TCD_MAX_PAGES (5 << (20 - CFS_PAGE_SHIFT))
95 #define TCD_STOCK_PAGES (TCD_MAX_PAGES)
96
97 #define TRACEFILE_SIZE (500 << 20)
98
99 /* Size of a buffer for sprinting console messages if we can't get a page 
100  * from system */
101 #define TRACE_CONSOLE_BUFFER_SIZE   1024
102
103 union trace_data_union {
104         struct trace_cpu_data {
105                 /*
106                  * pages with trace records not yet processed by tracefiled.
107                  */
108                 struct list_head        tcd_pages;
109                 /* number of pages on ->tcd_pages */
110                 unsigned long           tcd_cur_pages;
111
112                 /*
113                  * pages with trace records already processed by
114                  * tracefiled. These pages are kept in memory, so that some
115                  * portion of log can be written in the event of LBUG. This
116                  * list is maintained in LRU order.
117                  *
118                  * Pages are moved to ->tcd_daemon_pages by tracefiled()
119                  * (put_pages_on_daemon_list()). LRU pages from this list are
120                  * discarded when list grows too large.
121                  */
122                 struct list_head        tcd_daemon_pages;
123                 /* number of pages on ->tcd_daemon_pages */
124                 unsigned long           tcd_cur_daemon_pages;
125
126                 /*
127                  * Maximal number of pages allowed on ->tcd_pages and
128                  * ->tcd_daemon_pages each. 
129                  * Always TCD_MAX_PAGES * tcd_pages_factor / 100 in current
130                  * implementation.
131                  */
132                 unsigned long           tcd_max_pages;
133
134                 /*
135                  * preallocated pages to write trace records into. Pages from
136                  * ->tcd_stock_pages are moved to ->tcd_pages by
137                  * portals_debug_msg().
138                  *
139                  * This list is necessary, because on some platforms it's
140                  * impossible to perform efficient atomic page allocation in a
141                  * non-blockable context.
142                  *
143                  * Such platforms fill ->tcd_stock_pages "on occasion", when
144                  * tracing code is entered in blockable context.
145                  *
146                  * trace_get_tage_try() tries to get a page from
147                  * ->tcd_stock_pages first and resorts to atomic page
148                  * allocation only if this queue is empty. ->tcd_stock_pages
149                  * is replenished when tracing code is entered in blocking
150                  * context (darwin-tracefile.c:trace_get_tcd()). We try to
151                  * maintain TCD_STOCK_PAGES (40 by default) pages in this
152                  * queue. Atomic allocation is only required if more than
153                  * TCD_STOCK_PAGES pagesful are consumed by trace records all
154                  * emitted in non-blocking contexts. Which is quite unlikely.
155                  */
156                 struct list_head        tcd_stock_pages;
157                 /* number of pages on ->tcd_stock_pages */
158                 unsigned long           tcd_cur_stock_pages;
159
160                 unsigned short          tcd_shutting_down;
161                 unsigned short          tcd_cpu;
162                 unsigned short          tcd_type;
163                 /* The factors to share debug memory. */
164                 unsigned short          tcd_pages_factor;
165         } tcd;
166         char __pad[L1_CACHE_ALIGN(sizeof(struct trace_cpu_data))];
167 };
168
169 #define TCD_MAX_TYPES      8
170 extern union trace_data_union (*trace_data[TCD_MAX_TYPES])[NR_CPUS];
171
172 #define tcd_for_each(tcd, i, j)                                       \
173     for (i = 0; trace_data[i] != NULL; i++)                           \
174         for (j = 0, ((tcd) = &(*trace_data[i])[j].tcd);               \
175              j < num_possible_cpus(); j++, (tcd) = &(*trace_data[i])[j].tcd)
176
177 #define tcd_for_each_type_lock(tcd, i)                                \
178     for (i = 0; trace_data[i] &&                                      \
179          (tcd = &(*trace_data[i])[smp_processor_id()].tcd) &&         \
180          trace_lock_tcd(tcd); trace_unlock_tcd(tcd), i++)
181
182 /* XXX nikita: this declaration is internal to tracefile.c and should probably
183  * be moved there */
184 struct page_collection {
185         struct list_head        pc_pages;
186         /*
187          * spin-lock protecting ->pc_pages. It is taken by smp_call_function()
188          * call-back functions. XXX nikita: Which is horrible: all processors
189          * receive NMI at the same time only to be serialized by this
190          * lock. Probably ->pc_pages should be replaced with an array of
191          * NR_CPUS elements accessed locklessly.
192          */
193         spinlock_t              pc_lock;
194         /*
195          * if this flag is set, collect_pages() will spill both
196          * ->tcd_daemon_pages and ->tcd_pages to the ->pc_pages. Otherwise,
197          * only ->tcd_pages are spilled.
198          */
199         int                     pc_want_daemon_pages;
200 };
201
202 /* XXX nikita: this declaration is internal to tracefile.c and should probably
203  * be moved there */
204 struct tracefiled_ctl {
205         struct completion       tctl_start;
206         struct completion       tctl_stop;
207         cfs_waitq_t             tctl_waitq;
208         pid_t                   tctl_pid;
209         atomic_t                tctl_shutdown;
210 };
211
212 /*
213  * small data-structure for each page owned by tracefiled.
214  */
215 /* XXX nikita: this declaration is internal to tracefile.c and should probably
216  * be moved there */
217 struct trace_page {
218         /*
219          * page itself
220          */
221         cfs_page_t      *page;
222         /*
223          * linkage into one of the lists in trace_data_union or
224          * page_collection
225          */
226         struct list_head linkage;
227         /*
228          * number of bytes used within this page
229          */
230         unsigned int     used;
231         /*
232          * cpu that owns this page
233          */
234         unsigned short   cpu;
235         /*
236          * type(context) of this page 
237          */
238         unsigned short   type;
239 };
240
241 extern void set_ptldebug_header(struct ptldebug_header *header,
242                            int subsys, int mask, const int line,
243                            unsigned long stack);
244 extern void print_to_console(struct ptldebug_header *hdr, int mask, const char *buf,
245                              int len, const char *file, const char *fn);
246
247 extern struct trace_cpu_data *trace_get_tcd(void);
248 extern void trace_put_tcd(struct trace_cpu_data *tcd);
249 extern int trace_lock_tcd(struct trace_cpu_data *tcd);
250 extern void trace_unlock_tcd(struct trace_cpu_data *tcd);
251 extern char *trace_get_console_buffer(void);
252 extern void trace_put_console_buffer(char *buffer);
253
254 extern void trace_call_on_all_cpus(void (*fn)(void *arg), void *arg);
255
256 int trace_refill_stock(struct trace_cpu_data *tcd, int gfp,
257                        struct list_head *stock);
258
259
260 int tcd_owns_tage(struct trace_cpu_data *tcd, struct trace_page *tage);
261
262 extern void trace_assertion_failed(const char *str, const char *fn,
263                                    const char *file, int line);
264
265 /* ASSERTION that is safe to use within the debug system */
266 #define __LASSERT(cond)                                                         \
267 ({                                                                              \
268         if (unlikely(!(cond))) {                                                \
269                 trace_assertion_failed("ASSERTION("#cond") failed",             \
270                                        __FUNCTION__, __FILE__, __LINE__);       \
271         }                                                                       \
272 })
273
274 #define __LASSERT_TAGE_INVARIANT(tage)                  \
275 ({                                                      \
276         __LASSERT(tage != NULL);                        \
277         __LASSERT(tage->page != NULL);                  \
278         __LASSERT(tage->used <= CFS_PAGE_SIZE);         \
279         __LASSERT(cfs_page_count(tage->page) > 0);      \
280 })
281
282 #endif  /* LUSTRE_TRACEFILE_PRIVATE */
283
284 #endif /* __LIBCFS_TRACEFILE_H__ */