Whamcloud - gitweb
f08be5168e8d11a0e3451c3386ed7f636a17cba6
[fs/lustre-release.git] / libcfs / libcfs / linux / linux-debug.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * libcfs/libcfs/linux/linux-debug.c
37  *
38  * Author: Phil Schwan <phil@clusterfs.com>
39  */
40
41 #ifndef EXPORT_SYMTAB
42 # define EXPORT_SYMTAB
43 #endif
44
45 #ifndef AUTOCONF_INCLUDED
46 #include <linux/config.h>
47 #endif
48 #include <linux/module.h>
49 #include <linux/kmod.h>
50 #include <linux/notifier.h>
51 #include <linux/kernel.h>
52 #include <linux/mm.h>
53 #include <linux/string.h>
54 #include <linux/stat.h>
55 #include <linux/errno.h>
56 #include <linux/smp_lock.h>
57 #include <linux/unistd.h>
58 #include <linux/interrupt.h>
59 #include <asm/system.h>
60 #include <asm/uaccess.h>
61 #include <linux/completion.h>
62
63 #include <linux/fs.h>
64 #include <linux/stat.h>
65 #include <asm/uaccess.h>
66 #include <linux/miscdevice.h>
67 #include <linux/version.h>
68
69 # define DEBUG_SUBSYSTEM S_LNET
70
71 #include <libcfs/libcfs.h>
72 #include <libcfs/linux/portals_compat25.h>
73
74 #include "tracefile.h"
75
76 #if (LINUX_VERSION_CODE > KERNEL_VERSION(2,5,0))
77 #include <linux/kallsyms.h>
78 #endif
79
80 char lnet_upcall[1024] = "/usr/lib/lustre/lnet_upcall";
81 char lnet_debug_log_upcall[1024] = "/usr/lib/lustre/lnet_debug_log_upcall";
82
83 /**
84  * Upcall function once a Lustre log has been dumped.
85  *
86  * \param file  path of the dumped log
87  */
88 void libcfs_run_debug_log_upcall(char *file)
89 {
90         char *argv[3];
91         int   rc;
92         char *envp[] = {
93                 "HOME=/",
94                 "PATH=/sbin:/bin:/usr/sbin:/usr/bin",
95                 NULL};
96         ENTRY;
97
98         argv[0] = lnet_debug_log_upcall;
99
100         LASSERTF(file != NULL, "called on a null filename\n");
101         argv[1] = file; //only need to pass the path of the file
102
103         argv[2] = NULL;
104
105         rc = USERMODEHELPER(argv[0], argv, envp);
106         if (rc < 0 && rc != -ENOENT) {
107                 CERROR("Error %d invoking LNET debug log upcall %s %s; "
108                        "check /proc/sys/lnet/debug_log_upcall\n",
109                        rc, argv[0], argv[1]);
110         } else {
111                 CDEBUG(D_HA, "Invoked LNET debug log upcall %s %s\n",
112                        argv[0], argv[1]);
113         }
114
115         EXIT;
116 }
117
118 void libcfs_run_upcall(char **argv)
119 {
120         int   rc;
121         int   argc;
122         char *envp[] = {
123                 "HOME=/",
124                 "PATH=/sbin:/bin:/usr/sbin:/usr/bin",
125                 NULL};
126         ENTRY;
127
128         argv[0] = lnet_upcall;
129         argc = 1;
130         while (argv[argc] != NULL)
131                 argc++;
132
133         LASSERT(argc >= 2);
134
135         rc = USERMODEHELPER(argv[0], argv, envp);
136         if (rc < 0 && rc != -ENOENT) {
137                 CERROR("Error %d invoking LNET upcall %s %s%s%s%s%s%s%s%s; "
138                        "check /proc/sys/lnet/upcall\n",
139                        rc, argv[0], argv[1],
140                        argc < 3 ? "" : ",", argc < 3 ? "" : argv[2],
141                        argc < 4 ? "" : ",", argc < 4 ? "" : argv[3],
142                        argc < 5 ? "" : ",", argc < 5 ? "" : argv[4],
143                        argc < 6 ? "" : ",...");
144         } else {
145                 CDEBUG(D_HA, "Invoked LNET upcall %s %s%s%s%s%s%s%s%s\n",
146                        argv[0], argv[1],
147                        argc < 3 ? "" : ",", argc < 3 ? "" : argv[2],
148                        argc < 4 ? "" : ",", argc < 4 ? "" : argv[3],
149                        argc < 5 ? "" : ",", argc < 5 ? "" : argv[4],
150                        argc < 6 ? "" : ",...");
151         }
152 }
153
154 void libcfs_run_lbug_upcall(const char *file, const char *fn, const int line)
155 {
156         char *argv[6];
157         char buf[32];
158
159         ENTRY;
160         snprintf (buf, sizeof buf, "%d", line);
161
162         argv[1] = "LBUG";
163         argv[2] = (char *)file;
164         argv[3] = (char *)fn;
165         argv[4] = buf;
166         argv[5] = NULL;
167
168         libcfs_run_upcall (argv);
169 }
170
171 #ifdef __arch_um__
172 void lbug_with_loc(const char *file, const char *func, const int line)
173 {
174         libcfs_catastrophe = 1;
175         libcfs_debug_msg(NULL, 0, D_EMERG, file, func, line,
176                          "LBUG - trying to dump log to %s\n", debug_file_path);
177         libcfs_debug_dumplog();
178         libcfs_run_lbug_upcall(file, func, line);
179         asm("int $3");
180         panic("LBUG");
181 }
182 #else
183 /* coverity[+kill] */
184 void lbug_with_loc(const char *file, const char *func, const int line)
185 {
186         libcfs_catastrophe = 1;
187         libcfs_debug_msg(NULL, 0, D_EMERG, file, func, line, "LBUG\n");
188
189         if (in_interrupt()) {
190                 panic("LBUG in interrupt.\n");
191                 /* not reached */
192         }
193
194         libcfs_debug_dumpstack(NULL);
195         if (!libcfs_panic_on_lbug)
196                 libcfs_debug_dumplog();
197         libcfs_run_lbug_upcall(file, func, line);
198         if (libcfs_panic_on_lbug)
199                 panic("LBUG");
200         set_task_state(current, TASK_UNINTERRUPTIBLE);
201         while (1)
202                 schedule();
203 }
204 #endif /* __arch_um__ */
205
206 #ifdef __KERNEL__
207
208 #ifdef HAVE_DUMP_TRACE
209 #include <linux/nmi.h>
210 #include <asm/stacktrace.h>
211
212 static void
213 print_trace_warning_symbol(void *data, char *msg, unsigned long symbol)
214 {
215         printk(data);
216         print_symbol(msg, symbol);
217         printk("\n");
218 }
219
220 static void print_trace_warning(void *data, char *msg)
221 {
222         printk("%s%s\n", (char *)data, msg);
223 }
224
225 static int print_trace_stack(void *data, char *name)
226 {
227         printk(" <%s> ", name);
228         return 0;
229 }
230
231 #ifdef HAVE_TRACE_ADDRESS_RELIABLE
232 # define RELIABLE reliable
233 # define DUMP_TRACE_CONST const
234 static void print_trace_address(void *data, unsigned long addr, int reliable)
235 #else
236 /* before 2.6.24 there was no reliable arg */
237 # define RELIABLE 1
238 # define DUMP_TRACE_CONST
239 static void print_trace_address(void *data, unsigned long addr)
240 #endif
241 {
242         char fmt[32];
243         touch_nmi_watchdog();
244         sprintf(fmt, " [<%016lx>] %s%%s\n", addr, RELIABLE ? "": "? ");
245         __print_symbol(fmt, addr);
246 }
247
248 static DUMP_TRACE_CONST struct stacktrace_ops print_trace_ops = {
249         .warning = print_trace_warning,
250         .warning_symbol = print_trace_warning_symbol,
251         .stack = print_trace_stack,
252         .address = print_trace_address,
253 };
254 #endif
255
256 void libcfs_debug_dumpstack(struct task_struct *tsk)
257 {
258 #if defined(__arch_um__)
259         if (tsk != NULL)
260                 CWARN("stack dump for pid %d (%d) requested; wake up gdb.\n",
261                       tsk->pid, UML_PID(tsk));
262         //asm("int $3");
263 #elif defined(HAVE_DUMP_TRACE)
264         /* dump_stack() */
265         /* show_trace() */
266         if (tsk == NULL)
267                 tsk = current;
268         printk("Pid: %d, comm: %.20s\n", tsk->pid, tsk->comm);
269         /* show_trace_log_lvl() */
270         printk("\nCall Trace:\n");
271         dump_trace(tsk, NULL, NULL,
272 #ifdef HAVE_TRACE_ADDRESS_RELIABLE
273                    0,
274 #endif /* HAVE_TRACE_ADDRESS_RELIABLE */
275                    &print_trace_ops, NULL);
276         printk("\n");
277 #elif defined(HAVE_SHOW_TASK)
278         /* this is exported by lustre kernel version 42 */
279         extern void show_task(struct task_struct *);
280
281         if (tsk == NULL)
282                 tsk = current;
283         CWARN("showing stack for process %d\n", tsk->pid);
284         show_task(tsk);
285 #else
286         if ((tsk == NULL) || (tsk == current))
287                 dump_stack();
288         else
289                 CWARN("can't show stack: kernel doesn't export show_task\n");
290 #endif
291 }
292
293 cfs_task_t *libcfs_current(void)
294 {
295         CWARN("current task struct is %p\n", current);
296         return current;
297 }
298
299 static int panic_notifier(struct notifier_block *self, unsigned long unused1,
300                          void *unused2)
301 {
302         if (libcfs_panic_in_progress)
303                 return 0;
304
305         libcfs_panic_in_progress = 1;
306         mb();
307
308 #ifdef LNET_DUMP_ON_PANIC
309         /* This is currently disabled because it spews far too much to the
310          * console on the rare cases it is ever triggered. */
311
312         if (in_interrupt()) {
313                 trace_debug_print();
314         } else {
315                 while (current->lock_depth >= 0)
316                         unlock_kernel();
317
318                 libcfs_debug_dumplog_internal((void *)(long)cfs_curproc_pid());
319         }
320 #endif
321         return 0;
322 }
323
324 static struct notifier_block libcfs_panic_notifier = {
325         notifier_call :     panic_notifier,
326         next :              NULL,
327         priority :          10000
328 };
329
330 void libcfs_register_panic_notifier(void)
331 {
332 #ifdef HAVE_ATOMIC_PANIC_NOTIFIER
333         atomic_notifier_chain_register(&panic_notifier_list, &libcfs_panic_notifier);
334 #else
335         notifier_chain_register(&panic_notifier_list, &libcfs_panic_notifier);
336 #endif
337 }
338
339 void libcfs_unregister_panic_notifier(void)
340 {
341 #ifdef HAVE_ATOMIC_PANIC_NOTIFIER
342         atomic_notifier_chain_unregister(&panic_notifier_list, &libcfs_panic_notifier);
343 #else
344         notifier_chain_unregister(&panic_notifier_list, &libcfs_panic_notifier);
345 #endif
346 }
347
348 EXPORT_SYMBOL(libcfs_debug_dumpstack);
349 EXPORT_SYMBOL(libcfs_current);
350
351 #endif /* __KERNEL__ */
352
353 EXPORT_SYMBOL(libcfs_run_upcall);
354 EXPORT_SYMBOL(libcfs_run_lbug_upcall);
355 EXPORT_SYMBOL(lbug_with_loc);