Whamcloud - gitweb
LU-969 debug: reduce stack usage
[fs/lustre-release.git] / libcfs / libcfs / linux / linux-debug.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright (c) 2008, 2010, Oracle and/or its affiliates. All rights reserved.
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * libcfs/libcfs/linux/linux-debug.c
37  *
38  * Author: Phil Schwan <phil@clusterfs.com>
39  */
40
41 #ifndef EXPORT_SYMTAB
42 # define EXPORT_SYMTAB
43 #endif
44
45 #ifndef AUTOCONF_INCLUDED
46 #include <linux/config.h>
47 #endif
48 #include <linux/module.h>
49 #include <linux/kmod.h>
50 #include <linux/notifier.h>
51 #include <linux/kernel.h>
52 #include <linux/mm.h>
53 #include <linux/string.h>
54 #include <linux/stat.h>
55 #include <linux/errno.h>
56 #include <linux/smp_lock.h>
57 #include <linux/unistd.h>
58 #include <linux/interrupt.h>
59 #include <asm/system.h>
60 #include <asm/uaccess.h>
61 #include <linux/completion.h>
62
63 #include <linux/fs.h>
64 #include <linux/stat.h>
65 #include <asm/uaccess.h>
66 #include <linux/miscdevice.h>
67 #include <linux/version.h>
68
69 # define DEBUG_SUBSYSTEM S_LNET
70
71 #include <libcfs/libcfs.h>
72 #include <libcfs/linux/portals_compat25.h>
73
74 #include "tracefile.h"
75
76 #include <linux/kallsyms.h>
77
78 char lnet_upcall[1024] = "/usr/lib/lustre/lnet_upcall";
79 char lnet_debug_log_upcall[1024] = "/usr/lib/lustre/lnet_debug_log_upcall";
80
81 /**
82  * Upcall function once a Lustre log has been dumped.
83  *
84  * \param file  path of the dumped log
85  */
86 void libcfs_run_debug_log_upcall(char *file)
87 {
88         char *argv[3];
89         int   rc;
90         char *envp[] = {
91                 "HOME=/",
92                 "PATH=/sbin:/bin:/usr/sbin:/usr/bin",
93                 NULL};
94         ENTRY;
95
96         argv[0] = lnet_debug_log_upcall;
97
98         LASSERTF(file != NULL, "called on a null filename\n");
99         argv[1] = file; //only need to pass the path of the file
100
101         argv[2] = NULL;
102
103         rc = USERMODEHELPER(argv[0], argv, envp);
104         if (rc < 0 && rc != -ENOENT) {
105                 CERROR("Error %d invoking LNET debug log upcall %s %s; "
106                        "check /proc/sys/lnet/debug_log_upcall\n",
107                        rc, argv[0], argv[1]);
108         } else {
109                 CDEBUG(D_HA, "Invoked LNET debug log upcall %s %s\n",
110                        argv[0], argv[1]);
111         }
112
113         EXIT;
114 }
115
116 void libcfs_run_upcall(char **argv)
117 {
118         int   rc;
119         int   argc;
120         char *envp[] = {
121                 "HOME=/",
122                 "PATH=/sbin:/bin:/usr/sbin:/usr/bin",
123                 NULL};
124         ENTRY;
125
126         argv[0] = lnet_upcall;
127         argc = 1;
128         while (argv[argc] != NULL)
129                 argc++;
130
131         LASSERT(argc >= 2);
132
133         rc = USERMODEHELPER(argv[0], argv, envp);
134         if (rc < 0 && rc != -ENOENT) {
135                 CERROR("Error %d invoking LNET upcall %s %s%s%s%s%s%s%s%s; "
136                        "check /proc/sys/lnet/upcall\n",
137                        rc, argv[0], argv[1],
138                        argc < 3 ? "" : ",", argc < 3 ? "" : argv[2],
139                        argc < 4 ? "" : ",", argc < 4 ? "" : argv[3],
140                        argc < 5 ? "" : ",", argc < 5 ? "" : argv[4],
141                        argc < 6 ? "" : ",...");
142         } else {
143                 CDEBUG(D_HA, "Invoked LNET upcall %s %s%s%s%s%s%s%s%s\n",
144                        argv[0], argv[1],
145                        argc < 3 ? "" : ",", argc < 3 ? "" : argv[2],
146                        argc < 4 ? "" : ",", argc < 4 ? "" : argv[3],
147                        argc < 5 ? "" : ",", argc < 5 ? "" : argv[4],
148                        argc < 6 ? "" : ",...");
149         }
150 }
151
152 void libcfs_run_lbug_upcall(struct libcfs_debug_msg_data *msgdata)
153 {
154         char *argv[6];
155         char buf[32];
156
157         ENTRY;
158         snprintf (buf, sizeof buf, "%d", msgdata->msg_line);
159
160         argv[1] = "LBUG";
161         argv[2] = (char *)msgdata->msg_file;
162         argv[3] = (char *)msgdata->msg_fn;
163         argv[4] = buf;
164         argv[5] = NULL;
165
166         libcfs_run_upcall (argv);
167 }
168
169 #ifdef __arch_um__
170 void lbug_with_loc(struct libcfs_debug_msg_data *msgdata)
171 {
172         libcfs_catastrophe = 1;
173         libcfs_debug_msg(msgdata, "LBUG - trying to dump log to %s\n",
174                          libcfs_debug_file_path);
175         libcfs_debug_dumplog();
176         libcfs_run_lbug_upcall(msgdata);
177         asm("int $3");
178         panic("LBUG");
179 }
180 #else
181 /* coverity[+kill] */
182 void lbug_with_loc(struct libcfs_debug_msg_data *msgdata)
183 {
184         libcfs_catastrophe = 1;
185         libcfs_debug_msg(msgdata, "LBUG\n");
186
187         if (in_interrupt()) {
188                 panic("LBUG in interrupt.\n");
189                 /* not reached */
190         }
191
192         libcfs_debug_dumpstack(NULL);
193         if (!libcfs_panic_on_lbug)
194                 libcfs_debug_dumplog();
195         libcfs_run_lbug_upcall(msgdata);
196         if (libcfs_panic_on_lbug)
197                 panic("LBUG");
198         set_task_state(current, TASK_UNINTERRUPTIBLE);
199         while (1)
200                 schedule();
201 }
202 #endif /* __arch_um__ */
203
204 #ifdef __KERNEL__
205
206 #ifdef HAVE_DUMP_TRACE
207 #include <linux/nmi.h>
208 #include <asm/stacktrace.h>
209
210 static void
211 print_trace_warning_symbol(void *data, char *msg, unsigned long symbol)
212 {
213         printk("%s", (char *)data);
214         print_symbol(msg, symbol);
215         printk("\n");
216 }
217
218 static void print_trace_warning(void *data, char *msg)
219 {
220         printk("%s%s\n", (char *)data, msg);
221 }
222
223 static int print_trace_stack(void *data, char *name)
224 {
225         printk(" <%s> ", name);
226         return 0;
227 }
228
229 #ifdef HAVE_TRACE_ADDRESS_RELIABLE
230 # define RELIABLE reliable
231 # define DUMP_TRACE_CONST const
232 static void print_trace_address(void *data, unsigned long addr, int reliable)
233 #else
234 /* before 2.6.24 there was no reliable arg */
235 # define RELIABLE 1
236 # define DUMP_TRACE_CONST
237 static void print_trace_address(void *data, unsigned long addr)
238 #endif
239 {
240         char fmt[32];
241         touch_nmi_watchdog();
242         sprintf(fmt, " [<%016lx>] %s%%s\n", addr, RELIABLE ? "": "? ");
243         __print_symbol(fmt, addr);
244 }
245
246 static DUMP_TRACE_CONST struct stacktrace_ops print_trace_ops = {
247         .warning = print_trace_warning,
248         .warning_symbol = print_trace_warning_symbol,
249         .stack = print_trace_stack,
250         .address = print_trace_address,
251 #ifdef STACKTRACE_OPS_HAVE_WALK_STACK
252         .walk_stack = print_context_stack,
253 #endif
254 };
255 #endif
256
257 void libcfs_debug_dumpstack(struct task_struct *tsk)
258 {
259 #if defined(__arch_um__)
260         if (tsk != NULL)
261                 CWARN("stack dump for pid %d (%d) requested; wake up gdb.\n",
262                       tsk->pid, UML_PID(tsk));
263         //asm("int $3");
264 #elif defined(HAVE_DUMP_TRACE)
265         /* dump_stack() */
266         /* show_trace() */
267         if (tsk == NULL)
268                 tsk = current;
269         printk("Pid: %d, comm: %.20s\n", tsk->pid, tsk->comm);
270         /* show_trace_log_lvl() */
271         printk("\nCall Trace:\n");
272         dump_trace(tsk, NULL, NULL,
273 #ifdef HAVE_DUMP_TRACE_ADDRESS
274                    0,
275 #endif /* HAVE_DUMP_TRACE_ADDRESS */
276                    &print_trace_ops, NULL);
277         printk("\n");
278 #elif defined(HAVE_SHOW_TASK)
279         /* this is exported by lustre kernel version 42 */
280         extern void show_task(struct task_struct *);
281
282         if (tsk == NULL)
283                 tsk = current;
284         CWARN("showing stack for process %d\n", tsk->pid);
285         show_task(tsk);
286 #else
287         if ((tsk == NULL) || (tsk == current))
288                 dump_stack();
289         else
290                 CWARN("can't show stack: kernel doesn't export show_task\n");
291 #endif
292 }
293
294 cfs_task_t *libcfs_current(void)
295 {
296         CWARN("current task struct is %p\n", current);
297         return current;
298 }
299
300 static int panic_notifier(struct notifier_block *self, unsigned long unused1,
301                          void *unused2)
302 {
303         if (libcfs_panic_in_progress)
304                 return 0;
305
306         libcfs_panic_in_progress = 1;
307         mb();
308
309 #ifdef LNET_DUMP_ON_PANIC
310         /* This is currently disabled because it spews far too much to the
311          * console on the rare cases it is ever triggered. */
312
313         if (in_interrupt()) {
314                 cfs_trace_debug_print();
315         } else {
316                 while (current->lock_depth >= 0)
317                         unlock_kernel();
318
319                 libcfs_debug_dumplog_internal((void *)(long)cfs_curproc_pid());
320         }
321 #endif
322         return 0;
323 }
324
325 static struct notifier_block libcfs_panic_notifier = {
326         notifier_call :     panic_notifier,
327         next :              NULL,
328         priority :          10000
329 };
330
331 void libcfs_register_panic_notifier(void)
332 {
333 #ifdef HAVE_ATOMIC_PANIC_NOTIFIER
334         atomic_notifier_chain_register(&panic_notifier_list, &libcfs_panic_notifier);
335 #else
336         notifier_chain_register(&panic_notifier_list, &libcfs_panic_notifier);
337 #endif
338 }
339
340 void libcfs_unregister_panic_notifier(void)
341 {
342 #ifdef HAVE_ATOMIC_PANIC_NOTIFIER
343         atomic_notifier_chain_unregister(&panic_notifier_list, &libcfs_panic_notifier);
344 #else
345         notifier_chain_unregister(&panic_notifier_list, &libcfs_panic_notifier);
346 #endif
347 }
348
349 EXPORT_SYMBOL(libcfs_debug_dumpstack);
350 EXPORT_SYMBOL(libcfs_current);
351
352 #endif /* __KERNEL__ */
353
354 EXPORT_SYMBOL(libcfs_run_upcall);
355 EXPORT_SYMBOL(libcfs_run_lbug_upcall);
356 EXPORT_SYMBOL(lbug_with_loc);