使用ptrace跟踪进程收到的异常信号

loughsky 2007-03-09 12:45:52
最初的想法,我们在调试程序的时候,程序有时会出现进程收到SIGSEGV信号,异常退出。如果使用GDB,通过拦截该信号,并打印堆栈来实现,但在嵌入式的环境里,需要在嵌入式设备注入gdb server,来进行调试,比较麻烦。

我的一个想法,能够直接写一个程序,跑在设备里,拦截到特殊信号后,就打印堆栈呢?

相关文档参见:http://blog.chinaunix.net/u/30686/



有两个难点:

1、 如何实现信号的拦截,发现信号后,开始打印堆栈。

2、 打印堆栈,最好能够连带调用函数时的参数值。



1、 信号的拦截:

一开始我想到了使用ptrace,因为gdb是以它为基础的,gdb能够做到,它也能够做到。但通过查资料,ptrace主要是拦截系统调用,或者进行单步跟踪,没有谈及如何跟踪信号。那么在主程序,fork出子程序后,注册一个信号处理函数,在信号处理函数中打印出堆栈是否可行呢?

经过测试发现,在exec之后,起来的进程会冲掉原来该子进程的代码段,从而注册的信号处理事件失效。

这条路是否到头了呢?

继续想到,既然exec会冲掉原来的代码段,那么我是否可以采用将程序起来后,通过黑客的手段注入代码,并执行来实现呢?

理论上来讲,应该可行,但难度比较大。



峰回路转。。。

在linux内核分析的时候,发现这么一段话:

在do_signal中,首先它检查current接收进程是否正受某一进程的监控:既然这样,do_signal就调用notify_parent()和schedule让监控进程知道进行的信号处理。

这说明signal的信号处理肯定是能够被监控的。

通过google发现,strace是能够拦截signal的。我通过分析strace的源代码,发现了strace是如何监控信号。

Child=fork()

If(child==0)

{

ptrace(PTRACE_TRACEME, 0, NULL, NULL);

Exec //执行待监控的进程

}

Else

{

pid = wait4(-1, &status, wait4_options, cflag ? &ru : NULL);

if (WIFSIGNALED(status)) //检查是否因为信号挂起



if (WIFEXITED(status))



if (!WIFSTOPPED(status))

if (WSTOPSIG(status) != SIGTRAP) //注意SIGSEGC信号就是通过这里处理的。

也就是说,对于信号的拦截,它是通过标记为trace之后,通过wai的status来判断的。而不是象一般针对系统调用的跟踪。



既然找到了地方,接下来的就很容易了,打印堆栈:

long ebp=0,eip=0,i=0;

struct user_regs_struct regs;



ptrace(PTRACE_GETREGS, pid,NULL,®s);

tprintf("EIP: %lx ----EBP:%lx\n",regs.eip,regs.ebp); //首先获得当前的ebp寄存器中的地址,该地址指向了堆栈中的帧。

ebp = regs.ebp;

eip = regs.eip;



for(;;)

{

i++;

tprintf("%d: eip:%lx ebp:%lx\n",i,eip,ebp);

eip = ptrace(PTRACE_PEEKDATA,pid,ebp+4,NULL); //根据帧的结构,eip的地址在ebp地址+4,将来将其解析成函数,具体的文本就全靠它了。

ebp = ptrace(PTRACE_PEEKDATA,pid,ebp,NULL); //注意前后两行的顺序,这个命令使ebp指向堆栈中的上一个帧

if( 0 == ebp)

break;

}



这样,就能够把堆栈中,各个函数所运行的地址拿到。

你可以使用objdump –D 反编译你所跟踪的进程,来获得其对应的函数。



因为打印堆栈不是在所跟踪的进程内,所以不可以使用backtrace_symbols来对其进行解析,如何将其解析成直观的函数调用,目前我考虑自己实现反汇编来编写,打印出函数的名称。

采用backtrace_symbols有个局限,在编译程序时必须加上-rdynamic才行,按理说通过objdump反编译可以看到,应该更可靠一些。



下一步计划研究可执行文件的反汇编。

...全文
494 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
loughsky 2007-03-15
  • 打赏
  • 举报
回复
把堆栈打出来后,你就可以定位,是在哪个函数报错的。

这对于定位问题,非常有帮助。
woso 2007-03-15
  • 打赏
  • 举报
回复
请教一下,为什么要把堆栈打出来?
redex 2007-03-14
  • 打赏
  • 举报
回复
mark.
warabi 2007-03-09
  • 打赏
  • 举报
回复
不错。
Mark

23,110

社区成员

发帖
与我相关
我的任务
社区描述
Linux/Unix社区 应用程序开发区
社区管理员
  • 应用程序开发区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧