调试技巧总结

　　以下内容总结自debug hacks一书的高手们的调试技术一章

　　1.strace的使用技巧

　　　　strace name，以这样的方式运行程序，可以查看到程序运行时的系统调用，仅仅是系统调用。可以看到系统调用失败时的传参，或者卡在哪个函数位置等等。

　　　　-i选项可以看到每个系统调用的地址，那样在使用gdb调试时可以加断点。

　　　　-p选项可以attach上已经正在运行的程序

　　　　-o可以指定输出文件

　　　　-t和-tt可以指定系统调用时间，分别以秒和毫秒为单位。

　　2.objdump的使用技巧

　　　　objdump反汇编之后的文件往往很难看出来对应于c程序中的哪一行代码，这个时候可以指定-S和-l选项分别显示出源文件中的代码和行号，程序需要包含有调试信息，最好是没有优化选项的文件，但不一定完全对应，可以作为参考。

　　3.valgrind的使用技巧

　　　　valgrind可以对缓存，堆进行评测，检测POSIX线程冲突等。

　　　　最常用的内存检测，--tool=memcheck这个工具是valgrind的默认工具，可以不指定。

　　　　可以检测的内容有，内存泄露，非法内存访问，读取未初始化区域，访问已释放区域，内存双重释放，非法栈操作等等。但是valgrind对于栈上的空间检测不是很好。

　　4.kprobe的使用

　　　　这个属于内核调试技术，可以在不重新编译内核的基础上，在任何一个函数内加打印，或者做其他任何处理，当然需要有内核源码，做一个合适的操作。

　　　　比较好的一点是可以显示栈跟踪。这在调试中属于很好的技术。

　　5.jprobe的使用

　　　　与kprobe相同，可以检测任何一个内核函数的使用情况，但是jprobe的优点在于侦测函数的参数和被侦测函数的参数一样，可以很方便的打印出传参，而不像kprobe需要通过堆栈或者寄存器推理。

　　　　其实我觉得以上两个工具对应于gdb就是断点。

　　6.kprobe的强大之处

　　　　kproble强大他可以插入内核任意位置，而不像jprobe只能插入在函数的开头处，包括他还在可以插在某条指令执行后还是某条指令执行前。

　　7.kprobe替换内核函数

　　　　kprobe可以替换内核中的某个函数，这样就可以在内核不重新编译的情况下，调试某个函数的情况。

　　8.KAHO替换应用程序函数

　　　　类似于上一个kprobe的功能，这样可以省的再次编译大型的应用程序。

　　9.systemtap的使用

　　　　这个工具是利用kprobe实现的一个工具，但是他是类似于脚本语言的方式来使用的，更加方便。功能有，查看堆栈，内部数据，等等。在应用程序的调试中就是gdb工具。

　　10./proc/meminfo中的宝藏

　　　　这个可以用作内存检测，他与valgrind相比，valgrind必须在程序运行结束时才给出测试结果，但这个可以直接实时看到。

　　11./proc/<pid>/mem快速读取进程的内容

　　　　和gdb或者ptrace一样，是查看内存的功能，但是速度上要快。

　　12.oom killer

　　　　当内存不足时，系统会对每个应用进程进行评分，评分最高者被关闭。

　　13.错误注入

　　　　一般来讲，malloc都会是成功的，但是这样就很难检测一些如果分配失败时导致的错误。那么这个功能就是提高分配失败的概率，或者说指定分配失败。

　　　　需要连接一个failmalloc的库。方便测试失败情况。

　　　　这个的使用非常方便，首先到failmalloc的官网下载他的代码，并编译和安装他，

　　　　在每次运行时指定env的LD_PRELOAD参数为库所在目录及库名称，

　　　　另外一个这个库支持指定选项，有四个

　　　　FAILMALLOC_PROBABILITY

　　　　　　specifies how often it should fail between 0.0 and 1.0.

　　　　　　这个选项为失败的概率

　　　　FAILMALLOC_INTERVAL

　　　　　　specifies the interval of failures.

　　　　　　这个选项为每几次malloc出现一次失败。

　　　　FAILMALLOC_TIMES

　　　　　　specifies how many times failures may happen at most.

　　　　　　指定失败次数的上限

　　　　FAILMALLOC_SPACE

　　　　　　specifies the size of free space where memory can be allocated safely in bytes.

　　　　　　指定申请内存失败的上限，即低于或者等于该值才会申请失败，超过该值必定成功。

　　14.oprofile的使用

　　　　这个工具可以查看一个程序的性能，比如l2级缓存的命中，各个函数的运行时间等等，并且这个工具可以生成图表。

　　　　最常用的是各个函数的运行时间。

　　　　类似的工具还有gprof，但是功能上差很多

　　　　另外一个要注意的是，oprofile在虚拟机下不支持按事件计数。比较明显的是各个函数的运行时间检测不支持。

　　　　下面详细描述一次oprofile的使用过程：

　　　　源码：

#include <stdio.h>

int fun(int s,int i)
{
printf("s = %d , i = %d ",s,i);
s = s+i;
return s;
}

int main()
{
int i = 0;
int sum = 0;
for(;i<0x10000;i++)
sum = fun(sum,i);
printf("sum = %x ",sum);
return 0;
}

　　　　接着是初始化oprofile

　　　　[root@localhost oprofile-1.1.0]# opcontrol --init

　　　　指定监听事件，这里使用默认事件，在cpu的时钟下采样，每10000个时钟采一次，不记录内核，只记录应用程序

　　　　[root@localhost oprofile-1.1.0]# opcontrol --event=CPU_CLK_UNHALTED:10000:0:0:1

　　　　开始分析

　　　　[root@localhost oprofile-1.1.0]# opcontrol --start
　　　　Using 2.6+ OProfile kernel interface.
　　　　Using log file /var/lib/oprofile/samples/oprofiled.log
　　　　Daemon started.
　　　　Profiler running.

　　　　运行程序，结束之后，停止分析

　　　　[root@localhost oprofile-1.1.0]# opcontrol --stop

　　　　查看结果

[root@localhost oprofile-1.1.0]# opreport --merge=cpu -d a.out
CPU: Core 2, speed 2666.13 MHz (estimated)
Counted CPU_CLK_UNHALTED events (Clock cycles when not halted) with a unit mask of 0x00 (Unhalted core cycles) count 10000
Processes with a thread ID of 32720
Processes with a thread ID of all
vma samples % samples % symbol name
004004c4 226 61.9178 756 59.9524 fun
004004c4 12 5.3097 34 4.4974
004004cc 4 1.7699 25 3.3069
004004da 2 0.8850 17 2.2487
004004e7 4 1.7699 20 2.6455
004004ec 23 10.1770 97 12.8307
004004ef 130 57.5221 378 50.0000
004004f2 32 14.1593 96 12.6984
004004f5 19 8.4071 89 11.7725
004004f7 139 38.0822 505 40.0476 main
0040050f 3 2.1583 18 3.5644
00400519 3 2.1583 23 4.5545
0040051e 7 5.0360 25 4.9505
00400521 92 66.1871 299 59.2079
00400525 9 6.4748 33 6.5347
0040052c 25 17.9856 107 21.1881

　　　　这里的a.out是指定镜像，只查看该程序的函数。可以看出，main函数和fun函数各占了本次运行的比例。这只是一个简单的例子，如果对于一个大型的程序，就可以针对这个结果，优化函数，

　　　　　这里还可以查看代码级的分析结果。

　　 [root@localhost oprofile-1.1.0]# opannotate --merge=cpu -s a.out 　

/*
* Command line: opannotate --merge=cpu -s a.out
*
* Interpretation of command line:
* Output annotated source file with samples
* Output all files
*
* CPU: Core 2, speed 2666.13 MHz (estimated)
* Counted CPU_CLK_UNHALTED events (Clock cycles when not halted) with a unit mask of 0x00 (Unhalted core cycles) count 10000
* Processes with a thread ID of 32720
* Processes with a thread ID of all
*/
/*
* Total samples for file : "/root/czh/oprofile-1.1.0/test.c"
*
* 365 100.000 1261 100.000
*/

　　　　　　　　　　　　　　:#include <stdio.h>
　　　　　　　　　　　　　　:
　　　　　　　　　　　　　　:int fun(int s,int i)
16 4.3836 59 4.6788 　　 :{ /* fun total: 226 61.9178 756 59.9524 */
6 1.6438 37 2.9342 　　　 : printf("s = %d , i = %d ",s,i);
153 41.9178 475 37.6685 : s = s+i;
32 8.7671 96 7.6130 　　 : return s;
19 5.2055 89 7.0579 　　 :}
　　　　　　　　　　　　　　:
　　　　　　　　　　　　　　:
　　　　　　　　　　　　　　:int main()
　　　　　　　　　　　　　　:{ /* main total: 139 38.0822 505 40.0476 */
　　　　　　　　　　　　　　: int i = 0;
　　　　　　　　　　　　　　: int sum = 0;
126 34.5205 439 34.8136 : for(;i<0x10000;i++)
13 3.5616 66 5.2339 　　 : sum = fun(sum,i);
　　　　　　　　　　　　　　: printf("sum = %x ",sum);
　　　　　　　　　　　　　　: return 0;
　　　　　　　　　　　　　　:}

　　　　可以清楚的看到哪一行的代码占用的时间最多。

　　　　注意，如果在虚拟机下运行，是不支持基于事件采样的，只能基于时间采用，但是这个采样率太低，效果很差。

　　　　加载模块前先运行modprobe oprofile timer=1

　　　　可以通过dmesg查看是否是以timer运行的

　　15.vprobe

　　　　找不到相关资料

　　16.查看x86机器是否支持64位

　　　　这一点可以通过查看cpu自带的寄存器内容或者/proc/cpuinfo中的内容