Linux高级调试与优化——用户态堆

内存问题是软件世界的住房问题

  嵌入式Linux系统中,物理内存资源通常比较紧张,而不同的进程可能不停地分配和释放不同大小的内存,因此需要一套高效的内存管理机制。

  内存管理可以分为三个层次,自底向上分别为:

  1)Linux内核内存管理;

  2)glibc层使用系统调用(brk/sbrk)维护的内存管理算法;即glibc库维护一个内存资源池,在应用层满足其他应用的需求。

     glibc库使用第三方的ptmalloc库实现用户态堆管理器,当应用程序调用glibc库封装的malloc函数申请内存时,首先在用户态内存资源池中找合适的块,但是如果申请的内存大小超过128KB,则直接通过brk系统调用向内核申请物理内存。

  3)应用程序从glibc库动态分配内存后,根据应用程序本身的程序特性进行优化。即应用程序分配超大内存块,自己内部实现内存分配算法。

  需要明确的一点是,malloc函数和free函数不是系统调用,而是glibc库封装的接口,malloc和free都是通过brk系统调用实现。

Linux进程地址空间

  典型的Linux进程地址空间(虚拟地址)布局如下图,栈从上往下增长,堆从下往上增长。

  对于32位Linux系统而言,其地址总线宽度为32位,4字节对齐,可寻址范围为4GB。进程地址空间中高1GB为内核地址空间,低3GB为用户地址空间。

  对于64位Linux系统而言,其地址总线通常为48位,8字节对齐,可寻址范围为256TB。进程地址空间中高128TB为内核地址空间,低128TB为用户地址空间。

  栈一般是函数调用栈,函数调用时,将父函数的局部变量、临时变量、LR和PC寄存器值压栈,并为子函数创建新的栈帧。堆则用于动态内存分配,比如通过malloc()函数分配内存。

maps节点

  Linux内核的procfs文件系统为每一个进程维护一个/proc/<pid>/maps节点,用来实时显示该进程的地址映射表。

#cat /proc/1793/maps
00010000-003bf000 r-xp 00000000 01:00 295 /usr/bin/test      //读+执行权限,代码段
003ce000-003d7000 rw-p 003ae000 01:00 295 /usr/bin/test      //读写权限,数据段
003d7000-003f3000 rw-p 00000000 00:00 0
0060e000-00f5d000 rw-p 00000000 00:00 0 [heap]               //用户态堆
f6157000-f686c000 rw-p 00000000 00:00 0
f6889000-f6ee1000 rw-p 00000000 00:00 0
f6f62000-f706e000 rw-p 00000000 00:00 0
f706e000-f7109000 rw-p 00000000 00:00 0
f711c000-f7122000 r-xp 00000000 01:00 153 /lib/libthread_db-1.0.so
f7122000-f7131000 ---p 00006000 01:00 153 /lib/libthread_db-1.0.so
f7131000-f7132000 r--p 00005000 01:00 153 /lib/libthread_db-1.0.so
f7132000-f7133000 rw-p 00006000 01:00 153 /lib/libthread_db-1.0.so
f7133000-f7344000 rw-p 00000000 00:00 0
f7344000-f746d000 r-xp 00000000 01:00 132 /lib/libc-2.24.so
f746d000-f747d000 ---p 00129000 01:00 132 /lib/libc-2.24.so
f747d000-f747f000 r--p 00129000 01:00 132 /lib/libc-2.24.so
f747f000-f7480000 rw-p 0012b000 01:00 132 /lib/libc-2.24.so
f7480000-f7483000 rw-p 00000000 00:00 0
f7483000-f7527000 r-xp 00000000 01:00 139 /lib/libm-2.24.so
f7527000-f7536000 ---p 000a4000 01:00 139 /lib/libm-2.24.so
f7536000-f7537000 r--p 000a3000 01:00 139 /lib/libm-2.24.so
f7537000-f7538000 rw-p 000a4000 01:00 139 /lib/libm-2.24.so
f7538000-f756b000 r-xp 00000000 01:00 456 /usr/lib/libncurses.so.5.9
f756b000-f757a000 ---p 00033000 01:00 456 /usr/lib/libncurses.so.5.9
f757a000-f757d000 rw-p 00032000 01:00 456 /usr/lib/libncurses.so.5.9
f757d000-f757f000 r-xp 00000000 01:00 136 /lib/libdl-2.24.so
f757f000-f758e000 ---p 00002000 01:00 136 /lib/libdl-2.24.so
f758e000-f758f000 r--p 00001000 01:00 136 /lib/libdl-2.24.so
f758f000-f7590000 rw-p 00002000 01:00 136 /lib/libdl-2.24.so
f7590000-f75b0000 r-xp 00000000 01:00 128 /lib/ld-2.24.so
f75bb000-f75bf000 rw-p 00000000 00:00 0
f75bf000-f75c0000 r--p 0001f000 01:00 128 /lib/ld-2.24.so
f75c0000-f75c1000 rw-p 00020000 01:00 128 /lib/ld-2.24.so
ff8b0000-ff8d1000 rw-p 00000000 00:00 0   [stack]           //栈
ffff0000-ffff1000 r-xp 00000000 00:00 0   [vectors]

  显而易见,堆从下往上增长,栈从上往下增长。

  代码段和数据段都在低地址,分开存放是基于安全考虑,因为黑客可能通过篡改数据段从而植入代码。现在的CPU一般都有一个开关,可以配置为不执行数据段代码。

glibc和ptmalloc

  glibc库使用第三方的ptmalloc库实现用户态堆管理器,ptmalloc(POSIX thread malloc)库增加了多线程支持,为每一个线程分配单独的堆。

  ptmalloc库维护一个全局的结构体变量main_arena(主场地),与main_heap关联。main_arena->top指向最大的空闲块,main_arena->fastbinsY[]维护小块内存的链表集合,main_arena->bins[]维护大块内存的链表集合。

  主进程中的其他线程申请内存时,ptmalloc()库为它创建Non-arena辅场地。

  Main-arena从低地址向高地址增长,Non-arena从高地址向低地址增长。

  主进程使用Main-arena,创建线程时通过new_heap创建新的堆,按需分配,每次分配固定大小,如果线程内存不够,则另外再分配固定大小内存,因此线程的堆是不连续的。

  Main-arena和Non-arena的个数和大小是可以配置的。

  ptmalloc()通过brk()系统调用(brk分配的基本单位是132KB)向内存批发大块内存,通过malloc()零售小块内存。

  应用程序通过malloc()向ptmalloc堆管理器申请小块内存,当单次申请内存大小超过128KB时,ptmalloc会通过brk系统调用向内核申请大块内存。

堆检测工具

  因为堆管理算法非常复杂,如果出现堆内存泄漏问题,靠人工非常难分析情况,需要借助专门的工具。

  Valgrind工具提供的memcheck功能可以非常高效地检测内存泄漏问题。

  Google的Address Sanitizer(asan)工具也非常实用。

原文地址:https://www.cnblogs.com/justin-y-lin/p/11264856.html