程序运行之ELF文件的段

我们将之前的代码增加下变量来具体看下

在代码中增加了全局变量以及静态变量,还有一个简单的函数。

#include <stdio.h>

int global_var=1;

int global_init_var;

void func1(int i){

printf("%d ",i);

}

int main(void){

static int static_var=8;

static int static_var2;

int a=1;

int b;

func1(static_var+a);

return 0;

}

使用gcc -c来编译这个文件:gcc -c main.c。 -c表示只编译不链接

然后通过objdump -h来查看生成的.o文件。从下面结果看到除了代码段,数据段和BSS段以外,还有.rodata(只读数据段), .comment(注释信息段),.note.GNU-stack(堆栈提示段)。 在File off中标识了每个段的偏移位置。比如.text段的偏移位置是0x40. 代表ELFheader占据的空间为0x00-0x40.text的起始位置为0x40

main.o:     文件格式 elf64-x86-64

节:

Idx Name          Size      VMA               LMA               File off  Algn

  0 .text         0000004c  0000000000000000  0000000000000000  00000040  2**0

                  CONTENTS, ALLOC, LOAD, RELOC, READONLY, CODE

  1 .data         00000004  0000000000000000  0000000000000000  0000008c  2**2

                  CONTENTS, ALLOC, LOAD, DATA

  2 .bss          00000008  0000000000000000  0000000000000000  00000090  2**2

                  ALLOC

  3 .rodata       00000004  0000000000000000  0000000000000000  00000090  2**0

                  CONTENTS, ALLOC, LOAD, READONLY, DATA

  4 .comment      00000024  0000000000000000  0000000000000000  00000094  2**0

                  CONTENTS, READONLY

  5 .note.GNU-stack 00000000  0000000000000000  0000000000000000  000000b8  2**0

                  CONTENTS, READONLY

  6 .eh_frame     00000058  0000000000000000  0000000000000000  000000b8  2**3

                  CONTENTS, ALLOC, LOAD, RELOC, READONLY, DATA

另外有一个专门的命令size可以查看ELF文件的代码段,数据段和BSS段的长度。hex代表的是三个段的总长度。

root@zhf-maple:/home/zhf/c_prj# size main.o

   text    data     bss     dec     hex filename

168       8       8     180      b4 main.o

.data段中保存是已经初始化了的全局静态变量和局部静态变量。上面的代码中global_varstatic_var就是这样的数据,两个变量都是int类型,各占4个字节。一共刚好8个字节。所以.data这个段的大小为8个字节。

要想查看各个数据段中的具体内容可以通过objdump -s main.o的方式来查看

可以看到.data段中的数据为 01000000 和 08000000 各自占据4个字节,分别对应int global_var=1以及static int static_var=8;

那么为什么不是0x000000010x00000008呢,原因在于字节存放的顺序是大端序还是小端序的

大端序:数据的高位字节存放在地址的低端 低位字节存放在地址高端

小端序:数据的高位字节存放在地址的高端 低位字节存放在地址低端

具体的实现参考下面的这个帖子

https://www.cnblogs.com/flysnail/archive/2011/10/25/2223721.html

从上面的数据可以看出这个是小端序的

main.o:     文件格式 elf64-x86-64

Contents of section .text:

 0000 554889e5 4883ec10 897dfc8b 45fc89c6  UH..H....}..E...

 0010 488d3d00 000000b8 00000000 e8000000  H.=.............

 0020 0090c9c3 554889e5 4883ec10 c745fc01  ....UH..H....E..

 0030 000000be 04000000 488d3d00 000000b8  ........H.=.....

 0040 00000000 e8000000 008b1500 0000008b  ................

 0050 45fc01d0 89c7e800 000000b8 00000000  E...............

 0060 c9c3                                 ..              

Contents of section .data:

 0000 01000000 08000000                    ........        

Contents of section .rodata:

  0000 25640a00                             %d..        

Contents of section .comment:

 0000 00474343 3a202855 62756e74 7520372e  .GCC: (Ubuntu 7.

 0010 322e302d 38756275 6e747533 2920372e  2.0-8ubuntu3) 7.

 0020 322e3000                             2.0.            

Contents of section .eh_frame:

 0000 14000000 00000000 017a5200 01781001  .........zR..x..

 0010 1b0c0708 90010000 1c000000 1c000000  ................

 0020 00000000 24000000 00410e10 8602430d  ....$....A....C.

 0030 065f0c07 08000000 1c000000 3c000000  ._..........<...

 0040 00000000 3e000000 00410e10 8602430d  ....>....A....C.

 0050 06790c07 08000000                    .y...... 

另外我们看到在.rodata中也有数据。.rodata中是存储只读数据的。比如const修改的变量。在这里看到.rodata中的数据为%d。 这个是因为我们调用了printf的时候用到了字符串常量%d. 它是一种只读数据。所以被放到了.rodata中。

0000 25640a00                             %d.. 

.bss段存放的是未初始化的全局变量以及局部静态变量。也就是global_init_varstatic_var2变量,但是.bss段只有4个字节大小,2int的变量应该是8个字节才对。我们通过objdump -x main.o来查看符号表。可以看到.bss段中只有static_var2变量,global_init_var并没有在里面。这和编译器有关,global_init_var是一个未定义的COMMON符号,有些编译器会将其放入.bss段中

SYMBOL TABLE:

0000000000000000 l    df *ABS* 0000000000000000 main.c

0000000000000000 l    d  .text 0000000000000000 .text

0000000000000000 l    d  .data 0000000000000000 .data

0000000000000000 l    d  .bss 0000000000000000 .bss

0000000000000000 l    d  .rodata 0000000000000000 .rodata

0000000000000004 l     O .data 0000000000000004 static_var.2256

0000000000000000 l     O .bss 0000000000000004 static_var2.2257

0000000000000000 l    d  .note.GNU-stack 0000000000000000 .note.GNU-stack

0000000000000000 l    d  .eh_frame 0000000000000000 .eh_frame

0000000000000000 l    d  .comment 0000000000000000 .comment

0000000000000000 g     O .data 0000000000000004 global_var

0000000000000004       O *COM* 0000000000000004 global_init_var

0000000000000000 g     F .text 0000000000000024 func1

0000000000000000         *UND* 0000000000000000 _GLOBAL_OFFSET_TABLE_

0000000000000000         *UND* 0000000000000000 printf

0000000000000024 g     F .text 0000000000000028 main

除了之前介绍的这些段,ELF文件还有如下的段

.strtab : String Table 字符串表,用于存储 ELF 文件中用到的各种字符串。

.symtab : Symbol Table 符号表,从这里可以所以文件中的各个符号。

.shstrtab : 是各个段的名称表,实际上是由各个段的名字组成的一个字符串数组。

.hash : 符号哈希表。

.line : 调试时的行号表,即源代码行号与编译后指令的对应表。

.dynamic : 动态链接信息。

.debug : 调试信息。

.comment : 存放编译器版本信息,比如 "GCC:(GNU)4.2.0"

.plt 和 .got : 动态链接的跳转表和全局入口表。

.init 和 .fini : 程序初始化和终结代码段

另外GCC还提供了自定义段,比如你可能希望变量或者某些部分代码能够放到你指定的段中去实现特定的功能,比如满足硬件内存和I/O的地址布局。

我们在全局变量和函数之前加上”__attribute__((section(“name”)))”属性就可以把相应的变量或者函数放到以”name”为段名的段中去。

原文地址:https://www.cnblogs.com/zhanghongfeng/p/9043353.html