20145201李子璇《网络对抗》逆向及Bof基础实践

20145201李子璇《网络对抗》逆向及Bof基础实践

实践目标

  • 本次实践的对象是一个名为pwn1的linux可执行文件。

  • 该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。

  • 该程序同时包含另一个代码片段,getShell,会返回一个可用Shell。正常情况下这个代码是不会被运行的。我们实践的目标就是想办法运行这个代码片段。

  • 本次试验将学习两种方法
    ①利用foo函数的Bof漏洞,构造一个攻击输入字符串,覆盖返回地址,触发getShell函数。
    ②手工修改可执行文件,改变程序执行流程,直接跳转到getShell函数。

这几种思路,基本代表现实情况中的攻击目标(1)运行原本不可访问的代码片段(2)强行修改程序执行流(3)以及注入运行任意代码。

基础知识

  • 熟悉Linux基本操作,能看懂常用指令,如管道(|),输入、输出重定向(>)等。

  • 理解Bof的原理。

  • 能看得懂汇编、机器指令、EIP、指令地址。

  • 会使用gdb,vi。

本次实践知识点总结

1.掌握NOP, JNE, JE, JMP, CMP汇编指令的机器码(1分)
①NOP:NOP指令即“空指令”。执行到NOP指令时,CPU什么也不做,仅仅当做一个指令执行过去并继续执行NOP后面的一条指令。
②JNE:条件转移指令,如果不相等则跳转。
③JE:条件转移指令,如果相等则跳转。
④JMP:无条件转移指令。
⑤CMP:比较指令,功能相当于减法指令,只是对操作数之间运算比较,不保存结果。cmp指令执行后,将对标志寄存器产生影响。其他相关指令通过识别这些被影响的标志寄存器位来得知比较结果。

2.掌握反汇编与十六进制编程器(1分)
反汇编指令:objdump -d xxx
将显示模式切换为16进制模式:%!xxd
转换16进制为原格式:%!xxd -r

3.掌握可执行文件的基本格式(2分)

4.掌握缓冲区溢出攻击的原理(1分)
通过往程序的缓冲区写超出其长度的内容,造成缓冲区的溢出,从而破坏程序的堆栈,使程序转而执行其它指令,以达到攻击的目的。造成缓冲区溢出的原因是程序中没有仔细检查用户输入的参数。

实践过程

方法一:直接修改程序机器指令,改变程序执行流程

将目标文件20145201pwn1,反汇编。

其中最核心的几行代码,如下:

0804847d <getShell>:
 804847d:   55                      push   %ebp
 ...
08048491 <foo>:
 8048491:   55                      push   %ebp
 ...
080484af <main>:
 ...
 80484b5:   e8 d7 ff ff ff          call   8048491 <foo> 
 80484ba:   b8 00 00 00 00          mov    $0x0,%eax
 ...
  • "call 8048491 "是汇编指令,是说这条指令将调用位于地址8048491处的foo函数;其对应机器指令为“e8 d7ffffff”,e8即跳转之意。本来正常流程,此时此刻EIP的值应该是下条指令的地址,即80484ba,但一解释e8这条指令呢,CPU就会转而执行 “EIP + d7ffffff”这个位置的指令。“d7ffffff”是补码,表示-41,41=0x29,80484ba +d7ffffff= 80484ba-0x29正好是8048491这个值,main函数调用foo,对应机器指令为“ e8 d7ffffff”,那我们想让它调用getShell,只要修改“d7ffffff”为,"getShell-80484ba"对应的补码就行。用Windows计算器,直接 47d-4ba就能得到补码,是c3ffffff。

  • 下面我们就修改可执行文件,将其中的call指令的目标地址由d7ffffff变为c3ffffff。

  • 再反汇编看一下,call指令是否正确调用getShell

  • 运行下改后的代码,会得到shell提示符#

方法二:通过构造输入参数,造成BOF攻击,改变程序执行流

  • 反汇编,了解程序的基本功能

  • 确认输入字符串哪几个字符会覆盖到返回地址
    这里选择用1111111122222222333333334444444455555555来进行测试比较容易识别出来。


    根据上图我们就可以知道,堆栈上的返回地址已经被5555覆盖。但之前我们输入了八个5,下面就要具体分辨出具体时间哪4个。
    于是将“55555555”改为“12345678”进行具体分析:

    如果输入字符串1111111122222222333333334444444412345678,那 1234 那四个数最终会覆盖到堆栈上的返回地址,进而CPU会尝试运行这个位置的代码。那只要把这四个字符替换为 getShell 的内存地址,输给pwn1,pwn1就会运行getShell。

  • 确认用什么值来覆盖返回地址
    getShell的内存地址,在未启用ALSR的主机上是固定不变的,通过反汇编时可以看到,即0804847d。

    对比之前 eip 0x34333231 0x34333231 ,正确应用输入 "11111111222222223333333344444444x7dx84x04x08 " (小端)

  • 构造输入字符串
    由于我们没法通过键盘输入x7dx84x04x08这样的16进制值,所以先生成包括这样字符串的一个文件。x0a表示回车,如果没有的话,在程序运行时就需要手工按一下回车键。
    可以使用16进制查看指令xxd查看input文件的内容是否如预期。

    然后将input的输入,通过管道符“|”,作为pwn1的输入。

参考资料

原文地址:https://www.cnblogs.com/20145201lzx/p/6479495.html