第4章:逆向分析技术--64位软件逆向技术

函数

1.栈平衡

在 x64 环境下，某些汇编指令对栈顶的对齐有要求，因此在 Visual Studio 中，有时会出现申请了栈空间而不使用的情况。

2.启动函数

在 IDA 中找到启动函数的步骤： start -> _tmainCRTStartup -> 下翻找到 main 或者通过找到 exit 函数，向上翻一个 call 就是 main 函数。

3.调用约定

大部分在《逆向工程核心原理》中都有。此处注意一点，Debug 版本的程序，申请了栈空间后会使用 CC 填充（即 Int 3 ），而Release 版程序则不会有，并且会在一些地方做很多优化。

4.参数传递

(1) 参数为结构体时且大小不超过8字节

那么会将其放在一个栈单元内，通过一个寄存器传值进入函数。

(2) 参数为结构体且大小超过8字节

即将 [ rsp + 28 ] —— [ rsp + 34 ] 复制到 [ rsp + 50 ] —— [ rsp + 5C] ，然后

(3) thiscall 传递

它是 C++ 类的成员函数调用约定。

this 指针可以用来存储虚表。

(4) 函数返回值

RAX 返回保存函数值。浮点类型时使用 MMX0 寄存器。返回值大于8字节时，使用栈空间地址，间接保存返回值。

数据结构

(1) 局部变量

预留栈空间在低地址，局部变量在高地址。当为 Release 版时，程序会尽量使用寄存器，只有不够用时才会使用栈空间。

(2) 全局变量

先定义的在低地址，后定义的在高地址。

(3) 数组

一维数组，局部数组的寻址方式：

一维数组，全局数组的寻址方式：

在 Release 版本中，数组初始化可能会采用 XMM0 寄存器进行优化。

控制语句

(1) Switch-Case 语句

数学运算符

(1) 加法减法

通常用 lea 指令来进行优化，而不是直接用 add sub 指令。

(2) 整数的乘法

(3) 整数的除法

通常会由编译器计算出一个值，使用该值进行计算优化或者改变计算方法。

虚函数

VC++ 实现虚函数功能的方式是做表，即虚表。首先来看第一个程序：

#include "stdafx.h"


class CVirtual {
public:
    CVirtual() {
        m_nMember1 = 1;
        m_nMember2 = 2;
        printf("CVirtual()
");
    }
    virtual ~CVirtual() {
        printf("~CVirtual()
");
    }
    virtual void fun1() {
        printf("fun1()
");
    }
    virtual void fun2() {
        printf("fun2()
");
    }
private:
    int m_nMember1;
    int m_nMember2;
};

int main(int argc, char* argv[]) {
    CVirtual object;
    object.fun1();
    object.fun2();
    return 0;
}

this 指针用作构建虚表，不同的类虚表不同，相同的类对象共用同一个虚表。构造函数内部：

接下来调用类成员函数：

析构函数：

C++ 语法规定，在实例化对象时会自动调用构造函数，对象作用域会自动调用析构函数(在对象作用域以外时调用)。

构造函数执行完后会返回 this 指针。析构函数会重新赋值虚表，C++ 规定，析构函数需要调用函数的无多态性。

第二个程序：单重继承虚表

#include "stdafx.h"


class CBase {
public:
    CBase() {
        m_nMember = 1;
        printf("CBase()
");
    }
    virtual ~CBase() {
        printf("~CBase()
");
    }
    virtual void fun1() {
        printf("CBase::fun1()
");
    }
private:
    int m_nMember;
};

class CDerived :public CBase {
public:
    CDerived() {
        m_nMember = 2;
        printf("CDerived()
");
    }
    ~CDerived() {
        printf("~CDerived()
");
    }
    virtual void fun1() {
        printf("CDerived::fun1()
");
    }
    virtual void fun2() {
        printf("CDerived::fun2()
");
    }
private:
    int m_nMember;
};

int _tmain(int argc, _TCHAR* argv[]) {
    CBase *pBase = new CDerived();
    pBase->fun1();
    delete pBase;
    return 0;
}

首先，调用 new 函数，申请一块空间，返回首地址并存在 rax . 对象数据成员只有8字节，还需要8字节的虚表空间和8字节的内存对齐，因此总共申请了18字节。

检测返回值，存在则调用构造函数。

可以看到，在构造函数中，先是基类的表占用了 this 指针，然后是派生类占用了 this 指针。但是他们的成员( m_nMember )都相邻，共用一个虚表中。

若 this 指针不为 NULL ，则调用 this 指针第一个函数，而虚表的第一个函数是析构函数：

delete 函数有两个参数，一个是 this 指针，一个是 bool 值，分别由 ecx 和 edx 传入，而 edx 在调用析构函数后就被置为1。若 edx 为 1则不调用 delete 函数，否则调用。这是为了防止在调用析构函数之后再次调用 delete 函数，造成空间重复释放。

第三个程序：多重继承虚表

#include "stdafx.h"

class CBase1 {
public:
    CBase1() {
        m_nMember = 1;
        printf("CBase1()
");
    }
    ~CBase1() {
        printf("~CBase1()
");
    }
    virtual void fun1() {
        printf("CBase1::fun1()
");
    }
private:
    int m_nMember;
};
class CBase2 {
public:
    CBase2() {
        m_nMember = 2;
        printf("CBase2()
");
    }
    ~CBase2() {
        printf("~CBase2()
");
    }
    virtual void fun2() {
        printf("CBase2::fun1()
");
    }
private:
    int m_nMember;
};

class CDerived :public CBase1, public CBase2 { //继承两个基类
public:
    CDerived() {
        m_nMember = 2;
        printf("CDerived()
");
    }
    ~CDerived() {
        printf("~CDerived()
");
    }
    virtual void fun1() {
        printf("CDerived::fun1()
");
    }
    virtual void fun3() {
        printf("CDerived::fun3()
");
    }
private:
    int m_nMember;
};


int _tmain(int argc, _TCHAR* argv[]) {
    CDerived derievd;
    return 0;
}

函数总体结构比较统一：

最先进行基类的构造(同类则按照顺序进行构造)，然后完成对派生类的构造(派生类新增的虚函数挂在第一个虚表后面)：

第四个程序：菱形继承虚表

#include "stdafx.h"

class A {
public:
    A() {
        m_nMember = 1;
        printf("A()
");
    }
    ~A() {
        printf("~A()
");
    }
    virtual void fun1() {
        printf("A::fun1()
");
    }
private:
    int m_nMember;
};



class B :virtual public A{
public:
    B() {
        m_nMember = 2;
        printf("B()
");
    }
    ~B() {
        printf("~B()
");
    }
    virtual void fun2() {
        printf("B::fun2()
");
    }
private:
    int m_nMember;
};

class C :virtual public A{
public:
    C() {
        m_nMember = 3;
        printf("C()
");
    }
    ~C() {
        printf("~C()
");
    }
    virtual void fun3() {
        printf("C::fun3()
");
    }
private:
    int m_nMember;
};

class BC :public B, public C {
public:
    BC() {
        m_nMember = 4;
        printf("BC()
");
    }
    ~BC() {
        printf("~BC()
");
    }
    virtual void fun3() {
        printf("BC::fun3()
");
    }
    virtual void fun4() {
        printf("BC::fun4()
");
    }
private:
    int m_nMember;
};

int _tmain(int argc, _TCHAR* argv[]) {
    BC theBC;
    return 0;
}

依次是对 sub_140001041 、sub_14000102D 的调用。上图可知，首先对 A 基类进行了构造。因为 A 已经执行过构造函数，因此跳过，而 B 虚继承 A 基类，因此会取两次虚表，并且有一次重复的对 A 虚表的赋值，注意存储两个虚表的地址不同。

下图中，接下来会对 C 类进行构造，在 C 类的内部，若跳转失败，则会执行 A 基类的构造，因此 C 类也是继承的 A 。而 BC 类的构造中，会重复对 B、A 虚表进行同地址的重复存储，并将自己的表写入。程序中有一个 偏移表 需要好好注意一下，在存储虚表时会发挥作用。

第五个程序：抽象类虚函数

C++ 中，含有纯虚函数的类称为抽象类，它不能实例化对象，通常用抽象类给子类规范接口。

#include "stdafx.h"


class IBase {
public:
    IBase() {
        m_nMember = 1;
        printf("IBase()
");
    }
    virtual void fun1() = 0;
    virtual void fun2() = 0;
private:
    int m_nMember;
};

class CDerived :public IBase
{
public:
    CDerived()
    {
        printf("CDerived()
");
    }
    virtual void fun1(){};
    virtual void fun2() {};
};

int _tmain(int argc, _TCHAR* argv[]) {
    IBase *pBase = new CDerived();
    delete pBase;
    return 0;
}