从汇编看c++的虚拟继承以及其内存布局(一)

先看第一种最简单的情形,所有类中没有任何虚函数的菱形继承。

下面是c++源码:

class Top {//虚基类
public:
    int i;
    Top(int ii) {
        i = ii;
    }
};

class Left : public virtual Top {
public:
    int j;
    Left(int jj, int ii) : Top(ii) {
        j = jj;
    }
};

class Right : public virtual Top {
public:
    int k;
    Right(int kk, int ii) : Top(ii) {
        k = kk;
    }
};

class Bottom : public Left, public Right {
public:
    int l;
    Bottom(int ll, int jj, int kk, int ii) : Top(ii), Left(jj, ii), Right(kk, ii) {
        l = ll;
    }
};

int main() {
    Bottom b(1, 2, 3, 4);
    Bottom* bp = &b;
    //访问自身成员变量
    b.l = 1;
    bp->l = 2;
    //访问父类Left的成员变量
    Left* lp = bp;
    b.j = 1;
    bp->j = 2;
    lp->j = 3;
    //访问父类Right的成员变量
    Right* rp = bp;
    b.k = 1;
    bp->k = 2;
    rp->k = 3;
    //访问虚基类Top的成员变量
    Top* tp = bp;
    b.i = 1;
    bp->i = 2;
    tp->i = 3;
    
};

让我们来看看,汇编代码里面是怎样的情形,先看main函数里面的汇编码:

; 33   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 48                    ; 为对象程序所需变量预留空间,其中对象b只栈24byte

; 34   :     Bottom b(1, 2, 3, 4);

    push    1;压入标志1,作为判断是否调用虚基类构造函数的依据 1表示调用,0表示不调用
    push    4;压栈4,为对象b的构造函数传递参数
    push    3;压栈3,为对象b的构造函数传递参数
    push    2;压栈2,为对象b的构造函数传递参数
    push    1;压栈1,为对象b的构造函数传递参数
    lea    ecx, DWORD PTR _b$[ebp];获取对象b的首地址,传给寄存器ecx,作为隐含参数传递给对象b的构造函数
    call    ??0Bottom@@QAE@HHHH@Z            ; 调用对象b的构造函数

; 35   :     Bottom* bp = &b;

    lea    eax, DWORD PTR _b$[ebp];将对象b的首地址给寄存器eax
    mov    DWORD PTR _bp$[ebp], eax;将对象b的首地址给指针变量bp

; 36   :     
; 37   :     b.l = 1;

    mov    DWORD PTR _b$[ebp+16], 1;将1写入偏移对象首地址16字节处内存,即为对象b的成员变量l赋值1

; 38   :     bp->l = 2;

    mov    ecx, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器ecx
    mov    DWORD PTR [ecx+16], 2;将2写入偏移对象首地址16字节处内存,即为对象b的成员变量l赋值2
                             ;可以看到,无论是用对象本身,还是对象指针访问对象b的成员变量
                             ;其成员变量的偏移量都在编译期固定了,为16字节
                             ;且两种方式访问没有差别

; 39   :     
; 40   :     Left* lp = bp;

    mov    edx, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器edx
    mov    DWORD PTR _lp$[ebp], edx;将对象b的首地址给对象指针lp,此时lp指向父对象Left的首地址
                                ;从下面的内存布局图可以看到,父对象Left的首地址和Bottom一样

; 41   :     b.j = 1;

    mov    DWORD PTR _b$[ebp+4], 1;将1赋给偏移对象b首地址4byte处内存,即为
                               ;继承来的成员变量j赋值1

; 42   :     bp->j = 2;

    mov    eax, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器eax
    mov    DWORD PTR [eax+4], 2;将2写入偏移对象b首地址4byte处内存,即为继承来的成员变量j赋值2
                            ;可以看到,无论使用b对象本身,还是指针访问继承来的成员变量j,
                            ;其成员变量的偏移量都是编译器固定了,都为4byte
                            ;且两种方式访问无差别

; 43   :     lp->j = 3;

    mov    ecx, DWORD PTR _lp$[ebp];将父类Left对象的首地址给寄存器ecx
    mov    DWORD PTR [ecx+4], 3;将3赋给偏移Left对象首地址4byte处内存,即为父对象Left的成员变量j赋值3
                            ;可以看到,用这种方式访问父对象Left的成员变量,其偏移量也是编译器固定
                            ;为4byte

; 44   :     
; 45   :     Right* rp = bp;

    cmp    DWORD PTR _bp$[ebp], 0;比较指针的值是否为0,也就是判断bp是否为空指针
    je    SHORT $LN3@main;如果bp为空指针,则跳转到标号$LN3@main处执行,否则顺序执行,这里是顺序执行
    mov    edx, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器edx
    add    edx, 8;寄存器edx里面的内容加8,现在edx里面保存的地址偏移了对象b的首地址8byte,即指向了对象Right的首地址
    mov    DWORD PTR tv90[ebp], edx;将寄存器edx内容存入临时变量tv90
    jmp    SHORT $LN4@main;跳转到标号$LN4@main处执行
$LN3@main:
    mov    DWORD PTR tv90[ebp], 0;将临时变量tv90赋值为空指针,这是在上面判断bp指针为空的情况下执行,这里不执行这一句
$LN4@main:
    mov    eax, DWORD PTR tv90[ebp];将临时变量tv90里面的值赋给寄存器eax,eax保存了对象Right的首地址
    mov    DWORD PTR _rp$[ebp], eax;将寄存器eax里面的值赋给指针rp
                                ;到这里,完成了从指针bp到指针rp的转化,这里之所以有对bp指针为空的判断
                                ;是因为,rp里面的地址值是由bp里面的地址值加8byte得来,如果不进行判断,一旦bp为空指针
                                ;即bp不指向任何对象,那么rp将指向错误的内存,这种转换就有危险,编译器必须避免这种情况

; 46   :     b.k = 1;

    mov    DWORD PTR _b$[ebp+12], 1;将1写入偏移对象b首地址12byte处,即将1赋给继承来的成员变量k

; 47   :     bp->k = 2;

    mov    ecx, DWORD PTR _bp$[ebp];将对象b首地址给寄存器ecx
    mov    DWORD PTR [ecx+12], 2;将2写入偏移对象b首地址12byte处,即将2赋给继承来的成员变量k
                             ;可以看到,这里其成员变量的偏移量也是编译器固定,为2byte
                             ;且两种方式访问没有差别

; 48   :     rp->k = 3;

    mov    edx, DWORD PTR _rp$[ebp];将父对象Right首地址给寄存器edx
    mov    DWORD PTR [edx+4], 3;将3写给偏移父对象Right首地址4byte处,即将3赋给成员变量k

; 49   :     
; 50   :     Top* tp = bp;

    cmp    DWORD PTR _bp$[ebp], 0;比较bp指针的值是否为0,也就是判断bp是否为空,原因同上
    jne    SHORT $LN5@main;如果不为空,就跳转到标号处$LN5@main执行,否则顺序执行,这里跳转到标号处执行
    mov    DWORD PTR tv145[ebp], 0;如果bp为空指针,就将0赋给临时变量tv145,这里不执行这一句
    jmp    SHORT $LN6@main;跳转到标号处$LN6@main执行
$LN5@main:
    mov    eax, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器eax
    mov    ecx, DWORD PTR [eax];将对象b首地址里面的内容给寄存器ecx,对象b首地址处的值是vtable的地址,关于vtable将在下面解释
    mov    edx, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器edx
    add    edx, DWORD PTR [ecx+4];ecx里面存有vtable的首地址,这里取偏移vtable首地址4byte处内存内容(即对象b,或者父对象Left首地址到虚基类首地址的偏移量), 然后加上对象b的首地址
                              ;得到虚基类对象Top的首地址
    mov    DWORD PTR tv145[ebp], edx;寄存器edx里面保存虚基类对象Top的首地址,保存到临时变量tv145里面
$LN6@main:
    mov    eax, DWORD PTR tv145[ebp];将临时变量tv145里面的值给寄存器eax
    mov    DWORD PTR _tp$[ebp], eax;寄存器eax里面含有虚基类对象Top首地址,给指针tp
                                ;这里完成了从指针bp到tp的转换

; 51   :     b.i = 1;

    mov    ecx, DWORD PTR _b$[ebp];将对象b的首地址的内容给寄存器ecx,ecx里面是vtable的首地址
    mov    edx, DWORD PTR [ecx+4];取偏移vtable首地址4byte处的内容,即对象b首地址到虚基类Top首地址偏移量给寄存器edx
    mov    DWORD PTR _b$[ebp+edx], 1;将对象首地址加上edx里面的偏移量,得到虚基类Top首地址,将1写入这给地址所指内存,ji
                                 ;为继承自虚基类的成员变量i赋值

; 52   :     bp->i = 2;

    mov    eax, DWORD PTR _bp$[ebp];将对象b的首地址给寄存器eax
    mov    ecx, DWORD PTR [eax];将对象b首地址处内容给寄存器ecx,即将vtable的首地址给寄存器ecx
    mov    edx, DWORD PTR [ecx+4];将偏移vtable首地址4byte处内存内容给寄存器edx,即将对象b首地址到虚基类Top首地址偏移量给edx
    mov    eax, DWORD PTR _bp$[ebp];将对象b首地址给寄存器eax
    mov    DWORD PTR [eax+edx], 2;将对象b首地址加上刚才取出的偏移量,得到虚基类Top的首地址,将2写入改地址所处内存处,
                              ;即为继承自虚基类的成员变量i赋值2

; 53   :     tp->i = 3;

    mov    ecx, DWORD PTR _tp$[ebp];将虚基类对象Top的首地址给寄存器ecx
    mov    DWORD PTR [ecx], 3;将3赋给虚基类对象Top首地址处内才能,即为成员变量i赋值

; 54   :     
; 55   : };

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

接下来是Bottom构造函数的汇编码:

??0Bottom@@QAE@HHHH@Z PROC                ; Bottom::Bottom, COMDAT
; _this$ = ecx

; 28   :     Bottom(int ll, int jj, int kk, int ii) : Top(ii), Left(jj, ii), Right(kk, ii) {

    push    ebp
    mov    ebp, esp
    push    ecx;压栈ecx的目的是为保存对象b的首地址预留空间
    mov    DWORD PTR _this$[ebp], ecx;ecx里面保存这对象b的首地址,存放到刚才空间
    cmp    DWORD PTR _$initVBases$[ebp], 0;_$initVBases所代表的内存里面的内容存放的是调用Bottom构造器时压入的标志,其值为1
                                       ;这里与0进行比较
    je    SHORT $LN1@Bottom;如果上面比较结果相等,就跳到标号处$LN1@Bottom执行,否则顺序执行,这里是顺序执行
    mov    eax, DWORD PTR _this$[ebp];将对象b的首地址给寄存器eax
    mov    DWORD PTR [eax], OFFSET ??_8Bottom@@7BLeft@@@;将Bottom-Left的vtable首地址写入对象b首地址处内存
    mov    ecx, DWORD PTR _this$[ebp];将对象b的首地址给寄存器ecx
    mov    DWORD PTR [ecx+8], OFFSET ??_8Bottom@@7BRight@@@;将Bottom-Right的vtable首地址写入偏移对象b首地址8byte处
                                                        ;即写入对象Right的首地址处内存
    mov    edx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器edx
    push    edx;压栈寄存器edx,作为参数传递给虚基类的构造函数Top
    mov    ecx, DWORD PTR _this$[ebp];将对象b的首地址给寄存器ecx
    add    ecx, 20                    ; 将对象b的首地址加上20,得到虚基类Top的首地址,存放到寄存器ecx,作为隐含参数传递给虚基类Top的构造函数
    call    ??0Top@@QAE@H@Z                ; 调用虚基类Top的构造函数
$LN1@Bottom:;
    push    0;标志0,说明已经调用过虚基类Top的构造函数,在调用Right和Left的构造函数时,就不会再调用了。
    mov    eax, DWORD PTR _ii$[ebp];将参数ii的值给寄存器eax
    push    eax;压栈eax,给Left的构造函数传递参数
    mov    ecx, DWORD PTR _jj$[ebp];将参数jj的值给寄存器ecx
    push    ecx;压栈ecx,给Left的构造函数传递参数
    mov    ecx, DWORD PTR _this$[ebp];将对象b的首地址(也就是对象Left的首地址)给寄存器ecx,作为隐含参数传递给Left构造函数
    call    ??0Left@@QAE@HH@Z            ; 调用Left构造函数
    push    0;压栈标志0,说明已经调用过虚基类Top的构造函数,在调用Right和Left的构造函数时,就不会再调用了
    mov    edx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器edx
    push    edx;压栈edx,给Right构造函数传递参数
    mov    eax, DWORD PTR _kk$[ebp];将参数kk的值给寄存器eax
    push    eax;压栈eax,给Right的构造函数传递参数
    mov    ecx, DWORD PTR _this$[ebp];将对象b的首地址给ecx
    add    ecx, 8;将对象b的首地址加上8,得到对象Right的首地址,存入寄存器ecx,作为隐含参数传递给Right构造函数
    call    ??0Right@@QAE@HH@Z            ; 调用Right构造函数

; 29   :         l = ll;

    mov    ecx, DWORD PTR _this$[ebp];将对象b的首地址给寄存器ecx
    mov    edx, DWORD PTR _ll$[ebp];将参数ll的值给寄存器edx
    mov    DWORD PTR [ecx+16], edx;将寄存器edx的内容写入偏移对象b首地址16byte处,即给对象b的成员变量l赋值

; 30   :     }

    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    20                    ; 00000014H
??0Bottom@@QAE@HHHH@Z ENDP        

下面是Left构造函数的汇编码:

??0Left@@QAE@HH@Z PROC                    ; Left::Left, COMDAT
; _this$ = ecx

; 12   :     Left(int jj, int ii) : Top(ii) {

    push    ebp
    mov    ebp, esp
    push    ecx;压栈ecx寄存器,是为保存对象Left的首地址预留空间
    mov    DWORD PTR _this$[ebp], ecx;寄存器ecx里面含有对象Left的首地址,存入刚才预留空间
    cmp    DWORD PTR _$initVBases$[ebp], 0;_$initVBases所代表的内存,里面含有调用Left构造函数传入的标志,其值为0
                                       ;这里是将它的值和0作比较
    je    SHORT $LN1@Left;如果上面比较相等,则跳转到标号$LN1@Left处执行,否则顺序执行,这里跳转到标号执行,因此不会调用
                       ;虚基类Top的构造函数,避免重复调用
                       ;标号之前的语句在构造对象b的时候都不会执行
    mov    eax, DWORD PTR _this$[ebp];将Left对象的首地址给eax寄存器
    mov    DWORD PTR [eax], OFFSET ??_8Left@@7B@;将??_8Left@@7B@所带表的内存地址(即Left的vtable首地址)写入对象Left的首地址处内存
                                             ;由于这一句在构造对象b时不执行,设置无效
    mov    ecx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器ecx
    push    ecx;将ecx压栈,给虚基类Top构造函数传递参数,但是这一句在构造对象b时不执行,因此传参无效
    mov    ecx, DWORD PTR _this$[ebp];将对象Left的首地址给ecx寄存器
    add    ecx, 8;将Left的首地址加上8,得到Top对象的首地址,作为隐含参数传递给Top的构造函数
    call    ??0Top@@QAE@H@Z                ; 调用Top的构造函数,但是在构造对象b时,这句不执行,因此调用无效
$LN1@Left:

; 13   :         j = jj;

    mov    edx, DWORD PTR _this$[ebp];将对象Left的首地址给寄存器edx
    mov    eax, DWORD PTR _jj$[ebp];将参数jj给寄存器eax
    mov    DWORD PTR [edx+4], eax;将eax寄存器里面的内容写入偏移对象Left首地址4byte处内存,即给成员变量j赋值jj

; 14   :     }

    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    12                    ; 0000000cH
??0Left@@QAE@HH@Z ENDP        

下面是Right构造函数的汇编码:

??0Right@@QAE@HH@Z PROC                    ; Right::Right, COMDAT
; _this$ = ecx

; 20   :     Right(int kk, int ii) : Top(ii) {

    push    ebp
    mov    ebp, esp
    push    ecx;压栈ecx的目的是为了保存对象Right的首地址预留空间
    mov    DWORD PTR _this$[ebp], ecx;ecx寄存器保存有对象Right的首地址,存放到刚才预留空间
    cmp    DWORD PTR _$initVBases$[ebp], 0;_$initVBases所代表的内存存放调用Right构造函数时传入的标志,其值为0,说明
                                       ;这里将其值与0比较
    je    SHORT $LN1@Right;如果比较相等,就跳转到标号处执行$LN1@Right,不会调用虚基类的构造函数,否则,顺序执行,这里跳转到标号执行
                        ;所有标号之前的语句在构造对象b时都不会执行
    mov    eax, DWORD PTR _this$[ebp];将对象Right的首地址给寄存器eax
    mov    DWORD PTR [eax], OFFSET ??_8Right@@7B@;将??_8Right@@7B@的所带表的内存地址(即Right的vtable首地址)写入到对象Right的首地址处内存
    mov    ecx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器ecx
    push    ecx;压栈ecx,为调用Top构造函数传递参数
    mov    ecx, DWORD PTR _this$[ebp];将对象Right首地址给寄存器ecx
    add    ecx, 8;将对象Right的首地址加8,得到对象Top首地址,作为隐含参数传递给Top的构造函数
    call    ??0Top@@QAE@H@Z                ; 调用Top构造函数
$LN1@Right:

; 21   :         k = kk;

    mov    edx, DWORD PTR _this$[ebp];将Right首地址给寄存器edx
    mov    eax, DWORD PTR _kk$[ebp];将参数kk的值给寄存器eax
    mov    DWORD PTR [edx+4], eax;将eax里面的值写入偏移对象Right首地址4byte处,即为成员变量k赋值kk

; 22   :     }

    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    12                    ; 0000000cH
??0Right@@QAE@HH@Z ENDP            

下面是Top函数的汇编码:

??0Top@@QAE@H@Z PROC                    ; Top::Top, COMDAT
; _this$ = ecx

; 4    :     Top(int ii) {

    push    ebp
    mov    ebp, esp
    push    ecx;压栈的目的是为保留对象Top的首地址预留空间
    mov    DWORD PTR _this$[ebp], ecx;ecx寄存器里面含有对象Top的首地址,存到刚才预留的空间

; 5    :         i = ii;

    mov    eax, DWORD PTR _this$[ebp];将对象Top的首地址给寄存器eax
    mov    ecx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器ecx
    mov    DWORD PTR [eax], ecx;将ecx的值写入对象Top首地址处,即给成员变量i赋值ii

; 6    :     }

    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    4
??0Top@@QAE@H@Z ENDP    


下面是类之间的继承关系图:

                       图1 菱形继承,所有类不含任何虚函数

下面是每个类的内存布局

                  Left(12byte)

                                    Right(12byte)

                         Bottom(24byte)

上面代码中,Left和Right类对象首地址处都含有一个vbtable(误写为了vtable)指针,指向一个vbtable,vbtable里面只有两项:第一项是vbtable指针所属类的虚表指针vptr(没有就从对象首地址开始算)相对于vbtale指针的偏移量;第二项是其父类虚表指针vptr(没有的话就是对象首地址)相对于vbtable的偏移量。

从Bottom Left Right的构造函数可以看出来,在每次调用相应的构造函数之前,都会有编译器传入一个标志,以此来防止虚基类构造函数被多次调用。这就是为什么虚基类只有一份实例的原因。虚基类的构造函数总是由当前正构造的对象的构造函数调用,比如这里构造Bottom对象时,就由Bottom构造函数调用,Left和Right构造函数不会调用。

原文地址:https://www.cnblogs.com/chaoguo1234/p/3149212.html