C++类成员空间分配和虚函数表

最近在自学python,看到继承和类,就顺便复习了C++的类和继承等方面的知识。

先看Base基类

class Base {

private:

    virtual void display() { cout<<"Base display()"<<endl; }

    void say(){ cout<<"Base say()"<<endl; }

public:

    virtual void func(){cout << "Base func()" << endl; }
    void exec(){ display(); say(); }

    void f1(string a) { cout<<"Base f1(string)"<<endl; }

    void f1(int a) { cout<<"Base f1(int)"<<endl; }   //overload

};

Base类中定义私有的虚函数display, 普通成员函数say,公共的虚函数func, 普通的成员函数exec,重载了f1函数。

下面是DeriveA类,继承于Base类

class DeriveA:public Base{

public:

    void display() { cout<<"DeriveA display()"<<endl; }         //override

    void f1(int a,int b) { cout<<"DeriveA f1(int,int)"<<endl; }   //redefining

    void say() { cout<<"DeriveA say()"<<endl; }   //redefining

    virtual void func(){cout << "DeriveA func()" << endl; }

};

DeriveA类继承了Base类,重写(覆盖)了虚函数display和func,并且将display权限修改为public。重定义了f1函数和say函数,但是修改了f1的参数列表。

下面是基础的几个测试

     DeriveA a;

     Base *b=&a;

    b->func();
    a.func();
    b->f1("abc");
    b->f1(3);
    a.f1(3,5);    

 输出结果:

func函数在Base类中为虚函数,DeriveA继承Base后,根据多态机制实现了动态调用。所谓多态机制就是用基类指针指向子类对象,基类指针调用虚函数func,会动态调用实际的子类对象的func函数。

由于display函数在Base类中为虚函数,所以不可以通过b->display()调用。由于DeriveA重新定义(redefining)了f1函数,f1函数参数类型修改了,所以只能使用a.f1(int,int)这种调用,而采用a.f1(string)或者

采用a.f1(int)这种调用都会出错,编译阶段就会出错。因为DeriveA类对f1重新定义了,基类的f1函数不可通过对象直接调用。同样的道理对于基类指针或对象,无论基类指针指向子类还是基类对象,调用f1只能

调用基类定义的两个f1(int), f1(string)两个函数,如果采用b->f1(3,5),编译器在编译阶段就会提出错误。想实现子类对象调用基类的函数可在函数体内加上作用于Base::函数名(参数,...)

DeriveA类修改f1函数,先调用基类的f1在调用自己的f1


class DeriveA:public Base{

public:

    void display() { cout<<"DeriveA display()"<<endl; }   //override

    void f1(int a,int b) { 
        Base::f1(2);
        Base::f1("test");
        cout<<"DeriveA f1(int,int)"<<endl; }   //redefining

    void say() { cout<<"DeriveA say()"<<endl; }   //redefining

    virtual void func(){
        
        cout << "DeriveA func()" << endl; }

}; 

打印输出

a.f1(3,5);

结果如下:

 

先调用了基类的两个f1函数,之后调用DeriveA的f1函数

下面调用如下函数

b->exec();

a.exec();

结果如下:

为什么两个结果一样呢?

先看b->exec();由于b是Base类型变量,那么调用的Base类的exec函数,exec函数内部调用Base类的display()和say()函数。由于b为指向DeriveA类的基类指针,根据多态机制,调用Base类的display()函数时,会动态调用

DeriveA类的display()函数。调用Base类的say()函数时,由于say()函数不是虚函数,所以不触发多态机制。因此b->exec()函数的结果为调用DeriveA的display,调用Base的say函数。

由于DeriveA类继承于Base类,但是没有实现自己的exec()函数,即没有实现重定义,那么当执行a.exec()时,调用的时Base类的exec()函数,原理和上边一样,调用Base类中的display()函数和say()函数,由于display()函数为虚函数,

a为DeriveA类对象,调用基类的虚函数display(),根据多态机制,实际调用的是DeriveA类的display()函数。

执行下边代码

a.say()

结果如下:

下面修改DeriveA类的内容,在DeriveA类内部实现自己的exec()函数

class DeriveA:public Base{

public:

    void exec(){ display(); say(); }

    void display() { cout<<"DeriveA display()"<<endl; }   //override

    void f1(int a,int b) { 
        cout<<"DeriveA f1(int,int)"<<endl; }   //redefining

    void say() { cout<<"DeriveA say()"<<endl; }   //redefining

    virtual void func(){
        
        cout << "DeriveA func()" << endl; }

};

 执行下边代码,

b->exec();

a.exec();

结果如下:

因为DeriveA类重定义了exec函数,那么a.exec()函数调用的是DeriveA类的exec()函数,从而调用的都是DeriveA类的display()和say()函数。

继承类和基类成员函数调用规则总结:

DeriveA a;

Base *b=&a;

1 基类指针指向子类对象,该指针调用某个成员函数,先考虑该函数是否为虚函数,如果为虚函数,且子类有覆盖(重写),会触发多态机制,动态调用子类的重写函数:

如 b->func(), 输出为DeriveA func()

2 基类指针指向子类对象,该指针调用某个成员函数,先考虑该函数是否为虚函数,如果为虚函数,子类没有覆盖(没有重写),不会触发多态机制,调用基类的虚函数:

3  基类指针指向子类对象,该指针调用某个成员函数,如果该函数不为虚函数,无论该函数是否被子类重定义(redefined),只调用基类的该成员函数。如DeriveA类内部不实现

exec()函数,那么b->exec()调用的是Base类的exec()函数。

4  在第3条基础上,基类有成员函数exec(), 子类没有成员函数exec(),在基类的exec() 内部调用虚函数display(), 且子类覆盖了display()函数,那么根据多态机制,调用子类的display()。

如果display()虚函数没有被重写,则调用基类的display()函数,同第2条。如果exec()内部调用普通函数say(), 无论子类是否重定义say(),都会调用基类的say()函数,同3

5  Base类中实现exec()函数,而子类DeriveA类内部不实现exec()函数,DeriveA类对象调用exec()函数,实际调用的为Base类内部的exec()函数。如果exec()内部调用虚函数或者普通成员函数,

情况如同第4条。

6  Base类中实现exec()函数,而子类DeriveA类重定义exec()函数,那么DeriveA类对象调用的是DeriveA类的exec()函数。如果exec()函数内部调用DeriveA类的其他成员函数,那么调用的都是

DeriveA类的成员函数。

7 子类重定义了基类的成员函数,那么子类对象调用该成员函数,要根据子类重定义的形参列表。如a.f1(3,5);

 虚函数使用和定义规则:

(1)非类的成员函数不能定义为虚函数,类的成员函数中静态成员函数和构造函数也不能定义为虚函数,但可以将析构函数定义为虚函数。实际上,优秀的程序员常常把基类的析构函数定义为虚函数。

因为,将基类的析构函数定义为虚函数后,当利用delete删除一个指向派生类定义的对象指针时,系统会调用相应的类的析构函数。而不将析构函数定义为虚函数时,只调用基类的析构函数。

(2)只需要在声明函数的类体中使用关键字“virtual”将函数声明为虚函数,而定义函数时不需要使用关键字“virtual”。

(3)如果声明了某个成员函数为虚函数,则在该类中不能出现和这个成员函数同名并且返回值、参数个数、参数类型都相同的非虚函数。在以该类为基类的派生类中,也不能出现这种非虚的同名同返回值

同参数个数同参数类型函数。

 类的静态函数和构造函数不可以定义为虚函数:

1  静态函数的目的是通过类名+函数名访问类的static变量,或者通过对象调用staic函数实现对static成员变量的读写,要求内存中只有一份数据。而虚函数在子类中重写,并且通过多态机制实现动态调用,

在内存中需要保存不同的重写版本。

2  构造函数的作用是构造对象,而虚函数的调用是在对象已经构造完成,并且通过调用时动态绑定。动态绑定是因为每个类对象内部都有一个指针,指向虚函数表的首地址。而且虚函数,类的成员函数,

static成员函数都不是存储在类对象中,而是在内存中只保留一份。

  知其然、知其所以然(虚函数表原理):

虚函数存储在虚函数表中,每个类对象都包含一个指向该虚函数表首地址的指针。定义Baseclass类


class Baseclass { 

public: 
    Baseclass():a(1024){}
    virtual void f() { cout << "Base::f" << endl; } 
    virtual void g() { cout << "Base::g" << endl; } 
    virtual void h() { cout << "Base::h" << endl; } 
    int a;
}; 

从虚函数表中依次取出函数执行:

    Baseclass b; 

    cout <<"类对象大小" <<  sizeof(b) << endl;

    int * p = (int *)(&b) ;
    cout << "指向虚函数表的指针的地址"<< p << endl;
    cout <<"成员a地址"<< p+1 << endl;
    cout <<"成员a的数值" << *(p + 1) << endl;
    cout << "虚函数表首地址" <<(int *)(*p)  << endl;

    Func pFun =(Func) *(int *)(*p);
    pFun();
 
     pFun =(Func) *((int *)(*p) + 1);
    pFun();

     pFun =(Func) *((int *)(*p) + 2);
    pFun();
    

输出结果如下:

可见类对象大小为8字节,4字节正好是指向虚函数表指针的大小。剩余4字节为成员变量a的大小。画个图示意虚函数表结构:

 

p指向的就是类对象的首地址,同时也是虚函数表指针(指向虚函数表的指针)的地址,*p指向虚函数表,

由于指针是4字节,(int *)(*p)虚函数表首地址,也是第一个函数指针的地址。

Derive类继承于Base类,但是没有覆盖(重写)Base类的虚函数,Derive d; 的虚函数表如下:

 

Derive类继承于Base类,并且覆盖(重写)Base类的虚函数,Derive d; 的虚函数表如下:

可以看到d的虚函数表中第一个单元为Derive::f(),覆盖了原有的Base::f()。

Derive d;

Base * p = &d;

p指向d的首地址,其实就是d的虚函数表指针的地址,p->f()实际会调用虚函数表中的Derive::f(),从而实现多态。

多重继承结构如下:

 

虚函数表原理后可以篡改部分程序功能,其实很多外挂就是钩子函数回调注入的。

class Baseclass { 

public: 
    Baseclass():a(1024){}
private:
    virtual void f() { cout << "Base::f" << endl; } 

    virtual void g() { cout << "Base::g" << endl; } 

    virtual void h() { cout << "Base::h" << endl; } 

    int a;
}; 

class Deriveclass:public Baseclass{
public:
    Deriveclass():Baseclass(){}

};

由于Baseclass内部的虚函数是私有的,所以Deriveclass类变量是不能直接访问这些函数的。但是可以通过虚函数寻址,并且通过回调函数方式调用。

Deriveclass d;
    Func pFunc = (Func)*((int *)(*(int *)(&d)));
    pFunc();

结果如下:

 C++类对象的大小为多大?

一个类中,虚函数、成员函数(包括静态与非静态)和静态数据成员都是不占用类对象的存储空间的。

对象大小=   vptr(可能不止一个)   +   所有非静态数据成员大小   +   Aligin字节大小(依赖于不同的编译器对齐和补齐)

定义几个类,然后输出他们大小。

class   A    
{    
};    

class   B    
{    
    char   ch;    
    void   func()    
    {    
    }    
};    

class   C    
{    
    char   ch1;    //占用1字节 
    char   ch2;   //占用1字节 
    virtual   void   func()    
    {    
    }    
};    

class   D    
{    
    int   in;    
    virtual   void   func()    
    {    
    }    
};    

class E
{
    char m;
    virtual void func()
    {
    
    }
};

 输出大小:

    A   a;  
    B   b; 
    C   c;  
    D   d; 
    E    e;

      cout<<"a对象大小: "<< sizeof(a)<<endl;
      cout<<"b对象大小: "<< sizeof(b)<<endl;
      cout<<"c对象大小: " <<sizeof(c)<<endl;
      cout<<"d对象大小: "<< sizeof(d)<<endl;
      cout <<"e对象大小: " <<sizeof(e) <<endl;


 结果如下:

 类和结构体对象对齐和补齐原则?

 对齐:类(结构体)对象每个成员分配内存的起始地址为其所占空间的整数倍。

补齐:类(结构体)对象所占用的总大小为其内部最大成员所占空间的整数倍。

 空类定义的对象a  大小为1因为每个对象是独一无二的,编译器为了标识不同对象,要分配一字节的大小作为标识码。

对象b 大小为1是因为成员函数在内存中只存储一份,不会存储在对象中。

对象c大小为8, 是因为前四个字节存储虚函数表的指针,第5个字节存储成员变量ch1,第6个字节存储成员变量ch2,这样c的大小为6,根据补齐原则,需要补充2字节,使对象大小为8,8是最大字节4的整数倍。

对象d大小为8,不需要补齐和对齐。

对象e大小为8,前四个字节存储虚函数表指针,第5个字节存储成员m,需要补齐三个字节,总共八个字节,为4字节的倍数。

 看看下边这几个类

class F{ 
    static int num; 
}; 

class G{ 

    virtual void print(){} 
    virtual void  print1(){} 
}; 

class H{ 

    void print(){} 
    static void print1(){} 
}; 

 打印并输出大小:

    F f;
    cout<<"f 对象大小: "<< sizeof(f)<<endl;

    G g;
    cout<<"g 对象大小: "<< sizeof(g)<<endl;

    H h;
    cout<<"h 对象大小: "<< sizeof(h)<<endl;

 结果:

静态成员变量,虚函数和static成员函数都不会占用对象的空间,f大小为1,是因为要开辟一个字节保存对象标识信息。

g大小为4是开辟四字节给虚函数表指针。h大小为1字节也是开辟一个字节保存对象标识信息

  什么要采取对齐和补齐分配策略?

这个要从计算机CPU存取指令说起,

 

 每个字节单元为8bit,从地址0到地址3总共四个字节,为32bit。

 class  A{

    char  m;

    char  b;

};

A a;  对于a 将a.m分配在地址0开始的一个字节中,将a.b分配在地址1开始的额一个字节中。这样a的大小为2,cpu取数据可以执行一条指令就完成了。

class B{

  int m;

  char n;

};

B b; 对于b将b.m分配在地址为0开始的四个字节(0~3),对于b.n分配在开始地址为4的一字节空间。如果再定一个B b2;,不采取补齐策略,b2.m将被分起始地址为5的

4字节空间(5~8),b2.n就被分在了起始地址为9的一字节空间。cpu取数据需要分3次,先取出0~3地址空间的数据(b.m),再取出地址4~7数据(b.n和b2.m的前三个字节)

最后取出地址为8~11的数据(b2.m的最后一个字节以及b2.n)。取出数据后还要拆分和组合,极大地降低了效率。所以需要采取补齐策略。补齐策略数据分配如下:

地址0~3存储b.m, 地址4~7存储b.n,由于b.n只占用1个字节,地址5~7不存储数据,用于补齐。

地址8~11存储b2.m,地址12~15存储b2.n,13~15同样不存储数据用于补齐。

这样cpu读取四次可以将数据读取出来,进行简单的组合不需要切割数据就可以完成快速处理。

class C{

   char n;

   int  m;

}

 C c; c.n存储周期0开始的一个字节中,如果不采取对齐策略,那么c.m会存储在1~4字节中,这样cpu需要读去两次,并且需要进行切割(0~4地址中数据包含c.n和c.m的前三个字节),

以及组合地址4开始的一个字节(存储c.m的最后一个字节)。如果采取对齐策略,那么地址0~3存储c.n,地址4~7存储c.m,cpu同样读取两次,但是仅需要组合就可以去除对象的所有数据。

这就是为什么存储数据需要采取对齐和补齐的策略。

 到此为止C++虚函数和类成员的存储知识复习完,谢谢关注我的公众号:

 

 

原文地址:https://www.cnblogs.com/secondtonone1/p/7205108.html