C++虚函数机制(转)


C++的
虚函数(Virtual Function)是通过一张虚函数表(Virtual Table)来实现的。简称为V-Table。 在这个表中,主是要一个类的虚函数的地址表,这张表解决了继承、覆盖的问题,保证其容真实反应实际的函数。这样,在有虚函数的类的实例中这个表被分配在了 这个实例的内存中,所以,当我们用父类的指针来操作一个子类的时候,这张虚函数表就显得由为重要了,它就像一个地图一样,指明了实际所应该调用的函数。

1. 无继承的情况

#include <iostream>
using namespace std;

class Base {
public:
    virtual void f() { cout << "Base::f()" << endl; }
    virtual void g() { cout << "Base::g()" << endl; }
    virtual void h() { cout << "Base::h()" << endl; }
};

int main()
{
    typedef void (*Fun)();

    Base *b = new Base;
    cout << *(int*)(&b) << endl; //虚函数表的地址存放在对象最开始的位置

    Fun funf = (Fun)(*(int*)*(int*)b);
    Fun fung = (Fun)(*((int*)*(int*)b + 1));
    Fun funh = (Fun)(*((int*)*(int*)b + 2));


    funf();
    fung();
    funh();


    cout << (Fun)(*((int*)*(int*)b + 3)); // 最后一个位置为0,表明虚函数表的结束

    return 0;
}

 

注意:在上面这个图中,虚函数表中最后一个节点相当于字符串的结束符,其标志了虚函数表的结束,在Codeblocks下打印为0。 

 

2. 继承,无虚函数覆盖的情形

#include <iostream>
using namespace std;

class Base {
public:
    virtual void f() { cout << "Base::f()" << endl; }
    virtual void g() { cout << "Base::g()" << endl; }
    virtual void h() { cout << "Base::h()" << endl; }
};

class Derive: public Base {
    virtual void f1() { cout << "Derive::f1()" << endl; }
    virtual void g1() { cout << "Derive::g1()" << endl; }
    virtual void h1() { cout << "Derive::h1()" << endl; }
};

int main()
{
    typedef void (*Fun)();

    Base *b = new Derive;
    cout << *(int*)b << endl;
    Fun funf = (Fun)(*(int*)*(int*)b);
    Fun fung = (Fun)(*((int*)*(int*)b + 1));
    Fun funh = (Fun)(*((int*)*(int*)b + 2));
    Fun funf1 = (Fun)(*((int*)*(int*)b + 3));
    Fun fung1 = (Fun)(*((int*)*(int*)b + 4));
    Fun funh1 = (Fun)(*((int*)*(int*)b + 5));


    funf(); // Base::f()
    fung(); // Base::g()
    funh(); // Base::h()
    funf1(); // Derive::f1()
    fung1(); // Derive::g1()
    funh1(); // Derive::h1()

    cout << (Fun)(*((int*)*(int*)b + 6));
    return 0;
}

 

从上表可以发现:

1.  虚函数按照其声明顺序放于表中。

2.  父类的虚函数在子类的虚函数前面。 

 

 

3. 继承,虚函数覆盖的情形

 

#include <iostream>
using namespace std;

class Base {
public:
    virtual void f() { cout << "Base::f()" << endl; }
    virtual void g() { cout << "Base::g()" << endl; }
    virtual void h() { cout << "Base::h()" << endl; }
};

class Derive: public Base {
    virtual void f() { cout << "Derive::f()" << endl; }
    virtual void g1() { cout << "Derive::g1()" << endl; }
    virtual void h1() { cout << "Derive::h1()" << endl; }
};

int main()
{
    typedef void (*Fun)();

    Base *b = new Derive;
    cout << *(int*)b << endl;
    Fun funf = (Fun)(*(int*)*(int*)b);
    Fun fung = (Fun)(*((int*)*(int*)b + 1));
    Fun funh = (Fun)(*((int*)*(int*)b + 2));
    Fun fung1 = (Fun)(*((int*)*(int*)b + 3));
    Fun funh1 = (Fun)(*((int*)*(int*)b + 4));


    funf(); // Derive::f()
    fung(); // Base::g()
    funh(); // Base::h()
    fung1(); // Derive::g1()
    funh1(); // Derive::h1()

    cout << (Fun)(*((int*)*(int*)b + 5));
    return 0;
}

 
 

从上表可以看出:

 

1.  覆盖的f()函数被放到了虚表中原来父类虚函数的位置。

2.  没有被覆盖的函数依旧

3.  可通过获取获取成员函数指针来调用成员函数(即使是private类型的),带 来一定安全性的影响。

 

 

4. 多继承的情形

 

#include <iostream>
using namespace std;

class Base1 {
public:
    virtual void f() { cout << "Base1::f()" << endl; }
    virtual void g() { cout << "Base1::g()" << endl; }
    virtual void h() { cout << "Base1::h()" << endl; }
};

class Base2 {
public:
    virtual void f() { cout << "Base2::f()" << endl; }
    virtual void g() { cout << "Base2::g()" << endl; }
    virtual void h() { cout << "Base2::h()" << endl; }
};


class Base3 {
public:
    virtual void f() { cout << "Base3::f()" << endl; }
    virtual void g() { cout << "Base3::g()" << endl; }
    virtual void h() { cout << "Base3::h()" << endl; }
};


class Derive: public Base1,public Base2, public Base3 {
    virtual void f() { cout << "Derive::f()" << endl; }
    virtual void g1() { cout << "Derive::g1()" << endl; }
};

int main()
{
    typedef void (*Fun)();

    Derive d;
    Base1 *b1 = &d;
    Base2 *b2 = &d;
    Base3 *b3 = &d;


    b1->f(); //Derive::f()
    b2->f(); //Derive::f()
    b3->f(); //Derive::f()
    b1->g(); //Base1::g()
    b2->g(); //Base2::g()
    b3->g(); //Base3::g()


    Fun b1fun = (Fun)(*(int*)*(int*)b1);
    Fun b2fun = (Fun)(*(int*)*((int*)b1+1));
    Fun b3fun = (Fun)(*(int*)*((int*)b1+2));

    b1fun(); // Derive::f()
    b2fun(); // Derive::f()
    b3fun(); // Derive::f()

    return 0;
}

 

 

从上表可以看出:

 

1. 每个父类都有自己的虚表。

2. 子类的成员函数被放到了第一个父类的表中。(所谓的第一个父类是按照声明顺序来判断的)

3. 对于多继承无虚函数覆盖的情况,布局与上图类似(Derive的位置对应Base)

 
 
 
补充:
 
今天在c++坛子里瞎逛,看到精华坛里在讨论“为什么虚函数效率低”的问题,
××楼主回答面试官说“跟cpu流水线执行效率有关”        
××某人回答“因为虚函数需要一次间接的寻址... 而一般的函数可以在编译时定位到函数的地址,虚函数(动态类型调用)是要根据某个指针定位到函数的地址. ” 
×ד虚函数有个虚函数表,而且会传一个index索引~!会间接寻址!”
×ד流水线执行的话,和"命中率"有关吧. 也就是说在流水线后端,已经译码成功的,和正在执行的代码的后继是一样的. 否则流水线会中断,也就是说在后端做的是无效的,需要重新译码.”    
搞笑的是以下人的回复:
×ד的确,计算机程序效率说到底和计算机指令流水线息息相关(还和缓存命中率有关)。但是,把虚函数效率低的原因解释到流水线这一层,是极其变态的,这个考官很可能是在卖弄自己的水平而已。”   
×ד楼主以后你要是遇到这种考官,你和他谈与非逻辑门,硅锗原子的组成和爱因斯坦相对论对虚函数的影响,绝对震惊四座!”
×ד说是因为流水线执行的原因,根本与问题不着边际。或者应该说影响流水线执行是效率低的无数原因中的一种才好。”    
×ד首先是由this指向查找虚函数表,然后找到相应的虚函数地址 
比非虚函数多查找一次 
如果是(多继承)基类指针指向派生类对象的话,有可能会涉及this指针的调整                     
比如先访问基类的成员数据再访问派生类的析构函数  就要进行一次this指针的调整 
具体可以参见 insied the c++ object model的多重继承下的virtual functions ”
×ד一些C++的书籍有明确的说明,针对类的虚函数的机制,如果有虚函数的话,编译器会为类增加一个虚函数表(VBL),当在动态执行程序时,会到该虚函数表中寻找函数。多增加了一个过程,效率肯定会低一些,但带来了运行时的多态。”    
×ד流水线 貌似说的是 CPU执行代码的提前取指令吧 
虚函数 效率低 是因为 执行过程中会跳转两次(首先找到对象的函数表,其次通过该函数表中存的虚函数表地址找到真正的执行地址),这样CPU运行的时候会跳转两次,而普通函数只跳一次。CPU每跳转一次,预取指令基本上就要作废很多,所以效率会很低。”
/////////////////////////////////////最后得分者
和流水线相关是说得通的,究其原因还是因为存在动态跳转,这会导致分支预测失败,流水线排空。 

设想一下,如果说不是虚函数,那么在编译时期,其相对地址是确定的,编译器可以直接生成jmp/invoke指令; 
如果是虚函数,多出来的一次查找vtable所带来的开销,倒是次要的,关键在于,这个函数地址是动态的,譬如 
取到的地址在eax里,则在call eax之后的那些已经被预取进入流水线的所有指令都将失效。流水线越长,一次分支预测失败的代价也就越大。 

pf->test(); 
011E146D  mov        eax,dword ptr [pf] 
011E1470  mov        edx,dword ptr [eax] 
011E1472  mov        esi,esp 
011E1474  mov        ecx,dword ptr [pf] 
011E1477  mov        eax,dword ptr [edx] 
011E1479  call        eax  <------------------------- 分支预测失效 
011E147B  cmp        esi,esp 
011E147D  call        @ILT+355(__RTC_CheckEsp) (11E1168h)    

此兄接着回答道“说到流水线,penalty基本上都是因为气泡(也就是分支指令造成预取失效),知道这个以后碰到了就不会再卡壳了。虽然引入流水线(流水线其实是 RISC最初使用的),极大提高了效率,流水线不是越长越好。像P4,几十级流水线,频率虽高,但是性能不好,很大原因就是因为流水线实在臭长。有兴趣可 以去看看CPU怎么做分支预测,乱序执行的。”
//////////////////////////////////
还是贴上原帖的地址吧 http://topic.csdn.net/u/20081031/12/06d0e218-8aab-4203-850c-9e6b76099c09.html
由此还引申出一个问题 虚函数在编译器里是怎么工作的
 
 
 
 
C++虚函数表面试汇总
2011-09-02 12:16

一般来说,对于开发者我们只需要知道虚函数的使用方法,以及虚函数表的存在即可。但面试时往往会遇到更细节的问题,比如让你实现一个虚函数机制,虽然不太实用,总归了解些底层知识也是件好事。但如果有人苦苦相逼一定要拿这个刷人,你就去骂他吧,你才是写编译器的,你们全家都是写编译器的。唉,我有些失态了...

1. 虚函数与虚函数表基本知识

这里有一篇介绍,只需看前两页,各种配图,很形象:http://dev.yesky.com/208/8061708.shtml

这篇文章则更精练,只需看第一段就好:http://blog.csdn.net/jiangnanyouzi/article/details/3720807

总的来说,每一个拥有virtual function的类实例化对象时,都会额外申请一块内存存储虚函数表存储所有虚函数地址,并在对象某个位置存储一个vptr指针指向该表起始地址。这个指针具体放在什么位置,虚函数表怎么组织,怎么索引各个虚函数,这些都是编译器在编译期间决定的,在不同编译环境下不见得相同。

2. 多态子类的调用顺序 -- 为什么不要在构造函数中调用虚函数

原因是,在子类的构造函数执行时,虚函数表还没有被子类覆盖,换句话说,此时调用的函数是当前类的函数,虚函数机制在构造函数中无法触发。其原因在于子类构造时各个初始化步骤的调用顺序:

全部推演过程见此:http://saturnman.blog.163.com/blog/static/557611201081421344244/

直接摘录构造顺序:

1.构造子类构造函数的参数

2.子类调用基类构造函数

3.基类设置vptr

4.基类初始化列表内容进行构造

5.基类函数体调用

6.子类设置vptr

7.子类初始化列表内容进行构造

8.子类构造函数体调用

(注意一点,初始化列表内的数据不按书写顺序,而是按类内部的定义顺序)

析构的顺序恰好相反,所以也不要在析构函数中调用虚函数,那样也是没有意义的。

3. 如何去验证虚函数表的存在

其实在第一个链接里已经有了示例程序。

如果你看不懂函数指针,请看这里:http://hi.baidu.com/homonia/blog/item/90b7a72c49c521ea8a1399e2.html

4. 为什么构造函数不能是虚函数

从设计理念上说,构造函数不需要是虚函数;从当前vptr的实现机制上说,无法实现虚的构造函数。

详细可见这里:http://www.diybl.com/course/3_program/c++/cppxl/2008320/105849.html

 原文:http://hi.baidu.com/hehehehello/blog/item/6f0d2f3443bb26205bb5f507.html

 
原文地址:https://www.cnblogs.com/bizhu/p/2512316.html