C++虚函数机制（转）

C++的虚函数（Virtual Function）是通过一张虚函数表（Virtual Table）来实现的。简称为V-Table。在这个表中，主是要一个类的虚函数的地址表，这张表解决了继承、覆盖的问题，保证其容真实反应实际的函数。这样，在有虚函数的类的实例中这个表被分配在了这个实例的内存中，所以，当我们用父类的指针来操作一个子类的时候，这张虚函数表就显得由为重要了，它就像一个地图一样，指明了实际所应该调用的函数。

1． 无继承的情况

#include <iostream> using namespace std; class Base { public: virtual void f() { cout << "Base::f()" << endl; } virtual void g() { cout << "Base::g()" << endl; } virtual void h() { cout << "Base::h()" << endl; } }; int main() { typedef void (*Fun)(); Base *b = new Base; cout << *(int*)(&b) << endl; //虚函数表的地址存放在对象最开始的位置 Fun funf = (Fun)(*(int*)*(int*)b); Fun fung = (Fun)(*((int*)*(int*)b + 1)); Fun funh = (Fun)(*((int*)*(int*)b + 2));

funf(); fung(); funh();

cout << (Fun)(*((int*)*(int*)b + 3)); // 最后一个位置为0，表明虚函数表的结束 return 0; }

注意：在上面这个图中，虚函数表中最后一个节点相当于字符串的结束符，其标志了虚函数表的结束，在Codeblocks下打印为0。

2． 继承，无虚函数覆盖的情形

#include <iostream> using namespace std; class Base { public: virtual void f() { cout << "Base::f()" << endl; } virtual void g() { cout << "Base::g()" << endl; } virtual void h() { cout << "Base::h()" << endl; } }; class Derive: public Base { virtual void f1() { cout << "Derive::f1()" << endl; } virtual void g1() { cout << "Derive::g1()" << endl; } virtual void h1() { cout << "Derive::h1()" << endl; } }; int main() { typedef void (*Fun)(); Base *b = new Derive; cout << *(int*)b << endl; Fun funf = (Fun)(*(int*)*(int*)b); Fun fung = (Fun)(*((int*)*(int*)b + 1)); Fun funh = (Fun)(*((int*)*(int*)b + 2)); Fun funf1 = (Fun)(*((int*)*(int*)b + 3)); Fun fung1 = (Fun)(*((int*)*(int*)b + 4)); Fun funh1 = (Fun)(*((int*)*(int*)b + 5));

funf(); // Base::f() fung(); // Base::g() funh(); // Base::h() funf1(); // Derive::f1() fung1(); // Derive::g1() funh1(); // Derive::h1() cout << (Fun)(*((int*)*(int*)b + 6)); return 0; }

从上表可以发现：

1．虚函数按照其声明顺序放于表中。

2．父类的虚函数在子类的虚函数前面。

3． 继承，虚函数覆盖的情形

#include <iostream> using namespace std; class Base { public: virtual void f() { cout << "Base::f()" << endl; } virtual void g() { cout << "Base::g()" << endl; } virtual void h() { cout << "Base::h()" << endl; } }; class Derive: public Base { virtual void f() { cout << "Derive::f()" << endl; } virtual void g1() { cout << "Derive::g1()" << endl; } virtual void h1() { cout << "Derive::h1()" << endl; } }; int main() { typedef void (*Fun)(); Base *b = new Derive; cout << *(int*)b << endl; Fun funf = (Fun)(*(int*)*(int*)b); Fun fung = (Fun)(*((int*)*(int*)b + 1)); Fun funh = (Fun)(*((int*)*(int*)b + 2)); Fun fung1 = (Fun)(*((int*)*(int*)b + 3)); Fun funh1 = (Fun)(*((int*)*(int*)b + 4));

funf(); // Derive::f() fung(); // Base::g() funh(); // Base::h() fung1(); // Derive::g1() funh1(); // Derive::h1() cout << (Fun)(*((int*)*(int*)b + 5)); return 0; }

从上表可以看出：

1．覆盖的f()函数被放到了虚表中原来父类虚函数的位置。

2．没有被覆盖的函数依旧。

3．可通过获取获取成员函数指针来调用成员函数（即使是private类型的），带来一定安全性的影响。

4． 多继承的情形

#include <iostream> using namespace std; class Base1 { public: virtual void f() { cout << "Base1::f()" << endl; } virtual void g() { cout << "Base1::g()" << endl; } virtual void h() { cout << "Base1::h()" << endl; } }; class Base2 { public: virtual void f() { cout << "Base2::f()" << endl; } virtual void g() { cout << "Base2::g()" << endl; } virtual void h() { cout << "Base2::h()" << endl; } }; class Base3 { public: virtual void f() { cout << "Base3::f()" << endl; } virtual void g() { cout << "Base3::g()" << endl; } virtual void h() { cout << "Base3::h()" << endl; } }; class Derive: public Base1,public Base2, public Base3 { virtual void f() { cout << "Derive::f()" << endl; } virtual void g1() { cout << "Derive::g1()" << endl; } }; int main() { typedef void (*Fun)(); Derive d; Base1 *b1 = &d; Base2 *b2 = &d; Base3 *b3 = &d;

b1->f(); //Derive::f() b2->f(); //Derive::f() b3->f(); //Derive::f() b1->g(); //Base1::g() b2->g(); //Base2::g() b3->g(); //Base3::g() Fun b1fun = (Fun)(*(int*)*(int*)b1); Fun b2fun = (Fun)(*(int*)*((int*)b1+1)); Fun b3fun = (Fun)(*(int*)*((int*)b1+2)); b1fun(); // Derive::f() b2fun(); // Derive::f() b3fun(); // Derive::f() return 0; }

从上表可以看出：

1．每个父类都有自己的虚表。

2．子类的成员函数被放到了第一个父类的表中。（所谓的第一个父类是按照声明顺序来判断的）

3．对于多继承无虚函数覆盖的情况，布局与上图类似(Derive的位置对应Base)。

http://blog.chinaunix.net/uid-20196318-id-28833.html

补充：

今天在c++坛子里瞎逛，看到精华坛里在讨论“为什么虚函数效率低”的问题，
××楼主回答面试官说“跟cpu流水线执行效率有关”
××某人回答“因为虚函数需要一次间接的寻址... 而一般的函数可以在编译时定位到函数的地址,虚函数(动态类型调用)是要根据某个指针定位到函数的地址. ”
××“虚函数有个虚函数表，而且会传一个index索引~！会间接寻址！”
××“流水线执行的话,和"命中率"有关吧. 也就是说在流水线后端,已经译码成功的,和正在执行的代码的后继是一样的. 否则流水线会中断,也就是说在后端做的是无效的,需要重新译码.”
搞笑的是以下人的回复：
××“的确，计算机程序效率说到底和计算机指令流水线息息相关（还和缓存命中率有关）。但是，把虚函数效率低的原因解释到流水线这一层，是极其变态的，这个考官很可能是在卖弄自己的水平而已。”
××“楼主以后你要是遇到这种考官，你和他谈与非逻辑门，硅锗原子的组成和爱因斯坦相对论对虚函数的影响，绝对震惊四座！”
××“说是因为流水线执行的原因，根本与问题不着边际。或者应该说影响流水线执行是效率低的无数原因中的一种才好。”
××“首先是由this指向查找虚函数表,然后找到相应的虚函数地址
比非虚函数多查找一次
如果是(多继承)基类指针指向派生类对象的话,有可能会涉及this指针的调整
比如先访问基类的成员数据再访问派生类的析构函数就要进行一次this指针的调整
具体可以参见 insied the c++ object model的多重继承下的virtual functions ”
××“一些C++的书籍有明确的说明，针对类的虚函数的机制，如果有虚函数的话，编译器会为类增加一个虚函数表（VBL），当在动态执行程序时，会到该虚函数表中寻找函数。多增加了一个过程，效率肯定会低一些，但带来了运行时的多态。”
××“流水线貌似说的是 CPU执行代码的提前取指令吧
虚函数效率低是因为执行过程中会跳转两次（首先找到对象的函数表，其次通过该函数表中存的虚函数表地址找到真正的执行地址），这样CPU运行的时候会跳转两次，而普通函数只跳一次。CPU每跳转一次，预取指令基本上就要作废很多，所以效率会很低。”
/////////////////////////////////////最后得分者
和流水线相关是说得通的，究其原因还是因为存在动态跳转，这会导致分支预测失败，流水线排空。

设想一下，如果说不是虚函数，那么在编译时期，其相对地址是确定的，编译器可以直接生成jmp/invoke指令；
如果是虚函数，多出来的一次查找vtable所带来的开销，倒是次要的，关键在于，这个函数地址是动态的，譬如
取到的地址在eax里，则在call eax之后的那些已经被预取进入流水线的所有指令都将失效。流水线越长，一次分支预测失败的代价也就越大。

pf->test();
011E146D mov eax,dword ptr [pf]
011E1470 mov edx,dword ptr [eax]
011E1472 mov esi,esp
011E1474 mov ecx,dword ptr [pf]
011E1477 mov eax,dword ptr [edx]
011E1479 call eax <------------------------- 分支预测失效
011E147B cmp esi,esp
011E147D call @ILT+355(__RTC_CheckEsp) (11E1168h)

此兄接着回答道“说到流水线，penalty基本上都是因为气泡（也就是分支指令造成预取失效），知道这个以后碰到了就不会再卡壳了。虽然引入流水线（流水线其实是 RISC最初使用的），极大提高了效率，流水线不是越长越好。像P4，几十级流水线，频率虽高，但是性能不好，很大原因就是因为流水线实在臭长。有兴趣可以去看看CPU怎么做分支预测，乱序执行的。”
//////////////////////////////////
还是贴上原帖的地址吧 http://topic.csdn.net/u/20081031/12/06d0e218-8aab-4203-850c-9e6b76099c09.html
由此还引申出一个问题虚函数在编译器里是怎么工作的

http://blog.csdn.net/metalkittie/article/details/3281916

C++虚函数表面试汇总

2011-09-02 12:16

一般来说，对于开发者我们只需要知道虚函数的使用方法，以及虚函数表的存在即可。但面试时往往会遇到更细节的问题，比如让你实现一个虚函数机制，虽然不太实用，总归了解些底层知识也是件好事。但如果有人苦苦相逼一定要拿这个刷人，你就去骂他吧，你才是写编译器的，你们全家都是写编译器的。唉，我有些失态了...

1. 虚函数与虚函数表基本知识

这里有一篇介绍，只需看前两页，各种配图，很形象：http://dev.yesky.com/208/8061708.shtml

这篇文章则更精练，只需看第一段就好：http://blog.csdn.net/jiangnanyouzi/article/details/3720807

总的来说，每一个拥有virtual function的类实例化对象时，都会额外申请一块内存存储虚函数表存储所有虚函数地址，并在对象某个位置存储一个vptr指针指向该表起始地址。这个指针具体放在什么位置，虚函数表怎么组织，怎么索引各个虚函数，这些都是编译器在编译期间决定的，在不同编译环境下不见得相同。

2. 多态子类的调用顺序 -- 为什么不要在构造函数中调用虚函数

原因是，在子类的构造函数执行时，虚函数表还没有被子类覆盖，换句话说，此时调用的函数是当前类的函数，虚函数机制在构造函数中无法触发。其原因在于子类构造时各个初始化步骤的调用顺序：

全部推演过程见此：http://saturnman.blog.163.com/blog/static/557611201081421344244/

直接摘录构造顺序：

1．构造子类构造函数的参数

2．子类调用基类构造函数

3．基类设置vptr

4．基类初始化列表内容进行构造

5.基类函数体调用

6.子类设置vptr

7.子类初始化列表内容进行构造

8.子类构造函数体调用