C++ 虚函数详解

这篇文章主要是转载的http://blog.csdn.net/haoel/article/details/1948051这篇文章，其中又加入了自己的理解和难点以及疑问的解决过程，对难懂的地方进行了一些必要的解释注释，当然对错误也进行了纠正。

前言

　　C++中的虚函数的作用主要是实现了多态的机制。关于多态，简而言之就是用父类型别的指针指向其子类的实例，然后通过父类的指针调用实际子类的成员函数。这种技术可以让父类的指针有“多种形态”，这是一种泛型技术。所谓泛型技术，说白了就是试图使用不变的代码来实现可变的算法。比如：模板技术，RTTI技术，虚函数技术，要么是试图做到在编译时决议，要么试图做到运行时决议。

　　关于虚函数的使用方法，我在这里不做过多的阐述。大家可以看看相关的C++的书籍。在这篇文章中，我只想从虚函数的实现机制上面为大家一个清晰的剖析。当然，相同的文章在网上也出现过一些了，但我总感觉这些文章不是很容易阅读，大段大段的代码，没有图片，没有详细的说明，没有比较，没有举一反三。不利于学习和阅读，所以这是我想写下这篇文章的原因。也希望大家多给我提意见。言归正传，让我们一起进入虚函数的世界。

虚函数表

　　对C++ 了解的人都应该知道虚函数（Virtual Function）是通过一张虚函数表（Virtual Table）来实现的。简称为V-Table。在这个表中，主是要一个类的虚函数的地址表，这张表解决了继承、覆盖的问题，保证其容真实反应实际的函数。这样，在有虚函数的类的实例中这个表被分配在了这个实例的内存中，所以，当我们用父类的指针来操作一个子类的时候，这张虚函数表就显得由为重要了，它就像一个地图一样，指明了实际所应该调用的函数。

　　这里我们着重看一下这张虚函数表。C++的编译器应该是保证虚函数表的指针存在于对象实例中最前面的位置（这是为了保证取到虚函数表的有最高的性能——如果有多层继承或是多重继承的情况下）。这意味着我们通过对象实例的地址得到这张虚函数表，然后就可以遍历其中函数指针，并调用相应的函数。听我扯了那么多，我可以感觉出来你现在可能比以前更加晕头转向了。没关系，下面就是实际的例子，相信聪明的你一看就明白了。

　　假设我们有这样的一个类：

1 class Base
2 {
3     public:
4     virtual void f(){cout<<"Base::f"<<endl;}
5     virtual void g(){cout<<"Base::g"<<endl;}
6     virtual void h(){cout<<"Base::h"<<endl;}
7 };

按照上面的说法，我们可以通过Base的实例来得到虚函数表。下面是实际例程：

 1 typedef void (*Fun)(void);
 2     
 3 Base b;
 4 Fun pFun=NULL;
 5 cout<<"b对象的地址："<<(int*)&b<<endl;
 6 cout<<"虚函数表地址的地址："<<*(int*)(&b)<<endl; 
 7 cout<<"虚函数表--第一个函数地址："<<(int*)*(int*)(&b)<<endl;
 8 //调用第一个虚函数 
 9 pFun=(Fun)*((int*)*(int*)(&b));
10 pFun();

这里简单说一下第一行代码的意思，如果懂得人就不用看了。

typedef void (*Fun)(void);

这段代码是定义了一个指向参数为空，返回值为空的函数的指针类型。

类似于 typedef int length;

实际运行经果如下（Win7 64位操作系统）：

Dev C++(g++编译器环境下)：

1 b对象的地址：0x28ff30
2 虚函数表地址的地址：4466368
3 虚函数表--第一个函数地址：0x4426c0
4 Base::f

Visual C++6.0:

1 b对象的地址：0018FF44
2 虚函数表地址的地址：4649100
3 虚函数表--第一个函数地址：0046F08C
4 Base::f

如果前面的理论正确，那么第二行和第三行的结果应该是相等的，这里涉及到地址和指针在内存里的表示方，我们可以验证一下是否相等。

1 int i=4466368;
2 printf("i=%d %08x
",i,i);
3 int j=4649100;
4 printf("j=%d %08x
",j,j);

输出结果：

i=4466368 004426c0
j=4649100 0046f08c

可以看到是相等的，这说明C++的编译器应该是保证虚函数表的指针存在于对象实例中最前面的位置这个猜测是正确的。通过这个示例，我们就可以知道如果要调用Base::g()和Base::h()，其代码如下：

1 (Fun)*((int*)*(int*)(&b)+0);  // Base::f()
2 (Fun)*((int*)*(int*)(&b)+1);  // Base::g()
3 (Fun)*((int*)*(int*)(&b)+2);  // Base::h()

简要解释一下(Fun)*((int*)*(int*)(&b))的意思：

&b                      //取b的地址 
(int*)&b                //把b的地址转化为整型地址 
*(int*)&b               //b的地所指向的地方的内容(也就是虚拟表的首地址) 
(int*)*(int*)&b         //把虚拟表的首地址转化为整型地址 
*(int*)*(int*)&b        //首地址指向的内容(也就是f()的首地址) 
(Fun)*(int*)*(int*)&b   //将f()首地址转化为Fun型指针

画个图会更明白一些。如下所示：

注意：在上面这个图中，我在虚函数表的最后多加了一个结点，这是虚函数表的结束结点，就像字符串的结束符“/0”一样，其标志了虚函数表的结束。这个结束标志的值在不同的编译器下是不同的。在WinXP+VS2003下，这个值是NULL。而在Ubuntu 7.10 + Linux 2.6.22 + GCC 4.1.3下（作者是这么说的，没亲自验证过），这个值是如果1，表示还有下一个虚函数表，如果值是0，表示是最后一个虚函数表。

　　下面，我将分别说明“无覆盖”和“有覆盖”时的虚函数表的样子。没有覆盖父类的虚函数是毫无意义的。我之所以要讲述没有覆盖的情况，主要目的是为了给一个对比。在比较之下，我们可以更加清楚地知道其内部的具体实现。

一般继承（无虚函数覆盖）

下面，再让我们来看看继承时的虚函数表是什么样的。假设有如下所示的一个继承关系：

请注意，在这个继承关系中，子类没有重载任何父类的函数。那么，在派生类的实例中，对于实例：Derive d; 的虚函数表如下：

我们可以看到下面几点：

1）虚函数按照其声明顺序放于表中。

2）父类的虚函数在子类的虚函数前面。

我相信聪明的你一定可以参考前面的那个程序，来编写一段程序来验证，代码如下(Base定义在前面)

 1 class Derive:public Base
 2     {
 3         public:
 4             virtual void f1(){cout<<"Derive::f"<<endl;}
 5             virtual void g1(){cout<<"Derive::g"<<endl;}
 6             virtual void h1(){cout<<"Derive::h"<<endl;}
 7     };
 8     
 9     typedef void(*Fun)(void);
10     
11     Derive d;
12     Fun pFun=NULL;
13 
14     //调用虚函数 
15     for (int i=0;i<6;i++)
16     {
17         pFun=(Fun)*((int*)*(int*)(&d)+i);
18         pFun();
19     }

View Code

输出结果：

1 Base::f
2 Base::g
3 Base::h
4 Derive::f
5 Derive::g
6 Derive::h

一般继承（有虚函数覆盖）

　　覆盖父类的虚函数是很显然的事情，不然，虚函数就变得毫无意义。下面，我们来看一下，如果子类中有虚函数重载了父类的虚函数，会是一个什么样子？假设，我们有下面这样的一个继承关系。

为了让大家看到被继承过后的效果，在这个类的设计中，我只覆盖了父类的一个函数：f()。那么，对于派生类的实例，其虚函数表会是下面的一个样子：

我们从表中可以看到下面几点，

1）覆盖的f()函数被放到了虚表中原来父类虚函数的位置。

2）没有被覆盖的函数依旧。

可以验证一下，代码如下：

 1 class Derive:public Base
 2     {
 3         public:
 4             virtual void f(){cout<<"Derive::f"<<endl;}
 5             virtual void g1(){cout<<"Derive::g"<<endl;}
 6             virtual void h1(){cout<<"Derive::h"<<endl;}
 7     };
 8     
 9     typedef void(*Fun)(void);
10     
11     Derive d;
12     Fun pFun=NULL;
13     
14     //调用虚函数 
15     for (int i=0;i<5;i++)
16     {
17         pFun=(Fun)*((int*)*(int*)(&d)+i);
18         pFun();
19     }

View Code

结果如下：

Derive::f
Base::g
Base::h
Derive::g
Derive::h

这样，我们就可以看到对于下面这样的程序，

1 Base *b=new Derive();
2 b->f();

输出结果为：

Derive::f

　由b所指的内存中的虚函数表的f()的位置已经被Derive::f()函数地址所取代，于是在实际调用发生时，是Derive::f()被调用了。这就实现了多态。

多重继承（无虚函数覆盖）

　　下面，再让我们来看看多重继承中的情况，假设有下面这样一个类的继承关系。注意：子类并没有覆盖父类的函数。

对于子类实例中的虚函数表，是下面这个样子：

代码验证一下上面这幅图的正确性：

 1 class Base1
 2     {
 3         public:
 4             virtual void f(){cout<<"Base1::f"<<endl;}
 5             virtual void g(){cout<<"Base1::g"<<endl;}
 6             virtual void h(){cout<<"Base1::h"<<endl;}
 7     };
 8 
 9     class Base2
10     {
11         public:
12             virtual void f(){cout<<"Base2::f"<<endl;}
13             virtual void g(){cout<<"Base2::g"<<endl;}
14             virtual void h(){cout<<"Base2::h"<<endl;}
15     };
16 
17     class Base3
18     {
19         public:
20             virtual void f(){cout<<"Base3::f"<<endl;}
21             virtual void g(){cout<<"Base3::g"<<endl;}
22             virtual void h(){cout<<"Base3::h"<<endl;}
23     };
24     class Derive:public Base1,public Base2,public Base3
25     {
26         public:
27             virtual void f1(){cout<<"Derive::f"<<endl;}
28             virtual void g1(){cout<<"Derive::g"<<endl;}
29             virtual void h1(){cout<<"Derive::h"<<endl;}
30     };
31 
32     typedef void(*Fun)(void);
33 
34     Derive d;
35     Fun pFun=NULL;
36     int* dPoint=(int*)&d;
37     cout<<"Base1虚函数表首地址："<<dPoint<<endl;
38     int* pBase=dPoint;//Base虚函数表首地址
39     for (int j=0;j<3;j++)
40     {
41         pBase=dPoint+j;//分别得到Base1,Base2,Base3;
42         int table_size;//虚拟表的大小
43         if(j==0) 
44             table_size=6;//Base1大小是6
45         else
46             table_size=3;//Base2,Base3大小是3
47         for (int i=0;i<table_size;i++)
48         {
49             pFun=(Fun)*((int*)*pBase+i);
50             pFun();
51         }
52          printf("
");
53     }

View Code

输出结果：

 1 Base1虚函数表首地址：0018FF3C
 2 Base1::f
 3 Base1::g
 4 Base1::h
 5 Derive::f
 6 Derive::g
 7 Derive::h
 8 
 9 Base2::f
10 Base2::g
11 Base2::h
12 
13 Base3::f
14 Base3::g
15 Base3::h

我们可以看到：

1）每个父类都有自己的虚表。

2）子类的成员函数被放到了第一个父类的表中。（所谓的第一个父类是按照声明顺序来判断的）

这样做就是为了解决不同的父类类型的指针指向同一个子类实例，而能够调用到实际的函数。

多重继承（有虚函数覆盖）

下面我们再来看看，如果发生虚函数覆盖的情况。

下图中，我们在子类中覆盖了父类的f()函数。

下面是对于子类实例中的虚函数表的图：

我们可以看见，三个父类虚函数表中的f()的位置被替换成了子类的函数指针。这样，我们就可以任一静态类型的父类来指向子类，并调用子类的f()了。如：

 1     class Derive:public Base1,public Base2,public Base3
 2     {
 3         public:
 4                 virtual void f(){cout<<"Derive::f"<<endl;}
 5                 virtual void g1(){cout<<"Derive::g"<<endl;}
 6                 virtual void h1(){cout<<"Derive::h"<<endl;}
 7     };
 8 
 9     typedef void(*Fun)(void);
10     
11     Derive d;
12     Fun pFun=NULL;
13     int* dPoint=(int*)&d;
14     cout<<"Base1虚函数表首地址："<<dPoint<<endl;
15     int* pBase=dPoint;//Base虚函数表首地址
16     for (int j=0;j<3;j++)
17     {
18         pBase=dPoint+j;//分别得到Base1,Base2,Base3;
19         int table_size;//虚拟表的大小
20         if(j==0) 
21             table_size=5;//Base1大小是6
22         else
23             table_size=3;//Base2,Base3大小是3
24         for (int i=0;i<table_size;i++)
25         {
26             pFun=(Fun)*((int*)*pBase+i);
27             pFun();
28         }
29         printf("
");
30     }
31     
32     Base1 *b1 = &d;
33     Base2 *b2 = &d;
34     Base3 *b3 = &d;
35     b1->f(); //Derive::f()
36     b2->f(); //Derive::f()
37     b3->f(); //Derive::f()
38     
39     b1->g(); //Base1::g()
40     b2->g(); //Base2::g()
41     b3->g(); //Base3::g()

View Code

输出结果如下图：

Base1虚函数表首地址：0018FF3C
Derive::f
Base1::g
Base1::h
Derive::g
Derive::h

Derive::f
Base2::g
Base2::h

Derive::f
Base3::g
Base3::h

Derive::f
Derive::f
Derive::f
Base1::g
Base2::g
Base3::g

View Code

安全性

　　每次写C++的文章，总免不了要批判一下C++。这篇文章也不例外。通过上面的讲述，相信我们对虚函数表有一个比较细致的了解了。水可载舟，亦可覆舟。下面，让我们来看看我们可以用虚函数表来干点什么坏事吧。

一、通过父类型的指针访问子类自己的虚函数

我们知道，子类没有重载父类的虚函数是一件毫无意义的事情。因为多态也是要基于函数重载的。虽然在上面的图中我们可以看到Base1的虚表中有Derive的虚函数，但我们根本不可能使用下面的语句来调用子类的自有虚函数：

 1 class Base
 2     {
 3     public:
 4         virtual void f(){cout<<"Base::f"<<endl;}
 5         virtual void g(){cout<<"Base::g"<<endl;}
 6         virtual void h(){cout<<"Base::h"<<endl;}
 7     };
 8     
 9     class Derive:public Base
10     {
11     public:
12         virtual void f1(){cout<<"Derive::f"<<endl;}
13         virtual void g1(){cout<<"Derive::g"<<endl;}
14         virtual void h1(){cout<<"Derive::h"<<endl;}
15     };
16     
17     Base *b=new Derive();
18     b->f1();

View Code

error C2039: 'f1' : is not a member of 'Base'

任何妄图使用父类指针想调用子类中的未覆盖父类的成员函数的行为都会被编译器视为非法，所以，这样的程序根本无法编译通过。但在运行时，我们可以通过指针的方式访问虚函数表来达到违反C++语义的行为。有兴趣可以看看下面的代码：

 1 class Base
 2     {
 3     public:
 4         virtual void f(){cout<<"Base::f"<<endl;}
 5         virtual void g(){cout<<"Base::g"<<endl;}
 6         virtual void h(){cout<<"Base::h"<<endl;}
 7     };
 8     
 9     class Derive:public Base
10     {
11     public:
12         virtual void f1(){cout<<"Derive::f"<<endl;}
13         virtual void g1(){cout<<"Derive::g"<<endl;}
14         virtual void h1(){cout<<"Derive::h"<<endl;}
15     };
16     typedef void (*Fun)(void);
17     Fun pFun=NULL;
18     
19     Base* b=new Derive();
20     int* pBase=(int*)b;
21     pFun=(Fun)*((int*)*pBase+3);
22     pFun();

View Code

输出结果为：

Derive::f

写到这也就结束了，当然我也没完全按照作者原文里来，这里的代码都是我亲自实现和验证过的，详细代码我也附在了文字后面，大家可以选择性的看看，也可以copy下来自己验证看看是否争取，总之感觉原作者的那篇文章还是写的相当不错的。