C++ typeid实现原理

最近看了boost::any类源码,其实现主要依赖typeid操作符。很好奇这样实现的时间和空间开销有多大,决定探一下究竟。

VS2008附带的type_info类只有头文件,没有源文件,声明如下:

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
 
  1. class type_info {  
  2. public:  
  3.     virtual ~type_info();  
  4.     _CRTIMP_PURE bool __CLR_OR_THIS_CALL operator==(const type_info& rhs) const;  
  5.     _CRTIMP_PURE bool __CLR_OR_THIS_CALL operator!=(const type_info& rhs) const;  
  6.     _CRTIMP_PURE int __CLR_OR_THIS_CALL before(const type_info& rhs) const;  
  7.     _CRTIMP_PURE const char* __CLR_OR_THIS_CALL name(__type_info_node* __ptype_info_node = &__type_info_root_node) const;  
  8.     _CRTIMP_PURE const char* __CLR_OR_THIS_CALL raw_name() const;  
  9. private:  
  10.     void *_m_data;  
  11.     char _m_d_name[1];  
  12.     __CLR_OR_THIS_CALL type_info(const type_info& rhs);  
  13.     type_info& __CLR_OR_THIS_CALL operator=(const type_info& rhs);  
  14.     _CRTIMP_PURE static const char *__CLRCALL_OR_CDECL _Name_base(const type_info *,__type_info_node* __ptype_info_node);  
  15.     _CRTIMP_PURE static void __CLRCALL_OR_CDECL _Type_info_dtor(type_info *);  
  16. };  

测试代码:

 

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
 
  1. #include <iostream>  
  2. using namespace std;  
  3.   
  4. class Object  
  5. {  
  6. };  
  7.   
  8. int main()  
  9. {  
  10.     Object obj;  
  11.     cout << "type name:" << typeid(obj).name() << endl;  
  12.     cout << "type raw name:" << typeid(obj).raw_name() << endl;  
  13.     if(typeid(obj) == typeid(Object))  
  14.     {  
  15.         cout << "type is equal" << endl;  
  16.     }  
  17.     else  
  18.     {  
  19.         cout << "type is not equal" << endl;  
  20.     }  
  21.     return 0;  
  22. }  

输出:

type name:class Object
type raw name:.?AVObject@@
type is equal

 

在解释每个函数的实现原理前先开看type_info类的存储方式。

typeid返回的是type_info的引用,这个类不能拷贝,也不能自己构造,所以每个类最多只有一个type_info的数据,这个数据存放在哪里的呢?

用UltraEdit打开exe文件,搜索“Object”,能找到这个字符串。再用PE工具打开这个exe,发现这个字符串属于data节(这是可读可写的全局数据段)。再把有typeid的代码都注释,PE文件中没有了这个字符串。得出一个结论:

编译器会为每一种typeid操作的类型生成一份保存在数据段的type_info数据。

 

这份数据有多大呢?看下面这段代码:

 

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
 
  1. #include <iostream>  
  2. using namespace std;  
  3.   
  4. class Object  
  5. {  
  6. };  
  7.   
  8. int main()  
  9. {  
  10.     const type_info* p = &typeid(Object);  
  11.     cout << p << endl;  
  12.     return 0;  
  13. }  

在cout那一行下断点,查看到p的值为:

再看下这个类的声明,析构函数为virtual类型的,所以p的头四字节为虚函数表。p+4为_m_data,void*类型,四个字节,调试时发现都是0,还不清楚其表示什么。

p+8为_m_d_name,char类型数组,存储的是raw_name,每种类型的raw_name大小不定长,所以数组长度为1。现在type_info的存储结构已经一目了然:

每种类型的type_info数据长度依赖于类型名称,至少9个字节。

现在假设一个复杂的工程里面有50个类型用了typeid操作符,平均每个type_info长度为24,这些数据增加的PE大小为1200B,就1K左右。而现在的PE动辄几十M,所以这点空间开销根本不算什么。

再看看这些函数调用的开销:

  • raw_name函数直接返回_m_d_name的地址,非常快;
  • name函数将_m_d_name存储的字符串解码成实际的名称,也是很快;
  • ==操作符是比较raw_name是否相等,也是很快。

读者可能会有两点疑惑:

  1. 存储的时候为什么不直接存储成name呢?我想最大的原因是节省空间,比如double的raw_name为".N",name为"double"多了四字节。
  2. ==操作符为什么不直接比较两个type_info引用的地址是否相等呢?我也很疑惑,我看汇编码发现它是比较raw_name。

备注:C++并没有规定typeid实现标准,各个编译器可能会不一样,上述分析过程基于VS2008自带的编译器。

总结:typeid带来的时间和空间开销是非常小的,不过使用的时候尽量不要违背开放封闭原则。

http://blog.csdn.net/passion_wu128/article/details/38441633

原文地址:https://www.cnblogs.com/findumars/p/5006171.html