C++11中的技术剖析(萃取技术)

从C++98开始萃取在泛型编程中用的特别多，最经典的莫过于STL。STL中的拷贝首先通过萃取技术识别是否是已知并且支持memcpy类型，如果是则直接通过内存拷贝提高效率，否则就通过类的重载=运算符，相比之下就效率就低了一些。所以说有些做STL优化的程序员为了追求效率就直接改写STL以便于支持可以通过memcpy的结构体，其根本就是利用了C++的萃取识别了自定义结构体。

C++11增加了移动拷贝，这使得很多时候程序执行效率大幅度提升，与之而来的左值右值总是让初学者摸不清楚头脑，如果遇到各种类型转换只怕是恶心的只想放弃了。但是就我个人而言，因为之前学过苹果的Object-C,曾经一度很羡慕OC中的各种炫酷的功能，但是后来看过C++11，感觉OC有些方面也不外如是。

闲话到此为止了，这里通过一个万能引用的例子，讲解一下C++11中一部分萃取技术。

对于函数：

template<typename T>
void logAndAdd(T &&t)
{
	if (std::is_same<T, int&>::value)
	{
		printf("左值引用类型
");
	}
	else if (std::is_same<T, int>::value)
	{
		printf("右值引用类型
");
	}
}

我们知道，t是一个万能引用类型，因为这里涉及到类型推导，否则的话就是典型的右值引用。对于万能引用，如果传入的是右值，那么通过引用折叠，最终传入的就是T&&类型，如果传入的是左值，那么得到的就是T&类型。

如果按照以下方式调用上面函数，就会打出相应的结果，具体读者可以自己调试：

int nA0 = 0;

int &nA1 = nA0;
logAndAdd(nA1);  // 传入是左值，最终转换成左值引用

logAndAdd(1);   // 传入是右值，最终转换成右值引用

is_same是个什么东西？其实这只是个很简单很简单的模板，实现如下：

template<class _Ty1,class _Ty2>
struct is_same : false_type
{
};

template<class _Ty1>
struct is_same<_Ty1, _Ty1> : true_type
{
};

template<class _Ty,_Ty _Val>
struct integral_constant
{
     static constexpr _Ty value = _Val;
     typedef _Ty value_type;
     typedef integral_constant<_Ty, _Val> type;

     constexpr operator value_type() const _NOEXCEPT
     {	
	return (value);
     }

     constexpr value_type operator()() const _NOEXCEPT
     {
	return (value);
     }
};

typedef integral_constant<bool, true> true_type;
typedef integral_constant<bool, false> false_type;

从中可以看出，_Ty1和_Ty2相等时构造的则是第二个结构体，反之则是第一个结构体。而所谓的返回值则是true_type或者false_type。当std::is_same<T, int&>其值为true_type时，其实就是构造了一个integral_constant<bool, true>临时对象，而std::is_same<T, int&>::value的本质无非就是integral_constant<bool, true>构造的这个临时对象中取出value这个值，而value在本例中的定义就是static constexpr _Ty value = _Val;其中_Ty为bool型。

也就是说std::is_same<T, int&>::value只是通过T, int&类型对比是否一致，然后根据结果构造了一个临时对象，通过这个对象赋予初始类型和数值<bool, true>，从而返回了一个bool类型的值，再通过这个bool值的结果决定程序如何运行下去。

下面再看一个例子

template<typename T>
void logAndAddImp(T&& name, std::true_type)
{
	printf("logAndAddImp true_type
");
}

template<typename T>
void logAndAddImp(T&& name, std::false_type)
{
	printf("logAndAddImp false_type
");
}

template<typename T>
void logAndAdd(T &&t)
{
	if (std::is_same<std::remove_reference<T>::type, int>::value)
	{
		printf("T=int
");
	}
	else if (std::is_same<std::remove_reference<T>::type, float>::value)
	{
		printf("T=float
");
	}

	logAndAddImp(std::forward<T>(t), std::is_integral<typename std::remove_reference<T>::type>());
}

这里首先说一下std::is_integral，从字面意义上说，这里就是和之前判断是否同一类型一样。但是判断首先会remove_reference移除原来类型上的引用属性，const属性和volatile属性。也就是说，不管是int类型，int*，还是const int都会被判断成int类型。源码很简单如下（因为篇幅，这里只复制一部分）

template<class _Ty>
struct _Is_integral: false_type
{	
};

template<>
struct _Is_integral<char32_t>: true_type
{
};

template<>
struct _Is_integral<_LONGLONG>: true_type
{
};

template<>
struct _Is_integral<_ULONGLONG>: true_type
{	
};

true_type和false_type其实和之前一样，而
std::is_integral<typename std::remove_reference<T>::type>()最终得到的结果，也和之前is_same一样，是一个bool型的变量。但是从这里可以看到，只要是_Is_integral特化过的类型都会返回true，否则就为假。

这类萃取在实际代码中非常之高效，以VS2015为例，编译以下代码：

template<typename T>
void logAndAdd(T &&t)
{
	if (std::is_same<std::remove_reference<T>::type, int>::value)
	{
		printf("T=int
");
	}
	else if (std::is_same<std::remove_reference<T>::type, float>::value)
	{
		printf("T=float
");
	}
}


int main()
{
	const int i = 0;
	
	int nA0 = 0;
	//logAndAdd(nA0);

	int &nA1 = nA0;
	logAndAdd(nA1);

	logAndAdd(1);

	const int &nA2 = 0;
	logAndAdd(nA2);

	volatile int nA3 = 0;
	logAndAdd(nA3);

	float t = 0.1f;
	logAndAdd(t);

	getchar();
	return 0;
}

　最终得到的release版本exe，反汇编如下所示：

.text:00401000 ; int __cdecl main()
.text:00401000 _main           proc near               ; CODE XREF: __scrt_common_main_seh+F4p
.text:00401000
.text:00401000 nA0             = dword ptr -0Ch
.text:00401000 nA3             = dword ptr -8
.text:00401000 var_4           = dword ptr -4
.text:00401000
.text:00401000                 push    ebp
.text:00401001                 mov     ebp, esp
.text:00401003                 sub     esp, 0Ch
.text:00401006                 mov     eax, ___security_cookie
.text:0040100B                 xor     eax, ebp
.text:0040100D                 mov     [ebp+var_4], eax
.text:00401010                 push    offset _Format  ; "T=int
"
.text:00401015                 mov     [ebp+nA0], 0
.text:0040101C                 call    _printf
.text:00401021                 push    offset _Format  ; "T=int
"
.text:00401026                 call    _printf
.text:0040102B                 mov     [ebp+nA3], 0
.text:00401032                 push    offset aTFloat  ; "T=float
"
.text:00401037                 mov     [ebp+nA3], 0
.text:0040103E                 call    _printf
.text:00401043                 add     esp, 0Ch
.text:00401046                 call    ds:__imp__getchar
.text:0040104C                 mov     ecx, [ebp+var_4]
.text:0040104F                 xor     eax, eax
.text:00401051                 xor     ecx, ebp        ; cookie
.text:00401053                 call    @__security_check_cookie@4 ; __security_check_cookie(x)
.text:00401058                 mov     esp, ebp
.text:0040105A                 pop     ebp
.text:0040105B                 retn
.text:0040105B _main           endp

没有任何判断逻辑，纯粹是全部被优化，提取出来需要打印的地方直接printf了，这也是泛型编程一个特别让人着迷的地方。