C++基础之强制类型转换

C++中的类型转换分为：隐式类型转换和显式类型转换。

隐式类型转换

关于隐式转换原则，这篇文章中有详细讲解：混合运算中不同数据类型之间的转换原则（C语言），在此简略带过。

1) 算术转换(Arithmetic conversion)

在混合类型的算术表达式中, 最宽的数据类型成为目标转换类型。

int ival = 3;
double dval = 3.14159;
ival + dval;//ival被提升为double类型

2)一种类型表达式赋值给另一种类型的对象

目标类型是被赋值对象的类型。

int *pi = 0; // 0被转化为int *类型
ival = dval; // double->int

3)将一个表达式作为实参传递给函数调用，此时形参和实参类型不一致

目标转换类型为形参的类型。

extern double sqrt(double);
cout << "The square root of 2 is " << sqrt(2) << endl;
//2被提升为double类型：2.0

4)从一个函数返回一个表达式，表达式类型与返回类型不一致

目标转换类型为函数的返回类型。

double difference(int ival1, int ival2) {
    return ival1 - ival2;
    //返回值被提升为double类型
}

显式类型转换

C语言强制类型转换主要用于基础的数据类型间的转换，语法为：

(type-id)expression//OR
type-id(expression)

隐式类型转换是安全的，显式类型转换是有风险的。

为了使潜在风险更加细化，使问题追溯更加方便，使书写格式更加规范，C++对类型转换进行了分类，并新增了四个关键字来予以支持，它们分别是：

关键字	说明
static_cast	用于良性转换，一般不会导致意外发生，风险很低。
const_cast	用于 const 与非 const、volatile 与非 volatile 之间的转换。
reinterpret_cast	高度危险的转换，这种转换仅仅是对二进制位的重新解释，不会借助已有的转换规则对数据进行调整，但是可以实现最灵活的 C++ 类型转换。
dynamic_cast	借助 RTTI，用于类型安全的向下转型（Downcasting）。

这四个关键字的语法格式都是一样的，具体为：

xxx_cast<newType>(expression)

newType 是要转换成的新类型，expression是被转换的表达式。double 转 int 的新旧风格对比：

double scores = 95.5;
int n = (int)scores; //C
int n = static_cast<int>(scores); //C++

static_cast 关键字

static_cast 只能用于良性转换，这样的转换风险较低，一般不会发生什么意外，例如：

原有的自动类型转换，例如short转int、int转double、const转非const、向上转型等；
void指针和具体类型指针之间的转换，例如 void * 转 int * 、 char * 转 void * 等；
有转换构造函数或者类型转换函数的类与其它类型之间的转换，例如double转Complex（调用转换构造函数）、Complex转double（调用类型转换函数）。

需要注意的是，static_cast不能用于无关类型之间的转换，因为这些转换都是有风险的，例如：

两个具体类型指针之间的转换，例如 int * 转 double * 、 Student * 转 int * 等。不同类型的数据存储格式不一样，长度也不一样，用A类型的指针指向B 类型的数据后，会按照A类型的方式来处理数据：如果是读取操作，可能会得到一堆没有意义的值；如果是写入操作，可能会使B类型的数据遭到破坏，当再次以 B类型的方式读取数据时会得到一堆没有意义的值。
int和指针之间的转换。将一个具体的地址赋值给指针变量是非常危险的，因为该地址上的内存可能没有分配，也可能没有读写权限，恰好是可用内存反而是小概率事件。

static_cast也不能用来去掉表达式的const修饰和volatile修饰。换句话说，不能将const/volatile类型转换为非const/volatile类型。

static_cast是“静态转换”的意思，也就是在编译期间转换，转换失败的话会抛出一个编译错误。

示例

#include <iostream>
#include <cstdlib>
using namespace std;

class Complex{
public:
    Complex(double real = 0.0, double imag = 0.0): m_real(real), m_imag(imag){ }
public:
    operator double() const { return m_real; }  //类型转换函数
private:
    double m_real;
    double m_imag;
};

int main(){
    //下面是正确的用法
    int m = 100;
    Complex c(12.5, 23.8);
    long n = static_cast<long>(m);  //宽转换，没有信息丢失
    char ch = static_cast<char>(m);  //窄转换，可能会丢失信息
    int *p1 = static_cast<int*>( malloc(10 * sizeof(int)) );  //将void指针转换为具体类型指针
    void *p2 = static_cast<void*>(p1);  //将具体类型指针，转换为void指针
    double real = static_cast<double>(c);  //调用类型转换函数
   
    //下面的用法是错误的
    float *p3 = static_cast<float*>(p1);  //不能在两个具体类型的指针之间进行转换
    p3 = static_cast<float*>(0X2DF9);  //不能将整数转换为指针类型

    return 0;
}

const_cast 关键字

const_cast比较好理解，它用来去掉表达式的const修饰或volatile修饰。换句话说，const_cast就是用来将const/volatile类型转换为非const/volatile类型。

示例

#include <iostream>
using namespace std;

int main(){
    const int n = 100;
    int *p = const_cast<int*>(&n);
    *p = 234;
    cout << "n = " << n << endl;
    cout << "*p = " << *p << endl;

    return 0;
}
/*output:
n = 100
*p = 234
*/

&n 用来获取n的地址，它的类型为 const int * ，必须使用const_cast 转换为 int * 类型后才能赋值给 int * 类型的p。由于p指向了n，并且n占用的是栈内存，有写入权限，所以可以通过p修改n的值。

编译器优化

为什么通过n和*p输出的值不一样呢？

这是因为C++对常量的处理更像是编译时期的 #define ，是一个值替换的过程，代码中所有使用n的地方在编译期间就被替换成了100（体现在汇编中就是直接在寄存器中写入立即数而非通过访问内存）。换句话说，第8行代码被替换成了： cout << "n = " << 100 << endl; 。这样以来，即使程序在运行期间修改 n 的值，也不会影响 cout 语句了。

使用const_cast进行强制类型转换可以突破 C/C++ 的常量限制，修改常量的值，因此有一定的危险性；但是程序员如果这样做的话，基本上会意识到这个问题，因此也还有一定的安全性。

reinterpret_cast 关键字

reinterpret是“重新解释”的意思，顾名思义，reinterpret_cast这种转换仅仅是对二进制位的重新解释，不会借助已有的转换规则对数据进行调整，非常简单粗暴，所以风险很高。

reinterpret_cast 可以认为是static_cast的一种补充，一些static_cast不能完成的转换，就可以用reinterpret_cast来完成，例如两个具体类型指针之间的转换、int 和指针之间的转换（有些编译器只允许int转指针，不允许反过来）。

示例

#include <iostream>
using namespace std;

class A{
public:
    A(int a = 0, int b = 0): m_a(a), m_b(b){}
private:
    int m_a;
    int m_b;
};

int main(){
    //将 char* 转换为 float*
    char str[]="http://c.biancheng.net";
    float *p1 = reinterpret_cast<float*>(str);
    cout << *p1 << endl;
    //将 int 转换为 int*
    int *p = reinterpret_cast<int*>(100);
    //将 A* 转换为 int*
    p = reinterpret_cast<int*>(new A(25, 96));
    cout << *p << endl;
   
    return 0;
}
/*output:
3.0262e+29
25*/

可以想象，用一个float指针来操作一个char数组是一件多么荒诞和危险的事情，这样的转换方式不到万不得已的时候不要使用。将 A* 转换为 int* ，使用指针直接访问 private成员刺穿了一个类的封装性，更好的办法是让类提供get/set函数，间接地访问成员变量。

dynamic_cast 关键字

dynamic_cast用于在类的继承层次之间进行类型转换，它既允许向上转型（Upcasting），也允许向下转型（Downcasting）。向上转型是无条件的，不会进行任何检测，所以都能成功；向下转型的前提必须是安全的，要借助RTTI进行检测，所有只有一部分能成功。

dynamic_cast与static_cast是相对的，dynamic_cast是“动态转换”的意思，static_cast是“静态转换”的意思。dynamic_cast会在程序运行期间借助RTTI进行类型转换，这就要求基类必须包含虚函数；static_cast在编译期间完成类型转换，能够更加及时地发现错误。

dynamic_cast 的语法格式为：

dynamic_cast <newType> (expression)

newType和expression必须同时是指针类型或者引用类型。换句话说，dynamic_cast只能转换指针类型和引用类型，其它类型（int、double、数组、类、结构体等）都不行。
对于指针，如果转换失败将返回NULL；对于引用，如果转换失败将抛出 std::bad_cast 异常。

1) 向上转型（Upcasting）

向上转型时，只要待转换的两个类型之间存在继承关系，并且基类包含了虚函数（这些信息在编译期间就能确定），就一定能转换成功。因为向上转型始终是安全的，所以 dynamic_cast不会进行任何运行期间的检查，这个时候的 dynamic_cast 和 static_cast 就没有什么区别了。

示例

「向上转型时不执行运行期检测」虽然提高了效率，但也留下了安全隐患：

#include <iostream>
#include <iomanip>
using namespace std;

class Base{
public:
    Base(int a = 0): m_a(a){ }
    int get_a() const{ return m_a; }
    virtual void func() const { }
protected:
    int m_a;
};

class Derived: public Base{
public:
    Derived(int a = 0, int b = 0): Base(a), m_b(b){ }
    int get_b() const { return m_b; }
private:
    int m_b;
};

int main(){
    //情况①
    Derived *pd1 = new Derived(35, 78);
    Base *pb1 = dynamic_cast<Derived*>(pd1);
    cout<< "pd1 = " << pd1 << ", pb1 = " << pb1 << endl;
    cout<< pb1->get_a() << endl;
    pb1->func();

    //情况②
    int n = 100;
    Derived *pd2 = reinterpret_cast<Derived*>(&n);
    Base *pb2 = dynamic_cast<Base*>(pd2);
    cout<< "pd2 = " << pd2 << ", pb2 = " << pb2 <<endl;
    cout<< pb2->get_a() << endl;  //输出一个垃圾值
    pb2->func();  //内存错误

    return 0;
}

情况①是正确的，没有任何问题。对于情况②，pd指向的是整型变量n，并没有指向一个Derived类的对象，在使用dynamic_cast进行类型转换时也没有检查这一点，而是将pd的值直接赋给了pb（这里并不需要调整偏移量），最终导致pb也指向了n。因为pb指向的不是一个对象，所以 get_a() 得不到m_a的值（实际上得到的是一个垃圾值）， pb2->func() 也得不到func()函数的正确地址。

pb2->func() 得不到func()的正确地址的原因在于，pb2指向的是一个假的“对象”，它没有虚函数表，也没有虚函数表指针，而func()是虚函数，必须到虚函数表中才能找到它的地址。

2) 向下转型（Downcasting）

向下转型是有风险的，dynamic_cast会借助RTTI信息进行检测，确定安全的才能转换成功，否则就转换失败。

示例

#include <iostream>
using namespace std;

class A{
public:
    virtual void func() const { cout<<"Class A"<<endl; }
private:
    int m_a;
};

class B: public A{
public:
    virtual void func() const { cout<<"Class B"<<endl; }
private:
    int m_b;
};

class C: public B{
public:
    virtual void func() const { cout<<"Class C"<<endl; }
private:
    int m_c;
};

class D: public C{
public:
    virtual void func() const { cout<<"Class D"<<endl; }
private:
    int m_d;
};

int main(){
    A *pa = new A();
    B *pb;
    C *pc;
   
    //情况①
    pb = dynamic_cast<B*>(pa);  //向下转型失败
    if(pb == NULL){
        cout<<"Downcasting failed: A* to B*"<<endl;
    }else{
        cout<<"Downcasting successfully: A* to B*"<<endl;
        pb -> func();
    }
    pc = dynamic_cast<C*>(pa);  //向下转型失败
    if(pc == NULL){
        cout<<"Downcasting failed: A* to C*"<<endl;
    }else{
        cout<<"Downcasting successfully: A* to C*"<<endl;
        pc -> func();
    }
   
    cout<<"-------------------------"<<endl;
   
    //情况②
    pa = new D();  //向上转型都是允许的
    pb = dynamic_cast<B*>(pa);  //向下转型成功
    if(pb == NULL){
        cout<<"Downcasting failed: A* to B*"<<endl;
    }else{
        cout<<"Downcasting successfully: A* to B*"<<endl;
        pb -> func();
    }
    pc = dynamic_cast<C*>(pa);  //向下转型成功
    if(pc == NULL){
        cout<<"Downcasting failed: A* to C*"<<endl;
    }else{
        cout<<"Downcasting successfully: A* to C*"<<endl;
        pc -> func();
    }
   
    return 0;
}
/*output:
Downcasting failed: A* to B*
Downcasting failed: A* to C*
-------------------------
Downcasting successfully: A* to B*
Class D
Downcasting successfully: A* to C*
Class D*/

这段代码中类的继承顺序为：A => B => C => D。pa 是 A* 类型的指针，当pa指向A类型的对象时，向下转型失败，pa不能转换为 B* 或 C* 类型。当pa指向D类型的对象时，向下转型成功，pa可以转换为 B* 或 C* 类型。同样都是向下转型，为什么pa指向的对象不同，转换的结果就大相径庭呢？

RTTI和继承链

有虚函数存在时对象的真实内存模型中，每个类都会在内存中保存一份类型信息（ struct type_info ），编译器会将存在继承关系的类的类型信息使用指针“连接”起来，从而形成一个继承链（Inheritance Chain），也就是如下图所示的样子：

当使用dynamic_cast对指针进行类型转换时，程序会先找到该指针指向的对象，再根据对象找到当前类（指针指向的对象所属的类）的类型信息，并从此节点开始沿着继承链向上遍历，如果找到了要转化的目标类型，那么说明这种转换是安全的，就能够转换成功，如果没有找到要转换的目标类型，那么说明这种转换存在较大的风险，就不能转换。

对于本例中的情况①，pa指向A类对象，根据该对象找到的就是A的类型信息，当程序从这个节点开始向上遍历时，发现A的上方没有要转换的B类型或C类型（实际上A 的上方没有任何类型了），所以就转换败了。对于情况②，pa指向D类对象，根据该对象找到的就是D的类型信息，程序从这个节点向上遍历的过程中，发现了C类型和 B类型，所以就转换成功了。

总起来说，dynamic_cast会在程序运行过程中遍历继承链（代价是影响效率），如果途中遇到了要转换的目标类型，那么就能够转换成功，如果直到继承链的顶点（最顶层的基类）还没有遇到要转换的目标类型，那么就转换失败。对于同一个指针（例如 pa），它指向的对象不同，会导致遍历继承链的起点不一样，途中能够匹配到的类型也不一样，所以相同的类型转换产生了不同的结果。

从表面上看起来 dynamic_cast确实能够向下转型，本例也很好地证明了这一点：B和C都是A的派生类，我们成功地将pa从A类型指针转换成了B和C类型指针。但是从本质上讲，dynamic_cast还是只允许向上转型，因为它只会向上遍历继承链。造成这种假象的根本原因在于，派生类对象可以用任何一个基类的指针指向它，这样做始终是安全的。本例中的情况②，pa指向的对象是D类型的，pa、pb、pc 都是D的基类的指针，所以它们都可以指向D类型的对象，dynamic_cast只是让不同的基类指针指向同一个派生类对象罢了。

参考资料

http://c.biancheng.net/view/2343.html

https://www.cnblogs.com/ljygoodgoodstudydaydayup/p/3897314.html

https://www.cnblogs.com/chenyangchun/p/6795923.html

Min是清明的茗