C++语言中的四种类型转换

1 引子

这篇笔记是根据*上面的一个问题整理而成，主要内容是对C/C++当中四种类型转换操作进行举例说明。在之前其实对它们都是有所了解的，而随着自己在进行总结，并敲了一些测试示例代码进行验证之后，对它们的理解又深刻了一些。

总所周知，在C++ 当中引入了四种新的类型转换操作符：static_cast, dynamic_cast, reinterpret_cast，还有const_cast。就自己见过的一些C++代码当中，它们的使用其实并不普遍。不少程序员依然乐于去使用C-like的类型转换，因为它强大且编写起来又简单。据说C-Like类型转换操作符的作用实际上已经包括了static_cast, const_cast和reinterpret_cast三种操作符，你相信吗？一起来着看。

注：上面提到的C-Like类型转换操作有如下的两种形式，这一点大家一定都不会陌生。

(new-type) expression
new-type (expression)

2 static_cast vs dynamic_cast

之所以把static_cast与dynamic_cast两兄弟放在一起是因为它们两者对比起来更容易记得住。首先，从名称上面它们就有语义相对的关系，一“静”一“动”。另外，在功能上面也在一定程度上体现了这一对比的特性，如dynamic_cast的Run-time Checkingt，static_cast在编译时增加的类型检测。简单而言：

static_cast： 1）完成基础数据类型，2）同一个继承体系中类型的转换
dynamic_cast：使用多态的场景，增加了一层对真实调用对象类型的检查

2.1 从C-Like到static_cast

static_cast对于基础类型如int, float, char以及基础类型对应指针的处理大多情况下恰如C-Like的转换一样，不过static_cast会来得更加安全。

char c = 10;           // 1 个字节
int *p = (int *)&c;    // 4 个字节（32bit platform）

*p = 5;                // 内存踩脏
int *q = static_cast<int *>(&c); // 使用static_cast可在编译阶段将该错误检查出来。

对于自定义类型的处理，相比C-Like而言，它也多了一层保护，也就是它不支持在不属于同一继承体系的类型之间进行转换。但是C-Like就可以办到，看下面这个例子：

#include <iostream>

class A
{
public:
  A(){}
  ~A(){}
 
private:
  int i, j;
};

class C
{
public:
  C(){}
  ~C(){}

  void printC()
  {
    std::cout <<"call printC() in class C" <<std::endl;
  }
private:
  char c1, c2;
};

int main()
{  
  A *ptrA = new A;
  //C *ptrC = static_cast<C *>(ptrA);
  // 编译无法通过，提示：
  // In function ‘int main()’:
  // error: invalid static_cast from type ‘A*’ to type ‘C*’
 
  C *ptrC = (C *)(ptrA);
  ptrC->printC();
  // 编译正常通过。
  // 尽管这个时候能够正常调用printC，但实际上这种做法的结果是“undefined”
  // 尝试过，如果添加一些数据成员的运算，这个时候将会使得运算结果无法预测
  // 所以，在运行时候该逻辑相关的行为是不清晰的。
 
  return 0;
}

2.2 static_cast对于自定义类型的转换

上面这个小例子简单对比了static_cast与C-Like在针对不同继承体系的类之间表现的差异性，现在先把范围缩小到同一继承体系当中的类型转换。（注：这里所说的类型一般是针对类的指针或者类的引用）

static_cast针对同一继承体系的类之间的转换，它既可以进行upcast也可以进行downcast。一般来说，在进行upcast时是没有问题的，毕竟子类当中一定包含有父类的相关操作集合，所以通过转换之后的指针或者引用来操作对应的对象，其行为上是可以保证没问题。这和使用static_cast与使用C-Like或者直接隐式转换效果一样（当然，其结果是否符合程序员本身的预期与当时的设计有关系）。

需要注意的是，使用static_cast进行downcast应该避免，因为它可以顺利逃过编译器的法眼，但在运行时却会爆发未定义的问题：

#include <iostream>

class A
{
public:
  A():i(1), j(1){}
  ~A(){}
 
  void printA()
  {
    std::cout <<"call printA() in class A" <<std::endl;
  }
 
  void printSum()
  {
    std::cout <<"sum = " <<i+j <<std::endl;
  }
 
private:
  int i, j;
};

class B : public A
{
public:
  B():a(2), b(2) {}
  ~B(){}

  void printB()
  {
    std::cout <<"call printB() in class B" <<std::endl;
  }
 
  void printSum()
  {
    std::cout <<"sum = " <<a+b <<std::endl;
  }
 
  void Add()
  {
    a++;
    b++;
  }
 
private:
  double a, b;
};

int main()
{      
  B *ptrB = new B;
  ptrB->printSum();
  //打印结果：sum = 4
  A *ptrA = static_cast<B *>(ptrB);   
  ptrA->printA();
  ptrA->printSum();
  //打印结果：sum = 2
  //在进行upcast的时候，指针指向的对象的行为与指针的类型相关。
 
 
  ptrA = new A;
  ptrA->printSum();
  //打印结果：sum = 2  
  ptrB = static_cast<B *>(ptrA);
  ptrB->printB();
  ptrB->printSum();  
  //打印结果：sum = 0
  //在进行downcast的时候，其行为是“undefined”。
 
  //B b;
  //B &rB = b;
  //rB.printSum();
  //打印结果：sum = 4
  //A &rA = static_cast<A &>(rB);   
  //rA.printA();
  //rA.printSum();
  //打印结果：sum = 2
  //在进行upcast的时候，引用指向的对象的行为与引用的类型相关。
 
  //A a;
  //A &rA = a;
  //rA.printSum();
  //打印结果：sum = 4
  //B &rB = static_cast<B &>(rA);   
  //rB.printB();
  //rB.printSum();
  //打印结果：sum = 5.18629e-317  
  //在进行downcast的时候，其行为是“undefined”。
 
  return 0;
}

如上，static_cast在对同一继承体系的类之间进行downcast时的表现，与C-Like针对分属不同继承体系的类之间进行转换时的表现一样，将是未定义的。所以，应该尽可能使用static_cast执行downcast转换，更准确的说，应该尽可能避免对集成体系的类对应的指针或者引用进行downcast转换。

既然这样，那是不是在软件开发过程当中就不会存在downcast的这种情况了呢？实际上不是的。一般来说，进行downcast的时候一般是在虚继承的场景当中，这个时候dynamic_cast就上场了。

2.3 dynamic_cast

dynamic_cast的使用主要在downcast的场景，它的使用需要满足两个条件：

downcast时转换的类之间存在着“虚继承”的关系
转换之后的类型与其指向的实际类型要相符合

dynamic_cast对于upcast与static_cast的效果是一样的，然而因为dynamic_cast依赖于RTTI，所以在性能上面相比static_cast略低。

#include <iostream>
#include <exception>

class A
{
public:
  virtual void print()  
  {
    std::cout <<"Welcome to WorldA!" <<std::endl;
  }
};

class B : public A
{
public:
  B():a(0), b(0) {}
  ~B(){}
  virtual void print()  
  {
    std::cout <<"Welcome to WorldB!" <<std::endl;
  }
private:
  double a, b;
};

int main()
{
  B *ptrB = new B;
  A *ptrA = dynamic_cast<A *>(ptrB);
  ptrA->print();
  //在虚继承当中，针对指针执行upcast时dynamic_cast转换的效果与static_cast一样
  //对是否存在virtual没有要求，会实际调用所指向对象的成员。
    
  //A *ptrA = new A;
  //B *ptrB = dynamic_cast<B *>(ptrA);
  //ptrB->print();
  //Segmentation fault，针对指针执行downcast时转换不成功，返回NULL。
 
  //A a;
  //A &ra = a;
  //B &b = dynamic_cast<B &>(ra);
  //b.print();    
  //抛出St8bad_cast异常，针对引用执行downcast时转换不成功，抛出异常。
 
  //ptrA = new A;
  //ptrB = static_cast<B *>(ptrA);
  //ptrB->print();
  //使用static_cast进行downcast的时候，与dynamic_cast返回NULL不同，
  //这里会调用ptrB实际指向的对象的虚函数。
    
  //ptrA = new A;
  //ptrB = dynamic_cast<B *>(ptrA);
  //ptrB->print();
  //在进行downcast时，如果没有virtual成员，那么在编译时会提示：  
  // In function ‘int main()’:
  // cannot dynamic_cast ‘ptrA’ (of type ‘class A*’) to type ‘class B*’ (source type is not polymorphic)
 
  return 0;
}

从这个例子可以看出，在虚继承场景下，能够使用dynamic_cast的地方一定可以使用static_cast，然而dynamic_cast却有着更严格的要求，以便帮助程序员编写出更加严谨的代码。只不过，它在性能上面多了一部分开销。

3 reinterpret_cast

reinterpret_cast是最危险的一种cast，之所以说它最危险，是因为它的表现和C-Like一般强大，稍微不注意就会出现错误。它一般在一些low-level的转换或者位操作当中运用。

#include <iostream>

class A
{
public:
  A(){}
  ~A(){}
  void print()  
  {
    std::cout <<"Hello World!" <<std::endl;
  }
};

class B
{
public:
  B():a(0), b(0) {}
  ~B(){}

  void call()
  {
    std::cout <<"Happy for your call!" <<std::endl;
  }

private:
  double a, b;
};

int main()
{
  //A *ptrA = new A;
  //B *ptrB = reinterpret_cast<B *>(ptrA);
  //ptrB->call();
  //正常编译
  //A *ptrA = new A;
  //B *ptrB = (B *)(ptrA);
  //ptrB->call();
  //正常编译
  //A *ptrA = new A;  
  //B *ptrB = static_cast<B *>(ptrA);
  //ptrB->call();
  //编译不通过，提示：
  //In function ‘int main()’:
  //error: invalid static_cast from type ‘A*’ to type ‘B*’
 
  //char c;
  //char *pC = &c;
  //int *pInt = static_cast<int *>(pC);
  //编译提示错误：error: invalid static_cast from type ‘char*’ to type ‘int*’
  //int *pInt = reinterpret_cast<int *>(pC);
  //正常编译。
  //int *pInt = (int *)(pC);
  //正常编译。
 
  return 0;
}

分析了static_cast，dynamic_cast与reinterpret_cast之后就可以画出如下的图示对它们之间的区别进行简单比较了。这里没有将const_cast纳入进来是因为它比较特殊，另外分节对它进行介绍。

          ----------------
         /   dynamic_cast  -->同一继承体系（virtual）的类指针或引用[更安全的downcast]
        ~~~~~~~~~~~~~~~~~~~~    
       /     static_cast     -->基础类型[更安全]，同一继承体系的类指针或引用
      ~~~~~~~~~~~~~~~~~~~~~~~~
     /    reinterpret_cast     -->与C-Like的作用一致，没有任何静态或者动态的checking机制
    ~~~~~~~~~~~~~~~~~~~~~~~~~~~~
   /          C-Like             -->基础类型，同一继承体系的类指针或引用,不同继承体系类的指针或引用
  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

4 const_cast

const_cast能够使用来移出或者增加一个变量的const属性，最初的时候我觉得这个const_cast比较怪异，C里面一直都没有类似的东西来消除const属性，这里是否会多余呢？其实，我这种想法本身就没根没据。后来想想，在C++当中一直提倡将常量声明为const，这样一旦常量变得多了起来，在与其他软件组件或者第三方库进行衔接的时候就难免会碰到需要cast const属性的问题。比如：

const int myConst = 15;
int *nonConst = const_cast<int *>(&myConst);

void print(int *p)
{
    std::cout << *p;
}

print(&myConst); // 编译错误：error: invalid conversion from ‘const int*’ to ‘int*’
print(nonConst); // 正常

不过，在使用const_cast的时候应该要注意，如果没有必要尽量不要去修改它的值：

const int myConst = 15;
int *nonConst = const_cast<int *>(&myConst);

*nonConst = 10;
// 如果该变量存放在read-only内存区当中，在运行时可能会出现错误。

5 小结

在C++当中对于大部分数据类型而言，使用C-Like的类型转换已经完全够用了。然而，不少人一直在倡导进行显式数据类型转换的时候尽可能地使用C++规定的类型转换操作。我想这里面大概有两方面的原因：

第一种，C++是一门“新”的编程语言，应该学会用它本身的思想来解决编程方面的问题；
第二种，尽管C-Like转换操作能力强大，但如果将其任意使用，会产生不少在编译期间隐藏，却在运行时候神出鬼没。这些问题使得软件的行为极不清晰。

如此，C++当中引出了其他四种类型转换方式，用来更加安全的完成一些场合的类型转换操作。比如使用reinterpret_cast的时候会表示你确定无疑的想使用C-Like的类型转换；在使用static_cast的时候想要确保转换的对象基本兼容，比如无法将char *转换为int *，无法在不同继承体系类的指针或引用之间进行转换；而使用dynamic_cast的时候是要对虚继承下的类执行downcast转换，并且已经明了当前性能已经不是主要的影响因素......

回答一下前文提到的问题。可以这么说，对于const_cast, static_cast, reinterpret_cast和dynamic_cast所能够完成的所有转换，C-Like也可以完成。但是，C-Like转换却没有static_cast, dynamic_cast分别提供的编译时类型检测和运行时类型检测。

C++之父Bjarne Stroustrup博士在这里也谈到了他的观点，主要有两点：其一，C-Like的cast极具破坏性并且在代码文本上也难得花不少力气搜索到它；其二，新式的cast使得程序员更有目的使用它们并且让编译器能够发现更多的错误；其三，新的cast符合模板声明规范，可以让程序员编写它们自己的cast。

更多阅读，可以参见这里，这里，这里，还有这里。