C++语言中的四种类型转换

1 引子

这篇笔记是根据*上面的一个问题整理而成,主要内容是对C/C++当中四种类型转换操作进行举例说明。在之前其实对它们都是有所了解的,而随着自己在进行总结,并敲了一些测试示例代码进行验证之后,对它们的理解又深刻了一些。

总所周知,在C++ 当中引入了四种新的类型转换操作符:static_cast, dynamic_cast, reinterpret_cast,还有const_cast。就自己见过的一些C++代码当中,它们的使用其实并不普遍。不少程序员依然乐于去使用C-like的类型转换,因为它强大且编写起来又简单。据说C-Like类型转换操作符的作用实际上已经包括了static_cast, const_castreinterpret_cast三种操作符,你相信吗?一起来着看。

注:上面提到的C-Like类型转换操作有如下的两种形式,这一点大家一定都不会陌生。

  • (new-type) expression
  • new-type (expression)

2 static_cast vs dynamic_cast

之所以把static_castdynamic_cast两兄弟放在一起是因为它们两者对比起来更容易记得住。首先,从名称上面它们就有语义相对的关系,一“静”一“动”。另外,在功能上面也在一定程度上体现了这一对比的特性,如dynamic_cast的Run-time Checkingt,static_cast在编译时增加的类型检测。简单而言:

  • static_cast: 1)完成基础数据类型,2)同一个继承体系中类型的转换
  • dynamic_cast:使用多态的场景,增加了一层对真实调用对象类型的检查
2.1 从C-Like到static_cast

static_cast对于基础类型如int, float, char以及基础类型对应指针的处理大多情况下恰如C-Like的转换一样,不过static_cast会来得更加安全。

char c = 10;           // 1 个字节
int *p = (int *)&c;    // 4 个字节(32bit platform)

*p = 5;                // 内存踩脏
int *q = static_cast<int *>(&c); // 使用static_cast可在编译阶段将该错误检查出来。

对于自定义类型的处理,相比C-Like而言,它也多了一层保护,也就是它不支持在不属于同一继承体系的类型之间进行转换。但是C-Like就可以办到,看下面这个例子:

#include <iostream>

class A
{
public:
  A(){}
  ~A(){}
 
private:
  int i, j;
};

class C
{
public:
  C(){}
  ~C(){}

  void printC()
  {
    std::cout <<"call printC() in class C" <<std::endl;
  }
private:
  char c1, c2;
};

int main()
{  
  A *ptrA = new A;
  //C *ptrC = static_cast<C *>(ptrA);
  // 编译无法通过,提示:
  // In function ‘int main()’:
  // error: invalid static_cast from type ‘A*’ to type ‘C*’
 
  C *ptrC = (C *)(ptrA);
  ptrC->printC();
  // 编译正常通过。
  // 尽管这个时候能够正常调用printC,但实际上这种做法的结果是“undefined”
  // 尝试过,如果添加一些数据成员的运算,这个时候将会使得运算结果无法预测
  // 所以,在运行时候该逻辑相关的行为是不清晰的。
 
  return 0;
}  

2.2 static_cast对于自定义类型的转换

上面这个小例子简单对比了static_cast与C-Like在针对不同继承体系的类之间表现的差异性,现在先把范围缩小到同一继承体系当中的类型转换。(注:这里所说的类型一般是针对类的指针或者类的引用)

static_cast针对同一继承体系的类之间的转换,它既可以进行upcast也可以进行downcast。一般来说,在进行upcast时是没有问题的,毕竟子类当中一定包含有父类的相关操作集合,所以通过转换之后的指针或者引用来操作对应的对象,其行为上是可以保证没问题。这和使用static_cast与使用C-Like或者直接隐式转换效果一样(当然,其结果是否符合程序员本身的预期与当时的设计有关系)。

需要注意的是,使用static_cast进行downcast应该避免,因为它可以顺利逃过编译器的法眼,但在运行时却会爆发未定义的问题:

#include <iostream>

class A
{
public:
  A():i(1), j(1){}
  ~A(){}
 
  void printA()
  {
    std::cout <<"call printA() in class A" <<std::endl;
  }
 
  void printSum()
  {
    std::cout <<"sum = " <<i+j <<std::endl;
  }
 
private:
  int i, j;
};

class B : public A
{
public:
  B():a(2), b(2) {}
  ~B(){}

  void printB()
  {
    std::cout <<"call printB() in class B" <<std::endl;
  }
 
  void printSum()
  {
    std::cout <<"sum = " <<a+b <<std::endl;
  }
 
  void Add()
  {
    a++;
    b++;
  }
 
private:
  double a, b;
};

int main()
{      
  B *ptrB = new B;
  ptrB->printSum();
  //打印结果:sum = 4
  A *ptrA = static_cast<B *>(ptrB);   
  ptrA->printA();
  ptrA->printSum();
  //打印结果:sum = 2
  //在进行upcast的时候,指针指向的对象的行为与指针的类型相关。
 
 
  ptrA = new A;
  ptrA->printSum();
  //打印结果:sum = 2  
  ptrB = static_cast<B *>(ptrA);
  ptrB->printB();
  ptrB->printSum();  
  //打印结果:sum = 0
  //在进行downcast的时候,其行为是“undefined”。
 
  //B b;
  //B &rB = b;
  //rB.printSum();
  //打印结果:sum = 4
  //A &rA = static_cast<A &>(rB);   
  //rA.printA();
  //rA.printSum();
  //打印结果:sum = 2
  //在进行upcast的时候,引用指向的对象的行为与引用的类型相关。
 
  //A a;
  //A &rA = a;
  //rA.printSum();
  //打印结果:sum = 4
  //B &rB = static_cast<B &>(rA);   
  //rB.printB();
  //rB.printSum();
  //打印结果:sum = 5.18629e-317  
  //在进行downcast的时候,其行为是“undefined”。
 
  return 0;
}

如上,static_cast在对同一继承体系的类之间进行downcast时的表现,与C-Like针对分属不同继承体系的类之间进行转换时的表现一样,将是未定义的。所以,应该尽可能使用static_cast执行downcast转换,更准确的说,应该尽可能避免对集成体系的类对应的指针或者引用进行downcast转换。

既然这样,那是不是在软件开发过程当中就不会存在downcast的这种情况了呢?实际上不是的。一般来说,进行downcast的时候一般是在虚继承的场景当中,这个时候dynamic_cast就上场了。

2.3 dynamic_cast

dynamic_cast的使用主要在downcast的场景,它的使用需要满足两个条件:

  • downcast时转换的类之间存在着“虚继承”的关系
  • 转换之后的类型与其指向的实际类型要相符合

dynamic_cast对于upcast与static_cast的效果是一样的,然而因为dynamic_cast依赖于RTTI,所以在性能上面相比static_cast略低。

#include <iostream>
#include <exception>

class A
{
public:
  virtual void print()  
  {
    std::cout <<"Welcome to WorldA!" <<std::endl;
  }
};

class B : public A
{
public:
  B():a(0), b(0) {}
  ~B(){}
  virtual void print()  
  {
    std::cout <<"Welcome to WorldB!" <<std::endl;
  }
private:
  double a, b;
};

int main()
{
  B *ptrB = new B;
  A *ptrA = dynamic_cast<A *>(ptrB);
  ptrA->print();
  //在虚继承当中,针对指针执行upcast时dynamic_cast转换的效果与static_cast一样
  //对是否存在virtual没有要求,会实际调用所指向对象的成员。
    
  //A *ptrA = new A;
  //B *ptrB = dynamic_cast<B *>(ptrA);
  //ptrB->print();
  //Segmentation fault,针对指针执行downcast时转换不成功,返回NULL。
 
  //A a;
  //A &ra = a;
  //B &b = dynamic_cast<B &>(ra);
  //b.print();    
  //抛出St8bad_cast异常,针对引用执行downcast时转换不成功,抛出异常。
 
  //ptrA = new A;
  //ptrB = static_cast<B *>(ptrA);
  //ptrB->print();
  //使用static_cast进行downcast的时候,与dynamic_cast返回NULL不同,
  //这里会调用ptrB实际指向的对象的虚函数。
    
  //ptrA = new A;
  //ptrB = dynamic_cast<B *>(ptrA);
  //ptrB->print();
  //在进行downcast时,如果没有virtual成员,那么在编译时会提示:  
  // In function ‘int main()’:
  // cannot dynamic_cast ‘ptrA’ (of type ‘class A*’) to type ‘class B*’ (source type is not polymorphic)
 
  return 0;
}

从这个例子可以看出,在虚继承场景下,能够使用dynamic_cast的地方一定可以使用static_cast,然而dynamic_cast却有着更严格的要求,以便帮助程序员编写出更加严谨的代码。只不过,它在性能上面多了一部分开销。

3 reinterpret_cast

reinterpret_cast是最危险的一种cast,之所以说它最危险,是因为它的表现和C-Like一般强大,稍微不注意就会出现错误。它一般在一些low-level的转换或者位操作当中运用。

#include <iostream>

class A
{
public:
  A(){}
  ~A(){}
  void print()  
  {
    std::cout <<"Hello World!" <<std::endl;
  }
};

class B
{
public:
  B():a(0), b(0) {}
  ~B(){}

  void call()
  {
    std::cout <<"Happy for your call!" <<std::endl;
  }

private:
  double a, b;
};

int main()
{
  //A *ptrA = new A;
  //B *ptrB = reinterpret_cast<B *>(ptrA);
  //ptrB->call();
  //正常编译
  //A *ptrA = new A;
  //B *ptrB = (B *)(ptrA);
  //ptrB->call();
  //正常编译
  //A *ptrA = new A;  
  //B *ptrB = static_cast<B *>(ptrA);
  //ptrB->call();
  //编译不通过,提示:
  //In function ‘int main()’:
  //error: invalid static_cast from type ‘A*’ to type ‘B*’
 
  //char c;
  //char *pC = &c;
  //int *pInt = static_cast<int *>(pC);
  //编译提示错误:error: invalid static_cast from type ‘char*’ to type ‘int*’
  //int *pInt = reinterpret_cast<int *>(pC);
  //正常编译。
  //int *pInt = (int *)(pC);
  //正常编译。
 
  return 0;
}

分析了static_castdynamic_castreinterpret_cast之后就可以画出如下的图示对它们之间的区别进行简单比较了。这里没有将const_cast纳入进来是因为它比较特殊,另外分节对它进行介绍。

          ----------------
         /   dynamic_cast  -->同一继承体系(virtual)的类指针或引用[更安全的downcast]
        ~~~~~~~~~~~~~~~~~~~~    
       /     static_cast     -->基础类型[更安全],同一继承体系的类指针或引用
      ~~~~~~~~~~~~~~~~~~~~~~~~
     /    reinterpret_cast     -->与C-Like的作用一致,没有任何静态或者动态的checking机制
    ~~~~~~~~~~~~~~~~~~~~~~~~~~~~
   /          C-Like             -->基础类型,同一继承体系的类指针或引用,不同继承体系类的指针或引用
  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

4 const_cast

const_cast能够使用来移出或者增加一个变量的const属性,最初的时候我觉得这个const_cast比较怪异,C里面一直都没有类似的东西来消除const属性,这里是否会多余呢?其实,我这种想法本身就没根没据。后来想想,在C++当中一直提倡将常量声明为const,这样一旦常量变得多了起来,在与其他软件组件或者第三方库进行衔接的时候就难免会碰到需要cast const属性的问题。比如:

const int myConst = 15;
int *nonConst = const_cast<int *>(&myConst);

void print(int *p)
{
    std::cout << *p;
}

print(&myConst); // 编译错误:error: invalid conversion from ‘const int*’ to ‘int*’
print(nonConst); // 正常

不过,在使用const_cast的时候应该要注意,如果没有必要尽量不要去修改它的值:

const int myConst = 15;
int *nonConst = const_cast<int *>(&myConst);

*nonConst = 10;
// 如果该变量存放在read-only内存区当中,在运行时可能会出现错误。

5 小结

C++当中对于大部分数据类型而言,使用C-Like的类型转换已经完全够用了。然而,不少人一直在倡导进行显式数据类型转换的时候尽可能地使用C++规定的类型转换操作。我想这里面大概有两方面的原因:

  • 第一种,C++是一门“新”的编程语言,应该学会用它本身的思想来解决编程方面的问题;
  • 第二种,尽管C-Like转换操作能力强大,但如果将其任意使用,会产生不少在编译期间隐藏,却在运行时候神出鬼没。这些问题使得软件的行为极不清晰。

如此,C++当中引出了其他四种类型转换方式,用来更加安全的完成一些场合的类型转换操作。比如使用reinterpret_cast的时候会表示你确定无疑的想使用C-Like的类型转换;在使用static_cast的时候想要确保转换的对象基本兼容,比如无法将char *转换为int *,无法在不同继承体系类的指针或引用之间进行转换;而使用dynamic_cast的时候是要对虚继承下的类执行downcast转换,并且已经明了当前性能已经不是主要的影响因素......

回答一下前文提到的问题。可以这么说,对于const_cast, static_cast, reinterpret_castdynamic_cast所能够完成的所有转换,C-Like也可以完成。但是,C-Like转换却没有static_cast, dynamic_cast分别提供的编译时类型检测和运行时类型检测。

C++之父Bjarne Stroustrup博士在这里也谈到了他的观点,主要有两点:其一,C-Like的cast极具破坏性并且在代码文本上也难得花不少力气搜索到它;其二,新式的cast使得程序员更有目的使用它们并且让编译器能够发现更多的错误;其三,新的cast符合模板声明规范,可以让程序员编写它们自己的cast。

更多阅读,可以参见这里这里这里,还有这里