由一次程序崩溃唤起的对new表达式的再次学习

由一次程序崩溃引起的对new表达式的再次学习

1. 起因

某天,一个同事跟我反馈说在windows上调试公司产品的一个交易核心时出现了使用未初始化的指针导致后台服务崩溃的情况。示例代码如下所示:

 1 struct sample
 2 {
 3     int* ptr_table[4][4];
 4     //... other members
 5 };
 6 
 7 void test()
 8 {
 9     sample* sample_ptr = new sample[10];
10     for (int i = 0; i < 4; i++)
11         sample_ptr[0].ptr_table[0][i] = new int(i);
12 
13     // 实际系统中是根据初始化数据对sample_ptr数组中的对象进行赋值,但不是所有的对象都有初始化数据;
14     int* int_ptr = sample_ptr[0].ptr_table[0][0];
15     if (int_ptr != NULL)
16     {
17         printf("ptr1 = 0x%x\n", int_ptr);
18         *int_ptr = 100;
19     }
20 
21     int_ptr = sample_ptr[1].ptr_table[0][0];
22     if (int_ptr != NULL)
23     {
24         printf("ptr2 = 0x%x\n", int_ptr);
25         *int_ptr = 100; // crashed here!
26     }
27 }

 

使用未初始化的指针是c++的大忌,但是该代码在产品发布2年左右的时间一直没有出现过问题。唯一的区别是发布运行环境是linux,而调试环境是最近才配置好的windows环境。分别在linux下和windows下对代码进行debug,发现linux下新申请的内存被初始化为0,而windows下新申请的内存却并未初始化。

 由一次程序崩溃唤起的对new表达式的再次学习

将sample* sample_ptr = new sample[10]这行改为sample* sample_ptr = new sample[10]()后两个系统执行的结果变一样了,都是被初始化的内存。

那么问题来了:

(1) 为什么相同的代码(new sample[10])在两个系统下表现形式不一样呢?是两个系统的内存分配机制的原因还是类库的原因?

(2) new sample[10]和new sample[10]()的区别到底是什么?

 

2. 研究

 

在c++中,一般都是以new/delete来申请和释放内存。对于以下几种new的用法,各自的区别是什么呢?

 

1 int* p1 = new int;
2 int* p2 = new int();
3 int* p3 = new int(1);
4 // define class A;
5 A* p4   = new A;
6 A* p5   = new A();
7 A* p6   = new A[10];
8 A* p7   = new A[10]();

 

在平时写代码的时候,对于一块新申请的内存我都会要对它进行初始化后才会去用它,一般是例如p3的直接初始化或者memset,因此对于new A和new A()两种用法的结果还真是不了解之间的区别。

 

根据《C++ Primer, Fourth Edition》中5.11节[1] The new and delete Expressions中关于new的描述,new A属于Default Initializing of Dynamically Allocated Objects动态创建对象的默认初始化),而new A()则属于Value Initializing of Dynamically Allocated Objects动态创建对象的值初始化)。

当为默认初始化操作时,若被创建的对象没有显式定义默认构造函数,则按照2.3.4节[2]Variable Initialization Rules的规则进行初始化:

  • 对象为内置类型时,任何在函数体外定义的变量都会被初始化0(全局变量或者静态变量),在函数体内定义的变量都不会进行初始化
  • 对象为类类型时,调用对象的默认构造函数

当为值初始化操作时,若被创建的对象没有显式定义默认构造函数,则认为对该对象进行初始化操作。

 

不同new的用法对应的初始化的逻辑总结如下:

  new A new A() new A(parameters)
A为内置类型 无初始化动作

进行值初始化

例A为int类型,则初始化为0

进行值初始化,A被初始化为parameters
A为calss/struct

调用默认构造函数,A中成员是否

初始化依赖于默认构造函数的实现

若自定义了默认构造函数,则调用自定义的默认构造函数。

否则调用系统默认构造函数,并对A中的成员进行值初始化

调用A的自定义构造函数

 

 

 

 

 

 

 

 

 

因此上面代码的执行结果分别为:

  • p1指向了一个未被初始化的int空间
  • p2指向了一个被初始化的int空间,其值为0
  • p3指向了一个被初始化的int空间,其值为1
  • p4指向了一个调用了默认构造函数的实例A,除非A的默认构造函数对A的成员进行初始化,否则A的成员全为未初始化变量
  • p5指向了一个调用了默认构造函数的实例A,若A自定义了默认构造函数,A成员变量的初始化依赖于自定义的默认构造函数,反之A的成员变量全为初始化后的变量
  • p6、p7指向了调用了默认构造函数的实例A的数组,其执行结果同p4、p5

 

回到之前的问题,结构体sample是没有自定义默认构造函数的,按照c++标准,new sample的执行结果是sample中的ptr_table是不会被初始化的。这个在windows上是一致的,可是在linux上为什么被初始化成了0了呢?在stackoverflow上找到了一个类似的问题[3],其答案为:“Memory coming from the OS will be zeroed for security reasons....the C standard says nothing about this. This is strictly an OS behavior. So this zeroing may or may not be present on systems where security is not a concern”。操作系统的安全机制会在用户程序申请内存时对分配的内存进行初始化,以防止别有用心的人从新申请到的内存中读取到敏感数据,例如密码等,正是由于这个linux的特性使程序在首次申请内存时总是能得到一块被初始化的内存。

关于这个安全机制我在网上并没有搜到比较官方的说明文档,也许是我的搜索方式有误或者没有找对关键词,而且发现在程序运行过程中申请的内存也总并不是被初始化了的内存,例如下面的代码:

 1 int size = 10;
 2 {
 3     int * p1 = new int[size];
 4     for (int i = 0; i < size; i++)
 5     {
 6         p1[i] = i + 200;
 7         printf("%d\t", p1[i]);
 8     }
 9     printf("\n");
10     delete []p1;
11 }
12 
13 {
14     int * p1 = new int[size];
15     for (int i = 0; i < size; i++)
16         printf("%d\t", p1[i]);
17     delete []p1;
18 }
19 printf("\n");

执行结果:

由一次程序崩溃唤起的对new表达式的再次学习

 

希望对这方面有了解的大神能提供一下相关的资料。

 

3. 总结

 

(1) 项目中的代码是明显不符合c++代码规范的,在逻辑上会存在使用未经初始化的指针的现象。个人认为变量的初始化不应依赖于编译器或者系统的实现,而是尽量遵照c++标准或者手工初始化。

(2) 针对class/struct类型,如果没有自定义默认构造函数,不同的new的用法会产生不同的结果,这个在以后写代码的时候要注意。

 

1:http://shouce.jb51.net/c++/0201721481/ch05lev1sec11.html

2.  http://shouce.jb51.net/c++/0201721481/ch02lev1sec3.html#ch02lev2sec13

3:http://stackoverflow.com/questions/8029584/why-does-malloc-initialize-the-values-to-0-in-gcc

 

本文为原创内容,若有错误的地方烦请指正

本文地址:http://www.cnblogs.com/morebread/p/4936441.html

10楼Letsgollc
MARK (来自博客园v3.3.2)
9楼Supper_litt
未初始化,使用时候判断一下嘛。
8楼TinyHao
一句话,C++中不对变量初始化就是在挖坑!
7楼Antineutrino
C标准确实对这一块没有规定。因为2种方式各有利弊,一个效率高,一个更安全。这里面有一个前提,那就是即使不初始化,对安全性的损失也非常小(仅在理论上存在能够被利用的可能,实际上要想利用那是相当困难)。相反,不初始化对效率的提高确实很可观的。所以Windows才可以放心地选择不初始化的策略。
Re: 果冻想
@Antineutrino,其实,我觉的windows的做法就比较好,你没有初始化,编译器也不给你进行默认初始化,这样的话,错误就会在测试阶段被发现。
Re: 悠哉呀悠哉
@Antineutrino,引用C标准确实对这一块没有规定。因为2种方式各有利弊,一个效率高,一个更安全。这里面有一个前提,那就是即使不初始化,对安全性的损失也非常小(仅在理论上存在能够被利用的可能,实际上要想利用那是相当困难)。相反,不初始化对效率的提高确实很可观的。所以Windows才可以放心地选择不初始化的策略。,“不初始化对效率的提高确实很可观的”你确定?根据我的经验,内存分配才影响效率,初始化的影响几乎可以忽略不计,window下变量不初始化基本就是挖坑,经常debug版本没错,release就挂掉了
Re: WONDERFUL_cnblogs
@Antineutrino,Windows不是不初始化,在Debug版本,初始化为0xcdcdcdcd,这是故意为之的,就是为了防止一些隐藏的错误
6楼zc超神
作为一个测试选手表示看不懂
5楼松大人
你如果完全按照规范,这些细节问题可能就不会暴露出来了。
4楼莫压枯枯地
赞一个,我在面试的时候就被问到new int与new int()有什么区别,结果我没回答出来,后来看书也没看出个所以然来,此刻看了这个文章算是了了我一段陈年心事
3楼果冻想
谢谢分享,从实际的项目实例出发,分享开发中遇到的问题,真的好好。
2楼代码菜鸡
可以可以可以,写的不错
1楼笑对当空
这个文章有内容