深度解析与探讨:嵌入式系统的高低温故障的根源解决方案

深度解析与探讨:嵌入式系统的高低温故障的根源
呵呵,ARM7、ARM9 还有PXA3XX 等等嵌入式ARM都存在高低温时容易爆发故障?尤其是主频越高的CPU,越容易爆发高低温故障?
这是为什么?

这是因为我们疏忽了对于整个系统中的很多关键信号的完整性的研究、分析与设计;
我们的硬件、软硬件协调设计很多时候最主要考虑的是功能和部分性能的设计与实现,最容易忘记的就是信号完整性,特别是ARM、FLASH、DDR/SDRAM等比较复杂IC的信号完整性。
尤其在CPU/ARM的主频越来越高,其配套的储存器等器件的频率特性也越来越高,从而保证系统的性能越来越快,但这同时,其对关键信号的完整性(幅度与时序)就越来越严格,从而导致爆发高低温故障的几率越来越高。

一般CPU/ARM等系统在常温时,都比较稳定,但是到高温后,就可能出现故障。

给很多在高低温故障中很郁闷的兄弟们指条光明大道,高低温故障的爆发一般都是信号完整性的问题,具体体现在两大点:
1、关键信号的幅度存在临界(主要由于硬件设计存在比较隐蔽的缺陷);
2、时序存在很大临界(这里主要表现为CPU上电、NAND FLASH、DDR、NOR FLASH、SDRAM(频率较低,可能的几率较低)的时序,主要是由于我们配置的参数在常温好用,所以很多设计者都没有关注这些核心时序;
最关键的是很多设计者都是大家一起抄官网或者开发板的原理图与CODE,常温好用,但他们甚至都没有真正研究过或者没有真正致弄明白关键信号的正确时序是什么样的,所以等故障爆发,他们就会迷失了方向,因为他们根本不知道方向在何方, )

在此向大家强调:官网与各类开发板的设计,能验证的是大体功能,极少部分性能,仅可借鉴;它们之所以是开发板,而不是产品,因为它们相对产品而言,好比婴儿与我们! 缺少EMC、EMI、信号完整性等核心因素!

在此请大家思考下,为什么做CPLD、FPGA的同事,在高低温时,他们的产品和设计就比我们这些做嵌入式的好呢?

我的师傅--一位资深的系统架构大师,在我进公司,就教导我:硬件设计/研发工程师,最终职业的发展就只有两个方向?
在此我想请问大家?我师傅所谓的两个方向是什么? 谢谢!谢谢!

------解决方案--------------------
恩,受教了,不过楼主问的问题不太知道如何回答,哈哈哈,有点愚钝。试着答一下,1是数字逻辑设计、2是信号完整性设计。
------解决方案--------------------
谢谢!学习学习
------解决方案--------------------
学习下,帮顶下
------解决方案--------------------
fffffffffff
------解决方案--------------------
tytuu
------解决方案--------------------
up
------解决方案--------------------
设计的时候多给自己留点余量,能挑100,只担80
------解决方案--------------------
学习了
------解决方案--------------------
做CPLD、FPGA的同事,在高低温时,他们的产品和设计就比我们这些做嵌入式的好呢? 
---------------------------
一fpga高低温出问题的情况一样多,
主要是是时序设计不合理。
设计没有冗余
在恶劣情况下,硬件参数改变,导致软件就容易出问题。
------解决方案--------------------
我师傅也是位大拿。

------解决方案--------------------
向各位学习!
------解决方案--------------------
我还没师傅
------解决方案--------------------
ding
------解决方案--------------------
好贴,收藏。

PS:那两个方向,为何不去问你师傅?
------解决方案--------------------
还有师傅啊
------解决方案--------------------
大牛也,膜拜!
------解决方案--------------------
今天多发一部分 
------解决方案--------------------
一般是不了解器件的温度特性导致,不同材质的电容容量变化与温度的关系,漏电流的变化,寿命的变化。比如常用的陶瓷电容,如果你不了解材质像常用的Y5V材质,在高温的时候容量大大下降,甚至可以减小到80%,滤波效果肯定大打折扣,电源系统恶化造成系统不稳定。再如晶体管,与温度有关的参数很多,我们熟知的直流放大倍会随温度升高而升高,发射结电压会随温度降低而升高,ICBO,ICEO随温度上升而增大。经常遇到的问题就是低温是由于放大倍数降低且BE结电压升高导致驱动电流不够,而在高温的时候ICBO,ICEO的增大导致静态工作点上移工作不稳定。系统不稳定。再如磁性材料的磁导率与温度的关系,温度变化引起电感值的变化,还有饱和电流下降,对电流来说是很致使的问题。如果不了解这些特性,在计算参数的时候没有考虑温度的变化,那高低温测试就出问题。
另外作为硬件工程师还必需有一手好的PCB layout能力,原理图到处都有,大家抄来抄去,同样一个图,不同的人lay出来的板性能完全不一样,同样的菜同样的配料,为什么不同的人炒出来的味道也不一样。做硬件久了最终体现能力差别的就是PCB layout的水平。
------解决方案--------------------
引用:
一般是不了解器件的温度特性导致,不同材质的电容容量变化与温度的关系,漏电流的变化,寿命的变化。比如常用的陶瓷电容,如果你不了解材质像常用的Y5V材质,在高温的时候容量大大下降,甚至可以减小到80%,滤波效果肯定大打折扣,电源系统恶化造成系统不稳定。再如晶体管,与温度有关的参数很多,我们熟知的直流放大倍会随温度升高而升高,发射结电压会随温度降低而升高,ICBO,ICEO随温度上升而增大。经常遇到的问题就是低温是由于放大倍数降低且BE结电压升高导致驱动电流不够,而在高温的时候ICBO,ICEO的增大导致静态工作点上移工作不稳定。系统不稳定。再如磁性材料的磁导率与温度的关系,温度变化引起电感值的变化,还有饱和电流下降,对电流来说是很致使的问题。如果不了解这些特性,在计算参数的时候没有考虑温度的变化,那高低温测试就出问题。
另外作为硬件工程师还必需有一手好的PCB layout能力,原理图到处都有,大家抄来抄去,同样一个图,不同的人lay出来的板性能完全不一样,同样的菜同样的配料,为什么不同的人炒出来的味道也不一样。做硬件久了最终体现能力差别的就是PCB layout的水平。


支持!学习了。
------解决方案--------------------
LZ不错啊~~~~~~~~~~~学习啦
------解决方案--------------------
学习下,帮顶下
------解决方案--------------------
学习中
------解决方案--------------------
学习中
------解决方案--------------------
引用:
设计的时候多给自己留点余量,能挑100,只担80


我一般只让它干30~40的活,当然这是在可靠压倒一切的系统中

不重要,允许复位的可以干120~140
------解决方案--------------------
学习中,很多问题还是实践里才能感受到的
------解决方案--------------------
谢谢楼主,学习了
------解决方案--------------------
好的,受教了

------解决方案--------------------
已经工作将近三年了,发现却回答不了楼主的问题,看来三年白过了!
------解决方案--------------------
时钟源受温度影响频偏比较大吧,如果用温补晶振应该能解决部分问题吧
------解决方案--------------------
学习了
------解决方案--------------------
在开始设计之前对整体的结构和性能要有大致的了解,也就是心中有数.等出了问题再去补救往往并不能从根本上解决问题.
------解决方案--------------------
牛人啊! 学习下。
------解决方案--------------------
你们都知道自己要学什么 而米现在迷茫啊

------解决方案--------------------
问你师傅呗,都讲到这份上了,直接问个明白。

路过 学习
------解决方案--------------------
mark
------解决方案--------------------
谢谢了。受教了。
------解决方案--------------------
学习
------解决方案--------------------
marking 
------解决方案--------------------
XUEXILE
------解决方案--------------------
学习
------解决方案--------------------
值得学习,设计思路和系统的构架。