一维随机变量及其概率分布 1. 随机变量的概念 2. 离散型随机变量的分布 3. 几个常见的离散型分布 4. 连续型随机变量分布

顾名思义,随机变量就是“其值随机会而定”的变量。随机变量的反面是“确定性变量”,即其值遵循某种严格的规律的变量,比如从北京到上海的距离。但是从绝对意义上讲,许多通常视为确定性变量的量,本质上都有随机性,只是由于随机性干扰不大,以至在所要求的精度之内,不妨把经作为确定性变量来处理。

根据随机变量其可能取的值的全体的性质,可以把随机变量分为2大类,一类是离散型随机变量,比如检验100件产品中的次品个数;一类是连续型随机变量,比如一个灯泡的寿命。但是连续型变量这个概念只是数学上的抽象,因为任何量都有单位,都只能在该单位下量到一定的精度,所以也一定是离散的,比如灯泡的寿命如果只精确到秒,那它的寿命也是可以离散表示的。

研究随机变量的根本原因是,我们需要研究一些事物身上表现出来的会变动的因子,这些因子的值随机而定,但可能存在某种规律(比如总是取到某些特殊的值),我们需要研究这些规律(比如分布规律),而对这些因子做预测。

2. 离散型随机变量的分布

我们研究随机变量,并不是只关心它能取到哪些值,往往也关心的是它取到某些值的频率如何,即取到该值的概率。这个特性,我们称之为分布。

定义2.1

},则

称为X的概率函数。且有下面的性质:

1

X的分布表。

定义2.2

X为一随机变量,则函数

称为X的分布函数。

对离散型随机变量而言,概率函数与分布函数在下述意义下是等价的。

i

i,只需注意:

)

对于任何随机变量)具有下面的一般性质:

1))

2)当0

研究分布函数的直接原因是可以根据分布函数求概率,另一个原因我觉得是针对于连续型随机变量,因为它研究取某个值的概率没有意义,所以更多的关心的一个范围,比哪灯光寿命1万小时-1.2万小时的可能性大小,像这样范围内的概率用分布函数更容易求得。

3. 几个常见的离散型分布

3.1. 二项分布

某事件),同时这种试验称为伯努利试验。

n

k(加法公式)。

在研究连续型随机变量分布后,我们发现二项分布概率分布与高斯分布密度函数曲线一致。

3.2. 泊松分布

若随机变量,且概率分布为

!

则称0是一常数。

Poisson分布是用来描述稀有事件的概率的,比如:一定时间内红绿灯口发生事故的次数和总机接到电话的次数。

Poisson分布实际上是在p很小时,二项分布的一个近似:

λ

λ

3.3. 超几何分布

设有N个产品,其中有M个不合格品,若从中不放回地随机抽取),超几何分布的概率分布列为:

r

其中

N改变甚微,所以不放回抽样,可以近似地看成回抽样,这里超几何分布可以用二项分布近似。

N

3.4. 几何分布

在伯努利试验序列中,记每次试验中事件),其分布列为:

几何分布的无记忆性:设),则对任意正整数m与n有

)

上面这个公式表明在一系列的事件中,若前m次实验中事件A没有出现,则接下来的n次试验中A仍未出现的概率只与n有关,似乎忘记了前m次试验结果。

3.5. 负二项分布

在伯努利试验序列中,记每次试验中事件A发生的概率为),概率分布为:

4. 连续型随机变量分布

对于连续型变量的概率分布,不能用像离散型变量那种方法去描述。原因在于,这种变量的取值充满一个区间,无法一一排出。若指定一个值i是不可能事件。

刻画连续型随机变量的概率分布的一个方法是利用概率分布函数,但是在理论和实用上更方便因则更常用的方法,是使用所谓“概率密度函数”或简称密度函数。

定义4.1

设连续性随机变量X有概率分布函数),称为X的概率密度函数。

连续型随机变量)都具有以下三条基本性质:

1)0

2)1

3)对任何常数x

4.1. 正态分布

由中心极限定理可知:

一个变量如果是由大量微小的、独立的随机因素的叠加结果,那么这个变量一定是正态变量。因此很多随机变量可以用正态分布描述或近似描述,譬如测量误差、产品重量、人的身高、年降雨量等。

若随机变量X的密度函数为

X服从正态分布或高斯分布。

一维随机变量及其概率分布
1. 随机变量的概念
2. 离散型随机变量的分布
3. 几个常见的离散型分布
4. 连续型随机变量分布

1时,上面的概率密度函数变为

π−−√

它是正态分布)

)

4.2. 均匀分布

若随机变量X的密度函数为

则称)

4.3. 指数分布

若随机变量X的密度函数为

则称)

下图显示了指数分布当0处不连续。

一维随机变量及其概率分布
1. 随机变量的概念
2. 离散型随机变量的分布
3. 几个常见的离散型分布
4. 连续型随机变量分布

因为指数分布随机变量只可能取非负实数,所以指数分布被用作各种“寿命”分布,譬如电子元件的寿命,动物的寿命等。

0

上式表明,如果元件在1就是平均寿命。

指数分布描述的是一种无老化的寿命分布,在实际中是不可能的,因而只是一种近似。对一种元器件在使用初期老化现象很小,所以在这个阶段指数分布描述了其寿命分布情况。而人在50或60岁之前,生理老化而死亡的因素是次要的。排除那些意外情况,人的寿命在这个阶段也是接近指数分布的。

4.4. 威布尔分布

指数分布在寿命问题上忽略了老化问题,如果我们需要考虑老化问题,则显然失效率真应该随时间而上升,不能为常数,比如取为一个0,得出:

1

λ,得到:

0

概率密度函数为:

实际上指数分布是威布尔分布当1时的特例。