惯用统计量的分布

常用统计量的分布

所谓统计量,就是指没有未知参数的样本的函数。

常见的统计量有:

          样本均值:惯用统计量的分布

          样本方差:惯用统计量的分布

一般认为 S > 0,称作是样本的标准差。


应当区别样本均值与变量的均值,样本的方差与变量的方差。

样本具有一天然的性质,他们与总体都是同分布的。我们统一设总体的均值是惯用统计量的分布,方差是 惯用统计量的分布


值得一说的是,样本方差求和部分的 n 个值并不是完全相互独立的。应该认识到有一明显的约束:

    惯用统计量的分布

从自由度的角度考虑,那 n 个变量的自由度只有 n - 1,那么样本方差的分母是 n - 1 而不是 n 这一点就不是难以理解的了。


类似的,有样本协方差和样本相关系数的定义:

    惯用统计量的分布

    惯用统计量的分布


下面介绍这些统计量的分布:


设总体是正态分布,那么:

1)惯用统计量的分布

    惯用统计量的分布

    惯用统计量的分布

如果认识到 惯用统计量的分布 服从正态分布,并且均值与方差是易求的,第一式就是显然的。

第二式即是第一式的标准化。


2)惯用统计量的分布

    惯用统计量的分布

这个证明有时间再弄。。。挺麻烦的。。。

不过现在应该认识到的是:

1. 左边的自由度的确是 n - 1。。。

2. 左边的期望是 0,这吻合了 惯用统计量的分布分布的定义--是多个标准正态分布的平方和。


3) 惯用统计量的分布惯用统计量的分布 相互独立

证明也略去。。。。


4) 惯用统计量的分布

实际上,只要利用(1)、(2)以及 t 分布的定义,简单化简就可以得到。


5)设有取自两个独立正态总体的两组样本,惯用统计量的分布惯用统计量的分布

    惯用统计量的分布

只要把 惯用统计量的分布,标准化即可得到。


6)设有取自两个独立正态总体的两组样本,惯用统计量的分布惯用统计量的分布,并且惯用统计量的分布

    惯用统计量的分布

只要利用(2)、(5)以以及 t 分布的定义,简单化简即可。


7)设有取自两个独立正态总体的两组样本,惯用统计量的分布惯用统计量的分布

    惯用统计量的分布

利用(2)以及 F 分布定义化简即是之。


以上众多分布若干略显繁琐,那么其意义何在?其实这是参数估计和假设检验的知识准备。