响石潭 给我留言 | 地图 | 日志 | 帮助
医学统计
什么是正态分布?
来源:响石潭 日期:2010-05-24 08:07:50 标签:医学统计 中医
正态分布及渐近正态分布

这是指样本统计量为正态分布或接近正态分布的两种情况,凡符合这两种情况的分布,都可根据正态分布的概率进行统计推论。以平均数为例,有下述情形。

()总体分布为正态,方差(σ2)已知,样本平均数的分布为正态分布。

所谓平均数的分布是指从基本随机变量为正态分布的总体 (又称母总体)中,采用随机抽样的方法,每次从这个总体中抽取大小为n的一个样本,计算出它的平均数 ,然后将这些个体放回总体去,再次取n个个体,又可计算出一个 ,…再将n个个体放回去,再抽取n个个体……这样如此反复,可计算出无限多个 ,这无限多个平均数的分布是属于什么样的分布呢?理论及试验都可证明,这无限多个平均数的分布为正态分布。设母总体的参数为μ(平均数) σ2 (方差),那么,样本平均数分布的平均数与方差(或标准差)与母总体的平均数与方差(或标准差)有如下关系:

                

                     (511a)

                      (511b)

为平均数的平均数, 为平均数分布的方差,常称之为变异误。 为平均数分布的标准差,为了与母体的标准差相区别,一般称 为标准误,或平均数的标准误,也有时用SE表示。

由上可知,样本平均数的平均数与母总体的平均数相同,样本平均数的标准误与母总体的标准差成正比,而与样本容量n成反比。样本含量越大,标准误就越小。

如果横坐标都用总体随机变量的测量单位表示,则总体正态分布低阔,而样本平均数的分布高狭,高狭的程度与样本大小有关。如图58

5-8  母总体与样本平均数分布的比较

但不论母总体的分布还是样本平均数的分布,都可通过求标准分数,将各自的正态分布形式转换成相同的标准正态分布。样本平均数的标准分数,可写作:

                                   (512)

()总体分布非正态,但σ2已知,这时当样本足够大时(n> 30),其样本平均数的分布为渐近正态分布,接近正态分布的程度与样本n.及总体偏斜程度有关。样本n越大,接近得就越好,或总体偏态越小,接近的程度越好。当偏斜较大时,n越大,才接近正态分布。这是中心极限定理内容之一,概率论中早已有证明。

其样本分布的平均数与标准差,与总体的μ及σ之间,也有下述关系

                

                

()方差及标准差的分布

依随机取样的原则,自正态分布的总体中抽取容量为n的样本,当n足够大时(n>30),样本方差及标准差的分布,渐趋于正态分布,这时,其分布的平均数与标准差与母总体的σ2和σ的关系,可近似地表示如下:

                                        (513)

                                     (514)

样本的方差及标准差的分布,渐近正态分布,又能近似地求得标准差分布的平均数( )、方差分布的平均数( )及其标准误( ),这样,便可查正态表,确定其分布的概率。因为这个公式要求n非常大,一般难于保证,故标准差及方差的统计推论,陵少用到渐近分布,而用其精确分布(χ2分布)

除以上所说的几种统计量的分布为正态分布或渐近正态分布外,还有多种统计量的分布也为正态或渐近正态分布,如两样本平均数之差的分布(σ2已知)相关系数的分布,比率的分布等等,具体留待以后诸章介绍。

当知道了某些样本统计量为正态分布或渐近正态分布以后,便可根据正态分布表,求概率。例如,根据正态分布的概率可知,样本平均数中有95%落在μ±1.96 之间,有99%的样本平均落在μ±2.58 王之间。当n满足非常大的条件样本方差与标准差也依同样的规律散布,即有95%的样本标准差落在。σ±1.96σs之间……,有95%的样本方差落在σ2±1.96σs22之间等等。


© 响石潭医生 始于2008隆冬 ChinaDoctor 中国▪四川省古蜀不可斋 进入响石潭前必读 蜀ICP备08110769号