响石潭 给我留言 | 地图 | 日志 | 帮助
医学统计
什么是置信区间?
来源:响石潭 日期:2010-08-11 13:44:12 标签:正态分布 置信区间 医学统计 中医

置信区间或称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。置信度又称显著性水平,意义阶段,信任系数等,是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。

例如  95置信区间是指总体参数落在该区间之内,估计正确的概率为95%,而出现错误的概率为95(α=.05),由此可见:

95置信间距=.05显著性水平的置信间距,或.05置信度的置信间距。

99置信间距二.01显著性水平的置信间距,或.01置信度的置信间距。   

显著性水平在假设检验中,还指拒绝虚无假设时可能出现的犯错误的概率水平。

区间估计的原理与标准误

区间估计是根据样本分布的理论,用样本分布的标准误(SE)计算区间长度,解释总体参数落入某置信区间可能的概率。

区间估计存在成功估计的概率大小及估计范围大小,这样两个问题。人们在解决实际问题时,总希望估计值的范围小一点,成功的概率大一些。但在样本容量一定的情况下,二者不可兼得。如果使估计正确的概率加大些,势必要将置信区间加长,若使正确估计的概率为100,即完全估计正确,则置信区间就会很长,也就等于没作估计了。这就像在百分制的测验中你估计一个人的得分可能为0100分之间一样。反之,如果要使估计的区间变小,那就势必会使正确估计的概率降低。

统计分析中一般规定:正确估计的概率,也即置信水平为.95:或.99,那么显著性水平则为.05或.01,这是依据.05或.01属于小概率事件,而小概率事件在一次抽样中是不可能出现的原理规定的。   

区间估计的原理是样本分布理论。即在进行区间估计值的计算及估计正确概率的解释上,是依据该样本统计量时分布规律样本分布的标准误(SE)。也就是说,只有知道了样本统计量的分布规律和样本统计量分布的标准误才能计算总体参数可能落入的区间长度,才能对区间估计的概率进行解释,可见标准误及样本分布对于总体参数的区间估计是十分重要的。样本分布可提供概率解释,而标准误的大小决定区间估计的长度,如果标准误越小可使置信区间的长度变短,而估计成功的概率仍可保持较高水平。一般情况下,加大样本容量可使标准误变小。   

下面以平均数的区间估计为例,说明如何根据平均数的样本分布及平均数分布的标准误,计算置信区间和解释成功估计的概率。第五章已讲到,当总体方差已知时样本平均数的分布为正态分布或渐近正态分布。样本平均数的平均数 ,平均数的离散程度即平均数分布的标准差(简称标准误写作 ) 根据正态分布,可以说:

6826%的 落在μ±1 之间,

95%的 落在μ±196 之间,

99%的 落在μ±258 之间等等。

61  分布的概率

或者说:

μ±1 之间包含所有 6826%,

μ±1.96 之间包含所有 95%,

μ±2.58 之间包含所有 99%,等等。

只要符合正态分布, 的分布一定遵循按正态分布理论所计算出的概率。

可是在实际的研究中,只能得到一个样本的平均数,我们可将这个样本平均数看作无限多个样本平均数之中的一个。当只知样本平均数( ),而不知总体平均数时,可根据平均数的样本分布进行推理。


© 响石潭医生 始于2008隆冬 ChinaDoctor 中国▪四川省古蜀不可斋 进入响石潭前必读 蜀ICP备08110769号