如果有所有平均数的68.26%的平均数 落在μ上下一个 之间,那么可以推理:所有平均数中有68.26%的平均数加上一个或减去一个标准误这一间距之内将包含总体参数μ,也就是说有68.26%的机会被包含在任何一个平均数 ±1 之间,或者说,估计μ在 ±1 之间正确的概率为68.26%。同样的道理可以说:μ在 ±1.96 之间的正确概率为95%,μ在 ±2.58 之间的正确概率为99%,以及其他任何可能的概率。那为什么置信区间用平均数 加、减一定数量的标准误 计算呢?这是因为样本平均数 究竟μ落在的左侧还是右侧是不知道的,故用 ±Zα/2 (Zα/2为样本分布的横坐标值),这一段距离表示置信区间。如果能知 落在μ的左侧,那么 至 +1.96 这一区间内包含μ的可能为97.5%,若能确知 在μ之右侧,那么 至 +1.96 这一区间包含μ的可能亦为97.5%,这样不仅可以缩短置信区间的长度,还可提高正确估计的概率,但事实上这是做不到的。见图6—2
图6-2 的区间估计
当推论出总体参数μ按一定的概率落在某一置信区间时,实际的 值究竟落在分布的哪个位置上并不能确知,它也有可能落在分布的两侧尾部,这时若说μ在 ±Zα/2 之间便是错误的了,不过出现这种错误的可能概率,可以根据样本分布进行计算:其概率为α。例如估计μ在 ±1.96 之间正确的概率为95%,则错误的概率为5%,这5%来自样本分布的左右两尾端各2.5%的样本平均数,因为这些 ±1.96 这一段距离中并不包含μ在内。见图6-3:
图6-3 置信度示意图
其他总体参数的估计原理与平均数的估计原理相同,但所依据的样本分布及标准误不同。 |