响石潭
医学硕士,不为良相则为良医,不为良医则为良相。
(一)二项分布是离散型分布,概率直方图是跃阶式的。因为x为不连续变量,用概率条图表示更合适,用直方图表示只是为了更形象些。 1.当p=q时图形是对称的 例2 (p+q)6,p=q=1/2,各项的概率可写作: p6+6p5q+15p4q2+20p3q3+15p2q4+6plq5+q6 = 1/64+6/64+15/64+20/64+15/64+6/64+1/64 = 1 2.当p≠q时,直方图呈偏态,p<q与p>q的偏斜方向相反。如果n很大,即使p≠q,偏态逐渐降低,最终成正态分布,二项分布的极限分布为正态分布。故当n很大时,二项分布的概率可用正态分布的概率作为近似值。何谓n很大呢?一般规定:当p<q且np≥5,或p>q且nq≥5,这时的n就被认为很大,可以用正态分布的概率作为近似值了。 (二)二项分布的平均数与标准差 如果二项分布满足p<q,np≥5,(或p>q,np≥5)时,二项分布接近正态分布。这时,也仅仅在这时,二项分布的x变量(即成功的次数)具有如下性质: μ= np (5—10a) 即x变量具有μ= np, 式中n为独立试验的次数, p为成功事件的概率,q=1- p。 由于n很大时二项分布逼近正态分布,其平均数,标准差是根据理论推导而来的,故用μ和σ而不用X和S表示。它们的含意是指在二项试验中,成功的次数的平均数μ=np,成功次数的分散程σ=npq。例如一个掷10枚硬币的试验,出现正面向上的平均次数为5次(μ=1/2*10),正面向上的散布程度为10*(1/2)*(1/2)= 1.58(次),这是根据理论的计算,而在实际试验中,有的人可得10个正面向上,有人得9个、8个……,人数越多,正面向上的平均数越接近5,分散程度越接近1.58。 |