响石潭
医学硕士,不为良相则为良医,不为良医则为良相。
一、什么是相关 事物总是相互联系的,它们之间的关系多种多样。分析起来,大概有以下几种情况:一种是因果关系,即一种现象是另一种现象的因,而另一种现象则是果。例如学习的努力程度是学习成绩好坏的因(至少是部分的因);在一定刺激强度范围内,刺激强度经常是反应强度的因等等。第二种是共变关系,即表面看来有联系的两种事物都与第三种现象有关,这时两种事物之间的关系,便是共变关系。例如春天出生的婴儿与春天栽种的小树,就其高度而言,表面上看来都在增长,好像有关,其实,这二者都是受时间因素影响在发生变化,在它们本身之间并没有直接的关系。第三种是相关关系,即两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系。具有相关关系的两种现象之间,关系是较复杂的,甚至可能包含有暂时尚未认识的因果关系及其共变关系在内。例如,同一组学生的语文成绩与数学成绩的关系,即属于相关关系。 统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度。相关的情况有以下三种。一是两列变量变动方向相同。,即一种变量变动时,另工种变量亦同时发生或大或小与前一种变量同方向的变动,这称为正相关。如身高与体重的关系,一般讲身长越长体重就越重。第二种相关情况是负相关,这时两列变量中若有一列变量变动时,另一列变量呈或大或小但与前一列变量指向相反的变动。例如初学打字时练习次数越多,出现错误的量就越少等等。第三种相关是零相关,即两列变量之间无关系。这种情况下,一列变量变动时,另一列变量作无规律的变动。如学习成绩优劣与身高之间的关系,就属零相关,即无相关关系,二者都是独立的随机变量。 二、相关系数 相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。作为样本间相互关系程度的统计特征数,常用r表示,作为总体参数,一般用ρ表示,并且是指线性相关而言。 相关系数的取值介于—1.00至+1.00之间,常用小数形式表示。它只是一个比率,不代表相关的百分数,更不是相关量的相等单位的度量。相关系数的正负号,表示相关方向,正值表示正相关,负值表示负相关。相关系数取值的大小表示相关的程度。相关系数为0时,称零相关即毫无柜关,为1.00时,表示完全正相关,相关系数为—1.00时,为完全负相关。这二者都是完全相关。如果相关系数的绝对值在1.00与0之间不同时,则表示关系程度不同。接近1.00端一般为相关程度密切,接近0值端一般为关系不够密切。(注意:若是非线性相关关系,而用直线相关计算r值可能很小,但不能说二变量关系不密切)关于这一点如何判定,尚须考虑计算相关系数时样本数目的多少。如果样本数目较少,受取样偶然因素的影响较大,很有可能本来无关的两类事物,却计算出较大的相关系数来。例如欲研究身高与学习有无关系,如果只选3、5个人,很可能遇到身材愈高学习愈好这一类偶然现象。这时虽然计算出的相关系数可能接近1.00,但实际上这两类现象之间并无关系。究竟如何综合考虑样本数目大小,相关系数取值大小而判定相关是否密切这一问题,一般要经过统计检验后方能确定。 相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,如只能说相关系数 r=0.50的两列数值比相关系数r=0.25的两列数值之间的关系程度更密切,而绝不能说前二者的密切程度是后二者密切程度的两倍。也不能说相关系数从0.25到0.50与从0.50到0.75所提高的程度一样多。存在相关关系,即相关系数取值较大的两类事物之间,不一定存在因果关系,这一点要从事物的本质方面进行分析,绝不可简单化。 |