婵犵數濮烽。钘壩i崨鏉戠;闁规崘娉涚欢銈呂旈敐鍛殲闁稿顑夐弻锝呂熷▎鎯ф閺夆晜绻堝铏规崉閵娿儲鐝㈤梺鐟板殩閹凤拷 闂傚倸鍊搁崐鐑芥嚄閼哥數浠氭俊鐐€栭崹鐢稿箠閹版澘绠查柕蹇嬪€曠粻锝夋煥閺囨浜鹃梺钘夊暟閸犳牠寮婚妸鈺傚亞闁稿本绋戦锟� 闂傚倸鍊搁崐鐑芥嚄閼哥數浠氱紓鍌欒兌缁垶銆冮崨瀛樺仼闁绘垼濮ら崑銊х磼鐎n偄顕滈柣搴墴濮婅櫣鎹勯妸銉︾彚闂佺懓鍤栭幏锟� 闂傚倸鍊搁崐宄懊归崶銊х彾闁割偅鎯婂☉銏犵妞ゆ牑鍋撻柛銉墮缁€鍐煠绾板崬澧繛鍫濄偢濮婅櫣鎹勯妸銉︾彚闂佺懓鍤栭幏锟� 缂傚倸鍊搁崐鎼佸磹妞嬪海鐭嗗〒姘e亾闁诡垰顦甸幊鏍煛閸屾艾绨ユ繝鐢靛█濞佳囨偋韫囨洜鐭嗗┑鐘叉处閻撱儵鏌i弴鐐测偓鍦偓姘炬嫹 闂傚倸鍊搁崐椋庣矆娓氣偓楠炴牠顢曢敃鈧壕鐟扳攽閻樺疇澹樼紒鐘靛█閺岀喖骞嗚閹界姵绻涢崨顖氣枅闁哄被鍔戦幃銈夊磼濞戞﹩浼� 婵犵數濮烽弫鎼佸磻閻愬搫鍨傞悹杞扮秿濞戙垹绠i柣鎰缁犳岸姊洪幖鐐插姶闁告挻宀稿畷鏇㈠箻缂佹ḿ鍙嗛梺缁樻礀閸婂湱鈧熬鎷� 婵犵數濮烽弫鎼佸磻閻愬搫鍨傞柛顐f礀缁犲綊鏌嶉崫鍕櫣闁活厽顨婇弻宥堫檨闁告挻鐩崺鈧い鎺戝枤濞兼劙鏌熺喊鍗炰喊妤犵偛绻橀弫鎾绘晸閿燂拷 闂傚倸鍊峰ù鍥х暦閻㈢ǹ绐楅柟鎵閸嬶繝鏌曟径鍫濆壔婵炴垶菤閺€浠嬫倵閿濆啫濡烽柛瀣崌瀹曟帡鎮欑€涙ɑ顏熼梻浣芥硶閸o箓骞忛敓锟�

婵犵數濮烽弫鎼佸磻閻愬搫鍨傞柛顐f礀缁犲綊鏌嶉崫鍕櫣闁活厽顨婇弻宥堫檨闁告挻鐩崺鈧い鎺戝枤濞兼劙鏌熼崨濠冨€愮€规洘鍔欏畷褰掝敋閸涱厽顓块梻浣稿閸嬪懎煤閺嶎偆涓嶆慨姗嗗劒瑜版帗鏅查柛娑卞幗濞堟煡姊烘總鍛婃锭缂傚秴锕璇测槈閵忕姷鐫勯梺绋挎湰绾板秹鎮樻笟鈧铏圭磼濡⒈鏆¢梺绋垮婵炲﹪骞冩ィ鍐╊棃婵炴垼椴搁崓鐢告⒑閼测敚褰掓倶濮樿泛姹查柣妯肩帛閳锋垿鏌涘┑鍡楊伀闁诲繘浜堕弻娑㈡偐瀹曞洤鈪归梺浼欑到閸㈡煡銈导鏉戦唶闁绘柨鎲¢鐔兼⒒娴h姤纭堕柛锝忕畵楠炲繘鏁撻敓锟�

缂傚倸鍊搁崐鎼佸磹妞嬪海鐭嗗〒姘e亾閽樻繈鏌熷畡鐗堟拱闁瑰啿鐭傚缁樻媴閸涘﹥鍎撻梺娲诲墮閵堢ǹ鐣锋导鏉戝唨鐟滄粓宕甸弴銏$厱濠电姴瀚弸鏃堟煟閵堝倸浜鹃梻鍌欑閹碱偄煤閵娾晛绐楅柟鍓х帛閸嬫﹢鏌曟径鍡樻珕闁抽攱鍨块弻鐔虹矙閸ф鈧鏌涢悩铏闁哄瞼鍠栧畷娆撳Χ閸℃浼� 闂傚倸鍊搁崐椋庣矆娓氣偓楠炲鏁撻悩鑼槷闂佸搫娲㈤崹鍦不閻樼粯鐓欓柡澶婄仢缁ㄨ崵绱撳鍡欏⒌闁哄被鍔戦幃銈夊磼濞戞﹩浼� 婵犵數濮烽弫鍛婃叏娴兼潙鍨傚┑鍌溓归弰銉╂煛瀹ュ骸骞楅柛瀣儐缁绘繃绻濋崒婊冣拪缂傚倸绉甸悧鐘诲蓟閵娾晜鍋嗛柛灞剧☉椤忥拷 婵犵數濮烽弫鍛婃叏閻戝鈧倹绂掔€n亞鍔﹀銈嗗笒閸燁垶鎮甸鍡忓亾閻熺増鍟炵紒璇插暣婵$敻宕熼锝嗘櫇濡炪倖甯婄粈渚€顢旈敓锟� 闂傚倸鍊搁崐鐑芥倿閿曞倹鍎戠憸鐗堝笒閸ㄥ倸霉閻樿尙鎳佸鑸靛姇缁犺霉閸忚偐鎳呯紒瀣箻濮婅櫣鎹勯妸銉︾彚闂佺懓鍤栭幏锟� 闂傚倸鍊搁崐椋庣矆娓氣偓楠炲鏁撻悩鍐蹭画闂備緡鍓欑粔瀵哥不椤栫偞鐓ラ柣鏇炲€圭€氾拷 闂傚倸鍊搁崐椋庣矆娓氣偓楠炴饪伴崟顐㈢亖闂佸湱铏庨崰鏍不椤栫偞鐓ラ柣鏇炲€圭€氾拷 婵犵數濮甸鏍窗濡も偓閻g兘宕归鍛倯闂佺硶鍓濋〃蹇斿閿燂拷 闂傚倸鍊搁崐鐑芥倿閿曗偓椤啴骞愭惔锝庢锤闂佺粯鍨煎Λ鍕不椤栫偞鐓ラ柣鏇炲€圭€氾拷 闂傚倸鍊搁崐鐑芥嚄閸洖鍌ㄧ憸搴ㄥ箚閺傚簱鍫柛顐g箘椤斿棝姊虹捄銊ユ珢闁瑰嚖鎷� 闂傚倸鍊搁崐鐑芥嚄閼哥數浠氭繝娈垮枟閿曨偆绮婚幋锕€鐓濋柡鍐ㄧ墕閸楄櫕銇勯顐㈡灓缂佸绻樺铏规崉閵娿儲鐝㈤梺鐟板殩閹凤拷 闂傚倸鍊搁崐宄懊归崶銊х彾闁割偒婢€閻掑﹥绻涢崱妯哄闁告瑥绻愯灃闁挎繂鎳庨弳娆戠棯閹勫仴闁哄被鍔戦幃銈夊磼濞戞﹩浼� 濠电姷鏁告慨鐑藉极閹间礁纾绘繛鎴旀嚍閸ヮ剦鏁嶉柣鎰綑濞堬絽顪冮妶鍡欏缂侇喖娴风划鍫ュ礋椤栨稓鍙嗛梺缁樻礀閸婂湱鈧熬鎷� 闂傚倸鍊搁崐鐑芥嚄閸洖鍌ㄧ憸宥夘敋閿濆绀堝ù锝囨嚀鎼村﹪姊虹化鏇炲⒉缂佸鍨规竟鏇㈠锤濡や胶鍙嗛梺缁樻礀閸婂湱鈧熬鎷� 闂傚倸鍊搁崐鐑芥嚄閸洖鍌ㄧ憸宥夘敋閿濆绀堝ù锝堟閻撴捇姊洪崫鍕枆闁告ǹ鍋愭竟鏇熺節濮橆厾鍙嗛梺缁樻礀閸婂湱鈧熬鎷� 婵犵數濮撮惀澶愬级鎼存挸浜炬俊銈勭劍閸欏繐霉閸忓吋缍戠紒鈧径鎰闁圭⒈鍘鹃崢婊呯磽瀹ュ棛澧甸柡灞诲姂閹倝宕掑☉姗嗕紦 缂傚倸鍊搁崐鎼佸磹瀹勯偊娓婚柟鐑橆殕閸ゅ嫰鏌涢锝嗙缁炬儳顭烽弻锝夊棘閹稿孩鍎撻梺鎼炲妽缁诲牓寮婚妸鈺傚亞闁稿本绋戦锟� 闂傚倸鍊搁崐椋庣矆娓氣偓楠炲鏁嶉崟顓犵厯闂佽宕橀褔宕掗妸褎鍠愰柡鍐ㄧ墢瀹撲線鏌涢埄鍐姇闁哄懏鎮傞弻銊╂偆閸屾稑顏� 闂傚倸鍊搁崐鐑芥倿閿曗偓椤啴宕稿Δ浣镐簵闂佸壊鍋侀崕杈╃玻濡や胶绠鹃柟瀛樼懃閻忊晝鐥幆褜鐓奸柡灞诲姂閹倝宕掑☉姗嗕紦 闂傚倸鍊搁崐宄懊归崶銊х彾闁割偒婢€閻掑﹥銇勮箛鎾愁仱闁哄鐗犻弻锟犲炊閳轰讲鍋撻敐澶嬫櫜濠㈣泛顑嗗▍銏ゆ⒑鐠恒劌娅愰柟鍑ゆ嫹 缂傚倸鍊搁崐鎼佸磹閹间礁纾圭紒瀣紩濞差亜围闁糕檧鏅滈鏃堟⒑瑜版帗锛熺紒璁圭節瀵偅绻濋崶銊у弳闂佺粯娲栭崐鍦偓姘炬嫹 濠电姷鏁告慨鐑藉极閸涘﹥鍙忛柟缁㈠枟閺呮繈鏌曢崼婵愭▓闁轰礁瀚伴弻娑㈩敃椤掑倻蓱闂佹寧鍐婚幏锟� 闂傚倷娴囬褍霉閻戣棄纾婚柨婵嗩槸绾捐绻涢幋鐐冩岸寮搁弽銊х闁瑰瓨鐟ラ悞娲煛娴e壊鍎旈柡灞诲姂閹倝宕掑☉姗嗕紦 闂傚倸鍊搁崐鎼併偑閹绢喖纾婚柛鏇ㄥ€嬪ú顏勎у璺猴功閺屽牓姊虹憴鍕姸婵☆偄瀚划鍫ュ醇閵夛妇鍙嗛梺缁樻礀閸婂湱鈧熬鎷� 婵犵數濮烽。顔炬閺囥垹纾绘繛鎴欏焺閺佸嫰鏌涢妷顔煎缂佹劖顨婇弻鐔煎箲閹伴潧娈梺鍛婂灩婵炩偓闁哄被鍔戦幃銈夊磼濞戞﹩浼� 闂傚倸鍊搁崐椋庣矆娴i潻鑰块弶鍫涘妿娴犳碍淇婇悙顏勨偓褏绱撳璺虹闁瑰墎鏅畵浣糕攽閻樺弶澶勯柡鍛倐閺屻劑鎮ら崒娑橆伓 濠电姷鏁告慨鐑藉极閹间礁纾绘繛鎴欏灪閸庢棃鏌ゅù瀣珔闁搞劍绻冮妵鍕冀椤愵澀绮堕梺钘夊暟閸犳牠寮婚敐澶婄睄闁稿鍟垮﹢鍗炩枎閵忋倖鍊烽柛顭戝亜閺嬫垿鎮楅獮鍨姎妞わ富鍨堕幆灞轿旈崨顔惧弳闂佺粯娲栭崐鍦偓姘炬嫹
 《医学统计学》 > 第八章 直线相关与回归

第一节 直线相关

 

一、相关系数的意义

相关分析是用相关系数(r)来表示两个变量间相互的直线关系,并判断其密切程度的统计方法。相关系数r没有单位。在-1~+1范围内变动,其绝对值愈接近1,两个变量间的直线相关愈密切,愈接近0,相关愈不密切。相关系数若为正,说明一变量随另一变量增减而增减,方向相同;若为负,表示一变量增加、另一变量减少,即方向相反,但它不能表达直线以外(如各种曲线)的关系。

为判断两事物数量间有无相关,可先将两组变量中一对对数值在普通方格纸上作散点图,如图9.1~9.8所示。图中点子的分布可出现以下几种情况:

正相关——见图9.1,各点分布呈椭圆形,Y随X的增加而增加,X亦随Y的增加而增加,此时1>r>0。椭圆范围内各点的排列愈接近其长轴,相关愈密切,当所有点子都在长轴上时,r=1(见图9.2),称为完全正相关。

负相关——见图9.3,各点分布亦呈椭圆形,Y随X的增加而减少,X也随Y的增加而减少,此时0>r>-1。各点排列愈接近其长轴,相关愈密切,当所有点子都在长轴上时,r=1(见图9.4),称为完全负相关。

在生物现象中,完全正相关或完全负相关甚为少见。

无相关——见图9.5、图9.6和图9.7,X不论增加或减少,Y的大小不受其影响;反之亦然。此时r=0。另外,须注意有时虽然各点密集于一条直线,但该直线与X轴或Y轴平行,即X与Y的消长互不影响,这种情况仍为无相关。

非线性相关——见图9.8,图中各点的排列不呈直线趋势,却呈某种曲线形状,此时r≈0,类似这种情况称为非线性相关。

不同相关系数的散点示意图

图9.1—9.8 不同相关系数的散点示意图

 

二、相关系数的计算及假设检验

(一)相关系数计算法

计算相关系数的基本公式为:

计算相关系数的基本公式

(9.1)

式(9.1)中r为相关系数,∑(X-X)2为X的离均差平方和,∑(Y-Y)2为Y的离均差平方和,∑(X-X)(Y-Y)为X与Y的离均差乘积之和,简称离均差积之和,此值可正可负。以此式为基础计算相关系数的方法称积差法,在实际应用时式(9.1)中各离均差平方和(简称差方和)与积之和可化为

(9.2)

现举例说明计算相关系数的一般步骤:

例9.1 测定15名健康成人血液的一般凝血酶浓度(单位/毫升)及血液的凝固时间(秒),测定结果记录于表9.1第(2)、(3)栏,问血凝时间与凝血酶浓度间有无相关?

1.绘图,将表9.1第(2)、(3)栏各对数据绘成散点图,见图9.9。

2.求出∑X、∑Y、∑X2、∑Y2、∑XY,见表9.1下方。

3,代入公式,求出r值。

凝血时间与凝血酶浓度散点图及回归直线

图9.9 凝血时间与凝血酶浓度散点图及回归直线

表9.1 相关系数计算表

受试者号
(1)
凝血酶浓度(单位/毫升)
X
(2)
凝血时间(秒)
Y
(3)
11.114
21.213
31.015
40.915
51.213
61.114
70.916
80.915
91.014
100.916
111.115
120.916
131.114
141.015
150.817
合计15.1222

∑X=15.1 ∑Y=222
      ∑XY=221.7 
∑X2=15.41∑Y2=3304   

本例的相关系数r=-0.9070,负值表示血凝时间随凝血酶浓度的增高而缩短;绝对值∣-0.9070∣表示这一关系的密切程度。至于此相关系数是否显著,则要经过下面的分析。

(二)相关系数的假设检验

虽然样本相关系数r可作为总体相关系数ρ的估计值,但从相关系数ρ=0的总体中抽出的样本,计算其相关系数r,因为有抽样误差,故不一定是0,要判断不等于0的r值是来自ρ=0的总体还是来自ρ≠0的总体,必须进行显著性检验。检验假设是ρ=0,r与0的差别是否显著要按该样本来自ρ=0的总体概率而定。如果从相关系数ρ=0的总体中取得某r值的概率P>0.05,我们就接受假设,认为此r值的很可能是从此总体中取得的。因此判断两变量间无显著关系;如果取得r值的概率P≤0.05或P≤0.01,我们就在α=0.05或α=0.01水准上拒绝检验假设,认为该r值不是来自ρ=0的总体,而是来自ρ≠0的另一个总体,因此就判断两变量间有显著关系。

由于来自ρ-0的总体的所有样本相关系数呈对称分布,故r的显著性可用t检验来进行。本例r=-0.9070,进行t检验的步骤为:

1.建立检验假设,H0:ρ=0,H1:ρ≠0,α=0.01

2.计算相关系数的r的t值:

(9.3)

3.查t值表作结论

ν=n-2=15-2=13

根据专业知识知道凝血酶浓度与凝血时间之间不会呈正相关,故宜用单侧界限,查t值表得

t0.01,13=2.650

今∣tr∣>t0.01,13,P<0.01,在α=0.01水准上拒绝H0,接受H1,故可认为凝血时间的长短与血液中酶浓度有负相关。

为简化tr检验的计算过程,数理统计工作者根据t分配表,已把不同自由度时r的临界值求出,并列成相关系数界值表(见附表11)。故求相关系数后,只需查表就可知道该r值是否显著,而不必再计算tr值。

r的显著性界限为

|r|<R0.05,ν P>0.05 相关不显著

r0.05,,≤|r|<r0.01,, 0.05≥P>0.01

在α=0.05水准上相关显著

|r|≥r0.01,, P≤0.01 在α=0.01水准上相关显著

例9.1的ν =15-2=13,查附表11中P(1)的界值,得:

r0.05,13=0.441r0.01,13=0.592

现r=-0.9070,∣r∣>r0.01,13,P<0.01,按α=0.01水准,拒绝HO,接受H1。认为ρ≠0,说明凝血时间的长短与血液中凝血酶浓度有负相关。结论与计算所得一致。

相关系数的显著性与自由度的大小有关,如n=3,ν=1时,虽r=-0.9070,却为不显著;若ν=400时,即使r=0.1000,亦为显著。因此不能只看r的值,不考虑ν就下结论。

 

Copyright @ 2002-2010 婵犵數濮烽弫鎼佸磻閻愬搫鍨傞柛顐f礀缁犲綊鏌嶉崫鍕櫣闁稿被鍔戦弻銈吤圭€n偅鐝掗梺缁樺笒閿曨亪寮婚敐鍛傛棃鍩€椤掑嫭鍋嬮煫鍥ㄧ☉閻撴繈鏌¢崘锝呬壕闂侀潧娲ょ€氫即鐛鈧、娑樜旈埀顒佺閸撗€鍋撶憴鍕婵炲眰鍨藉畷鎴﹀箛椤斿墽锛濋梺绋挎湰閻熝囁囬敂濮愪簻闁挎棁妫勯婊堟煙缁涘浜版慨濠冩そ瀹曨偊宕熼鐘辩礃闂備礁鎽滄慨鐢稿箰閹灛锝夊箛閺夎法鐫勯梺鍓插亞閸犳劕鈻嶉姀銈嗏拺閻犳亽鍔屽▍鎰版煙閸戙倖瀚�. xxmy.com 闂傚倸鍊搁崐鐑芥嚄閸撲礁鍨濇い鏍亼閳ь剙鍟村畷銊р偓娑櫭禍杈ㄧ節閻㈤潧孝闁稿﹤顕槐鎾愁潩閼哥數鍘卞銈嗗姉婵挳宕濆杈╃<闁绘﹩鍠栭崝锕傛煛鐏炵晫啸妞ぱ傜窔閺屾盯骞樼捄鐑樼€诲銈嗘穿缂嶄線骞冩禒瀣窛濠电姴鍟鐔兼⒒娴h姤纭堕柛锝忕畵楠炲繘鏁撻敓锟� 濠电姷鏁告慨鐑藉极閸涘﹥鍙忔い鎾卞灩绾惧鏌熼崜褏绡€缂佽妫濋弻鏇㈠醇濠靛洤顦╅梺鎼炲€栧Σ鍫濃攽閻樺灚鏆╁┑顔诲嵆瀹曡绺介崜鍙夋櫓闂佸湱澧楀妯肩不椤栫偞鐓ラ柣鏇炲€圭€氾拷10017704闂傚倸鍊搁崐椋庣矆娓氣偓楠炲鏁撻悩鍐蹭画闂備緡鍓欑粔瀵哥不椤栫偞鐓ラ柣鏇炲€圭€氾拷