




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
事物間的相關關系——相關分析第9章內容提要9.1相關分析概述相關分析概述尋找變量間的關系是科學研究的首要目的。變量間的關系最簡單的劃分即:有關與無關。在統計學上,我們通常這樣判斷變量之間是否有關:如果一個變量的取值發生變化,另外一個變量的取值也相應發生變化,則這兩個變量有關。如果一個變量的變化不引起另一個變量的變化則二者無關。對相關關系的測量:散點圖相關系數(一)散點圖散點圖是考察兩個變量之間相關關系的最直觀的圖形,以點的分布反映兩變量之間的關系。Graphs——LegacyDialogs——Scatter/Dot省級衛視競爭分化情況(一)散點圖例:數據“收視率前15.sav”包含了2010年國內電視頻道全天收視率及收視份額前15名的數據。試作散點圖考察電視頻道收視率與收視份額的關系。選入標志觀測量的變量勾選顯示觀測量的標志(一)散點圖添加回歸趨勢線(二)相關系數雖然散點圖能夠直觀地展現變量之間的統計關系,但并不精確。相關系數以數值的方式精確地反映了兩個變量間線性相關的強弱程度。對不同類型的變量應采用不同的相關系數指標,但其取值范圍和含義都是相同的:相關系數r的取值在[-1,1]之間;r>0表示兩變量存在正的線性相關關系;r<0表示兩變量存在負的線性相關關系;r=0表示兩變量無線性相關關系;r=1表示兩變量完全正相關;r=-1表示兩變量完全負相關;
|r|>0.8表示兩變量之間具有較強的線性關系;|r|<0.3表示兩變量之間的線性相關關系較弱。9.2定類變量的相關定類變量的相關——列聯相關當卡方檢驗的結果是顯著的,則可知兩個變量之間是不獨立的,即一個變量對另一個變量有影響。這種影響程度有多強呢?這就要計算其中的關聯強度。關聯強度是指兩個不獨立的變量之間的關系有多緊密。卡方檢驗從定性的角度分析是否存在相關,各種關聯指標從定量的角度分析相關的程度如何。定類變量的相關用于測量定類變量關聯強度的測量指標變量間是否具有對稱關系:對于兩個變量X和Y,如果我們認為X會影響Y,而Y不會影響X,就稱X和Y具有不對稱關系;反之,如果我們不確定或不區分X影響Y,還是Y影響X,就稱X和Y是對稱關系。相關系數是否具有消減誤差比例的意義:如果Y與X有關系,那么利用X的信息來預測Y時,就會比不知道X的值來預測Y避免一定的盲目性,從而減少若干誤差。X和Y的關系越密切,減少的誤差會越多。預測時能夠減少多少誤差,可以反映X和Y之間關系的強弱。定類變量關聯強度的測量指標Phi系數:最簡單的基于卡方的測量指標。對于大于2×2的列聯表,其值可能大于1,故該系數主要用于2×2的列聯表。C系數(ContingencyCoefficient):對Phi系數進行了一定的修正,其值介于0~1之間。但隨著列聯表行列的增加,C系數會不斷地接近1,但不可能等于1。故即使兩個變量間有最強的關聯強度,從C系數中也得不到反映,所以C系數對格數太少的列來說并不是好的測量指標,它會低估關聯強度。
CV系數(Cramer’sV):也是對Phi系數的一種修正,同時相對于C系數,解決了對列聯表單元格數目限制的問題,其值介于0~1之間,也可以等于0或1。適用于對稱關系的相關系數:定類變量關聯強度的測量指標Lambda系數:取值在0~1之間,這個值越大,說明自變量對預測的因變量的幫助越大。如果它為1,說明自變量有良好的預測因變量的能力;如果它為0,說明自變量信息對預測因變量沒有任何用處。Tau-y系數:針對兩個變量具有不對稱關系給出的相關系數,具有消減誤差比例的意義。Tau-y系數比Lambda系數更敏感。不確定系數(UncertaintyCoefficient):取值在0~1之間。值越大,說明自變量對預測的因變量幫助越大。如果它為1,說明自變量可向因變量提供最多的信息;如果它為0,說明自變量對預測因變量沒有用。適用于消減誤差比例的相關系數(非對稱關系):定類變量關聯強度的測量指標例:根據數據“住房狀況調查.sav”,分析戶口狀況與房屋產權之間是否存在顯著的相關關系?關聯程度有多強?判斷定類變量之間的關聯性(獨立性)先進行卡方檢驗。當樣本量n≥40,且只有20%以下的單元格的期望頻數1≤fe<5時,用對數似然比計算的卡方。定類變量關聯強度的測量指標本例中兩變量屬于非對稱關系,因此選擇適用于消減誤差比例的相關系數。定類變量關聯強度的測量指標在5%的顯著性水平下,兩變量的相關關系顯著。tau-y相關系數說明:戶口狀況作為因變量時,即用房屋產權去預測戶口狀況可消減8.5%的誤差;而用戶口狀況去預測房屋產權可消減3.4%的誤差。9.3定序變量的相關定序變量關聯強度的測量指標對于定序變量,排列順序也可傳達有用的信息。對定序變量之間關聯強度的測量叫“等級相關”Nc——同序對:定序變量x和定序變量y有相同的變化方向;Nd——逆序對:定序變量x和定序變量y有相反的變化方向;T——同分對:定序變量x和定序變量y都不變動。用于測量定序變量定序變量關聯強度的測量指標Gamma系數:用于測量定序變量等級相關的測量指標,取值在-1≤Gamma≤1;當Gamma=0時,表示兩個定序變量沒有關聯;當0<Gamma<1,表明兩個變量等級正相關;當-1<Gamma<0,表明兩個變量等級負相關;當Gamma=1,表明兩個變量完全正相關;當Gamma=-1,表明兩個變量完全負相關。Kendall’stau-b系數:適用于行列數相等的情況;Kendall’stau-c系數:適用于行列數不等的情況。適用于對稱關系的相關系數:定序變量關聯強度的測量指標Spearman等級相關系數:適用于兩個變量是定序變量且呈線性關系。當兩個變量是定距變量,變量之間呈線性關系,但不滿足積差相關系數所要求的條件(如不滿足正態性要求),可采用Spearman等級相關系數。Spearman等級相關系數要求是定序變量。適用于對稱關系的相關系數:定序變量關聯強度的測量指標Somers’d系數:考慮變量X和變量Y具有不對稱的關系。d的取值在-1~1之間,絕對值越大,兩個變量的相關性越強絕對值越接近于0,兩個變量的相關性越小d大于0,兩變量正相關;反之負相關d還具有消減誤差比例的意義,如dy=0.58,說明用x預測y時,將比不知道x預測y減少58%的誤差。適用于非對稱關系的相關系數:定序變量的相關分析例:數據會考成績.sav是某班學生的物理和數學成績,已經進行了等級變換,1為優,5為不及格,試分析該班學生的物理成績和數學成績是否有顯著的相關性判斷定類變量之間的關聯性(獨立性)先進行卡方檢驗。卡方檢驗結果顯著,說明兩變量不獨立。定序變量的相關分析本例中兩變量屬于對稱關系,且行列數相等,可選擇Gamma和Kendall’stau-b系數。定序變量的相關分析可見數學成績和物理成績相關關系顯著,Gamma系數為0.777,呈現較強的正相關關系。定序變量的相關分析例:數據會考成績.sav是某班學
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 經濟作物高效智能收獲裝備企業縣域市場拓展與下沉戰略研究報告
- 農村改造用地合同標準文本
- 出租衣櫥改造合同樣本
- led政府合同樣本
- 三輪車修理轉讓合同樣本
- 醫院居間合同標準文本
- 北京抵押車合同樣本
- 農場收購設備合同樣本
- 包工施工合同樣本
- 保修延長期合同樣本
- 小學英語-《Caterpillar,caterpillar》教學設計學情分析教材分析課后反思
- 長郡中學小升初招生考試數學真題試卷(含答案)
- 紡紗織造工藝流程培訓教材實用課件
- 中美關系新時代52張課件
- 廣東省廣州市廣外、鐵一、廣附三校2022-2023學年高一下學期期末聯考物理試題(無答案)
- 《通達信炒股軟件從入門到精通》讀書筆記模板
- 科研誠信問題課件
- 高頻電刀之負極板的正確使用方法
- 關于高中班級管理論文
- 21秋國家開放大學《公共部門人力資源管理》單元自測題參考答案
- 東北抗聯英雄人物智慧樹知到答案章節測試2023年牡丹江師范學院
評論
0/150
提交評論