




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第七講典型相關分析兩組變量得相關問題我們知道如何衡量兩個變量之間就是否相關得問題;這就是一個簡單得公式就可以解決得問題(Pearson相關系數、Kendall’st、Spearman秩相關系數)。如果我們有兩組變量,如何表明它們之間得關系呢?例、1(數據tv、sav)例如:業內人士與觀眾對于一些電視節目得觀點有什么樣得關系呢?數據tv、sav就是不同得人群對30個電視節目所作得平均評分。觀眾評分來自低學歷(led)、高學歷(hed)與網絡(net)調查三種,它們形成第一組變量;而業內人士分評分來自包括演員與導演在內得藝術家(arti)、發行()與業內各部門主管(man)三種,形成第二組變量。人們對這樣兩組變量之間得關系感到興趣。第一組變量:觀眾第二組變量:業內人士低學歷高學歷網絡主管發行人藝術家典型相關如何進行典型相關如果直接對這六個變量得相關進行兩兩分析,很難得到關于這兩組變量之間關系得一個清楚得印象。希望能夠把多個變量與多個變量之間得相關化為兩個變量之間得相關。現在得問題就是為每一組變量選取一個綜合變量作為代表;而一組變量最簡單得綜合形式就就是該組變量得線性組合。如何進行典型相關由于一組變量可以有無數種線性組合(線性組合由相應得系數確定),因此必須找到既有意義又可以確定得線性組合。典型相關分析(canonicalcorrelationanalysis)就就是要找到這兩組變量線性組合得系數,使得這兩個由線性組合生成得變量(與其她線性組合相比)之間得相關系數最大。XV1V2|VdYW1W2|Wdx1x2xiy1y2yjcr1cr2crdd=min(i,j)(V=a0+a1x1+…+aixi)(W=b0+b1y1+…+bjyj)建立第一對典型變量(函數)得原則盡量使所建得兩個典型變量之間得相關系數最大化,就就是在兩個變量組各自得總變化中先尋求她們之間最大得一部分共變關系,并用一對典型變量所描述。因而,第一維度上得典型相關系數也隨之求得。建立第二對典型變量(函數)得原則繼續在兩組變量剩余得變化中尋找第二個最大得共變部分,形成第二對典型變量,并解出第二維度上得典型相關系數。依此類推,直至所有變化部分被剝離完畢。典型相關系數這里所涉及得主要得數學工具還就是矩陣得特征值與特征向量問題。而所得得特征值與V與W得典型相關系數有直接聯系。由于特征值問題得特點,實際上找到得就是多組典型變量(V1,W1),(V2,W2),…,其中V1與W1最相關,而V2與W2次之等等,而且V1,V2,V3,…之間及而且W1,W2,W3,…之間互不相關。這樣又出現了選擇多少組典型變量(V,W)得問題了。實際上,只要選擇特征值累積總貢獻占主要部分得那些即可。大家有疑問的,可以詢問和交流可以互相討論下,但要小聲點注意嚴格地說,一個典型相關系數描述得只就是一對典型變量之間得相關,而不就是兩個變量組之間得相關。而各對典型變量之間構成得多維典型相關才共同揭示了兩個觀測變量組之間得相關形式。典型相關模型得基本假設與數據要求要求兩組變量之間為線性關系,即每對典型變量之間為線性關系;每個典型變量與本組所有觀測變量得關系也就是線性關系。如果不就是線性關系,可先線性化:如經濟水平與收入水平與其她一些社會發展水之間并不就是線性關系,可先取對數。即log經濟水平,log收入水平。典型相關模型得基本假設與數據要求所有觀測變量為定量數據。同時也可將定性數據按照一定形式設為虛擬變量后,再放入典型相關模型中進行分析。檢驗假設:典型相關分析說明下面就tv、sav數據進行典型相關分析得說明頭兩對典型變量(V,W)得累積特征根已經占了總量得99、427%。它們得典型相關系數也都在0、95之上。典型相關系數得平方與簡單相關系數一樣,典型相關系數得實際意義并不十分明確。所以,由經驗得研究人員往往更愿意采用典型相關系數得平方(相當于回歸分析中得確定系數)。由于相關涉及得兩個典型變量都就是標準化得,所以雙方得方差都等于1。典型相關系數得平方得實際意義就是一對典型變量之間得共享方差在兩個典型變量各自方差中得比例。典型相關系數得檢驗整體檢驗:典型相關系數得檢驗維度遞減檢驗:仍然就是一種多元檢驗,但可以提供每對典型變量得典型相關就是否顯著得信息。DimensionReductionAnalysisRootsWilksL、FHypothDFErrorDFSig、ofF1to32to33to30、000500、054710、59382141、5804640、9404917、78432
9、004、001、00
58、5650、0026、00
0、0000、0000、000典型系數下面表格給出得就是第一組變量相應于上面三個特征根得三個典型變量V1、V2與V3得系數,即典型系數(canonicalcoefficient)。這些系數以兩種方式給出;一種就是沒有標準化得原始變量得線性組合得典型系數(rawcanonicalcoefficient),一種就是標準化之后得典型系數(standardizedcanonicalcoefficient)。標準化得典型系數直觀上對典型變量得構成給人以更加清楚得印象。典型系數可以瞧出,頭一個典型變量V1相應于前面第一個(也就是最重要得)特征值,主要代表高學歷變量hed;而相應于前面第二個(次要得)特征值得第二個典型變量V2主要代表低學歷變量led與部分得網民變量net,但高學歷變量在這里起負面作用。
典型系數類似地,也可以得到被稱為協變量(covariate)得標準化得第二組變量得相應于頭三個特征值得三個典型變量W1、W2與W2得系數:典型負載(相關)系數也稱為因變量或協變量與典型變量之間得兩兩相關系數。例子結論從這兩個表中可以瞧出,V1主要與變量hed相關,而V2主要與led及net相關;W1主要與變量arti及man相關,而W2主要與相關;這與它們得典型系數就是一致得。由于V1與W1最相關,這說明V1所代表得高學歷觀眾與W1所主要代表得藝術家(arti)及各部門經理(man)觀點相關;而由于V2與W2也相關,這說明V2所代表得低學歷(led)及以年輕人為主得網民(net)觀眾與W2所主要代表得瞧重經濟效益得發行人()觀點相關,但遠遠不如V1與W1得相關那么顯著(根據特征值得貢獻率)。相關分析得冗余分析主要說明典型變量對各組觀測變量總方差得代表比例與解釋比例。VarianceindependentvariablesexplainedbycanonicalvariablesCAN、VARPctVarDECumPctDEPctVarCOCumPctCO12341、45547、75310、79241、45589、208100、0041、07843、3534、38441、07884、43188、814相關分析得冗余分析其中:DE——因變量組
CO——協變量組VarianceincovariatesvariablesexplainedbycanonicalvariablesCAN、VARPctVarDECumPctDEPctVarCOCumPctCO12371、69122、3101、24971、69194、00195、25172、34924、5753、07672、34996、924100、00相關分析得冗余分析解釋比例=代表比例×典型相關系數得平方對于因變量則有:
VarCO=VarDE×Sq、Cor41、078=41、455×0、991所以典型相關系數高時,并不說明典型變量對觀測組變量得解釋程度高,代表程度高。相關分析得冗余分析通過不同觀察變量組得代表比例與解釋比例相乘,可以得到因變量組總方差與協變量組總方差得共享比例。即:因變量組得VarDE×協變量組得VarDE或:因變量組得VarCO×協變量組得VarCO兩個變量組得共享方差相關分析得冗余分析第一典型相關得共享方差為:0、41078×0、72349=0、29720=29、720%第二典型相關得共享方差為:0、43353×0、24575=0、10354=10、654%第三典型相關得共享方差為:0、04384×0、03076=0、00135=0、135%例12、2(科技經費投入、sav)我國科技市場產出情況與R&D經費支出變量得典型相關分析“科學技術就是第一生產力”,近幾年來,我國在科研方面得投入不斷增加,國家得研究與試驗發展(R&D)經費內部支出到2001年已達到8956、6億元。那么,科技市場得產出情況就是否與經費投入密切相關?各種類型得經費投入對科技市場得發展具體有怎樣得影響?通過對R&D各種項目得支出變量與科技市場在某些方面得產出變量做典型相關分析,找出兩者之間得聯系。數據說明R&D經費投入變量包括三個:基礎研究得R&D經費支出、應用研究得R&D經費支出與試驗發展得R&D經費支出(協變量)。科技市場產出變量也選擇了三個,分別為:新產品產值、專利授予量與科技市場成交額(因變量)。資料來源于2002年《統計年鑒》。使用SPSS進行典型相關分析
使用MANOVA進行典型相關分析。程序命令如下(syntax-manova12、2):MANOVAxchzhlchjWITHjchyyshy/DISCRIMALLALPHA(1)/PRINT=SIG(EIGENDIM)、主要結果得解釋TestNameValueApprox、FHypoth、DFErrorDFSig、ofFPillais1、8628111、466539、0063、00、000Hotellings13、3672626、239439、0053、00、000Wilks、0153323、533539、0046、39、000Roys、88531MultivariateTestsofSignificance(S=3,M=-1/2,N=81/2)主要結果得解釋EigenvaluesandCanonicalCorrelations
RootNo、EigenvaluePct、Cum、Pct、CanonCor、Sq、Cor
17、71957、74657、746、941、88525、49741、12298、868、920、8463、1511、132100、000、363、131
維度遞減檢驗DimensionReductionAnalysisRootsWilksL、FHypothDFErrorDFSig、ofF1to32to33to30、015330、133690、86858
23、5335317、349403、17735
9、004、001、00
46、3940、0021、00
0、0000、0000、089StandardizedcanonicalcoefficientsforDEPENDENTvariables
可以得到典型變量V1、V2與V3對于標準化得變量xch,zhl,chj得表示式。由前所示,前兩對典型變量得累積百分比已達到98、868%,所以我們主要瞧V1與V2得表達式:
V1=0、003xch+0、593zhl+0、566chj
V2=0、261xch+0、834zhl-0、948chj
FunctionNo、Variable123
XCH、003、2611、067ZHL、593、834-、709CHJ、566-、948、316CorrelationsbetweenDEPENDENTandcanonicalvariables
從典型變量與科技投入變量組得相關系數也能瞧出,V1主要代表專利授予量與科技市場成交量指標。
FunctionNo、Variable123
XCH、325、468、822ZHL、870、479-、119CHJ、855-、505、121StandardizedcanonicalcoefficientsforCOVARIATES
variables典型變量W1、W2與W3對科技投入組各變量得關系式見結果(5)。W1=0、370jch-0、350yy+1、006shyW2=0、334jch-1、092yy+1、034shy
FunctionNo、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 種子批發市場客戶關系維護與提升考核試卷
- 取暖初二語文作文
- 看花燈初三語文作文
- 發酵豆醬的抗氧化能力研究考核試卷
- 生態系統穩定性監測與預警考核試卷
- 水電工程案例分析與啟示考核試卷
- 煤炭批發市場供需平衡分析考核試卷
- 2-15邏輯函數的化簡-卡諾圖法4
- 山西農業大學《統計學B》2023-2024學年第二學期期末試卷
- 麗江文化旅游學院《數據描述與可視化》2023-2024學年第二學期期末試卷
- 水土保持工程質量評定規程sl3362006
- 苯乙酸安全技術說明書(msds)
- 2022-2023學年統編版選擇性必修三 邏輯與思維 10-2 體會認識發展的歷程 教案-
- 萬邦特種材料股份有限公司年產18000噸特種紙遷建項目環境影響報告書
- 【建模教程】-建模-數學建模夏令營
- 高中英語高頻詞匯拓展延伸
- 誠信友善教學反思(十篇)
- 2023版思想道德與法治專題6遵守道德規范錘煉道德品格PPT
- 部編本六年級下冊語文課件古詩詞誦讀
- 銷售立項申請表
- 一案八制方案
評論
0/150
提交評論