第十典型相關(guān)分析學(xué)習(xí)教案_第1頁
第十典型相關(guān)分析學(xué)習(xí)教案_第2頁
第十典型相關(guān)分析學(xué)習(xí)教案_第3頁
第十典型相關(guān)分析學(xué)習(xí)教案_第4頁
第十典型相關(guān)分析學(xué)習(xí)教案_第5頁
已閱讀5頁,還剩46頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、會計學(xué)1第十第十 典型相關(guān)典型相關(guān)(xinggun)分析分析第一頁,共51頁。2022-4-142),(21pxxx),(21qyyyThe canonical correlation analysis-CCA第1頁/共51頁第二頁,共51頁。2022-4-143第2頁/共51頁第三頁,共51頁。2022-4-144第3頁/共51頁第四頁,共51頁。2022-4-145 :戶戶主主受受教教育育程程度度:家家庭庭的的年年收收入入:戶戶主主的的年年齡齡321yyy :每年外出看電影頻率:每年外出看電影頻率率率:每年去餐館就餐的頻:每年去餐館就餐的頻21xx分析兩組變量分析兩組變量(binling)

2、之間的之間的關(guān)系。關(guān)系。The canonical correlation analysis-CCA第4頁/共51頁第五頁,共51頁。2022-4-146X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量變量(binling)間的相關(guān)系數(shù)矩陣間的相關(guān)系數(shù)矩陣The canonical correlation analysis-CCA第5頁/共51頁第六頁,共51頁。2022-4-147y2y3y1x2x

3、1 33122111112211111ybybybVxaxau 33222211222221122ybybybvxaxau?),(11 vu ?),(22 vu The canonical correlation analysis-CCA第6頁/共51頁第七頁,共51頁。2022-4-148典型典型(dinxng)(dinxng)相關(guān)分析的思想:相關(guān)分析的思想: 首先首先(shuxin)(shuxin)分別在每組變量中找出第一對線分別在每組變量中找出第一對線性組合,使其具有最大相關(guān)性,性組合,使其具有最大相關(guān)性, 111 1212111112121ppqqua xa xa xvb yb yb

4、y The canonical correlation analysis-CCA第7頁/共51頁第八頁,共51頁。2022-4-149 然后再在每組變量中找出第二對線性組合,使其然后再在每組變量中找出第二對線性組合,使其分別與本組內(nèi)的第一線性組合不相關(guān),第二對線性組分別與本組內(nèi)的第一線性組合不相關(guān),第二對線性組合本身合本身(bnshn)具有次大的相關(guān)性。具有次大的相關(guān)性。 既既:u2和和v2與與u1和和v1相互獨立,但相互獨立,但u2和和v2有次大相關(guān)有次大相關(guān)性。如此繼續(xù)下去,直至性。如此繼續(xù)下去,直至(zhzh)進行到進行到r步,兩組變量步,兩組變量的相關(guān)性被提取完為止。的相關(guān)性被提取完為

5、止。rmin(p,q),可以得到,可以得到r組變組變量。量。212 1222221212222ppqqua xa xa xvb yb yb yThe canonical correlation analysis-CCA第8頁/共51頁第九頁,共51頁。2022-4-14101212(,)pqx xxyyyZ其其協(xié)方差陣協(xié)方差陣為為pqpq11122122 其中其中(qzhng)(qzhng)1111是第一組變量的協(xié)方差矩陣;是第一組變量的協(xié)方差矩陣;2222是是第二組變量的協(xié)方差矩陣;第二組變量的協(xié)方差矩陣; 是是X X和和Y Y的其協(xié)方差矩陣的其協(xié)方差矩陣。1221 矩陣矩陣的分的分塊塊Th

6、e canonical correlation analysis-CCA第9頁/共51頁第十頁,共51頁。2022-4-141111u = a X11v = b Y 其中其中(qzhng)(qzhng): 11211(,)paaa1a11211(,)qbbb1b122()1VarVar1111vb(Y)bb b1()11Cov u ,vCov11u ,v11121a(X,Y)ba b 所以所以(suy)(suy),典型相關(guān)分析就是求,典型相關(guān)分析就是求a1a1和和b1b1,使,使uvuv達達到最大。到最大。1()()1Var uVar111111aX aa a想一想想一想如何求如何求?The

7、canonical correlation analysis-CCA第10頁/共51頁第十一頁,共51頁。2022-4-1412 在在約束約束條件條件: :( )1Var u11a a( )1Var v22b b下,求下,求a1a1和和b1b1,使,使uvuv達到達到(d do)(d do)最大。最大。令令1 211 a1 222 b1 211a1 222b1 1 2111左乘2122左乘The canonical correlation analysis-CCA第11頁/共51頁第十二頁,共51頁。2022-4-1413 根據(jù)數(shù)學(xué)分析根據(jù)數(shù)學(xué)分析(sh xu fn x)(sh xu fn x

8、)中條件極值的求法,引入中條件極值的求法,引入LagrangeLagrange乘數(shù),求極值問題,則可以轉(zhuǎn)化為求乘數(shù),求極值問題,則可以轉(zhuǎn)化為求11(,)(1)(1)(1)22a b112111111221a ba ab b 的極大值,其中的極大值,其中(qzhng)(qzhng)和和是是 Lagrange Lagrange乘數(shù)。乘數(shù)。The canonical correlation analysis-CCA不含1不含1第12頁/共51頁第十三頁,共51頁。2022-4-1414110(2)0a121111211221 b - a a - b(3)121111211221 b - a = 0

9、a - b = 0將上面將上面(shng min)(shng min)的的3 3式分別左乘式分別左乘 和和 1a1b 1121111112111221a b -a a = 0b a -b b = 0The canonical correlation analysis-CCA( )1Var u11a a注意注意(zh y)到到( )1Var v22b b 11211211a bb a第13頁/共51頁第十四頁,共51頁。2022-4-141511( , )u v 1121a b將將 左乘(左乘(3 3)的第二式,得)的第二式,得-11222 0-1-112222111222221 a - b0-

10、11222211121 a - b 并將第一并將第一(dy)(dy)式代入,得式代入,得0-121222211111 a - a0-1-121112222111 a - a 的特征根的特征根是是 ,相應(yīng)的特征向,相應(yīng)的特征向量為量為211221211121(3)121111211221 b - a = 0 a - b = 0等于等于(dngy)單位陣單位陣特征特征(tzhng)根定義根定義The canonical correlation analysis-CCA第14頁/共51頁第十五頁,共51頁。2022-4-1416將將 左乘(左乘(3 3)的第一)的第一(dy)(dy)式,并將第二式代

11、式,并將第二式代入,得入,得111120-12111211121 b - a0-122111121221 b - b10-1-12222111121 b - b 的特征根的特征根是是 ,相應(yīng)的特征向,相應(yīng)的特征向量為量為211111212221回顧特征回顧特征(tzhng)根定義根定義12111211222112212111BA令令mBmll22AThe canonical correlation analysis-CCA第15頁/共51頁第十六頁,共51頁。2022-4-1417 結(jié)論:結(jié)論: 既是既是A A又是又是B B的特征的特征(tzhng)(tzhng)根,根, 和和 是相是相應(yīng)于應(yīng)

12、于A A和和B B的特征的特征(tzhng)(tzhng)向量。向量。211 至此,典型相關(guān)分析轉(zhuǎn)化為求至此,典型相關(guān)分析轉(zhuǎn)化為求A A和和B B特征特征(tzhng)(tzhng)根和特根和特征征(tzhng)(tzhng)向量的問題。向量的問題。 第一對典型變量提取了原始變量第一對典型變量提取了原始變量X X與與Y Y之間相關(guān)的主要部之間相關(guān)的主要部分,如果這部分還不能足以解釋原始變量,可以在剩余的相分,如果這部分還不能足以解釋原始變量,可以在剩余的相關(guān)中再求出第二關(guān)中再求出第二(d r)(d r)對典型變量和他們的典型相關(guān)系數(shù)。對典型變量和他們的典型相關(guān)系數(shù)。The canonical

13、correlation analysis-CCA第16頁/共51頁第十七頁,共51頁。2022-4-14182u2a x22v = b y在在約束條件約束條件: 2()1Var u2112a a2()1Var v2222b b12cov( ,)cov()0u u121112a x,a xa a12cov( ,)cov()0v v121112b y,b yb b 求使求使 達到達到最大最大的的 和和 。22cov(,)u v2122a b2a2b獨立性獨立性The canonical correlation analysis-CCA第17頁/共51頁第十八頁,共51頁。2022-4-1419:戶

14、主受教育程度:家庭的年收入:戶主的年齡321yyy:每年外出看電影頻率率:每年去餐館就餐的頻21xx分析分析(fnx)兩組變量之間的關(guān)系。兩組變量之間的關(guān)系。The canonical correlation analysis-CCA第18頁/共51頁第十九頁,共51頁。2022-4-1420X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量變量(binling)間的相關(guān)系數(shù)矩陣間的相關(guān)系數(shù)矩陣The

15、canonical correlation analysis-CCA第19頁/共51頁第二十頁,共51頁。2022-4-1421典型相關(guān)分析典型相關(guān)分析典型相典型相關(guān)系數(shù)關(guān)系數(shù)調(diào)整典型調(diào)整典型相關(guān)系數(shù)相關(guān)系數(shù)近似方差近似方差典型相關(guān)典型相關(guān)系數(shù)的平系數(shù)的平方方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919The canonical correlation analysis-CCA第20頁/共51頁第二十一頁,共51頁。2022-4-1422X X組典型變量的系數(shù)組典型變量的系數(shù)U1U2X1( (就餐)就餐)0

16、.7689-1.4787X2(電影(電影)0.27211.6443Y Y組典型變量的系數(shù)組典型變量的系數(shù)V1V2Y1(年齡(年齡)0.04911.0003Y2(收入(收入)0.8975-0.5837Y 3 ( 文 化( 文 化)0.19000.29562112721. 07689. 0 xxu2126443. 14787. 1xxu32111900. 08975. 00491. 0yyyv32122956. 05837. 00003. 1yyyv第21頁/共51頁第二十二頁,共51頁。2022-4-1423kuka xkvk= b yikrik;, 2 , 1,cov(,)cov()0kiiu

17、 ukik k11a x,a xa aX組的典型變量之間是組的典型變量之間是相互獨立相互獨立的:的:cov(, )cov(0kiv vkik11ib y,b y) = b b =Y組的典型變量之間是組的典型變量之間是相互獨立相互獨立的:的:因為因為(yn wi)特征向量之間是正交的。故特征向量之間是正交的。故注意正交與獨立的關(guān)系注意正交與獨立的關(guān)系The canonical correlation analysis-CCA第22頁/共51頁第二十三頁,共51頁。2022-4-1424cov( ,)cov()iju vija x,b ycov()jii12jax,y ba b-1/2-1/2i1

18、11222j ,0,iijij),min(, 2 , 121ppi同對則協(xié)方差為同對則協(xié)方差為i ,不同,不同(b tn)對則為零。對則為零。The canonical correlation analysis-CCA第23頁/共51頁第二十四頁,共51頁。2022-4-142512111211222112212111BAmBmll22AThe canonical correlation analysis-CCA第24頁/共51頁第二十五頁,共51頁。2022-4-1426The canonical correlation analysis-CCA第25頁/共51頁第二十六頁,共51頁。202

19、2-4-1427nqnnpnqpqpqpqpyyxxyyxxyyxxyyxxyyxx11441441331231221221111111XThe canonical correlation analysis-CCA第26頁/共51頁第二十七頁,共51頁。2022-4-1428m1i(i)()(Xn1X,)(n1其中XXXXiii)(il)(imi),.2 , 1(,1)2()()1()(piXmVXlUiiiii)(il)(imThe canonical correlation analysis-CCA第27頁/共51頁第二十八頁,共51頁。2022-4-1429)(rRRRRRij22211

20、211pjisssrjjiiijij,.,2 , 1,其中:ppsssS.00.0.00.022111111111.00.0.00.02, 21, 12ppppppsssSThe canonical correlation analysis-CCA第28頁/共51頁第二十九頁,共51頁。2022-4-1430;SRSSRS,SRS2121122222221111110)(0)(S-RRR(R)(221211121122)(1221-12212-111iimSRRRRl122211,)(2)(1,iimSlS2112212111RRRR1211112111RRRR2i)2()()1()(,XmV

21、XlUiiiiiThe canonical correlation analysis-CCA第29頁/共51頁第三十頁,共51頁。2022-4-1431(一)整體(一)整體(zhngt)(zhngt)檢驗檢驗)0:; 0XXCov:(12112210HH),()()(的特征根是其中21122121112i12222210RRRRA)1 ()1).(1)(1 (11piip檢驗的檢驗的統(tǒng)計量統(tǒng)計量:Wilkes分布分布The canonical correlation analysis-CCA第30頁/共51頁第三十一頁,共51頁。2022-4-14320.222211p0H200lnmQ) 1

22、(211,2121ppnmppf0H20Q1111V,UThe canonical correlation analysis-CCA第31頁/共51頁第三十二頁,共51頁。2022-4-1433的特征根是其中)(21122121112i22223221RRRRA)1 ()1).(1 (111piip111p1211ln)1(212ppnQ) 1)(1(21pp221Q0H22V,UThe canonical correlation analysis-CCA第32頁/共51頁第三十三頁,共51頁。2022-4-14341211ln)1(21rrpprnQ) 1)(1(21rprp2的特征根是其中

23、)(21122121112i222121RRRRA)1 ()1).(1 (111priiprrrThe canonical correlation analysis-CCA第33頁/共51頁第三十四頁,共51頁。2022-4-1435(jnxng)(jnxng)假設(shè)檢驗。假設(shè)檢驗。 2 2)H0H0經(jīng)檢驗被拒絕,則應(yīng)進經(jīng)檢驗被拒絕,則應(yīng)進一步作檢驗。一步作檢驗。The canonical correlation analysis-CCA第34頁/共51頁第三十五頁,共51頁。2022-4-1436(二)部分(二)部分(b fen)總體典型相關(guān)系數(shù)為零的檢驗總體典型相關(guān)系數(shù)為零的檢驗The ca

24、nonical correlation analysis-CCA.r,32i ,H0.H2i1r320,不等于零中至少:.r43i ,H0.H3i1r430,不等于零中至少:第35頁/共51頁第三十六頁,共51頁。2022-4-1437如此進行如此進行(jnxng)下去下去.直至對某個直至對某個k,有有The canonical correlation analysis-CCA中至少一個不為零:r2k1k1r2k1k0,.,H0.H第36頁/共51頁第三十七頁,共51頁。2022-4-14382111(3)ln2kiki kQnkpq 近似服從自由度為近似服從自由度為(p-k)(q-k)(p-

25、k)(q-k)的的2 2分布。在給定的分布。在給定的顯著性水平顯著性水平下,如果下,如果2 22 (p-k)(q-k)2 (p-k)(q-k),則拒絕,則拒絕原假設(shè),認為至少第原假設(shè),認為至少第k+1k+1對典型變量對典型變量(binling)(binling)之間的之間的相關(guān)性顯著。相關(guān)性顯著。The canonical correlation analysis-CCAWilkes分布分布(fnb)與與2分布分布(fnb)rkii121k)1 (第37頁/共51頁第三十八頁,共51頁。2022-4-1439The canonical correlation analysis-CCA22211

26、211RRRRR,RRRRA2i2212212111的特征根;S)(1il特征向量,RRRRB2i1211121122的特征根;S)(2im特征向量)(),()(212)()(111)(iiiimSSmlSSl)2()(p1()()2()2(2)1()2(2)2()1(1)1()1(11111V.,XmXlUXmVXlUXmVXlUppp,)第38頁/共51頁第三十九頁,共51頁。2022-4-1440 2 法法)0:; 0XXCov:(12112210HH),()()(第39頁/共51頁第四十頁,共51頁。2022-4-1441確定典型相關(guān)確定典型相關(guān)(xinggun)分析的目的分析的目的設(shè)

27、計典型相關(guān)分析設(shè)計典型相關(guān)分析檢驗典型相關(guān)分析的基本假設(shè)檢驗典型相關(guān)分析的基本假設(shè)典型函數(shù)的估計和識別典型函數(shù)的估計和識別解釋典型函數(shù)和變量解釋典型函數(shù)和變量驗證模型驗證模型The canonical correlation analysis-CCA第40頁/共51頁第四十一頁,共51頁。2022-4-1442第41頁/共51頁第四十二頁,共51頁。2022-4-14431212ijrR)(X1X2X3X4X5X6X7X8X9X10X11X12X11.000.300.16-0.020.240.07-0.160.400.360.410.28-0.47X21.000.380.01-0.100.45

28、0.25-0.300.640.500.56-0.24X31.000.31-0.240.19-0.01-0.300.550.550.32-0.48X41.00-0.030.050.20-0.280.37-0.040.24-0.09X51.000.050.32-0.43-0.18-0.010.14-0.01X61.000.28-0.080.260.330.23-0.28X71.00-0.250.150.030.080.19X81.00-0.44-0.26-0.460.07X91.000.490.60-0.46X101.000.35-0.52X111.00-0.42X121.00第42頁/共51頁第

29、四十三頁,共51頁。2022-4-14441211121122RRRRB序序號號典型相關(guān)典型相關(guān) 系數(shù)系數(shù) 典型變量典型變量 1 2 3 4 58514. 017284. 026109. 033932. 043246. 051211109817654325113560. 00037. 03696. 02334. 04266. 00138. 00911. 02216. 00614. 05883. 02668. 0X4421. 0UXXXXXVXXXXXX121110982765432128101. 02219. 01983. 00403. 182554. 023987. 01748. 07262

30、. 00147. 02 .21. 07021. 0X2087. 0UXXXXXVXXXXXX121110983765432135373. 08850. 02896. 02531. 03704. 0171844353. 07237. 05662. 04638. 09015. 0X4640. 0UXXXXXVXXXXXX121110984765432141858. 09934. 03749. 07669. 06537. 00335. 14725. 04627. 01537. 01331. 055682. 0X55135. 0UXXXXXVXXXXXX121110985765432157480. 00904. 00850. 14791. 01413. 05283. 01839. 03015. 09126. 03773. 01814.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論