多元數據特征與相關分析課件_第1頁
多元數據特征與相關分析課件_第2頁
多元數據特征與相關分析課件_第3頁
多元數據特征與相關分析課件_第4頁
多元數據特征與相關分析課件_第5頁
已閱讀5頁,還剩121頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第3講1.3多元數據的數字特征與相關分析2、相關分析,偏相關分析本節要求掌握知識點:1、二元,多元數據的數字特征:均值,協方差矩陣,相關系數第3講1.3多元數據的數字特征與2、相關分析,偏相關1相關關系的類型相關關系非線性相關線性相關正相關正相關負相關負相關完全相關不相關相關關系的類型相關關系非線性相關線性相關正相關正相關負相關負2不相關負線性相關正線性相關非線性相關完全負線性相關完全正線性相關相關系數的直觀圖示不相關負線性相關3相關關系的測度

(相關系數)對變量之間關系密切程度的度量對兩個變量之間線性相關程度的度量稱為簡單相關系數若相關系數是根據總體全部數據計算的,稱為總體相關系數若是根據樣本數據計算的,則稱為樣本相關系數,r相關關系的測度

(相關系數)對變量之間關系密切程度的度量4相關關系的測度

(相關系數取值及其意義)

r的取值范圍是[-1,1]|r|=1,為完全相關r=1,為完全正相關r=-1,為完全負正相關

r=0,不存在線性相關關系-1r<0,為負相關0<r1,為正相關|r|越趨于1表示關系越密切;|r|越趨于0表示關系越不密切相關關系的測度

(相關系數取值及其意義)r的取值范圍是5選擇不同的方法計算相關系數

Pearson:雙變量正態分布資料,連續變量

Kendall:資料不服從雙變量正態分布或

總體分布未知,等級資料

Spearman:等級資料(非參數檢驗)。選擇不同的方法計算相關系數Pearson:雙變量正態分6§1.3多維數據的數字特征及相關分析

1.3.1二維數據的數字特征及相關系數設是二維總體,從中取得樣本數據,,……,數據觀測矩陣§1.3多維數據的數字特征及相關分析1.3.1二維數據71.樣本數據的數字特征與相關系數記均值向量:記,為變量X,Y的觀測數據的方差.1.樣本數據的數字特征與相關系數記均值向量:記,為變量X,Y8記為變量X,Y的觀測數據的協方差.觀測數據的協方差矩陣且有,S≥0.記為變量X,Y的觀測數據的協方差.觀測數據的協方差矩陣且有,9樣本相關系數(Pearson相關系數)且有.樣本相關系數(Pearson相關系數)且有102.二維總體的相關系數設是二維總體,定義總體相關系數為由于觀測數據的相關系數是總體相關系數的相合估計,故當n充分大時,有2.二維總體的相關系數設是二維總體,113.相關分析當二元總體的兩個分量X與Y不相關,即時,而利用樣本數據算得的相關系數,這時用樣本數據相關系數來度量X與Y的關聯性是不合適的.因此,需要做假設檢驗1)2)檢驗統計量3.相關分析當二元總體的兩個分量X與Y不相關,即123.相關分析3)當H0為真時,統計量t~t(n﹣2)檢驗p的值為對于給定的顯著水平,若p<

,則拒絕H0,這時,認為X與Y相關,用樣本數據算得的相關系數反映了兩變量的線性關聯性的強弱.式中的t0為通過樣本數據算得的統計量t的值.3.相關分析3)當H0為真時,統計量13SPSS操作:相關分析1.做散點圖:標題、標目、散點Graphs-Scattert-Simple-Defind雙擊Title加標題、標目2.相關分析:Analyze-Correlation-Bivariate-Variables

DASC操作SPSS操作:相關分析14例1.2:一個產科醫師發現孕婦尿中雌三醇含量與產兒的體重有關。于是設想,通過測量待產婦尿中雌三醇含量,可以預測產兒體重,以便對低出生體重進行預防。因此收集了31例待產婦24小時的尿,測量其中的雌三醇含量,同時記錄產兒的體重。問尿中雌三醇含量與產兒體重之間相關系數是多少?是正相關還是負相關?分析問題:目的、變量、關系

例1.2:一個產科醫師發現孕婦尿中雌三醇含量與產兒的體重有關15編號

(1)尿雌三醇mg/24h(2產兒體重kg(3)編號

(1)尿雌三醇mg/24h(2)產兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2

待產婦尿雌三醇含量與產兒體重關系

編號

尿雌三醇產兒體重編號

尿雌三醇mg/24h(2)產兒體16計算結果從計算結果可以知道,31例待產婦尿中雌三醇含量與產兒體重之間程正相關,相關系數是0.61。計算結果從計算結果可以知道,31例待產婦尿中雌三醇含量與產兒17問題:我們能否得出結論:待產婦尿中雌三醇含量與產兒體重之間成正相關,相關系數是0.61?為什么?問題:我們能否得出結論:待產婦尿中雌三醇含量與產兒體重之間成18對例子中相關系數必須進行假設檢驗

例中的相關系數r等于0.61,說明了31例樣本中雌三醇含量與出生體重之間存在相關關系。但是,這31例只是總體中的一個樣本,由此得到的相關系數會存在抽樣誤差。因為,總體相關系數()為零時,由于抽樣誤差,從總體抽出的31例,其r可能不等于零。這就要對r進行假設檢驗,判斷r不等于零是由于抽樣誤差所致,還是兩個變量之間確實存在相關關系。

對例子中相關系數必須進行假設檢驗例中的相關系數r等于0.619H0:

=0

H1:

≠0=0.05r=0.61,n=31,代入公式

t==n-2=31-2=29

t=4.14查t值表,t0.05(29)=2.045,查t值表,t0.05(29)=2.045,上述計算t=4.14>2.045,由t所推斷的P值小于0.05,按=0.05水準拒絕,接受,認為臨產婦24小時內尿中雌三醇濃度與產兒體重之間有正相關關系。

H0:=0=n-2=31-2=29t=4.1420多元數據特征與相關分析課件21多元數據特征與相關分析課件22

等級相關

rankcorrelation

適用資料:⑴不服從雙變量正態分布⑵總體分布類型未知⑶原始數據用等級表示

等級相關系數qxy(即SpearmanCorrelationCoefficient)——反映兩變量間相關的密切程度與方向。

等級相關

rankcorrelation適用資料:⑴233.Spearman相關系數秩的概念將一容量為n的樣本觀測值x1,x2,…,xn按升序排列成

x(1)≤x(2)≤‥‥‥≤x(n)若xi

=x(k),則稱xi

的秩為k,記作Ri,稱R1,R2,…,Rn為秩統計量.3.Spearman相關系數秩的概念243.Spearman相關系數如下的樣本觀測值-0.8,-3.1,1.1,-5.2,4.2按升序排列成-5.2,-3.1,-0.8,1.1,4.2秩統計量R1,R2,…,Rn的取值為3,2,4,1,53.Spearman相關系數如下的樣本觀測值253.Spearman相關系數設二維總體(X,Y)T的樣本觀測數據為(x1,y1)T,(x2,y2)T,…,(xn,yn)T對于分量X,其樣本數據x1,x2,…,xn的秩統計量是R1,R2,…,Rn3.Spearman相關系數設二維總體(X,Y)T的樣本263.Spearman相關系數對于分量Y,其樣本數據y1,y2,…,yn的秩統計量是S1,S2,…,Sn記3.Spearman相關系數對于分量Y,其樣本數據y1,y2273.Spearman相關系數Spearman相關系數定義為Spearman相關系數qxy就是把Pearson相關系數rxy中X,Y的樣本值用X,Y的秩來代替的.3.Spearman相關系數Spearman相關系數定義為283.Spearman相關系數由于經過某些運算,可得可以推出,Spearman相關系數具有Pearson相關系數一樣的性質,如|qxy|≤1.3.Spearman相關系數由于291.3.2多維數據的數字特征及相關矩陣設是p維總體.樣本數據

1.3.2多維數據的數字特征及相關矩陣設30樣本數據觀測矩陣記稱為第i個樣品.X的p個列分別是變量X1,X2,…,Xp的n個觀測數據.樣本數據觀測矩陣記稱為第i個樣品.X的p個列分別是變量X1,31⑴第j列數據的均值樣本數據觀測矩陣可以寫成⑴第j列數據的均值樣本數據觀測矩陣可以寫成32⑵第j列數據的方差⑶第j,k列數據的協方差并且有⑵第j列數據的方差⑶第j,k列數據的協方差并且有33樣本觀測數據的均值向量樣本觀測數據的協方差矩陣樣本觀測數據的均值向量樣本觀測數據的協方差矩陣34⑷X的第j,k列數據的Pearson相關系數可見,rjj=1,X的Pearson相關矩陣⑷X的第j,k列數據的Pearson相關系數可見,rjj35注意到,樣本協方差矩陣成為注意到,樣本協方36若記則有,S=DRD若記則有,S=DRD37⑸對數據作標準化變換標準化數據的觀測矩陣是⑸對數據作標準化變換標準化數據的觀測矩陣是38標準化變換后的樣品觀測矩陣可以寫成標準化變換后的樣品觀測矩陣可以寫成39注意到就有所以注意到就有所以40即S*=R就是說,從標準化數據觀測矩陣X*計算得到的協方差陣就是由原數據觀測矩陣X計算得到的相關陣。即S*=R就是說,從標準化數據觀測矩陣X*計算得到的協方411.3.3總體的數字特征、相關矩陣及

多維正態分布總體的數字特征

p維總體:

總體CDF:連續型總體的PDF:其中,1.3.3總體的數字特征、相關矩陣及

多維正態分布總體的數42總體均值向量其中,總體協方差矩陣總體均值向量其中,總體協方差矩陣43其中,總體分量Xj與Xk的協方差總體分量Xj與Xk的相關系數總有,jj=1,|jk|≤1.其中,總體分量Xj與Xk的協方差總體分量Xj與Xk的相關系數44總體的相關矩陣為若記則有總體的相關矩陣為若記則有452.均值向量與協方差陣的性質設設A,B為常量矩陣,則E(AX)=AE(X)=ACov(AX)=ACov(X)AT=AATCov(AX,BY)=ACov(X,Y)BT

這里,Cov(X,Y)=E[(X-E(X))(Y–E(Y))],稱為X與Y的協方差陣.2.均值向量與協方差陣的性質設設A,B為常量矩陣,則E(AX46當n充分大時,有當n充分大時,有473.多維正態分布若多維總體具有概率密度則稱總體X服從p維正態分布,記為X

~3.多維正態分布若多維總體具有概率密度則稱總體X服從p維正態48多維正態分布的性質⑴若Y=AX+b,其中Al×p,bl×1為常量矩陣,則設X

~Y

~多維正態分布的性質⑴若Y=AX+b,其中Al×p,49X(1)

~,X(2)

~⑵將X,和作如下劃分這里,p1+p2=p,且,則X(1)~50⑶正態總體X的兩個分量Xi和Xj相互獨立的充要條件是ij=0(i

≠j).又若則X(1)和X(2)相互獨立的充要條件是⑶正態總體X的兩個分量Xi和Xj相互獨立的充要條件是ij511、概念當有多個變量存在時,為了研究任何兩個變量之間的關系,而使與這兩個變量有聯系的其它變量都保持不變。即控制了其它一個或多個變量的影響下,計算兩個變量的相關性。2、偏相關系數偏相關系數是用來衡量任何兩個變量之間的關系的大小。1、概念當有多個變量存在時,為了研究任何兩個變52

Analyze-----Correlation-----Partial把分析變量選入Variable框把控制變量選入Controllingfor框點擊Options點擊Statistics:選擇MeanandstandarddeviationZero-ordercorrelationContinueOK3.SPSS操作:偏相關分析Analyze-----Correlation-----Pa53第1章例3例3:已知某地29名13歲男童身高X1(cm)、體重X2(kg)和肺活量Y(ml),請計算身高與肺活量,體重與肺活量的相關關系。第1章例354身高與肺活量的簡單相關系數1、身高與肺活量的簡單相關系數身高與肺活量的簡單相關系數1、身高與肺活量的簡單相關系數552、體重與肺活量的簡單相關系數2、體重與肺活量的簡單相關系數563、身高與體重的簡單相關系數3、身高與體重的簡單相關系數57VariableMeanStandardDevCasesX1(身高)152.57598.362229Y(肺活量)2206.8966448.554129X2(體重)37.30695.670429例子偏相關分析結果:例子偏相關分析結果:58體重為控制變量,身高與肺活量的偏相關系數PARTIALCORRELATIONCOEFFICIENTSControllingfor..X2(體重)Y(肺活量)X1(身高)Y(肺活量)1.0000.2361(0)(26)P=.P=.226X1(身高).23611.0000(26)(0)P=.226P=.體重為控制變量,身高與肺活量的偏相關系數PARTI59PARTIALCORRELATIONCOEFFICIENTSControllingfor..X1(身高)Y(肺活量)X2(體重)Y1.0000.4152(0)(26)P=.P=.028X2.41521.0000(26)(0)P=.028P=.身高作為控制變量,肺活量與體重的偏相關系數PARTIALCORRELA60相關分析實際應用注意事項

1.實際意義進行相關回歸分析要有實際意義,不可把毫無關系的兩個事物或現象用來作相關回歸分析。

2.相關關系相關關系不一定是因果關系,也可能是伴隨關系,并不能證明事物間有內在聯系。

相關分析實際應用注意事項1.實際意義613.利用散點圖對于性質不明確的兩組數據,可先做散點圖,在圖上看它們有無關系、關系的密切程度、是正相關還是負相關,然后再進行相關分析。4.變量范圍相關分析和回歸方程僅適用于樣本的原始數據范圍之內,出了這個范圍,我們不能得出兩變量的相關關系和原來的回歸關系。3.利用散點圖62第1章總結當手中有了一個數據,首先要對它有個直觀的概念。要心中有數。如果數據來自一個總體,首先要看它的大概的分布形狀。利用直方圖,盒子圖(又稱箱線圖),莖葉圖等,看該分布是否呈現出對稱性,是否有很長的尾部,是否有遠離數據主體的點等等。如果研究對象是多樣本模型,數據來自不同總體,除了上面所說的對一個樣本所作的分析和處理之外,還要看這些樣本的形狀是否類似;要作各種二維(諸如散點圖,直方圖和盒子圖)或三維圖來發現這些樣本之間的聯系或相關性。第1章總結63第3講1.3多元數據的數字特征與相關分析2、相關分析,偏相關分析本節要求掌握知識點:1、二元,多元數據的數字特征:均值,協方差矩陣,相關系數第3講1.3多元數據的數字特征與2、相關分析,偏相關64相關關系的類型相關關系非線性相關線性相關正相關正相關負相關負相關完全相關不相關相關關系的類型相關關系非線性相關線性相關正相關正相關負相關負65不相關負線性相關正線性相關非線性相關完全負線性相關完全正線性相關相關系數的直觀圖示不相關負線性相關66相關關系的測度

(相關系數)對變量之間關系密切程度的度量對兩個變量之間線性相關程度的度量稱為簡單相關系數若相關系數是根據總體全部數據計算的,稱為總體相關系數若是根據樣本數據計算的,則稱為樣本相關系數,r相關關系的測度

(相關系數)對變量之間關系密切程度的度量67相關關系的測度

(相關系數取值及其意義)

r的取值范圍是[-1,1]|r|=1,為完全相關r=1,為完全正相關r=-1,為完全負正相關

r=0,不存在線性相關關系-1r<0,為負相關0<r1,為正相關|r|越趨于1表示關系越密切;|r|越趨于0表示關系越不密切相關關系的測度

(相關系數取值及其意義)r的取值范圍是68選擇不同的方法計算相關系數

Pearson:雙變量正態分布資料,連續變量

Kendall:資料不服從雙變量正態分布或

總體分布未知,等級資料

Spearman:等級資料(非參數檢驗)。選擇不同的方法計算相關系數Pearson:雙變量正態分69§1.3多維數據的數字特征及相關分析

1.3.1二維數據的數字特征及相關系數設是二維總體,從中取得樣本數據,,……,數據觀測矩陣§1.3多維數據的數字特征及相關分析1.3.1二維數據701.樣本數據的數字特征與相關系數記均值向量:記,為變量X,Y的觀測數據的方差.1.樣本數據的數字特征與相關系數記均值向量:記,為變量X,Y71記為變量X,Y的觀測數據的協方差.觀測數據的協方差矩陣且有,S≥0.記為變量X,Y的觀測數據的協方差.觀測數據的協方差矩陣且有,72樣本相關系數(Pearson相關系數)且有.樣本相關系數(Pearson相關系數)且有732.二維總體的相關系數設是二維總體,定義總體相關系數為由于觀測數據的相關系數是總體相關系數的相合估計,故當n充分大時,有2.二維總體的相關系數設是二維總體,743.相關分析當二元總體的兩個分量X與Y不相關,即時,而利用樣本數據算得的相關系數,這時用樣本數據相關系數來度量X與Y的關聯性是不合適的.因此,需要做假設檢驗1)2)檢驗統計量3.相關分析當二元總體的兩個分量X與Y不相關,即753.相關分析3)當H0為真時,統計量t~t(n﹣2)檢驗p的值為對于給定的顯著水平,若p<

,則拒絕H0,這時,認為X與Y相關,用樣本數據算得的相關系數反映了兩變量的線性關聯性的強弱.式中的t0為通過樣本數據算得的統計量t的值.3.相關分析3)當H0為真時,統計量76SPSS操作:相關分析1.做散點圖:標題、標目、散點Graphs-Scattert-Simple-Defind雙擊Title加標題、標目2.相關分析:Analyze-Correlation-Bivariate-Variables

DASC操作SPSS操作:相關分析77例1.2:一個產科醫師發現孕婦尿中雌三醇含量與產兒的體重有關。于是設想,通過測量待產婦尿中雌三醇含量,可以預測產兒體重,以便對低出生體重進行預防。因此收集了31例待產婦24小時的尿,測量其中的雌三醇含量,同時記錄產兒的體重。問尿中雌三醇含量與產兒體重之間相關系數是多少?是正相關還是負相關?分析問題:目的、變量、關系

例1.2:一個產科醫師發現孕婦尿中雌三醇含量與產兒的體重有關78編號

(1)尿雌三醇mg/24h(2產兒體重kg(3)編號

(1)尿雌三醇mg/24h(2)產兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2

待產婦尿雌三醇含量與產兒體重關系

編號

尿雌三醇產兒體重編號

尿雌三醇mg/24h(2)產兒體79計算結果從計算結果可以知道,31例待產婦尿中雌三醇含量與產兒體重之間程正相關,相關系數是0.61。計算結果從計算結果可以知道,31例待產婦尿中雌三醇含量與產兒80問題:我們能否得出結論:待產婦尿中雌三醇含量與產兒體重之間成正相關,相關系數是0.61?為什么?問題:我們能否得出結論:待產婦尿中雌三醇含量與產兒體重之間成81對例子中相關系數必須進行假設檢驗

例中的相關系數r等于0.61,說明了31例樣本中雌三醇含量與出生體重之間存在相關關系。但是,這31例只是總體中的一個樣本,由此得到的相關系數會存在抽樣誤差。因為,總體相關系數()為零時,由于抽樣誤差,從總體抽出的31例,其r可能不等于零。這就要對r進行假設檢驗,判斷r不等于零是由于抽樣誤差所致,還是兩個變量之間確實存在相關關系。

對例子中相關系數必須進行假設檢驗例中的相關系數r等于0.682H0:

=0

H1:

≠0=0.05r=0.61,n=31,代入公式

t==n-2=31-2=29

t=4.14查t值表,t0.05(29)=2.045,查t值表,t0.05(29)=2.045,上述計算t=4.14>2.045,由t所推斷的P值小于0.05,按=0.05水準拒絕,接受,認為臨產婦24小時內尿中雌三醇濃度與產兒體重之間有正相關關系。

H0:=0=n-2=31-2=29t=4.1483多元數據特征與相關分析課件84多元數據特征與相關分析課件85

等級相關

rankcorrelation

適用資料:⑴不服從雙變量正態分布⑵總體分布類型未知⑶原始數據用等級表示

等級相關系數qxy(即SpearmanCorrelationCoefficient)——反映兩變量間相關的密切程度與方向。

等級相關

rankcorrelation適用資料:⑴863.Spearman相關系數秩的概念將一容量為n的樣本觀測值x1,x2,…,xn按升序排列成

x(1)≤x(2)≤‥‥‥≤x(n)若xi

=x(k),則稱xi

的秩為k,記作Ri,稱R1,R2,…,Rn為秩統計量.3.Spearman相關系數秩的概念873.Spearman相關系數如下的樣本觀測值-0.8,-3.1,1.1,-5.2,4.2按升序排列成-5.2,-3.1,-0.8,1.1,4.2秩統計量R1,R2,…,Rn的取值為3,2,4,1,53.Spearman相關系數如下的樣本觀測值883.Spearman相關系數設二維總體(X,Y)T的樣本觀測數據為(x1,y1)T,(x2,y2)T,…,(xn,yn)T對于分量X,其樣本數據x1,x2,…,xn的秩統計量是R1,R2,…,Rn3.Spearman相關系數設二維總體(X,Y)T的樣本893.Spearman相關系數對于分量Y,其樣本數據y1,y2,…,yn的秩統計量是S1,S2,…,Sn記3.Spearman相關系數對于分量Y,其樣本數據y1,y2903.Spearman相關系數Spearman相關系數定義為Spearman相關系數qxy就是把Pearson相關系數rxy中X,Y的樣本值用X,Y的秩來代替的.3.Spearman相關系數Spearman相關系數定義為913.Spearman相關系數由于經過某些運算,可得可以推出,Spearman相關系數具有Pearson相關系數一樣的性質,如|qxy|≤1.3.Spearman相關系數由于921.3.2多維數據的數字特征及相關矩陣設是p維總體.樣本數據

1.3.2多維數據的數字特征及相關矩陣設93樣本數據觀測矩陣記稱為第i個樣品.X的p個列分別是變量X1,X2,…,Xp的n個觀測數據.樣本數據觀測矩陣記稱為第i個樣品.X的p個列分別是變量X1,94⑴第j列數據的均值樣本數據觀測矩陣可以寫成⑴第j列數據的均值樣本數據觀測矩陣可以寫成95⑵第j列數據的方差⑶第j,k列數據的協方差并且有⑵第j列數據的方差⑶第j,k列數據的協方差并且有96樣本觀測數據的均值向量樣本觀測數據的協方差矩陣樣本觀測數據的均值向量樣本觀測數據的協方差矩陣97⑷X的第j,k列數據的Pearson相關系數可見,rjj=1,X的Pearson相關矩陣⑷X的第j,k列數據的Pearson相關系數可見,rjj98注意到,樣本協方差矩陣成為注意到,樣本協方99若記則有,S=DRD若記則有,S=DRD100⑸對數據作標準化變換標準化數據的觀測矩陣是⑸對數據作標準化變換標準化數據的觀測矩陣是101標準化變換后的樣品觀測矩陣可以寫成標準化變換后的樣品觀測矩陣可以寫成102注意到就有所以注意到就有所以103即S*=R就是說,從標準化數據觀測矩陣X*計算得到的協方差陣就是由原數據觀測矩陣X計算得到的相關陣。即S*=R就是說,從標準化數據觀測矩陣X*計算得到的協方1041.3.3總體的數字特征、相關矩陣及

多維正態分布總體的數字特征

p維總體:

總體CDF:連續型總體的PDF:其中,1.3.3總體的數字特征、相關矩陣及

多維正態分布總體的數105總體均值向量其中,總體協方差矩陣總體均值向量其中,總體協方差矩陣106其中,總體分量Xj與Xk的協方差總體分量Xj與Xk的相關系數總有,jj=1,|jk|≤1.其中,總體分量Xj與Xk的協方差總體分量Xj與Xk的相關系數107總體的相關矩陣為若記則有總體的相關矩陣為若記則有1082.均值向量與協方差陣的性質設設A,B為常量矩陣,則E(AX)=AE(X)=ACov(AX)=ACov(X)AT=AATCov(AX,BY)=ACov(X,Y)BT

這里,Cov(X,Y)=E[(X-E(X))(Y–E(Y))],稱為X與Y的協方差陣.2.均值向量與協方差陣的性質設設A,B為常量矩陣,則E(AX109當n充分大時,有當n充分大時,有1103.多維正態分布若多維總體具有概率密度則稱總體X服從p維正態分布,記為X

~3.多維正態分布若多維總體具有概率密度則稱總體X服從p維正態111多維正態分布的性質⑴若Y=AX+b,其中Al×p,bl×1為常量矩陣,則設X

~Y

~多維正態分布的性質⑴若Y=AX+b,其中Al×p,112X(1)

~,X(2)

~⑵將X,和作如下劃分這里,p1+p2=p,且,則X(1)~113⑶正態總體X的兩個分量Xi和Xj相互獨立的充要條件是ij=0(i

≠j).又若則X(1)和X(2)相互獨立的充要條件是⑶正態總體X的兩個分量Xi和Xj相互獨立的充要條件是ij1141、概念當有多個變量存在時,為了研究任何兩個變量之間的關系,而使與這兩個變量有聯系的其它變量都保持不變。即控制了其它一個或多個變量的影響下,計算兩個變量的相關性。2、偏相關系數偏相關系數是用來衡量任何兩個變量之間的關系的大小。1、概念當有多個變量存在時,為了研究任何兩個變115

Analyze-----Correlation-----Partial把分析變量選入Variable框把控制變量選入Controllingfor框點擊Options點擊Statistics:選擇MeanandstandarddeviationZero-ordercorrelationContinueOK3.SPSS操作:偏相關分析Analyze-----Correlation-----Pa116第1章例3例3:已知某地29名13歲男童身高X1(cm)、體重X2(kg)和肺活量Y(ml),請計算身高與肺活量,體重與肺活量的相關關系。第1章例3117身高與肺活量的簡單相關系數1、身高與肺活量的簡單相關系數身高與肺活量的簡單相關系數1、身高與肺活量的簡單相關系數1182、體重與肺活量的簡單相關系數2、體重與肺活量的簡單相關系數1193、身高與體重的簡單相關系數3、身高與體重的簡單相關系數120

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論