數學建模講座多元統計分析_第1頁
數學建模講座多元統計分析_第2頁
數學建模講座多元統計分析_第3頁
數學建模講座多元統計分析_第4頁
數學建模講座多元統計分析_第5頁
已閱讀5頁,還剩181頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數學建模講座多元統計分析第1頁,共186頁,2023年,2月20日,星期六第一部分理論分析1.1相關分析1.2路徑分析1.3結構方程模型1.4聚類分析1.5因子分析第2頁,共186頁,2023年,2月20日,星期六相關分析第3頁,共186頁,2023年,2月20日,星期六(一)相關關系(1)函數關系:(如:銷售額與銷售量;圓面積和圓半徑.)是事物間的一種一一對應的確定性關系.即:當一個變量x取一定值時,另一變量y可以依確定的關系取一個確定的值(2)統計關系:(如:收入和消費;身高的遺傳.)事物間的關系不是確定性的.即:當一個變量x取一定值時,另一變量y的取值可能有幾個.一個變量的值不能由另一個變量唯一確定第4頁,共186頁,2023年,2月20日,星期六概述統計關系的常見類型:線性相關:正線性相關、負線性相關非線性相關統計關系不象函數關系那樣直接,但卻普遍存在,且有強有弱.如何測度?第5頁,共186頁,2023年,2月20日,星期六概述(二)相關分析的任務研究對象:統計關系相關分析旨在測度變量間線性關系的強弱程度第6頁,共186頁,2023年,2月20日,星期六相關分析(一)目的通過樣本數據,研究兩變量間線性相關程度的強弱.

(二)基本方法繪制散點圖、計算相關系數第7頁,共186頁,2023年,2月20日,星期六

繪制散點圖(一)散點圖將數據以點的形式繪制在直角平面上.比較直觀,可以用來發現變量間的關系和可能的趨勢.體現了正相關趨勢第8頁,共186頁,2023年,2月20日,星期六繪制散點圖(二)基本操作步驟(1)菜單選項:graphs->scatter(2)選擇散點圖類型:simple:簡單散點圖(顯示一對變量的散點圖)overlay:重疊散點圖(顯示多對變量的散點圖)(3)選擇x軸和y軸的變量(4)選擇分組變量(setmarkersby):分別以不同顏色點的表示(5)選擇標記變量(labelcaseby):散點圖上可帶有標記變量的值(如:職工號)第9頁,共186頁,2023年,2月20日,星期六計算相關系數(一)相關系數(1)作用:以精確的相關系數(r)體現兩個變量間的線性關系程度.r:[-1,+1];r=1:完全正相關;r=-1:完全負相關;r=0:無線性相關;|r|>0.8:強相關;|r|<0.3:弱相關第10頁,共186頁,2023年,2月20日,星期六計算相關系數(一)相關系數(2)說明:相關系數只是較好地度量了兩變量間的線性相關程度,不能描述非線性關系.如:x和y的取值為:(-1,-1)(-1,1)(1,-1)(1,1)

r=0但xi2+yi2=2數據中存在極端值時不好如:(1,1)(2,2)(3,3),(4,4),(5,5),(6,1)r=0.33但總體上表現出:x=y應結合散點圖分析第11頁,共186頁,2023年,2月20日,星期六計算相關系數(一)相關系數(3)種類:簡單線性相關系數(Pearson):針對定距數據.

(如:身高和體重)第12頁,共186頁,2023年,2月20日,星期六計算相關系數(一)相關系數(3)種類:Spearman相關系數:用來度量定序或定類變量間的線性相關關系(如:不同年齡段與不同收入段,職稱和受教育年份)利用秩(數據的排序次序).認為:如果x與y相關,則相應的秩Ui、Vi也具有同步性.首先得到兩變量中各數據的秩(Ui、Vi),并計算Di2統計量.計算Spearman秩相關系數,與簡單相關系數形式完全相同.若兩變量存在強正相關性,則Di2應較小,秩序相關系數較大.若兩變量存在強負相關性,則Di2應較大,秩序相關系數為負,絕對值較大第13頁,共186頁,2023年,2月20日,星期六計算相關系數(一)相關系數(3)種類:Kendall相關系數:度量定序定類變量間的線性相關關系首先計算一致對數目(U)和非一致對數目(V)如:對x和y求秩后為:x:24351y:34152x的秩按自然順序排序后:x:12345y:23145一致對:(2,3)(2,4)(2,5)(3,4)(3,5)(1,4)(1,5)(4,5)非一致對:(2,1)(3,1)然后計算Kendall相關系數.若兩變量存在強相關性,則V較小,秩序相關系數較大;若兩變量存在強負關性,則V較大,秩序相關系數為負,絕對值較大第14頁,共186頁,2023年,2月20日,星期六計算相關系數(二)相關系數檢驗應對兩變量來自的總體是否相關進行統計推斷.原因:抽樣的隨機性、樣本容量小等(1)H0:兩總體零相關(2)構造統計量簡單相關系數Spearman系數,大樣本下,近似正態分布kendall系數,大樣本下,近似正態分布第15頁,共186頁,2023年,2月20日,星期六計算相關系數(二)相關系數檢驗(3)計算統計量的值,并得到對應的相伴概率p(4)結論:如果p<=a,則拒絕H0,兩總體存在線性相關;如果p>a,不能拒絕H0.第16頁,共186頁,2023年,2月20日,星期六計算相關系數(三)基本操作步驟(1)菜單選項:analyze->correlate->bivariate...(2)選擇計算相關系數的變量到variables框.(3)選擇相關系數(correlationcoefficients).(4)顯著性檢驗(testofsignificance)tow-tailed:輸出雙尾概率P.one-tailed:輸出單尾概率P第17頁,共186頁,2023年,2月20日,星期六計算相關系數(四)其他選項statistics選項:僅當計算簡單相關系數時,選擇輸出哪些統計量.meansandstandarddeviations:均值、標準差;cross-productdeviationsandcovariances:分別輸出兩變量的離差平方和(sumofsquare分母)、兩變量的差積和(cross-products分子)、協方差(covariance以上各個數據除以n-1)第18頁,共186頁,2023年,2月20日,星期六偏相關分析(一)偏相關系數(1)含義: 在控制了其他變量的影響下計算兩變量的相關系數。虛假相關.研究商品的需求量和價格、消費者收入之間的關系.因為:需求量和價格之間的相關關系包含了消費者收入對商品需求量的影響;收入對價格也產生影響,并通過價格變動傳遞到對商品需求量的影響中。又如:糧食產量與平均氣溫、月降水量、平均日照時間、溫度之間的關系的研究。第19頁,共186頁,2023年,2月20日,星期六偏相關分析(2)計算方法:第20頁,共186頁,2023年,2月20日,星期六偏相關分析(二)基本操作步驟(1).菜單選項:analyze->correlate->partial…(2).選擇將參加計算的變量到variable框.(3).選擇控制變量到controllingfor框。(4)option選項:zero-ordercorrelations:輸出簡單相關系數矩陣第21頁,共186頁,2023年,2月20日,星期六路徑分析第22頁,共186頁,2023年,2月20日,星期六2023/4/2123第十章路徑分析

目錄上頁下頁返回結束

20世紀初,“Pearson原理”占著生物遺傳學(在過去幾乎就是我們現在所稱作的統計學)的統治地位。Pearson原理的一個基本內容就是相關關系是現實生活中最基本的關系,而因果關系僅僅是完全相關的(理論)極限。這種理論認為沒必要尋找變量之間的因果關系,只需計算相關系數。然而相關分析逐漸暴露出自身的很多局限:一是相關分析僅僅反應變量之間的線性關系;二是相關分析反應變量之間的關系是對稱的,而很多變量之間的關系是非對稱的;三是只有在正態假設下,相關思想才是有效的。第23頁,共186頁,2023年,2月20日,星期六2023/4/2124第十章路徑分析

目錄上頁下頁返回結束

在遺傳學中,很多現象具有明顯的因果關系,如父代與子代的基因關系,父代在前,子代在后,二者的關系只能是單向的,而非對稱的。對這種變量結構進行思考,遺傳學家SewallWright于1918-1921年提出路徑分析(pathanalysis),用來分析變量間的因果關系。現代的路徑分析由生物遺傳學家、心理測驗學家、計量經濟學家以及社會學家的推進,引入隱變量(latentvariable,又稱unmeasuredvariable,不可觀測變量),并允許變量間具有測量誤差,并且極大似然估計代替了最小二乘法,成為路徑系數主流的估計方法。第24頁,共186頁,2023年,2月20日,星期六2023/4/2125第十章路徑分析

目錄上頁下頁返回結束

路徑分析現在成為多元分析的一種重要方法,廣泛應用于遺傳學、社會學、心理學、經濟問題和市場調研領域。然而習慣上把基于最小二乘的傳統的路徑分析稱作路徑分析,而把基于極大似然的路徑分析稱作結構方程式模型(StructuralEquationModeling,SEM)。本節主要介紹傳統的路徑分析,不進行特別說明,本節所提到的路徑分析均指基于最小二乘的路徑分析,結構方程式模型方在下節介紹。第25頁,共186頁,2023年,2月20日,星期六2023/4/2126目錄上頁下頁返回結束

一、路徑圖路徑分析的主要工具是路徑圖,它采用一條帶箭頭的線(單箭頭表示變量間的因果關系,雙箭頭表示變量間的相關關系)表示變量間預先設定的關系,箭頭表明變量間的關系是線性的,很明顯,箭頭表示著一種因果關系發生的方向。在路徑圖中,觀測變量一般寫在矩形框內,不可觀測變量一般寫在橢圓框內,對于簡單的路徑模型,可以直接用字母表示變量,繪出路徑圖。第26頁,共186頁,2023年,2月20日,星期六2023/4/2127

目錄上頁下頁返回結束

圖10-1是一個簡單的路徑路,A是父親智商,B是母親智商,C1、C2是兩個成年子女的智商,是與A,B不相關的另外原因變量。一般來說,父母親的智商之間不存在關系;父母親的智商對子女的智商存在因果關系,用單箭頭表示,子女的之間,存在相關關關系,用雙箭頭表示。箭頭上的字母表示路徑系數,路徑系數反應原因變量對結果變量的相對影響大小。在路徑分析中一般采用經過標準化后的變量,沒有特別說明,均指經過標準化后的變量。可以把圖10-1寫為方程式的形式:(10.1)第27頁,共186頁,2023年,2月20日,星期六2023/4/2128

目錄上頁下頁返回結束

式(10.1)實際上是普通的多元回歸方程,多元回歸分析是因果關系模型的一種,但它是一種比較簡單的因果關系模型,各個自變量對因變量的作用并列存在,它僅包含一個環節的因果結構。路徑分析的優勢在于它可以容納多環節的因果結構,通過路徑圖把這些因果關系很清楚地表示出來,據此進行更深層次的分析,如比較各種因素之間的相對重要程度,計算變量與變量之間的直接與間接影響,這在后面會涉及到。圖10-2是有關一種消費性電子產品(如手機)路徑分析的例子(這里省略了路徑系數),四個變量耐用性、操作的簡單性、通話效果和價格兩兩相關,決定感知價值,同時通過感知價值決定忠誠度。相對于圖10-1,它具有兩層的因果關系。接下來主要以圖10-2為例,說明路徑圖中的一些基本概念。第28頁,共186頁,2023年,2月20日,星期六2023/4/2129

目錄上頁下頁返回結束

§10.1.1

路徑圖第29頁,共186頁,2023年,2月20日,星期六2023/4/2130

目錄上頁下頁返回結束

路徑圖上的變量分為兩大類:一類是外生變量(exogenousvariable,又稱獨立變量,源變量),它不受模型中其他變量的影響,如圖10-2中的耐用性、操作的簡單性、通話效果和價格。與此相反,另一類是內生變量(endogenousvariable,又稱因變量或下游變量),在路徑圖上至少有一個箭頭指向它,它被模型中的其它一些變量所決定,如圖10-2中的感知價值由耐用性、操作的簡單性、通話效果和價格四個變量和隨機誤差e5決定,忠誠度取決于四個外生變量、感知價值和隨機誤差e6。此外,我們可以將路徑圖中不影響其它變量的內生變量稱為最終結果變量(ultimateresponsevariable),最終結果變量不一定只有一個。圖10-2中忠誠度是最終結果變量。第30頁,共186頁,2023年,2月20日,星期六2023/4/2131

目錄上頁下頁返回結束

其他變量(A)對內生變量(B)的影響有兩種情況:若A直接通過單向箭頭對B具有因果影響,稱A對B有直接作用(directeffect);若A對B的作用是間接地通過其他變量(C)起作用,稱A對B有間接作用(indirecteffect),稱C為中間變量(mediatorvariable)。變量間的間接作用常常由多種路徑最終總合而成。圖10-2中,四個外生變量耐用性、操作的簡單性、通話效果和價格既對忠誠度有直接作用,同時通過感知價值對忠誠度具有間接作用。第31頁,共186頁,2023年,2月20日,星期六2023/4/2132

目錄上頁下頁返回結束

如果模型中包含中間變量,首先從理論角度考慮,這個中間作用是否有理論依據,其次實際工作者會提出這樣的問題:“模型中中間變量的中間影響顯著嗎?”,這些問題涉及到對中間變量的間接作用進行檢驗。Barron,R.M.&KennyD.(1986)提出了檢驗中間變量間接作用是否統計顯著的一種做法。他們利用基于普通最小二乘的多元回歸進行,以圖10-2為例說明這種做法:第一步:用中間變量(感知價值)對外生變量耐用性、操作的簡單性、通話效果和價格四個變量進行回歸;第二步:用內生變量(忠誠度)對第一步中的四個變量進行回歸;第三步:用忠誠度對第一步中的四個變量以及中間變量感知價值進行回歸。第32頁,共186頁,2023年,2月20日,星期六2023/4/2133

目錄上頁下頁返回結束

Agarwal,S.&Teas,R.K.(1997)的工作表明“如果(a)在第一步的估計中解釋變量統計顯著;(b)在第二步的估計中解釋變量統計顯著;(c)在第三步的估計中中間變量統計顯著,則說明中間變量的間接作用顯著”.假設對圖10-2進行間接作用檢驗,得到表10-1。第33頁,共186頁,2023年,2月20日,星期六2023/4/2134

目錄上頁下頁返回結束

對每一外生變量,存在三種可能的中間結果:沒有間接作用(nomediation),部分間接作用(partialmediation)和完全間接作用(fullmediation)。如果第一步中外生變量的回歸系數不是統計顯著或者第三步中(中間變量)感知價值的回歸系數不顯著,說明該外生變量不存在間接作用;如果某一外生變量(如耐用性、操作的簡單性和通話效果)在第一步和第三步中的回歸系數都是統計顯著的,說明該外生變量存在部分間接作用;如果某外生變量(價格)的回歸系數在第一步顯著,而在第三步不顯著,說明該外生變量存在完全的間接作用。第34頁,共186頁,2023年,2月20日,星期六2023/4/2135

目錄上頁下頁返回結束

廣義的路徑模型有兩種基本類型:遞歸模型和非遞歸模型。兩種模型在分析時有所不同,遞歸模型可以直接通過最小二乘求解,而非遞歸模型的求解比較復雜。盡管本章主要介紹基于最小二乘的路徑分析(即遞歸路徑模型),但同時也要求讀者能夠預先正確判斷一個模型的所屬類型,才能保證應用路徑分析不會出錯。因果關系結構中全部為單向鏈條關系、無反饋作用的模型稱為遞歸模型(recursivemodel)。無反饋作用意味著,各內生變量與其原因變量的誤差項之間或各兩個內生變量的誤差項之間必須相互獨立。與遞歸模型相對的另一類模型稱作非遞歸模型(nonrecursivemodel)。一般來說,非遞歸模型相對來說容易判斷,如果一個模型不包括非遞規模型的特征,它便是遞歸模型。第35頁,共186頁,2023年,2月20日,星期六2023/4/2136

目錄上頁下頁返回結束

如果一個路徑模型包括以下四種情況,便是非遞歸模型。情況一:模型中任何兩個變量之間存在直接反饋作用,在路徑圖上表示為雙向因果關系。如圖10-3(a)所示。情況二:某變量存在自身反饋作用,即該變量存在自相關,如圖10-3(b)所示。第36頁,共186頁,2023年,2月20日,星期六2023/4/2137

目錄上頁下頁返回結束

情況三:變量之間雖然沒有直接反饋,但是存在間接反饋作用,即順著某一變量及隨后變量的路徑方向循序前進,經過若干變量后,又能返回這一起始變量,如圖10-3(c)所示。第37頁,共186頁,2023年,2月20日,星期六2023/4/2138

目錄上頁下頁返回結束

情況四:內生變量的誤差項與其他有關項相關,如結果變量的誤差項與其原因項相關(圖10-3(d)),或者不同變量之間的誤差項之間存在相關(圖10-3(e))。第38頁,共186頁,2023年,2月20日,星期六2023/4/2139

目錄上頁下頁返回結束

使用最小二乘的估計方法要求路徑模型具有一些假設要求和限制,現在總結如下:

(1)首先要求模型中各變量的函數關系為線性、可加;否則不能采用回歸方法估計路徑系數。如果處理變量之間的交互作用,把交互項看作一個單獨的變量,此時它與其它變量的函數關系同樣滿足線性、可加。

(2)模型中各變量均為等間距測度。盡管路徑分析中通常會使用二分數據(dichotomiesdata)或者順序數據(ordinaldata),然而不能使用超過一個值的虛擬變量,因為這會違反遞歸性要求。第39頁,共186頁,2023年,2月20日,星期六2023/4/2140

目錄上頁下頁返回結束

(3)每一內生變量的誤差項不得與其前置變量相關,同時也不得與其它內生變量及其誤差項相關。這是對模型遞歸性的要求。另外,模型不考慮外生變量的相關性,即不對外生變量的相關進行分析。(4)模型中的因果關系必須為單向,不得包括各種形式的反饋作用。這同樣是對模型遞歸性的要求。(5)各變量均為可觀測變量,并且各變量的測量不能存在誤差。這兩個弱點在SEM技術中得到了克服,已經發展了一套成熟的處理隱變量和測量誤差的技術。(6)變量間的多重共線性程度不能太高,否則路徑系數估計值的誤差將會很大。(7)需要有足夠的樣本量。Kline(1998)建議樣本量的個數應該是需要估計的參數個數的10倍(20倍更加理想)。第40頁,共186頁,2023年,2月20日,星期六2023/4/2141

目錄上頁下頁返回結束

在上述假設下,采用最小二乘法可以很容易求解各個參數值,見文獻[3],并且可以單獨對其中一個方程求解。上述假設條件用數學符號很容易說明,但有些抽象。任何一個(遞歸)路徑模型都可以用結構方程組表示,假設和分別為模型中的內生和外生可觀側變量向量;是的參系數矩陣,可以證明,若為路徑遞歸模型,則總可以寫為上三角矩陣。是的參系數矩陣,e為內生變量所對應的誤差項,滿足期望為零,兩兩不相關。則該路徑模型的結構方程組為:和

第41頁,共186頁,2023年,2月20日,星期六2023/4/2142目錄上頁下頁返回結束

作為本節結束,我們需要提醒讀者:一個好的路徑圖并不意味著一定包含有盡可能多的箭頭;相反,統計學上最感興趣的情形是:應該尋找盡可能少的箭頭去聯結盡可能少的變量,而這時的路徑圖又能對所代表的樣本擬合得好,即所謂模型簡約性(parsimony),在后面有關模型擬合度的檢驗中我們對這段話會有更深的體會。第42頁,共186頁,2023年,2月20日,星期六2023/4/2143

目錄上頁下頁返回結束

路徑分析技術是從分解相關系數發展出來的,因此分解相關系數在路徑分析中帶有一般性意義,并且是路徑分析中很重要的一部分。通過對原因變量和結果變量的相關系數的分解,我們可以很清楚地看出造成相關關系的各種原因。有時也涉及到對回歸系數的分解,我們這里不進行介紹。下面以一例子說明相關系數的分解過程。圖10-4為一假想的六個變量的路徑圖:A,B,C為三個兩兩相關的外生變量,A,B和殘差項e4共同決定D,B,C,D和殘差項e5決定E,最后,D,E和殘差項e6影響最終結果變量F,共具有三層的因果關系。對應于路徑圖,我們寫出結構方程組:第43頁,共186頁,2023年,2月20日,星期六2023/4/2144

目錄上頁下頁返回結束

第44頁,共186頁,2023年,2月20日,星期六2023/4/2145

目錄上頁下頁返回結束

外生變量的相關關系在圖中體現,內生變量的誤差項之間獨立,內生變量的誤差項與其前置變量之間獨立。在式(10.3)中,如果路徑系數p14,p24已知,則D的方差可以從上式計算出的大小。很容易看出,對其它的表達式存在同樣的結果,這里只是提醒讀者,殘差項的路徑系數由其它路徑系數決定,并且該內生變量與其誤差項的相關系數即為誤差項的路徑系數;另外,殘差項的路徑系數可由多元回歸的決定系數計算出,它們之間的關系為:

,詳細的證明可參考[8]。第45頁,共186頁,2023年,2月20日,星期六2023/4/2146

目錄上頁下頁返回結束

下面考慮相關系數的分解,首先分解A,D之間的相關系數,由于各變量均經過標準化處理,所以A,D的相關系數

等于A,D乘積的期望值。即(變量D用式10.3代替)第46頁,共186頁,2023年,2月20日,星期六2023/4/2147

目錄上頁下頁返回結束

第47頁,共186頁,2023年,2月20日,星期六2023/4/2148

目錄上頁下頁返回結束

第48頁,共186頁,2023年,2月20日,星期六2023/4/2149

目錄上頁下頁返回結束

第49頁,共186頁,2023年,2月20日,星期六2023/4/2150

目錄上頁下頁返回結束

第50頁,共186頁,2023年,2月20日,星期六2023/4/2151

目錄上頁下頁返回結束

第51頁,共186頁,2023年,2月20日,星期六2023/4/2152

目錄上頁下頁返回結束

通過上面對相關系數的分解,我們可以總結出,相關系數的分解可能產生四種類型的組成部分:(1)直接作用;(2)間接作用;(3)由于原因變量相關而產生的未析部分;(4)由于共同原因的存在而產生的偽相關部分。路徑系數分解的結果一般通過報表的形式把各種作用展現出來,第五節的實例分析會給讀者提供一個報表的形式。然而,如果按照上面的步驟,相關系數的分解將是非常繁瑣的。Wright提供了從路徑圖直接分解的規則。Wright認為,對于一個遞歸性的路徑模型,任何兩個變量的相關系數都可以表示成連接這兩點之間的所有復合路徑之和;而這個復合路徑是按下述三個規則選取的(Wright規則):第52頁,共186頁,2023年,2月20日,星期六2023/4/2153

目錄上頁下頁返回結束

(1)這個復合路徑沒有閉合環路;(2)在這個復合路徑中的箭頭取向是不可有“先向前,再向后”,也就是說該路徑鏈上不止兩個箭頭時,要“先向后”盡可能多的次數,“再向前”盡可能少的次數。(3)對于有多個雙箭頭的鏈,只可以取最遠距離的一個雙箭頭。即一條路徑中不可以包含兩個雙向箭頭。結合Wright規則,在圖10-5(a)中,若計算D和E的相關系數,路徑DCE是合理的,而路徑DCABCE則不可以(規則(1));在圖10-5(b)中,若計算B和C的相關系數,路徑BAC是合理的,而路徑BDC則不可以(規則(2));在圖10-5(c)中,若計算D和F的相關系數,路徑DACF是合理的,而路徑DABCF則不可以(規則(3))。第53頁,共186頁,2023年,2月20日,星期六2023/4/2154

目錄上頁下頁返回結束

第54頁,共186頁,2023年,2月20日,星期六2023/4/2155

目錄上頁下頁返回結束

第55頁,共186頁,2023年,2月20日,星期六2023/4/2156

目錄上頁下頁返回結束

第56頁,共186頁,2023年,2月20日,星期六2023/4/2157

目錄上頁下頁返回結束

路徑分析流程圖及SPSS指令分析流程圖進行路徑分析所使用的SPSS指令第57頁,共186頁,2023年,2月20日,星期六2023/4/2158

目錄上頁下頁返回結束

分析流程圖第58頁,共186頁,2023年,2月20日,星期六2023/4/2159

目錄上頁下頁返回結束

進行路徑分析所使用的SPSS指令下面以SPSSAmos模塊為例說明路徑分析的實現過程;然而根據上面的介紹,路徑分析也可以利用回歸分析手工完成。在AmosGraphics模塊中,首先需要選擇數據文件,在File菜單下,選擇“DataFiles”給出需要進行分析的文件名。然后繪出路徑分析圖:在Diagram菜單下,選擇“DrawObserved”繪制觀測變量;選擇“DrawUnobserved”繪制不可觀測變量,在路徑分析中是殘差項;選擇“DrawPath”繪制兩變量的因果關系;選擇“DrawCovariance”繪制兩變量的相關關系;然后對繪出的各個變量指定變量名。第59頁,共186頁,2023年,2月20日,星期六2023/4/2160

目錄上頁下頁返回結束

進行路徑分析所使用的SPSS指令接著要指定殘差項方差為1,選定某個殘差項后,擊右鍵,選擇“ObjectProperties”后,在“Parameteres”下設定方差為1。并在菜單下View/Set下選擇“AnalysisProperties”,在“Estimation”一項中選擇估計方法為“Scale-freeleastsquare”,關閉該窗口。最后就可以點擊Model-Fit菜單下的選項“CalculateEstimates”計算路徑系數了。可以通過三種方式察看結果:文字法,表格法和圖表法。第60頁,共186頁,2023年,2月20日,星期六2023/4/2161

目錄上頁下頁返回結束

案例分析從對路徑模型的介紹可以知道,路徑系數的估計并不復雜,用普通的多元回歸方法就可實現。SPSS軟件是一個可以選擇的軟件,然而路徑分析又不全部是靠軟件實現的,變量相關系數的分解,對模型的調試和檢驗通過手工就可完成。下面以具體實例說明路徑分析的整個實現過程。第61頁,共186頁,2023年,2月20日,星期六2023/4/2162

目錄上頁下頁返回結束

模型設定【例10.1】我們采用SPSS10.0自帶的數據文件Employeedata進行路徑分析。該數據共有474個觀測值,473個有效,標號為434的出生日期缺失,在下面的分析中,不考慮該樣品;該數據包含10個變量:標號(id)、性別(gender)、出生日期(bdate,DateofBirth)、受教育水平(educ,EducationalLevel)、工作類別(jobcat,EmploymentCategory)、當前工資(salary,CurrentSalary)、初始工資(salbegin,BeginningSalary)、已經工作時間(jobtime,MonthssinceHire)、以前的工作經驗(preexp,PreviousExperience)、是否是少數民族(minority)。性別為屬性變量,用“f”表示女性,“m”表示男性;受教育水平使用受教育的年數衡量;工作類別分為三類:公務員(“1”),監督人(“2”)以及經理人員(“3”)。第62頁,共186頁,2023年,2月20日,星期六2023/4/2163

目錄上頁下頁返回結束

模型設定當前工資和初始工資以實際額為準。已經工作的時間和以前的工作經驗均以發生的月份衡量;是否是少數民族為0,1變量,1表示是少數民族,0表示非少數民族。假設數據的采集時間為1997,則用1997減出生日期的年份數作為年齡(age)的衡量指標。例如若某人在1952年出生,則年齡的測度為1997-1952=45。表10-2為樣本相關系數矩陣。第63頁,共186頁,2023年,2月20日,星期六2023/4/2164

目錄上頁下頁返回結束

模型設定對標號、性別、民族不進行區分,關注其余7個變量之間的因果關系。表10-2為這7個變量的樣本相關系數。根據時間和邏輯順序,我們得到幾條因果路徑:受教育水平影響初始工資和當前工資,因為大量統計結果表明,個人受教育的水平越高,所獲得工資也越高;同時也認為,一個人受教育水平越高,以前的工作經驗越多,他從事的工作類別應該越高;另外,初始工資會影響工作類別,在相關系數矩陣中,我們已經看到二者的相關系數較大;年齡影響已經工作的時間以及以前的工作經驗,因為年齡越大,(在本職位)已經工作的時間或者以前的工作經驗會越長;其次,年齡和受教育水平應該存在負相關,這里不關注二者的因果關系,僅僅簡單假設二者相關。第64頁,共186頁,2023年,2月20日,星期六2023/4/2165

目錄上頁下頁返回結束

模型設定最后,初始工資、工作類別、已經工作的時間以及以前的工作經驗都影響當前工資,一般來說,初始工資越高,工作類別越高(按1,2,3的順序),以前工作的經驗越多,時間越長,當前的工資越高,這些變量間的均應有正的因果關系。根據這些邏輯理由,我們假設的路徑模型如圖10-8所示,不妨稱此模型為模型1。很顯然,模型1為遞歸的路徑模型,各外生變量不存在測量誤差,假設各路徑的因果關系均為線性、可加,并進一步假設各內生變量之間不存在相關關系。第65頁,共186頁,2023年,2月20日,星期六2023/4/2166

目錄上頁下頁返回結束

模型設定第66頁,共186頁,2023年,2月20日,星期六2023/4/2167

目錄上頁下頁返回結束

路徑系數估計采用Amos軟件對圖10-8進行估計,輸出結果如圖10-9所示。第67頁,共186頁,2023年,2月20日,星期六2023/4/2168

目錄上頁下頁返回結束

路徑系數估計根據圖10-9,我們發現年齡對已經工作時間的路徑系數僅為0.003,為0.001,方程擬合效果不好;同時,以前工作經驗對當前工資的路徑系數也很小。考慮刪除上面的兩條路徑以及殘差項e6,并重新估計模型,結果如圖10-10。第68頁,共186頁,2023年,2月20日,星期六2023/4/21中國人民大學六西格瑪質量管理研究中心69

目錄上頁下頁返回結束

模型的調試和檢驗假設圖10-9對應的模型是基準模型,圖10-10對應的模型為待檢模型。下面分別計算基準模型和待檢模型的擬合指數和,對模型進行調試:

第69頁,共186頁,2023年,2月20日,星期六2023/4/2170

目錄上頁下頁返回結束

模型的調試和檢驗

從而W統計量為:若基準模型正確,W服從自由度為2的分布。這里W的p值為0.1891,統計不顯著。可以認為圖10-10對應的模型正確。第70頁,共186頁,2023年,2月20日,星期六2023/4/2171

目錄上頁下頁返回結束

路徑系數分解

表10-3是Amos軟件總效應的分解報表:表10-3路徑系數的分解報表

原因變量

結果變量總影響直接影響間接影響受教育水平初始工資0.5700.5700.000工作類別0.5300.1290.401當前工資0.6580.1960.462年齡以前工作經驗0.8010.8010.000工作類別0.1230.0000.123當前工資0.0220.0000.022已經工作時間當前工資0.0840.0840.000以前工作經驗工作類別0.1540.1540.000當前工資0.0280.0000.028初始工資工作類別0.7050.7050.000當前工資0.7690.6400.129工作類別當前工資0.1830.1830.000第71頁,共186頁,2023年,2月20日,星期六2023/4/2172

目錄上頁下頁返回結束

路徑系數分解

可以看出,受教育水平對當前工資的影響主要是通過工作類別和初始工資傳遞的間接影響,教育水平對初始工資(工作)具有很大的影響作用,但隨后的(直接)影響便較弱(0.196),這與我們的常識相一致,初始工作可能取決于學歷,然而以后主要看工作經歷及個人能力了。年齡對當前工資的影響主要通過工作類別和以前工作經驗的傳遞完成,它對當前工資的影響為正。其它的分析類似,讀者不妨自己動手分析。

下面再舉一個例子。第72頁,共186頁,2023年,2月20日,星期六2023/4/2173

目錄上頁下頁返回結束

路徑系數分解

【例10.2】一家大型的商業銀行在多個地區設有分行,其業務主要是進行基礎設施建設、國家重點項目建設、固定資產投資等項目的貸款。今年來,該銀行的貸款額平穩增長,但不良貸款額也有較大比例的增長,這給銀行業務的發展帶來較大的壓力。為弄清楚不良貸款形成的原因,管理者希望利用銀行業務的有關數據做些定量分析,以便找出控制不量貸款的辦法。圖10-11就是該銀行所屬的25家分行2002年的有關業務數據。第73頁,共186頁,2023年,2月20日,星期六圖10.11商業銀行所屬的25家分行2002年的有關業務數據2023/4/2174

目錄上頁下頁返回結束

第74頁,共186頁,2023年,2月20日,星期六2023/4/2175

目錄上頁下頁返回結束

路徑系數分解

注:不良貸款(y)、貸款余額(x1)、累計應收貸款(x2)、貸款項目個數(x3)和固定資產投資額(x4)根據經驗可知,各項貸款余額越高則不良貸款越高,但同時,各項貸款余額也會受其他變量的影響,因此綜合考慮之下,本例應該建立如下的路徑分析模型:第75頁,共186頁,2023年,2月20日,星期六2023/4/2176

目錄上頁下頁返回結束

路徑系數分解

下面考慮對該模型加以擬合,由于整個模型是一個遞歸模型,可以在SPSS中使用分別擬合回歸方程的方法來實現對模型中各參數的估計,首先對各項貸款余額回歸方程進行估計,結果見表10-4和10-5:表10-4第76頁,共186頁,2023年,2月20日,星期六2023/4/2177

目錄上頁下頁返回結束

路徑系數分解

表10-5可見,應收貸款、貸款項目、固定資產均對各項貸款余額有影響。應收貸款、貸款項目則各項貸款余額越高。下面對第二個方程進行估計,參數結果見表10-6和表10-7:第77頁,共186頁,2023年,2月20日,星期六2023/4/2178

目錄上頁下頁返回結束

路徑系數分解

表10-6表10-7第78頁,共186頁,2023年,2月20日,星期六2023/4/2179目錄上頁下頁返回結束

路徑系數分解

固定資產和各項貸款對不良貸款有影響,而應收貸款、貸款項目對其影響不顯著。從上面分析可知,如果只是擬合第二個方程,則所得結果其實就是一個簡單的多重回歸方程結果,而且可知自變量間存在共線性。顯然,對于不良貸款而言,使用路徑分析并不會使得模型對最終結果變量預測的更加精確。但通過對自變量間復雜關聯的刻畫,路徑分析模型可以很精確地估計出每一個自變量究竟是通過那些方式來作用于最終因變量的,從而使得研究者對問題的理解更加深入和全面。通過上面的分析,可以將上述模型加以簡化,去除那些無統計意義的變量后重新加以擬合,分析結果見表10-8和表10-9:第79頁,共186頁,2023年,2月20日,星期六2023/4/2180

目錄上頁下頁返回結束

路徑系數分解表10-8表10-9第80頁,共186頁,2023年,2月20日,星期六2023/4/2181

目錄上頁下頁返回結束

路徑系數分解可見方程的決定系數基本未變,自變量均有統計學意義。顯然,化簡后的路徑分析模型對數據的解釋程度與前一個模型相比無顯著差別,但更加簡潔。本例所擬合的路徑分析模型可以使用標準化系數繪制出路徑如圖10-12.圖10-12第81頁,共186頁,2023年,2月20日,星期六結構方程模型第82頁,共186頁,2023年,2月20日,星期六2023/4/2183目錄上頁下頁返回結束結構方程模型結構方程模型SEM(structuralequationmodeling)是近二十年應用統計學領域中發展最為迅速的一個分支。它是一種實證分析模型,通過尋找變量間內在的結構關系,去驗證某種結構關系或模型的假設是否合理,模型是否正確,并且如果模型存在問題,可以指出如何加以修改。結構方程模型的另一大特點是可以對隱變量(latentvariables)進行分析。多元回歸分析、因子分析和路徑分析等都可看成是結構方程模型的一種特例。現實生活中,有許多變量諸如健康、優秀、樂觀、智力、滿意、公正等概念雖然是客觀存在的,但由于人的認識水平或事物本身的抽象性、復雜性等原因,我們是無法直接測量的,我們稱這樣的變量為隱變量。結構方程可以通過一些可觀測變量對這些隱變量的特征及其相互之間的關系進行描述,因此,有時也稱結構方程模型為隱變量分析模型。第83頁,共186頁,2023年,2月20日,星期六2023/4/2184目錄上頁下頁返回結束結構方程模型結構方程模型的應用始見于20世紀60年代發表的論文中,1987年Loehlin用路徑分析模型和結構方程模型對隱變量模型作了出色的介紹,兩年之后Bollen提出了處理測量誤差模型的更專門化的統計辦法。到了90年代,結構方程模型得到了廣泛的應用。目前,結構方程模型已發展成內容非常豐富的一個重要領域,在此,僅介紹結構方程模型一些基本內容,有興趣的讀者可以進一步參閱相關書籍。第84頁,共186頁,2023年,2月20日,星期六2023/4/21中國人民大學六西格瑪質量管理研究中心85目錄上頁下頁返回結束結構方程模型的基本思想結構方程模型是反映隱變量和顯變量的一組方程,其目的是通過顯變量的測量推斷隱變量,并對假設模型的正確性進行檢驗。結構方程模型是模型驗證技術。即利用結構方程模型分析的過程實際上是對假定模型的驗證過程。對于某個領域的專業人員根據本領域的知識或常識建立的反映結構關系的模型,由于專業人員的認識水平和各種原因的限制,這一模型未必是客觀現實的反映,有可能存在偏差和主觀性,如何發現模型的問題,如何根據分析結果進一步修正模型,這些正是結構方程模型可以處理的問題。第85頁,共186頁,2023年,2月20日,星期六2023/4/2186目錄上頁下頁返回結束具體來說,結構方程模型分析的過程是:在設定結構模型的基礎上,為證實模型的準確性,首先要判斷這些方程是否可識別模型,對于可識別模型,通過收集顯變量的數據,利用最大似然估計(maximumlikelihood)或廣義最小二乘估計(generalizedleastsquares)等估計方法對未知參數進行估計。對于模型的結果,需要對模型與數據之間是否擬合進行評價。如果,模型與數據擬合得不好,就需要對模型進行修正,重新設定模型,一個擬合較好的模型往往需要反復試驗多次。在進行模型估計之前,研究者需要根據專業知識或經驗設定假設的初始模型。而結構方程模型的主要用途即為確定該假定模型是否合理。第86頁,共186頁,2023年,2月20日,星期六2023/4/2187目錄上頁下頁返回結束結構方程模型通常是借助路徑圖將初始模型描述出來,對于復雜的模型尤其如此。這里從與結構方程結合的角度,對上一章的內容簡單回顧一下,并在此基礎上看怎樣得出結構方程模型。路徑圖中的變量可以是不同的類型,按能否被直接測量,路徑圖中的變量可以分為顯變量(manifestvariable)和隱變量(latentvariable)。通常前者是可以直接測量的,在圖中用方框來標識;而后者雖然是客觀存在的,但由于人的認識水平或事物本身的抽象性、復雜性等原因,我們無法直接測量,通常用橢圓形框來標識。

第87頁,共186頁,2023年,2月20日,星期六2023/4/2188目錄上頁下頁返回結束按照變量之間的關系,又可分為外生變量(exogenousvariable)和內生變量(endogenousvariable),內生變量是由隱變量決定的變量,外生變量是由顯變量決定的變量。變量之間的關系用線條表示,可以是直接作用也可以是間接作用,當二者之間有直接聯線時,稱為直接作用。如果變量之間沒有直接聯線則是假設變量之間沒有直接聯系,但可以通過其他變量發生聯系,稱之為間接聯系。線條既可以加單箭頭,也可以加雙箭頭。單箭頭表示存在因果關系,雙箭頭則表示具有相關關系。

第88頁,共186頁,2023年,2月20日,星期六2023/4/2189目錄上頁下頁返回結束下面用一個具體的事例來看一下路徑圖,然后在此基礎上寫出結構方程模型。這是Wheatonetal在1977年給出的一個廣為人知的例子。這是一個測度“神精錯亂平穩性”的例子,在他給出的數據集中使用了Illinois農村地區932個人的調查數據,調查了六個變量:y1:1967年的異常程度;y2:1967年的軟弱程度;y3:1971年的異常程度;y4:1971年的軟弱程度;x1:受教育情況(上學年數);x2:當地的社會經濟指數。第89頁,共186頁,2023年,2月20日,星期六2023/4/2190目錄上頁下頁返回結束第90頁,共186頁,2023年,2月20日,星期六2023/4/2191目錄上頁下頁返回結束第91頁,共186頁,2023年,2月20日,星期六2023/4/2192目錄上頁下頁返回結束路徑圖實際上提供了一個假設模型,它體現了隱變量與隱變量之間、隱變量與顯變量之間(包括內生隱變量與顯變量和外生隱變量與顯變量之間)可能存在的關系,而且,這種關系的具體程度,可以通過路徑系數來反映。在這些變量中,顯變量是可以觀測的,而每個隱變量都對應著幾個顯變量,如上圖中的隱變量“社會經濟狀況”就對應著兩個顯變量“受教育情況”和“社會經濟指數”。給出路徑圖后,我們就可以對這些假設的結構關系,利用顯變量的數據,通過建立結構方程模型,進一步檢驗模型假設的合理性并確定模型中的路徑系數。第92頁,共186頁,2023年,2月20日,星期六2023/4/2193目錄上頁下頁返回結束結構方程模型的結構結構方程模型一般由測量方程(MeasurementEquation)和結構方程(StructuralEquation)兩部分構成。測量方程描述潛變量與指標之間的關系;結構方程則反映潛變量之間的關系。指標含有隨機誤差和系統誤差。前者指測量上的不準確性行為,后者反映指標同時測量潛變量以外的特性。隨機誤差和系統誤差統稱為測量誤差,但潛變量則不含這些誤差。第93頁,共186頁,2023年,2月20日,星期六2023/4/2194目錄上頁下頁返回結束第94頁,共186頁,2023年,2月20日,星期六2023/4/2195目錄上頁下頁返回結束第95頁,共186頁,2023年,2月20日,星期六2023/4/2196目錄上頁下頁返回結束第96頁,共186頁,2023年,2月20日,星期六2023/4/2197目錄上頁下頁返回結束結構方程模型的優點(1)能同時處理多個因變量。結構方程模型可同時考慮并處理多個因變量。而回歸分析中,只能處理一個因變量,如果有多個因變量需要處理,則需要分別計算,這樣在計算一個因變量時,就忽略了其他因變量的存在及影響。第97頁,共186頁,2023年,2月20日,星期六2023/4/2198目錄上頁下頁返回結束(2)允許自變量和因變量均包含測量誤差。從測量方程中可看到,很多變量如學業成績、社會經濟地位等潛變量的觀察值不能用單一指標來測量,往往還包含了大量的測量誤差。從結構方程模型的特點看出:結構方程分析允許自變量和因變量均含有測量誤差。而回歸分析只允許因變量存在測量誤差,假定自變量沒有誤差。(3)估計整個模型的擬和程度。在傳統的路徑分析中,我們只估計每條路徑變量間關系得強弱。在結構方程分析中,可以通過結構方程軟件LISREL計算出的多個擬和參數值,可以判斷不同模型對同一個樣本數據的整體擬和程度,從中選取最精確的模型描述樣本數據體呈現的特征。第98頁,共186頁,2023年,2月20日,星期六2023/4/2199目錄上頁下頁返回結束結構方程模型的構建

由上一節介紹的結構方程模型的結構模式可以看出,結構方程模型一般由測量方程(MeasurementEquation)和結構方程(StructuralEquation)兩部分構成。要很好完成這兩部分的構造,關鍵是利用結構方程模型中分析變量(包括顯變量和隱變量)的關系,根據相關領域的專業知識和研究目的,構建出理論模型,然后用測得的數據去驗證這個理論模型的合理性。下面以一經典實例來說明模型的建立過程。第99頁,共186頁,2023年,2月20日,星期六2023/4/21100目錄上頁下頁返回結束第100頁,共186頁,2023年,2月20日,星期六2023/4/21101目錄上頁下頁返回結束結構方程模型的構建

(1)結構方程的建立根據模型的假設條件可以建立反映隱變間關系的路徑圖,見圖11-2。第101頁,共186頁,2023年,2月20日,星期六2023/4/21102目錄上頁下頁返回結束結構方程模型的構建

第102頁,共186頁,2023年,2月20日,星期六2023/4/21103目錄上頁下頁返回結束結構方程模型的構建

(2)測量方程的建立。根據模型的假設條件可以建立反映顯變量和隱變量關系的路徑圖,如圖11-3、圖11-4、圖11-5所示。第103頁,共186頁,2023年,2月20日,星期六2023/4/21104目錄上頁下頁返回結束結構方程模型的構建

第104頁,共186頁,2023年,2月20日,星期六2023/4/21105目錄上頁下頁返回結束結構方程模型的構建

第105頁,共186頁,2023年,2月20日,星期六2023/4/21106目錄上頁下頁返回結束結構方程模型的構建

至此,測量方程和結構方程都得到了建立,整個結構方程模型也得以建立。當然,初始建立的理論模型有可能不是較理想模型,需要在數據的擬合過程中反復修改,直到建立較理想模型。第106頁,共186頁,2023年,2月20日,星期六2023/4/21107目錄上頁下頁返回結束結構方程模型的估計

第107頁,共186頁,2023年,2月20日,星期六2023/4/21108目錄上頁下頁返回結束結構方程模型的估計最常見的估計方法有沒有加權的最小二乘法(ULS)、廣義最小二乘法(GLS)和最大似然估計(ML)。每種計算方法都是要找到參數估計使得擬合損失函數達到最小。擬合損失函數是度量觀測的樣本協差陣和參數估計給出的預測協差陣之間差異程度的函數。ML方法對于多數應用問題特別是考慮到統計問題時是首選的方法。GLS通常得出與ML方法類似的結論。ML和GLS這兩種方法在不考慮協差陣的尺度時是適用的,而且需要顯變量是連續的和多元正態的。這是因為變量的偏態或高峰度會導致很差的估計及其不正確的標準誤和較高的卡方值。ULS方法適用于僅當這些變量是可比較的尺度上被測量時得到的協差陣,否則ULS方法使用相關陣。若預測的或觀測的協差陣是奇異的,則不能使用ML和GLS這兩種方法,這時要么去掉線性相關變量,要么用ULS方法。第108頁,共186頁,2023年,2月20日,星期六2023/4/21109目錄上頁下頁返回結束結構方程模型的計算機實現

目前,國際上一些著名的軟件公司都推出了利用結構方程模型進行統計分析的計算機應用軟件,例如瑞典阿帕薩拉大學(TheUniversityofUppsala,Sweden)的喬瑞斯考格(KarlG.Joreskog)和索爾波姆(DagSorbom)專門為進行結構方程模型分析所編寫的LISREL軟件、以及我們所熟悉的SAS軟件中的CALIS和SPSS的AMOS等等,這樣,我們就可以很方便的運用結構方程模型來解決各領域的問題。根據我國統計軟件的應用情況,在這里主要對國內比較流行SAS軟件中的CALIS和LISREL軟件進行介紹。第109頁,共186頁,2023年,2月20日,星期六2023/4/21110目錄上頁下頁返回結束結構方程模型的計算機實現

11.5.1結構方程模型分析流程根據前面關于結構方程模型分析過程的分析,利用結構方程模型進行分析的結構流程圖如下,這是我們進行計算機實現的基礎:第110頁,共186頁,2023年,2月20日,星期六2023/4/21111目錄上頁下頁返回結束結構方程模型的計算機實現

從這一流程圖可以看出,在利用結構方程模型進行分析時,首先要對分析的實際問題進行模型設定,這一模型建立的好壞直接影響進一步的分析。要想建立一個好的模型往往需要研究人員對研究對象有比較透徹的了解,弄清指標之間的關系,為了使模型的建立更直觀,并進一步寫出結構方程模型,往往借助路徑圖;接下來,就需要對建立的模型進行模式識別,看建立的模型屬于恰好識別結構模型、識別不足結構模型還是過渡識別結構模型,只有可識別的模型才可以進入下一個環節;第111頁,共186頁,2023年,2月20日,星期六2023/4/21112目錄上頁下頁返回結束§11.5結構方程模型的計算機實現

對于可識別模型就可以利用下面將要介紹的有關軟件估計結構方程模型中的有關參數并給出有關的檢驗參數;利用這些參數,就可以對模型進行評價,根據有關指標的標準,評價模型是否需要進一步修正;如果模型不需要修正,就可以對模型進行應用。對于需要修正的模型,需要回到模型設定階段,再按上面的過程逐步進行,直到模型不需要修正、可以應用為止。第112頁,共186頁,2023年,2月20日,星期六2023/4/21113目錄上頁下頁返回結束結構方程模型的計算機實現

SAS中的CALIS過程簡介SAS/STAT軟件6.06版本以后新增加了線性結構方程組的協方差過程CALIS(covarianceanalysisoflinearstructuralequation),該過程可以通過協方差結構分析,來估計參數并檢驗結構方程的正確性。在SAS的CALIS過程中,又提供了多種模型來建立結構方程模型,如RAM模型、LINEQS模型、LISREL模型等,在此介紹RAM模型,其他模型請參看有關書籍。

第113頁,共186頁,2023年,2月20日,星期六2023/4/21114目錄上頁下頁返回結束結構方程模型的計算機實現

1、路徑圖的描述CALIS中的RAM語句可以方便地描述路徑圖,假定有n個顯變量,按它們在SAS數據集中的順序用整數1,2,3,…,n編號。每個箭頭便可由路徑圖中它所連接的兩個變量的編號所確認,RAM語句包括了路徑圖中所有箭頭的說明,說明之間用逗號隔開,每一說明項包括3或4個數字或可選擇的一個名字,順序如下:第114頁,共186頁,2023年,2月20日,星期六2023/4/21115目錄上頁下頁返回結束結構方程模型的計算機實現

(1)箭頭有幾個;(2)箭頭指向的變量的編號,若是雙箭頭則為任意變量的編號;(3)箭頭出發的變量的編號,若是雙箭頭則取另一變量的編號;(4)箭頭表示的系數、(協)方差值;(5)若箭頭代表的參數待估,這寫上名字,這時前一個數字表示參數的初始值。若箭頭代表一個常量,可以省略名字;若用名字,第4個數字可以省略。第115頁,共186頁,2023年,2月20日,星期六2023/4/21116目錄上頁下頁返回結束結構方程模型的計算機實現

2、選擇估計方法CALIS提供三種估計方法,可以用選項METHOD=來規定:ULS沒有加權的最小二乘估計GLS廣義最小二乘估計ML多元正態分布的最大似然估計

第116頁,共186頁,2023年,2月20日,星期六2023/4/21117目錄上頁下頁返回結束結構方程模型的計算機實現

沒有特別規定時(即缺省時)估計方法使用METHOD=ML,因為ML對于多數統計問題是首選的方法。例如,對于前面我們已經給出的例子,如果選擇廣義最小二乘法作為估計方法時,可使用語句proccaliscovdata=wheatonmethod=glstech=lmedf=931;其中proccalis是調用SAS中的CALIS過程,選項cov要求對協方差陣進行分析,沒有cov選項時則計算和分析相關陣;而data=wheaton是調用我們分析所用的數據庫(注:這是SAS自帶的數據庫);選項tech=lm代表的是使用Levenberg-Marquandt或Newton-Raphson的最優化方法,這里使用的是后者;選項edf=931指明了自由度的個數,即931個樣本數據。

第117頁,共186頁,2023年,2月20日,星期六2023/4/21118目錄上頁下頁返回結束結構方程模型的計算機實現

根據這些規定,表11-1的語句給出了上例中“神經錯亂”數據的RAM結構模型(注意表11-1中第五列給出字母與圖11-1中稍有不同)。其中Vnames1F1-F3,2E1-E6D1-D3;給出了隱變量和誤差變量的名字。拿ram語句的第一行來說明路徑圖的描述,即該箭頭為單箭頭,從變量7出發,指向變量1,箭頭表示的系數值為1。第118頁,共186頁,2023年,2月20日,星期六2023/4/21119目錄上頁下頁返回結束結構方程模型的計算機實現

通過運行上面的程序,輸出結果11-1(這里僅給出了檢驗結果,讀者運行時還會看到反映變量關系的其他結果,在此不一一列出),可以通過這一結果對模型的正確性進行判斷。第119頁,共186頁,2023年,2月20日,星期六2023/4/21120目錄上頁下頁返回結束結構方程模型的計算機實現

LISREL軟件簡介LISREL(linearstructuralrelations)是專門為進行結構方程分析而編寫的統計分析軟件。與SAS軟件中的CALIS有所不同的是,LISREL的路徑圖可以在輸出結果中直觀給出,并能夠在圖形窗口進行編輯和修改。LISREL能夠在圖形窗口進行編輯和修改路徑圖。用光標點擊命令行的pathdiagram或相應的圖標,即進入圖形窗口。在圖形窗口命令行點擊model,可以選擇顯示不同的圖形。對模板圖形進行修改和變動,可以得到所需的路徑圖。圖形窗口命令行的其他命令的用途分別是:exit退出該窗口,kind調出其他統計結果以便對路徑圖進行修改,options修改統計數值得小數位顯示長度,print打印路徑圖,zoom對路徑圖進行放大和縮小,re-estimate是根據統計分析結果對路徑圖進行修改之后再次運行估計程序。第120頁,共186頁,2023年,2月20日,星期六2023/4/21121目錄上頁下頁返回結束結構方程模型的計算機實現

首先,需要編寫并運行程序命令。LISREL程序包含一子程序PRELIS,該子程序對結構方程模型數據進行預處理。該程序包括多個指令,指示原始數據的出處以及變量信息和結果的存入。表11-2以程序的形式簡略的給出了PRELIS的基本指令。第121頁,共186頁,2023年,2月20日,星期六2023/4/21122目錄上頁下頁返回結束結構方程模型的計算機實現

原始數據經過預處理可以得到其協方差矩陣。根據協方差矩陣開始編寫LISREL程序。如表11-3所示。第122頁,共186頁,2023年,2月20日,星期六2023/4/21123目錄上頁下頁返回結束§11.5結構方程模型的計算機實現

第123頁,共186頁,2023年,2月20日,星期六2023/4/21124目錄上頁下頁返回結束結構方程模型的計算機實現

LISREL能夠提供結果路徑圖并且能夠在圖形窗口進行編輯和修改路徑圖。用光標點擊命令行的pathdiagram或相應的圖標,即進入圖形窗口。在圖形窗口命令

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論