多元統計分析填空和簡答(一)_第1頁
多元統計分析填空和簡答(一)_第2頁
多元統計分析填空和簡答(一)_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、仁多元分析研究的是多個隨機變量及其相互關系的統計總體。2多元統計中常用的統計量有:樣本均值、樣 本方差、樣本協方差和樣本相關系數。3 協方差和相關系數僅僅是變量間離散程度的 一種度量,并不能刻畫變量間可能存在的關聯程 度。4 人們通過各種實踐,發現變量之間的相互關系可以分成相關和不相關兩種類型。5 總離差平方和可以分解為回歸離差平方和和剩余離差平方和兩個部分,各自的自由度為 p和n-p-1 ,其中回歸離差平方和在總離差平方和中所占比重越大,則線性回歸效果越顯著。7 偏相關系數是指多元回歸分析中,當其他變 量固定后,給定的兩個變量之間的的相關系數。8 . Spss中回歸方程的建模方法有一元線形回

2、 歸、多元線形回歸、嶺回歸、多對多線形回歸等。9 主成分分析是通過適當的變量替換,使新變 量成為原變量的綜合變量,并尋求相關性的一種 方法。10 -主成分分析的基本思想是: 設法將原來眾 多具有一定相關性(比如P個指標),重 新組合成一組新的互相無關的綜合指標 來代替原來的指標。11 主成分的協方差矩陣為對角矩陣。12 主成分表達式的系數向量是相關系數矩陣的特征向量。13 原始變量協方差矩陣的特征根的統計含義是原始數據的相關系數。14 原始數據經過標準化處理,轉化為均值為0 ,方差為1 的標準值,且其協方差矩陣與相 關系數矩陣相等。15 樣本主成分的總方差等于1 。16 .變量按相關程度為,在

3、相關性很強程度下, 主成分分析的效果較好。仃在經濟指標綜合評價中,應用主成分分析法,則評價函數中的權數為方差貢獻度。19.因子分析是把每個原始變量分解為兩部分因素,一部分是公共因子,另一部分為特殊因子。20變量共同度是指因子載荷矩陣中第i行元素的平方和。21 公共因子方差與特殊因子方差之和為1。22 -聚類分析是建立一種分類方法,它將一批樣哂或變量按照它們在性質上的親疏程度進行科學的分 類。23. Q型聚類法是按樣品進行聚類,R型聚類法是按變量進行聚類。24 - R型聚類統計量通常采用具有代表性的變量。25 -在聚類分析中需要對原始數據進行無量綱化處理,以消除不同量綱或數量級的影響,達到數據間

4、 可同度量的目的。 常用的無量綱化方法有以下幾種: 中心化變換、規格化變換、標準化變換、對數變換。26 .六種Q型聚類方法分別為最短距離法、最長距 離法、中間距離法、重心法、類平均法、可變類平 均法28判別分析是要解決在研究對象已分成若干類的 情況下,確定新的觀測數據屬于已知類別中哪一類 的多元統計方法。29用判別分析方法處理問題時,通常以判別函數作為衡量新樣本點與各已知組別接近程度的指標。30.進行判別分析時,通常指定一種判別規則,用 來判定新樣本的歸屬,常見的判別準則有 Fisher準 則、貝葉斯準則。33 - Fisher判別法就是要找一個由p個變量組成的線性判別函數,使得各自組內點的離

5、差盡可能接近, 而不同組間點的盡可能疏遠。簡述多元統計分析的作用。能夠簡化數據的數據結構;能夠進行分類和 組合;能夠研究指標之間的依存關系;進行預測; 進行假設檢驗。簡述逐步回歸分析萬法的基本原理。原理是從一個自變量出發,依照自變量對因變 量的影響顯著性大小,從大到小逐個弓I入回歸方 程,同時,在逐個自變量選入回歸方程的過程中, 如果發現先前被弓I入的自變量在其后由于某些自 變量的弓I入而失去其重要性時,可以從回歸方程中 隨時予以剔除。弓I入一個變量或剔除一個變量,為 逐步回歸的一步,每步都要進行顯著性檢驗,以便 保證每次弓I入變量前回歸方程中只包括顯著性變 量,這個過程反復進行,直到既無不顯

6、著變量從回 歸方程中剔除,又無顯著變量需要選入回歸方程時 為止。提取樣本主成分的原則。Fi于F不相關。(2) F1是X ,X 2Xp的一切線 性組合中方差最大的,F2是與F1不相關的X1 ,X2Xp 一切線性組合中方差最大。Fp是與F1 , Fp-1不相關的X1 ,X 1.Xp 一切線性組合中方差最大。思考主成分分析法的應用。首先,主成分分析可以用于系統評估;其次, 在經濟統計研究中,除了經濟效益的綜合評價研究 外,對不同地區經濟發展水平的評價研究,不同地 區經濟發展競爭力的評價研究,人民生活水平、生活質量的評價研究,等等都可以用主成分分析方法BAYES判別法和FISHER判別法的比較進行研究

7、;另外,主成分分析除了用于系統評估 研究領域外,還可以與回歸分析結合,進行主成 分回歸分析,以及利用主成分分析進行挑選變 量,選擇變量子集合的研究。簡述囚子分析的基本思想。因子分析是通過變量(或樣品)的相關系數 矩陣內部結構的研究, 找出存在于所有變量 (或 樣品)中具有共性的因素, 并綜合為少數幾個新 變量,把原始變量表示成少數幾個綜合變量的線 性組合,以再現原始變量與綜合變量之間的相關 關系。其中,這里的少數幾個綜合變量一般是不 可觀測指標,通常稱為公共因子。簡述系統聚類法的基本思想及王要步驟。聚類分析是將樣品或變量按照它們在性質上的親疏程度進行分類的多元統計分析方法。聚類分析時,用來描述

8、樣品或變量的親疏程度通常 有兩個途徑,一是把每個樣品或變量看成是多維 空間上的一個點,在多維坐標中,定義點與點, 類和類之間的距離,用點與點間距離來描述樣品 或變量之間的親疏程度;另一個是計算樣品或變 量的相似系數,用相似系數來描述樣品或變量之 間的親疏程度簡述系統聚類分析法。是在樣品距離的基礎上定義類與類的距離, 首先將n個樣品自成一類,然后每次將具有最 小距離的兩個類合并,合并后再重新計算類與類 之間的距離,再并類,這個過程一直持續到所有 的樣品都歸為一類為止。這種聚類方法稱為系統 聚類法。根據并類過程所做的樣品并類過程圖稱 為聚類譜系圖。16 簡述聚類分析和判別分析的區別和聯系。 一 |

9、區別:判別分析與聚類分析不同。判別分析 是在已知研究對象分成若干類型(或組別)并已 取得各種類型的一批已知樣品的觀測數據, 在此 基礎上根據某些準則建立判別式,然后對未知類型 的樣品進行判別分類。聚類分析,并對于一批合定 樣品要劃分的類型事先不知道,正需要聚類分析來 綜合確定類型的。聯系:判別分析與聚類分析往往聯合使用,往往是專職能部門類分析,再進行判別新樣品屬于哪 一類。建立判別式判別。判別分析的基本步驟。步驟:(1)選擇自變量或組變量,并計算各組 單變量描述的計量,對判別分析所要求的前提能定 進行統計檢驗;(2)推導判別系數組出標準化或未標準化的典則判別函數系數,并進行安著性檢驗;(3)建

10、立 Fisher判別模型,根據 Bayes規則和Fisher規則進行判別組合;4)進行樣本回判分析,對判別系數的結果進行分析;(5)輸出結果,根據實際情況分析出結果,做出結論。Fisher判別:又稱典則判別,該方法的基本思想是投影,即將原來在R維空間的自變量組合投影到維度較低的 D維空間上去,然后在 D維空間再進行分類。其優勢在于對分布和方差沒有什么限制,應用范圍廣泛。Bayes判別:就是利用經驗信息,基本思想是認 為所有D個類別都是空間中互斥的子城,每個觀測 都是空間中的一點。其優點在于進行多類別判別, 但是它要求總體呈多元正態分布。距離判別法基本思想 :根據已知分類的數據,計算 樣品與各類

11、之間的“距離”,根據樣品到類之間的“距 離”大小判別,樣品到那個類的“距離”最小,判 樣品屬于哪個類。Fisher判別法的基本思想|:從多個總體(類)抽取 一定的樣本,借助方差分析的思想,建立p個指標的線性判別函數,把待判樣品代入線性判別函數, 然后與臨界值比較,就可判樣品屬于哪個類。Bayes判別法的基本思想:對多個總體(類)要求 有一定的認識,禾U用借Bayes公式計算樣品到每個 總體(類)的概率,比較概率的大小,樣品到那個 總體(類)的概率最大,就判樣品屬于哪個總體(類)。因子分析的基本思想 :把每個研究變量分解為幾個影響因素變量,將每個原始變量分解成兩部分因素,一部分是由所有變量共同具

12、有的少數幾個公共因子組成的,另一部分是 每個變量獨自具有的因素,即特殊因子。聯系:(1)因子分析是主成分分析的推廣,是主 成分分析的逆問題。(2)二者都是以降維為目 的,都是從協方差矩陣或相關系數矩陣出發。區別:(1)主成分分析模型是原始變量的線性組 合,是將原始變量加以綜合、歸納,僅僅是變量變 換;而因子分析是將原始變量加以分解,描述原始 變量協方差矩陣結構的模型;只有當提取的公因子個數等于原始變量個數時,因子分析才對應變量變 換。(2)主成分分析,中每個主成分對應的系數是 唯一確定的;因子分析中每個因子的相應系數即因 子載荷不是唯一的。(3)因子分析中因子載荷的不 唯一性有利于對公因子進行

13、有效解釋;而主成分分 析對提取的主成分的解釋能力有限。因子分析的基本步驟|(1)因子分析的前提條件鑒定(2)因子提取(3)因子旋轉(4)計算因子得分主成分分析概念及兒何意義概念(思想):主成分分析就是設法將原來指標 重新組合成一組新的互相無關的幾個綜合指標來 代替原來指標。同時根據實際需要從中可取幾個較少的綜合指標盡可能多地反映原來的指標的信息幾何意義:1,,n).檢驗主成分分析的過程也就是坐標旋轉的過程,各主成分表達式就是新坐標系與原坐標系的轉換 關系,新坐標系中各坐標軸的方向就是原始數據 方差最大的方向。(1) H0:卩0 (卩0為已知向量),H1:卩工卩0(2)取檢驗統計量(3)按傳統的

14、檢驗方法,對給定的顯著水平a ,查臨界值表得入a是根據一批樣品的多個觀測指標,具體地找出一些能夠度量樣品或指標之間相似程度的統 計量,然后利用統計量將樣品或指標進行歸類。 把相似的樣品或指標歸為一類,把不相似的歸為其他類。直到把所有的樣品(或指標)聚合完畢. 典型相天基本思想和王成分分析非常相似。首先在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關系數。然后選取和最初挑選的這對線性組合不相關的線性組合, 使其配對,并選取相關系數最大的一對,如此繼續下去,直到兩組變量之間的相關性被提取完畢 為此。被選出的線性組合配對稱為典型變量,它們的相關系數稱為典型相關系數。典型相關系數度

15、量了這兩組變量之間聯系的強度。簡述典型相關分析的分析方法和典型變量選取 具體冥施步驟(4) 由樣本值計算 X及T20值,若T20 Xa ,則否定H否則H相容.(1) 計算相關系數陣 R(2) 求典型相關系數及典型變量(3) 典型相關系數的顯著性檢驗(1) 兩個總體的距離判別法:這兩個總體、G分別抽取m和n2個樣品,每個樣品測量p個指標,計算X 到 G、G 總體的距離。X G D (X , G) 0對一切j工I ;待判 若有一個 W=0。當刀)刀(2刀(k)互不相等時:X G,若 W(X) 0對一切j工I ;待判 若有一個 W/=0L已知時均值向量的檢驗(1 )寫出檢驗假設, H:卩=卩0 H 典型相關分析是研究兩組變量之間相關關 系的統計方法:卩工卩0 (2)檢 驗統計量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論