




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
多元分析的基本原理第一頁,共四十三頁,2022年,8月28日第八章
多元分析的基本原理本章學習要點本章內容結構
第二頁,共四十三頁,2022年,8月28日第一節
概述
一什么是多元分析
1多變量系統(1)產品的指標(2)教育系統(3)單變量分析(如圖所示)
(4)單變量分析的困難:變量的相關性第三頁,共四十三頁,2022年,8月28日2多元分析法(1)變量相關性的例子:P180
有相關性,但是又不能用一個確定的方程描述相互關系(2)多元分析法:P181
(3)例子第四頁,共四十三頁,2022年,8月28日二多元分析法的分類(從應用的角度)
1用于求綜合特性的多元分析法研究的關鍵是:多個變量的綜合特性主要方法有:主成分分析、相關分析
2用于預測的多元分析法研究的關鍵是:通過對多個變量的綜合研究,進行系統預測主要方法有:多元回歸法、因子分析法、判別函數法第五頁,共四十三頁,2022年,8月28日三多元分析在教育中的應用
1需求
2應用舉例
3發展動態第六頁,共四十三頁,2022年,8月28日第二節
回歸分析
零:引入1多變量之間的關系確定的函數關系,變量之間的關系可以通過計算直接得到不確定的相關關系,教育中的例子很多2回歸分析的任務用確定的函數關系來描述多個相關變量之間的關系3回歸分析的分類(根據回歸函數的不同)
第七頁,共四十三頁,2022年,8月28日一直線回歸(一元線性回歸)1線性回歸方程
y=ax+b
其中a、b為回歸系數,通過n(大于2)組樣本數據,可以計算出a、b。(如果x、y是確定的函數關系,n只需要為2:P184)2樣本數據(觀測值)設n=3,有(x1,y1)(x2,y2)(x3,y3)三組數據把x1、x2、x3分別代入回歸方程,得到三個對應的計算值y第八頁,共四十三頁,2022年,8月28日3觀測值y與計算值y的差異
三組差異分別是:第九頁,共四十三頁,2022年,8月28日4求回歸系數(1)對誤差求極值(使誤差最小)改錯:P184(a、b互換位置),經整理得:改錯:P185(a、b互換位置)第十頁,共四十三頁,2022年,8月28日(2)回歸系數
第十一頁,共四十三頁,2022年,8月28日5寫出回歸方程并進行預測6例:(三個學生的數學、物理成績)(1)設樣本數據為(70,75)、(80,85)、(90,90)(2)計算回歸系數得:a=0.75,b=23.3(3)寫出回歸方程:y=0.75x+23.3(4)進行預測設某學生數學考試得:x=85,預測物理成績得:y=0.75*85+23.3=87第十二頁,共四十三頁,2022年,8月28日第十三頁,共四十三頁,2022年,8月28日7一般情況[樣本數由3變為n(n>3)]通過完全一樣的方法,公式(8—5)變為:改錯:(a、b互換位置)最后得回歸系數:改錯:(a、b互換位置)第十四頁,共四十三頁,2022年,8月28日二多元線性回歸
1線性回歸方程
y=a0+a1x1+a2x2+….+apxp
其中a0、a1、a2….ap為回歸系數,通過m(大于p)組樣本數據,可以計算出回歸系數。
2樣本數據(觀測值)(x11,x12,….x1p,z1),,,,(xm1,xm2,….xmp,zm)把xi1、xi2…..xip分別代入回歸方程,得到對應的計算值yi第十五頁,共四十三頁,2022年,8月28日3觀測值zi與計算值yi的差異第十六頁,共四十三頁,2022年,8月28日根據微分學中的極值原理,a0,a1,,,ap應是下列方程的解第十七頁,共四十三頁,2022年,8月28日經整理,得:第十八頁,共四十三頁,2022年,8月28日4求回歸系數再整理上述方程,得:………第十九頁,共四十三頁,2022年,8月28日上述方程組用矩陣表示,得:當(X’X)滿秩時(即|X’X|≠0),逆矩陣(X’X)-1存在,系數矩陣A可以表示為:第二十頁,共四十三頁,2022年,8月28日其中A=(a0,a1,a1,,,,ap)’,稱為回歸方程的系數矩陣(一列矩陣)而矩陣X則為:而X’是X的轉置矩陣,Z是個一列矩陣第二十一頁,共四十三頁,2022年,8月28日三多項式回歸(略)四指數回歸(略)第二十二頁,共四十三頁,2022年,8月28日五回歸分析的應用1一元線性回歸
(1)樣本測量值
(2)計算回歸系數得,a=12(這里a=R),b=0
(3)寫出回歸方程:U=12I(如圖所示)
(4)進行預測:設某次測量電流得I=0.8,預測電壓得:U=12*0.8=9.6第二十三頁,共四十三頁,2022年,8月28日2多元線性回歸(1)樣本數據(取自1979年某高考班)設考生的物理成績為因變量(z),語文(x1)、數學(x2)、政治(x3)15個考生的測量;測量成績如下(m=15,p=3):編號語文數學政治物理 編號 語文數學政治物理1 61.5315932 9 50.53267572 35 23 40.58 10 57.53047.5373 56.5 40 53 69 11 47 5863 684 35 19 58.5 21 12 28 2852 275 50.5 60 49 66 13 58 2272 41641.5 15 59 41 14 36 2339 207 59 46 68.557 15 453353308 41 26 557 第二十四頁,共四十三頁,2022年,8月28日(2)
計算回歸系數根據矩陣公式計算得a0=-44.6023,a1=0.4166,a2=0.9729,a3=0.5780(3)回歸方程
y=-44.6023+0.4166*x1+0.9729*x2+0.5780*x3(4)進行預測某學生考試成績:語文=40,數學=90,政治=60
預測物理成績為y=94.4第二十五頁,共四十三頁,2022年,8月28日第五節聚類分析
分類學:根據事物性質進行分類,性質相近的分在一類,性質差別大的分在不同的類一般分類方法的缺陷:往往帶有主觀性和任意性,不能揭示客觀事物內在的本質聯系和差別多元統計的應用:形成了數值分類學注:本節選用另一教材,與本書略有不同(數據矩陣行、列相反)第二十六頁,共四十三頁,2022年,8月28日一基本原理(系統聚類法,此外還有動態聚類法)1設有n個樣品,m個指標,有數據矩陣:第二十七頁,共四十三頁,2022年,8月28日2規格化變換(使各個指標權重相同,即同等重要)
其中的兩個極值分別是第j列最大值和最小值結果:每一列數據的最大值為1,最小值為0。然后,重新構造矩陣,仍用X表示注:也可不做規格化處理直接用原始數據,各指標權重可能不同第二十八頁,共四十三頁,2022年,8月28日3確定距離(親疏關系)(1)距離的性質多元統計分析中的距離dij(樣品Xi和Xj之間的距離)滿足下列3個性質:①
dij≥0,對一切Xi、Xj,當且僅當Xi=Xj時,有dij=0;②
dij=dji,即Xi與Xj的距離=Xj與Xi的距離;③
對于樣品Xi、Xj、Xk,有dij≤dik+dkj,這是幾何學中三角不等式的推廣(任意兩邊之和大于第三邊)。第二十九頁,共四十三頁,2022年,8月28日任意兩個樣品距離越小,說明它們越接近(一致),計算距離的方法很多,主要有歐氏距離、馬氏距離(P98)、B-模距離、閔可夫斯基距離(參見<<應用數理統計>>吳國防科技大學出版社:P271(2)
歐氏距離(我們只介紹歐氏距離)表示第i個樣品與第j個樣品之間的距離(矩陣表示形式)(一般表示形式)第三十頁,共四十三頁,2022年,8月28日(3)距離矩陣(按上述方法分別算出任意兩個樣品之間的距離)該矩陣共有n行、n列第三十一頁,共四十三頁,2022年,8月28日4開始聚類(初始為n類,每個樣品為1類)①從D中找出一個最小值(最小距離法)涉及到的兩個類;②在數據矩陣X中,把上述兩類合并成一類,兩組數據取平均值,總的類就減少了一個;③重新計算D(實際上只要計算剛合并的那個類與其他各類的距離)④重復①、②、③,直到所有的樣品都歸為一類或者歸為所需要的類為止。5畫出聚類譜系圖第三十二頁,共四十三頁,2022年,8月28日二應用例(10名學生三次測驗成績,要求為4類)1原始數據及規格化數據第三十三頁,共四十三頁,2022年,8月28日2計算距離矩陣
第三十四頁,共四十三頁,2022年,8月28日3開始聚類
(1)開始,第5類和第6類的距離最小(=0.1919),把第5類和第6類聚類
(2)現在還有9個類,數據如下:第三十五頁,共四十三頁,2022年,8月28日(3)重新計算距離矩陣(實際上只要計算(5,6)合類與其它各類的距離)
第三十六頁,共四十三頁,2022年,8月28日(4)此時,第2類和第9類的距離最小(=0.2266),把第2類和第9類聚類(5)現在還有8個類,數據如下:
第三十七頁,共四十三頁,2022年,8月28日(6)依次類推,重復上述步驟,經過6次聚類之后,可得最后4個類的距離矩陣
第三十八頁,共四十三頁,2022年,8月28日4畫出聚類譜系圖
第三十九頁,共四十三頁,2022年,8月28日本章小結: 多元統計方法比較符合教育應用中的許多問題,按照具體的技術方法,我們主要介紹了一元和多元回歸分析、主成分分析、聚類分析,這
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Python職業發展路徑考題及答案
- 財務計劃中的邏輯思維重要性試題及答案
- 知識管理在戰略規劃中的作用試題及答案
- 2025年細節把握試題及答案總結
- 軟件開發基礎知識試題及答案
- 面對挑戰2025年稅法考試試題及答案
- 軟體重構步驟與注意事項試題及答案
- 2025年計算機基礎知識試題及答案簡析
- MySQL索引的使用及原理試題及答案
- 2025辦公設備租賃合同協議書范本
- GB/T 14337-2008化學纖維短纖維拉伸性能試驗方法
- L4-《采購與供應策略》-講義課件
- 固定資產和無形資產培訓課程課件
- 合歡樹史鐵生課件
- 機房工程系統調試檢驗批質量驗收記錄表
- 光伏項目試驗報告
- DB37-T 3587-2019養老機構護理型床位認定
- 汽車電子可靠性測試項目-(全)-16750-1-to-5
- 丁苯橡膠乳液聚合的生產工藝
- JOINT VENTURE AGREEMENT合資企業協議(雙語版)
- CJ343-2010 污水排入城鎮下水道水質標準
評論
0/150
提交評論