




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
主成分分析方差分析相關與回歸分析目錄頁方差分析主成分分析相關與回歸分析方差分析的應用條件(1)獨立,各組數據相互獨立,互不相關(2)正態,即各組數據符合正態分布(3)方差齊性,即各組方差相等
統計學上的因素是指研究者所關心的實驗條件,而水平是指因素的具體表現形式。如,溫度(30、60、90)℃、藥物種類(A、B、C)和產地(山東、安徽、江蘇)。溫度、藥物種類和產地就是因素,而每個因素里具體的不同形式就稱為水平單因素方差分析例:一共有4種不同的飼料喂豬,共有19頭豬分為4組,每組一種飼料,一段時間后稱重。比較4種飼料對豬的體重影響是否顯著不同。飼料的類型增加的體重單擊“兩兩比較”主成分分析
是考察多個變量間相關性的一種多元統計方法,其主要目的是用較少的變量去解釋原始數據中的大部分變異。它通常用來尋找判斷某種事物或現象的綜合指標,并且給綜合指標所包含的信息以適當的解釋,從而更好的揭示事物內在的規律。但在實際的應用當中,主成分分析只是一種達到目的的中間手段,而不是最終目的,而要結合其他的統計方法來處理問題。2023/2/416第二章主成分分析
主成分分析(principalcomponentsanalysis)。主成分分析是利用降維的思想,在損失很少信息的前提下把多個指標轉化為幾個綜合指標的多元統計方法。通常把轉化生成的綜合指標稱之為主成分,其中每個主成分都是原始變量的線性組合,且各個主成分之間互不相關,這就使得主成分比原始變量具有某些更優越的性能。這樣在研究復雜問題時就可以只考慮少數幾個主成分而不至于損失太多信息,從而更容易抓住主要矛盾,揭示事物內部變量之間的規律性,同時使問題得到簡化,提高分析效率。2023/2/417主成分分析的基本思想
既然研究某一問題涉及的眾多變量之間有一定的相關性,就必然存在著起支配作用的共同因素,根據這一點,通過對原始變量相關矩陣或協方差矩陣內部結構關系的研究,利用原始變量的線性組合形成幾個綜合指標(主成分),在保留原始變量主要信息的前提下起到降維與簡化問題的作用,使得在研究復雜問題時更容易抓住主要矛盾。一般地說,利用主成分分析得到的主成分與原始變量之間有如下基本關系:1.每一個主成分都是各原始變量的線性組合;2.主成分的數目大大少于原始變量的數目2023/2/418
目錄上頁下頁返回結束
3.主成分保留了原始變量絕大多數信息4.各主成分之間互不相關
通過主成分分析,可以從事物之間錯綜復雜的關系中找出一些主要成分,從而能有效利用大量統計數據進行定量分析,揭示變量之間的內在關系,得到對事物特征及其發展規律的一些深層次的啟發,把研究工作引向深入。主成分分析的任務1計算主成分首先將原有的變量標準化,然后計算各變量之間的相關矩陣、該矩陣的特征根和特征向量,最后將特征根由大到小排列,分別計算出對應的主成分。2確定主成分個數(1)累計貢獻率:當前k個主成分的累計貢獻率達到某一特定值(一般采用70%以上)時,則保留前k個主成分。(2)特征根:一般選取特征根≥1的主成分。
表示主成分影響力度大小的指標,即引入該主成分后可以解釋平均多少原始變量的信息,如果特征根小于1,說明該主成分的解釋程度還不如直接引入一個原始變量的平均解釋程度大。
表示前k個主成分累計提取了原始變量多少的信息。2023/2/420注意的問題1.首先應當認識到主成分分析方法適用于變量之間存在較強相關性的數據,如果原始數據相關性較弱,運用主成分分析后不能起到很好的降維作用,即所得的各個主成分濃縮原始變量信息的能力差別不大。一般認為當原始數據大部分變量的相關系數都小于0.3時,運用主成分分析不會取得很好的效果。2.主成分分析不能有效地剔除重疊信息,但它至少可以發現原始變量是否存在著重疊信息,這對我們減少分析中的失誤是有幫助的。2023/2/421主成分分析步驟1.根據研究問題選取初始分析變量;2.根據初始變量特性判斷由協方差陣求主成分還是由相關陣求主成分;3.求協差陣或相關陣的特征根與相應標準特征向量;4.判斷是否存在明顯的多重共線性,若存在,則回到第一步;5.得到主成分的表達式并確定主成分個數,選取主成分;6.結合主成分對研究問題進行分析并深入研究。例:1980年某汽車制造商從競爭對手中選擇了17種車型,訪問了25名顧客,要求他們根據自己的偏好對這17種車型打分,打分范圍0-9.9分。如下表:點擊“繼續”,回到主頁點擊”確定“
相關關系的常見類型:線性相關:正線性相關、負線性相關非線性相關相關關系不象函數關系那樣直接,但卻普遍存在,且有強有弱.如何測度?相關分析和回歸分析的任務研究對象:相關關系相關分析旨在測度變量間線性關系的強弱程度.回歸分析側重考察變量之間的數量變化規律,并通過一定的數學表達式來描述這種關系,進而確定一個或幾個變量的變化對另一個變量的影響程度.回歸分析基本步驟(1)確定自變量和因變量(2)從樣本數據出發確定變量之間的數學關系式,并對回歸方程的各個參數進行估計.(3)對回歸方程進行各種統計檢驗.(4)利用回歸方程進行預測.相關分析(一)目的通過樣本數據,研究兩變量間線性相關程度的強弱.(例如:投資與收入之間的關系、GDP與通信需求之間的數量關系)(二)基本方法繪制散點圖、計算相關系數繪制散點圖基本操作步驟(1)菜單選項:graphs->scatter(2)選擇散點圖類型:(3)選擇x軸和y軸的變量(4)選擇分組變量(setmarkersby):分別以不同顏色點的表示(5)選擇標記變量(labelcaseby):散點圖上可帶有標記變量的值(如:省份名稱)計算相關系數(1)作用:以精確的相關系數(r)體現兩個變量間的線性關系程度.r:[-1,+1];r=1:完全正相關;r=-1:完全負相關;r=0:無線性相關;|r|>0.8:強相關;|r|<0.3:弱相關(2)說明:相關系數只是較好地度量兩變量間的線性相關程度,不能描述非線性關系.基本操作步驟(1)菜單選項:analyze->correlate->bivariate...(2)選擇計算相關系數的變量到variables框.(3)選擇相關系數(correlationcoefficients).(4)顯著性檢驗(testofsignificance)tow-tailed:輸出雙尾概率P.one-tailed:輸出單尾概率P(一)一元回歸方程:
y=β0+β1xβ0為常數項;β1為y對x回歸系數,即:x每變動一個單位所引起的y的平均變動(二)一元回歸分析的步驟利用樣本數據建立回歸方程回歸方程的擬和優度檢驗回歸方程的顯著性檢驗(t檢驗和F檢驗)殘差分析預測
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 信息系統項目管理師考試通關試題及答案
- 2025屆甘肅省武威市高中名校高三三模物理試題
- 核心藥師試題及答案優化
- 教師資格考試生活化學習方式的試題及答案
- 母豬復配技巧知識試題及答案
- 第二單元長方體(一)(基礎卷)(含解析)-2024-2025學年五年級數學下冊常考易錯題(北師大版)
- 發展心理學知識中小學教師資格筆試試題及答案
- 教師資格考試歷史發展試題及答案
- 2025-2030中國電子包裝硅膠干燥劑行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國電子元件行業市場全景調研及投資價值評估咨詢報告
- 北京市教育委員會關于建立民辦學校辦學情況年度報告制度的通知
- 橋墩尺寸經驗值
- 商務部商業保理企業管理辦法
- ICOM 2720中文說明書
- 初中英語語法-介詞、連詞.ppt
- 【精選】配電室安全管理制度精選
- 變電運行巡視(概述)ppt課件
- 淺析小學數學教學中草稿本的有效使用
- 《信用卡工作證明 》
- 燈具購銷合同
- 小學生請假條打印模板
評論
0/150
提交評論