




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、極差:一組數據的最大值與最小值之差稱為極差,也稱全距,用R表示。其計算公式為:R=max ( xi) min (xi)離散系數:也稱為變異系數,它是一組數據的標準差與其相應的平均數之比。其計算公式為:v=s/x。離散系數是測量數據離散程度的相對統計量,主要是用于比較不同樣本數據的 離散程度。離散系數大,說明數據的離散程度也大;離散系數小,說明數據的離散程度 也小。三大統計分布:卡方分布、T分布、F分布卡方分布(X 2)定理:設n個相互獨立并且都服從正態 N (0,1)分布的隨機變量 XI、X2 ,Xn,記 則隨機變量X 2服從自由度為n的X2分布。統計變量服從卡方分布,其含義是:在給定概率a的
2、條件下,滿足HJT A /a” y川工心 N aJ xjmr = SXf > X ? Cni或者說表達式E*的概率為a。T分布7定理:設隨機變量 x, y相互獨立,XN (0,1), Y x 2 ( n )記。則隨機變量T服從自由度為n的t分布。設 Tt ( n ),0 v a v 1, 對于滿足下列 等式PT > 匚(爪)弓 /r(x)dx = a創的數ta ( n),稱為t (n)分布的上側分位數。對于較大的 n (> 45)可以同標準正態分布的上側分位數 Ua作為t (n)分布的上 側分位數F分布2細定理:設隨機變量 x, y相互獨立,X x 2 (n1), Y x 2
3、 ( n2)記,則隨機變量F服從第一自由度為 n1,第二自由度為n2的F分布,記作:FF (n1, n2)F t .(越 * 2) 貝y_ 1F.(如的)若 FF( n1, n2),易知:,右統計量:描述樣本特征的概括性數字度量。完全由樣本決定的量,叫做統計量;或者說不含有其他未知量的樣本的函數稱為統計量。統計量可以看做是對樣本的一種加工,它吧樣 本中所包含的關于總體的其一方面的信息集中起來。最常用的統計量是樣本均值和樣本方差s2。自由度:隨機變量所包含的獨立變量的個數。參數估計:就是用樣本統計量去估計總體的參數。在參數估計中,用來估計總體參數的統計量的名稱稱為估計量,用符號B表示。樣本均值、
4、樣本比例、樣本方差等都可以是一個 估計量。而根據一個具體的樣本計算出來的估計量的數值稱為估計值。參數估計的方法 有點估計和區間估計兩種。點估計:就是用樣本統計量B的某個取值直接作為總體參數B的估計值。區間估計:是在點估計的基礎上, 給出總體參數估計的一個區間范圍,該區間通常由樣本統計量加減估計誤差得到。與點估計不同,進行區間估計時,根據樣本統計量的抽樣分布 可以對樣本統計量與總體參數的接近程度給出一個概率度量。樣本量:從總體中抽取的一部分元素的集合為樣本,構成樣本的元素的數目為樣本量。樣本量的大小是選擇檢驗統計量得一個要素。置信區間:在區間估計中,由樣本統計量所構造的總體參數的估計區間稱為置信
5、區間。置信水平:將構造置信區間的步驟重復很多次,置信區間包含總體參數真值的次數所占的比例稱為置信水平。表示為(1a) % ,a為是總體參數未在區間內的比例。也稱置信度 或置信系數。假設檢驗:利用樣本信息,對提出的命題進行檢驗的一套程序和方法。事先對總體參數或分布形式作出某種假設,然后利用樣本信息來判斷假設是否成立;有參數假設檢驗和非參 數假設檢驗。采用邏輯上的反證法,依據統計上的小概率原理。單側檢驗:拒絕域在右側或者在左側的假設檢驗,左單側檢驗右單側檢驗雙側檢驗:拒絕域在兩側的假設檢驗原假設:提出一個或兩個參數是否等于或大于、小于某個特殊值的命題。H0 :有待檢驗的假設,又稱0假設,收集證據予
6、以反對的假設(總是有等號)備擇假設:H1 :又稱研究假設,收集證據予以支持的假設。與原假設相對立的假設(總是 有不等號)方差分析:縮寫為ANOVA,就是通過檢驗各總體的均值是否相等來判斷分類型對數值型變 量是否有顯著影響的統計方法。因子和處理:在方差分析中,所要檢驗的對象稱為因素或因子,是所研究的分類型變量的另一個名稱。因素的不同表現稱為處理或水平。總平方和:記為SST。它是全部觀測值 刈與總均值x的誤差平方和。組間平方和:記為SSA,它是各組均值 xi與總均值x的誤差平方和,反應各樣本之間的差 異程度,因此又稱為因素平方和。組內平方和:記為SSE,它是每個水平或組的各樣本數據與其組均值的誤差
7、平方和,反應了每個樣本觀測值的離散情況,因此稱為組內平方和。該平方和反應了隨機誤差的大小。SST、SSA、SSE之間的關系:k 叫kk 叫- =22 _=2 2 xij xni Xj xXjj xii 1 jj 1i 1ii 1 jj 1組間方差:SSA的均方,也稱為組間均方,記為MSA,其計算公式為:MSA=組間平方和/自由度=SSA/k 1組內方差:SSE的均方,也稱為組內均方,記為MSE,其計算公式為:MSE=組內平方和/自由度=SSE/n k將上述MSA與MSE進行對比,即得到所需要的檢驗統計量F。當Ho為真時,二者的比值服從分子自由度為 k 1、分母自由度為n k的F分布。單因素方差
8、分析:研究一個分類型自變量同數值型因變量之間關系的一種統計方法。雙因素方差分析:研究兩個分類型自變量同數值型因變量之間關系的一種統計方法。當方差分析中涉及兩個分類型自變量時,稱為雙因素方差分析。無重復雙因素分析有重復雙因素分析相關關系:變量之間存在的不確定的數量關系,稱為相關關系,一個變量的取值不能由另一個變量唯一確定。相關系數:是根據樣本數據計算的度量兩個變量之間線性關系強度的統計量。若相關系數是根據總體全部數據計算的,稱為總體相關系數,記為p;若使根據眼根數據計算的,則 稱為樣本相關系數,記為 r。樣本相關系數的計算公式為:n xy x yr ! 2 : 22 2n x x 、n y yL
9、SD :最小顯著差異法。存在一定的缺陷。在都與對照相比時可以使用該法。是對檢驗兩個 總計均值是否相等的t檢驗方法的總體方差估計加以修正(用 MSE來代替)而得到的。-方差分析中的多重比較(步驟)1提出假設叢=曲(笫個惡體的均值等干勒個總體的均值)式中,t a /2為t分布的臨界值,通過 查t分布表得到,其自由度為(n k), 這里的k是因素中水平的個數;MSE 為組內方差;ni和nj分別是第i個 樣本和第j個樣本的樣本量。 出匸山工4 (第冷為體的均值不等于劉個息體的均 值)2. 計算檢驗的統計氓®-知3. 計 .LSD':邸二5 MSE丄十丄4決無若匡-玉卜觀,拒絕弘;若札
10、-兀LSD 不拒絕簡述評價估計量好壞的標準。1. 無偏性:估計量抽樣分布的數學期望等于被估計的總體參數。設總體參數為所選擇 的估計量為B,如果 E (0) = B,則稱B為B的無偏估計量。2. 有效性:對同一總體參數的兩個無偏點估計量有更小標準差的估計量更有效。在無偏估 計的條件下,估計量的方差越小,估計也就越有效。3. 一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數。換而言之, 一個大樣本給出的估計量要比一個小樣本給出的估計量更接近總體的參數。怎樣理解置信區間?在區間估計中,又樣本統計量所構造的總體參數的估計區間稱為置信區間,其中區間的 最小值稱為置信下線,最大值稱為置信上
11、線。由于統計學家在某種程度是上確信這個區間會 包含真正的樣本的總體參數,所以給它取名為置信區間。什么是假設檢驗中的兩類錯誤?兩類錯誤之間存在什么樣的數量關系?一類錯誤是原假設 H 0為真卻被我們拒絕了,犯這種錯誤的概率用a表示,所以也稱a 錯誤或棄真錯誤;另一類錯誤是原假設為偽我們卻沒有拒絕,犯這種錯誤的概率用B表示, 所以也稱B錯誤或者取偽錯誤。a和B在數量上是此消彼長的關系。簡述假設檢驗的基本步驟。1. 提出假設2. 確定適當的檢驗統計量3. 規定顯著性水平4. 計算檢驗統計量的值5. 作出統計決策方差分析包括哪些類型?它們有何區別?1. 單因素方差分析:研究一個分類型自變量最一個數值型因
12、變量的影響。2. 雙因素方差分析:究兩個分類型自變量同數值型因變量之間關系的一種統計方法。當方 差分析中涉及兩個分類型自變量時,稱為雙因素方差分析。無重復雙因素分析:兩個影 響因素相互獨立;可重復雙因素分析:兩個因素有交互作用,結合后產生新的影響。簡述方差分析的基本思想。方差分析的基本假定: 1.每個總體都應服從正態分布2.各個總體的方差必須相同(同質性) 3.觀察值是獨立的方差分析的基本思想和原理: 1.判斷均值之間是否有差異時需要借助于方差。2,。通過對數據誤差來源的分析判斷不同總體的均值是否相等。3.即:判斷均值之間是否有差異需要進行方差分析。解釋R2的含義和作用。R2稱為多重判定系數,
13、在無重復雙因素方差分析中用于關系強度的測量。行因素所產生的誤差平方和記為 SSR,列因素所產出的誤差平方和記為SSC,這兩個平方和加在一起則度量了兩個自變量對因變量的聯合效應,聯合效應與總平方和的比值定義為R2,其平方根R則反映了這兩個自變量合起來與因變量之間的關系強度。即:R2=聯合效應/總效應=SSR+SSC/SST簡述相關系數的性質。1. r的取值范圍為-1到1,r=1時,完全正線性相關R=-1 時,完全負線性相關R=0 時,不存在線性相關關系0>r>=-1, 負線性相關0<r<=1, 正線性相關R 越趨近于 + 1 ,線性相關關系越密切R 越趨近于 0,線性相關
14、關系越不密切2. r具有對稱性。x與y之間的相關系數和 y與x之間的相關系數相等。3. r 數值大小與 x 和 y 的原點及尺度無關。4. r 僅僅是 x 與 y 之間線性關系的一個度量,它不能用于描述非線性關系。5. r雖然是兩個變量之間線性關系的一個度量,卻不一定意味著x與y 定有因果關系。簡述相關系數顯著性檢驗的步驟。1. 提出假設: H0:p=0;H1:P 不等于 02. 使用 t 檢驗的方法,根據公式計算檢驗的統計量得出 tt(n-2)3. 根據置信度a,查表,確定接受區域和拒絕區域4. 檢驗t在哪個區域:若t在拒絕域,則拒絕 H0;若t在接受域,則不拒絕 H05. 如果求出兩變量之
15、間的線性相關系數,并且證明了兩者有顯著相關性,則考慮用一簡述參數最小二乘估計的基本原理。 未知量的最可能值是使各項實際觀測值和計算值之間差的平方乘以其精確度的數值以后的和為最小。在回歸分析中, F 檢驗和 t 檢驗各有什么作用?F 檢驗(線性關系檢驗)是檢驗自變量 x 和因變量 y 之間的線性關系是否顯著,或者說,它們之間能否用一個線性模型y 3 1+ 3 2x+ &來表示。t 檢驗(回歸系數檢驗)是要檢驗自變量對因變量的影響是否顯著。參數估計:1,樣本均值根據1-a%這樣的概率水平構造了一個置信區間,而總體均值在這個區間里的概率為1-a%,即置信水平為 1-a%,顯著性水平為 a%。
16、1, 一個總體參數的估計的評估:首先看其是否是無偏性,即估計量的抽樣分布的數學期望 與被估計的總體參數一樣; 其次, 對同一總體參數的兩個無偏點, 以其方差小的更有效; 一致性,即隨著樣本容量逐漸增大,估計量應該越來越接近被估計的總體參數。2, 關鍵掌握幾個公式( 1),總體均值的估計區間(2),總體方差的估計區間方差分析:1, 就是比較組間方差和組內方差,如果相等,則說明組間沒有顯著性差異,也就是說不同品種不造成影響。因為組間方差既包含系統誤差也包含隨機誤差,組內方差只包含隨機2, 誤差來源也就是說是組間的還是組內的,方差分析就是對誤差來源的分析,判斷均值是 否相同。前提是三個假定:正態分布
17、,每組的組內方差相同,相互獨立個線性關系式表達兩者之間的線性關系單因素方差分析:(1 ),提出假設: H0,H1(2) ,計算出每組的平均值X1,計算出總體的平均值 X0,計算出總平方和 SST,即所有數 值的分散情況(3),計算出組間平方和 SSA,即各組均值的分散情況(4),計算出組內平方和 SSE,即各個觀察值與該組的均值的平方和之和(所有組)SST(總誤差)=SSA (系統誤差和隨機誤差)+SSE (隨機誤差)所以,如果沒有顯著性差異,則應該是不存在系統誤差,那么就是說SSA/自由度=SSE/自由度SST 自由度為 n-1SSA 自由度為 k-1SSE 自由度為 n-k所以現在需要計算
18、的是 SSA/(k-1)與SSE/(n-k)的值,即MSA/MSE,得到的值遵循 F分布, 其實也就是得到一個 F 值,然后在給定的顯著性水平下,根據 k-i 和 n-k 的值在表中查到一 個對應的Fa值,比較兩者的大小,如果 Fa>F,則不接受H0雙因素方差分析:( 1),同單因素一樣,首先進行假設,H0,H1;H0,H1( 因為是兩個因素,所以要分別的假設,最后的結果也是分開的,分別的檢驗 )(2),求出總誤差平方和SST,自由度為kr-1行誤差平方和SSR,自由度為k-1 列誤差平法和SSC,自由度為r-1 隨機誤差項平方和 SSE,自由度為(k-1)(r-1)SST=SSR+SSC+SSE(3) ,根據各誤差平方和和自由度,求出各均方,MST,MSE,MSR,MSC下面的步驟和單因素類似, 根據行誤差均方和隨機誤差均方的比值 MSR/MSE=Fr 根據列誤差均方和隨機誤差均方的比之 MSC/MSE=Fc 分別就兩種因素中的一種檢驗, 根據 自由度,給定的置信度,查出Fa。分別查找行行和列的,分別比較回歸分析與相關分析的區別1. 相關分析中,變量x 變量 y 處于平等的地位;2. 回歸分析中,變量 y 稱為因變量,處在被解釋的地位, x 稱為自變量,用于預測
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 應急示位燈企業縣域市場拓展與下沉戰略研究報告
- 地質、石油鉆探用合金鋼(粗鋼)企業數字化轉型與智慧升級戰略研究報告
- 礦產鈀企業縣域市場拓展與下沉戰略研究報告
- 沖版機企業ESG實踐與創新戰略研究報告
- 內燃固定平臺搬運車企業ESG實踐與創新戰略研究報告
- 電梯配件企業縣域市場拓展與下沉戰略研究報告
- 冰箱、微波爐燈泡企業ESG實踐與創新戰略研究報告
- 中空織物企業數字化轉型與智慧升級戰略研究報告
- 硬度計企業縣域市場拓展與下沉戰略研究報告
- 新能源汽車熱泵空調企業數字化轉型與智慧升級戰略研究報告
- 山東省高中名校2025屆高三4月校際聯合檢測大聯考生物試題及答案
- 2025年武漢數學四調試題及答案
- 【MOOC】數學建模精講-西南交通大學 中國大學慕課MOOC答案
- 職業病防護設施與個體防護用品的使用和維護
- 2024年全國高中數學聯賽北京賽區預賽一試試題(解析版)
- 綠化養護服務投標方案(技術標)
- 中國紡織文化智慧樹知到期末考試答案2024年
- (正式版)HGT 6313-2024 化工園區智慧化評價導則
- GB/T 3091-2015低壓流體輸送用焊接鋼管
- 實際控制人股東會決議
- 混凝土攪拌機設計論文
評論
0/150
提交評論