




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、變異數與標準差n變異數變異數:離差離差(資料值與期望值的差異資料值與期望值的差異)平方和的平均平方和的平均n 標準差標準差:變異數的平方根變異數的平方根n 變異數的單位是原資料單位的平方變異數的單位是原資料單位的平方n 標準差的單位同原資料的單位標準差的單位同原資料的單位n母體變異數母體變異數:n 樣本變異數樣本變異數:n計算樣本變異數時,分母取計算樣本變異數時,分母取(n-1)而非而非(n)的原因的原因:n 實務上,母體變異數通常未知,須以樣本變異數估計之,而樣本變異數會隨所實務上,母體變異數通常未知,須以樣本變異數估計之,而樣本變異數會隨所n 抽選樣本的不同而有變動抽選樣本的不同而有變動(
2、非固定非固定),若考慮很多次抽樣,每次都以,若考慮很多次抽樣,每次都以” ”的的n 公式計算樣本變異數,則有些樣本變異數會高於母體變異數,有些則低於母體公式計算樣本變異數,則有些樣本變異數會高於母體變異數,有些則低於母體n 變異數,但平均而言會與母體變異數很接近;反之,若計算樣本變異數時均除變異數,但平均而言會與母體變異數很接近;反之,若計算樣本變異數時均除n 以以n,則平均而言會偏向低於母體變異數,則平均而言會偏向低於母體變異數Nxi22)(1)(22nxxsi) 1( nn 變異數(或標準差)與期望值一樣,容易受極值的影響n 例:(起薪的資料)n若將最大值改為10,000,則($)65.1
3、6591.440,27)($91.440,2711850,3011)(222snxxsi723.051, 26 .566,209, 4496, 32ssx起薪的資料變異係數(Coefficient of Variation)n 變異係數定義為n CV是量測相對(於期望值)分散程度的量數,表示標準差佔期望值的百分比,通常小於1n 例:(起薪的資料)n表示薪資的分散程度約為期望值的5.6%n 變異係數在財務分析上可用來計算相對的風險(%)100 xsCV %6.5(%)100940,265.165CV變數變換對期望值與標準差的影響n 設變數Y為變數X的函數:y=g(x)n變數Y之觀察值的期望值通常
4、無法直接以X變數之期望值的相同函數計算,但線性函數則例外n假設 則 n但對標準差的影響則為n baxybxayxysas xy=ax+by=axy=x+bxabx bxa xxsaxsaxsxsxsx/)/(bxasax)/( xasax)/(bxsxn 例: 假設成本(C) 是產量(x)的線性函數,n 變動成本+固定成本nn若每月平均產量為 標準差n則n而產量與成本的變異係數則分別為000,000, 15 xc000,300 x000,15xs000,75000,155000,500, 2000,000, 1000,3005csc%3000,500, 2/000,75%5000,300/00
5、0,15cxcvcvZ分數(z-score)n 是一個特殊的線性變數變換:n 未知時以 代之,而常另稱之為t分數(t-score)n 正的Z分數表示變數值比期望值大z個標準差n負的Z分數表示變數值比期望值小|z|個標準差n 變數變換後的Z分數是無單位的,所以適用於比較不同資料集之資料值在各自資料集裡的相對位置,例如:林同學身高的z分數為0.6,而體重的z分數為0.2;表示比班上平均身高高0.6個標準差,而比平均體重重0.2個標準差;所以在班上是屬於中等個子,但稍微高一些/ )( xbaxz,sx,經驗法則(Empirical Rule)n若原資料呈對稱如吊鐘型的分佈,則經變數變換後的Z分數會變
6、為對稱於零的吊鐘型分配,且分配的型態固定(不因標準差的大小而有不同),此通稱為標準常態分配(Standard Normal Distribution) n大約有68%的z分數會對稱分佈在+1之間,n大約有95%的z分數會對稱分佈在+ 2之間,n而幾乎所有的z分數會對稱分佈在+ 3之間保齡球成績的資料012312368%99.7%95%謝比契夫(Chebyshev) 不等式n 若原資料的分佈非對稱,則至少有n的資料會落在n期望值+z倍標準差n之間, 但z須大於1n )%/11 (1002zZ275%389%494%2/11zn 例:(起薪的資料)n若起薪分配的期望值=2,940,標準差=165.
7、65,則至少有n 75%畢業學生的起薪會在n 2,940+2(165.65)=(2,608.7, 3,105.65) 之間n 89%畢業學生的起薪會在n 2,940+3(165.65)=(2,443.05, 3,436.95) 之間n 94%畢業學生的起薪會在n 2,940+4(165.65)=(2,277.40, 3,602.60) 之間離群值(Outliers)n Z分數可用來檢查資料集裡是否有離群值:n一般而言,若Z分數的絕對值大於3,則稱對應的資料值為離群值n 離群值可能是錯誤的資料,也可能是較特殊的資料n 如果是錯誤的資料,須訂正或移除後,才進行統計分析n 如果是特殊的資料,則可比較
8、移除與不移除下的兩種分析結果,折衷或採其中之一較合理的結果箱型圖(Box Plot)n 五個統計量:n Min, Q1, Q2, Q3, Maxn 繪製圖型的步驟:n 由Q1, Q3劃一個箱型n 以Q2將箱型分成兩部分n 由箱型兩邊各劃一條平行直線,向外延伸到Min與Maxn 在箱型兩邊向外 1.5倍IQR 處,各劃一條垂直直線n 在箱型兩邊向外 3倍IQR 處,各劃一條垂直直線n Q1, Q2, Q3大約將所有資料平分成四份起薪資料的箱型圖Min=2,710 Q1=2,865 Q2=2,905 Q3=3,000 Max=3,325IQR=135 Q1-1.5 IQR=2,663 Q3+1.5
9、 IQR=3,203共變異數(Covariance)與相關係數(Correlation Coefficient)n 量測兩量化變數之間線性關聯程度的量數n 例如: 廣告次數 vs. 銷售金額n 溫度 vs. 餅乾的脆度n 若觀察資料的序對 呈現狹長的帶狀分佈,則表示兩變數具有線性關聯,分布越集中,越有關聯n 計算公式:n 母體共變異數: n 樣本共變異數: n 母體相關係數:n 樣本相關係數:),( ,),(11nnyxyxNyxyixixy)(1)(nyyxxsiixy22)()()(xixiyixiyxxyxyyxyx22)()()(yyxxyyxxsssriiiiyxxyxy例例: 廣告次數廣告次數(x) vs. 銷售金額銷售金額(y)93.930. 7491. 1999930. 795661)(491. 19201)(22yxxyxyiyixsssrnyysnxxsn相關係數是無單位的,且係數值一定會介於+1與-1之間;正的係數表示正向的相關,負的係數表示負向的相關,係數值越接近+1,相關程度越高n係數值接近零 ,表示無明顯的線性相關,但並不表示無其他非線性函數的關係,n例如:nx -2.0-1.5-1.0-0.50.00.51.01.52.0y 6.00 4.25 3.00 2.25 2.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 養豬場租賃合同書
- 跨境電商平臺運營策略及市場拓展研究
- 油茶種苗采購合同范本
- 船舶配件合同范本
- 通訊配件出售合同范本
- 復工復產培訓計劃
- 室內線安裝合同范本
- 2025電梯設備安裝合同協議書范本
- 外景拍照合同范本
- 2025水果購銷合同標準格式
- 中國農業銀行筆試真題含解析
- 茶臺買賣合同5篇
- 2025年新疆天澤水利投資發展有限公司招聘筆試參考題庫含答案解析
- 2025年鄭州衛生健康職業學院單招職業適應性測試題庫含答案
- 2024年北京市中考滿分作文《盤中餐》
- 沖床基礎板施工方案
- 2025屆高考英語應用文寫作高分素材(活動報道+自然災害新聞報道+博文寫作)清單
- 《鎂鋁合金的腐蝕與防護》課件
- 2024年亳州利辛縣第二人民醫院社會招聘護理筆試真題
- 2024新外研社版英語七下單詞默寫表(開學版)
- 《政協委員培訓材料》課件
評論
0/150
提交評論