應用統計方法第一章數理統計基本概念課件_第1頁
應用統計方法第一章數理統計基本概念課件_第2頁
應用統計方法第一章數理統計基本概念課件_第3頁
應用統計方法第一章數理統計基本概念課件_第4頁
應用統計方法第一章數理統計基本概念課件_第5頁
已閱讀5頁,還剩76頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 應用統計方法電子教案開課系:數理系對象:工科研究生學時:48授課教師:李曉童Email:電話:897345919/24/20221 應用統計方法電子教案開課系:數理系9/24/20221參考書:吳翊等 國防大學出版社1995高惠璇,北京大學出版社 2001梅長林等 西安交通大學出版社 20029/24/20222參考書:吳翊等 國防大學出版社19959/2考核方式 閉卷考試(50%)+課程論文(40%)+考勤(10%)9/24/20223考核方式 閉卷考試(50%)+課程論文(40%)+考勤(10主要內容數理統計基礎-抽樣分布,參數估計,假設檢驗回歸分析方差分析多元分析的基本概念多元正態的參

2、數估計與假設檢驗主成分分析判別分析聚類分析因子分析9/24/20224主要內容數理統計基礎-抽樣分布,參數估計,假設檢驗9/24 chapter1 數理統計基本概念 (Basic Concept of Mathematical Statistics) 9/24/20225 chapter1 數理統計基本概念 (Basic 數理統計學是數學的重要分支它研究怎樣有效得收集,整理和分析帶有隨機性的數據,以對所考察的問題作出推斷和預測,直到采取一定的決策和行動提供依據和建議統計學:去掉帶有隨機性也是數據科學數理統計和統計學的區別:9/24/20226數理統計學是數學的重要分支它研究怎樣有效得收集,整理

3、和分析那里有受隨機性影響的數據,那里就有數理統計的問題教育學醫學環境科學氣象,地質,考古,服裝工業經濟學社會學,心理學農業文學9/24/20227那里有受隨機性影響的數據,那里就有數理統計的問題教育學9/2例如何估計產品的壽命?工業管理極重要的問題,因為壽命實驗是破壞性的,只能抽取少量產品做試驗為評價這批電子產品的使用壽命,隨機抽取臺作試驗,測得壽命數據為(小時):,問整批電子設備中壽命超過小時的占多大比例?(參數估計問題)9/24/20228例如何估計產品的壽命?工業管理極重要的問題,因為壽命實例某針織廠進行技術革新,漂白工藝過程中,要考慮溫度對針織品斷裂強力(主要質量指標)的影響,為了比較

4、70C,80C 影響有無差異,在兩個溫度下做了次試驗:70:20.5,18.8,19.8,20.9,21.5,19.5,21.0,21.280:17.7,20.3,20.0,18.8,19.0,20.1,20.2,19.1.問這兩種溫度下強力有無差別?(假設檢驗問題)這1公斤差別是由什么引起?隨機誤差?溫度的不同?9/24/20229例某針織廠進行技術革新,漂白工藝過程中,要考慮溫度對針織例3.為探討吸煙與慢性支氣管炎是否有關,調查了339人問從這批數據能否判定患慢性支氣管炎與吸煙有關?(列聯表的獨立性)人數患未患合計吸煙43162205不吸煙13121134合計562833399/24/20

5、2210例3.為探討吸煙與慢性支氣管炎是否有關,調查了339人人數患1.1 樣本和總體(Sample and Population)1.2 直方圖與經驗分布函數(Histogram and Empirical Distribution Function)1.3 統計量及其分布(Statistic and Distribution)9/24/2022111.1 樣本和總體(Sample and Populati1.1 樣本和總體 (Sample and Population)9/24/2022121.1 樣本和總體9/24/2022129/24/2022139/24/2022139/24/202

6、2149/24/2022149/24/2022159/24/2022159/24/2022169/24/2022169/24/2022179/24/2022179/24/2022189/24/2022189/24/2022199/24/2022199/24/2022209/24/2022209/24/2022219/24/2022219/24/2022229/24/2022229/24/2022239/24/2022239/24/2022249/24/2022249/24/2022259/24/2022259/24/2022269/24/2022261.2 直方圖與經驗分布函數Histogra

7、m and Empirical Distribution Function)9/24/2022271.2 直方圖與經驗分布函數9/24/2022279/24/2022289/24/2022289/24/2022299/24/2022299/24/2022309/24/2022309/24/2022319/24/2022319/24/2022329/24/2022329/24/2022339/24/202233data wh100; input h w ; if w=50.3 then wc= 50.3 and w54.1 and w57.9 and w61.7 and w65.5 and w6

8、9.3 and w=73.2; wgroup=int(w-46.5)*8/(77-46.5)-0.001)+1; cards;9/24/202234data wh100; input h w ;172.4 75.0 169.3 54.8 169.3 64.0 171.4 64.8 166.5 47.4 171.4 62.2168.2 66.9 165.1 52.0 168.8 62.2 167.8 65.0 165.8 62.2 167.8 65.0164.4 58.7 169.9 57.5 164.9 63.5 160.3 55.2 175.0 66.6 172.5 73.5172.0 64

9、.0 168.4 57.0 155.0 57.0 175.5 63.9 172.3 69.0 168.6 58.0176.4 56.9 173.2 57.5 167.5 50.0 169.4 52.2 166.7 72.0 169.5 57.0165.7 55.4 161.2 48.5 172.8 57.0 175.1 75.5 157.5 50.5 169.8 62.9168.6 63.4 172.6 61.0 163.8 58.5 165.1 61.5 166.7 52.5 170.9 61.0166.1 69.5 166.2 62.5 172.4 52.6 172.8 60.0 177.

10、8 63.9 162.7 56.8168.8 54.0 169.1 66.2 177.5 60.0 177.0 66.2 169.9 55.9 167.4 54.4169.3 58.4 172.8 72.8 169.8 58.0 160.0 65.3 179.1 62.2 172.3 49.8163.3 46.5 172.9 66.7 165.4 58.0 175.8 63.2 162.3 52.2 165.4 65.7171.5 59.3 176.6 66.3 181.7 68.6 175.2 74.9 169.5 59.5 169.6 61.5169.1 63.1 185.5 77.0 1

11、73.9 65.5 162.5 50.0 171.5 58.5 175.6 59.8166.0 75.5 167.2 63.3 171.9 57.0 176.6 58.4 177.3 67.0 169.2 71.8166.2 49.8 181.7 63.0 175.8 68.3 172.3 55.5 172.7 58.5 174.3 64.0171.2 59.0 174.8 68.0 165.4 55.5 169.1 64.8 167.9 62.0 176.8 64.0183.5 69.9 165.5 48.6 171.0 70.5 170.3 58.59/24/202235172.4 75.

12、0 169.3 54.8 169.3 64proc print data=wh100;run;proc freq data=wh100; tables wc ; /* tables wgroup; */ title 100名學生的體重分為8個組的頻數表;run;proc chart data=wh100; vbar w / midpoints=48 to 76 by 4; title 對學生體重數據使用選項MIDPOINT=產生的條形圖;run;proc chart data=wh100; vbar wgroup / discrete; /* vbar wc / discrete; */ ti

13、tle 把輸出1.2.1的頻數表用條形圖表示;run;proc univariate data=wh100 plot; var w;run;9/24/202236proc print data=wh100;run;pr100名學生的體重分為8個組的頻數表 3 12:45 Thursday, February 18, 2009 The FREQ Procedure Cumulative Cumulative wc Frequency Percent Frequency Percent - =73.2 6 6.00 100 100.009/24/202237100名學生的體重分為8個組的頻數表 T

14、he UNIVARIATE Procedure Variable: w Stem Leaf # Boxplot 76 0 1 | 74 9055 4 | 72 085 3 | 70 58 2 | 68 036059 6 | 66 2236790 7 | 64 00008800357 11 +- - -+ 62 022225901234599 15 | | 60 000055 6 *- + -* 58 00044555570358 14 | | 56 890000055 9 +- - -+ 54 04824559 8 | 52 02256 5 | 50 005 3 | 48 5688 4 | 4

15、6 54 2 | - -+- -+- - -+- -+9/24/2022389/24/202238五數概括與箱線圖-次序統計量的應用之一9/24/202239五數概括與箱線圖-次序統計量的應用之一9/24/202做法做法:1 畫一個箱子,其兩側恰為第一4分位數和第三4分位數,在中位數位置上畫一豎線,它在箱子內,這個箱子包含了樣本中50%的數據.2 在箱子左右兩側各引一條水平線,分別至最小值和最大值為止.個線段包含了樣本的25%的數據.9/24/202240做法做法:1 畫一個箱子,其兩側恰為第一4分位數和第三4分位二 莖葉圖:每個數值分為兩部分,前面一部分(百位,十位)稱為莖,后面部分(個位)

16、稱為葉. 如: 數值 分開 莖 葉 112 12|2 11 2 然后畫一豎線,在豎線的左側寫上莖,右側寫上葉.就形成了莖葉圖. 647 7024669 8012333566779 91123333566779100024667881122468991223568133 9/24/202241二 莖葉圖:每個數值分為兩部分,前面一部分(百位,十位)稱為 要比較兩組樣本時,可畫出它們的背靠背的莖葉圖.這是簡單,直觀而有效的對比方法.例2.下面的數據是某廠車間某天40名員工生產的產品的數量. 甲車間 62056 乙車間 87775554211667788 8776644217224555566688

17、9 8766532801133344466778 73210922358 53001079/24/202242 要比較兩組樣本時,可畫出它們的背靠背的莖葉圖.這是簡單9/24/2022439/24/2022439/24/2022449/24/2022449/24/2022459/24/2022459/24/2022469/24/2022469/24/2022479/24/2022471.3 統計量及其分布(Statistic and Distribution)9/24/2022481.3 統計量及其分布9/24/2022489/24/2022499/24/202249data Money50;

18、input w ;cards;924 800 916 704 870 1040 824 690 574 490 972 988 1266 684 764 940 408 804 610 892 602 754 788 962 704 712 854 888 768 848 882 1192 820 878 614 846 746 828 792 872 696 644 926 808 1010 728 742 850 864 738;proc print data=Money50; var w;proc means data=Money50; var w;proc univariate dat

19、a=Money50 plot;var w;run;9/24/202250data Money50;9/24/202250 The MEANS Procedure Analysis Variable : w N Mean Std Dev Minimum Maximum - 50 810.3200000 156.1738226 408.0000000 1266.00 - Stem Leaf # Boxplot 12 7 1 0 12 11 9 1 0 11 10 10 14 2 | 9 679 3 | 9 2234 4 | 8 55556778899 11 +-+ 8 001223 6 *-+-*

20、 7 556799 6 | | 7 0001344 7 +-+ 6 89 2 | 6 0114 4 | 5 7 1 | 5 | 4 9 1 | 4 1 1 0 -+-+-+-+ Multiply Stem.Leaf by 10*+29/24/2022519/24/202251 Stem Leaf # Boxplot 12 7 1 0 12 11 9 1 0 11 10 10 14 2 | 9 679 3 | 9 2234 4 | 8 55556778899 11 +-+ 8 001223 6 *-+-* 7 556799 6 | | 7 0001344 7 +-+ 6 89 2 | 6 011

21、4 4 | 5 7 1 | 5 | 4 9 1 | 4 1 1 0 -+-+-+-+ Multiply Stem.Leaf by 10*+29/24/2022529/24/202252 The SAS System 13:47 Saturday, February 20, 2009 22 The UNIVARIATE Procedure Variable: w Moments N 50 Sum Weights 50 Mean 810.32 Sum Observations 40516 Std Deviation 156.173823 Variance 24390.2629 Skewness 0.2322891 Kurtosis 1.40426379 Uncorrected SS 34026048 Corrected SS 1195122.88 Coeff Variation 19.2731048 Std Error Mean 22.0863138 Basic Statistical Measures Location Variability Mean 810.3200 Std Deviation 156.17382 Median 814.0000 Va

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論