




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、本課程的內容第一章 緒論第二章 統計數據的搜集、整理和 顯示第三章 統計數據的描述分析第四章 參數估計第五章 參數假設檢驗第六章 方差分析第七章 非參數統計方法第八章 時間序列分析 第九章 相關與回歸分析第十章 統計指數 教材:吳詣民 趙春艷應用統計學 陜西人民教育出版社,2006年。參考書目:1、李心愉應用經濟統計學北京:北京大學出版社,2003年。2、耿修林商務經濟統計學北京:科學出版社,2003年3、美戴維 R 安德森等商務與經濟統計北京:中信出版社,2003。4、肖筱南新編概率論與數理統計北京:北京大學出版社,2002年。第一章 緒論 第一節 統計學的學科性質一、統計學的學科性質1、爭
2、論:“方法論學科” “實質性學科”2、統計處理數據的過程:搜集數據整理數據分析數據解釋數據二、統計學的分類1、描述統計學和推斷統計學2、理論統計學和應用統計學第二節 統計學的幾個基本概念一、總體和總體單位1、總體是由具有某種共同性質的許多個體組成的整體,構成總體的個體稱為總體單位。2、兩層含義: 統計學研究的是大量現象的數量特征,總體包含了大量現象; 統計單位具有某一共同性質,但其他的性質、特征是不同的,便于在差異中尋找規律。二、標志和指標1、標志是說明總體單位特征和屬性的名稱,分為數量標志和品質標志。2、指標是說明總體現象數量特征的概念和數值。按其反映數量特點的不同,分為數量指標和質量指標。
3、三、統計指標1、從總體的一個特征到具體數值,中間有很多步要走。2、以GDP的核算為例來說明想看一國一年內生產活動的總量,定義GDP是一國在一定時期內最終產品的總價值。(內涵)最終產品是本期生產本期不再投入生產使用的產品,消費、投資、出口產品。(外延)跟蹤所有產品的使用去向,再核算其價值是不可能的。部門增加值核算方法(計算方法)棉花紗布 印染衣服300350460580 880部門增加值30050110120 300最終產品的總價值=880部門增加值合計=300+50+110+120+300=880時間、空間、計量單位第二章 統計數據的搜集、整理和顯示第一節 統計數據的搜集一、統計調查方式統計報
4、表制度、普查、抽樣調查、典型調查、重點調查例2.1、一批鋼材,抽樣測試其抗張力,隨機抽取76個樣本觀察值如下:(單位:kg /cm2)41.0 37.0 33.0 44.2 30.5 27.0 45.0 28.5 40.6 34.831.2 33.5 38.5 41.5 43.0 45.5 42.5 39.0 36.2 27.538.8 35.5 32.5 29.5 32.6 34.5 37.5 39.5 35.8 29.142.8 45.1 42.8 45.8 39.8 37.2 33.8 31.2 31.5 29.529.0 35.2 37.8 41.2 43.8 48.0 43.6 41
5、.8 44.5 36.536.6 34.8 31.0 32.0 33.5 37.4 40.8 44.7 40.0 41.540.2 41.3 38.8 34.1 31.8 34.6 38.3 41.3 44.2 37.130.0 35.2 37.5 40.5 38.1 37.3第二節 數據的整理一、統計分組1、統計分組是將統計總體按照一定標志區分成若干個組成部分的一種統計分析方法。2、兩點注意:有時不易確定組與組之間的界限;窮盡原則、互斥原則。二、頻數分布數列1、統計分組后,每個組分配的總體單位數稱為頻數或次數,頻數/總體單位總數=頻率。2、意義整理了雜亂無章的數據,同時顯示出一批數的分布情況
6、,是數理統計學中隨機變量及其概論分布概念在實際中的應用。3、分類:按分組標志的不同,分為:品質數列 單項數列:一個變量值是一個組變量數列 組距數列:兩個變量值構成的區間是一個組 三、組距分布數列的編制方法第一步,排序后,極差=max-min第二步,確定組數、組距。 組數 k=1+3.32lgn(參考) 組距=(max-min)/組數第三步,組中值。 組中值=(下限+上限)/2四、累計頻數分布數列1、各組頻數向上、向下累計形成的數列。2、在經濟學中的應用。洛倫茨曲線基尼系數=A/(A+B)第三節 數據顯示統計表和統計圖一、統計表1、表的格式:橫行標題:對象(總體(常以年份形式表示)、總體分組、總
7、體各單位)縱欄標題:統計指標交叉部分:指標值2、注意事項:數據居中,小數點對齊左右不封口;表下面注明資料來源。二、統計圖第三章 統計數據的描述分析第一節 集中趨勢分析集中趨勢是數據分布的中心,描述集中趨勢的指標有算術平均數、中位數、眾數等。某單位80個工人生產的零 單位:個65 78 88 65 58 76 69 66 80 64 77 78 60 65 85 74 73 65 66 79 74 85 59 69 60 87 85 86 64 93 76 62 91 49 74 78 75 79 86 68 87 97 92 82 66 94 75 56 85 77 67 89 78 79 8
8、8 83 73 69 84 95 55 79 77 58 80 68 77 87 70 78 79 61 47 69 89 96 66 76 81 99Min=47 max=99一、算術平均數(均值)1、將一批數累加起來,除以數據的個數,即為算術平均數。2、分為簡單算術平均數和加權算術平均數例、某單位80工人一周生產零件數。1、簡單算術平均數2、加權算術平均數3、算術平均數與數學期望對于離散型隨機變量X,設它的概率密度函數P(Xi)為,則的數學期望為對于連續型隨機變量X,設其概率密度函數為f(X),則的數學期望為4、算術平均數的缺陷10 15 20 25 70去掉70后,二、眾數(M0)1、眾
9、數是指一組變量值中出現次數最多的變量值。2、眾數的確定未分組資料,M0就是出現次數最多的變量值。上例中,78、79各出現5次,都是M0數據分布是雙峰的。分組資料:在等距分組的情況下,頻數最多的組是眾數組,在該組內確定眾數。例、上例中眾數組是第3組,三、中位數及分位數1、中位數把一批數按照從小到大的順序排列,處于數列中點的變量值就是Me確定方法未分組資料:(n+1)/2中位數的位置。 前例Me=77分組資料:根據向上或向下累計頻數分布數列,按照 確定中位數所在的組,然后確定。2、百分位數把數據按從小到大的順序排列后,第P百分位數是指有P%的值小于或等于它,而有(100-P)%的值大于或等于它。確
10、定方法。i=(P/100)n就是第P百分位數的位置。其中最常用的是四分位數。即把數據分成四個部分,每個部分包括1/4數值。第二節 離中趨勢分析一、離中趨勢1、離中趨勢是數據分布的又一特征,它表明變量值的差異或離散程度。2、意義:首先,可以衡量算術平均數的代表性。例:均值都為150的兩組數 50,100,150,200,250 100,125,150,175,200其次,進行產品質量管理和決策。3、離中趨勢測度經常用到的指標有:極差、方差和標準差、四分位差等,它們也被稱為變異指標。二、極差1、極差也稱為全距,是一組變量中最大值與最小值的離差,表明變量值變動的范圍。用R表示極差,其計算公式是: 2
11、、缺點:易受極端值的影響。三、四分位差1、四分位差用數列中第3/4位次與1/4位次的變量值之差除以2來表示。2、意義:剔除了極端值,說明50%數據分布的范圍;與中位數配合說明數據分布是否對稱。若分布對稱,則Q2-Q1=Q3-Q2=(Q3-Q1)/2若不相等,則是非對稱的。四、平均差1、平均差是指變量值與其算術平均數的離差絕對值的算術平均數,用符號AD表示。計算公式: 2、優缺點五、方差與標準差1、方差與標準差是測定離中趨勢最常用的指標。標準差是方差的平方根,也稱均方差。2、計算公式:樣本方差和標準差要除以n-1,才是總體的無偏估計。 3、標準差系數第三節 偏度和峰度分析一、矩的概念1、矩是力學
12、概念,用來表示力和力臂對中心的關系。統計學中借用這一概念討論隨機變量的分布特征。2、統計學中,將矩定義為原點矩和中心矩。原點矩的定義是:k為整數,稱為k階原點矩中心矩的定義是: 3、中心矩的兩個重要性質:分布對稱時,奇數階中心矩恒為零;當分布為正態分布時,偶數階中心矩有二、偏態1、分布的偏態就是分布不對稱的方向和程2、它的測量主要是兩種方法,一種是矩法,二是Pearson偏態系數。Pearson偏態系數以平均數與眾數之差除以標準差來衡量偏斜程度,用SK表示。其計算公式為:當SK=0時, 呈對稱分布; 當SK0時, 分布是右偏(正偏)的;當SK0時,表示頻數分布比正態分布更集中,分布呈尖峰狀態;
13、0時表示頻數分布比正態分布更分散,分布呈平坦峰。例、前例數據的峰度分析 第四章 參數估計第一節 隨機變量與概論分布隨機現象隨機變量概論分布離散型和連續型隨機變量第二節 統計量與抽樣分布一、幾個基本概念1、總體和樣本研究對象的全體稱為總體,組成總體的每個基本單元稱為個體;把從總體中按照隨機原則抽出的個體組成的小群體稱為樣本,所包含的個體總數稱為樣本容量。總體=某項數量指標取值的全體=隨機變量一個容量為n的樣本就是一個n維隨機變量其中 相互獨立,與總體 具有相同的概率分布。 2、統計量與抽樣分布參數估計統計量樣本函數稱為統計量。設是來自總體 的一個樣本,是 的函數,若 是連續函數且其中不含任何未知
14、參數,則稱 是一個統計量。 抽樣分布統計量的概論分布為抽樣分布,總體的分布已知時,統計量的分布是確定的。二、三大推斷分布(一) 分布1、設 是來自總體(0,1)的一個樣本,則稱統計量服從自由度為n的 分布,記為 。此處,自由度是指包含的獨立變量的個數。2、性質:(1)設 ,且 獨立,則 ,即分布具有可加性。(2)分位點若對于給定的 ,0 1,存在使得則稱點 為 分布的上 分位點,如圖所示。 (二)t分布1、設XN(0,1),Yx2(n),且X,Y相互獨立,則稱隨機變量為服從自由度為n的t分布,記Tt(n)。t分布又稱學生氏(student)分布。2、性質關于y軸呈對稱分布;當 時,近似于N(0
15、,1)分布。分位點對于給定的,0 1,稱滿足的點 為t分布的分位點。(三)F分布1、設UX2(n1),VX2(n2),且U、V相互獨立,則服從自由度為( n1,n2)的F分布,記為2、性質F分布是非對稱的分位點對于給定的,0 30),同(1),可以用樣本方差替代總體方差。2、樣本方差s2的抽樣分布3、兩樣本均值差的抽樣分布(1) 已知(2) 未知,但兩者相等(3)當不知總體的分布形式時,n很大時,由中心極限定理推,同(1),用樣本方差替代總體方差。4、兩總體方差比5、樣本成數的抽樣分布第二節 點估計一、點估計1、點估計是指根據總體參數的性質構造一個統計量,然后由樣本資料計算出統計量的值,并直接
16、作為相應的總體參數值的替代。2、常見的用樣本均值、方差、成數作為總體均值、方差、成數的估計值。3、缺點第三節 區間估計一、含義1、用樣本統計量的兩個估計值所構成的一個區間估計總體參數。(1)區間估計不僅要有具體結果,還要有精度及可靠程度;(2)估計的置信度或概論保證程度;(3)置信度與估計精度。二、區間估計原理以總體均值的估計為例(1)三、例題例4.1、一家襪廠的原料之一加彈尼龍來自甲、乙兩家工廠,為了估計甲乙兩廠提供的產品的拉力強度的差異,從甲廠隨機抽取了25個樣品,從乙廠抽取了16個樣品,測試結果,甲廠產品的平均拉力強度為22千克,乙廠產品的平均拉力強度為20千克,根據過去記錄,兩個工廠產
17、品的拉力強度的方差均為10,要求以95%的把握對兩廠產品拉力強度的差異情況做出判斷。解:m=25 ,n =16, , ,1- =95%即(0.016,3.984),在95%的概率保證下,甲廠產品的拉力強度大于乙廠,不超過4千克。例4. 2、某教育研究機構為了了解男女學生高考數學成績的差異程度,隨機從參加高考的男女學生中分別抽取了61人和121人,調查資料得出:男生女生數學考試成績的方差分別是73和84,試以95%的概率推斷 的置信區間。解:m=121 ,n =61, =84, =73, 1- =95%假定男、女生成績服從正態分布,統計量服從的分布是: =0.05,查表, (120,60)=1.
18、58, (120,60)=1/ (60,120)=1/1.53代入上式,得區間估計為(0.57,1.37)。第四節 樣本容量的確定一、決定樣本容量的因素1、總體方差2、允許誤差3、概率保證程度4、以總體均值的估計為例:設 =例第五章 參數假設檢驗第一節 參數假設檢驗的基本原理和步驟一、參數假設檢驗的含義1、問題的提出2、這類問題特征3、兩個假設的提出4、對總體假設的類型二、假設檢驗的基本原理以實例說明。例5.1、某旅游機構根據過去資料對國內旅游者的旅游費用進行分析,發現在10天的旅游時間中,旅游者用在車費、住宿費、膳食及購買紀念品等方面的費用是一個近似服從正態分布的隨機變量,其平均值為1010
19、元,標準差為205元,而某研究所抽取了樣本容量為400的樣本,作了同樣內容的調查,得到樣本平均數為1250元。能否根據樣本的平均數1250元,推斷認為總體平均數是1010元呢?1、H0:=1010; H1: 1010若H0為真,則從XN(1010,2052)中抽取容量為400的樣本,則 N(1010,2052/400) ,則 N(0,1)代入樣本值有2、Z=23.4相當于隨機變量的一個取值。3、小概率事件在一次試驗中幾乎不可能發生。4、誤判5、P值規則。第二節 常見的參數假設檢驗一、樣本均值統計量的抽樣分布。總體XN(,2),n,H0: = 0; H1: 0;(1)總體方差已知 H 0成立時,
20、拒絕域 (2)總體方差未知H0成立的條件下,拒絕域,(3)總體分布未知,大樣本,同(1)二、兩個總體均值差的檢驗(1)兩總體方差已知H0成立時,拒絕域(2)兩總體方差未知,但相等在H0成立的條件下,拒絕域(3)總體分布形式未知,大樣本,同(1)三、單個正態總體方差的檢驗在H0成立的條件下,拒絕域2四、兩個正態總體方差比的檢驗在H0成立的條件下,拒絕域F五、單個總體成數的檢驗1、拒絕域六、兩個總體成數差的檢驗拒絕域第三節 假設檢驗的其他問題一、單側檢驗1、單側檢驗指拒絕域在樣本統計量分布的一側。(1)若 ,則對于顯著性水平 ,有(2)若 ,則因為 是總體均值,所以對于給定的顯著性水平 ,有 當
21、是概率更小的事件。2、H0中不管出現什么符號,均按等號處理。二、參數檢驗的兩類錯誤1、“以真為假”2、“以假為真”3、給定的原則三、實例例1、已知某煉鐵廠的鐵水含碳量服從正態分布N(.40,0.052),某日測得爐鐵水的含碳量如下:4.34 4.40 4.42 4.30 4.35若標準差不變,該日鐵水含碳量的均值是否顯著降低(取 =0.05)?解:已知=4.40,=0.05,n=5,=0.05,設提出假設: : =4.40, : 4.40選取統計量- 0.05,拒絕原假設。例2、一所學校正在考慮修訂下一年的學校用車服務合同,結合諸多情況的分析,初步確定學校只能在A和B 兩個汽車出租公司中選擇其
22、中的一個。假設我們以運送或到達的時間方差作為衡量這兩個公司的服務質量的標準。如果兩個公司的時間方差相等,那么就要考慮能夠以較低價格出租的那個公司,如果兩個公司的時間方差明顯不同,那么就要考慮選擇一個時間方差比較小的公司進行合作。為了找到決策的事實依據,該學校對過去這兩個汽車出租公司的行駛和服務時間進行了調查。對A公司做了25次觀察,得到它的時間方差為48,對B公司做了16次觀察,得到它的時間方差為20。試在顯著性水平為0.1的條件下,對兩個出租車公司的服務時間差異進行假設檢驗。解:已知 nA=25, SA2=48, nB =16 , SB2=20,=0.1 F=代入樣本值,得F=48/20=2
23、.4在0.1顯著性水平下,查表得F0.05 (24,19)= 2.29,F0.05 (24,19)=)=1/ F0.05 (19,24)=1/2.03=0.49例3、為了了解男性與女性對公共場所禁煙立法的態度,現隨機調查510名男性,有16%的人贊成公共場所禁煙立法,被調查的324名女性中,有29%的人贊成禁煙立法。問男性與女性對公共場所禁煙立法的態度是否存在明顯的差異。(=0.05)解:已知n =510,px =16% ,m =324 py=29% =0.05 =0.05,本題是左側檢驗,查表得z0.05=1.65,-4.332.87,拒絕原假設,電流強度對電解銅雜質率有顯著影響。二、單因素不等重復方差分析A因素的各水平下所做的試驗次數不完全相等1、離差平方和2、樣本統計量的分布3、例題:某公司為進一步激勵銷售人員的工作熱情,正籌劃實行新的分配辦法,擬定采用的做法是對新近招聘進來的銷售人員實行傭金制,對工作滿五年的員工采用傭金加固定薪金,對工作滿八年以上的銷售人員基本實行固定薪金方案。不知這樣的分配辦法是否能達到促進銷售的目的,為此,主管部門考慮進行跟蹤觀察一段時間,然后再正式決定。從各個分配方案的人員中,按隨機原則抽取一定的人員,登記一個月的銷售量(單位:萬元),具體資料如表所示:試在顯著性水平=0.0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同概括轉移協議
- 2025年會計職稱考試《初級會計實務》財務報表編制核心考點模擬試題卷
- 2025年專升本藝術概論考試模擬卷(藝術史論重點與藝術史研究方法試題)
- 2025年一建《機電工程管理與實務》考試施工現場安全防護設施與文明施工試題集
- 保安合同解約協議
- 取消工業合同協議
- 員工宿舍協議合同
- 廣東餐飲加盟協議合同
- 定制櫥柜合同協議
- 合同協議書餐館
- 《廣東省普通高中學生檔案》模板
- 高職院校與區域經濟協調發展研究
- 紀念五四運動100周年知識競賽試題題庫與答案
- YY/T 1492-2016心肺轉流系統表面涂層產品通用要求
- YS/T 1028.3-2015磷酸鐵鋰化學分析方法第3部分:磷量的測定磷鉬酸喹啉稱量法
- JJF 1104-2003國家計量檢定系統表編寫規則
- GB/T 665-2007化學試劑五水合硫酸銅(Ⅱ)(硫酸銅)
- GB/T 17891-1999優質稻谷
- GA 588-2012消防產品現場檢查判定規則
- DB1308-T 318-2022酸棗仁采收加工技術規程
- 《蘭亭集序》《歸去來兮辭》對比閱讀課件(教材精研+情境任務)統編版高中語文選擇性必修下冊
評論
0/150
提交評論