




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統計學案一隨機抽樣(一)總體、個體、樣本把所考察對象的某一數值指標的全體構成的集合看成總體,構成總體的每一個元素為個體從總體中隨機抽取若干個個體構成的集合叫做總體的一個樣本(二)抽樣方法1簡單隨機抽樣(1)定義:設一個總體含有N個個體,從中不放回地抽取n個個體作為樣本(nN),如果每次抽取時,總體內的各個個體被抽到的機會都相等,稱這種抽樣方法為簡單隨機抽樣(2)簡單隨機抽樣的特點如下:它要求被抽取樣本的總體中個體數有限它是從總體中逐個地進行抽取它是一種不放回抽樣它每一次抽取時,總體中的各個個體有相同的可能性被抽到(3)常用的簡單隨機抽樣方法抽簽法先將總體中的所有N個個體編號,并把號碼寫在形狀、
2、大小相同的號簽上,然后將這些號簽放在同一個容器里,攪拌均勻抽簽時,每次從中抽出1個號簽,連續抽取n次,就得到一個容量為n的樣本抽簽法的優點是簡單易行缺點是當總體的容量非常大時,費時、費力又不方便況且,如果號簽攪拌得不均勻,可能導致抽樣的不公平隨機數表法a隨機數表:隨機數表是由0,1,2,9這10個數字組成的數表,并且表中的每一位置出現各個數字的可能性相同b用隨機數表抽樣的步驟:第一步:將總體中的個體編號為了保證抽取樣本有很好的代表性,編號時位數要相同第二步:選定開始的數字為了保證所選定數字的隨機性,應在面對隨機數表之前就指出開始數字的縱橫位置第三步:獲取樣本號碼隨機確定一個讀數方向,讀數的方向
3、可以向右,也可以向左、向上、向下等,重復的號碼跳過2系統抽樣(1)定義:當總體元素個數很大時,可將總體分成均衡的若干部分,然后按照預先制定的規則,從每一部分抽取一個個體得到所需要的樣本,這種抽樣方法叫做系統抽樣,也稱作等距抽樣(2)系統抽樣的步驟:編號采用隨機的方式將總體中的個體編號分段先確定分段的間隔k.當(N為總體中的個體數,n為樣本容量)是整數時,k;當不是整數時,通過從總體中隨機剔除一些個體使剩下的總體中個體總數N能被n整除,這時k.確定起始個體編號在第1段用簡單隨機抽樣確定起始的個體編號S.按照事先確定的規則抽取樣本通常是將S加上間隔k,得到第2個個體編號Sk,再將(Sk)加上k,得
4、到第3個個體編號S2k,這樣繼續下去,獲得容量為n的樣本其樣本編號依次是:S,Sk,S2k,S(n1)k.3分層抽樣(1)定義:當總體由有明顯差別的幾部分組成時,按某種特征在抽樣時將總體中的各個個體分成互不交叉的層,然后按照各層在總體中所占的比例,從各層獨立地抽取一定數量的個體合在一起作為樣本,這種抽樣的方法叫做分層抽樣分層抽樣使用的前提是總體可以分層,層與層之間有明顯區別,而層內個體間差異較小,每層中所抽取的個體數可按各層個體數在總體中所占比例抽取分層抽樣要求對總體的內容有一定的了解,明確分層的界限和數目,分層要恰當各層抽取時采用簡單隨機抽樣或系統抽樣(2)分層抽樣的步驟分層;按比例確定每層
5、抽取個體的個數;各層抽樣(方法可以不同);匯合成樣本(3)分層抽樣的優點分層抽樣充分利用了己知信息,充分考慮了保持樣本結構與總體結構的一致性使樣本具有較好的代表性,而且在各層抽樣時,可以根據具體情況采取不同的抽樣方法,因此分層抽樣在實踐中有著非常廣泛的應用6三種抽樣方法的比較類別共同點各自特點相互聯系適用范圍簡單隨機抽樣抽樣過程中每個個體被抽取的機會均等從總體中逐個抽取 總體中的個體數較少系統抽樣將總體均勻分成幾部分,按事先確定的規則在各部分抽取在起始部分抽樣時采用簡單隨機抽樣總體中的個體數較多分層抽樣將總體分成幾層,分層進行抽取各層抽樣時采用簡單隨機抽樣或系統抽樣總體由差異明顯的幾
6、部分組成練1.(2010·安徽文,14)某地有居民100 000戶,其中普通家庭99 000戶,高收入家庭1 000戶從普遍家庭中以簡單隨機抽樣方式抽取990戶,從高收入家庭中以簡單隨機抽樣方式抽取100戶進行調查,發現共有120戶家庭擁有3套或3套以上住房,其中普通家庭50戶,高收入家庭70戶依據這些數據并結合所掌握的統計知識,你認為該地擁有3套或3套以上住房的家庭所占比例的合理估計是_練2.將一個總體為100的個體編號為0,1,2,3,99,并依次將其分為10個小組,組號為0,1,,9,要用系統抽樣的方法抽取一個容量為10的樣本,規定如果在第0組(號碼為09)隨機抽取的號碼為2,
7、則所抽取的10個號碼為 .練3.2010年高考湖北卷將參加夏令營的600名學生編號為:001,002,600.采用系統抽樣方法抽取一個容量為50的樣本,且隨機抽得的號碼為003.這600名學生分住在三個營區,從001到300在第營區,從301到495在第營區,從496到600在第營區,三個營區被抽中的人數依次為 ( )A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9 練4.一個社會調查機構就某地居民的月收入調查了10000人,并根據所得數據畫了樣本的頻率分布直方圖(如下圖),為了分析居民的收入與年齡、學歷、職業等方面的關系,要從這10000人中再用分層抽樣方法抽出
8、100人作進一步調查,則在(2500,3000)(元)月收入段應抽出的人數為()A25 B30 C35 D40二用樣本估計總體1編制頻率分布直方圖的步驟如下:求極差:極差是一組數據的最大值與最小值的差決定組距和組數:當樣本容量不超過100時,常分成512組組距.將數據分組:通常對組內數值所在區間取左閉右開區間,最后一組取閉區間,也可以將樣本數據多取一位小數分組;列頻率分布表:登記頻數,計算頻率,列出頻率分布表將樣本數據分成若干小組,每個小組內的樣本個數稱作頻數,頻數與樣本容量的比值叫做這一小組的頻率頻率反映數據在每組所占比例的大小繪制頻率分布直方圖:把橫軸分成若干段,每一段對應一個組距,然后以
9、線段為底作一矩形,它的高等于該組的,這樣得出一系列的矩形,每個矩形的面積恰好是該組上的頻率這些矩形就構成了頻率分布直方圖在頻率分布直方圖中,縱軸表示“頻率/組距”,數據落在各小組內的頻率用小矩形的面積表示,各小矩形的面積總和等于1.2頻率分布折線圖(1)把頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分布折線圖(2)總體密度曲線如果樣本容量不斷增大,分組的組距不斷縮小,則頻率分布直方圖實際上越來越接近于總體的分布,它可以用一條光滑曲線yf(x)來描繪,這條光滑的曲線就叫總體密度曲線3莖葉圖:統計中還有一種被用來表示數據的圖叫做莖葉圖莖是指中間的一列數,葉是從莖的旁邊生長出來的數在
10、樣本數據較少、較為集中,且位數不多時,用莖葉圖表示數據的效果較好,它較好的保留了原始數據信息,方便記錄與表示,但當樣本數據較多時,莖葉圖就不太方便4平均數、中位數和眾數(1)平均數:一組數據的總和除以數據的個數所得的商就是平均數(2)中位數:如果將一組數據按從小到大的順序依次排列,當數據有奇數個時,處在最中間的一個數是這組數據的中位數;當數據有偶數個時,處在最中間兩個數的平均數,是這組數據的中位數(3)眾數:出現次數最多的數(若有兩個或幾個數據出現得最多,且出現的次數一樣,這些數據都是這組數據的眾數;若一組數據中,每個數據出現的次數一樣多,則認為這組數據沒有眾數)(4)在頻率分布直方圖中,最高
11、小長方形的中點所對應的數據值即為這組數據的眾數而在頻率分布直方圖上的中位數左右兩側的直方圖面積應該相等,因而可以估計其近似值平均數的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和5方差、標準差設樣本數據為x1,x2,xn樣本平均數為,則s2(x1)2(x2)2(xn)2(x12x22xn2)n2叫做這組數據的方差,用來衡量這組數據的波動大小,一組數據方差越大,說明這組數據波動越大 把樣本方差的算術平方根叫做這組數據的樣本標準差 數據的離散程度可以通過極差、方差或標準差來描述,其中極差反映了一組數據變化的最大幅度方差則反映一組數據圍繞平均數波動的大小練5(2011
12、83;青島)一組數據20,30,40,50,50,60,70,80的平均數、中位數、眾數的大小關系是A平均數>中位數>眾數 B平均數<中位數<眾數C中位數<眾數<平均數 D眾數中位數平均數練6 .(2011·安徽名校聯考一)關于統計數據的分析,有以下幾個結論:一組數不可能有兩個眾數;將一組數據中的每個數據都減去同一個數后,方差沒有變化;調查劇院中觀眾觀看感受時,從50排(每排人數相同)中任意抽取一排的人進行調查,屬于分層抽樣; 一組數據的方差一定是正數;如圖是隨機抽取的200輛汽車通過某一段公路時的時速分布直方圖,根據這個直方圖,可以得到時速在50
13、,60)的汽車大約是60輛 則這5種說法中錯誤的個數是()A2 B3 C4 D5練7.(2010·山東文)在某項體育比賽中,七位裁判為一選手打出的分數如下:90899095939493去掉一個最高分和一個最低分后,所剩數據的平均值和方差分別為()A92,2 B92,2.8 C93,2 D93,2.8 練8.(2010·合肥工大附中)某市共有5000名高三學生參加聯考,為了了解這些學生對數學知識的掌握情況,現從中隨機抽出若干名學生在這次測試中的數學成績,制成如下頻率分布表:分組頻數頻率80,90)90,100)0.050100,110)0.200110,120)360.300
14、120,130)0.275130,140)12140,1500.050合計(1)根據上面的頻率分布表,求,處的數值;(2)在所給的坐標系中畫出區間80,150上的頻率分布直方圖;(3)從整體中任意抽取3個個體,成績落在105,120中的個體數目為,求的分布列和數學期望練9. (2011·廣東廣州)某校高三(1)班的一次數學測試成績的莖葉圖如圖所示和頻率分布直方圖如圖所示,都受到不同程度的破壞,但可見部分如下,據此回答如下問題:(1)求全班人數;(2)求分數在80,90)之間的人數;并計算頻率分布直方圖中80,90)間的矩形的高;(3)若要從分數在80,100之間的試卷中任取兩份分析學
15、生失分情況,在抽取的試卷中,求至少有一份分數在90,100之間的概率三統計案例(一)變量間的相關關系(1)散點圖直觀反映了兩變量的成對觀察值之間存在的某種關系,利用散點圖可以初步判斷兩個變量之間是否線性相關如果散點圖中點的分布從整體上看大致在一條直線的附近,我們說變量x和y具有線性相關關系(2)最小二乘法求回歸直線的方程 :設線性回歸方程為x.其中,是回歸直線的斜率,是截距注意:回歸直線一定經過樣本的中心點(,),據此性質可以解決有關的計算問題3回歸分析 (1)相關系數r,叫做相關系數(2)相關性檢驗的步驟作統計假設假設x與y不具有線性相關關系根據小概率0.05與n2在附表中查出r的一個臨界值
16、r0.05;根據樣本相關系數計算公式算出r的值;作統計推斷如果|r|>r0.05,表明有95%的把握認為x與y之間具有線性相關關系;如果|r|r0.05,則沒有理由拒絕原來的假設(二)獨立性檢驗1.若變量的不同“值”表示個體所屬的不同類別,則這些變量稱為分類變量2.兩個分類變量X與Y的頻數表,稱作2×2列聯表. y1y2合計x1n11n12n1x2n21n22n2合計n1n2n在2×2列聯表中,隨機變量2,其中n為樣本容量,2的取值范圍可以判斷“X與Y有關系”的可信度,如表,用它的大小可以決定是否拒絕原來的統計假設H0 如果算出的2值較大,就拒絕H0,也就是
17、拒絕“事件A與B無關”,從而就認為它們是有關的.3.兩個臨界值:3.841與6.635經過對2統計量分布的研究,已經得到了兩個臨界值:3.841與6.635 .當根據具體的數據算出的23.841 時,有95%的把握說事件A與B有關;當26.635 時,有99%的把握說事件A與B有關;當23.841 時,認為事件A與B是無關的.(其中頻數n11、n12、n21、n22都不小于5)P(2k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828練10.(2011
18、·山東理,7)某產品的廣告費用x與銷售額y的統計數據如下表 廣告費用x(萬元)4235銷售額y(萬元)49263954根據上表可得回歸方程x中的為9.4,據此模型預報廣告費用為6萬元時銷售額大約為()A63.6萬元 B65.5萬元 C67.7萬元 D72.0萬元練11. (2011·湖南理,4)通過隨機詢問110名性別不同的大學生是否愛好某項運動,得到如下的列聯表:男女總計愛好402060不愛好203050總計6050110由K2算得, K27.8.附表:P(K2k)0.0500.0100.001k3.8416.63510.828參照附表,得到的正確結論是()A在犯錯誤的概
19、率不超過0.1%的前提下,認為“愛好該項運動與性別有關”B在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關”C有99%以上的把握認為“愛好該項運動與性別有關”D有99%以上的把握認為“愛好該項運動與性別無關”練12.(2011·廣東理,13)某數學老師身高176cm,他爺爺、父親和兒子的身高分別是173cm、170cm和182cm.因兒子的身高與父親的身高有關,該老師用線性回歸分析的方法預測他孫子的身高為_cm.練13.(2011·鄭州二次質檢)某中學對高二甲、乙兩個同類班級進行“加強語文閱讀理解訓練對提高數學應用題得分率作用”的試驗,其中甲班為試驗班(加
20、強語文閱讀理解訓練),乙班為對比班(常規教學,無額外訓練),在試驗前的測試中,甲、乙兩班學生在數學應用題上的得分率基本一致,試驗結束后,統計幾次數學應用題測試的平均成績(均取整數)如下表所示:60分以下6170分7180分8190分91100分甲班(人數)36111812乙班(人數)48131510現規定平均成績在80分以上(不含80分)的為優秀(1)試分析估計兩個班級的優秀率;(2)由以上統計數據填寫下面2×2列聯表,并問是否有75%的把握認為“加強語文閱讀理解訓練對提高數學應用題得分率”有幫助.優秀人數非優秀人數合計甲班乙班合計參考公式及數據:K2,P(K2k0)0.500.40
21、0.250.150.10k00.4550.7081.3232.0722.706P(K2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828練14.為了比較注射A,B兩種藥物后產生的皮膚皰疹的面積,選200只家兔做實驗,將這200只家兔隨機地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.下表1和表2分別是注射藥物A和藥物B后的試驗結果(皰疹面積單位:mm2)表1:注射藥物A后皮膚皰疹面積的頻數分布表皰疹面積60,65)65,70)70,75)75,80)頻數30402010表2:注射藥物B后皮膚皰疹面積的頻數分布表皰疹面積60,65)65,70)70,75)75,80)80,85)頻數1025203015(1) 完成下面頻率分布直方圖,并比較注射兩種藥物后皰疹面積的中位數大小; (2)完成下面2×2列聯表,并回答能否有99.9%的把握認為“注射藥物A后的皰疹面積與注射藥物B后
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 呼吸科護理創新小發明
- 廈門城市職業學院《生藥學實驗》2023-2024學年第一學期期末試卷
- 湖南省邵陽縣重點名校2025屆初三全真數學試題模擬試卷(17)含解析
- 內蒙古財經大學《紡織品檢驗學》2023-2024學年第二學期期末試卷
- 錫林郭勒職業學院《法語視聽說》2023-2024學年第二學期期末試卷
- 天津市和平區第二十中學2024-2025學年第二學期教學質量檢測試題初三數學試題(二模)含解析
- 塔里木職業技術學院《營養健康與社會》2023-2024學年第二學期期末試卷
- 臨安市2024-2025學年五年級數學第二學期期末調研試題含答案
- 平涼職業技術學院《建筑力學2》2023-2024學年第二學期期末試卷
- 寧夏回族自治區銀川市興慶區銀川一中2025年高三下第二次段考試化學試題(理)試題含解析
- 藥事管理法律法規相關知識培訓
- 地毯織造技藝(北京宮毯織造技藝)
- 第4章-選區激光熔化工藝及材料課件
- 2023屆高考寫作指導:“尋找溫暖”與“成為燈火”課件
- 2022年上海市工業技術學校招聘考試真題
- 長期護理保險技能比賽理論試題庫300題(含各題型)
- 二重積分的概念與性質演示文稿
- 醫院雙重預防機制建設工作完成情況
- 大學生勞動教育通論知到章節答案智慧樹2023年大連海洋大學
- 2003高教社杯全國大學生數學建模競賽B題競賽參考答案
- AB股公司章程(同股不同權)
評論
0/150
提交評論