




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統計學案一.隨機抽樣(一)總體、個體、樣本把所考察對象的某一數值指標的全體構成的集合看成總體,構成總體的每一個元素為個體.從總體中隨機抽取若干個個體構成的集合叫做總體的一個樣本.(二)抽樣方法1 .簡單隨機抽樣(1)定義:設一個總體含有 N個個體,從中不放回地抽取 n個個體作為樣本(nWN),如果每 次抽取時,總體內的各個個體被抽到的機會都相等,稱這種抽樣方法為簡單隨機抽樣.(2)簡單隨機抽樣的特點如下:它要求被抽取樣本的總體中個體數有限.它是從總體中逐個地進行抽取.它是一種不放回抽樣.它每一次抽取時,總體中的各個個體有相同的可能性被抽到.(3)常用的簡單隨機抽樣方法抽簽法先將總體中的所有 N
2、個個體編號,并把號碼寫在形狀、大小相同的號簽上,然后將這些號簽放在同一個容器里,攪拌均勻.抽簽時,每次從中抽出1個號簽,連續抽取n次,就得到一個容量為n的樣本.抽簽法的優點是簡單易行.缺點是當總體的容量非常大時,費時、費力又不方便.況且,如果號簽攪拌得不均勻,可能導致抽樣的不公平.隨機數表法a.隨機數表:隨機數表是由0,1,2,,9這10個數字組成的數表,并且表中的每一位置出現各個數字的可能性相同.b.用隨機數表抽樣的步驟:第一步:將總體中的個體編號.為了保證抽取樣本有很好的 代表性,編號時位數要相同.第二步:選定開始的數字.為了保證所選定數字的隨機性,應在面對隨機數表之前就指出開始數字的縱橫
3、位置.第三步:獲取樣本號碼.隨機確定一個讀數方向,讀數的方向可以向右,也可以向左、向上、向下等,重復的號碼跳過.2 .系統抽樣(1)定義:當總體元素個數很大時,可將總體分成均衡的若干部分,然后按照預先制定的規則,從每一部分抽取一個個體得到所需要的樣本,這種抽樣方法叫做系統抽樣,也稱作等距抽樣.(2)系統抽樣的步驟:編號.采用隨機的方式將總體中的個體編號.分段.先確定分段的間隔k.當*N為總體中的個體數,n為樣本容量)是整數時,k = N;當N不是整數時,通過從總體中隨機剔除 n n一些個體使剩下的總體中個體總數 N'能被n整除,這時k= %.確定起始個體編號.在 第1段用簡單隨機抽樣確
4、定起始的個體編號 S.按照事先確定的規則抽取樣本. 通常是將 S加上間隔k,得到第2個個體編號S+k,再將(S+ k)加上k,得到第3個個體編號S+ 2k, 這樣繼續下去,獲得容量為 n的樣本.其樣本編號依次是: S, S+ k, S+ 2k,,S+(n 1)k.3 .分層抽樣(1)定義:當總體由有明顯差別的幾部分組成時,按某種特征在抽樣時將總體中的各個個體分成互不交叉的層,然后按照各層在總體中所占的比例,從各層獨立地抽取一定數量的個 體合在一起作為樣本,這種抽樣的方法叫做分層抽樣.分層抽樣使用的前提是總體可以分 層,層與層之間有明顯區別,而層內個體間差異較小,每層中所抽取的個體數可按各層個
5、體數在總體中所占比例抽取.分層抽樣要求對總體的內容有一定的了解,明確分層的界限 和數目,分層要恰當.各層抽取時采用簡單隨機抽樣或系統抽樣.(2)分層抽樣的步驟分層;按比例確定每層抽取個體的個數;各層抽樣(方法可以不同);匯合成樣本.分層抽樣的優點分層抽樣充分利用了己知信息,充分考慮了保持樣本結構與總體結構的一致性.使樣本具 有較好的代表性,而且在各層抽樣時,可以根據具體情況采取不同的抽樣方法,因此分層 抽樣在實踐中有著非常廣泛的應用.6.三種抽樣方法的比較類別共同點各自特點相互聯系適用范圍笥單隨機抽 羊抽樣過程中每個 個體被抽取的機 會均等從總體中逐個抽 取總體中的個體數較少,我樣將總體均勻分
6、成 幾部分,按事先確 定的規則在各部 分抽取在起始部分 抽樣時采用 簡單隨機抽 樣總體中的個體數較多樣將總體分成幾層, 分層進行抽取各層抽樣時 采用簡單隨 機抽樣或系 統抽樣總體由差異明 顯的幾部分組 成練1.(2010安徽文,14)某地有居民100 000戶,其中普通家庭99 000戶,高收入家庭1 000 戶.從普遍家庭中以簡單隨機抽樣方式抽取990戶,從高收入家庭中以簡單隨機抽樣方式抽取100戶進行調查,發現共有 120戶家庭擁有3套或3套以上住房,其中普通家庭50戶,高收入家庭70戶.依據這些數據并結合所掌握的統計知識,你認為該地擁有3套或3套以上住房的家庭所占比例的合理估計是 .練2
7、.將一個總體為100的個體編號為0, 1, 2, 3,99,并依次將其分為10個小組,組號為0,1,9,要用系統抽樣的方法抽取一個容量為10的樣本,規定如果在第 0組(號碼為09)隨機抽取的號碼為 2,則所抽取的10個號碼為 .練3. 2010年高考湖北卷將參加夏令營的600名學生編號為:001, 002,,600.采用系統抽樣方法抽取一個容量為50的樣本,且隨機抽得的號碼為003.這600名學生分住在三個營區,從 001到300在第I營區,從 301到495在第H營區,從 496到600在第出營 區,三個營區被抽中的人數依次為()A.26 , 16, 8B.25, 17, 8C.25,練4.
8、一個社會調查機構就某地居民的月收入調查了16, 9D.24, 17, 9A. 25B. 30C. 35D. 4010000人,并根據所得數據畫了樣本 的頻率分布直方圖(如下圖),為了分 析居民的收入與年齡、學歷、職業等 方面的關系,要從這10000人中再用 分層抽樣方法抽出 100人作進一步 調查,則在(2500,3000)(元)月收入段 應抽出的人數為()二.用樣本估計總體1 .編制頻率分布直方圖的步驟如下:求極差:極差是一組數據的最大值與最小值的差.決定組距和組數:當樣本容量不超過100時,常分成512組.組距=旅.將數據分組:通常對組內數值所在區間取左閉右開區間,最后一組取閉區間,也可以
9、將樣本數據多取一位小數分組;列頻率分布表:登記頻數,計算頻率,列出頻率分布表.將樣本數據分成若干小組,每個小組內的樣本個數稱作頻數,頻數與樣本容量的比值叫做這一小組的頻率.頻率反映數據在每組所占比例的大小.繪制頻率分布直方圖:把橫軸分成若干段,每一段對應一個組距,然后以線段為底作一矩形,它的高等于該組的 磊,這樣得出一系列的矩形,每個矩形的面積恰好是該組上的頻率.這些矩形就構成了頻率分布直方圖.在頻率分布直方圖中,縱軸表示“頻率/組距”,數據落在各小組內的頻率用小矩形的面積表示,各小矩形的面積總和等于1.2 .頻率分布折線圖(1)把頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分
10、布折線圖.(2)總體密度曲線如果樣本容量不斷增大,分組的組距不斷縮小,則頻率分布直方圖實際上越來越接近于總 體的分布,它可以用一條光滑曲線y=f(x)來描繪,這條光滑的曲線就叫總體密度曲線.3 .莖葉圖:統計中還有一種被用來表示數據的圖叫做莖葉圖.莖是指中間的一列數,葉 是從莖的旁邊生長出來的數.在樣本數據較少、較為集中,且位數不多時,用莖葉圖表示 數據的效果較好,它較好的保留了原始數據信息,方便記錄與表示,但當樣本數據較多時,莖葉圖就不太方便.4 .平均數、中位數和眾數(1)平均數:一組數據的總和除以數據的個數所得的商就是平均數.(2)中位數:如果將一組數據按從小到大的順序依次排列,當數據有
11、奇數個時,處在最中間 的一個數是這組數據的中位數;當數據有偶數個時,處在最中間兩個數的平均數,是這組 數據的中位數.(3)眾數:出現次數最多的數 (若有兩個或幾個數據出現得最多,且出現的次數一樣,這些 數據都是這組數據的眾數;若一組數據中,每個數據出現的次數一樣多,則認為這組數據 沒有眾數).(4)在頻率分布直方圖中, 最高小長方形的中點所對應的數據值即為這組數據的眾數.而在頻率分布直方圖上的中位數左右兩側的直方圖面積應該相等,因而可以估計其近似值.平 均數的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和.5 .方差、標準差1222設樣本數據為X1,X2,,Xn樣本平
12、均數為 X,則5=彳(*1 x) +(X2 x) + (xn一 o 1o oo oX)2 =n( X12+X22+ Xn2) - n X 2叫做這組數據的方差,用來衡量這組數據的波動大小,一組數據方差越大,說明這組數據波動越大.把樣本方差的算術平方根叫做這組數據的樣本標準差.數據的離散程度可以通過極差、方差或標準差來描述,其中極差反映了一組數據變化的最大幅度.方差則反映一組數據圍繞平均數波動的大小.練5. (2011青島)一組數據20,30,40,50,50,60,70,80的平均數、中位數、眾數的大小關系是A.平均數 中位數眾數B.平均數中位數眾數C.中位數 眾數平均數D.眾數=中位數=平均
13、數練6 .(2011安徽名校聯考一)關于統計數據的分析,有以下幾個結論:一組數不可能有兩個眾數;將一組數據中的每個數據都減去同一個數后,方差沒有變化;調查劇院中觀眾觀看感受時,從50排(每排人數相同)中任意抽取一排的人進行調查,屬于分層抽樣;一組數據的方差一定是正數;如圖是隨機抽取的200輛汽車通過某一段公路時的時速分布直方圖,根據這個直方圖,可以得到時速在50,60)的汽車大約是60輛.則這5種說法中錯誤的個數是()A. 2 B. 3C. 4D. 5練7. (2010 山東文)在某項體育比賽中,七位裁判為一選手打出的分數如下:90 89 90 95 93 94 93去掉一個最高分和一個最低分
14、后,所剩數據的平均值和方差分別為()A. 92,2B. 92,2.8 C , 93,2D. 93,2.8練8.(2010合肥工大附中)某市共有5000名高三學生參加聯考,為了了解這些學生對數學知識的掌握情況,現從中隨機抽出若干名學生在這次測試中的數學成績,制成如下頻率分 布表:分組頻數頻率80,90)90,100)0.050100,110)0.200110,120)360.300120,130)0.275130,140)12140,1500.050合計頻率. 面0舊30 00.027 501)25 00.022 50.020 00.017 5, 0.015 0 0,012 5 (kOK) 0
15、-0,007 5 - 0.005 00.002 5O 90 100 110 120 130 140 150 成績(分)(1)根據上面的頻率分布表,求,處的數值;(2)在所給的坐標系中畫出區間80,150上的頻率分布直方圖;(3)從整體中任意抽取 3個個體,成績落在105,120中的個體數目為 E,求E的分布列 和數學期望.練9. (2011廣東廣州)某校高三(1)班的一次數學測試成績的莖葉圖如圖所示和頻率分布直 方圖如圖所示,都受到不同程度的破壞,但可見部分如下,據此回答如下問題:(1)求全班人數;(2)求分數在80,90)之間的人數;并計算頻率分布直方圖中80,90)間的矩形的高;(3)若要
16、從分數在80,100之間的試卷中任取兩份分析學生失分情況,在抽取的試卷中,求至少有一份分數在90,100之間的概率.三.統計案例(一)變量間的相關關系(1)散點圖直觀反映了兩變量的成對觀察值之間存在的某種關系,利用散點圖可以初步判斷兩個變量之間是否線性相關.如果散點圖中點的分布從整體上看大致在一條直線的附近, 我們說變量x和y具有線性相關關系. 人人人(2)最小二乘法求回歸直線的方程:設線性回歸方程為y = bx+a.一. A 八一其中,b是回歸直線的斜率,a是截距.xi x y yA b=n2Xi X 2i = 1xiyi n x y i= 1n 4 4x2 n x2i=1注意:回歸直線一定
17、經過樣本的中心點a= y b x 一 (x, y),據此性質可以解決有關的計算問題.3.回歸分析ny yxi xi=1(2)相關性檢驗的步驟作統計假設.假設x與y不具有線性相關關系.根據小概率0.05與n 2在附表中查出r的一個臨界值0.05 ;根據樣本相關系數計算公式算出r的值;作統計推斷.如果|r|>r0.05,表明有95%的把握認為x與y之間具有線性相關關系;如果 |r|<r0.05,則沒有理由拒絕原來的假設.(二)獨立性檢驗1.若變量的不同“值”表示個體所屬的不同類別,則這些變量稱為分類變量.2.兩個分類變量 X與Y的頻數表,稱作2X2列聯表.y1y2合計K1nnn12n1
18、+K2n21n22n2+合計n+1n+2n在2X2列聯表中,隨機變量f=nniin22-ni2n21 2,其中n為樣本容量,聲的取值范ni+ n2+ n+1 n+2圍可以判斷“ X與Y有關系”的可信度,如表,用它的大小可以決定是否拒絕原來的統計 假設H)如果算出的 卡值較大,就拒絕H),也就是拒絕事彳A與B無關",從而就認為 它們是有關的.3.兩個臨界值:3.841與6.635經過對X2統計量分布的研究,已經得到了兩個臨界值:3.841與6.635.當根據具體的數據算出的x2>3.841時,有95%勺把握說事件A與B有關;當x2>6.635練10.(2011山東理,7)某
19、產品的廣告費用x與銷售額y的統計數據如下表時,有99%勺把握說事件 A與B有關;當X2W3.841時,認為事件 A與B是無關的.(其中頻數 nn、m2、01、n22都不小于5)P( X 2>k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828第9頁A. 63.6萬元B. 65.5萬元 C. 67.7萬元D. 72.0萬元練11.(2011湖南理,4)通過隨機詢問110名性別不同的大學生是否愛好某項運動, 得到如下的列聯表:由K2=男女總計愛好40
20、2060不愛好203050總計60501102n ad bca+ b c+ d a+ c b+ d算得,K2 =110X 40X30 20X20 260X 50X 60X 507.8.附表:P(K2>k)0.0500.0100.001k3.8416.63510.828參照附表,得到的正確結論是 ()A.在犯錯誤的概率不超過 0.1%的前提下,認為“愛好該項運動與性別有關”B.在犯錯誤的概率不超過 0.1%的前提下,認為“愛好該項運動與性別無關”C.有99%以上的把握認為“愛好該項運動與性別有關”D.有99%以上的把握認為“愛好該項運動與性別無關”練12.(2011廣東理,13)某數學老師
21、身高176cm,他爺爺、父親和兒子的身高分別是 173cm、170cm和182cm.因兒子的身高與父親的身高有關,該老師用線性回歸分析的方法預測他孫子的身高為 cm.練13.(2011鄭州二次質檢)某中學對高二甲、乙兩個同類班級進行“加強語文閱讀理解訓練對提高數學應用題得分率作用”的試驗,其中甲班為試驗班(加強語文閱讀理解訓練),乙班為對比班(常規教學,無額外訓練),在試驗前的測試中,甲、乙兩班學生在數學 應用題上的得分率基本一致,試驗結束后,統計幾次數學應用題測試的平均成績(均取整數)如下表所示:60分以下6170分7180分8190分91100分甲班(人數)36111812乙班(人數)48
22、131510現規定平均成績在 80分以上(不含80分)的為優秀.(1)試分析估計兩個班級的優秀率;(2)由以上統計數據填寫下面2X2列聯表,并問是否有 75%的把握認為“加強語文閱讀理解訓練對提高數學應用題得分率”有幫助優秀人數非優秀人數合計甲班乙班合計2參考公式及數據:K2= a c +d+c b ,P(K2> k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2> k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828練14.為了比較注射 A, B兩種藥物后產生的皮膚
23、皰疹的面積,選200只家兔做實驗,將這200只家兔隨機地分成兩組,每組100只,其中一組注射藥物 A,另一組注射藥物 B.下表1和表2分別是注射藥物 A和藥物B后的試驗結果.(皰疹面積單位:mm2)表1:注射藥物A后皮膚皰疹面積的頻數分布表庖疹面積60,65)65,70)70,75)75,80)頻數30402010表2:注射藥物B后皮膚皰疹面積的頻數分布表庖疹面積60,65)65,70)70,75)75,80)80,85)頻數1025203015(1)完成下面頻率分布直方圖,并比較注射兩種藥物后皰疹面積的中位數大小;頻率0. 08Q. 07 0. 06 0. 05 0, 04 0. 03 0.
24、 020. 01I1 I-I* 1>1t»|i)I-i中1 1«4«4 耳h J m : a q: 4 n.P/tQ11i .41» *11R1- - - nJV - . 1 1 1*P192i16065 70 7580 85 皰掙面枳圖1注射藥物A后皮膚皰疥面枳的頻率分布直方圖病Q. 08 0. 97 0. 06 氏05Q 04Q. 03D, 02 0, 01111 1119 1|一 一-一1F' , 1.1 V , i*JIft H* 1r * W* 一FII6065 70 75£0 85 皰爰面枳圖2沆射藥物R后皮膚皰勢面積的頻率分布直方圖(2)完成下面2X2列聯表,并回答能否有 99.9%的把握認為“注射藥物 A后的皰疹面積與 注射藥物B后的皰疹面積有差異”.皰疹面積小于70mm2皰疹面積不小于70mm2合計生射藥物Aa =b=生射藥物Bc=d =合計n =2n ad bca+b c+d a + c b + dP(x>k)0.1000.05
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇師范大學科文學院《醫學生職業生涯規劃與發展》2023-2024學年第二學期期末試卷
- 山東勞動職業技術學院《畫法幾何與透視》2023-2024學年第一學期期末試卷
- 新疆喀什地區2025年數學五下期末綜合測試試題含答案
- 內蒙古民族大學《教育活動設計與實施》2023-2024學年第二學期期末試卷
- 浙江省寧波市鄞州中學2025年高考英語試題命題比賽模擬試卷(17)含解析
- 江西省南昌市十所省重點2025年高三第六次診斷考試化學試題試卷含解析
- 南方醫科大學《植物纖維化學實驗》2023-2024學年第二學期期末試卷
- 山西航空職業技術學院《敘事醫學》2023-2024學年第一學期期末試卷
- 山西省長治市上黨聯盟2024-2025學年3月高三教學測試(一)語文試題含解析
- 四川大學《光纖通信原理與系統》2023-2024學年第二學期期末試卷
- 【杜邦分析法企業財務分析文獻綜述】
- 人教版二年級下冊快樂讀書吧課外閱讀測試卷
- 2023年成都市錦江區九年級二診語文試題(含答案)
- 婦產科護理學 簡答題
- 感染性疾病臨床診療規范2021版
- 畢業論文工程量計算與造價控制
- 人機料安全等方面應急措施及處理方法
- 麻醉學課件:多器官功能障礙綜合征
- 2023年中石油職稱英語考試通用選讀
- GB/T 24128-2018塑料塑料防霉劑的防霉效果評估
- GB/T 22864-2009毛巾
評論
0/150
提交評論