




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、板塊三.莖葉圖知識內容一隨機抽樣1隨機抽樣:滿足每個個體被抽到的機會是均等的抽樣,共有三種經常采用的隨機抽樣方法:簡單隨機抽樣:從元素個數為的總體中不放回地抽取容量為的樣本,如果每一次抽取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機抽樣抽出辦法:抽簽法:用紙片或小球分別標號后抽簽的方法隨機數表法:隨機數表是使用計算器或計算機的應用程序生成隨機數的功能生成的一張數表表中每一位置出現各個數字的可能性相同隨機數表法是對樣本進行編號后,按照一定的規律從隨機數表中讀數,并取出相應的樣本的方法簡單隨機抽樣是最簡單、最基本的抽樣方法系統抽樣:將總體分成均衡的若干部分,然后按照預先制定的規
2、則,從每一部分抽取一個個體,得到所需要的樣本的抽樣方法抽出辦法:從元素個數為的總體中抽取容量為的樣本,如果總體容量能被樣本容量整除,設,先對總體進行編號,號碼從到,再從數字到中隨機抽取一個數作為起始數,然后順次抽取第個數,這樣就得到容量為的樣本如果總體容量不能被樣本容量整除,可隨機地從總體中剔除余數,然后再按系統抽樣方法進行抽樣系統抽樣適用于大規模的抽樣調查,由于抽樣間隔相等,又被稱為等距抽樣分層抽樣:當總體有明顯差別的幾部分組成時,要反映總體情況,常采用分層抽樣,使總體中各個個體按某種特征分成若干個互不重疊的幾部分,每一部分叫做層,在各層中按層在總體中所占比例進行簡單隨機抽樣,這種抽樣方法叫
3、做分層抽樣分層抽樣的樣本具有較強的代表性,而且各層抽樣時,可靈活選用不同的抽樣方法,應用廣泛2簡單隨機抽樣必須具備下列特點:簡單隨機抽樣要求被抽取的樣本的總體個數是有限的簡單隨機樣本數小于等于樣本總體的個數簡單隨機樣本是從總體中逐個抽取的簡單隨機抽樣是一種不放回的抽樣簡單隨機抽樣的每個個體入樣的可能性均為3系統抽樣時,當總體個數恰好是樣本容量的整數倍時,取;若不是整數時,先從總體中隨機地剔除幾個個體,使得總體中剩余的個體數能被樣本容量整除因為每個個體被剔除的機會相等,因而整個抽樣過程中每個個體被抽取的機會仍然相等,為二頻率直方圖列出樣本數據的頻率分布表和頻率分布直方圖的步驟:計算極差:找出數據
4、的最大值與最小值,計算它們的差;決定組距與組數:取組距,用決定組數;決定分點:決定起點,進行分組;列頻率分布直方圖:對落入各小組的數據累計,算出各小數的頻數,除以樣本容量,得到各小組的頻率繪制頻率分布直方圖:以數據的值為橫坐標,以的值為縱坐標繪制直方圖,知小長方形的面積組距×頻率頻率分布折線圖:將頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩端點沒有實際意義總體密度曲線:樣本容量不斷增大時,所分組數不斷增加,分組的組距不斷縮小,頻率分布直方圖可以用一條光滑曲線來描繪,這條光滑曲線就叫做總體密度曲線總體密度曲線精確地反
5、映了一個總體在各個區域內取值的規律三莖葉圖制作莖葉圖的步驟:將數據分為“莖”、“葉”兩部分;將最大莖與最小莖之間的數字按大小順序排成一列,并畫上豎線作為分隔線;將各個數據的“葉”在分界線的一側對應莖處同行列出 四統計數據的數字特征用樣本平均數估計總體平均數;用樣本標準差估計總體標準差數據的離散程序可以用極差、方差或標準差來描述極差又叫全距,是一組數據的最大值和最小值之差,反映一組數據的變動幅度;樣本方差描述了一組數據平均數波動的大小,樣本的標準差是方差的算術平方根一般地,設樣本的元素為樣本的平均數為,定義樣本方差為,樣本標準差簡化公式:五獨立性檢驗1兩個變量之間的關系;常見的有兩類:一類是確定
6、性的函數關系;另一類是變量間存在關系,但又不具備函數關系所要求的確定性,它們的關系是帶有一定隨機性的當一個變量取值一定時,另一個變量的取值帶有一定隨機性的兩個變量之間的關系叫做相關關系2散點圖:將樣本中的個數據點描在平面直角坐標系中,就得到了散點圖散點圖形象地反映了各個數據的密切程度,根據散點圖的分布趨勢可以直觀地判斷分析兩個變量的關系3如果當一個變量的值變大時,另一個變量的值也在變大,則這種相關稱為正相關;此時,散點圖中的點在從左下角到右上角的區域反之,一個變量的值變大時,另一個變量的值由大變小,這種相關稱為負相關此時,散點圖中的點在從左上角到右下角的區域散點圖可以判斷兩個變量之間有沒有相關
7、關系4統計假設:如果事件與獨立,這時應該有,用字母表示此式,即,稱之為統計假設5(讀作“卡方”)統計量:統計學中有一個非常有用的統計量,它的表達式為,用它的大小可以用來決定是否拒絕原來的統計假設如果的值較大,就拒絕,即認為與是有關的統計量的兩個臨界值:、;當時,有的把握說事件與有關;當時,有的把握說事件與有關;當時,認為事件與是無關的獨立性檢驗的基本思想與反證法類似,由結論不成立時推出有利于結論成立的小概率事件發生,而小概率事件在一次試驗中通常是不會發生的,所以認為結論在很大程度上是成立的1獨立性檢驗的步驟:統計假設:;列出聯表;計算統計量;查對臨界值表,作出判斷2幾個臨界值:聯表的獨立性檢驗
8、:如果對于某個群體有兩種狀態,對于每種狀態又有兩個情況,這樣排成一張的表,如下:狀態狀態合計狀態狀態如果有調查得來的四個數據,并希望根據這樣的個數據來檢驗上述的兩種狀態與是否有關,就稱之為聯表的獨立性檢驗六回歸分析1回歸分析:對于具有相關關系的兩個變量進行統計分析的方法叫做回歸分析,即回歸分析就是尋找相關關系中這種非確定關系的某種確定性回歸直線:如果散點圖中的各點都大致分布在一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線2最小二乘法:記回歸直線方程為:,稱為變量對變量的回歸直線方程,其中叫做回歸系數是為了區分的實際值,當取值時,變量的相應觀察值為,而直線上對應于的縱坐標
9、是設的一組觀察值為,且回歸直線方程為,當取值時,的相應觀察值為,差刻畫了實際觀察值與回歸直線上相應點的縱坐標之間的偏離程度,稱這些值為離差我們希望這個離差構成的總離差越小越好,這樣才能使所找的直線很貼近已知點記,回歸直線就是所有直線中取最小值的那條這種使“離差平方和為最小”的方法,叫做最小二乘法用最小二乘法求回歸系數有如下的公式:,其中上方加“”,表示是由觀察值按最小二乘法求得的回歸系數3線性回歸模型:將用于估計值的線性函數作為確定性函數;的實際值與估計值之間的誤差記為,稱之為隨機誤差;將稱為線性回歸模型產生隨機誤差的主要原因有:所用的確定性函數不恰當即模型近似引起的誤差;忽略了某些因素的影響
10、,通常這些影響都比較小;由于測量工具等原因,存在觀測誤差4線性回歸系數的最佳估計值:利用最小二乘法可以得到的計算公式為,其中,由此得到的直線就稱為回歸直線,此直線方程即為線性回歸方程其中,分別為,的估計值,稱為回歸截距,稱為回歸系數,稱為回歸值5相關系數: 6相關系數的性質:;越接近于1,的線性相關程度越強;越接近于0,的線性相關程度越弱可見,一條回歸直線有多大的預測功能,和變量間的相關系數密切相關7轉化思想:根據專業知識或散點圖,對某些特殊的非線性關系,選擇適當的變量代換,把非線性方程轉化為線性回歸方程,從而確定未知參數8一些備案回歸(regression)一詞的來歷:“回歸”這個詞英國統計
11、學家Francils Galton提出來的1889年,他在研究祖先與后代的身高之間的關系時發現,身材較高的父母,他們的孩子也較高,但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,但這些孩子的平均身高卻比他們父母的平均身高高Galton把這種后代的身高向中間值靠近的趨勢稱為“回歸現象”后來,人們把由一個變量的變化去推測另一個變量的變化的方法稱為回歸分析回歸系數的推導過程:,把上式看成的二次函數,的系數,因此當時取最小值同理,把的展開式按的降冪排列,看成的二次函數,當時取最小值解得:,其中,是樣本平均數9 對相關系數進行相關性檢驗的步驟:提出統計假設:變量不具有線
12、性相關關系;如果以的把握作出推斷,那么可以根據與(是樣本容量)在相關性檢驗的臨界值表中查出一個的臨界值(其中稱為檢驗水平);計算樣本相關系數;作出統計推斷:若,則否定,表明有的把握認為變量與之間具有線性相關關系;若,則沒有理由拒絕,即就目前數據而言,沒有充分理由認為變量與之間具有線性相關關系說明:對相關系數進行顯著性檢驗,一般取檢驗水平,即可靠程度為這里的指的是線性相關系數,的絕對值很小,只是說明線性相關程度低,不一定不相關,可能是非線性相關的某種關系這里的是對抽樣數據而言的有時即使,兩者也不一定是線性相關的故在統計分析時,不能就數據論數據,要結合實際情況進行合理解釋典例分析題型一 莖葉圖【例
13、1】 (2010豐臺二模)甲、乙兩名運動員的次測試成績如下圖所示設分別表示甲、乙兩名運動員測試成績的標準差,分別表示甲、乙兩名運動員測試成績的平均數,則有( )A, B, C, D,【例2】 (2010宣武二模)隨機抽取某中學甲,乙兩班各10名同學,測量他們的身高(單位:cm),獲得身高數據的莖葉圖如圖 ,則下列關于甲,乙兩班這10名同學身高的結論正確的是 ( )A 甲班同學身高的方差較大B 甲班同學身高的平均值較大C 甲班同學身高的中位數較大D 甲班同學身高在175以上的人數較多 【例3】 (2010天津高考) 甲、乙兩人在10天中每天加工零件的個數用莖葉圖表示如下圖,中間一列的數字表示零件
14、個數的十位數,兩邊的數字表示零件個數的個位數,則這10天甲、乙兩人日加工零件的平均數分別為 和 【例4】 右圖是某賽季甲、乙兩名籃球運動員每場比賽得分的莖葉圖,則甲、乙兩人這幾場比賽得分的中位數之和是( )A B C D【例5】 在某五場籃球比賽中,甲、乙兩名運動員得分的莖葉圖如右下列說法正確的是A在這五場比賽中,甲的平均得分比乙好,且甲比乙穩定B在這五場比賽中,甲的平均得分比乙好,但乙比甲穩定C在這五場比賽中,乙的平均得分比甲好,且乙比甲穩定D在這五場比賽中,乙的平均得分比甲好,但甲比乙穩定【例6】 (2009年福建12)作品898 9 92 3 2 1 4某校開展“愛我海西、愛我家鄉”攝影比賽,位評委為參賽作品給出的分數如莖葉圖所示,記分員在去掉一個最高分和一個最低分后,算得平均分為,復核員在復核時,發現有一個數字(莖葉圖中的)無法看清若記分員計算無誤,則數字應該是 【例7】 (2010東城一模)在一次數學統考后,某班隨機抽取名同學的成績進行樣本分析,獲得成績數據的莖葉圖如下計算樣本的平均成績及方差;在這個樣本中,現從不低于分的成績中隨機抽取個,求分的成績被抽中的概率【例8】 某班甲、乙兩學生的高考備考成績如下
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 襄陽職業技術學院《英語:聽力》2023-2024學年第二學期期末試卷
- 西安建筑科技大學《鏡前表演及實踐》2023-2024學年第二學期期末試卷
- 浙江省杭州下城區重點達標名校2024-2025學年初三1月份階段模擬測試語文試題試卷含解析
- 江西航空職業技術學院《Python語言程序設計Ⅱ》2023-2024學年第二學期期末試卷
- 南充職業技術學院《中國地理(二)》2023-2024學年第二學期期末試卷
- 寧夏大學《孫冶方經濟科學獎與中國經濟發展》2023-2024學年第二學期期末試卷
- 昆山杜克大學《日語筆譯》2023-2024學年第二學期期末試卷
- 重慶工貿職業技術學院《生物工程專業實驗(一)》2023-2024學年第二學期期末試卷
- 吉林省松原市乾安縣七中2025屆普通高中畢業班3月質量檢查英語試題含解析
- 浙江省紹興實驗學校2025年初三英語試題第三次質量檢測試題試卷含答案
- 應急物資倉庫管理制度(4篇)
- 2024-2030年中國高壓變頻器行業現狀分析及前景趨勢調研報告
- 2024年度中國船員心理健康報告
- 《地源熱泵介紹》課件
- 5以內數的守恒-課件
- 2024年第四屆全國工業設計職業技能大賽決賽包裝設計師理論考試題庫(含答案)
- 2023年高考真題-政治(福建卷) 含答案
- 幼兒園小班認識小動物課件
- 熱敏灸課件完整版本
- 體育概論(第二版)課件第五章體育手段
- 計算機組裝與維護
評論
0/150
提交評論