概率與統計教學資料_第1頁
概率與統計教學資料_第2頁
概率與統計教學資料_第3頁
概率與統計教學資料_第4頁
概率與統計教學資料_第5頁
已閱讀5頁,還剩118頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

普通高中課程標準實驗教科書選修1-2,2-3概率與統計

簡介人教版高中數學課標教材(A版)

北京師范大學數學科學學院張淑梅zsm1963@.數學1數學3數學4數學2數學5選修2-3選修2-2選修2-1選修1-2選修1-1選修3-5選修3-4選修3-3選修3-2選修3-1選修3-6選修4-10選修4-9…

選修4-3選修4-2選修4-1系列1系列2系列3系列4選修必修必修模塊(各36學時)數學1:集合、函數概念與基本初等函數I(指數函數、對數函數、冪函數);數學2:立體幾何初步、平面解析幾何初步;數學3:算法初步、統計、概率;數學4:基本初等函數II(三角函數)、平面上的向量、三角恒等變換;數學5:解三角形、數列、不等式。必選模塊(各36學時)系列1:文科必選選修1-1:常用邏輯用語(8)、圓錐曲線與方程(12)、導數及其應用(16);選修1-2:統計案例(10)、推理與證明(10)、數系的擴充與復數的引入(4)、框圖(6)。系列2:理科必選選修2-1:常用邏輯用語(8)、圓錐曲線與方程(16)、空間中的向量與立體幾何(12);選修2-2:導數及其應用(24)、推理與證明(8)、數系的擴充與復數的引入(4);選修2-3:計數原理(14)、隨機變量及其分布(12)、統計案例(10)。選修系列3(各18學時)1.數學史選講;2.信息安全與密碼;3.球面上的幾何;4.對稱與群;5.歐拉公式與閉曲面分類;6.三等分角與數域擴充。注:要求修得學分,不作為高考科目;第2、5、6三個專題不再列入備選專題。選修系列4(各18學時)1.幾何證明選講;2.矩陣與變換;3.數列與差分;4.坐標系與參數方程;5.不等式選講;6.初等數論初步;7.優選法與試驗設計初步;8.統籌法與圖論初步;9.風險與決策;10.開關電路與布爾代數。注:要求作為高考科目;第3、8、10三個專題不再列入備選專題,只作為課外讀物出版。統計是研究如何合理收集、整理、分析數據的學科,它可以為人們制訂決策提供依據.概率是研究隨機現象規律的學科,它為人們認識客觀世界提供了重要的思維模式和解決問題的方法,同時為統計學的發展提供了理論基礎。在終極的分析中,一切知識都是歷史在抽象的意義下,一切科學都是數學在理性的基礎上,所有的判斷都是統計學

C.R.勞

統計的思維方法總有一天會像讀和寫的能力一樣,成為一個效率公民的必備能力。威爾斯(H.G.Wells)統計和概率關系概率論和數理統計都是以隨機現象為研究對象。概率論是對隨機現象統計規律演繹的研究,而數理統計是對隨機現象統計規律歸納的研究。雖然兩者在方法上是如此明顯的不同,但是作為一門學科,它們卻是相互滲透、相互聯系的。概率論是統計學的理論和方法的依據,而統計學可視為概率論的一種應用。數學3:統計:隨機抽樣、用樣本估計總體、變量間的相關關系概率:隨機事件的概率、古典概型、幾何概型選修2-3(選修1-2):隨機變量及其分布:離散型隨機變量及其分布列、二項分布及其應用、離散型隨機變量的均值與方差、正態分布回歸分析的基本思想及其初步應用、獨立性檢驗的基本思想及其初步應用選修4-9風險與決策第二章隨機變量及其分布教學目標結構設置與課時分配教材內容的變化與特點教學建議1.教學目標在對具體問題的分析中,理解取有限值的離散型隨機變量及其分布列的概念,認識分布列對于刻畫隨機現象的重要性。通過實例,理解超幾何分布及其導出過程,并能進行簡單的應用。在具體情景中,了解條件概率和兩個事件相互獨立的概念,理解n次獨立重復試驗的模型及二項分布,并能解決一些簡單的實際問題。通過實例,理解隨機變量均值、方差的概念,能計算簡單離散型隨機變量的均值、方差,并解決一些實際問題。通過實際問題,借助直觀,認識正態分布曲線的特點及曲線所表示的意義。1.教學目標教學目標結構設置與課時分配教材內容的變化與特點幾個應注意的問題隨機變量及其分布(12學時)二項分布及其應用︵4課時︶正態分布與小結︵2課時︶離散型隨機變量的均值與方差︵3課時︶離散型隨機變量及其分布列︵3課時︶2.結構設置與課時分配教學目標結構設置與課時分配教材內容的變化與特點幾個應注意的問題3.教材內容的變化與特點知識的引入的變化具體內容的變化知識的應用3.教材內容的變化與特點知識的引入的變化:注重利用學生熟悉的實例和具體情景,以引發學生的學習興趣;通過思考或探究欄目提出問題,以調動學生解決問題的積極性。具體內容的變化知識的應用例如:隨機變量的引入思考:拋一枚骰子,出現的點數可以用數字1,2,3,4,5,6來表示,那么擲一枚硬幣的結果是否也可以用數字來表示呢?正面向上1反面向上0例如:條件概率的引入探究:3張獎券中只有1張能中獎,現分別由3名同學無放回地抽取,問最后一名同學抽到中獎獎券的概率是否比其他同學小?思考:如果已經知道第一名同學沒有抽到中獎獎券,那么最后一名同學抽到中獎獎券的概率又是多少?條件概率例如:離散型隨機變量均值的引入思考:某商場要將單價分別為18元/kg,24元/kg,36元/kg的3種糖果按3:2:1的比例混合銷售,如何對混合糖果定價才合理?

利用高爾頓板引入正態分布的密度曲線更直觀,易于解釋曲線產生的原因。例如:正態分布密度曲線的引入3.教材內容的變化與特點知識的引入的變化具體內容的變化:以取有限值的離散型隨機變量為知識載體;增加了超幾何分布;減少了幾何分布。知識的應用

使學生的注意力更集中在有關隨機變量的均值、方差概念的理解;便于解釋隨機變量取所有值的概率和為1;

不影響二點分布、超幾何分布、二項分布的知識理解,它們都是取有限值的隨機變量。用有限值的離散型隨機變量作為知識載體的目的:例1.2在含有5件次品的100件產品中,任取3件,試求:(1)取到的次品數X的分布列;(2)至少取到1件次品的概率。

貼近學生們的生活。如在模球和撲克牌游戲中,都會出現超幾何分布,由此可提升他們學習概率知識的興趣。幫助理解二項分布模型的背景。

應用廣泛。引入超幾何分布的目的:3.教材內容的變化與特點知識的引入的變化具體內容的變化知識的應用。體現概率統計的應用價值;利用思考、探究等欄目提高學生解決實際問題能力。例1.3

在某年級的聯歡會上設計了一個摸獎游戲,在一個口袋中裝有10個紅球,20個白球,這些球除顏色外完全相同.一次從中摸出5個球,至少摸到3個紅球就中獎.求中獎的概率.例如超幾何分布的應用思考:如果要將這個游戲的中獎概率控制在55%左右,那么應該如何設計中獎規則?例2.2

一張儲蓄卡的密碼共有6位數字,每位數字都可從0

9中任選一個.某人在銀行自動提款機上取錢時,忘記了密碼的最后一位數字。(1)求在他任意按最后一位數字的情況下,不超過2次就按對的概率;(2)如果他記得密碼的最后一位是偶數,求不超過2次就按對的概率。例如條件概率的應用例2.3

某商場推出二次開獎活動,凡購買一定價值的商品可以獲得一張獎券.獎券上有一個兌獎號碼,可以分別參加兩次抽獎方式相同的兌獎活動.如果兩次兌獎活動的中獎概率都是0.05,求兩次抽獎都抽到某一指定號碼的概率;兩次抽獎恰有一次抽到某一指定號碼的概率;兩次抽獎至少有一次抽到某一指定號碼的概率.例如獨立性的應用思考:二次開獎至少中一次獎的概率是不是一次開獎中獎概率的兩倍?為什么?例如二項分布的應用例2.4

某射手每次射擊擊中目標的概率是0.8,求這名射手(1)在10次射擊中,恰有8次擊中目標的概率;(2)在10次射擊中,至少有8次擊中目標的概率.

探究:第一名同學擊中目標靶的環數X1~B(10,0.8),第二名同學擊中目標靶的環數X2=Y+4,其中Y~B(5,0.8),請問派哪名同學參賽?例如二項分布的應用例2.4

某射手每次射擊擊中目標的概率是0.8,求這名射手(1)在10次射擊中,恰有8次擊中目標的概率;(2)在10次射擊中,至少有8次擊中目標的概率.

概率分布中“分布”一詞的意思是:它指明全部概率1是如何分布在(分配到)隨機變量X的各個可能值的。解決實際問題的例子例3

根據氣象預報,某地區近期有小洪水的概率為0.25,有大洪水的概率為0.01。該地區某工地上有一臺大型設備,遇到大洪水時要損失6萬元,遇到小洪水時要損失1萬元。為保護設備,有以下3種方案:方案1:運走設備,搬運費為3800元;方案2:建保護圍墻,建設費為2000.但圍墻只能防小洪水;方案3:不采取措施,希望不發生洪水.試比較哪一種方案好。教學目標結構設置與課時分配教材內容的變化與特點幾個應注意的問題4.幾個應注意的問題在教學過程中要交待引入隨機變量的原因(章引言中);通過與函數的比較加深對隨機變量的理解;通過取有限值的隨機變量為載體,介紹有關隨機變量的概念,重點在概率含義的理解及應用;離散型隨機變量的定義使用了“取值可以一一列出”的描述性語言,主要是為了避免“可數集”概念;e.分布的重要性隨機現象的兩個特性:1.結果的隨機性;2.頻率的穩定性。了解一個隨機現象:1.這個隨機現象可能出現的結果;2.每個結果出現的概率。當給出了隨機變量,了解隨機現象就變成了解這個隨機變量所有可能的取值和取每個值的概率。f.數字特征的重要性數字特征的重要性在于它們有非常明確的含義,反映了隨機變量的重要信息。隨機變量的均值、方差等數字特征都是數,樣本均值和方差等是隨機的。分布可以確定數字特征,數字特征一般無法確定分布。g.注意超幾何分布與二項分布背景的區別:超幾何分布:不放回模出m個球中的紅球個數;二項分布:有放回模出m個球中的紅球個數。h.注意解釋隨機變量與樣本均值(方差)的關系:兩者都表示各自的平均位置(變化劇烈程度);樣本均值(方差)具有隨機性,而隨機變量的均值(方差)沒有隨機性;樣本均值(方差)的極限是總體均值(方差)

。i.在高爾頓釘板試驗中,課文中說“隨著試驗次數的增加,這個頻率直方圖的形狀會越來越像一條鐘形曲線”。越來越接近于鐘形曲線的離散化。j.注意通過邊框問題引導學生了解:對于同一個實際問題,可以用不同的隨機變量來描述(如擲一枚硬幣);k.概率模型的選取三張獎券抽簽:

A:{YX1X2,YX2X1,X1YX2,X2YX1,X1X2Y,X2X1Y}

B:{YXX,XYX,XXY}在一個特定的隨機試驗中,稱每一可能出現的結果為一個基本事件,全體基本事件的集合稱為事件空間。隨機事件(簡稱事件)是由某些基本事件組成的。k.概率模型的選取又如,兩顆骰子點數和

{(1,1)(1,2)(2,1)…(6,6)}

{(奇,奇)(奇,偶)(偶,奇)(偶,偶)}{2,3,4,5,6,7,8,9,10,11,12}45隨機變量的定義假設你家訂了一份報紙,送報人可能在早上6:30~7:30之間把報紙送到你家,你父親離開家去工作的時間在早上7:00~8:00之間,你父親在離開家之前能得到報紙(稱為事件A)的概率是多少?設送報人到達的時間為x,父親離開的時間為y,則A={(x,y)|y≧x,6.5≦x≦7.5,7≦y≦8}獨立的例子買彩票中的號碼選擇拋硬幣……

例一輛汽車0~100km發生故障的概率為0.5,0~200km發生故障的概率為0.8,已知在1~100km沒有發生故障的條件下,100~200km發生故障的概率?第三章統計案例統計學不止是一種方法和技術,還含有世界觀的成分—它是看待世界上萬事萬物的一種方法。

—陳希孺教學目標結構設置與課時分配回歸分析獨立性檢驗1.教學目標通過典型案例的探究,進一步了解回歸分析的基本思想、方法及其初步應用。通過典型案例的探究,了解獨立性檢驗(只要求2×2列聯表)的基本思想、方法及其初步應用。教學目標結構設置與課時分配回歸分析獨立性檢驗統計案例(10課時)獨立性檢驗模型(3課時)回歸分析模型(4課時)實習作業與小結(3課時)2.結構設置與課時分配教學目標結構設置與課時分配回歸分析獨立性檢驗3.回歸分析比《數學3》中“回歸”增加的內容回歸分析知識結構圖幾個應注意的問題畫散點圖了解最小二乘法的思想求回歸直線方程y=bx+a用回歸直線方程解決應用問題必修《數學3》已學回歸內容比《數學3》中“回歸”增加的內容引入線性回歸模型y=bx+a+e了解模型中隨機誤差項e產生的原因了解R2和模型擬合的效果之間的關系了解殘差圖的作用利用線性回歸模型解決一類非線性回歸問題正確理解統計分析方法與結果選修《數學2-3》新增內容比《數學3》中“回歸”增加的內容3.回歸分析比《數學3》中“回歸”增加的內容回歸分析知識結構圖幾個應注意的問題b.回歸分析知識結構圖問題背景分析線性回歸模型兩個變量線性相關最小二乘法兩個變量非線性相關非線性回歸模型殘差分析R2散點圖應用例1

從某大學中隨機選取8名女大學生,其身高和體重數據如表3-1所示。求根據女大學生的身高預報體重的回歸方程,并預報一名身高為172cm的女大學生的體重。編號12345678身高/cm165165157170175165155170體重/kg485750546461435960(1)畫散點圖(2)散點圖上樣本點呈現出線性相關。(3)由最小二乘法可求得:回歸方程為:(4)預報體重為:引入線性回歸模型:與函數關系不同,在回歸模型中,y的值由x和隨機誤差e共同確定。對于樣本點(x1,y1),(x2,y2),…(xn,yn)隨機誤差為ei=yi-bxi-a其估計值(殘差)為模型診斷1殘差散點圖模型診斷2R2越接近于1,說明模型的擬合效果越好;R2越接近0,說明模型的擬合效果越差。3.回歸分析比《數學3》中“回歸”增加的內容回歸分析知識結構圖幾個應注意的問題(教學建議)回歸分析教學建議回歸一詞的來歷函數模型與“回歸模型”的關系散點圖與模型的選擇殘差變量與模型選擇解釋殘差變量的來源正確理解R2的含義注意提煉案例所蘊含的統計思想應用統計方法解決實際問題需要注意的問題信息技術的使用教學目標結構設置與課時分配回歸分析獨立性檢驗獨立性檢驗兩個假設檢驗問題獨立性檢驗知識結構圖幾個應注意的問題獨立性檢驗兩個假設檢驗問題獨立性檢驗知識結構圖獨立性檢驗的教學建議a.兩個假設檢驗問題阿布茲諾特的《從兩性出生數觀察的規律性所得關于神的意旨存在的一個論據》(1)生男生女純屬偶然(即有同等機會)(2)由于“神的意旨”,生男的機會大于生女。a.兩個假設檢驗問題費歇爾的“女士品茶”(TM和MT各4杯)(1)該女士對TM和MT并無鑒別力,所得結論純屬偶然;(2)該女士對TM和MT有一定的鑒別能力。假設檢驗問題由兩個互斥的假設構成,其中一個叫做原假設,用H0表示;另一個叫做備擇假設,用H1表示。例如,在前面的例子中,原假設為:

H0:生男生女純屬偶然,備擇假設為:

H1:由于“神的意旨”,生男的機會大于生女。這個假設檢驗問題可以表達為:

H0:←→H1:獨立性檢驗兩個假設檢驗問題獨立性檢驗知識結構圖幾個應注意的問題b.獨立性檢驗知識結構圖背景分析列聯表條形圖獨立性檢驗分類變量之間關系不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965例1為研究吸煙是否對患肺癌有影響,某腫瘤研究所隨機地調查了9965人,得到如下結果:

吸煙與患肺癌列聯表那么吸煙是否對患肺癌有影響?等高條形圖不吸煙吸煙患肺癌比例不患肺癌比例2×2列聯表不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d79獨立性檢驗用A表示不吸煙,B表示不患肺癌。假設H0:吸煙和患肺癌沒有關系。80獨立性檢驗在“吸煙與患肺癌沒有關系”成立的條件下,可以估算出:P(K2>k0)0.100.050.0250.010.0050.001k02.0723.8415.0246.6357.87910.828結果的解釋:k≈56.632>6.635解釋為在犯錯誤的概率不超過0.01的前提下認為“吸煙與患肺癌有關”。這里概率的計算基于K2的分布獨立性檢驗假設檢驗的基本思想:1.在H0成立的條件下,構造與H0矛盾的小概率事件;2.如果樣本使得這個小概率事件發生,就能在犯錯誤概率不超過小概率的前提下斷言H1成立;否則,就說從數據中沒有發現充分的證據支持H1成立。

獨立性檢驗的基本思想:當K2很大時,就認為兩個變量有關系;否則就認為沒有充分的證據顯示兩個變量有關系。檢驗問題的解:一個規則,用以判斷是H0

還是H1正確。獨立性檢驗兩個假設檢驗問題獨立性檢驗知識結構圖幾個應注意的問題c.幾個應注意的問題獨立性檢驗的本質反證法原理與假設檢驗原理的比較犯錯誤概率的計算檢驗結果的表述兩個結果不矛盾K2統計量的非齊次問題把沒有關系作為假設的原因臨界值的確定總結“兩個分類變量獨立性檢驗”的本質問題:建立判斷結論

H1:分類變量X與Y之間有關系成立的規則。判別指標:規則k0:如果k>k0,判定H1成立;否則認為H1不成立。確定規則k0判定“H1成立”犯錯誤的概率。表3-11給出了一些規則的犯錯誤的概率。反證法原理:

在假設H0下,如果推出一個矛盾,就證明了H0不成立。

假設檢驗原理:

在假設H0下,如果出現一個與H0相矛盾的小概率事件,就推斷H0不成立,且該推斷犯錯誤的概率不超過這個小概率。

反證法原理與假設檢驗原理檢驗結果的表述如果根據實際問題確定的顯著性水平為0.01,其對應的臨界值為6.635。當k≧6.635時,表述為:在犯錯誤概率不超過0.01的前提下認為兩個變量有關系;否則就認為沒有充分的證據顯示兩個變量有關系。P(K2>k0)0.100.050.0250.010.0050.001k02.0723.8415.0246.6357.87910.828這里概率的計算基于K2的分布犯錯誤概率的計算在教學過程中強調只有在兩個分類變量沒有關系的假設,才能得到這個近似公式。在教學過程中可以指出估算需要很多的概率統計知識。表3-11是個近似值表,通常要求總觀察數大于40,且a,b,c,d都不小于5。在前面案例中,由k≈54.721>6.635可得結論:在犯錯誤的概率不超過0.01的前提下認為“吸煙與患肺癌有關”。另一方面,由k≈54.721>10.828還可得結論:在犯錯誤的概率不超過0.001的前提下認為“吸煙與患肺癌有關”。問題:二個結論矛盾嗎?可引導學生討論下面問題,加深對假設檢驗問題的正確理解。兩個結論不矛盾,它們是對兩個不同評判規則的結論。結論“在犯錯誤的概率不超過0.01的前提下認為‘吸煙與患肺癌有關’”是相對于規則一:如果隨機變量的觀測值大于或等于6.635就認為“吸煙與患肺癌有關系”。結論“在犯錯誤的概率不超過0.001的前提下認為‘吸煙與患肺癌有關’”是相對于規則二:如果隨機變量的觀測值大于或等于10.828就認為“吸煙與患肺癌有關系”。關于非齊次的問題,例如為什么總是把“沒有關系”作為原假設臨界值的設定

關于例1的教學建議例1.禿頭與患心臟病在解決實際問題時,可以直接計算K2的觀測值k進行獨立檢驗,而不必寫出K2的推導過程

。提醒學生們注意統計結果的適用范圍(這由樣本的代表性所決定)。因為這組數據來自住院的病人,因此所得到的結論適合住院的病人群體.92例1.(2010年課標高考文理19)為調查某地區老人是否需要志愿者提供幫助,用簡單隨機抽樣方法從該地區調查了500位老年人,結果如下:(1)估計該地區老年人中,需要志愿者提供幫助的老年人的比例;(2)能否有99%的把握認為該地區的老年人是否需要志愿者提供幫助與性別有關?(3)根據(2)的結論,能否提供更好的調查方法來估計該地區老年人,需要志愿幫助的老年人的比例?說明理由。附:性別是否需要志愿男女需要4030不需要160270例2.(2010遼寧18)為了比較注射A,B兩種藥物后產生的皮膚皰疹的面積,選200只家兔做試驗,將這200只家兔隨機地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B。(Ⅰ)甲、乙是200只家兔中的2只,求甲、乙分在不同組的概率;(Ⅱ)下表1和表2分別是注射藥物A和B后的試驗結果.(皰疹面積單位:mm2)表1:注射藥物A后皮膚皰疹面積的頻數分布表表2:(ⅰ)完成下面頻率分布直方圖,并比較注射兩種藥物后皰疹面積的中位數大小;(ⅱ)完成下面2×2列聯表,并回答能否有99.9%的把握認為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”.表3:案例:2007年6月20日在中央電視臺12頻道19:30-20:00的中國法制報道節目:一個經常買福利彩票的人某天18:00收到一條短信“今天19:30開獎的3D福利彩票的中獎號碼為776”,第2天該人在報紙中看到,該期的中獎號碼確實是776,他覺得奇怪,就打電話給發短消息的號碼,對方說這是內部消息,100%準確。該人又問“你能告訴我今天晚上的中獎號碼嗎?”對方回答“你需要交信息費998元”。你這時會怎么想?你認為這是真的嗎?騙局是:中獎號碼是000~999,騙子給1000人發信息,每人一個號碼,一定有一個人的號碼是中獎號碼,該人就可能上當。投稿的論文中錯誤的使用統計表收視率調查樣本戶講述被電視臺收買作假經歷培訓時教師常問的問題1、信息技術的應用掌握到什么程度?2、高考考到什么程度?3、有沒有相應的課件?4、在講古典概型前是否要補充排列組合的知識?謝謝!f.教學建議

關于探究吸煙與患肺癌關系的教學建議關于例1的教學建議關于例2的教學建議關于探究吸煙與患肺癌關系的教學建議通過圖形直觀判斷,只能得到定性的結論,無法知道所得結論的可信程度及含義,因此需要用列聯表檢驗。不吸煙吸煙推導統計量K2

用意是建立判定吸煙與患肺癌是否有關系的指標(用于構造有利于H1成立的小概率事件的指標)

,使同學了解:K2越大,推斷H1成立犯錯誤的概率越小。關于探究吸煙與患肺癌關系的教學建議這里概率的計算基于K2的分布在“吸煙與患肺癌沒有關系”成立的條件下,可以估算出:關于探究吸煙與患肺癌關系的教學建議P(K2>k0)0.100.050.0250.010.0050.001k02.0723.8415.0246.6357.87910.828結果的解釋:k≈54.721>6.635解釋為在犯錯誤的概率不超過0.01的前提下認為“吸煙與患肺癌有關”。若按如下規則進行判斷,則把“吸煙與患肺癌沒有關系”錯判斷成“吸煙與患肺癌有關系”的概率不超過0.01。規則:若K2≥6.635,就斷定“吸煙與患肺癌有關”關于探究吸煙與患肺癌關系的教學建議函數模型與“回歸模型”的關系函數模型:回歸模型:樣本點在函數曲線上樣本點不在回歸函數曲線上函數模型與“回歸模型”的關系函數模型:因變量y完全由自變量x確定回歸模型:

預報變量y完全由解釋變量x和隨機誤差e確定隨機誤差e

散點圖與模型的選擇案例2:紅鈴蟲的產卵數與溫度這些散點更像是集中在一條指數曲線或二次曲線的附近。散點圖幫助確定可供選擇模型的范圍,模型的比較則基于殘差分析

殘差變量與模型選擇

殘差圖的制作及作用在殘差圖中尋找異常點

可能由錯誤數據引起殘差圖的趨勢性分析趨勢性的殘差圖說明模型有改進的余地殘差圖幫助確定異常點,以及模型的改進方向。殘差圖的制作及作用。坐標縱軸為殘差變量,橫軸可以有不同的選擇。橫軸為編號,可以考察殘差與編號次序之間的關系,常用于調查數據錯誤。橫軸為解釋變量,可以考察殘差與解釋變量的關系,常用于研究模型是否有改進的余地。若模型選擇的正確,殘差圖中的點應該分布在以橫軸為心的帶形區域。在殘差圖中尋找異常點可能由錯誤數據引起的異常點異常點異常點身高與體重殘差圖殘差圖具有趨勢性,模型有改進的余地,模型中應該添加二次項

殘差圖的趨勢性分析殘差變量的來源:其它因素的影響。如影響體重y的因素不只是身高x,可能還包括遺傳基因、飲食習慣、生長環境等因素。選用的回歸模型近似真實模型所引起的誤差。預報變量的觀測誤差。身高y的測量有誤差。

R2是度量模型擬合效果的一種指標。在線性模型中,它代表自變量刻畫預報變量的能力。R2越大(0<R2<1),模型擬合效果越好。

正確理解R2的含義總偏差平方和:預報變量的變化程度回歸平方和:解釋變量引起的變化程度殘差平方和:殘差變量的變化程度預報變量的變化中能由解釋變量引起的比例

在線性模型中,它代表解釋變量刻畫預報變量的能力。不需要學生掌握平方和分解公式

注意提煉案例所蘊含的統計思想如在例1結尾提到“用身高預報體重時,需要注意下列問題:……”,這些論述適用于所有的回歸模型。

模型適用的總體;模型的時間性;

樣本的取值范圍對模型的影響;模型預報結果的正確理解。

注意提煉案例所蘊含的統計思想又如教科書上所列“建立回歸模型的基本步驟”,不僅適用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論