概率及統計的個人總結_第1頁
概率及統計的個人總結_第2頁
概率及統計的個人總結_第3頁
概率及統計的個人總結_第4頁
概率及統計的個人總結_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

隨機抽樣和樣本估計總體1.統計的基本概念(1)總體(2)個體(3)樣本.(4)樣本容量:樣本中個體的數目叫樣本容量.2.簡單隨機抽樣(1)定義:一般地,設一個總體含有N個個體,從中抽取n個個體作為樣本(n≤N),(2)最常用的簡單隨機抽樣方法有兩種和.抽簽法和隨機數法是比較常用的兩種方法.(3)應用范圍:總體個體數較少.3.分層抽樣(1)定義:一般地,在抽樣時,將總體分成的層,然后按照一定的,從各層獨立(2)分層抽樣的應用范圍:當總體是由差異的幾個部分組成時,往往選用分層抽樣的方法.4.頻率分布表(2)頻率分布表的畫法步驟:第一步:求極差,決定組數和組距,組距=;第二步:分組;第三步:登記頻數,計算頻率,列出頻率分布表.5.頻率分布直方圖利用直方圖反映樣本的頻率分布規律,這樣的直方圖稱為頻率分布直方圖.(1)作頻率分布直方圖的方法①先制作頻率分布表,然后作直角坐標系.②把橫軸分成若干段,每一線段對應一個組的組距,然后以此線段為底作一矩形,它的高等于該組的,這樣得出一系列的矩形.③每個矩形的面積恰好是該組的頻率,這些矩形就構成了頻率分布直方圖.(2)頻率分布直方圖的特征①直方圖中各小長方形的面積之和為.②直方圖中縱軸表示,故每組樣本的頻率為組距×,即矩形的.③直方圖中每組樣本的頻數為頻率×總體數.莖葉圖兩位數的莖葉圖,則莖為,莖按從小到大的順序從列出,共莖的葉為,一般按從小到大(或從大到小)的順序同行列出.莖葉圖的畫法步驟7.(1)條形圖;(2)折線圖;(3)扇形圖;8.樣本的數字特征:眾數;、中位數、設一組數據x1,x2,x3,…,xn的平均數為eq\x\to(x)=,則這組數據的標準差和方差分別是,s2=s=標準差是反映總體波動的特征數,當標準差大時,反映數據;標準差小時,反映數據樣本方差是標準差的平方.補充:平均數:eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn)(5)標準差和方差的一些結論若取值x1,x2,…,xn的頻率分別為p1,p2,…,pn,則其平均值為eq\x\to(x)=;若x1,x2,…,xn的平均數為,方差為s2,則ax1+b,ax2+b,…,axn+b的平均數為,方差為.關于樣本方差的常用變形:s2=補充:在頻率直方圖中,眾數為中位數平均數方差、標準差可由分層抽樣的樣本均值及樣本方差計算設樣本中不同兩層,一層有n個x1,x2,…,xn,平均數及方差分別為eq\x\to(x),seq\o\al(2,1);另一層y1,y2,…,ym平均數及方差分別為,seq\o\al(2,2),則這個樣本的平均值為=方差為s2=更一般的有:多個分層隨機抽樣的方差設樣本中不同層的平均數分別為eq\x\to(x)1,eq\x\to(x)2,…,eq\x\to(x)n,方差分別為seq\o\al(2,1),seq\o\al(2,2),…,seq\o\al(2,n),相應的權重分別為w1,w2,…,wn,則這個樣本的平均值為eq\x\to(x)=方差為s2=[seq\o\al(2,i)+(eq\x\to(x)i-eq\x\to(x))2](eq\x\to(x)為樣本的平均數).公式推導:百分位數1.第p百分位數的定義:一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.2.計算一組n個數據的第p百分位數的一般步驟如下:第1步,按從小到大排列原始數據.第2步,計算i=.第3步,若i不是整數,而大于i的比鄰整數為j,則第p百分位數為;若i是整數,則第p百分位數為第i項與第(i+1)項數據的3.四分位數25%,50%,75%這三個分位數把一組由小到大排列后的數據分成四等份,因此稱為四分位數,其中第25百分位數也稱為第一四分位數或下四分位數,第75百分位數也稱為第三四分位數或上四分位數.1.事件的相關概念頻數、頻率和概率3.事件的關系與運算事件的關系:包含關系及相等關系;互斥事件及對立事件;相互獨立事件甲、乙兩人破譯同一個密碼,令甲、乙破譯出密碼分別為事件A,B,則eq\x\to(A)B∪Aeq\x\to(B)表示的含義是________________,事件“密碼被破譯”可表示為________________.對偶律:;4.概率的幾個基本性質當一個事件包含多個結果時,要用到概率加法公式的推廣,即P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An).(1)概率的取值范圍:.(2)必然事件的概率為.(3)不可能事件的概率為eq\a\vs4\al(0).如果A?B,那么P(A)P(B).(4)概率的加法公式:如果事件A與事件B互斥,則P(A∪B)=說明:“事件A與事件B互斥”是P(A∪B)=成立的條件(5)對立事件的概率:若事件A與事件B互為對立事件,則A∪B為必然事件,P(A∪B)=,P(eq\x\to(A))=任意兩事件A與事件B,P(A∪B)=對比集合中的個數計算公式:Card(A∪B)=card(A)+card(B)-card(AB)5.古典概型(1)特點:①有限性:在一次試驗中所有可能出現的結果只有有限個,即只有有限個不同的基本事件.②等可能性:每個基本事件出現的可能性是均等的.(2)計算公式:P(A)=.6.相互獨立事件(1)對于事件A,B,若事件A的發生與事件B的發生互不影響,則稱事件有公式P(AB)=(2)若A與B相互獨立,則P(B|A)=(3)若A與B相互獨立,則A與eq\x\to(B),eq\x\to(A)與B,eq\x\to(A)與eq\x\to(B)也都相互獨立.(4)P(AB)=P(A)P(B)是事件A,B相互獨立的條件對比:事件A,B互斥的充要條件1.條件概率一般地,設A,B為兩個隨機事件,且P(A)>0,我們稱P(B|A)=為在事件A發生的條件下,事件B發生的條件概率.2.概率乘法公式對任意兩個事件A與B,若P(A)>0,則P(AB)==為概率的乘法公式。公式總結:對于任意兩事件A,B有P(A∪B)=當事件A,B互斥時,P(A∪B)=當事件A,B獨立時,P(A∪B)==(利用對偶律轉化)對于任意兩事件A,B,則有P(AB)=當事件A,B獨立時,則有P(AB)=3.全概率公式一般地,設A1,A2,…,An是一組兩兩互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,則對任意的事件B?Ω,有P(B)=,我們稱該公式為全概率公式.貝葉斯公式設A1,A2,…,An是一組兩兩互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,則對任意的事件B?Ω,P(B)>0,有P(Ai|B)=4.離散型隨機變量的分布列及性質(1)一般地,若離散型隨機變量X可能取的不同值為x1,x2,…,xi,…,xn,X取每一個值xi(i=1,2,…,n)的概率P(X=xi)=pi,則表Xx1x2…xi…xnPp1p2…pi…pn稱為離散型隨機變量X的概率分布列.(2)離散型隨機變量的分布列的性質①pi≥0(i=1,2,…,n);②=1(1)均值:稱E(X)=為隨機變量X的均值或數學期望,它反映了離散型隨機變量取值的平均水平.(2)D(X)=為隨機變量X的方差,它刻畫了隨機變量X與其均值E(X)的平均偏離程度,其算術平方根eq\r(D(X))為隨機變量X的標準差.期望、方差的運算性質:E(aX+b)=D(aX+b)=期望與方差的關系:D(X)=四大分布1、超幾何分布在含有M件次品的N件產品中,任取n件,其中恰有X件次品,則事件{X=k}發生的概率為P(X=k)=,k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*,稱分布列為超幾何分布列.X01…mPeq\f(Ceq\o\al(0,M)Ceq\o\al(n-0,N-M),Ceq\o\al(n,N))eq\f(Ceq\o\al(1,M)Ceq\o\al(n-1,N-M),Ceq\o\al(n,N))…eq\f(Ceq\o\al(m,M)Ceq\o\al(n-m,N-M),Ceq\o\al(n,N))E(X)=n*M/N,D(X)=(了解)2.獨立重復試驗與二項分布(1)在n次獨立重復試驗中,用X表示事件A發生的次數,設每次試驗中事件A發生的概率為p,則P(X=k)=,此時稱隨機變量X服從二項分布,記為X~,并稱p為成功概率.3.兩點分布與二項分布的均值、方差(1)若隨機變量X服從兩點分布,則E(X)=,D(X)=.(2)若X~B(n,p),則E(X)=,D(X)=.4.正態分布記作X~則E(X)=,D(X)=正態曲線的特點①曲線位于x軸上方,與x軸不相交;②曲線是單峰的,它關于直線對稱;③曲線在x=處達到峰值;④曲線與x軸之間的面積為;⑤當σ一定時,曲線的位置由μ確定,曲線隨著μ的變化而沿x軸平移,如圖甲所示;⑥當μ一定時,曲線的形狀由σ確定,σ越,曲線越,表示總體的分布越;σ,曲線越,表示總體的分布越,如圖乙所示.特殊表達式的概率:正態總體在三個特殊區間內取值的概率值①P(μ-σ<X≤μ+σ)=0.6826;②P(μ-2σ<X≤μ+2σ)=0.9544;③P(μ-3σ<X≤μ+3σ)=0.9974.P(X≤μ)=,P(μ-3σ<X)=若P(X≤s)+P(X≤t)=1,則有s+t=2μ1.兩個變量的線性相關知識點一一元線性回歸模型稱eq\b\lc\{\rc\(\a\vs4\al\co1(Y=bx+a+e,,Ee=0,De=σ2))為Y關于x的一元線性回歸模型.其中Y稱為因變量或響應變量,x稱為自變量或解釋變量,a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差,如果e=0,那么Y與x之間的關系就可以用一元線性函數模型來描述.知識點二最小二乘法將eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))稱為Y關于x的經驗回歸方程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線,這種求經驗回歸方程的方法叫做最小二乘法,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的最小二乘估計,其中eq\o(b,\s\up6(^))=不需要記,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).知識點三殘差與殘差分析1.殘差對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的eq\o(y,\s\up6(^))稱為預測值,觀測值減去預測值稱為殘差.2.殘差分析殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.知識點四對模型刻畫數據效果的分析1.殘差圖法在殘差圖中,如果殘差比較均勻地集中在以橫軸為對稱軸的水平帶狀區域內,則說明經驗回歸方程較好地刻畫了兩個變量的關系.2.殘差平方和法殘差平方和(yi-eq\o(y,\s\up6(^))i)2越小,模型的擬合效果越好.3.R2法可以用R2=1-來比較兩個模型的擬合效果,R2越大,模型擬合效果越好,R2越小,模型擬合效果越差(1)正相關(2)負相關(3)線性相關關系、回歸直線2.回歸方程(1)最小二乘法求回歸直線,使得樣本數據的點到它的距離的平方和的方法叫做最小二乘法.(2)回歸方程方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))是兩個具有線性相關關系的變量的一組數據(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))是待定參數.eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up9(^))=\f(\o(∑,\s\up6(n),\s\do3(i=1))xi-\x\to(x)yi-\x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)2)=\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\x\to(x)\x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2),,\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x).))注意:樣本點的中心在回歸直線上3.回歸分析(1)定義:對具有相關關系的兩個變量進行統計分析的一種常用方法.(2)樣本點的中心對于一組具有線性相關關系的數據(x1,y1),(x2,y2),…,(xn,yn),其中(eq\x\to(x),eq\x\to(y))稱為樣本點的中心.其中eq\x\to(x)=,eq\x\to(y)=(3)相關系數當r>0時,表明兩個變量;當r<0時,表明兩個變量.r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于時,認為兩個變量有很強的線性相關性.對于一組具有線性相關關系的數據(x1,y1),(x2,y2),…,(xn,yn),均在直線y=bx+a(b>0)上,則兩個變量X,Y的相關系數為在直線y=bx+a(b<0)上,則兩個變量X,Y的相關系數為4.獨立性檢驗(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯表:列出的兩個分類變量的頻數表,稱為列聯表.假設有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數列聯表(稱為2×2列聯表)為2×2列聯表y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d構造一個隨機變量K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d為樣本容量.(3)獨立性檢驗0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828利用隨機變量K2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗.當χ2>2.706時,判定變量A,B;推判斷犯錯誤的概率不超過當χ2≤2.706時,沒有充分理由判定變量A,B,故認為A,B當χ>3.841時,判定變量A,B;當χ>6.635時,判定變量A,B.從上表可知值越小,臨界值越;當接受變量A,B相互獨立時,也可能犯錯誤,這類錯誤大小,隨值越大,犯錯誤的概率越精講06兩個計數原理1.分類加法計數原理做一件事,完成它有n類辦法,在第一類辦法中有m1種不同的方法,在第二類辦法中有m2種不同的方法……在第n類辦法中有mn種不同的方法.那么完成這件事共有N=種不同的方法.2.分步乘法計數原理做一件事,完成它需要分成n個步驟,做第一個步驟有m1種不同的方法,做第二個步驟有m2種不同的方法……做第n個步驟有mn種不同的方法.那么完成這件事共有N=種不同的方法.3.分類加法計數原理和分步乘法計數原理的區別分類加法計數原理針對問題,其中各種方法相互獨立,用其中任何一種方法都可以這件事;分步乘法計數原理針對問題,各個步驟,只有各個步驟才算完成這件事.知識點一排列的定義一般地,從n個不同元素中取出m(m≤n)個元素,并按照一定的排成一列,叫做從n個不同元素中取出m個元素的一個排列.知識點二排列數的定義:從n個不同元素中取出m(m≤n)個元素的所有不同排列的個數,叫做從n個不同元素中取出m個元素的排列數,用符號表示.知識點三排列數公式及全排列1.排列數公式的兩種形式(1)AEQ\*jc0\*hps10\o(\s\up9(m),n)==,其中m,n∈N*,并且m≤n.2.全排列:AEQ\*jc0\*hps10\o(\s\up9(n),n)=(叫做n的階乘).規定:0!=題型三排列處理排隊問題1.簡單問題直接法:2.特殊元素(特殊位置)優先法,如元素的“在”與“不在”問題,解決時;3.相鄰問題捆綁法4.不相鄰問題插空法5.定序問題縮倍法(等概率問題縮倍法)先把所有的元素安排好,再縮小一定的倍數.如甲、乙、丙自左向右的順序保持不變,即甲、乙、丙自左向右順序的排法種數占全排列種數的eq\f(1,A\o\al(3,3)).1、組合:一般地,從n個不同元素中取出m(m≤n)個元素作為一組,叫做從n個不同元素中取出m個元素的一個組合.所有不同組合的個數,叫做從n個不同元素中取出m個元素的組合數,用符號表示.2、組合數計算公式CEQ\*jc0\*hps10\o(\s\up9(m),n)==注意=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論