生物統(tǒng)計學(自理重點)_第1頁
生物統(tǒng)計學(自理重點)_第2頁
生物統(tǒng)計學(自理重點)_第3頁
生物統(tǒng)計學(自理重點)_第4頁
生物統(tǒng)計學(自理重點)_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上生物統(tǒng)計學復習資料(70%)填空:10題×1=10 選擇:5題×1=5 名詞解釋:5題×2=10判斷:5題×1=5 簡答:3題×5=15 統(tǒng)計推斷:4題 10+10+10+20=50第1章 緒論生物統(tǒng)計學:是研究收集、整理、分析和解釋生物科學試驗數(shù)據(jù)的科學,是統(tǒng)計學原理在生物學研究領域的應用。生物統(tǒng)計學的主要內(nèi)容生物統(tǒng)計學包括試驗數(shù)據(jù)的獲取、整理和分析等相關內(nèi)容,具體來說,包括試驗或調(diào)查設計、數(shù)據(jù)的整理(描述統(tǒng)計學)、概率論基礎(統(tǒng)計理論基礎)、統(tǒng)計推斷方法(推斷統(tǒng)計學)等內(nèi)容。調(diào)查設計:是指整個調(diào)查計劃的制訂,包括調(diào)

2、查研究的目的、對象與范圍,調(diào)查項目及調(diào)查表內(nèi)容,抽樣方法的選取,抽樣單位和抽樣數(shù)量的確定,數(shù)據(jù)處理方法,調(diào)查組織工作,調(diào)查報告撰寫等內(nèi)容。試驗設計:是指試驗單位的選取、生物學重復數(shù)的確定及試驗單位的分組等。生物統(tǒng)計學發(fā)展簡史(1) 古典記錄統(tǒng)計學(2) 近代描述統(tǒng)計學(3) 近代推斷統(tǒng)計學總體:是研究對象的全體。個體:是總體中的一個研究單位。樣本:是從總體中抽取的用于代表總體的一部分個體。樣本容量記為n,通常把n30的樣本稱為小樣本,n30的樣本稱為大樣本。(判斷區(qū)別)隨機抽樣:是指總體中的每一個個體都有同等的被抽取的機會組成樣本。參數(shù):由總體計算的特征數(shù)。統(tǒng)計數(shù):由樣本計算的特征數(shù)。準確性:

3、也叫準確度,是指在試驗中某一試驗指標的觀測值與其真值接近的程度。精確性:也叫精確度,是指同一試驗指標的重復觀測值彼此接近的程度。隨機誤差:是由于無法控制的內(nèi)在和外在的偶然因素所造成的,是客觀存在的,在實驗中,即使十分小心也難以消除。系統(tǒng)誤差:也叫片面誤差,是由試驗材料的初始條件不同或測量儀器不準等引起的傾向性或定向性偏差。(小題)誤差怎么控制?(小題)隨機誤差可完全避免 (×)(小題)減小統(tǒng)計誤差的方法是 (B)A、 提高準確度 B、提高精確度 C、減少樣本容量 D、增加樣本容量第2章 數(shù)據(jù)的描述與分析數(shù)據(jù)可以大致分為數(shù)量性狀數(shù)據(jù)和質(zhì)量性狀數(shù)據(jù)兩大類。數(shù)量性狀數(shù)據(jù):是指通過測量、度量

4、或計數(shù)取得的數(shù)據(jù)。根據(jù)數(shù)據(jù)的特征又分為連續(xù)型數(shù)據(jù)和離散型數(shù)據(jù)。連續(xù)型數(shù)據(jù):或稱為計量數(shù)據(jù),是指用測量或度量方式得到的數(shù)量性狀數(shù)據(jù)。(如身高、作物產(chǎn)量、蛋白質(zhì)含量等)連續(xù)型數(shù)據(jù)的特點:(1) 用測量或度量方式得到的數(shù)量性狀數(shù)據(jù)。(2) 數(shù)據(jù)是用長度、容積、重量等來表示。(3) 觀測值可以是整數(shù)或帶小數(shù)的任何數(shù)值。(4) 小數(shù)位數(shù)由測量工具或統(tǒng)計要求的精度而定,數(shù)據(jù)之間的變異是連續(xù)的。離散型數(shù)據(jù):或稱為計數(shù)數(shù)據(jù),是指用計數(shù)方法得到的數(shù)量性狀數(shù)據(jù)。(如不同血型的人數(shù)、魚的數(shù)量、白細胞數(shù)等)質(zhì)量性狀數(shù)據(jù):或稱為屬性數(shù)據(jù),是指對某種現(xiàn)象進行觀察而不能測量的數(shù)據(jù)。(如土壤的顏色、植物葉的形狀等)質(zhì)量性狀數(shù)

5、據(jù)數(shù)量化的方法(1)二值化(2)等級化離散型數(shù)據(jù)基本上采用單項式分組法整理。連續(xù)型數(shù)據(jù)一般采用組距式分組法整理。全距又稱為極差統(tǒng)計表的結(jié)構:統(tǒng)計表由標題、橫標目、縱標目、線條、數(shù)字及合計(總計)構成。編制統(tǒng)計表的總原則:結(jié)構簡單、層次分明、內(nèi)容安排合理、重點突出、數(shù)據(jù)準確,便于理解和統(tǒng)計分析。統(tǒng)計表編制的具體要求(1) 標題:標題要簡明扼要、準確地說明表的內(nèi)容,有時需在最右側(cè)注明時間、地點,表中數(shù)據(jù)為同一單位時也在此說明。(2) 標目:標目分為橫標目和縱標目兩項。橫標目列在表的左側(cè),縱標目列在表的上端,并注明計量單位,如%、kg、cm等。(3) 數(shù)字:一律用阿拉伯數(shù)字,小數(shù)點對齊,(每列)小數(shù)

6、位數(shù)一致,無數(shù)字的用“”表示,數(shù)字是“0”的,則填寫“0”。(4) 線條:表的上、下兩條邊線略粗,縱、橫標目間及合計(總計)用細線分開,表的左右邊線可省去,表的左上角一般不用斜線;科技論文則習慣使用三線表。常用的統(tǒng)計圖有:柱狀圖、餅圖、線圖、直方圖和折線圖。離散型數(shù)據(jù)常用的統(tǒng)計圖:柱狀圖、線圖或餅圖連續(xù)型數(shù)據(jù)常用的統(tǒng)計圖:直方圖和折線圖統(tǒng)計圖繪制的的基本要求:(1) 標題簡明扼要,列于圖的下方;縱、橫兩軸應有刻度,注明單位。(2) 橫軸由左至右、縱軸由下而上,數(shù)值由小到大;圖形寬度與高度之比為4:3至6:5。(3) 圖中用不同顏色或線條代表不同事物時,應有圖例說明。變量分布具有兩種明顯的基本特

7、征,及集中性和離散性。集中性:是指變量有向某一中心聚集的趨勢,或者說以某一數(shù)值中心向兩側(cè)遞減分布的性質(zhì)。離散性:是指變量有離中心分散變異的性質(zhì)。反映數(shù)據(jù)集中性的特征數(shù)為平均數(shù),常用的是算術平均數(shù),還包括幾何平均數(shù)、調(diào)和平均數(shù)、中位數(shù)和眾數(shù)等。(具體事例,如進行。的滴定叫做什么平均數(shù))中位數(shù):將資料中的所有觀測值按從大到小的順序排列,位于中間的那個觀測值稱為中位數(shù)。變異數(shù)包括極差、方差、標準差和變異系數(shù)等。(各自的計算方法):極差:資料中觀測值的最大值與最小值之差,記為R。R=maxx1,x2,,xn- minx1,x2,xn方差:記為s2或均方,記為MS。(自由度為n-1)s2=(x-x)2n

8、-1相應的總體參數(shù)稱為總體方差,記為2。2=(x-)N2標準差:記為s。s=x-x2n-1=x2-x2nn-1標準差的特性(1) 標準差受所有觀測值的影響,觀測值間的差異大小直接影響標準差的大小。(2) 在計算標準差時,所有觀測值同時加上一個常數(shù),標準差值不變;所有觀測值同時乘以常數(shù)a時,標準差擴大a倍。(3) 數(shù)據(jù)呈正態(tài)分布時,在平均數(shù)兩側(cè)1s范圍內(nèi)的觀測值個數(shù)為68.26%,在平均數(shù)兩側(cè)2s范圍內(nèi)的觀測值個數(shù)為95.45%,在平均數(shù)兩側(cè)3s范圍內(nèi)的觀測值個數(shù)為99.73%。標準差的作用(1) 表示變量變異程度的大小。標準差小,說明變量比較密集地分布于平均數(shù)附近;標準差大,說明變量分布比較分

9、散。因此,可以根據(jù)標準差的大小判斷平均數(shù)的代表性。(2) 利用標準差估計變量的次數(shù)分布及各類觀測值在總體中所占的比例。(3) 利用樣本標準差代替總體標準差計算平均數(shù)的標準誤。(4) 用于平均數(shù)的區(qū)間估計和變異系數(shù)的計算。變異系數(shù)的用途(1) 比較度量衡的單位不同的多組數(shù)據(jù)的變異度。(2) 比較均數(shù)相差懸殊的多組數(shù)據(jù)的變異度。計算:在度量單位不同和(或)平均數(shù)差異較大時,比較兩個樣本的變異程度就不能直接采用標準差,而須先對其進行標準化,消除度量單位的差異和平均數(shù)大小的差異的影響。標準差與平均數(shù)的比值稱為變異系數(shù),記為Cv。Cv=sx第3章 概率與概率分布必然事件:在一定條件下必然發(fā)生的事件,用U

10、表示。不可能事件:在一定條件下不可能發(fā)生的事件,用V表示。概率:用于反映事件發(fā)生的可能性大小的數(shù)量指標。隨機事件滿足以下三個條件:(1) 試驗的所有可能結(jié)果只有有限個。(2) 試驗的各種結(jié)果出現(xiàn)的可能性相等。(3) 試驗的所有可能結(jié)果兩兩互不相容。事件的相互關系(1) 和事件,記作AB(或A+B)(2) 積事件,記作AB(或AB)(3) 互斥事件(4) 獨立事件概率計算法則:(應用,p20)(1) 加法定理P(AB)=P(A)+P(B)(2) 條件概率,記作P(B|A)P(B|A)=P(AB)P(A)(3) 乘法法則設事件A和事件B是同一個樣本空間的兩個事件,則P(AB)=P(A)P(B|A)

11、如果事件A與事件B相互獨立,則P(B|A)=P(B),于是P(AB)=P(A)P(B)二項分布:二項分布:是一種常見的離散性隨機變量的概率分布。所謂二項,是指每次試驗只有兩個可能的結(jié)果:事件A和事件A,它們互為對立事件。(非此即彼的對立事件)二項分布的概率函數(shù):Px=Cnxpxqn-xx=0,1,2,n (3-16)二項分布的表示方法:B(n,p)二項分布曲線形狀由n(正整數(shù))和p(0與1之間的任何數(shù)值)兩個參數(shù)決定。當p趨于0.5時,二項分布趨于對稱;當p值較?。╬0.3)且n不大時,分布是左偏的;當p值較大(p0.7)且n不大時,分布是右偏的。后兩種情況下,當n時,二項分布接近連續(xù)型的正態(tài)

12、分布。泊松分布:事件類型:稀有事件的概率分布。表示方法:P()性質(zhì):當n時,泊松分布近似服從正態(tài)分布N(,)。(了解,p24)正態(tài)分布:事件類型:連續(xù)型隨機變量的概率分布表示方法:N(,2)特征(了解,p26)標準正態(tài)分布表示方法:N(0,1)普通正態(tài)分布轉(zhuǎn)化為標準正態(tài)分布的方法:u=x-u【例3.6】 已知uN(0,1),試求下列概率:(記答案)(1) P(u-1)= 0.1587(2) P(|u|2.576)= 0.99(3) P(|u|1.960)= 0.05(4) P(-3u3)= 0.9972P(-1.960u1.960)= 0.95 P(|u|1.960)= 1-0.95 = 0.

13、05P(-2.576u2.576)= 0.99 P(|u|2.576)= 1-0.99 = 0.01(記)無偏估計:統(tǒng)計學上,如果樣本統(tǒng)計數(shù)分布的平均值與總體的相應參數(shù)相等,則稱該統(tǒng)計數(shù)為總體相應參數(shù)的無偏估計值。無偏估計的三個推斷:(1) 樣本平均數(shù)x是總體平均數(shù)的無偏估計值;(2) 樣本方差s2是總體方差2的無偏估計值;(3) 樣本標準差s不是總體標準差的無偏估計值。大數(shù)定律:是概率論描述當前試驗次數(shù)很大時所呈現(xiàn)的概率性質(zhì)的定律。中心極限定理:是概率論中討論隨機變量的和的分布趨向正態(tài)分布的定理。計算:x=,x=n (3-28)u=x-x=x-n (3-29) sx=sn (3-30)t=x

14、-sx=x-nsn (3-31)(樣本方差之比)F=s12s22 (3-38)第4章 統(tǒng)計推斷假設檢驗:又稱顯著性檢驗,是利用樣本統(tǒng)計數(shù)推斷總體參數(shù)的統(tǒng)計方法。小概率原理:小概率事件在一次試驗中不應該發(fā)生。假設檢驗的基本思路:根據(jù)零假設計算出事件發(fā)生的概率,如果概率很小,事件在一次試驗中是不應該發(fā)生的,如果發(fā)生了,則認為零假設不成立。假設檢驗的步驟:(1) 提出零假設H0和備擇假設HA;(2) 確定檢驗的顯著水平(3) 在H0正確的前提下,根據(jù)抽樣分布的統(tǒng)計量進行假設檢驗的概率計算;(4) 計算統(tǒng)計量對應的概率值與顯著水平比較,或統(tǒng)計量與顯著水平的臨界值比較,進行差異顯著性推斷。雙尾檢驗與單尾

15、檢驗判別雙尾檢驗:H0:=0 HA:0 單尾檢驗:H0:0 HA:0假設檢驗中的兩類錯誤(區(qū)別和聯(lián)系):若H0是真實的,假設檢驗卻否定了它,就犯了一個否定真實假設的錯誤,稱為第類錯誤。若H0不是真實的,假設檢驗卻接受了H0,就犯了接受不真實假設的錯誤,稱為第類錯誤。兩類錯誤的關系是,在樣本容量相同的情況下,減少犯第類錯誤的概率,就會增加犯第類錯誤的概率;反之,減少犯第類錯誤的概率,就會增加犯第類錯誤的概率。平均數(shù)的檢驗(u檢驗,單樣本/雙樣本,統(tǒng)計推斷,10分,t檢驗,成組/配對,10分)看例題(1)112、22已知u=x1-x2x1-x2 x1-x2=12n1+22n2(2)12、22未知

16、n130,n230 u=x1-x2Sx1-x2 Sx1-x2=s12n1+s22n2 n130,n230(t檢驗) t檢驗 成組 12=22 Se2=S12n1-1+S22n2-1n1-1+n2-1 1222 n1=n2=n Se2Sx1-x2tdf=n-1 n1n2 配對 t=x-Sx=dSd Sd=Sn參數(shù)估計包括區(qū)間估計和點估計。P(x-uxx+ux)= 1- (4-18)當總體方差2為已知,或總體方差2未知但為大樣本時,置性度為P=1- 的總體平均數(shù)的區(qū)間估計和點估計分別為x-ux,x+ux,x±ux (4-19)當總體方差未知且樣本為小樣本時,由樣本方差s2來估計總體方差2

17、,置性度為P=1- 的總體平均數(shù)的區(qū)間估計和點估計分別為x-tsx,x+tsx,x±tsx (4-20)第5章 次數(shù)資料的x2檢驗(統(tǒng)計推斷,獨立性或二項分布的適合性檢驗,10分)X2檢驗與連續(xù)型資料假設檢驗的區(qū)別(必考)X2檢驗連續(xù)型資料假設檢驗數(shù)據(jù)資料離散型資料連續(xù)型資料總體總體分布是未知的正態(tài)分布檢驗對象不是對總體參數(shù)的檢驗,而是對總體分布的假設檢驗對總體參數(shù)或幾個總體參數(shù)之差X2檢驗的三個用途:(1) 單個樣本方差的同質(zhì)性檢驗(2) 獨立性檢驗(3) 適合性檢驗計算公式(5-1)-(5-3):x2=O-E2EXc2=|0-E|-0.52EEij=RiCjT =1,2,j=1,

18、2第6章 方差分析(統(tǒng)計推斷,多重比較,LSD法,一定有顯著性,20分)試驗因素:試驗中人為設置的影響試驗指標的因素。試驗水平:試驗因素所處的某種特定狀態(tài)或數(shù)量等級。效應:對試驗單位施加試驗處理而引起的試驗指標的改變,同一因素不同水平表現(xiàn)出來的單獨作用稱為主效應,或稱簡單效應?;プ鳎憾嘁蛩卦囼炛?,兩個及以上因素間相互促進或相互抑制所產(chǎn)生的新效應,即不能用各因素主效應解釋的試驗指標的改變部分,稱為交互作用,簡稱互作。方差分析的基本思路:方差分析就是通過將數(shù)據(jù)的總變異分解為組間變異和組內(nèi)變異,然后比較、檢驗組間變異相對于組內(nèi)變異的懸殊程度。通常用方差s2描述數(shù)據(jù)的變異性,方差比衡量兩者的懸殊程度,且由于兩個方差之比服從F分布,故可用F檢驗法檢驗組間變異和組內(nèi)變異的比值是否顯著。計算:最小顯著差數(shù)法(LSD法)(方差分析表,4分、結(jié)果一張表)步驟:表6-2 方差分析表的一般形式 C=T2/nk方差分析的三個基本假定:效應可加性、誤差正態(tài)性、方差同質(zhì)性方差分析的數(shù)據(jù)轉(zhuǎn)換:對數(shù)轉(zhuǎn)換、反正弦轉(zhuǎn)換、平方根轉(zhuǎn)換估計缺失數(shù)據(jù)的原則:補上缺失數(shù)據(jù)后誤差平方和最小。第8章 抽樣的原理與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論