生物統計學-總結_第1頁
生物統計學-總結_第2頁
生物統計學-總結_第3頁
生物統計學-總結_第4頁
生物統計學-總結_第5頁
已閱讀5頁,還剩12頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

生物統計學總結緒論統計工作的四大步驟:設計、搜集、整理、分析統計資料的三大類型:計量資料:對每個觀察值單位用定量方法測得每項指標量的大小所得的資料計數資料:將觀察單位按照某種屬性類別分組,所得的觀察單位數等級資料:將觀察單位按某種屬性的不同程度分組所得的資料同質與變異同質:除研究因素外,其他因素相同或相近為同質變異:觀測值的不齊性總體與樣本:總體:根據研究目的所確定的同質觀察單位的全體=所有研究對象性質相同的全體觀察單位某項變量值的集合總體含量:總體中所包含的觀察單位數有限總體:總體觀察單位數可數無限總體:總體觀察單位數不可數樣本:從總體中隨機抽取的部分觀察單位樣本含量:樣本中所包含的觀察單位數抽樣:從總體中獲得樣本的過程放回式抽樣不放回式抽樣抽樣誤差:因個體變異的存在,由抽樣而導致的樣本指標與總體指標之差統計量:有樣本所得指標或數參數:由總體所得指標,關于特征的表征頻數:完全相同的觀察只出現的次數頻率:某一觀察值出現的次數與樣本含量的比值概率:描述某事物發生可能性大小的一個度量樣本空間:一次實驗所有可能的結果的集合基本事物:樣本空間每一個可能的結果小概率事件:P<=0。05或P〈=0。01的事件小概率原理:小概率事件在一次抽樣中不可能發生計量資料的統計描述集中趨勢的指標:平均數定義:描述一組同質計量資料的集中趨勢,反映某一組觀察值的平均水平或某一分布的平均位置的指標作用:作為一組資料的代表值,可用于組間的分析比較均數的兩個重要特征代表性離均差和等于0離均差平方最小小于常用平均數指標:1.算術均數(1)定義:全部觀察值相加之和除以觀察值個數所得的商總體均數樣本均數(2)算法:1)直接法:2)加權法:3)縮減法(3)注意事項:1)只有在合理分組的基礎上對同質數據取均數才有意義2)均數用于近似正態分布的對稱分布,尤其是正態分布2.幾何均數G(不能用算術均數時)(1)定義:幾個觀察值相乘之積,開幾次方所得根(2)計算1)直接法2)(3)應用注意:1)幾何均數適用于觀察值相差很大,甚至呈倍數關系(等比或幾何級數資料)或用于對數正態分布資料2)觀察值不能有零,不能同時有正負,若都為負,去符號最后加符號,觀察值比較小或有零,可加1,最后減去3)同一資料求得的幾何均數小于均數中位數M(1)定義:把一組觀察值按大小順序排列,位次居中的(2)計算:1)直接法2)頻數表法:(3)注意事項1)適用場合:偏態,開口(一端或兩端無界限),分布不清的2)特性:只代表了居中觀察值的特性,敏感性低,不受特小特大值的影響3)對于正態分布資料,理論上,中位數=均數(數值上)百分位數(1)定義:將n個觀察值由小到大排列,編上秩次,將n個秩次100等分,與X%秩次相對應的數值,即X的百分位數,是一個位置指標,以Px表示(x代表百分秩次)Px將整個數列分為兩半,X%比Px小,1-X%比Px大(2)計算:(3)應用注意1)百分位數常用于描述一組資料(樣本或總體)在某百分位數上的水平和分布特征,多個百分位數結合使用,可全面描述觀察值分布特征,包括位置的大小和變異度2)一般分布中部的百分位數相當穩定,代表性好,靠近兩端的百分位數,只在樣本含量足夠大(>120個)才足夠穩定,所以當樣本含量不夠大時,不宜取兩端百分位數3)用百分位數確定正常值范圍,習慣上95%離散趨勢的描述1.極差R:樣本資料中最大值和最小值之差在一定程度上能說明樣本波動幅度的大小,但它只受樣本中兩個極端個體數值大小的影響,不能反映樣本中各個觀測值的變異程度,穩定性差2。四分位數間距:是上四分位數與下四分位數之差,用四分位數間距可反映變異程度的大小。穩定性好,靈敏度不夠3。標準差:定義:描述一組同質計量資料離散程度大小的指標反映了均數對一組觀察值的代表性說明了觀察值圍繞均數分布的離散程度,個體變異計算:應用:表示變量分布的離散程度結合均數描述正態分布特征結合均數計算變異系數結合樣本含量計算標準誤注意:不同單位,相同標準差,不能比較大個體差異大,變異度大,小個體則變異度小4.變異系數CV定義:標準差與均數之比,用百分數表示計算:應用:單位不同的幾組資料變異度及均數相差懸殊的幾組資料的變異度的比較,不單獨使用自由度ν泛指可以自由取值的變量的個數正常值:正常動植物解剖生理生化等各種數據的波動范圍必要性區分正常和異常看不同種群在不同時間地域上某一指標的差異選取極差中的一部分單側或雙側正常值之分,由指標實際情況及實驗要求確定方式之一為正常值范圍的百分位數,習慣上95%雙側:確定P2.5或P97.5單側:P5或P95,看實驗需要計量資料的統計推斷統計推斷用樣本信息推斷總體特征參數估計:由樣本結果對總體參數在一定概率水平下所做出的估計假設檢驗正態分布概念:一種連續型隨機變量的概率分布密度函數:分布函數:特征:在橫軸上均數處最高以均數為中心,左右對稱有兩個參數曲線下的面積分布有一定的規律F(x)應用:以曲線下的面積反映頻率及概率分布估計正常值范圍或正常值范圍的正態分布法雙側正常值范圍質量控制正態分布是很多種統計方法的理論基礎標準正態分布,u分布Uα與面積的關系對數正態分布原觀察值x呈偏態(正偏),取對數后,lgX呈正態分布x服從對數正態分布均數的抽樣誤差定義:平均數與總體均數之差均數抽樣誤差大小的度量標準誤定義:樣本均數的標準差意義:反映抽樣誤差的大小是樣本均數圍繞總體均數分布的離散程度,衡量了樣本均數的可靠程度計算:一般一次抽樣估計總體沒有標準誤,只針對樣本用途:計算可信區間(參數估計)用于統計推斷(假設檢驗)t分布t變換與t變量t分布的特征單峰,一0為中心,左右對稱曲線中間比正態分布低,兩端翹得比正態分布高有無數根,中間越低,兩端越翹t分布與自由度有關,自由度越小,中間越低,兩端越翹當自由度趨向無窮時,t分布趨向標準正態分布,tu概率密度函數與分布函數t介值與t介值表tα,ν:給定自由度為ν,兩側雙尾面積之和為α時,相應t值.t分布原理:P(—tα,ν<=t<=tα,ν)=1—α方差分析方差分析又叫變量分析,俗稱F檢驗用途:兩個或多個均數的比較分離各有關因素,并分別估計其對變異的作用分析兩個或多個因素的交互作用方差齊性檢驗適用條件(用于多個均數比較時)個樣本是相互獨立的隨機樣本小樣本要求正態方差齊基本思想:把全部觀察值之間的變異,總變異,按設計需要,分為兩個或多個組成部分再作分析計算總體均數的估計總估計區間估計:定義:按一定的概率估計總體均數在什么范圍內可信區間:按一定的概率估計總體均數的可能范圍方式:t分布法:按t分布的原理估計總體均數在什么范圍內適用于總體標準差未知且n〈50的情形總體均數在可信區間的概率1-α可信度:1-α置信水平:α通常,我們取95%或99%作可信區間正態分布法適用于總體標準差已知或n〉50總體標準差已知:n>50:假設檢驗為什么做假設檢驗檢驗差別是否由抽樣誤差造成的基本思想假定差別是由抽樣誤差引起的然后計算由抽樣誤差引起這么大,甚至比這更大的差別的概率P根據小概率原理,作出拒絕或者接受假設的判斷步驟建立假設,確定檢驗水準先確定是單側還是雙側的若考慮u,u0有誤差別雙側若不僅考慮差別,還關注u,u0大小單側一般認為雙側無效假設H0:從反證法的基礎上提出的,無論何時,假設差別是由抽樣誤差造成的,但具體問題具體分析備擇假設H1:與H0相對立的假設,是依H0而產生的,一旦H0不成立,只能接受H1,現在H0不成立非H0體現單雙側之分檢驗水準α:界定小概率事件的一個標準(有單雙側之分)通常α=0.05選定檢驗方法,計算統計量確定P值,做出統計推斷P值:指由H0所規定的總體中做隨機抽樣,獲得等于大于或小于現有統計量的概率.若P〈=α,拒絕H0;若P〉α,接受H0第一類錯誤和第二類錯誤第一類:拒絕實際上成立的H0第二類:不拒絕實際上不成立的H0客觀實際拒絕H0不拒絕H0H0成立第一類錯誤(α)推斷正確(1-α)H0不成立推斷正確(1-β)第二類錯誤(β)可信度1—α把握度β:未知,只能估計,不能單獨存在,只有與H1結合才有意義檢驗效能1—β:計量總體卻有差別,按α水準,能夠發現他們有差別的能力注意樣本的代表性組間的均衡性資料的可比性選用的假設檢驗方法一定要符合其適用條件正確理解差別有無顯著性的含義(顯著、極顯著不意味著差別的大小)結論不能絕對化報告要規范化檢驗方法一、完全隨機設計(一)樣本均數與已知總體均數比較的假設檢驗小樣本,總體標準差σ未知t檢驗(要求x取自正態總體)大樣本,總體標準差σ未知:t檢驗(嚴格)法2無需來自正態總體u檢驗(ν∞,tu)法1大樣本,總體標準差σ已知u檢驗(二)兩個樣本均數比較的假設檢驗小樣本(有一個就算),總體標準差σ未知,正態方差齊t檢驗先求合并方差再求兩樣本均數差的標準誤計算t值小樣本(有一個就算),總體標準差σ未知,方差不齊(非正態)采用適當的變量變換使達到方差齊性的要求采用不要求方差齊的方法比較非參數統計采用近似的t‘檢驗大樣本u檢驗(不考慮正態方差齊的情況下,仍可用t檢驗)(三)兩個樣本幾何均數比較的假設檢驗對x取反對數,用t檢驗或者u檢驗(四)多個樣本均數的比較(單因素方差分析)條件:個樣本是相互獨立的隨機樣本小樣本要求正態方差齊*多個樣本均數間的兩兩比較q檢驗二、配對設計(一)配對設計的計量資料的比較小樣本,t檢驗t=三、配伍組設計(一)多個樣本均數的比較(兩因素方差分析)多個性質相同的配伍,同一配伍組中的N個受試對象分別接受k種處理作用:1。可改善處理組間的均衡性2。可分析配伍因素的的影響3.提高設計效率,分析兩個因素*多個樣本均數間的兩兩比較q檢驗正態性檢驗一、為什么做正態性檢驗特定統計方法要求的描述統計平均數、標準差正常值范圍的正態統計法統計推斷t檢驗F檢驗二、定義判定資料是否服從正態分布或樣本是否來自正態總體的一類檢驗方法三、何時用?為了說明資料是否服從正態分布一定要做為了滿足特定統計方法的需要可以不做四、怎么做?正態分布分布的特征:對稱性偏度(正偏、對稱、負偏)三階偏度系數g1態峰翹度(正態峰、尖峭峰、平闊峰)四階峰度系數g2方差齊性檢驗一、為什么?t檢驗F檢驗使用條件的要求方差的抽樣波動二、定義說明變量值的變異度有無差別,或者通過樣本信息來推斷總體方差是否相等的一類檢驗方法三、何時做?說明變量值的變異度有無差別時一定做為滿足t、F檢驗方差齊性要求的可不做四、如何做?多個方差的齊性檢驗——X2檢驗變量變換意義:通過改變觀察值的原初形式,使資料正太化,達到方差齊性的要求,以滿足t檢驗及方差分析的應用條件依據:只改變觀察值的分布形式,而不是其相對大小常用方法:對數變換:以觀察值x的對數值作為新的分析數據常用方式適用場合:使服從對數正態分布的資料正態化使方差達到方差齊性要求,特別是標準差與均數的比值接近時使指數曲線直線化,常用于曲線擬合平方根變換:以原觀察值x的平方根作為新的分析數據常用方式適用場合:使服從Poisson分布的計數資料或輕度偏態資料正態化使各樣本的方差與均數的正比例關系消除或削弱,達到方差齊性要求百分數、平方根、正反弦變換以原觀察值用百分數表示,平方根反正弦值作為新的分析數據適用場合:總體百分數小于30%或大于70%的情形計數資料的統計描述和推斷相對數(一)為什么引入絕對數不能做進一步分析(二)什么是相對數同一基礎上,兩個有聯系指標之比*常用指標率/頻率指標:用以說明某現象發生的頻率與強度計算比例基數—依習慣而用—使算的的率至少保留1-2位整數構成比/構成指標:用以說明某一事物內部各組成部分所占的比重或分布→總和為100%計算*若總和不為100%:超減于大,低加在小相對比:兩個有關同類指標之比,用以說明兩者的對比水平計算*指標可為平均數、絕對數、相對數動態數列:一系列按時間順序排列起來的統計指標,用以說明事物延時間發展的變化與趨勢*指標可為平均數、絕對數、相對數*動態分析:(1)絕對增量=統計期指標-基期指標說明事物在一定時期增加的絕對數量可分為逐年的、逐期的:后比前,內部波動累計的:基期固定,總體結果發展速度、增長速度:反映事物在一定時期的速度變化,可分為定基與環基發展速度=統計期指標/基期指標增長速度=發展速度-1(三)應用相對數應注意的問題計算相對數的分母一般不宜過小,對于動物實驗,可減小分析時不能以比代率計算觀察單位不等的幾個率的平均值時,不能直接相加求平均資料的對比應注意可比性率和構成比也可有抽樣誤差→假設檢驗二項分布及其應用(一)概念及其應用條件對于某個性狀,常常可以把其資料分成兩個類型。即“非此即彼”兩種情況,彼此構成對立事件,我們把這種“非此即彼”事件所構成的總體,稱為二項總體,其概率分布稱為二項分布。二項分布的概率密度函數:重復做①n次相互獨立的實驗,每次實驗②有相互獨立的結果,③P(A)=ΠP(A)=1—Π,則n次實驗中A恰好發生x次的概率實驗有①②③,則可用二項分布處理分布函數特征:Π=0.5對稱,正態0.3≤Π≤0.7近似對稱,近似正態Π〉0。7或Π〈0。3偏態嚴重,離0。5越遠,偏的越厲害二項分布近似正態分布的條件:Π,1-Π均大于0.01Π不接近0或1nΠ,n(1—Π)均大于5n足夠大二項分布的均數和標準差、(二)二項分布的應用1.總體率的可信區間點估計區間估計查表法正態近似法(條件)樣本率與已知總體率比較的假設檢驗直接計算概率法利用二項分布的概率密度和分布函數,求出p值,與所用的檢驗水準α進行比較,做出統計推斷適用條件:Π偏離0。5較遠,x較小正態近似法(條件)兩個樣本率比較的u檢驗(條件)Poisson分布及其應用(一)概念及應用條件是二項分布的一個特例,當Π或1—Π很小(<0。05)而n很大時,二項分布近似于Poisson分布常用于研究單位時間或單位面積或容積內,某罕見事件發生次數的分布概率密度函數:應用條件:同二項分布分布函數特點:離散型分布,適用于計數資料二項分布的特例,應用條件同二項分布方差等于均數,σ=λλ≥20時,Poission分布近似正態分布Poisson分布具有可加性(二)應用總體均數λ的估計(區間)查表法x≤50正態近似法樣本均數與總體均數的比較直接計算概率法正態近似法兩個樣本均數的比較u檢驗兩個樣本觀察單位數相等兩樣本單位不同時X2檢驗及其應用—-同性質、適合性、獨立性檢驗X2分布X2變量ν個標準正態變量平方和概率密度函數分布函數X2介值表X2分布與正態分布的關系隨著自由度的增加卡方分布近似于正態分布當ν=1時,二、X2檢驗的基本思想在實際操作中,k個實際頻數ki與其相應的理論頻數T的差值i=1k表示實際頻數與理論頻數的吻合程度*當n>40,Ti〉5時,上式①近似X2*可以利用X2值檢驗實際頻數與按假設檢驗計算的理論頻數是否相等的問題*如果假設成立,那X2≈0;不應出現大X2的概率P<α,如果出現,則可以懷疑假設是否成立,進而拒絕他,反之不拒絕X2的基本公式X2=TTTν四格表資料處理陽性數陰性數合計陽性率1aba+b2cdc+d合計a+cb+dnX2基本公式的專用公式X2=X2校正公式X2=A-T-0.5X2校正公式的專用公式X2=ad-bc四格表的確切概率法P=a+b!配對計數資料的X2檢驗甲處理乙處理合計+—+aba+b—cdc+d合計a+cb+dn兩種處理有誤差別X2=b-c-1兩種處理有無相關(雙向有序列聯表)XR×C列聯表X2檢驗基本數據中多于四格表用途:多個樣本率的比較樣本構成比的比較(三個以上)計數資料的相關分析基本思想、基本公式、自由度的計算同前X應用條件:1。n>402。1<T<5的格子數不能超過總格子數的1/53.不能有T<1的格子T過小的處理:增大樣本含量n合并相應的行或列刪除相應的行或列*多個樣本率/構成比的比較,結論為拒絕H0時,認為有差別,但不知其具體,應兩兩比較*如果分組標志是雙因素的,若其中一組分組標志有序單向有序列聯表.若分析構成比X2檢驗,否則用秩和檢驗(一)多個樣本率的比較(k×2表)(二)兩個樣本構成比的比較(可推多個)(2×k表)(三)計數資料的相關分析(雙向有序列聯表)頻數分布擬合優度的X2檢驗--判定樣本頻數分布是否符合某一理論Pν非參數統計*不依賴于總體的分布形式,應用時忽略分布類型是否已知*檢驗時比較分布而非參數*適用范圍廣,不受分布形式限制*可用于不能活未能精確測量的資料,尤其適用等級資料或適合于算中位數*前提為變量變換后仍不能達到正態缺點:檢驗效能低=參數統計×30%適用場合:①等級資料②偏態分布(經變換后不能正態,近似L型)③開口資料④分布不清的⑤方差不齊(經變換后仍不能達到齊性)常用方法:①符號檢驗②秩和檢驗③超越檢驗④游程檢驗⑤等級相關分析秩和檢驗配對比較的符號秩和檢驗兩個樣本比較的秩和檢驗多個樣本比較的秩和檢驗多個樣本兩兩比較的秩和檢驗t檢驗相關與回歸分析直線相關概念兩變量間的關系直線相關分析:找出一個適當的指標來描述兩個變量間的直線相關關系、相關密切程度及方向是怎樣的適用條件:雙變量正態分布或正態雙變量相關系數(指標)定義:描述兩個變量間有無直線變量關系及密切程度樣本r總體ρ意義:通過取值描述不同的相關情形相關系數的計算r=0推出ρ=0r的假設檢驗t檢驗等級相關用等級數據做直線相關分析適用場合:1。不服從雙變量正態分布的2.總體分布型未知的3.原始數據使用等級表示的等級相關系數:表明兩變量間的相關密切程度樣本rs總體ρrs的檢驗:1.查表法2。t檢驗直線回歸一、概念研究兩變量在數量上的依存關系直線回歸方程y=a+bx+ε*用容易測量的變量推算不易測得的變量*對資料的要求:1.正態雙變量:xy&yx的兩個方程(不同)2.至少有一個是正態變量,必須是y要求x是精確測定的二、直線回歸方程1。一般表達式*數學模型:Y=a+bx+ε*一般表達式:2。系數a、b的求法直線回歸方程的圖示回歸系數的假設檢驗方差分析(F檢驗)回歸系數b的t檢驗回歸方程的應用描述兩變量間的依存關系以容易測得的變量去推測不易測得的變量利用回歸方程進行預測預報(一個區間)把變量x帶入回歸方程中去估計Y利用直線回歸方程進行控制應用注意要有實際意義資料要符合要求自變量和因變量的選擇要符合實際直線回歸的范圍只限于取得原始資料的范圍直線回歸方程可以內插,一般不能外延回歸方程必須經過檢驗相關與回歸的區別與聯系區別相關回歸資料要求正態雙變量至少有一個為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論