




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
word第一章緒論1、統計學,是關于數據收集、整理、分析、表達和解釋的普遍原理和方法。2、研究對象:具有不確定性結果的事物。3、統計學作用:能夠透過偶然現象來探測其規律性,使研究結論具有科學性。4、統計分析要點:正確選用統計分析方法,結合專業知識作出科學的結論。5、醫學統計學根本內容:統計設計、數據整理、統計描述、統計推斷。6、醫學統計學中的根本概念(1)同質與變異同質,指根據研究目的所確定的觀察單位其性質應大致一樣。變異,指總體內的個體間存在的、絕對的差異。統計學通過對變異的研究來探索事物。(2)變量與數據類型變量,是反映實驗或觀察對象生理、生化、解剖等特征的指標。變量的觀測值,稱為數據分為三種類型:定量數據,也稱計量資料,指對每個觀察單位某個變量用測量或其他定量方法準確獲得的定量結果。〔如身高、體重、血壓、溫度等〕定 性數據,也稱計數資料,指將觀察單位按某種屬性分組計數的定性觀察結果。包括二分類、無序多分類。〔進一步分為二分類和多分類,如性別分為男和女,血型分為A、B、O、AB等〕有序數據,也稱半定量數據或等級資料,指將觀察單位按某種屬性的不同程度或次序分成等級后分組計數的觀察結果,具有半定量性質。統計方法的選用與數據類型有密切的關系。〔3〕總體與樣本總體,指根據研究目確實定的所有同質觀察單位的全體,包括所有定義X圍內的個體變量值。樣本,是從研究總體中隨機抽取局部有代表性的觀察單位,對變量進展觀測得到的數據。抽樣,是從研究總體中隨機抽取局部有代表性的觀察單位。參數,指描述總體特征的指標。統計量,指描述樣本特征的指標。〔4〕誤差誤差,指觀測值與真實值、統計量與參數之間的差異。可分為三種:系統誤差,也稱統計偏倚,是某種必然因素所致,不是偶然機遇造成的,誤差的大小通常恒定,具有明確的方向性。隨機測量誤差,是偶然機遇所致,誤差沒有固定的大小和方向抽樣誤差,是抽樣引起的統計量與參數間的差異。抽樣誤差主要來源于個體的變異。統計學主要研究抽樣誤差。〔5〕概率概率,是描述某事件發生可能性大小的量度。必然事件,事件肯定發生,概率P(U)=1;隨機事件,事件可能發生,可能不發生,概率介于0WP(A)W1;不可能事件,事件肯定不發生,概率P($)=0;小概率事件,事件發生的可能性很小,概率P(A)W0.05、或P(A)W0.01。1/18word醫學科研中, P(A)W0.05 作為事物差異有統計意義,P(A)W0.01作為事物差異有高度統計意義。第二章定量數據的統計描述定量數據的統計描述方法:頻數表、直方圖、統計指標。〔1〕頻數分布頻數分布的目的:了解數據的分布X圍、集中位置以與分布形態等特征,以便根據資料分布情況選擇適宜的統計方法。頻數分布的用途:①作為陳述資料的形式;②便于觀察數據的分布類型;③便于發現數據中特大或特小的可疑值;④當樣本量大時,可用各組段的頻率作為概率的估計值。計算全距〔range,R〕:是一組數據的最大值與最小值之差。R=Max-Min確定組數與組距樣本量在100例左右,組數選擇8?15之間,一般取10組左右。組距"全距/組數確定組限第一組段必須包括最小值,最后一組段必須包括最大值。最后一組段包括最大值,且一般情況下應包含該組段上限,其余各組段區間左閉右開。計算各組段頻數[frequency〕:即計算各組段內觀察值的個數。計算各組段頻率[percent〕:即計算各組段頻數與總觀察值個數之比,用百分數表示。計算累計頻數〔叫巾32£丫6 frequency〕和累計頻率〔 cumulativepercent〕:累計頻數是由上至下將頻數累加;累計頻率是由上至下將頻率累加。〔2〕直方圖直方圖,是以垂直條段代表頻數分布的一種圖形。〔3〕頻數分布表的用途1、作為稱述資料的形式,可以代替原始資料,便于進一步分析。2、便于觀察數據的分布類型。資料分布類型分為:對稱分布和偏態分布。在統計分析時常需要根據資料的分布形式選擇相應的統計分析方法,因此對數據分布形式的判定非常重要。3、便于發現資料中某些遠離群體的特大或特小值。4、當樣本含量比擬大時,可用各組段的頻率作為概率的估計值。集中趨勢的統計指標平均數,是描述一組觀察值集中位置或平均水平的統計指標,常作為一組數據的代表值用于分析和進展組間的比擬。常用的有算術均數、幾何均數、中位數、百分位數等。算術均數,等于一個變量所有觀察值的和除以觀察值個數。總體均數用希臘字母口表示,樣本均數用符號X拔表示。算術均數適用于對稱分布的資料,如分布均勻的小樣本數據或近似正態分布的大樣本數據0算術均數易受極端值的影響,并且受極大值的影響大于受極小值的影響。幾何均數幾何均數婕6加6”憶mean,G〕,等于一個變量所有n個觀察值的乘積的n次方根。幾何均數適用于取對數后近似呈對稱分布的資料,尤其是右偏態分布數據。醫學研究中常2/18用于比例數據。【注】計算幾何均數的觀察值不能小于或等于0,因為無法求對數。中位數中位數〔巾6出2必M],是在按大小順序排列的變量的所有觀察值中,位于正中間的一個或兩個數值。當數據呈偏態分布、或頻數分布兩端無確定數值,均宜采用中位數描述集中趨勢。中位數確實定取決于它在數據序列中的位置,因此對極端值不敏感。百分位數百分位數〔percentile〕,是一個位置指標,它將一組變量值排列后劃分為假如干相等局部的分割點數值。用Px表示,X用百分數表示。表示在按照升序排列的數據中,其左側〔WPx 〕的觀察值個數在整個樣本中所占百分比為 X%,其右側〔2Px〕的觀察值個數在整個樣本中所占百分比為(100—X)%。百分位數不論資料分布類型均可計算,在實際工作中常用于確定醫學參考值X圍;在假設檢驗中用作拒絕或不拒絕檢驗假設的界值。百分位數并非由全部觀察值綜合計算得來,因此,它不如均數和標準差準確;然而中間局部的百分位數因不受資料中個別極端數據的影響,具有較好的穩定性。小結指標意義適用場合均數個體的平均值對稱分布,特別是正態分布資料。幾何均數平均倍數取對數后對稱分布。中位數位次居中的觀察值①非對稱分布;②半定量資料;③末端無確切數值;④分布不明。變異程度的統計指標變異指標,又稱離散指標,用以描述一組計量資料各觀察值之間參差不齊的程度。變異指標越大,觀察值之間差異愈大,說明變異程度越大;反之亦然。常用的有極差、四分位數間距、方差、標準差和變異系數。極差極差〔range,R],等于一個變量所有觀察值中最大值與最小值之間的差值。R=Max—Min缺點:①沒有利用觀察值的全部信息,不能反映其它數據的離散度;②各樣本含量大小懸殊時,不宜比擬其極差;③極差的抽樣誤差也較大,所以不夠穩定。極差僅適用于對未知分布的小樣本資料作粗略的分析。四分位數間距四分位數,是統計學對特殊的三個百分位數P25%、P50%和P75%的統稱四分位數間距〔quartilerange,Q〕,等于第三四分位數與第一四分位數之間的差值。Q=P75%—P25%3/18缺點:①沒有利用觀察值的全部信息,不能反映其它數據的離散度;四分位數間距僅用來描述大樣本偏態資料的變異情況。方差方差〔variance〕,是描述一個變量的所有觀察值與總體均數的平均離散程度的指標。總體方差用。2表示,樣本方差用S2表示。標準差標準差〔standard deviation,S 〕,是描述一個變量的所有觀察值與均數的平均離散程度的指標。總體標準差用。表示,樣本標準差用S表示。標準差方差或標準差屬同類變異指標,它們多用來描述均勻分布或近似正態分布的資料,大、小樣本均可,其中以標準差的應用最廣,通常與均數結合使用。比如在許多醫學研究報告中常用X拔士S的形式表達資料。變異系數變異系數〔coefficientofvariation,CV〕,是一個度量相對離散程度的指標。CV是無量綱的指標,可以用來比擬幾個量綱不同的指標變量之間的離散程度的差異,或比擬量綱一樣但均數相差懸殊的變量之間的離散程度的差異。小結指標意義適用場合極差觀察值的取值X圍不拘分布形式,概略分析。四分位數間距居中半數觀察值的極差①非對稱分布;②半定量資料;③末端無確切數值;④分布不明。標準差〔方差〕觀察值距離均數的平均程度對稱分布,特別是正態分布資料。變異系數變異程度大小的比照①不同量綱的變量間比擬;②量綱一樣但數量級相差懸殊的變量間比擬。第三章正態分布與醫學參考值X圍正態分布,是一種連續型隨機變量常見而重要的分布。正態曲線,是一條頂峰位于中央,兩側逐漸下降并完全對稱,曲線兩端永遠不與橫軸相交的鐘型曲線。如果隨機變量X的分布服從概率密度函數和概率分布函數稱連續型隨機變量X服從正態分布,記為X~N(U,。2)。n為圓周率,6為自然對數的底值,。為總體標準差,U為總體均數。正態分布的特征1、正態分布是單峰分布,以 X二口為中心,左右完全對稱,正態曲線以X軸為漸近線,兩端與X軸不相交。2、正態曲線在 X 二U 處有最大值,其值為4/18f(g=1/(uJ2n);X越遠離u,f(X)值越小,在X二口±。處有拐點,呈現鐘形。3、正態分布完全由參數口和。決定。口是位置參數,決定正態曲線在 X 軸上的位置。在。一定時,口增大,曲線沿橫軸向右移動;口較小,曲線沿橫軸向左移動。。是形狀參數,決定正態曲線的分布形態。。越大,曲線的形狀越“矮胖〃,表示數據分布越分散;。越小,曲線的形狀越“瘦高〃,表示數據分布越集中。正態曲線下面積分布規律1、服從正態分布的隨機變量在某一區間上的曲線下面積與其在同一區間上取值的概率相等02、曲線下的總面積為1或100%,以U為中心左右兩側面積各占50%,越靠近u處曲線下面積越大,兩邊逐漸減少。3、所有的正態曲線,在u左右的任意個標準差X圍內面積一樣。一些特殊情況,在U±oX圍內的面積約為68.27%,在u±oX圍內的面積約為95.00%,在U±oX圍內的面積約為99.00%。標準正態分布對任意一個服從N(u,。2)分布的隨機變量X,經Z=X-u/。變換都可以轉為U=0、o=1的標準正態分布,也稱隨機變量的標準化變換。標準正態分布的應用實際應用中,經z變換可把求解任意一個正態分布曲線下面積的問題,轉化成標準正態分布曲線下相應面積的問題。正態分布的應用1、制定醫學參考值X圍2、質量控制3、正態分布是很多統計方法的理論根底醫學參考值X圍醫學參考值X圍,指正常人的解剖、生理、生化、免疫與組織代謝產物的含量等各種數據的波動X圍。醫學參考值X圍,習慣上是包含95%的參照總體的X圍。制訂的須知事項a、抽取足夠例數的同質“正常人〃樣本★“正常人〃的定義,樣本量〔n>120],隨機化。b、確定具有實際意義的統一測量標準★指標的測量方法等要有規定,控制測量誤差。c、根據指標的性質確定是否要分組★根據實際情況、專業知識。d、根據指標含義決定單、雙側X圍★單側下限,過低異常;單側上限,過高異常;雙側,過高、過低均異常。e、選擇適當的百分X圍★絕大多數人,一般80%、90%、95%、99%;★減少誤診,取較大X圍;減少漏診,取較小X圍。f、估計參考值X圍★根據資料分布類型:正態分布法、百分位數法。第四章定性數據的統計描述相對數,是兩個有關的絕對數之比,也可以是兩個統計指標之比。5/18word計算相對數的意義主要是把基數化作相等,便于相互比擬。相對數主要用于定性資料的統計描述。常用的指標有頻率、構成比、相比照。頻率頻率〔rate〕,表示在一定X圍內某現象的發生數與可能發生的總數之比,說明某現象出現的頻率或概率。總體率用n來表示,樣本率用P來表示。需要注意的是,率在更多情況下是一個具有時間概念的指標,即用于說明在一段時間內某現象發生的強度或頻率。構成比構成比,表示某事物內部各組成局部在整體中所占的比重。構成比之和應為100%,某一構成局部的增減會影響其他構成局部相應的減少或增加;而某一局部率的變化并不影響其他局部率的變化,且其平均率不能簡單地將各率相加后平均求得。相比照相比照,是A、B兩個有關聯指標之比,用以描述兩者的比照水平。相對危險度〔relativerisk,RR〕,用于流行病學中隊列研究資料。比數比〔。ddsratio,OR〕,用于流行病學中病例對照研究資料。小結指標計算公式適用場合頻率n/N估計總體中某一結局發生的概率或可能性構成比n1/N,n2/N,…,nk/N估計總體中所有可能結局所占的比例或比重相比照A/B估計兩個指標的相對大小構成比表示某事物內部各局部所占的比例或比重,頻率是明確某現象發生的頻率或概率。構成比的分子中的個體一定是分母中的一局部,而相比照如此不一定;構成比是同一類事物的數值之比,相比照可以是任意兩個數值之比。相對數的使用注意a、區別構成比和頻率★頻率,強度相對數;構成比,結構相對數。b、使用相對數時分母不宜過小如分母太小,用絕對數表示,如“3例中死亡1例〃。c、注意相對數的可比性研究對象要同質,方法要一樣,觀察時期要一致等。d、考慮存在抽樣誤差對總體進展推斷應作統計學檢驗。率的標準化標準化率,是為了在比擬兩個不同人群的患病率、發病率、死亡率等資料時,消除內部構成〔如年齡、性別、工齡、病程長短等〕不同而不能直接比擬所產生的影響。標準化率僅用于相互比擬,不代表實際水平;當標準構成不同時,標準化率一般也不一樣O標準構成的選取從外部取一個公認的標準構成比,如全國X圍或全省X圍的數據、國際間比擬時取世界6/18word通用標準。★將幾個組的觀察例數合并,計算出合并的構成比,以其作為標準構成比。取某一個組的構成比為標準構成比。醫學中常用相對數指標死亡率,又稱粗死亡率,表示某年某地每千人中的死亡人數。反映當地居民總體死亡水平0對不同地區的死亡率進展比擬時,應注意不同地區人口年齡或性別構成的影響。假如年齡或性別構成存在差異,需先將死亡率標化后再進展比擬。年齡別死亡率,表示某年某地某年齡組每千人口中的死亡數。死因別死亡率,表示某年某地每10萬人中因某種疾病死亡的人數。反映各類病傷死亡對居民生命的危害程度。死亡(因)構成,也稱相對死亡比,表示全部死亡人數中,死于某死因者占總死亡數的百分比。反映各種死因的相對重要性。疾病統計指標發病率,表示在一定期間內,一定人群中某病新發生的病例出現的頻率。反映疾病對人群健康影響和描述疾病分布狀態的一項測量指標。患病率,也稱現患率,表示某一時點某人群中患某病的頻率。反映病程較長的慢性病的發生或流行情況。病死率,表示某期間內,某病患者中因某病死亡的頻率。反映該疾病的嚴重程度和醫療水平0治愈率,表示承受治療的病人中治愈的頻率。第五章統計表與統計圖統計表,把反映某事物的數量特征以與相互關系的統計數字用表格的形式歸納起來。特點:①防止冗長的文字表示、減少篇幅;②便于表達事物間的內在聯系和區別;③便于分析、比擬并易于發現和糾正錯誤。編制原如此a、重點突出,簡單明了一X表表達一個中心內容或主題。b、主謂清楚,層次清楚定語在標題內,主語作為橫標目,謂語作為縱標目。c、數據表達規X、文字和線條從簡結構a、標題位于統計表的最上部,應包括表的編號。b、標目縱標目標示相應一列〔或數列〕的內容;橫標目標示相應行的內容。c、線條不宜太多,一般為三線表;不允許使用豎線與斜線。d、數字7/18一律使用阿拉伯數字;同一指標的小數位數應一致,位次要對齊;數值為零時應寫“0〃,缺省用”…〃表示,不存在或不需要用“一〃表示。e、備注不是統計表的必須項目,需要時才用;★位于統計表的最下部,表格之外,用■〃號標出。統計圖統 計 圖,是指用幾何圖形〔點、線段、直條等〕顯示統計指標的大小、比照關系或變化趨勢。特 點與統計表相比,統計圖更加直觀,更便于比擬和分析。但它不能確切地顯示數字大小,因此常與統計表一并使用。常用的統計圖有:條圖、圓圖、百分條圖、線圖、直方圖等。制作原如此a、根據資料性質、分析目的選用適當的統計圖b、一個圖表達一個中心內容或主題。c、圖形應準確、美觀。結構a、標題★位于統計圖的下方,應包括圖的編號。b、圖域★一般用直角坐標系第一象限的位置表示圖域。c、標目★縱標目和橫標目,表示縱軸和橫軸數字刻度;★一般有度量衡單位。d、圖例★對圖中不同顏色或圖案代表的指標進展注釋;★圖例放在橫標目與標題之間,或放在圖域中。e、刻度★刻度數值從小到大,縱軸由下向上,橫軸由左向右。描述定量數據的統計圖直方圖,用于表示連續變量頻數分布情況。線圖,適用于描述一個變量隨另一個變量變化的趨勢。半對數線圖,用來比擬事物之間相對的變化速度。箱 圖 ,適用于比擬多組資料的集中趨勢和離散趨勢。一般選用五個描述統計量〔Min、P25、M、P75、Max〕來繪制。誤差條圖,適用于比擬多組資料的均值和可信區間。散點圖,用點的密集程度和變化趨勢來表示兩指標之間的直線或曲線關系。條圖,適用于各組資料之間指標的比擬。圓圖,描述一組構成比資料。百分條圖,描述多組構成比資料8/18word小結圖形主要目的說明條圖比擬各組之間的統計指標的差異一個坐標軸為組名稱,另一個坐標軸為頻率;多個指標變量可放在一個圖中圓圖描述變量的構成比沒有坐標軸;用圖例區分各局部百分條圖比擬多個指標變量的構成比一個坐標軸為各變量名稱,另一個坐標軸刻度為0~100%;用圖例區分各局部線圖描述一個變量隨另一個變量變化的趨勢兩個變量的觀察值必須一一對應;橫軸為自變量,縱軸為因變量半對數線圖同上因變量的變異較大時使用;其他同上箱圖比擬一個變量在多個組上的分布一個坐標軸為組名稱,另一個坐標軸為該變量的取值散點圖描述兩個指標變量之間的直線相關關系兩個變量的觀察值可以不一一對應;橫軸為自變量,縱軸為因變量第六章參數估計抽樣誤差:由個體差異和抽樣造成的樣本統計量與總體參數的差異。包括:樣本統計量與總體參數間的差異,樣本統計量間的差異。具有如下特點:1、各樣本均數未必等于總體均數;2、各樣本均數間存在差異;3 、樣本均數的分布圍繞著總體均數呈現中間多、兩邊少、左右根本對稱,近似服從正態分布;4、樣本均數的變異X圍較之原變量的變異X圍小;5、隨著樣本含量的增大,樣本均數的變異X圍逐漸縮小。均數的標準誤標準誤〔standarderror,SE],指樣本統計量的標準差。TOC\o"1-5"\h\z均數的標準誤〔standard error ofmean,SEM〕,指樣本均數的標準誤。它反映樣本均數間的離散程度,反映樣本均數與相應總體均數間的差異,說明了均數抽樣誤差的大小。在n一定的情況下,標準誤與標準差呈正比,說明當總體中各觀測值變異較小時,抽到的X 拔 與口可能相差較小,X 拔 用估計U的可靠程度高;反之,當總體中各觀測值變異較大時,可靠程度較低。標準誤與樣本含量的平方根呈反比,說明在同一總體中隨機抽樣,n越大,標準誤越小。率的抽樣誤差率的標準誤〔standard error ofrate,SER〕,指樣本率的標準誤。它反映樣本率間的離散程度,反映樣本率與相應總體率間的差異,說明了率抽樣誤差的大小。總體率標準誤用op表示,樣本率標準誤用Sp表示。總體均數的估計9/18word概述點估計〔pointestimation〕,是用樣本統計量直接作為其總體參數的估計值。區間估計〔intervalestimation〕,是按預先給定的概率(1-a)所確定的包含未知總體參數的一個X圍。點估計:優點:表達簡單缺點:未考慮抽樣誤差,無法評價參數估計的準確程度可信區間在區間估計中,預先給定的概率(1-a),稱為可信度〔confidencelevel〕,常取95%或99%。通過可信度,計算得到的區間X圍,稱為可信區間[confidenceinterval,CI〕。可信區間由兩個數值界定的可信限〔confidencelimit,CL〕構成,較小的數值為下限〔lowerlimit,L〕,較大的數值為上限〔upperlimit,U〕,一般表示為L~U。可信度為95%可信區間的涵義:假如重復100次樣本含量一樣的抽樣,每個樣本均按同一方法構建95%可信區間,如此理論上平均有95個可信區間包含了總體均數,只有5個可信區間未包含。可信區間估計的優劣:準確性,反映可信度1-a的大小,其值越接近1越好。準確性,用可信區間的寬度CU—CL衡量,寬度越小越好。t分布t分布:主要用于總體均數的區間估計和t檢驗等。丫為自由度〔degreeoffreedom,df],指能夠自由取值的變量個數。t分布的特點:1、t分布圖是一簇曲線,曲線的形態變化與自由度有關。2、隨v的增大,曲線越來越接近標準正態分布曲線;3、當v-8時,t分布的極限分布就是標準正態分布。10/18
word4、t分布的密度曲線下面積有一定的規律性。在t界值表中,橫標目為自由度,縱標目為尾部概率。一側尾部面積稱為單側概率〔one-tailedprobability〕,兩側尾部面積之和稱為雙側概率〔two-tailedprobability〕。從t界值表中看出:在一樣自由度時,|t|值越大,概率P越小。小結區別總體均數的可信區間一匚■按預先給定的概率確定的未知參數淵可瞰胤“正常人*的解剖,生理,生化等某項指標的波動區別總體均數的可信區間一匚■按預先給定的概率確定的未知參數淵可瞰胤“正常人*的解剖,生理,生化等某項指標的波動總體均數的波動乂1個體值的波動X1計算。未知:±za/2S公式 計算。未知:±za/2S公式 。或沫知但n>60:(雙側)偏態分布:Px-P100-X(雙側)樣本n?大,。?小;雁8, n?大,參考值X圍越穩CI一0兩總體均數差值的區間估計在實際工作中,常常需要估計兩總體均數之差U1—U2的大小,需估計兩總體均數差值的可信區間。總體率的區間估計小樣本率的區間估計:在樣本例數較小,且樣本率接近1或0時,利用二項分布可估計其總體率的(1-a)可信區間。當nW50,樣本例數n和陽性例數XWn/2時,直接查表得到95%和99%可信區間。當陽性例數X>n/2時,用n—X查表,獲得總體陰性率可信區間,再用1減去總體陰性率可信區間,既為總體陽性率可信區間。大樣本率的區間估計在樣本例數較大,且p和1—p均不太小,如np與n(1—p)均大于5時,樣本率p的抽樣分布近似正態分布,可按正態分布近似法求總體率的(1-a)可信區間。兩總體率差值的區間估計設兩樣本率分別為p1和p2,當n1與n2均較大,且p1,1—p1與p2,1—p2均不太小,如n1p1、n1(1—p1)、n2p2、n2(1—p2)均大于5時,可采用正態近似法對兩總體率差值進展可信區間估計。第七章假設檢驗假設檢驗〔hypothesistesting〕也稱顯著性檢驗〔significance12/18wordtest],是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質差異造成的統計推斷方法。假設檢驗的根本思想反證法思想:先提出假設,再用適當的統計方法確定假設成立的可能性大小,如可能性小,如此認為假設不成立。小概率事件:是指在一次試驗中根本上不大會發生的事件。假設檢驗的根本步驟建立假設無效假設〔nullhypothesis〕,記為H0,指需要檢驗的假設,即g=u2。確定檢驗水準檢驗水準〔levelofatest〕也稱為顯著性水準〔significancelevel〕,是預先規定的判斷小概率事件的概率尺度,記為a。實際中一般取a=0.05或a=0.01。c、選擇檢驗方法,計算統計量根據資料類型、研究設計方案和統計推斷的目的,選擇適當的檢驗方法和計算公式。如:t檢驗、u檢驗、F檢驗、x2檢驗。確定P值,作出統計推斷結論P 值〔probabilityvalue〕,指由H0所規定的總體做重復隨機抽樣,獲得等于與大于當前檢驗統計量的概率O確定P值的方法:依據檢驗統計量的自由度、檢驗水準,查檢驗統計量對應的界值表,通過檢驗界值,得到與檢驗統計量相對應的P值X圍。如:u0.05/2=1.96對應的P值為0.05。確定P值,作出統計推斷結論假設檢驗規定:如果一次試驗結果13/18wordPWa,拒絕H0,結論為“差異有統計學意義〃。P2a,不拒絕H0,結論為“差異沒有統計學意義〃。P值的習慣表述:“不顯著”〔notsignificant〕;PW”顯著〃[significant〕;PW"非常顯著”〔highlysignificant〕。假設檢驗中兩類錯誤假設檢驗是利用小概率反證法思想,從問題的對立面(H0)出發間接判斷要解決的問題(H1)是否成立,然后在假定H0成立的條件下計算檢驗統計量,最后根臧值判斷結果,此推斷結論具有概率性,因而無論拒絕還是不拒絕H0,都可能犯錯誤。檢驗效能〔poweroftest〕,指當兩總體確有差異,按a水準,假設檢驗能發現其差異的能力。記為1-B。a愈小,B愈大;a愈大,B愈小。假如要同時減小I型錯誤和II型錯誤,唯一方法是增加樣本量。第七章單樣本t檢驗〔onesamplet-test〕,適用于樣本均 X拔與均數口0的比擬,目的是檢驗樣本均數口0所代表的未知總體均數日是否與總體均數口0有差異。總體均數口0一般指理論值、標準值或經過大量觀察所得到的穩定值。配對樣本均數t檢驗〔pairedt-test〕,適用于配對設計的計量資料兩相關樣本均數的比擬,目的是檢驗兩相關樣本均數所代表的未知總體均數是否有差異。配對設計〔paireddesign〕,是將受試對象按某些重要特征相近的原如此配成對子,每對中的兩個個體隨機地給予兩種處理。14/18配對設計處理分配方式:將同一受試對象處理前后的結果進展比擬;同一受試對象隨機分配承受不同處理;同一標本的兩個部位測試同一指標;兩個同質受試對象分別承受兩種處理。兩獨立樣本均數t檢驗〔twoindependentsamplest-test〕,適用于完全隨機設計兩獨立樣本均數的比擬,目的是檢驗兩獨立樣本均數所代表的未知總體均數是否有差異。完全隨機設計〔pletelyrandomdesign〕:從某研究總體隨機抽取一定數量的研究對象,將其隨機分配到兩組,承受不同的處理后,測量某指標后進展組間比擬。兩獨立樣本均數t檢驗要求兩樣本所代表的總體方差相等 ,即方差齊性須知事項:a、假設檢驗結論正確的前提★作假設檢驗用的樣本資料,必須能代表相應的總體,各比照組具有良好的組間均衡性。b、檢驗方法的選用與其適用條件根據分析目的、研究設計、資料類型、樣本量大小等選用適當的檢驗方法。。、雙側檢驗與單側檢驗的選擇根據研究目的和專業知識予以選擇,一般選用雙側檢驗。d、假設檢驗的結論不能絕對化列出概率確實切數值或給出X圍,注明采用單側檢驗還是雙側檢驗。e、正確理解P值的統計意義第八章方差分析方差分析,能用于兩個或兩個以上樣本均數的比擬,還可分析兩個或多個研究因素的交互作用以與線性回歸方程的假設檢驗等。根本思想是:分析變異,也就是分解變異,即將數據總的變異分解為處理因素引起的變異和隨機誤差引起的變異,通過對兩者進展比擬作出處理因素有無作用的統計推斷。應用條件各組樣本是相互獨立的隨機樣本各組樣本都來自正態總體。各組總體方差相等,即方差齊性。完全隨機設計的方差分析完全隨機設計,是按一個處理因素隨機分組,統計分析處理因素各個水平組間均數差異有無統計學意義。a、變異的分解b、自由度分解c、估計方差〔均方〕d、F統計量的計算e、F分布與確定P值隨機區組設計的方差分析隨機區組設計〔randomizedblockdesign〕,是先按對試驗結果有影響的非研究因素將受試對象配成假如干個區組,再分別將各區組內的受試對象隨機分配到處理水平不同的各個組。多個樣本均數的兩兩比擬經方差分析,假如各組的均數差異無統計學意義,如此不需要作進一步的統計處理,但是15/18當方差分析結果為PVa時,只說明各組總體均數不一樣或不全一樣,不能說明各組總體均數間有差異。如果要分析哪兩組間均數有差異,需進展多組均數間的多重比擬。多個樣本均數兩兩比擬方法選擇策略第九章卡方檢驗方差齊性檢驗的作用:Bartlett檢驗法主要適用于正態分布資料的方差齊性檢驗問題。卡方檢驗常用于推斷兩個總體率〔或構成比〕之間有無差異。X2值反映了實際頻數與理論頻數的吻合程度。假如假設成立,實際頻數與理論頻數的差值較小,X2值也較小;假如假設不成立,實際頻數與理論頻數的差值較大,X2值也較大。配對四格表資料的卡方檢驗計數資料的配對設計常用于兩種檢驗方法、培養方法、診斷方法的比擬。特點是對樣本中各觀察單位分別用兩種方法處理,然后觀察兩種處理方法的某兩分類變量的計數結果RXC列聯表資料的卡方檢驗用于多個樣本率的比擬、兩個或多個構成比的比擬。根本數據為:⑴多個樣本率比擬時,有R行2列;⑵兩個樣本構成比比擬時,有2行C列;⑶多個樣本構成比比擬時,有R行C列。采用Bonferroni法進展多個樣本率的兩兩比擬,步驟如下:①對需要比擬的行X列表資料進展X2分割,變成多個四格表;②對每個四格表進展X2檢驗;③采用〔a'二a/比擬次數〕計算調整的水準,其中1為事先確定的水準;④以a’調整作為檢驗檢驗水準,作出結論。RXC列表表X2檢驗須知事項:假如有1/5以上的格子出現1WT<5,如此增大樣本含量,以達到增某某論頻數的目的;③結合專業,刪去理論頻數太小的格子對應的行或列;④結合專業,將理論頻數太小的行或列與性質相近的行或列合并;⑤用雙向無序RXC表資料的Fisher確切概率法。人多個樣本率比擬,假如統計推斷為拒絕H0,承受H1,只能認為各總體率或構成比之間總的來說有差異。假如要進一步了解哪兩者之間有差異,可用卡方分割法,或者調整檢驗水準。c、對于單向有序的RXC表資料,在比擬各處理組的效應有無差異時,應該用秩和檢驗。第十章非參數秩和檢驗參數檢驗,是基于隨機樣本來自某分布的總體,推斷兩個或兩個以上總體參數是否一樣的方法。常用的方法有:t檢驗、方差分析。特點主要有:16/18①對總體參數進展估計或檢驗是主要目的;②要求總體分布;③統計量有明確的理論依據;④有嚴格的使用條件,要求總體分布符合正態分布、總體方差齊性、數據間相互獨立。非參數檢驗〔nonparametrictest〕,是在不考慮總體參數和分布類型的情況下,對總體的參數和分布位置進展檢驗的方法。常用的方法有:秩和檢驗、符號檢驗。特點主要有:①適用X圍廣,可應用于總體分布類型未知的計量資料、偏態分布的資料、等級資料、不滿足參數檢驗條件的資料等;②受限條件少,更適合一般情況;③具有較好的穩健性;④方法簡便,易于理解和掌握。秩和檢驗〔ranksumtest〕,是基于秩次的假設檢驗方法,屬非參數檢驗X疇。秩
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 湖北鐵道運輸職業學院《先進材料制備技術》2023-2024學年第二學期期末試卷
- 柳州城市職業學院《媒介產業化經營》2023-2024學年第二學期期末試卷
- 貴州財經職業學院《鋼結構設計》2023-2024學年第二學期期末試卷
- 東北師范大學《爬蟲開發與實踐》2023-2024學年第二學期期末試卷
- 河南物流職業學院《資源分析與環境修復技術》2023-2024學年第二學期期末試卷
- 青海衛生職業技術學院《預算管理》2023-2024學年第二學期期末試卷
- 四川警察學院《日本近代文學講讀》2023-2024學年第二學期期末試卷
- 宣城職業技術學院《婦女健康與康復》2023-2024學年第二學期期末試卷
- 漳州城市職業學院《企業經營管理沙盤》2023-2024學年第二學期期末試卷
- 天津醫科大學《基礎化學實驗C》2023-2024學年第二學期期末試卷
- 新能源汽車維修技術與標準
- DZ∕T 0211-2020 礦產地質勘查規范 重晶石、毒重石、螢石、硼(正式版)
- 人體常見病 知到智慧樹網課答案
- 幼兒詩歌《家》課件
- 2023年調度受令資格和停電申請資格考試題庫(筆試+停送電操作單+上機題)
- JJG 818-2018磁性、電渦流式覆層厚度測量儀
- 橫山縣朱家峁煤礦礦山地質環境保護與土地復墾方案
- (高清版)DZT 0217-2020 石油天然氣儲量估算規范
- 公路局應急培訓課件
- 短視頻運營實戰:抖音短視頻運營
- 2023年北京普通高中學業水平等級性考試生物卷
評論
0/150
提交評論