統計背誦版(三份整合)_第1頁
統計背誦版(三份整合)_第2頁
統計背誦版(三份整合)_第3頁
統計背誦版(三份整合)_第4頁
統計背誦版(三份整合)_第5頁
已閱讀5頁,還剩13頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、統計學資料背誦版一、單選題:其次章:計量資料的統計描述1、 描述一組偏態分布資料的變異度,以四分位數間距指標較好。2、 用均數和標準差可以全面描述正態分布資料的特征。3、 各觀看值均加(或減)同一數后標準差不變。4、 比較某地12歲和55.5歲兒童身高的變異程度,宜用變異系數。5、 偏態分布宜用中位數描述其分布的集中趨勢。6、 各觀看值同乘以一個不等于0的常數后,變異系數不變。7、 正態分布的資料,均數等于中位數。8、 對數正態分布是一種右偏態分布(說明:設X變量經Y=lgX變換后聽從正態分布,問X變量屬何 種分布?)9、 橫軸上,標準正態曲線下從0到2.58的面積為49.5%10、 當各觀看

2、值呈倍數變化(等比關系)時,平均數宜用幾何均數。第3章 :總體均數的估量與假設檢驗1、 均數的標準誤反映了樣本均數與總體均數的差異。2、 兩樣本均數比較的t檢驗,差別有統計學意義時,P越小,說明越有理由認為兩總體均數不同。3、 甲乙兩人分別從同一隨機數字表抽得30個(各取兩位數字)隨機數字作為兩個樣本,求得1和S12、2和S22,則理論上由甲、乙兩樣本均數之差求出的總體均數95%可信區間,很可能包括04、 在參數未知的正態總體中隨機抽樣,丨丨t0.05/2,S的概率為5%5、 某地1992年隨機抽取100名健康女性,算得其血清總蛋白含量的均數為74g/L,標準差為4g/L,則其95%的參考值范

3、圍為74±1.96×46、 關于以0為中心的t分布,敘述錯誤的是相同時,丨t丨越大,P越大。7、 在兩樣本均數比較的t檢驗中,無效假設為兩總體均數相等。8、 兩樣本均數比較作t檢驗時,分別取以下檢驗水準,犯其次類錯誤概率最小的是=0.309、 正態性檢驗,按=0.10水準,認為總體聽從正態分布,此時若推斷有錯,其錯誤的概率等于,而未知。10、 關于假設檢驗,說法正確的是接受配對t檢驗還是兩樣本t檢驗是由試驗設計方案所打算的。第4章 :多個樣本均數比較的方差分析1、完全隨機設計資料的方差分析中,必定有SS總=SS組間SS組內2、隨機區組設計資料的方差分析中,對其各變異關系表達

4、正確的是SS總=SS處理SS區組SS誤差3、當組數等于2時,對于同一資料,方差分析結果與t檢驗結果完全等價且t=4、方差分析結果,F處理F0.05,(1,2),則統計推論是各總體均數不全相等5、完全隨機設計方差分析中的組間均方是表示某處理因素的效應和隨機誤差兩者綜合影響的結果的統計量。6、配對設計資料,若滿足正態性和方差齊性,要對兩樣本均數的差別作比較,可選擇隨機區組設計的方差分析7、個組方差齊性檢驗有統計學意義,可認為12、22、.k2不全相等第五章、計數資料的統計描述1、醫院日門診各科疾病分類資料,可作為計算構成比指標的基礎。2、計算某地某年肺癌發病率,其分子應為該地某年新發生肺癌患者3、

5、一種新的治療方法可以延長生命,但不能治愈其病,則發生下列狀況該病患病率將增加4、在使用相對數時,簡潔犯的錯誤是將構成比當做率看待5、在實際工作中,發生把構成比當做率分析的錯誤的主要緣由是由于計算構成比的原始資料較率簡潔得到6、已知男性的鉤蟲感染率高于女性。欲比較甲、乙兩鄉居民的鉤蟲總感染率,但甲鄉人口女多于男,而乙鄉男多于女,適當的比較方法是對性別進行標準化后再比較7、要比較甲乙兩廠某工種工人某種職業病患病率的凹凸,實行標準化法的原理是假設甲乙兩廠某工種工人的工齡構成比相同8、要比較甲乙兩廠工人換某種職業病的患病率,對工齡進行標化,其標準構成的選擇是甲乙兩廠合并后的工人工齡構成。9、某項關于某

6、種藥物的廣告聲稱:“在服用本制劑的1000名上感的兒童中,有970名兒童在72小時內癥狀消逝。”因此推斷此藥治療兒童的上感是格外有效的,可以推廣應用。這項推論是不正確,因未設對比組或對比組10、定基比和環比屬于相對比指標。第六章:幾種離散型變量的分布及其應用1、若某人群某疾病發生的陽性數X聽從二項分布,則從該人群隨機抽出n個人,陽性數X不少于k人的概率為P()P(1).P()2、Poisson分布的標準差和均數的關系是=23、用計數器測得某放射性物質10min內發出的脈沖數為660個,據此可估量該放射性物質平均每分鐘脈沖計數的95%可信區間為661.964、Poisson分布的方差和均數分別記

7、為2和,當滿足條件220時,Poisson分布近似正態分布。5、能用來較好地描述傳染性疾病發生規律的離散型分布是負二項分布6、在負二項分布的兩個參數和中,用來衡量分布的聚集趨向的程度是第七章:2檢驗1、2分布的外形與自由度有關2、2值的取值范圍023、當四格表的周邊合計數不變時,假如某格的實際頻數有變化,則其理論頻數不變4、下列檢驗不適用2檢驗的是兩樣本均數的比較5、以下關于2檢驗的自由度的說法,正確的是若20.05,120.05,2,則自由度126、5個樣本率作比較,220,01,4,則在=0.05檢驗水準下,可認為各總體率不全等第8章 :秩轉換的非參數檢驗1、 兩個獨立小樣本計量資料比較的

8、假設檢驗,首先應考慮資料是否符合t檢驗條件2、 配對樣本差值的Wilcoxon符號秩檢驗,確定P值的方法為T值在界值范圍內,P大于相應的3、 等級資料比較宜用非參數檢驗4、 多樣本計量資料的比較,當分布類型不清時選擇H檢驗5、 以下檢驗方法中,不屬于非參數檢驗的方法是t檢驗6、 成組設計兩樣本比較的秩和檢驗,其檢驗統計量T是以例數較小者秩和為T第9章 :雙變量回歸與相關1、 直線回歸中,假如自變量X乘以一個不為0或1的常數,則有回歸系數轉變2、 利用直線回歸估量X值所對應Y值的均數可信區間時,增加樣本含量、令X值接近其均數、減小剩余標準差、減小可信度(以上都可以)可以減小區間長度。3、 直線相

9、關假設檢驗得到P,可認為兩變量無直線關系4、 假如直線相關系數=1,則肯定有SS總=SS回5、 假如直線相關系數=0,則肯定有直線回歸的截距等于或6、 假如兩樣本1=2,12,那么b1=r17、 用最小二乘法確定直線回歸方程的原則是各觀測點距直線的縱向距離平方和最小8、 曲線擬合時,打算系數R2的大小肯定是與的積差相關系數的平方。第10章 :統計表與統計圖1、 欲比較兩地20年來冠心病和惡性腫瘤死亡率的上升速度,最好選用半對數線圖2、 202例腰椎間盤后突患者年齡分布如下所示(略),為了形象地描述該人群的年齡分布狀況,宜選用直方圖3、 比較某地在兩個年份幾種傳染病的發病率可用復式條圖4、 某地

10、一班級12名高校生的體重與肺活量數據如下(略),期望用統計圖來反映肺活量與體重之間的變化趨勢,宜繪制散點圖5、 表示某地區某年各種死因的構成比,可繪制圓圖6、 關于統計表的制作,不正確的敘述是統計表包含的內容越多越好7、 關于統計圖的制作,正確的敘述是直條圖的縱軸必需從零開頭二、簡答題1、資料的分類:A 計量資料:又稱定量資料或數值變量資料。為觀測每個觀看單位的某項指標的大小,而獲得的資料。其變量值是定量的,表現為數值大小,一般有度量衡單位。依據其觀測值取值是否連續,又可分為連續型或離散型兩類。B 計數資料:又稱定性資料或者無序分類變量資料,亦稱名義變量資料,是將觀看單位依據某種屬性或類別分組

11、計數,分組匯總各組觀看單位數后得到的資料。其變量值是定性的,表現為互不相容的性或類別。分兩種情形:(1)二分類:兩類間相互對立,互不相容。(2)多分類:各類間互不相容。C 等級資料:又稱半定量資料或有序分類變量資料,是將觀看單位按某種屬性的不同程度分成等級后分組計數,分類匯總各組觀看單位數后而得到的資料。其變量值具有半定量性質,表現為等級大小或屬性程度。2、試述頻數發布表的用途1) 描述頻數分布的類型:看是正態分布還是偏態分布;2) 描述頻數發布的特征:如可看出是數據變異范圍和統計分布規律;3) 便于發覺一些特大或特小的離群值;4) 便于進一步做統計分析和處理。3、集中趨勢和離散趨勢的描述性指

12、標及其應用條件1)集中趨勢描述性指標:算術平均數,幾何均數,中位數和百分位數。應用條件:算術平均數:可用于反映一組呈對稱分布的變量值在數量上的平均水平;幾何均數:可用于反映一組經對數轉換后呈對稱分布的變量值在數量上的平均水平;中位數和百分位數:是一種位置指標,可用于各種分布類型的資料,尤其是偏態分布資料和一端或兩端無精確數值的資料;2)離散趨勢的描述性指標:極差,四分位間距,方差與標準差,變異系數。應用條件:極差:可用于各種類型分布;四分位間距:一般和中位數一起描述偏態分布資料的分布特征;方差與標準差:可用于各種類型發布,反映一組數據的平均離散水平;變異系數(CV):多用于所觀看的指標單位不同

13、時,如身高與體重的比較,或者均數相差太大時。4、醫學參考值范圍的制定方法依據資料的分布類型不同有以下2種計算醫學參考值的方法:1)對于數據為正態分布或近似正態分布的資料,以及雖然為偏態發布但假如可以經適當的變量變換轉化為正態分布的資料都可以接受正態分布法制定醫學參考值范圍,接受此方法前一般要對資料進行正態性檢驗,且要求樣本含量較大(如n100)。2) 偏態分布資料醫學參考值范圍的制定通常接受百分位數法,所要求的樣本含量比正態分布法要多(不低于100). 5、均數的抽樣誤差與標準誤的概念 均數的抽樣誤差:由個體變異產生、隨機抽樣造成的樣本統計量與總體均數的差異,叫做抽樣誤差。標準誤的概念:樣本均

14、數的標準差也稱均數的標準誤(SEM),它反映了樣本均數間的離散程度,也反映樣本均數與相應總體均數間的差異,因而說明白均數抽樣誤差的大小。6、可信區間的概念及其精確含義可信區間的概念:可信區間通常是由2個界值即可信限/置信限(CL)構成并按預先給定的概率所確定的包含未知總體參數的一個范圍。其中較小值為可信下限,較大值為可信上限,一般表示為(L,U),用圓括號表示。精確含義:從固定樣本含量的已知總體中進行重復隨機抽樣試驗,依據每個樣本可以算得一個可信區間,那么平均有1-a(如95%)的可信區間包含了總體參數,而不是總體參數該范圍的可能性為1-a。7、假設檢驗的基本步驟及其P值的精確含義基本步驟:(

15、1)建立檢驗假設,確定檢驗水準a, Ho:為無效假設, H1: 為對立假設,a為預先規定的概率值.(2)計算檢驗統計量, (3)確定P值,做出推斷結論。P值的精確含義:依據獲得的事后概率P值與事先規定的概率檢驗水準a進行比較,看其是否為小概率大事而得出結論。若Pa,則結論為按所取檢驗水準a,拒絕Ho,接受H1,差異有統計學意義。若Pa。則結論為所取檢驗水準a,不拒絕Ho,差異無統計學意義。8、假設檢驗2類錯誤的概念類錯誤:拒絕了實際上成立的Ho,這類“棄真”的錯誤為類錯誤,前面所講的檢驗水準,就 是預先規定的允許犯類錯誤概率的最大值,類錯誤概率大小也用a表示.類錯誤:“接受”了實際上不成立的H

16、o,這類“取偽”的錯誤為類錯誤,其概率大小用表示。只取單尾,值的大小一般未知,須在知道兩總體差值、a及n時,才能算出。9、方差分析的基本思想及應用條件:A、基本思想:是依據試驗設計的類型,將全部測量值總的離均差平方和及自由度分解為兩個或多個部分,除隨機誤差作用外。每個部分的變異可由某個因素的作用(或某幾個因素的交互作用)加以解釋。通過比較不同變異的來源的均方,借助F分布作出統計推斷從而推論各種爭辯因素對試驗結果的影響。B、應用條件:各樣本是相互獨立的隨機樣本,均聽從正態分布。相互比較的各樣本的總體方差相等。具有方差齊性。10、率與構成比的區分:A 率:強度相對數,說明某現象發生的頻率或強度。B

17、 構成比:結構相對數字,表示事物內部某一部分的個體與該事物各個部分個體數的和之比。用來說明各構成部分在總體所占的比重或分布11、四格表卡方檢驗的應用條件當n40且全部的T5時,用檢驗的基本公式(7-1)或四格表資料檢驗的專用公式7-4;當P時,改用四格表資料的Fisher精確法。當n40但有1T<5時,用四個表資料檢驗的校正公式7-5或7-6;或改用四格表資料的Fisher精確概率法。 當n<40,或T<1時,用四個表資料的Fisher精確概率法12、參數檢驗與非參數檢驗的區分參數檢驗是指總體分布為已知的數學形式,對其總體參數做假設檢驗,如F檢驗、T檢驗。非參數檢驗對總體分布

18、不作嚴格假定,又稱任意分布假設檢驗。它直接對總體分布(或分布位置)做假設檢驗,它的優點是不受總體分布的限制,適用范圍廣。13、配對樣本比較的Wilcoxon秩和檢驗基本步驟第一步:做無效假設,設定檢驗標準其次步:求檢驗統計量T值:省略全部差值為0的對子數,令余下的有效對子數為n;按n個差值的確定數從小到大編正秩和負秩,遇差值的確定值相等者取平均秩,稱為相同秩;任取正秩和負秩和為T。第三步:確定P值:當n50時,查T界值表。若n>50,可用正態近似法作u檢驗。14、直線回歸與直線相關在應用中的區分直線相關用于說明兩變量間直線關系的方向和親密程度,X與Y沒有主次之分;直線回歸更進一步地用于定

19、量刻畫應變量Y對自變量X在數值上的依存關系,其中哪一個作為應變量主要是依據專業上的要求而定,可以考慮將易于精確測量的變量作為X,另一個隨即變量作為Y。繪制散點圖時,直線回歸要求X與Y聽從雙變量正態分布,直線回歸要求至少對于每個X值相應的Y要聽從正態分布,X可以使聽從正態分布的隨機變量也可以是能精確計算和嚴格把握的非隨即變量。直線回歸在用于結果的猜測時,其適用范圍一般不應超出樣本中自變量的取值范圍。15、統計表的制表原則和要求原則:首先,統計表編制要重點突出,一張表一般只表達一個中心內容,與其把過多的內容放在一個龐雜的大表里,不如用多個表格表達不同的指標和內容。其次,統計表就猶如完整的一句話,有

20、其描述的對象(主語)和內容(賓語)。通常主語放在表的左邊,作為橫標目,賓語放在右邊,作為縱標目。由左向右讀,構成完整的一句話。最終,統計表應簡潔明白,一切文字、數字和線條都盡量從簡。基本要求:1、標題:概括表的主要內容,包括爭辯的時間、地點和爭辯內容,放在表的上方。假如整個表的指標統一時,可以將爭辯指標的單位標在標題后面。2、標目:分別用橫標目和縱標目來說明表格每行和每列內容或數字的意義.留意標明指標的單 位。3、線條:至少用三條線,表格的頂線和底線將表格與文章的其他部分分隔開來,縱標目下橫線將標目的文字區與表格的數字區分隔開來。部分表格可再用橫線將合計分隔開,或用橫線將兩重縱標目分隔開。其他

21、的豎線和斜線一概省去。4、數字:用阿拉伯數字表示很多字用“-”表示,缺失數字用“.”表示,數值為0者記為“0”,不要留空頂。數字按小數位對齊。表中數字區不要插入文字。必需說明者標“*”號,在表格下方以備注的形式說明。16、常用統計圖的應用 1、直條圖:用于相互獨立的統計指標的比較 2、圓圖和百分條圖:適合描述分類變量資料的各類別所占的構成比。 3、線圖:適合于描述某統計量隨另一 連接性數值變量變化而變化的趨勢,最常用于描述統計量隨時間變化而變化的趨勢。一般線圖: 適用于連續性資料,反映事物在時間上的進展變化的趨勢,或某現象隨另一現象變遷的狀況。半對數線圖,適用于連續性資料,反映事物進展速度(相

22、對比)。 4、直方圖:適合表示連續性數值變量資料的頻數分布。 5、統計地圖:適宜描述爭辯指標的地理分布 6、箱式圖:適用于多組數據分布的比較。 7、莖葉圖:可以格外直觀地顯示數據的分布范圍和形態。 8、誤差條圖:適合于多個樣本間的差異狀況的比較。三、計算分析題樣本率與總體率的比較:直接法:在諸如療效評價中,利用二項分布直接計算有關概率,推斷樣本所在的總體率與已知總體率有無差別。比較時,經常遇到單側檢驗,即“優”或“劣”的問題。那么,在總體陽性率為的n次獨立重復試驗中,一般有下面兩種情形的概率計算。(1)若是回答“差”或“低”的問題,則需計算消滅“陽性”次數至多為k次的概率,即 k k n! P

23、(Xk)= P(X)= X(1-)n-X (6-11) X=0 X=0 X!(n-X)!(2)若是回答“優”或“高”的問題,則需計算消滅“陽性”次數至少為k次的概率,即 n n n! P(Xk)= P(X)= X(1-)n-X (6-12) X=k X=k X!(n-X)!明顯,P(Xk)+ P(Xk)=1+P(k)。 對于雙側檢驗而言,由于要回答的是“有無差別”,即備擇假設H1:0是否成立,因此,所要計算的雙側檢驗概率P值應為實際樣本(記“陽性”次數為k次)消滅的概率與更背離無效假設的大事(記“陽性”次數為i次,ik)消滅的概率之和,即P=P(X=k)+P(X=i), 其中i滿足P(X=i)

24、P(X=k)。 i例6-4 已知輸卵管結扎的育齡婦女實施壺腹部-壺腹部吻合術后受孕率為0.55。今對10名輸卵管結扎了的育齡婦女實施壺腹部-壺腹部吻合術,結果有9人受孕。問實施峽部-峽部吻合術婦女的受孕率是否高于壺腹部-壺腹部吻合術的受孕率?明顯,這是單側檢驗的問題,屬上述第2種狀況,記峽部-峽部吻合術后的受孕率為,其假設檢驗為H0:=0.55 H1:>0.55 =0.05 對這10名實施峽部-峽部吻合術的婦女,按0.55的受孕率,若消滅至少9人受孕的概率大于0.55,則不拒絕H0;否則,可視為小概率大事,拒絕H0,接受H1。本例n=10,=0.55,k=9。按公式(6-12)有 10

25、10 10! P=P(X9)= P(X)= 0.55X(1-0.55)10-X =0.023257 X=9 X=9 X!(10-X)!0.01<P<0.05,按=0.05水準,拒絕H0,接受H1,即認為實施峽部-峽部吻合術婦女的受孕率要高于壺腹部-壺腹部吻合術的受孕率。例65已知某種非傳染性疾病接受甲藥治療的有效率為0.60。今改乙藥治療該疾病患者10人,發覺9人有效。問甲、乙兩種藥物的療效是否不同? 明顯這是雙側檢驗的問題。記乙藥治療該疾病的有效率為,其假設檢驗為: H0:=0.60 H1:0.60 =0.05 本例n=10,按=0.60,實際按樣本陽性數X=9消滅的概率由公式P

26、(X)= X=0,1,2,3,n 則有:P(X=9)=0.040311這實際樣本更背離無效假設的大事,即滿足P(X=i)0.040311的i(i9)分別有:0、1、2、10。因此,所要檢驗的雙側檢驗概率P值為 P= P(X=9)+ P(X=0)+P(X=1)+ P(X=2)+ P(X=10) =0.040311+0.000104858+0.001572864+0.010617+0.006046618 =0.0586520.05P0.10,按=0.05水準,不拒絕H0 ,尚不能認為甲、乙兩種藥物的療效不同。2、樣本均數與總體均數的比較:直接法:當總體均數<20時,可接受直接計算概率的方式對

27、樣本均數與已知總體均數間的差別進行有無統計學意義的比較。如用于發病率很低的非傳染性疾病,則是對以樣本均數X為代表的總體率與已知的總體率0是否有差別進行推斷。例6-12 一般人群先天性心臟病的發病率為80/00,某爭辯者為探討母親吸煙是否會增大其小孩的先天性心臟病的發病危急,對一群20-25歲有吸煙嗜好的孕婦進行了生育觀看,在她們生育的120名小孩中,經篩查有4人患了先天性心臟病,試作統計推斷。 對于這樣一群低發病率的樣本計數資料可看作聽從Poisson分布,在120名被調研的小孩中,按0=0.008的發病水平,若有4名及以上的小孩患先天性心臟病的概率大于0.05,則尚不能認為母親吸煙會增大其小

28、孩的先天性心臟病的發病危急,否則,即說明母親吸煙會增大其小孩的先天性心臟病的發病危急,為此,本例可以作如下假設檢驗:H0:=0.008,即母親吸煙不會增大其小孩的先天性心臟病的發病危急H1:>0.008,即母親吸煙會增大其小孩的先天性心臟病的發病危急本例n=120,=n0=120X0.008=0.96 3 3 e-0.960.96x P=P(X4)=1-P(X)= P(X)=1-=0.016633 X=0 X=0 X!0.01<P<0.05,按a=0.05水準,拒絕H0,接受H1,即認為母親吸煙會增大其小孩的先天性心臟病的發病危急。直接計算概率法也可用于兩個低的發(患)病率的

29、比較,具體做法類似例6-12,只需把這兩個發(患)病率中的一個看做0,而另一個當做即可,對于雙側檢驗的情形與二項分布類似。例613 有爭辯表明,一般人群精神發育布裙的發生率為3,今調查了有親緣關系血統婚配關系的后代25000人,發覺123人精神發育不全,問有親緣關系血統婚配關系的后代其精神發育不全的發生率是否高于一般人群?可以認為人群中精神發育不全的發生數聽從Poisson分布。本例n=25000,X=123,0 =0.003, =n0 =25000×0.003=75 H0:=0.003 H1:0.003 =0.05 按公式 u= 有:u=5.543 查u界值表得單側P0.0005。

30、按=0.05水準,拒絕H0 ,接受H1 ,即認為有親緣血統關系婚配關系的后代其精神發育不全的發生率高于一般人群。課后習題:1、 已知某種常規藥物治療某種非傳染性疾病的有效率為0.70,今改用一種新藥治療該疾病患者10人,發覺9人 有效,問新藥的療效是否優于常規藥物?2、 一項爭辯表明,15歲女孩青春痘的發生率為0.60。現在某中學的一學校班上對15歲的女生以其學號為抽樣框,隨機抽取了10人,發覺9人長有青春痘。問該班15歲女生青春痘的發生率與同齡女孩青春痘的發生率是否不同?3、 一課題組對某職業人群的艾滋病學問知曉狀況進行基線調查,發覺其知曉率為60%。課題組現實行整群抽樣的方法對120名該職

31、業人員開展艾滋病學問的同伴教育活動,活動結束后按事先的設計進行了相應學問的問卷調查,發覺有96人回答正確。問這種同伴教育活動是否能提高該人群艾滋病學問的知曉率?4、 在對4550歲男性人群胃癌的發病狀況爭辯中,某醫師在甲、乙兩個地區進行了調查。甲地區調查了8000人,胃癌患者有42人;乙地區調查了7600人,胃癌患者有25人。問乙地區4550歲男性人群胃癌的發病率是否低于甲地區完全隨機設計和隨機區組設計離均差平方和及其自由度的分解、均方的計算例4-2某醫生為了爭辯一種降血脂新藥的臨床療效,按統一納入標準選擇120名高血脂患者,接受完全隨機設計方法將患者等分為4組,進行雙盲試驗。6周后測得低密度

32、脂蛋白作為試驗結果,見表4-3。問4個處理組患者的低密度脂蛋白含量總體均數有無差別?4個處理組低密度脂蛋白測量值分組niX2勸慰組3.534.594.342.663.593.132.642.563.503.25303.43102.91367.853.304.043.533.563.854.073.523.934.192.961.373.932.332.984.003.552.964.304.162.59降脂藥2.4組2.423.364.322.342.682.951.563.111.811.77302.7281.46233.001.982.632.862.932.172.722.652.222

33、.902.972.362.562.522.272.983.722.803.574.022.314.8組2.862.282.392.282.482.283.212.232.322.68302.7080.94225.542.662.322.613.642.583.652.663.682.563.023.482.422.412.663.292.703.042.811.971.687.2組0.891.061.081.271.631.891.192.172.281.72301.9758.99132.131.981.742.163.372.971.690.942.112.812.521.312.511.8

34、81.413.191.922.471.022.103.71H0:u1=u2=u3=u4,即4個試驗組的總體均數相等H1:4個試驗組的總體均數不全相等a=0.05按表中的公式計算各離均差平方和SS、自由度v、均方MS和F值。ij=102.91+81.46+80.94+58.99=324.30ij2=367.85+233.00+225.54+132.13=958.52C=(324.30)2/120=876.42SS總=958.52-876.42=82.10 v總=120-1=119SS組間=(102.91)2/30+(81.46)2/30+(80.94)2/30+(58.99)2/30-876.4

35、2=32.16 v組間=4-1=3SS組內=82.10-32.16=49.94,v組內=120-4=116MS組間=32.16/3=10.72,MS組內=49.94/116=0.43,F=10.72/0.43=24.93方差分析表變異來源自由度SSMSFP總變異11982.10組間332.1610.7224.93P<0.01組內11649.940.43按v1=3、v2=116查附表3的F界值表,得F0.01,(3,116)=3.98,24.93>F0.01,(3,116),P<0.01。結論:按a=0.05水準,拒絕H0,接受H1,認為4個處理組患者 低密度脂蛋白總體均數不全

36、相等,即不同劑量藥物對血脂中低密度脂蛋白降低有影響。例題4-4 某爭辯者接受隨機區組設計進行試驗,比較三種抗癌藥物對小白鼠肉瘤的抑制效果,先將15只染有肉瘤小白鼠按體重大小配成5個區組,每個區組內3只小白鼠隨即接受三種抗癌藥物,以肉瘤的重量為指標,試驗結果見下表:問三種不同藥物的抑制效果有無差別? H0:1=2=3,即三種不同藥物作用后小白鼠肉瘤重量的總體均數相等H1:三種不同藥物作用后小白鼠肉瘤重量的總體均數不全相等=0.05計算C=6.812/15=3.0917=3.6245-3.0917=0.5328, =15-1=14=1/5(3.072+2.172+1.572)-3.0917=0.2

37、280, =3-1=2=1/3(1.982+1.502+1.052+0.932+1.352)-3.0917=0.2284, =5-1=4=0.5328-0.2280-0.2284=0.0764, =(5-1)(3-1)=8方差分析見下表:變異來源 自由度 SS MS F P 總變異 14 0.5328 處理間 2 0.2280 0.1140 11.88 <0.01區組間 4 0.2264 0.0571 5.59 <0.05誤差 8 0.0746 0.0096 查F界值表,得F0.05,(2,8)=4.46,F0.01,(2,8)=8.65,11.88F0.01,(2,8),p0.0

38、1.按=0.05水準,拒絕H0,接受H1,認為三種不同藥物作用后小白鼠肉瘤重量的總體均數不全相等,即不同藥物的抑瘤效果有差別。課后習題:1、爭辯動物被隨機分成三個組來比較對三宗不同刺激的反應時間,問動物在三種不同刺激下的反應時間是否有差別。按v1=2,v2=39 查F界值表,得F0.01(2,39)=19.47,F=123.65>F0.01(2,39),P<0.01,結論:依據a=0.05水準,拒絕H0,接受H1,3種不同刺激下動物的反應時間有差別。2、為爭辯某藥物的的抑癌作用,使一批小白鼠致癌后,按完全隨機設計的方法隨機分為四組,A、B、C三個試驗組和一個對比組,分別接受不同的處

39、理,A、B、C三個試驗組,分別注射0.5、1.0和1.5ml30%的注射液,對比組不用藥。經肯定時間以后,測定四組小白鼠的腫瘤腫瘤,測量結果見下表。問不同劑量藥物注射液的抑癌作用有無差別。按v1=3,v2=36查F界值表,得F0.01(3,36)=4.38,F=13.71>F0.01(3,36) P<0.01。結論:按a=0.05水準,拒絕H0,接受H1,認為4個不同劑量藥物注射液的抑癌作用有差別。3、為爭辯注射不同劑量雌激素對大白鼠子宮質量的影響,取4窩不同種系的大白鼠,每窩3只,隨機第安排到3個組內接受不同劑量雌激素的注射,然后測定其子宮質量,結果見下表。問注射不同劑量的雌激素

40、對大白鼠子宮質量是否有影響。4、某醫院在苯扎溴銨(新潔爾滅)器械消毒液以工業亞硝酸鈉為防腐劑的抑菌試驗中,觀看了五種含不同品種防腐劑的苯扎溴銨溶液的抑菌效果,第20天抑菌試驗結果(抑菌直徑)如下表,問五種溶液的抑菌效果有無差別?四種細菌被抑制的效果有無差別?2、 統計重點:閉卷 期末考試80%,平常作業20%。 1、名詞解釋(10分) 5道*2 2、選擇(40分): 20道*2部分來自課后練習題 3、簡答(20分) 4道*5.分析統計圖/表,可能會以改錯的形式消滅。 4、計算分析(30分): 34道 4、可能的重點 1、計量資料:給出X,S,(樣本均數,標準差)推斷95%CI。參考值范圍,t檢

41、驗公式,I類、II類錯誤的推斷。2、 計數資料:卡方檢驗的四格表公式。3、方差分析:不考計算過程,可能會考自由度的計算。4、學會推斷結論的對錯,以及它簡潔犯哪一類錯誤?5、各檢驗方法適應條件:t檢驗,方差分析,正態分布,二項分布,POSSION分布的使用條件(何種狀況用線性相關?何種狀況用等級相關?)6、統計學是什么?用來干什么?7、計量資料的統計描述,集中和離散趨勢分別從哪幾個方面進行描述、分析?8、推斷數據屬于哪一種資料類型?小概率大事的定義9、醫學參考值范圍的概念,U界值表。如何用正態分布法、百分位數法計算醫學參考值范圍?10、正態分布的概念和特點, 標準正態分布全部把握,常見的正態曲線

42、面積分布。(1%,5%的面積分布)11、t分布的基本公式。P33可信區間的概念及精確含義。總體均數的參數估量:單一總體均數的可信區間計算。為什么要對總體均數進行估量?12、P35,假設檢驗(小概率反證法):基本思想,基本步驟。 如何確立 H0檢驗假設?13、 t檢驗:用途,分類,適用條件,留意事項。單樣本t檢驗公式。I類錯誤,II類錯誤的定義。可能的考核形式“分析結果是否正確,不正確的話,推斷簡潔犯哪一類錯誤”?P44-45,正態性檢驗的適用范圍,方差齊性F檢驗的概念,適用范圍。14、 方差分析的基本思想,變異分解,自由度的分解。推斷正態分布總體,總體方差齊性 公式不要求背,變異分解可能會以選

43、擇題的形式消滅。多樣本方差齊性比較的方法, 方差分析(不考計算過程,或許會考查自由度。任意基本思想即可)16、 計數資料的統計描述:強度相對數,結構相對數,相對比的計算。率與構成比的區分。標準化的方法,理解,不考大題。17、 二項分布的應用條件,性質,二項分布的應用分布,什么時候用正態分布法,什么時候用直接法。 POSSION分布的特點:可加性。POSSION的分布應用,尤其是兩樣本均數的比較。 負二項分布的應用調整。18、 第七章:卡方檢驗。 四格表的卡方檢驗基本思想,專用公式,校正公式及它們的使用條件,P114(大題)。擬合優度。行*列表資料的卡方檢驗專用公式,P119。關聯性檢驗公式,P

44、120。檢驗水準和,P122。19、第八章: 【問答題?】參數檢驗與非參數檢驗的概念及區分。每種的編秩過程,應用條件。20、 第九章: 什么是最小二乘法?直線相關與直線回歸的區分。相關系數,回歸系數,確定系數的定義。回歸方程的假設檢驗的剩余標準差,殘差,可信區間。 21、統計圖、統計表。 標目,可能以改錯問答題的形式消滅。統計圖分類,各種用途,關注各檢驗分析適用的條件,何種狀況用等級相關,何種狀況用線性相關。 P2,變量與資料。P4小概率大事的定義。一、名解:1.總體:依據爭辯的目的確定的同質觀看單位的全體,更精確的說,它是同質的全部觀看單位某種觀看值的集合。2、參數:描述總體數量特征的統計指

45、標3、抽樣爭辯:在醫學爭辯中,為節省人力,物力,財力和時間,一般都實行從總體中抽取樣本,依據樣本信息推斷總體特征的方法,即抽樣爭辯的方法來實現,這種從總體中抽取部分觀看單位的過程稱為抽樣4.樣本含量:從總體中隨機抽得的觀看單位,其實測值的集合,就稱樣本,該樣本中所包含的觀看單位數稱為該樣本的樣本含量5.變量:確定總體之后,爭辯者應對每個觀看單位的某項特征進行觀看或測量,這種特征能表現觀看單位的變異性,稱為變量6.計量資料:為觀測每個觀看單位某項指標的大小,而獲得的資料,一般有度量衡單位7.計數資料:為將觀看單位按某種屬性或類別分組計數,分組匯總各組觀看單位數后而得到的資料8.等級資料:又稱半定

46、量資料或有序分類變量資料,為將觀看單位按某種屬性的不同程度分為等級后分組計數,分類匯總各組觀看單位數后而得到的資料。9.誤差:泛指實測值與真值之差。按其產生的緣由和性質可粗分為隨機誤差和非隨機誤差,后者又可分為系統誤差與非系統誤差。10.隨機誤差:是一類不恒定的、隨機變化的誤差,由多種尚無法把握的因素引起。在抽樣過程中由于抽樣的偶然性而消滅的抽樣誤差。隨機誤差是不行避開的,在大量的重復測量中,或在抽樣過程中,它可消滅或大或小或正或負,呈肯定規律的變化。11.系統誤差:在試驗過程中產生的誤差,它的值或恒定不變,或遵循肯定的變化規律,其產生的緣由往往是克制的或可以把握。12.頻率與概率:在重復多次后,消滅“正面”(或“反面”)這個結果的比例稱之為頻率;描述隨機大事發生可能性大小的一個度量,稱之為概率。13.幾何均數:可用于反映一組經對數轉換后呈對稱分布的變量值在數量上的平均水平。14.醫學參考值:指包括絕大多數正常人的人體形態、功能和代謝產物等各種生理及生化指標常數,也稱正常值。15.抽樣誤差:這種由個體變異產生,隨機抽樣造成的樣本統計量與總體參數的差異。15.檢驗效能:1-稱為檢驗效能,過去稱為把握度,其意義為當兩總體確有差異,按規定檢驗水準所能發覺該差異的力量。16.率:說明某現象發生的頻率或強度;率=(某時期內發生某現象的觀看單位數/同期可能性某現象的觀看單位總數)*

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論