復習資料(醫學統計)_第1頁
復習資料(醫學統計)_第2頁
復習資料(醫學統計)_第3頁
復習資料(醫學統計)_第4頁
復習資料(醫學統計)_第5頁
已閱讀5頁,還剩53頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

復習資料(醫學統計)復習資料(醫學統計)58/58PAGE58復習資料(醫學統計)復習資料(醫學統計)復習資料第一大題:單項選擇題1、欲了解某市8歲小學生的身高情況,該市某小學二年級8歲小學生是:()A.樣本B.有限總體C.無限總體D.個體2、抽樣調查了某地4歲男孩的生長發育情況,得到身高均數為98.67cm,標準差為4.63cm,頭圍均數為46.23cm,標準差為3.16cm,欲比較兩者的變異程度,下列結論正確的是:()A.身高變異程度大B.頭圍變異程度大C.身高和頭圍的變異程度相同D.由于兩者的均數相差很大,無法比較兩者的變異程度3、在計算方差時,若將各觀察值同時減去某一常數后求得的方差:()A.會變小B.會變大C.不變D.會出現負值4、某地2006年肝炎發病人數占當年傳染病發病人數的10.1%,該指標為()A.概率B.構成比C.發病率D.相對比5、兩個分類變量的頻數表資料作關聯性分析,可用()A.積距相關或等級相關B.積距相關或列聯系數C.列聯系數或等級相關D.只有等級相關6、對于服從雙變量正態分布的資料,如果直線相關分析算出的值越大,則經回歸分析得的相應的b值:A.越大B.越小C.比r小D.可能較大也可能較小7、多組均數的兩兩比較中,若不用q檢驗而用t檢驗,則:()A.結果更合理B.結果一樣C.會把一些無差別的總體判斷為有差別D.會把一些有差別的總體判斷為無差別8、在比較甲、乙兩種監測方法測量結果是否一直時,若采用配對設計秩和檢驗,甲、乙兩法測量值之差中有-0.02、0.02,若差值絕對值的位次為3、4,則這兩個差值的秩次分別為:()A.-3.5,3.5B.-3.5,-3.5C.3.5,3.5D.-3,49、Y=14+4X是1~7歲兒童以年齡(歲)估計體重(市斤)回歸方程,若體重換成國際單位kg,則此方程:()A.截距改變B.回歸系數改變C.兩者都改變D.兩者都不變10、某衛生局對其轄區內甲、乙兩醫院醫療技術人員的業務素質進行考核,在甲醫院隨機抽取100人,80人考核結果為優良;乙醫院隨機抽取150人,100人考核結果為優良。本題中資料類型與設計類型分別為:A.定量資料成組設計B.定量資料配對設計C.分類資料成組設計D.分類資料配對設計11、在某農村地區隨機抽取100名兒童,進行蛔蟲感染情況糞檢,結果50名兒童蛔蟲卵糞檢為陽性,則該地兒童蛔蟲卵糞檢總體陽性率的95%的置信區間為:()A.35%-60%B.37%-63%C.30%-70%D.40%-60%12、兩樣本均數比較,經t檢驗,差別有顯著性時,P越小,說明:()A.兩樣本均數差別越大B.兩總體均數差別越大C.越有理由認為兩總體均數不同D.越有理由認為兩樣本均數不同13、用于推斷總體特征的樣本應該是:()A.從總體中隨機抽取的一部分B.從總體中隨便抽取的一部分C.總體中有價值的一部分D.總體中便于測量的一部分14、某研究欲了解男性高血壓患者與女性高血壓患者血脂是否有差異,從某市6家醫院隨機調查了400人,測量血脂水平,經t檢驗,得P<0.05,有統計學差異,由此推斷該地男、女高血壓患者血脂總體均數有差別,這里所謂有統計學差異是指:()A.兩樣本均數差別有統計學差異B.兩總體均數差別有統計學差異C.兩樣本均數和兩總體均數的差別有統計學差異D.其是有一個樣本均數和總體均數有統計學差異15、下列關于醫學參考值范圍的敘述不正確的是:()A.沒有疾病的人的解剖、生理、生化等數據的波動范圍B.習慣以包含95%或99%的觀察值為界值C.根據專業知識確定單側范圍或雙側范圍D.資料為正態分布時,選擇正態分布法計算16、假設某地35歲以上正常成年男性收縮壓的總體均數為120.2mmHg,標準差為11.2mmHg,后者反映的是:()A.個體變異的大小B.抽樣誤差的大小C.系統誤差的大小D.總體的平均水平17、在計算標準化率時,標準人口應選擇:()A.文獻中經常涉及的非目標人群B.方便獲得、與目標人群不同類的人群C.前人研究過、與目標人群不相關的人群D.有代表性的、較穩定的、數量較大的人群18、Wilcoxon兩樣本比較的秩和檢驗在編秩時,若遇到兩組中有相同數值,應:()A.不計秩次B.依次序編秩C.取其平均秩次D.以平均秩次的整數為秩19、下列關于直線回歸的說法中,錯誤的是:()A.回歸分析前應繪制散點圖B.應變量與自變量關系應為線性C.回歸方程可用來描述兩定量變量間數量依存的關系D.假設檢驗的P值能夠反映自變量對應變量數量上的影響大小20、下列關于樣本含量的敘述,正確的是:()A.樣本含量越大越好B.以實際可以收集到的樣本例數為準C.時間、財力、人力等條件允許下的最大樣本例數D.一定的推斷精度和檢驗效能下的最少樣本例數21、均數與標準差的關系:()A.均數越大,標準差越大B.均數越大,標準差越小C.標準差越大,均數對各變量值的代表性越好D.標準差越小,均數對各變量值的代表性越好22、兩樣本均數比較,經t檢驗,差別有顯著性時,P越小,說明:()A.兩個樣本均數差別越大B.兩總體均數差別越大C.越有理由認為兩總體均數不同D.越有理由認為兩樣本均數不同23、成組設計的方差分析中,有()A.MS組間=MS組內B.SS組內=SS組間C.MS總=MS組間+MS組內D.SS總=SS組間+SS組內24、比較身高和體重兩組數據變異度大小宜采用:()A.變異系數(CV)B.方差(S)C.極差(R)D.四分位數間距25、正態近似法估計總體率的95%置信區間為:()A.B.C.D.26、成組設計四格表資料的X2檢驗,選用基本公式的條件A.A≥5B.T≥5C.A≥5且T≥5D.n≥40且T≥527、對于一組服從雙變量正態分布的資料,經直線相關分析得相關系數=1,則有:()A.SS總=SS殘B.SS殘=SS回C.SS總=SS回D.SS總>SS回28、3.由兩樣本均數的差別推斷兩總體均數的差別,H0:μ1=μ2,H1:μ1≠μ2。t檢驗結果P<0.05,拒絕H0,接受H1,是因為:()A.第一型錯誤小于5%B.H0成立的可能性小于5%C.第二型錯誤小于5%D.H1成立的可能性大于95%29、正態分布曲線下,橫軸上,從均數μ到μ1.96SS的面積為:()A.95%B.45%C.97.5%D.47.5%30、符合t檢驗條件的數值變量資料如果采用秩和檢驗,則下列說法正確的是:A.第一類錯誤增大B.第二類錯誤增大C.第一類錯誤減少D.第二類錯誤減少31、實驗設計應遵循的基本原則是:A.隨機化、對照、盲法B.隨機化、盲法、配對C.隨機化、重復、配對D.隨機化、對照、重復32、以下資料類型不宜用秩和檢驗的是:()A.等級資料B.二項分布C.極度偏態分布資料D.數據一端不確定資料33、某研究檢測了男性和女性紅細胞數,經檢驗該資料總體方差相等,欲比較男性和女性的紅細胞數有無差異,取雙側a=0.05,經成組t檢驗得P<0.01,則:()A.可認為男性和女性的紅細胞均數差異有統計學意義B.可認為男性和女性的紅細胞均數無差異C.可認為男性和女性的紅細胞均數差異很大D.尚不能認為男性和女性的紅細胞均數有差異34、根據500例正常人的發鉛原始數據(偏態分布),計算其95%醫學參考值范圍應采用:()A.雙側正態分布法B.雙側百分位數法C.單上側百分位數法D.單下側百分位數法35、用于推斷總體特征的樣本應該是:()A.從總體中隨機抽取的一部分B.從總體中隨便抽取的一部分C.總體中有價值的一部分D.總體中便于測量的一部分36、宜用均數和標準差進行統計描述的資料分布類型是:()A.正態分布B.對數正態分布C.正偏態分布D.兩端無確切值的分布37、關于t分布特征的敘述錯誤的是:()A.分布為單峰分布B.t分布曲線是一簇曲線C.以0為中心,左右對稱D.自由度越大,t分布曲線的峰部越低,尾部越高38、隨機抽取某市100名10歲女孩,測得其體重均數為35kg,若以一定的概率估計該市10歲女孩體重的總體均數,宜采用:()A.點估計B.區間估計C.假設檢驗D.醫學參考值范圍39、下列關于樣本含量的敘述,正確的是:()A.樣本含量越大越好B.以實際可以收集到的樣本例數為準C.以實際可以收集到的樣本例數為準D.一定的推斷精度和檢驗效能下的最少樣本例數40、方差分析的應用條件:()A.樣本小,來自正態總體,樣本間相互獨立B.樣本來自正態總體,樣本例數足夠小C.樣本例數小,樣本相互獨立D.樣本來自正態總體,方差齊,樣本數據獨立41、用最小二乘法建立直線回歸方程的原則是各實測點距回歸直線的:()A.縱向距離平方和最小B.垂直距離的和最小C.垂直距離的平方和最小D.縱向距離之和最小42、若以成年男性血紅蛋白低于120g/L為貧血的判斷標準,調查某地成年男性1000人,記錄每人是否患有貧血,結果有19名貧血患者,981名非貧血患者,則該資料的類型為:()A.定量資料B.二項分類資料C.有序多分類資料D.無序多分類資料43、對兩個地區惡性腫瘤發病率進行比較時,應該:()A.排除兩地人口年齡構成不同的影晌B.排除兩地總人口數不同的影響C.排除各年齡組死亡人數不同的影響D.排除抽樣誤差44、用某療法治療急性腰扭傷病人30例,兩周后25例患者痊愈,由此可認為:()A.該療法療效好B.該療法療效一般C.因無對照,尚不能說明該療法的療效如何D.因冶療例數少,尚不能說明該療法的療效如何45、在計算標準化率時,標準人口應選擇:()A.有代表性的、較穩定的、數量較大的人群B.方便獲得、與目標人群不同類的人群C.前人研究過、與目標人群不相關的人群D.根據研究目的隨機抽樣獲得的小樣本人群46、不受年齡構成的影響,能夠反映整個人群死亡水平的指標是:()A.死因別死亡率B.粗死亡率C.標準化死亡率D.年齡別死亡率47、描述血清抗體滴度資料的平均水平宜選用:()A.均數B.中位數C.幾何均數D.標準差48、抽樣調查某市正常成年男性與女性各300人,測得其血紅蛋白含量,欲比較男性與女性的血紅蛋白含量有無差異(假設男性和女性的血紅蛋白的方差相等),應采用:()A.樣本均數與總體均數比較的t檢驗B.配對t檢驗C.成組t檢驗D.成組設計兩樣本比較的秩和檢驗49、完全隨機設計的方差分析組間變異源于:()A.個體變異B.隨機變異C.處理因素D.隨機變異和處理因素50、某醫生對患某病的10例成年男性患者的血清蛋白含量與血紅蛋白含量資料進行分析,得到兩變量的相關系數為r=0.916且p<0.001,下列說法正確的是:()A.兩變量呈正相關關系B.兩變量呈負相關關系C.兩變量不存在相關關系D.兩變量間相關關系密切程度不高51、下列分布中,均數等于方差的是:()A.X2B.u分布C.二項分布D.Poisson分布52、已知男性的鉤蟲感染率高于女性,今欲比較甲,乙兩鄉居民的鉤蟲感染率,最合適的方法是:()A.分性別進行比較B.兩個率比較的X2檢驗C.不具可比性,不能比較D.對性別進行標準化后再比較53、在同一正態總體中隨機抽樣,總體均數有90%的可能在:()A.B.C.D.54、正態性檢驗,按α=0.10水準,認為總體不服從正態分布,此時若推斷的錯,其錯誤的概率為:()A.等于0.10B.β,而β未知C.等于0.90D.1-β,且β未知55、對于R×C行列表的X2檢驗,其自由度計算公式為:()A.R-1B.C-1C.(R-1)(C-1)D.R×C-156、某研究欲比較正常人(n1=10)與單純肥胖者(n2=8)血漿總皮質醇是否有差異,采用秩和檢驗。計算得T1=96.5,T2=74.5,查兩樣本比較的秩和檢驗用T界值表:當雙側α=0.1時,T界值范圍為56~96;當雙側α=0.05時,T界值范圍為53~99;當雙側α=0.01時,T界值范圍為47~105。則P值為:()A.P>0.10B.0.05<P<0.10C.P=0.05D.0.01<P<0.0557、下列符號中表示總體參數的是:()A.tB.πC.χ2D.58、下列關于均數的標準誤的敘述錯誤的是:()A.是樣本均數的標準差B.反映樣本均數抽樣誤差大小C.與成正比,與成反比D.其值越大,用樣本均數估計總體均數的可靠性越好59、采用正態近似法估計總體率的置信區間,要求:()A.n≥50B.P不接近與0C.np或n(1-p)大于5D.np與n(1-p)均大于560、為了反映某地區五年期間鼻咽癌病例的年齡分布,可采用___A.直方圖B.普通線圖C.半對數線圖D.復式直條圖第二大題:多項選擇題1、當四格表的周邊合計數不變時,若某個格子的實際頻數有變化,則其理論頻數說法不正確的是:A.增大B減小C.不變D.不確定E.隨該格實際頻數的增減而增減2、方差分析的條件是A.各樣本相互獨立B各樣本來自正態總體C.各處理組總體方差相等D.樣本例數大于50E.各處理組樣本例數應相等3、頻數表可用于A.揭示資料分布類型B揭示資料分布特征C.發現可疑值D.計算某些統計指標E.參數估計4、某醫生對患某病的10例成年男性患者的血清蛋白含量與血紅蛋白含量資料進行分析,得到兩變量的相關系數為=0.916,且P<0.001,下列說法正確的是()A.兩變量呈正相關關系B兩變量呈負相關關系C.兩變量不存在相關關系D.兩變量間相關關系密切E.兩變量間相關關系較弱5、兩樣本比較的t檢驗的適用條件為()A.資料須為數值變量資料B資料服從正態分布C.兩總體方差相等D.任何資料類型E.不確切數據資料6、某研究調查了某地100名高血壓患者的血膽固醇含量,經計算其均數為6.58mmol/L,標準差為1.23mmol/L,當樣本含量增大到500人時,以下說法不正確的是:()A.標準差會變小B標準差會變大C.標準誤會變小D.標準誤會變大E.標準差與標準誤均不變7、X2檢驗可用于:()A.兩個及兩個以上樣本均數的比較B配對設計兩個樣本率的比較C.多個樣本率或構成比的比較D.頻數分布的擬合優度檢驗E.率的線性趨勢檢驗8、下列指標中可用于描述頻數分布集中趨勢的指標有:()A.全距B.標準誤C.均數D.變異系數E.中位數9、當兩總體方差相同時,以下方法適用于兩樣本均數比較的是:()A.t檢驗B.t’檢驗C.Z檢驗D.方差齊性檢驗E.方差分析10、兩樣本均數比較時,已知n1、n2均小于30、總體方差不齊且呈極度偏態的資料宜用()A.t’檢驗B.t檢驗C.u檢驗D.秩和檢驗E.沒有合適的統計方法11、假設某地35歲以上正常成年男性收縮壓的總體均數為120.2mmHg,標準差為11.2mmHg,從該地隨機抽取20名35歲以上正常成年男性,其平均收縮壓為112.8mmHg,又從該地隨機抽取10名7歲正常男孩,測得其收縮壓為90.5mmHg,標準差為10.4mmHg,則下列說法不正確的是:()A.C.D.E.12、下列屬于相對比的指標是:()A.相對危險度RRB比值比ORC.病死率D.變異系數E.性比例13、某研究用甲、乙兩種方法測量某市10處水源中氟含量(mg/L),采用Wilcoxon符號秩和檢驗比較兩種方法測量結果有無差別,下列編秩方法錯誤的是:()A.差值從小到大編秩B差值的絕對值從小到大編秩C.差值從大到小編秩D.差值的原始值從大到小統一編秩E.原始值從小到大分別編秩14、若樣本相關系數r=0,則下列說法不正確的是:()A.兩變量(x,y)不存在任何關系B兩變量存在相互關系的可能性很小C.兩變量的關系尚不能確定D.兩變量間必然存在某種曲線關系E.兩變量間不存在直線關系,但不排除存在某種曲線關系15、對于服從雙變量正態分布的資料,如果直線相關分析算出的r值越大,則經回歸分析得的相應的b值,下列說法不正確的是()A.越大B越小C.比r小D.比r大E.可能較大也可能較小16、在多組均數的兩兩比較中,若不用q檢驗而用t檢驗,則下列不正確的是:()A.結果更合理B結果一樣C.會把一些無差別的總體判斷為有差別D.會把一些有差別的總體判斷為無差別E.因條件不足,尚不能判斷17、關于t分布,下列敘述正確的是:()A.t分布是以0為中心,左右對稱的一簇單峰曲線B自由度越小,曲線峰度越低,尾部越高C.當自由度趨近于無窮大時,t分布就是標準正態分布D.自由度相同時,t的絕對值越大,概率P值就越小E.自由度越大,相同概率值的t界值越大18、下列指標,屬于絕對數的是:()A.甲區的急性傳染病人數為乙區的1.25倍B甲區某年急性傳染病的發病率為382/10萬C.甲區占某市急性傳染病的比重為18%D.某區某男身高為168厘米E.甲區某年急性傳染病人數為2600人19、下列屬于非參數檢驗方法的是:()A.t檢驗B.H檢驗C.Wilcoxon符號秩和檢驗D.方差分析E.M檢驗20、下列關于相關系數r的說法錯誤的是:()A.根據|r|大小可將兩變量關系分為低、中、高度相關B根據兩組的|r|可直接比較相關密切程度C.若r>0.5,則x和y必存在線性相關D.得r值后尚須作假設檢驗才能確定x和y有無線性相關E.正態雙變量資料可以根據對b的假設檢驗對r作出判斷第三大題:簡答題1、計算參考值范圍的方法有那些。答:正態分布法和百分位數法。(2分)

當指標服從正態分布時,用正態分布法;(1.5分)不服從正態分布時,用百分位數法。(1.5分)2、方差分析的基本思想及應用條件是什么?答:基本思想:將全部觀察值的總變異按設計類型分解成兩個或多個組成部分,然后將各部分的變異與隨機誤差進行比較,以判斷各部分的變異是否具有統計學意義。(3分)應用條件:各樣本是相互獨立的隨機樣本,且服從正態分布,各樣本的總體方差齊性。(2分)3、簡述率的標準化需要注意的問題。答:(1)標準化法的目的是為了通過選擇同一參照標準,消除混雜因素的影響,使算得的標準化率具有可比性。但標準化率并不代表真實水平,選擇標準不同,計算出的標準化率也不相同。因此標準化率是用于相互間的比較,實際水平應采用未標化率來反映。(2分)

(2)樣本的標準化率是樣本指標值,亦存在抽樣誤差,若要比較其代表的總體標準化率是否相同,需作假設檢驗。(1分)

(3)注意標準化方法的選用。如對死亡率的年齡構成標準化,當已知被標化組的年齡別死亡率時,宜采用直接法計算標準化率。但當被標化組各年齡段人口數太少,年齡別死亡率波動較大時,宜采用間接法。(1分)

(4)各年齡組率若出現明顯交叉,或呈非平行變化趨勢時,則不適合采用標準化法,宜分層比較各年齡組率。此外,對于因其它條件不同,而非內部構成不同引起的不可比性問題,標準化法難以解決。(1分)4、簡述患病率和發病率的區別。答:發病率表示在一定時期內,可能發生某病的一定人群中新病例出現的頻率,其分子是一定期間內的新發病例數。(2分)

患病率指在某特定時間內總人口中某病新舊病例所占比例,適用于病程較長的疾病或發病時間不易明確的疾病的統計研究,按觀察時間的不同可分為時點患病率和期間患病率。(1分)

時點患病率用于反映在調查或檢查時點一定人群中某病的現患情況(包含該病的新、舊病例);(1分)

期間患病率可用于反映在觀察期間內一定人群中存在或流行某病的頻度,包括觀察期間內的新病例數和現患病例數,但資料收集較為困難。(1分)5、請舉例說明什么是總體和樣本。答:總體:是根據研究目的確定的所有同質觀察單位某種觀察值的集合,通常有無限總體和有限總體。(2分)例:略。(1分)樣本:是從總體中抽取部分觀察單位其實測值的集合。(1分)例:略。(1分)6、在完全隨機設計的方差分析中SS總、SS組間、SS組內各表示的含義?答:SS總是各觀測值與總均值之差的平方和,即總的離均差平方和,表示總變異的大小(2分);SS組間表示組間變異,指各處理組均值大小的不同,是有處理因素和隨機誤差造成的(2分);SS組內表示組內變異,指同一處理組內部給觀察值之間的變異,是由隨機誤差造成的。(1分)7、簡述非參數統計方法的應用條件。答:(1)資料不服從正態分布、方差齊或總體分布類型未知(1分)(2)等級資料(1分)(3)個別數值偏大或某一端為確定數值(1分)(4)在資料滿足參數統計的要求時,應首選參數法,以免降低檢驗效能。(2分)8、簡述實驗設計和調查設計的主要區別。答:調查設計指在沒有任何干預措施的條件下,客觀的觀察和記錄研究對象的現狀及其相關特征,(2分),影響因素較多,誤差較難控制。(1分)實驗設計指研究者根據研究目的,主動加以干預措施,并觀察其結果,回答研究假設所提出的問題,(1分)影響因素較少,較易控制誤差。(1分)9、簡述小概率事件原理。答:當某事件發生的概率小于或等于0.05時,統計學上習慣稱該事件為小概率事件。(2分)其含義是該事件發生的可能性很小,進而認為它在一次抽樣中不可能發生,這就是小概率事件的原理,也是進行統計推斷的基礎。(3分)10、參數統計和非參數統計的區別。答:(1)參數檢驗是以特定的總體分布為前提,對未知總體參數做推斷的假設檢驗方法;非參數檢驗不以特定的總體分布為前提,也不針對決定總體分布的參數做推斷。(2分)(2)非參數檢驗不要求總體的分布類型,適用性廣泛;在非參數檢驗中,一般不直接用樣本觀察值做分析,統計量的計算基于原數據在樣本中的秩次,因此損失了部分樣本信息。(2分)(3)若對符合參數檢驗條件的資料用非參數檢驗,則檢驗效能低于參數檢驗。因此對于符合參數檢驗的資料,或經變量變換后符合參數檢驗的資料應首選參數檢驗;對不滿足參數檢驗條件的資料,應選用非參數檢驗。(1分)11、簡述Pearson積距相關與Spearman秩相關的區別和聯系。答:區別:(1)Pearson積矩相關適用于二元正態分布資料,Spearman秩相關適用不服從正態分布、總體分布未知、存在極端值或原始數據用等級表示的資料。(1分)(2)Pearson積矩相關是基于原始數據進行統計分析,而Spearman秩相關是將原始數據進行秩變換后進行統計分析。Pearson積矩相關是參數檢驗方法,而Spearman秩相關不以特定的總體分布為前提,為非參數檢驗的方法。(2分)

聯系:(1)兩種相關系數的取值都介于-1和1之間,無單位,小于0為負相關,大于0為正相關。(2)用原始數據的秩次來計算Pearson相關系數,得到的即為Spearman秩相關系數。(2分)12、可信區間與醫學參考值范圍的區別。答:(1)意義不同:可信區間:按一定的置信度(1-a)估計總體均數所在的范圍;醫學參考值范圍:大多數“正常人:的某項解剖、生理、生化指標的波動范圍。(2分)(2)計算公式不同:可信區間用的是標準誤,而醫學參考值范圍用的是標準差。(2分)(3)用途不同:可信區間用于總體均數的估計和假設檢驗,醫學參考值范圍是用于判斷觀察對象的某項指標是否正常,為臨床提供參考。(1分)13、t檢驗中是否都應采用雙側檢驗?答:t檢驗中是選擇單側檢驗還是雙側檢驗,需根據專業知識來確定。(3分)例如,根據專業知識能確定未知總體均數不會大于已知總體均數時,此時則用單側檢驗,否則,采用雙側檢驗。(2分)14、標準差和標準誤的區別和聯系是什么?答:區別:1)計算公式不同:標準差,標準誤;(1分)2)統計學意義不同:標準差越小,說明個體越集中,均數對數據的代表性好;標準誤越小,說明抽樣誤差越小,用樣本均數來估計總體參數的可能性越大;(1分)3)用途不同:標準差用于描述個體值的變異程度,標準誤用于描述均數的抽樣誤差大小。(1分)

聯系:當樣本量n一定時,標準誤隨標準差的增加而增加,公式為。(2分)15、簡述x2檢驗的基本思想。答:基本思想:判斷實際頻數與理論頻數的差別是否由抽樣誤差所引起,x2值的大小反映了實際頻數與理論頻數的吻合程度。(2分)在H0成立的條件下,實際頻數與理論頻數相差不應該很大,若計算得到較大的x2值,超過了事先設定的檢驗水準所對應的x2值,則P<0.05,說明實際頻數與理論頻數的較大差別是由抽樣誤差所引起的可能性很小,有理由拒絕H0,接受H1。16、簡述回歸方程中a、b的含義?答:α:即截距,表示x=0時,的值。(2.5分)b:即直線的斜率,表示自變量x改變一個單位時,應變量y平均變化b個單位。(2.5分)第四大題:判斷分析題1、某地抽樣調查360名健康成年男子的紅細胞數,均數為4.66×1012/L,標準差為0.58×1012/L,故該研究者得出該地健康成年男子的紅細胞數的95%可信區間為(4.66±1.96×0.58)1012/L。請問該結論是否正確,并說明理由。答:不正確.

可信區間用的是標準誤,而95%醫學參考值范圍用的才是標準差,(1分)該題求的95%可信區間用的是標準差,混淆了標準差和標準誤的區別,故該結論不正確。(1分)2、研究某藥治療口腔扁平苔癬的療效,經假設檢驗P<0.05,按=0.05水準拒絕H0,認為該藥效果優于對照藥。但某醫生懷疑檢驗效能是否足夠大,你認為這種懷疑對嗎?簡述理由。答:不正確。(2分)檢驗效能,即1-是指兩總體參數間確實存在差異,則,按照現有檢驗水準,檢驗出其差別的能力。(1分)當樣本含量一定時,與成反比,與1-成正比,(1分)因為P<0.05已經檢驗出差異,在這種情況下只可能犯I型錯誤,不用再考慮檢驗效能了。(1分)3、在臨床實驗中,樣本含量越大越好。該說法是否正確,請說明理由。答:不正確。(2分)樣本含量越高,會增加研究的成本,而且會降低科學研究的可操作性,應選擇適當的樣本含量,既能滿足科研的統計學要求,又能最大限度的控制成本和研究風險,提高研究效率。(2分)4、在完全隨機設計的方差分析中,變異分解為MS總=MS組間+MS組內,該分解是否正確,請說明理由。答:不正確。(2分)完全隨機設計資料只有一個研究因素,目的在于比較兩個或多個處理組的總體均數是否不同。完全隨機設計資料的總離均差平方和可以分解為MS組間和MS組內兩部分,即SS總=SS組間+SS組內。5、“200例肝癌的病因與臨床分析”研究中,男性120例,占60.0%,女性40例,占40%,因此認為男性肝癌的發病率高于女性。試述該結論是否正確,并說明理由。答:不正確。(2分)它犯了以構成比代替率的錯誤。(2分)6、某班級全體男生32人,其平均身高為175.6cm,女生26人其平均身高為162.0cm,對其進行假設檢驗,測得P<0.05,可以認為男女身高不等。該分析是否正確?請說明理由。答:不正確。(2分)本研究的目的是全班同學不同性別間血壓的比較,因該題已經知道了全班男女身高的平均身高值,即已知了總體均數,不是抽樣研究,沒有抽樣誤差,所以不需要假設檢驗,所以該分析不正確。(2分)7、某研究者測得159名正常成年男性礦工的血紅蛋白,紅細胞的均數分別為:15g/dL、520萬/mm3,標準誤分別為0.5g/dL、12萬/mm3,由于0.5比起12來要小得多,因此有結論“紅細胞數的變異大于血紅蛋白的變異度”。此結論是否合理?請說明理由。答:不正確。(2分)標準誤是表示抽樣誤差大小的,要比較兩指標的變異程度的大小應用變異系數比較,所以改說法不正確。(2分)8、在雙變量正態分布的相關與回歸分析中,||值越大,則|b|越大。該說法正確嗎?請說明理由。答:不正確。(2分)因為在雙變量正態分布資料中,與b同號,且其假設檢驗等價,但無能肯定||值越大,則|b|越大。(2分)9、某研究者欲比較甲乙兩地高血壓患病率,資料見下表:

甲、乙地各年齡組人數及高血壓患病率(%)年齡組甲地乙地調查人數患病率調查人數患病率30~3122.531382.3740~3598.682938.0350~21918.2132516.7560~19728.8736923.46合計108712.42112514.93該研究者根據兩地的合計患病率認為甲地高血壓患病率低于乙地高血壓患病率。該結論是否正確?請說明理由。(4分)答:不正確。(2分)

從資料可以看出,甲地各年齡組的高血壓患病率均高于乙地,但由于甲乙兩地調查對象的年齡構成不同,甲地的年輕調查對象的構成比更大,最終導致其合計患病率反而更低,應將兩地患病率進行標準化后再比較。故該結論不正確。(2分)10、將20名某病患者隨機分成兩組,分別用甲乙兩種藥物治療,用藥一個月后測得治療前后血沉(mm/h)如下表。要分析甲乙兩種藥物的療效有無差別,某醫生分別將甲乙兩種藥物治療后的血沉值進行兩樣本均數的t檢驗,得到的結論為甲乙兩種藥物的療效無差別。該結論是否正確,請說明理由。(4分)

甲、乙兩藥治療前后的血沉(mm/h)甲藥組乙藥組受試者治療前治療后受試者治療前治療后11061942139210236339541110413651010583674663782710488581129539105109310104答:不正確。(2分)

由于甲、乙組治療前的數據不一樣,只用治療后的數據進行分析,只能說明兩組治療后的血沉不同,而不能說明甲乙兩藥的療效有無差別。要比較甲乙兩藥療效有無差別,應分別將甲乙兩藥各自治療前后的血沉值作差值,比較兩組差值的均數是否有差別。(2分)11、已知某病潛伏期服從偏態分布,某醫生收集了37名男性患者的潛伏期資料,欲采用均數、標準差描述其集中位置和離散程度,該醫生所選指標是否合理?請說明理由。答:不正確。(2分)

該資料為負偏態分布,應用中位數和四分數間距來表示其集中趨勢和離散趨勢。(1分)而均數和標準差是用于正態分布的資料,所以所選指標不正確。(1分)12、某工廠保健站在調查中發現946名工人中,患慢性病的274人,其中女性219人,占80%,男性55人,占20%,由此得出結論,女工易患慢性病。該說法正確嗎?請說出理由。(4分)答:答:不正確。(2分)

犯了以構成比代替率的錯誤。(2分)13、某地抽樣調查360名健康成年男子的血紅蛋白含量,均數為154.50g/L,標準差為7.10g/L,則該地健康成年男子的血紅蛋白含量的95%區間估計為(154.50±1.96×7.10)g/L。該方法是否正確?請說明理由。答:不正確。(2分)

計算參考值范圍用的是標準差,計算可信區間用標準誤,該題計算血紅蛋白含量的95%可信區間用的是標準差,所以該方法不正確。(2分)14、某研究探討體表面積與體重的關系,分別進行了直線相關與回歸分析,得到r=0.78,b=-1.6。該分析結果是否正確?請說明理由。(4分)答:不正確。(2分)

一般來說,體表面積和體重均服從正態分布。對同一雙變量正態分布的資料進行直線相關與回歸分析,r應該與b同號。但該題中得出r與b的符號相反,故該結論不正確。(2分)15、某醫生認為“成組設計的兩樣本比較時,t檢驗總比秩和檢驗好”,試述該結論是否正確,請說明理由.答:不正確。(2分)

當資料不服從正態分布、方差齊或總體分布類型未知;等級資料;個別數值偏大或某一端為確定數值時,用秩和檢驗,在資料滿足參數統計的要求時,而選t檢驗時,則會降低檢驗效能。(2分)16、“196例胰腺癌的病因與臨床分析”研究中,男性140例,占71.43%,女性56例,占28.57%,因此認為男性胰腺癌的發病率高于女性。試述該結論是否正確,并說明理由。答:不正確。(2分)

它犯了以構成比代替率的錯誤。(2分)17、某醫院為了解某藥治療高血壓的療效,實驗組40高血壓患者中有15例有效,對照組50人,有效10人,得出X2=9.753,P<0.05,因此認為激素療法治療腎上腺樣瘤有效。試述該統計分析方法是否正確,并說明理由。答:不正確。(2分)因為n=36<40,應該用四格表的確切概率法進行檢驗。(2分)18、為研究年齡(歲)與牙齒AKP酶反應活性的關系,某醫生在其接診的病人中隨機抽取281例患者,其年齡(分為3個等級)和牙齒AKP酶反應活性分布見下表,經卡方檢驗,得X2=84.533,P<0.005,按0.05檢驗水準,拒絕H0,可認為不同年齡患者的AKP酶反應活性不同,兩者之間有關系。以上分析正確嗎?說明理由。

281例患者年齡與牙齒AKP酶反應活性的分布年齡(歲)牙齒AKP酶反應性合計-+++<31517365831-234549051-249712133合計31148102281答:不正確。(2分)

該案例是對同一份樣本的兩個分類變量之間的關聯性進行分析,檢驗的計算方式不變,結果仍為84.533,但下結論時最好不要從“不同年齡的AKP酶反應活性不同”演繹到“兩變量有關系”,而應為“按=0.05水準,拒絕H0,可認為年齡與AKP酶反應活性之間有關”,此外,可結合列聯系數說明其關聯強度,。(1分)

由于年齡與AKP酶反應活性都是有序分類變量,可考慮進行Spearman秩相關分析,得,單側P<0.001,可認為隨著年齡的增加,AKP酶反應活也降低。(1分)19、某地抽樣調查360名健康成年男子的血紅蛋白含量,均數為154.50g/L,標準差為7.10g/L,則該地健康成年男子的血紅蛋白含量的95%區間估計為(154.50±1.96×7.10)g/L。該方法是否正確?請說明理由。答:不正確。(2分)

混淆了醫學參考值范圍與可信區間,可信區間用的是標準誤,而醫學參考值范圍用的是標準差,該題他用的是標準差,所以不正確。(2分)20、將100名腦血栓患者隨機分成兩組,分別采用納洛酮和復方丹參治療,比較兩組患者起效時間,資料如表下所示。某研究者進行x2檢驗,得x2=10.762,P=0.013,故認為兩組患者起效時間有差異。該結論是否正確?請說明理由。

兩種藥物治療腦血栓患者的起效時間藥物起效時間1周內2周內3周內大于3周納洛酮2015105復方丹參1010255合計30253510答:不正確。(2分)

起效時間為單向有序的分類資料,卡方檢驗只能說明其構成不同。要比較兩組患者起效時間的長短有無差別,應用秩和檢驗。(2分)第五大題:計算分析題1、將18名某病患者隨機分成兩組,分別用藥物A或藥物B治療,觀察治療前后血色素變化,測得血色素差值(g/l)資料見下表,欲比較兩藥療效有無差別。

表218名病患血色素差值(g/l)A藥1118153111024624B藥2537341136101331請回答:

(1)上題資料類型和設計類型。

(2)A、B兩藥的療效有無差別?并寫出基本分析步驟,不必計算。答:(1)定量資料。(2分)成組設計兩樣本均數的比較。(2分)

(2)建立檢驗假設,確定檢驗水準(2分)

H0:A、B兩藥的療效有無差別H1:A、B兩藥的療效有差別

a=0.05

計算檢驗統計量(4分)

確定P值,作出統計推斷(2分)

查t界值表,得P>0.05,不拒絕H0,差異無統計學意義,可以認為兩藥的療效無差別。2、某地用A、B、C三種方案治療血紅蛋白小于10克的嬰幼兒貧血患者,每種方案治療20名貧血患兒,治療一個月后,記錄下每名患兒血紅蛋白的上升克數,問三種治療方案對嬰幼兒貧血的療效是否相同?(假設滿足參數檢驗的條件)

請回答:

(1)寫出具體的檢驗假設H0和備擇假設H1

(2)完成下列方差分析的計算表:方差分析的計算表變異來源SS

離均差平方和v

自由度MS

均方F值P值總變異200(②)85.520.0001組間變異150(③)75組內變異(①)(④)0.877(3)據方差分析的結果做出統計推斷,進一步可作何種分析?答:(1)H0:三種治療方案對嬰幼兒貧血的療效相同

H1:三種治療方案對嬰幼兒貧血的療效不全相同

=0.05(2分)

(2)(4分)方差分析的計算表變異來源SS

離均差平方和V

自由度MS

均方F值P值總變異200(59)85.520.0001組間變異150(2)75組內變異(50)(19)0.877(3)根據F值=85.52,P=0.0001,按=0.05水準,P<0.05,差異有統計學意義,可認為三種治療方案對嬰幼兒貧血的療效不全相同。(4分)。若要知道兩兩之間是否不同,需用SNK法進行兩兩比較,來得到兩兩比較的結果。(2分)系統提示:如果您需要繪制表格,可選擇使用以下任意方式:

1、通過表格編輯工具,點擊答題區域下的"插入表格"圖標彈出表格編輯工具[推薦];

2、插入橫線;點擊答題區域下的"插入橫線"圖標插入橫線;

3、通過"Shift"加"-"組合鍵輸入橫線。3、某研究欲探討64排螺旋CT和高分辨率HRCT在煤工塵肺肺氣腫檢出方面的差異,選擇96例I期煤工塵肺患者,進行64排螺旋CT和高分辨率HRCT掃描檢查,結果兩種CT均檢出肺氣腫73例,均未檢出14例,螺旋CT檢出而高分辨率HRCT未檢出者2例。

請回答:

(1)該研究設計屬于何種類型?資料屬于什么類型?

(2)將資料整理成合理的表格形式。

(3)為達到研究目的,宜選用什么統計方法?并寫出基本分析步驟,不必計算。答:(1)配對設計;(2)分類資料.(2分)

(2)(3分)HRCTCT合計+-+73780-21416合計752196(3)宜選用配對卡方檢驗(1分)

建立檢驗假設,確定檢驗水準(1分)

H0:兩種方法的檢出率有無差別

H1:兩種方法的檢出率有有差別

=0.05計算檢驗統計量(3分)

因為b+c=7+2=9<40,故用校正的公式:V=1

確定P值,作出統計推斷(1分)

查X2界值表,得P>0.05,按=0.05水準,不拒絕H0,差異無統計學意義,尚不能認為兩種方法的檢出率不同。系統提示:如果您需要繪制表格,可選擇使用以下任意方式:

1、通過表格編輯工具,點擊答題區域下的"插入表格"圖標彈出表格編輯工具[推薦];

2、插入橫線;點擊答題區域下的"插入橫線"圖標插入橫線;

3、通過"Shift"加"-"組合鍵輸入橫線。4、經研究顯示:漢族正常成年男性環指長度的均數為10.1cm,某醫生記錄了某地區正常成年男性環指長度資料(cm)如下:

10.0510.3310.4910.009.8910.159.5210.3310.1610.3710.1110.27

問該地區正常成年男性環指長度是否大于一般漢族成年男性?答:建立檢驗假設,確定檢驗水準(1分)H0:=10.1H1:>10.1單側=0.05計算檢驗統計量(7分)v=12-1=11確定P值,作出統計推斷(2分)查t界值表,得p>0.25,按=0.05水準,不拒絕H0,差異無統計學意義,尚不能認為該地區正常成年男性環指長度大于一般漢族成年男性。5、用TrFIA法與MEIA法共檢測抗-HBc302例,其中TrFIA法檢測陽性者236例;MEIA法檢測的陽性者234例;兩法同為陽性者226例。

請問:

(1)該資料屬何種類型?

(2)該資料屬何種設計?

(3)請整理出相應表格。

(4)兩法檢出率是否有差別?請寫出基本步驟,不必計算。答:答:(1)分類資料(2分)

(2)配對設計(2分)

(3)(3分)TrFIAMEIA合計+-+2268234-105868合計23666302建立檢驗假設,確定檢驗水準(1分)H0:兩種方法的檢出率有無差別H1:兩種方法的檢出率有有差別=0.05因為b+c=8+10=18<40,故用校正的公式:v=1

確定P值,作出統計推斷(1分)

查X2界值表,得P>0.05,按=0.05水準,不拒絕H0,差異無統計學意義,尚不能認為兩種方法的檢出率不同。系統提示:如果您需要繪制表格,可選擇使用以下任意方式:

1、通過表格編輯工具,點擊答題區域下的"插入表格"圖標彈出表格編輯工具[推薦];

2、插入橫線;點擊答題區域下的"插入橫線"圖標插入橫線;

3、通過"Shift"加"-"組合鍵輸入橫線。6、某醫生研究不同方案治療缺鐵性貧血的效果,將36名缺鐵性貧血的患者隨機分成三組,分別給予A、B、C三種處理,測得一個月后患者紅細胞的升高數(1012/L)資料見下表。(13分)

三種處理一個月后缺鐵性貧血患者紅細胞的升高數(1012/L)ABC0.811.322.350.751.412.500.741.352.430.861.382.360.821.402.440.871.332.460.751.432.400.741.382.430.721.402.210.821.402.450.801.342.380.751.462.40問:(1)此設計屬于什么類型?

(2)問三種處理有無差別?請寫出具體過程,不要求計算。答:7、將18名某病患者隨機分成兩組,分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論