中國人民大學613衛生統計歷年真題12-16_第1頁
中國人民大學613衛生統計歷年真題12-16_第2頁
中國人民大學613衛生統計歷年真題12-16_第3頁
中國人民大學613衛生統計歷年真題12-16_第4頁
中國人民大學613衛生統計歷年真題12-16_第5頁
已閱讀5頁,還剩57頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

中國人民大學2016年攻讀碩士學位研究生入學考試試題考試科目:衛生統計科目代碼:613考試時間:月日(注:特別提醒所有答案一律寫在答題紙上,直接寫在試題或草稿紙上的無效!)———————————————————————————————一、名詞解釋:同質與變異總體和樣本參數和統計量抽樣誤差概率計量資料計數資料等級資料二、是非題:1.用定性的方法得到的資料稱作數值變量資料,亦稱作計數資料。()2.觀察某人群的血型,以人為觀察單位,結果分為A型、B型、AB型和O型,是有序分類資料。()3.分類變量或稱定量變量,其變量值是定量的,表現為數值大小,一般有度量衡單位,亦稱計量資料。()4.調查某地10歲女孩的身體發育狀況,以人為觀察單位,測得每個人的身高(cm)、體重(kg)、血壓(mmHg),此資料稱為多項分類變量資料。()5.用定量的方法測定觀察單位某個量的大小的資料,稱數值變量資料。()7.等級分組資料兼有計數與計量資料的性質。()8.將觀察單位按某一屬性的不同程度分組計數,所得各組的觀察單位稱為計數資料。()三、單選題:計量資料﹑計數資料和等級分組資料的關系有A.計量資料兼有計數資料和等級分組資料的一些性質B.計數資料兼有計量資料和等級分組資料的一些性質C.等級分組資料兼有計量資料和計數資料的一些性質D.計數資料有計量資料的一些性質E.等級分組資料又可叫半計數資料為了由樣本推斷總體,樣本應該是A.總體中任意一部分B.總體中的典型部分C總體中有意義的一部分D.總體中有價值的一部分E.總體中有代表性的一部分統計學上所說的系統誤差﹑測量誤差和抽樣誤差三種誤差,在實際工作中有A.三種誤差都不可避免B.系統誤差和測量誤差不可避免C.系統誤差和抽樣誤差不可避免D.測量誤差和抽樣誤差不可避免E.三種誤差都可避免抽樣誤差指的是A.個體值和總體參數值之差B.個體值和樣本統計量值之差C.樣本統計量值和總體參數值之差D.總體參數值和總體參數值之差醫學統計工作的基本步驟是調查資料﹑校對資料﹑整理資料B.調查資料﹑歸納資料﹑整理資料C.收集資料﹑校對資料﹑整理資料D.收集資料﹑整理資料﹑分析資料E.收集資料﹑校對資料﹑歸納資料統計學中所說的總體是指A.任意想象的研究對象的全體B.根據研究目的確定的研究對象的全體C.根據地區劃分的研究對象的全體D.根據時間劃分的研究對象的全體E.根據人群劃分的研究對象的全體答案名詞解釋:同質與變異:同質指被研究指標的影響因素相同,變異指在同質的基礎上各觀察單位(或個體)之間的差異。總體和樣本:總體是根據研究目的確定的同質觀察單位的全體。樣本是從總體中隨機抽取的部分觀察單位。參數和統計量:根據總體個體值統計算出來的描述總體的特征量,稱為總體參數,根據樣本個體值統計計算出來的描述樣本的特征量稱為樣本統計量。抽樣誤差:由抽樣造成的樣本統計量和總體參數的差別稱為抽樣誤差。概率:是描述隨機事件發生的可能性大小的數值,用p表示計量資料:由一群個體的變量值構成的資料稱為計量資料。計數資料:由一群個體按定性因數或類別清點每類有多少個個體,稱為計數資料。。等級資料:由一群個體按等級因數的級別清點每類有多少個體,稱為等級資料。是非題:××××√√×單選題:CEDCDB中國人民大學2015年攻讀碩士學位研究生入學考試試題考試科目:衛生統計科目代碼:613考試時間:月日(注:特別提醒所有答案一律寫在答題紙上,直接寫在試題或草稿紙上的無效!)———————————————————————————————名詞解釋:平均數標準差標準正態分布參考值范圍填空題:醫學統計資料按研究指標的性質分為________、________和_________三類。統計工作的全過程按順序可分為四個步驟,即_________、_________、________和__________。正態分布用N(μ,2)表示,為了應用方便,常對變量X作___________變換,使μ=0,=1,則正態分布轉變為___________分布,用___________表示。正態曲線下面積的分布有一定規律,理論上___________、___________和___________,區間的面積(觀察單位數)各占總面積(總觀察單位數)的___________、___________和___________可用于估計醫學參考值范圍和質量控制方面。標準正態曲線下,區間(-1.96,0)的面積占總面積的___________%。用___________和___________可全面描述正態分布資料的特征。為了說明離散程度應選用變異指標,常用的變異指標有___________、___________、___________和___________。___________范圍內的面積占正態曲線下總面積的95%。樣本值中最大值與最小值之差,稱為這個樣本的___________記___________。通常把α稱為___________或___________而將u>u1-(α/2)的區域稱作拒絕域,α一般取___________有時___________或___________。正常值范圍的意義是指絕大多數正常人的變量均在此范圍中,這個絕大多數習慣上包括正常人的_______、_______、_______、_______而最常用的是_______。對于正態分布的資料,在μ±1.96,μ±2.58區間內的變量值,其出現的概率分別為___________和___________。頻數分布的兩個重要特征是指___________和___________,可全面地分析所研究的事物。偏態分布資料宜計算___________以表示其平均水平。平均數的計算和應用必須具備___________、___________,否則平均數是沒有意義。正態分布有以下的特征①正態曲線在橫軸上方,且_________所處在最高。②正態分布以_________為中心左右對稱。③正態分布有兩個參數即_________和_________。④正態分布的面積有一定的__________。17.描述一組正態分布資料的變異度,以__________指標為好。18.變異系數CV常用于比較_________或_________的兩組或多組資料的變異程度是非題:1.平均數是一類用于推斷數值變量及資料平均水平(或集中趨勢)的指標。()2.反映頻數分布的兩個重要特征是集中趨勢與散離趨勢。()3.標準差是最常用的變異指標,它既可以用于正態資料亦可用于非正態資料。()4.計算中位數時要求組距相等。()5.計量單位相同,均數相差不大時,可使用變異系數反應兩組變量值的離散程度。()6.變量值之間呈倍數或等比關系的數據,宜用幾何均數表示其平均水平。()7.百分位數應用中提到,分布中部的百分位數相當穩定具有較好的代表性,但靠近兩端的百分位數只在樣本例數足夠多時才比較穩定。()8.為了解數值變量分布規律,可將觀察值編制頻數表,繪制頻數分布圖,用于描述資料的分布特征以及分布類型。()9.如果少數幾個數據比大部分數據大幾百倍一般就不宜計算均數()10.原始數據有零,就不能直接計算幾何均數()11.正態分布是以均數為中心的鐘型分布()12.高峰位于中央,兩側逐漸下降并完全對稱的頻數分布即為正態分布()13.理論上,對于正態分布資料的P5-P95和±1.96S范圍內都包含有95%的變量值。()14.制定正常值范圍應選足夠數量正常人作為調查對象,所謂正常人就是排影響被研究指標的各種疾病的人()15.描述頻數分布離散程度的最常用的指標是變異系數和標準差()16.正態分布用N(0,1)表示,為了應用方便,常對變量X作u=(x-μ)/變換,使μ=0=1則將正態分布轉換為標準正態分布用N(μ,2)表示()17.只要單位相同,用標準差和用變異系數來比較兩組變量值的離散度結論是完全一致的()18.四分位數間距Q=P75~P25,常用于描述近似正態分布資料的離散程度()19.頻數表和頻數分布圖用以推斷變量值的分布特征和揭示變量值的分布規律()20.制定正常值范圍,如取95%界限,是指95%的正常人本項指標在此范圍()21.指標無論過高或過低均屬異常,可用來計算正常值范圍()單選題:1.以年齡(歲)為例,最常用的組段表示法是A.0─5,5─10,10─15,15─20……;B.0─,5─,10─,15─……;C.0─4,5─9,10─14,15─19……;D.─5,─10,─15,─20……;E.以上都不是;2.以下指標中____可用來描述計量資料離散程度。A.算術平均數B.幾何均數C.中位數D.標準差E.第50百分位數3.偏態分布資料宜用___描述其分布的集中趨勢。A.算術平均數B.標準差C.中位數D.四分位數間距E.方差4.用均數和標準差可全面描述___資料的分布特征。A.正態分布B.正偏態分布C.負偏態分布D.對稱分布E.任何計量資料分布5.____可用于比較身高與體重的變異度A.方差B.標準差C.變異系數D.全距E.四分位數間距6.各觀察值均加(或減)同一個數后,_______。A.均數不變,標準差不一定變B.均數不變,標準差變C.均數不變,標準差也不變D.均數變,標準差不變E.均數變,標準差也變7.各觀察值同乘以一個不等于0的常數后,______不變。A.均數B.標準差C.幾何均數D.中位數E.變異系數8.____的資料,均數等于中位數。A.對稱B.正偏態C.負偏態D.對數正態9.最小組段無下限或最大組段無上限的頻數分布表資料,可用____描述其集中趨勢。A.均數B.標準差C.中位數D.四分位數間距E.幾何均數10.描述一組偏態分布資料的變異度,以___ ___指標較好.A.全距(R)B.標準差(s)C.變異系數(CV)D.四分位數間距(Qu-QL)11.計算某抗體滴度的平均水平,一般選擇A.算術均數B.幾何均數C.中位數D.標準差E.標準誤12.計算某病的平均潛伏期,一般選擇A.算術均數B.幾何均數C.中位數D.標準差E.變異系數13.表示正態分布資料個體變量值的變異程度的常用指標是A.均數B.全距C.標準差D.標準誤E.變異系數14.平均數是表示A.性質相同的變量值的相對水平B.性質相同的變量值的實際水平C.性質相同的變量值的平均水平D.性質不同的變量值的平均水平E.性質相同的變量值的變異程度15.用變異系數比較變異程度,適于A兩組觀察值單位不同,或兩均數相差較大B兩組觀察值單位相同,標準誤相差較大C兩均數相差較大,標準誤相差較大D以上都不是16.正偏態資料計算平均水平,首選A.算術均數B.幾何均數C.中位數D.加權均數E.百分位數17.均數與標準差的關系是A.均數越大,標準差越大B.均數越大,標準差越小C.標準差越大,均數代表性越好D.標準差越小,均數代表性越差E.標準差越小,均數代表性越好18.有8名某傳染病患者,潛伏期分別為:2,1,21,7,12,1,4,13天。其平均潛伏期為天。A.4B.5.5C.7D.12E.9.519.五小鼠出生體重分別為4,5,6,7,8(g);染毒后存活日數分別為2,5,6,7,1(天),問以何種指標比較兩組數據變異大小為宜A.SB.SC.全距D.CVE.自由度20.調查50例鏈球菌咽峽炎患者潛伏期如下,為計算均數平均數,應首選潛伏期12—24—36—48—60—72—84—96—108—120合計病例數1711117542250A.算術均數B.幾何均數C.中位數D.百分位數E.以上均可以21.102名健康人鉤端螺旋體血液抗體滴度分布如下,欲表示其平均水平,宜用抗體滴度1﹕1001﹕2001﹕4001﹕8001﹕1600合計人數719342913102A.算術均數B.幾何均數C.中位數D.百分位數E.以上均可以22.對于均數μ﹑標準差為σ的正態分布,95%的變量值分布范圍為A.μ-σ~μ+σB.μ-1.96σ~μ+1.96σC.0~μ+1.96σD.-∞~μ+1.96σE.μ-2.58σ~μ+2.58σ23.若u服從均數為0,標準差為1的正態分布,則A.u≥2.58的P=0.01B.u≥2.58的P=0.005C.-2.58<u<2.58的P=0.01D.u≥2.58的P=0.05E.u≥2.58的P=0.02524.正態分布有兩個參數μ與σ,______曲線的形狀越扁平。A.μ越大B.μ越小C.σ越大D.σ越小E.μ與σ越接近025.對數正態分布是一種_____分布A.正態B.近似正態C.左偏態D.右偏態E.對稱26.正態分布曲線下,橫軸上,從均數μ到+∞的面積占總面積的比例為______A.97.5%B.95%C.50%D.5%E.不能確定(與標準差的大小有關)27.標準正態分布的均數與標準差分別為_____A.0與1B.1與0C.0與0D.1與1E.1.96與2.5828.若X服從以μ,σ2為均數和方差的正態分布,則X的第95百分位數即___A.μ-1.64σB.μ-1.96σC.μ+σD.μ+1.64σE.μ+1.96σ29.若正常成人的血鉛含量X服從近似對數正態分布,則可用公式______制定95%正常值范圍。(其中:Y=logX)A.<+1.96SB.<+1.64SC.<+1.64SYD.<log-1(+1.64SY)E.<log-1(+1.96SY)30.正態分布曲線下,橫軸上,從均數μ到μ+1.96倍標準差的面積為____A.95%B.45%C.97.5%D.47.5%31.標準正態分布曲線下中間90%的面積所對應的橫軸尺度u的范圍是___A.–1.645到+1.645B.-∞到+1.645C.∞到+1.282D.–1.282到+1.28232.設X符合均數為μ﹑標準差為σ的正態分布,作u=的變量變換則A.符合正態分布,且均數不變B.符合正態分布,且標準差不變C.u符合正態分布,且均數和標準差都不變D.u不符合正態分布E.u符合正態分布,但均數和標準差都改變33.正態分布是以A.標準差為中心的頻數分布B.t值為中心的頻數分布C.組距為中心的頻數分布D.均數為中心的頻數分布E.觀察例數為中心的頻數分布34.用變異系數比較變異程度,適于A兩組觀察值單位不同,或兩均數相差較大B兩組觀察值單位相同,標準誤相差較大C兩均數相差較大,標準誤相差較大D以上都不是35.決定個體值正態分布的參數是A.變異系數B.全距 C.標準誤D.標準差 E.以上都不是36.正態分布是以A.標準差為中心的頻數分布B.t值為中心的頻數分布C.組距為中心的頻數分布D.均數為中心的頻數分布E.觀察例數為中心的頻數分布37.正偏態資料計算平均水平,首選A.算術均數B.幾何均數C.中位數D.加權均數E.百分位數38.均數與標準差的關系是A.均數越大,標準差越大B.均數越大,標準差越小C.標準差越大,均數代表性越好D.標準差越小,均數代表性越差E.標準差越小,均數代表性越好39.計量資料的標準差A.不會比均數大B.不會比均數小C.要比標準誤小D.不決定于均數E.以上都不對40.有9名某傳染病人,潛伏期分別為(天):2,1,21,7,12,1,4,13,24其平

均潛伏期為A.4B.5.5C.7D.12E.9.541.表示變異程度的指標中A.標準差越大,變異程度越小B.標準差越小,變異程度越大C.變異系數越大,變異程度越大D.變異系數越大,變異程度越小E.全距越大,變異程度越小42.正態資料的變異系數應A.一定>1B.一定<1C.可能>1,也可能<1D.一定<標準差E.一定>標準差43.五小鼠出生體重分別為4,5,6,7,8(g);染毒后存活日數分別為2,5,6,7,1(天),問以何種方式說明兩組數據變異大小A.SB.SC.全距D.CVE.自由度44.調查50例鏈球菌咽峽炎患者潛伏期如下潛伏期12—24—36—48—60—72—84—96—108—120合計病例數1711117542250求平均潛伏期,應首選A.算術均數B.幾何均數C.中位數D.百分位數E.以上均可以45.102名健康人鉤端螺旋體血液抗體滴度分布如下,欲表示其平均水平,宜用─────────────────────────────────────抗體滴度1﹕1001﹕2001﹕4001﹕8001﹕1600合計人數719342913102A.算術均數B.幾何均數C.中位數D.百分位數E.以上均可以問答題:1.均數﹑幾何均數和中位數的適用范圍有何異同?2.中位數與百分位數在意義上﹑計算和應用上有何區別與聯系?3.同一資料的標準差是否一定小于均數?4.測得一組資料,如身高或體重等,從統計上講,影響其標準差大小的因素有哪些?5.正態分布﹑標準正態分布與對數正態分布在概念上和應用上有何異同?6.醫學中參考值范圍的含義是什么?確定的原則和方法是什么?7.對稱分布資料在“均數±1.96倍標準差”的范圍內,也包括95%的觀察值嗎?計算題1.某地101例30~49歲健康男子血清總膽固醇值(mmol/L)測定結果如下:4.773.376.143.953.564.234.314.715.694.124.564.375.396.305.217.225.543.935.216.515.185.774.795.125.205.104.704.073.504.694.384.896.255.324.504.633.614.444.434.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.865.553.044.553.354.874.175.855.165.094.524.384.314.585.726.554.764.614.174.034.473.043.912.704.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.05(1)編制頻數分布表并繪制直方圖,簡述其分布特征。(2)計算均數、標準s、變異系數CV。(3)計算中位數M,并與均數比較,(4)計算P2.5及P97.5并與±1.96s的范圍比較。(5)分別考察1S、1.9S6、2.58S范圍內的實際頻數與理論分布是否基本一致?(6)現測得一40歲男子的血清總膽固醇值為6.993(mmol/L),若按95%正常值范圍估計,其血清總膽固醇值是否正常?估計該地30~49歲健康男子中,還有百分之幾的人血清總膽固醇值比他高?2.某地衛生防疫站,對30名麻疹易感兒童經氣溶膠免疫一個月后,測得其得血凝抑制抗體滴度資料如表。表2-1:平均滴度計算表抗體滴度 人數f1:8 21:16 61:32 51:64 101:128 4

1:256 21:512 1合計 30(1)試計算其平均滴度。(2)有人發現本例用抗體滴度稀釋倍數和直接用滴度倒數算得幾何標準差的對數值相同,為什么?3.50例鏈球菌咽峽炎患者的潛伏期如表,說明用均數、中位數或幾何均數,何者的代表性較好?并作計算。表2-2:50例鏈球菌咽峽炎患者的潛伏期潛伏期(小時)病例數f12~124~736~1148~1160~772~584~496~2108~1202合計504.某市1974年為了解該地居民發汞的基礎水平,為汞污染的環境監測積累資料,調查了留住該市一年以上,無明顯肝、腎疾病,無汞作業接觸史的居民238人,發汞含量如表:表2-3:238人發汞含量頻數計算表發汞值人數f(μmol/kg)1.5~203.5~ 665.5~ 607.5~ 489.5~ 1811.5~ 1613.5~ 615.5~ 117.5~ 019.5~21.5 3合計238(1).說明此頻數分布的特征,(2).計算均數和中位數,何者較大?為什么?何者用于說明本資料的集中位置較合適?(3).選用何種指標描述其離散程度較好?(4).估計該地居民發汞值的95%參考值范圍答案名詞解釋:

1.平均數是描述數據分布集中趨勢(中心位置)和平均水平的指標

2.標準差是描述數據分布離散程度(或變量變化的變異程度)的指標

3.標準正態分布以μ服從均數為0、標準差為1的正態分布,這種正態分布稱為標準狀態分布。

4.參考值范圍參考值范圍也稱正常值范圍,醫學上常把把絕大多數的某指標范圍稱為指標的正常值范圍。填空題:計量,計數,等級設計,收集資料,分析資料,整理資料。(變量變換)標準正態分布、0、14.68.27%95%99%5.47.5%

6.均數、標準差

7.全距、方差、標準差、變異系數

8.

9.全距R

10.檢驗水準、顯著性水準、0.05、0.01(0.1)

11.80%90%95%99%95%

12.95%99%

13.集中趨勢、離散趨勢

14.中位數

15.同質基礎,合理分組

16.均數,均數,μ,σ,規律性

17.標準差

18.單位不同,均數相差較大是非題:×√×××√√√√√√√×√√×××√√√單選題:BDCACDEACDBCCCACECDCBBECACBDDDAEDADDCEDBCBDCB問答題:1.均數﹑幾何均數和中位數的適用范圍有何異同?答:相同點,均表示計量資料集中趨勢的指標。不同點:表2-5.表2-5均數,幾何均數和中位數的相異點平均數意義應用場合均數平均數量水平應用甚廣,最適用于對稱分布,特別是正態分布幾何均數平均增減倍數①等比資料;②對數正態分布資料中位數位次居中的觀①偏態資料;②分布不明資料;③分布一端或兩察值水平端出現不確定值2.中位數與百分位數在意義上﹑計算和應用上有何區別與聯系?答:意義:中位數是百分位中的第50分位數,常用于描述偏態分布資料的集中位置,反映位次居中的觀察值水平。百分位數是用于描述樣本或總體觀察值序列在某百分位置的水平,最常用的百分位是P50即中位數。多個百分位數結合使用,可更全面地描述總體或樣本的分布特征。(2)計算:中位數和百分位數均可用同一公式計算,即Px=L+(i/fx)(n·x%-ΣfL)可根據研究目的選擇不同的百分位數代入公式進行計算分析。(3)應用:中位數常用于描述偏態分布資料的集中趨勢;百分位數常用于醫學參考值范圍的確定。中位數常和其它分位數結合起來描述分布的特征,在實際工作中更為常用。百分位數還可以用來描述變量值的離散趨勢(四分位數間距)。3.同一資料的標準差是否一定小于均數?答:不一定。同一資料的標準差的大小與均數無關,主要與本資料的變異度有關。變異大,標準差就大,有時比均數大;變異小,標準差小。4.測得一組資料,如身高或體重等,從統計上講,影響其標準差大小的因素有哪些?(1)樣本含量的大小,樣本含量越大,標準差越穩定。(2)分組的多少(3)分布形狀的影響,偏態分布的標準差較近似正態分布大(4)隨機測量誤差大小的影響(5)研究總體中觀察值之間變異程度大小5.正態分布﹑標準正態分布與對數正態分布在概念上和應用上有何異同?概念上:①相同點:正態分布、標準正態分布與對數正態分布都是變量的連續型分布。其特征是:分布曲線在橫軸上方,略呈鐘型,以均數為中心,兩邊對稱,均數處最高,兩邊逐漸減小,向外延伸,不與橫軸相交。②相異點:表示方法不同,正態分布用N(μ,σ2)表示,標準正態分布用N(0,1)表示,對數正態分布N(μlgX,σ2lgX)表示。應用上:①相同點:正態分布、對數正態分布都可以轉換為標準正態分布。②相異點:標準正態分布是標準正態變量u的分布,標準正態曲線下的面積唯一的由u決定,給應用帶來極大方便。對醫學資料呈偏態分布的數據,有的經對數變換后服從正態分布。正態分布、對數正態分布可描述變量值的分布特征,可用于正常值范圍估計和質量控制等。正態分布是很多統計方法的理論基礎。6.醫學中參考值范圍的含義是什么?確定的原則和方法是什么?含義:參考值范圍亦稱正常值范圍,它是指特定健康狀況人群(排除了有關疾病和因素對所研究指標有影響的所謂“正常人”不同于“健康人”概念)的解剖、生理、生化等數據絕大多數人的波動范圍。(2)原則:①抽取有代表性的足夠例數的正常人群樣本,樣本分布越接近總體,所得結果越可靠。一般認為樣本含量最好在100例以上,以能得到一個分布較為穩定的樣本為原則。②對選定的正常人進行準確而統一的測定,保證測定數據可靠是確定正常值范圍的前提。③判定是否要分組(如男女、年齡、地區等)確定正常值范圍。④決定取雙側范圍值還是單側范圍值。⑤選擇適當的百分范圍⑥確定可疑范圍⑦估計界值(3)方法:①百分位數法:Px=L+(i/fx)(n·x%-ΣfL)②正態分布法(對數正態分布):百分位數法用于各種分布型(或分布不明)資料;正態分布法用于服從或近似正態分布(服從對數正態分布)的資料。7.對稱分布資料在“均數±1.96倍標準差”的范圍內,也包括95%的觀察值嗎?答:不一定。均數±1.96倍標準差是正態分布的分布規律,對稱分布不一定是正態分布。計算題:1.某地101例30~49歲健康男子血清總膽固醇值(mmol/L)測定結果如下:4.773.376.143.953.564.234.314.715.694.124.564.375.396.305.217.225.543.935.216.515.185.774.795.125.205.104.7040743.504.694.384.896.255.324.504.633.614.444.434.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.865.553.044.553.354.874.175.855.165.094.524.384.314.585.726.554.764.614.174.034.473.043.912.704.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.05(1)編制頻數分布表,簡述其分布特征。①找出最大值、最小值求全距(R):全距=最大值-最小值=7.22-2.70=4.50(mmol/L)②求組距:I=全距/組數=4.52/10=0.452≈0.5(mmol/L)③分組段,劃記(表1-1)表2-6某地101例30~49歲健康男子血清總膽固醇值劃記表組段(mmol/L)劃記頻數2.5~13.0~83.5~94.0~234.5~255.0~175.5~96.0~66.5~27.0~7.51合計101由表2-6可知,本例頻數分布中間局多,兩側逐漸減少,左右基本對稱。表2-7某地101例30~49歲健康男子血清總膽固醇值(mmol/L)、s計算表血清總膽組中值頻數fXfX2累計累計頻數固醇值Xf頻數(實際)2.5~2.7512.757.56310.00993.0~3.25826.0084.50090.08913.5~3.75933.75126.563180.17824.0~4.252397.75415.438410.40594.5~4.7525118.75564.063660.65355.0~5.251789.25468.563830.82185.5~5.75951.75297.563920.91096.0~6.25637.50234.375980.97036.5~6.75213.5091.1251000.99017.0~7.57.2517.2552.5631011.0000478.252242.315注:Xu為組段上限值(2)計算均數、標準s、變異系數CV。由上計算表1-2可見:478.25/101=4.735(mmol/L)=0.882(mmol/L)CV=100%=0.882/4.735100%=18.627%(3)計算中位數M,并與均數X比較,利用前表計算中位數MM=L+(i/f50)(n50%-ΣfL)=4.5+(0.5/25)(10150%-41)=4.69(mmol/L)本題算術均數為4.735(mmol/L),與中位數4.69(mmol/L)很接近,這也是資料服從正態分布的特征之一。(4)計算P2.5及P97.5并與±1.96s的范圍比較。P2。5=3.0+(0.5/8)(1012.5%-1)=3.095(mmol/L)P97.5=6.5+(0.5/2)(10197.5%-98)=6.619(mmol/L)1.96S=4.735±1.960.882=3.01~6.46(mmol/L)用百分位數法求得101例30~49歲健康男子血清總膽固醇值95%分布范圍3.095~6.619(mmol/L),與正態分布法求得的95%分布范圍3.01~6.46(mmol/L)基本一致。(5)分別考察1S、1.96S、2.58S范圍內的實際頻數與理論分布是否基本一致(表1-3)表2-8某地101例30~49歲健康男子血清總膽固醇值理論分布與實際分布比較血清總膽固醇實際分布理論分布人數%%3.85~5.627271.2968.273.01~6.469796.0495.002.46~7.0110099.0199.00由上表,范圍內,實際分布與理論分布略有不同,而、范圍內,實際分布與理論分布基本一致。(6)現測得一40歲男子的血清總膽固醇值為6.993(mmol/L),若按95%正常值范圍估計,其血清總膽固醇值是否正常?估計該地30~49歲健康男子中,還有百分之幾的人血清總膽固醇值比他高?前計算得95%正常值為3.01~6.46(mmol/L)現測得一40歲男子的血清總膽固醇值為6.993(mmol/L),在95%范圍以外,故屬于異常u=(X-μ)/σ=(6.993-4.735)/0.882=2.56因ф(2.56)=ф(-2.56),查表1得ф(-2.56)=0.0052估計該地30~49健康男子中約有0.52%的人血清總膽固醇值比他高。2.某地衛生防疫站,對30名麻疹易感兒童經氣溶膠免疫一個月后,測得其得血凝抑制抗體滴度資料如表2-9第(1)(2)欄。表2-9平均滴度計算表抗體滴度人數f滴度倒數X1lgX1flgX1(1)(2)(3)(4)(5)=(2)×(4)1:8280.90311.80621:166161.20417.22471:325321.50517.52571:6410641.806218.06181:12841282.10728.42881:25622562.40824.81651:51215122.70932.7093合計3050.5730(1)試計算其平均滴度。由表1-4得,G=lg-1(50.5730/30)=lg-11.6858=48.5該站30名麻疹易感兒童經氣溶膠免疫一個月后,測得血凝抑制抗體平均滴度為1:48.50表2-10平均滴度計算表抗體滴度人數f滴度倒數X1lgX1flgX1(1)(2)(3)(4)(5)=(2)(4)1﹕8280.90311.80621﹕166161.20417.22471﹕325321.50517.52571﹕6410641.806218.06181﹕12841282.10728.42881﹕25622562.40824.81651﹕51215122.70932.7093合計3050.5730(2)有人發現本例用抗體滴度稀釋倍數和直接用滴度(原書誤為倒數)算得對數值的標準差相同,為什么?表2-11滴度對數值計算表抗體滴度X2人數flgX2flgX21﹕82-0.9031-1.80621﹕166-1.2041-7.22471﹕325-1.5051-7.52571﹕6410-1.8062-18.06181﹕1284-2.1072-8.42881﹕2562-2.4082-4.81651﹕5121-2.7093-2.7093合計30-50.57301)由表1-4中數據計算標準差為:slgx1=lg-10.4444=2.78232)由表1-5中數據計算標準差為:slgx2=lg-10.4444=2.7823直接用抗體滴度的對數lgx2與稀釋倍數的對數lgx1計算標準差是相等的,因為由上表可見lgx2=lg1-lgX1=-lgx1,而lgx1與-lgx1的離散程度是相同的,所以用抗體滴度稀釋倍數和直接用滴度算得對數值的標準差是相同的。3.50例鏈球菌咽峽炎患者的潛伏期如表2-12,說明用均數、中位數或幾何均數,何者的代表性較好?并作計算。表2-1250例鏈球菌咽峽炎患者的潛伏期的中位數計算表潛伏期(小時)病例數f累計頻數12~1124~7836~111948~113060~772~584~496~2108~1202合計50本例目測頻數分布為偏態分布,長尾拖向右側,故為正偏態,宜用中位數及幾何均數表示其平均水平。如上表,經計算中位數,幾何均數、算術均數分別為:M=54.55(小時),G=54.08(小時),=58.56(小時)顯然,算術均數受長潛伏期的影響使其偏大,中位數M與幾何均數G接近,故描述鏈球菌咽峽炎患者潛伏期的集中趨勢指標使用中位數M或幾何均數G均可。4.某市1974年為了解該地居民發汞的基礎水平,為汞污染的環境監測積累資料,調查了留住該市一年以上,無明顯肝、腎疾病,無汞作業接觸史的居民238人,發汞含量

如表2-13:表2-13238人發汞含量頻數計算表發汞值人數f組中值XfXfX2累計頻數累計頻率(μmol/kg)1.5~202.550.0125.00208.403.5~664.5297.01336.508636.105.5~606.5390.02535.0014661.347.5~488.5408.03468.0019481.509.5~1810.5189.01984.5021289.0811.5~1612.5200.02500.0022895.8013.5~614.587.01261.5023498.3215.5~116.516.5272.2523598.7417.5~018.50.00.0023598.7419.5~21.5320.561.51260.75238100.00合計2381699.014743.50(1).說明此頻數分布的特征:可見發汞值的頻數分布高峰位于第2個組段。前4個組段的頻數占總頻數的81.5%,長尾拖向右側,呈極度正偏態。(2).計算均數和中位數M,何者較大?為什么?何者用語說明本資料的集中位置較合適?=1699/238=7.139(μmol/kg)M=L+(i/f50)(n50%-ΣfL)=5.5+2/60(23850%-86)=6.6(μmol/kg)由計算結果得知,其原因因為本例呈正態分布,均數計算結果受到少數較大發汞值的影響,使得偏向大發汞值一邊.本例用中位數描述偏態資料的集中趨勢較好,它不受兩端較大值和極小值的影響.(3).選用何種指標描述其離散程度較好?選用四分位數間距描述其離散程度較好.(4).估計該地居民發汞值的95%參考值范圍本資料應選用單側95%上界值,本例是正偏態分布.而且樣本含量較大,n=238,保證獲得一個較為穩定的分布,故采用百分位數法計算的參考值范圍較為合適.P95=L+(i/f95)(n95%-ΣfL)=11.5+(2/16)(23895%-212)=13.2625(μmol/kg)中國人民大學2014年攻讀碩士學位研究生入學考試試題考試科目:衛生統計科目代碼:613考試時間:月日(注:特別提醒所有答案一律寫在答題紙上,直接寫在試題或草稿紙上的無效!)———————————————————————————————名詞解釋:標準誤總體均數可信區間假設檢驗檢驗水準檢驗統計量P值第I類錯誤第II類錯誤填空題:1.用樣本均數估計總體均數的可靠程度宜選用__________。2.一般將概率小于_________和_________的隨機事件稱為小概率事件。3.對總體所作的假設進行統計推斷,作出拒絕或接受假設的結論的方法,稱___________。4.樣本均數比較,經t檢驗差別有顯著性時,P越小,說明___________。5.t分布的圖型形狀與___________有關。6.可信區間的兩個要素是___________,______。7.準誤愈小,表示_________愈小,_________對_________估計愈可靠。8.統計推斷包括___________和___________兩方面。9.設檢驗中,不拒絕Ho時,可發生_________錯誤,其概率用_________表示。是非題:1.區間估計以預先給定的概率(可信度)估計總體參數在哪個范圍內的方法,稱區間估計。()2.樣本標準誤反映了抽樣誤差大小,顯然n越大抽樣誤差越大,用樣本推斷總體的精度越高。()3.抽樣誤差的大小可以用標準差來表示。()4.參數估計有⑴點(值)估計——用樣本統計量值估計相應的總體參數。⑵區間估計——估計總體參數在哪個范圍,它不涉及抽樣誤差,所以比點(值)估計更為重要。()5.從正態總體N(μ,σ)中,隨機抽取例數為n的樣本,則樣本均數也服從N(μσ)的正態分布。()6.抽樣研究時,可通過增加樣本含量來減少抽樣誤差。()7.成組比較的t檢驗要求兩組樣本例數一定相等。()8.可信區間比假設檢驗還可以提供更多信息,不但能回答差別有無統計意義,還能提出差別有無實際意義。()9.t檢驗結果t>1.96,可以認為兩樣本均數不同。()10.樣本含量相同時,配對設計與成組設計相比,前者統計效率較高()11.在配對t檢驗中,用藥前數據減去用藥后數據,與用藥后數據減去用藥前數據作t檢驗后的結論是相同的()12.t分布曲線的形狀與標準差有關()13.拒絕了實際上是成立的Ho,這類“棄真”的錯誤稱為第一類錯誤或Ⅰ型錯誤

()14.抽樣調查是從總體中隨機抽取一定數量的觀察單位組成樣本,然后用樣本信息來推斷總體特征()15.變量變換是各組觀察值經變量轉換后達到方差齊性()16.樣本均數的99%可信區間可用2.58表示()17.計算總體均數可信區間的通式為(,)縮寫為()18.當P≤α時,結論為按所取α檢驗水準拒絕Ho,接受H1;如P>α時,即樣本信息支持Ho,就無理由拒絕它,此時只好接受它()19.當t0.01v>t>t0.05v時,則0.01>P>0.05()20.兩個均數比較只能用t檢驗或u檢驗()21.t檢驗可用于同一批對象的身高和體重均數差別的假設檢驗()22.β為第二類錯誤的概率(1-β)越小,所需的樣本例數越多()單選題:從一個計量資料的總體中抽樣,產生的抽樣誤差的原因是:()A.總體中的個體值存在差異B.總體均數不等于零C.樣本中的個體值存在差異D.樣本均數不等于零E.樣本只包含總體的一部分個體σ是指:()A.所有個體值對總體均數的離散程度B.某一個樣本均數對總體均數的離散程度C.所有樣本均數對總體均數的離散程度D.一些樣本均數對總體均數的離散程度E.所有某個含量相同的樣本均數對總體均數的離散程度在同一正態總體中隨機抽樣,有99%的樣本均數在下述范圍內:()A.B.C.D.E.以上都不是在同一總體中隨機抽取多個樣本,用樣本來估計總體均數的95%可信區間,則估計精密的是:()A.均數大的樣本B.均數小的樣本C.標準差小的樣本D.標準誤大的樣本E.標準誤小的樣本表示:()A.總體的95%個體值在該區間內B.樣本的95%個體值在該區間內C.平均每100個總體均數,有95個總體均數在該區間內D.平均每100個樣本(含量相同)均數,有95個樣本均數在該區間內E.平均每100個樣本(含量相同)有95個樣本所得出的該區間包括總體均數總體均數的99%可信區間為:()A.B.C.D.E.以上都不是在由兩樣本均數的差別推斷兩總體均數的差別的t檢驗中,檢驗假設的無效假設是:()A.兩樣本均數差別無統計意義B.兩總體均數差別無統計意義C.兩樣本均數相等D.兩總體均數相等E.兩總體均數不等由兩樣本均數的差別推斷兩總體均數的差別,所謂差別有顯著性是指:()A.兩樣本均數差別有顯著性B.兩總體均數差別有顯著性C.兩樣本均數和兩總體均數的差別都有顯著性D.其中一個樣本均數和總體均數的差別有顯著性E.以上都不是在樣本均數和總體均數差別的顯著性檢驗中,H0(無效假設):μ=μ0;H1(備擇假設):μ≠μ0;結果因為P<0.05而拒絕H0接受H1,是由于:()A.無效假設成立的可能性小于5%B.備擇假設成立的可能性大于5%C.無效假設成立的可能性小于5%和備擇假設成立的可能性大于95%D.該樣本來自該總體(μ=μ0)的可能性小于5%E.該樣本來自另一個總體(μ≠μ0)的可能性大于95%與標準正態分布(u分布)比較,t分布的:()A.中心位置左移B.中心位置右移C.分布曲線峻峭一些D.分布曲線平坦一些E.以上都不是與標準正態分布(u分布)比較,t分布的:()A.均數要小些B.均數要大些C.標準差要小些D.標準差要大些E.以上都不是若總例數相同,則兩組計量資料的t檢驗與配對計量資料的t檢驗相比較,一般為:()A.兩組計量資料的t檢驗的效率要高些B.配對計量資料的t檢驗的效率要高些C.兩者效率相等D.兩者效率相差不大E.兩者效率不可比在兩個均數比較的t檢驗中,計算合并方差的公式為:()A.B.C.D.E.推斷樣本率為16.8%與14.5%所代表的總體有無差別,選用的方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論