




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、衛生統計學期末復習提要一、期末考試有關問題的說明一出題的指導思想、原則及題目類型出題的指導思想是:全面考核學生對本課程的基本概念、基本方法,基本技能的掌握情況,考核學生運用所學的知識和方法綜合分析與解決實際問題的能力。出題的原則是:不超過教學大綱的內容,難度適中但覆蓋面較廣,基本知識占8090%,稍難或靈活的題目占1020%。凡自學的章節不考。二答題要求選擇題:要求選擇無誤,每題只選一個最佳答案。計算分析題:要求完整地寫出計算步驟(包括計算公式)、用計算器計算出正確結果,并能對所得結果作出相應的分析結論。二、期末復習范圍和重點緒言一重點復習的名詞:計量資料:對每個觀察單位用定量的方法測定某項指
2、標量白大小,所得的資料稱為計量資料(measurementdata)。計量資料亦稱定量資料、測量資料。計數資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數稱為計數資料(countdata)。計數資料亦稱定性資料或分類資料。總體(population):表示大同小異的對象(某個測量值)全體。樣本(sample):從研究總體中隨機抽取的一部分有代表性的個體變異(variation):同一總體內的個體間存在差異。抽樣誤差:消除了系統誤差并控制了隨機測量誤差之后,樣本數值仍和總體指標的數值有差異,這種誤差稱之。概率:某事件出現機會大小的量。二重點復習的問題:1、 根據計量、計數、等級資料的概念正
3、確識別統計資料的類型。等級資料:將觀察單位按測量結果的某種屬性的不同程度分組,所得各組的觀察單位數,稱為等級資料(ordinaldata),等級資料又稱有序變量。等級資料與計數資料不同:屬性分組有程度差別,各組按大小順序排列。等級資料與計量資料不同:每個觀察單位未確切定量,故亦稱為半計量資料。2、 統計工作的步驟及搜集資料的來源和要求。1 .設計:設計內容包括資料收集、整理和分析全過程總的設想和安排。設計是整個研究中最關鍵的一環,是今后工作應遵循的依據。2 .收集資料:應采取措施使能取得準確可靠的原始數據。3 .整理資料:簡化數據,使其系統化、條理化,便于進一步分析計算。4 .分析資料:計算有
4、關指標,反映事物的綜合特征,闡明事物的內在聯系和規律。分析資料包括統計描述和統計推斷。3、 抽樣研究的原因及目的,產生抽樣誤差的原因。三一般復習的名詞:同質:一些個體處于同一總體么就是指他們大同小異,具有同質性。參數:參數(paramater)是指總體的統計指標,如總體均數、總體率等。總體參數是固定的常數。多數情況下,總體參數是不易知道的,但可通過隨機抽樣抽取有代表性的樣本,用算得的樣本統計量估計未知的總體參數。統計量:統計量(statistic)是指樣本的統計指標,如樣本均數、樣本率等。樣本統計量可用來估計總體參數。總體參數是固定的常數,統計量是在總體參數附近波動的隨機變量。隨機化抽樣:隨機
5、抽樣(randomsampling)是指按照隨機化的原則(總體中每一個觀察單位都有同等的機會被選入到樣本中),從總體中抽取部分觀察單位的過程。隨機抽樣是樣本具有代表性的保證。樣本含量:四一般復習的問題:1、衛生統計學的內容及學習衛生統計學的意義。2、統計工作各個步驟的基本內容和關系。*.集中趨勢與離散趨勢一重點復習的名詞:頻數分布表:當變量值個數較多時,對各變量值出現的頻率列表即為頻率分布表(frequencydistributiontable)。中位數(median,M):將原始觀察值從小到大或者從大到小排序后,位次居中的那個數。二重點復習的問題:1、 對頻數分布特征的描述。頻數分布分為集中
6、趨勢(centraltendency)和離散趨勢(tendencyofdispersion)。常用描述定量變量集中趨勢的統計指標包括算數均數、幾何均數、中位數。算數均數適用于對稱分布,特別是正態分布的資料;幾何均數適用于可經對數轉換為對稱分布的資料;中位數適用于各種分布資料,常用于描述偏峰分布的資料。常用的描述定量變量離散趨勢的統計指標包括極差、四分位數間距、方差、標準差和變異系數。極差只利用最大值和最小值的信息,易受樣本含量的影響,很不穩定;四分位數間距適用于各種分布資料;方差和標準差適用于對稱分布,特別是正態分布的資料;變異系數常用于量綱不同時,或均數相差較大時變量間變異程度的比較。實際應
7、用中,常將算數均數和標準差結合對正態分布資料進行統計描述;常將中位數和四分位數間距結合對偏峰分布資料進行統計描述。2、 平均指標:算術均數、幾何均數、中位數的意義及應用條件,算術均數的計算。2-1常用平均數的氤義及其應用場合平均數意義均數平均數噎水?幾何均數平均埔(減,倍數中位馥位次居中的迎旗做水平屈川場合陶用甚r,最適用F對稱分布.特別是正態分布等比資料工對數正態分布偏態分布:分布不臚工分布耒端七確定值算術均數(irithMtiemean)椅稱均數.描述殂教挪在救量上的平均水平.曲體均數用1表示,樣本均數用f表示,It計算方法如卜:直按法:直一用扇帕觀測/計算.(2-2)以)加權法,在的班表
8、奉礎上片算,其中X為綱中值,了為婉故變異指標:全距、標準差、變異系數的意義及應用條件,標準差和變異系數的計算。(一)反映數據變異料度大小的變用指標變異指標的應用亦根據資料的不同而選取不同指標退行描述4常用的變異指標有極差、四分位敷間距、方差、標準差和變異系數,尤其是方差和標準差更為常用.L橫鑿極差dang。小梆金Hi,即最大值與最小蛆差,用于贊料的粗略分析卜其計算衢使但糖意性較差.2. 一分位數與四分與四分輪(1)百分位數fgTEStiK)|是將n個觀察值從小到大依次撐列,再把它們的位次依次轉化為總分位*百分位數的另一個重要用途是確定醫學正常參考值范圍.,兮位數用片表示,0IV10Q如型電數左
9、不為f0在建效表上,門分位奴的計算公式為:尺=442S四-工Ze)f2-81fx(2)四分位數間距(intequartilerange)是由第3四分位數(6=P1"和第i四分位數=PQ相減計算而得,常與中位數一起使用,描述偏態分布資料的分布特征比卜穩定-其計算公宓赍=<2-9)3.方差方差(variance)友而組數擲的平均寓敵情況.其計算公式為,小.產M-1-2-10)L標準基標準差Standarddw:ioM£1匚的正平方根.便用的量綱與原量綱相同.適用于近做正態分布的資料,大樣本、小桿案均可,最為常用,箕計算公式為工SD耳變異梟數變異系數(coefficient
10、ofwiation)用于j»察指標單位不同或均數相差較大時兩組資料變異程度的比較,用C萋下.汁笄公式那(2-13)平均指標和變弓指標分別反映資料的不同平征,作為資料的息平均指計量,起使用.如比用T土5或AM5tL兩類指標要求4、正態分布的兩個參數及正態曲線下面積的分布規律。正態分布的特征:服從正態分布的變量的頻數分布由科、b完全決定。(1)W是正態分布的位置參數,描述正態分布的集中趨勢位置。正態分布以x=科為對稱軸,左右完全對稱。正態分布的均數、中位數、眾數相同,均等于科。(2)b描述正態分布資料數據分布的離散程度,b越大,數據分布越分散,b越小,數據分布越集中。b也稱為是正態分布的
11、形狀參數,b越大,曲線越扁平,反之,b越小,曲線越瘦高。正態曲線下面積的分布規律:如果用其標準差作為衡量單位,則以均數為中心,正負1個標準差內,即(科-科+b)區間內,正態分布曲線下的面積為總面積的68.27%;正負2個標準差內,即(科-2*科+2b)區間內,面積為95.44%;正負3個標準差,即(科-3(r,+3(r)區間內,面積為99.74%。這是由正態分布的性質所決定的。三一般復習的問題:1、除二4外,正態分布的其余特點。2、u變換的形式和作用。3、查閱標準正態曲線下面積表的方法。均數的抽樣誤差及標準誤一重點復習的名詞:均數的抽樣誤差:抽樣造成的這種樣本均數與樣本均數之間、樣本均數與總體
12、均數之間的差異。標準誤:用于表示均數抽樣誤差大小的指標,也叫樣本均數的標準差,它反映了樣本均數之間的離散程度。總體均數的可信區間:用統計量X和Sx確定一個有概率意義的區間,以該區間具有較大的可信度包含總體均數。二重點復習的問題:1、標準誤的意義、計算及應用。標準誤:用于表示均數抽樣誤差大小的指標,也叫樣本均數的標準差,它反映了樣本均數之間的離散程度。標準誤的計算公式:_s_7n在實際應用中可通過增加樣本含量n來減小樣本均數的標準誤,從而降低抽樣誤差。對于任意分布,在樣本Sx含量足夠大時,其樣本均數的分布近似于正態分布,且樣本均數的均數等于原分布的均數,均數的標準誤由公式計算。2、標準差與標準誤
13、的區別與聯系。樣本均數標準誤的大小與標準差成正比,量n越大,抽樣誤差越小。與樣本含量n的平方根成反比,即在同一總體中隨機抽樣,樣本含表右1均數的標準促與標準期的區別記均數的際洪浜反職工的前片宜工大小<7f£計值5壬)反訴出敏案啊需股情就a,桿率拈計/5.用制與讓融人祥h*轉可減小標潴誤。個體用樣或H然空界,不m統計方法會也制,3、 總體均數可信區間的意義和計算。根據總體標準差是否已知及樣本含量n的大小,總體均數置信區間的計算有t分布和Z分布(標準正態分布)兩種方法。1. t分布方法當總體標準差未知時,正態總體N(,2)的樣本均數的t變換結果服從t分布,若砍去"t分布雙
14、側尾部面積=0.05=5%,故有95%勺t值滿足不等式:Xt0.05/2,<<X-t0.05/2,Xt0.05/2,Sx<<+t0.05/2,Sx:(Xta。52sX,X+ta。5。sX)總體均數_的(i-)X可信儀間置信區間的般計算式為Xt/2,S,均數的單側置信區間為X>Xt/2,sx或<X+t/2,Sx2正態分布近似方法Z/2X(1)當總體標準差已知時,總體均數的雙側置信區間為z/2代替公式(5-9)中的t/2,(2)當未知但n足夠大時(n50),t分布的極限分布是標準正態分布,可用同理,與X+XXZ/2(5-8)和(5-9_)Zx或_XZs文或Iz則
15、總體均數的雙側置信區間為sx式相對應,單側置信區間則為zX4、總體均數可信區間與正常值范圍的區別。直范圍總體均數的置信區間意義絕大多數人某項指標的數值范圍指f的置信度倩計總體均數所在的范圍計算正態分布雙側xz/2sx單側,(X_Z/2S,8)或(-OO,X+Z/2S)偏峰分布雙側,RPi00-x正態分布未知:雙色,Xt/2,v與單側,(-X/2,vSX,8)或(-8,X12Vsx)已知:雙例,XZ/2X單側,(-XZX,oo)X單側,(Px,8)或(-OO,P100-X)或(-8,+Zx)正態分布或偏峰分布未知但n足夠大:雙側XZ/2Sx單側(X-Zsx,8)或(-oo,X+Z/sX)應用判斷
16、某項指標正常與否估計總體均數所在的范圍三一般復習的問題:1、抽樣誤差的規律。2、提高對總體均數可信區間估計精度的辦法。均數的假設檢驗一重點復習的名詞:檢驗假設H0:零假設(nullhypothesis),又稱原假設。檢驗水準”:根據問題的背景,規定一個“小”的概率a,若P值小于a,就認為“P值較小”,若P值不小于a,就認為“P值較大”。通常取a=0.05或0.01以保證犯假陽性錯誤的概率不超過0.05或0.01。這個a稱為檢驗水準。假設檢驗中的P值:在零假設成立的條件下,出現統計量目前值及更不利于零假設數值的概率。可比性:第I類錯誤和第n類錯誤:假陽性錯誤稱為第I類錯誤(typeIerror)
17、,指拒絕了實際上成立的H0,這類“棄真”的錯誤稱為I型錯誤,其概率大小用a表示;假陰性錯誤稱為第II類錯誤(typeIIerror),指接受了實際上不成立的H0,這類“存偽”的誤稱為II型錯誤,其概率大小用b表示。二重點復習的問題:1、 t值;t分布與標準正態分布的關系。2、 假設檢驗的基本思想和步驟。基本思想:把握“小概率事件在一次抽樣試驗中是幾乎不可能發生”的原理。步驟:建立假設、選用單側或雙側檢驗、確定檢驗水準;選用適當檢驗方法,計算統計量;確定P值并作出推斷結論。3、 樣本均數與總體均數比較的t檢驗。L杯不均數.利息體為數比較的F檢及前提;服從正態分布%=%*"%4、 兩大樣
18、本均數比較的u檢驗。5.大樣本均數比較的口校驗前提:樣本足翳大成組設計的圓樣小均數比城口用!一予一元辱+其5、 配對設計三種形式的特點及t檢驗的H。、H1。配對設計三種形式的特點:1)異體配對:兩個受試對象。2)自身配對:同一受試對象的兩個部位分別接受兩種處理。3)統一受試對象接受某種處理之前和之后的數據,也可以視為自身配對。-I2.配財設汁的t拉唆前提;性值服從正態分布凡;出=0;4工06、 假設檢驗時需注意的問題。(重點是可比性和犯第I類及第n類錯誤的含義與概率)可比性:I類錯誤:H0為真(實際無差別),假設檢驗結果拒絕H0,接受Hi(推論有差別)所犯的錯誤稱為I類錯誤(typeIerro
19、r),I類錯誤的概率記作a。II類錯誤:Hi為真(實際有差別),假設檢驗結果拒絕H1,接受H0(推論無差別)所犯的錯誤稱為II類錯誤(typeIIerror),II類錯誤的概率記作3。1- 3稱為檢驗效能,過去稱把握度(poweroftest),即兩總體確有差別,按a水準能發現該差別的能力。三一般復習的名詞:自由度、假設檢驗。四一般復習的問題:1、配對設計的t檢驗。2、兩小樣本均數比較的t檢驗。3、t檢驗的應用條件。方差分析一般復習的問題:1、方差分析的基本思想。2、完全隨機設計的特點和方差分析法。3、配伍組設計的特點和方差分析法。4、多個樣本均數的兩兩比較。相對數一重點復習的名詞:構成比:(
20、proportion)說明某一事物內部各組成部分所占的比重或分布。率:(rate)說明一定時期內某現象發生的頻率或強度。相對比:,是A、B兩個有關指標之比,說明A是B的若干倍或百分之幾。比=A/B動態數列:(dynamicseries)物在時間上的變化和發展趨勢。二重點復習的問題:是一系列按時間順序排列起來的統計指標,包括絕對數、相對數或平均數,用以說明事定基比、環比的計算。構成此工某-組成部分的觀察單位數,為。同一事物皆蛆成部分的觀察單位總數發生某現象的觀察單位數2、 可能發司京發生的觀糕單戊總數構成比、率、相對比、-比=A/B定基比,即統一用某個時間的指標作基數,其它各時間的指標都與之相比
21、;環比,即以前一個時間的指標作基數,以相鄰的后一個時間的指標與之相比。3、 下述指標的意義及計算:死因構成,發病率,患病率,死亡率,病死率。死因構成(proportionofdyingofaspecificcause)指全部死亡人數中,死于某死因者所占的百分比,說明各種死因的相對重要性。死因構成比=同年某死因死亡數/同年內死亡總數*100%(頻率型)發病率(incidencerate,IR)表示在一定時期內,在可能發生某病的一定人群中新發生某病的強度。某病發病率=時期內新發生的某病病例數/年平均人口數*1年(強度型)患病率(prevalencerate,PR)指某時點上受檢人數中現患某種疾病的
22、頻率,通常用于描述病程較長或發病時間不易明確的疾病的患病情況。患病率改患病人數/檢查人口數(頻率型)死亡率(mortalityrate)指某地某年平均每千人口中的死亡數,反映當地居民總的死亡水平。死亡率=同年內死亡人數/年平均人口數*1年(強度型)病死率(casefatalityrate,CFR)指在某一期間內(1年)患某病者因該病死亡的百分比,可說明一種疾病的嚴重程度,也可反映一個醫療單位醫療水平和質量。某病病死率=同年某病死亡人數/同年患該病總數*100%(頻率型)4、 動態數列的分析。動態數列(dynamicseries)是一系列按時間順序排列起來的統計指標,包括絕對數、相對數或平均數,
23、用以說明事物在時間上的變化和發展趨勢。丸動態數列常用的分析指標主要有絕時嫡長量;發展速度和增氏速度,可計算1)定基比.即統用某個時間的指標作基勒其它各時間的指標都叮之相比:2)環比,即以前一個時間的指標作基數.以相鄰的后一個時間的指標叮之相比.0)平均發展速度和平均增長速度、平均發展速度=爪而平均增長速度=平均發展速度-15、 應用相對數時需注意的問題。(重點是不能以比代率)1 .計算相對數的分母一般不宜過小。2 .分析時不能以構成比代替率容易產生的錯誤有(1)指標的選擇錯誤如住院病人只能計算某病的病死率,不能認為是某病的死亡率;(2)若用構成指標下頻率指標的結論將導致錯誤結論,如某部隊醫院收
24、治胃炎的門3 .診人數中軍人的構成比最高,但不一定軍人的胃炎發病率最高。4 .不能用構成比的動態分析代替率的動態分析。5 .對觀察單位數不等的幾個率,不能直接相加求其總率。6 .在比較相對數時應注意可比性通常應注意:(1)觀察對象,研究方法、觀察時間、地區和民族等因素應相同或相近;(2)其它影響因素在各組的內部構成是否相同。7 .對樣本率(或樣本構成比)的比較應隨機抽樣,并做假設檢驗。三一般復習的名詞:時期動態數列、時點動態數列、標準化法。四一般復習的問題:1、動態數列的分類。2、標準化法的意義及基本思想。3、標準化率的直接法和間接法計算。4、應用標準化法的注意事項。二項分布及其應用一重點復習
25、的問題:1、 率的抽樣誤差概念。在抽樣研究中所獲得的樣本率與總體率也存在率的抽樣誤差。2、 率的標準誤的意義及計算。表示率抽樣誤差大小的統計指標成為率的標準誤。由于總體率和總體率的標準誤一般未知,常用樣本率p來估計樣本率弓總體率之間存在抽樣誤差,其度埴方法;%=jc匚北為總體率,或伊/,歹為樣本率:總體率兀,用楊頻率的標準誤Sp來估計總體率的標準誤:'”率的標準誤是衡量樣本率穩定性和可靠性的統計指標,它反應率的抽樣誤差大小,率的標準誤越小,表示率的抽樣誤差越小,用以估計總體率的可靠性就越大。3、 總體率可信區間的意義及計算。當n足夠大,且p和1-p均不太小,p的抽樣分布逼近正態分布。總
26、體率的可信區間可根據樣本含量n和樣本頻率p的大小,選用查表法或正態近似法來估計其總體概率兀的(1-a)置信區間。總體率的可信區間:(-為?£5小丑4%尸乂與,P93例子二一般復習的名詞:二項分布:三一般復習的問題:1、二項分布的概率函數與圖形。2、二項分布的特點。3、樣本率與總體率比較的u檢驗。4、兩個樣本率比較的u檢驗。Poisson分布及其應用一一般復習的名詞:Poisson分布:二一般復習的問題:1、Poisson分布的概率函數及圖形。2、Poisson分布的特點。3、總體均數可信區間的意義及計算。4、樣本均數與總體均數比較的u檢驗。5、兩樣本均數比較的u檢驗。X2檢驗一重點復
27、習的名詞:理論頻數:theoreticalfrequency,在假設多個率或構成比相等的前提下,由合計率(構成比)推算出來的頻數。二重點復習的問題:1、 X檢驗的基本思想。1 .檐驗的里本思想是以I”真的大小來反映理論版數弓實際頻效的吻合程度口在零假設為(比如/=叼)成匯的條件卜,實際頻數勺理值方激相差不盛該很大,感/俏不應該很大.若實際計算出的值較大.超過了段定的檢驗水準所對陶的界值,則有理由懷疑A。的真實性,從而拒絕接受H(比如鳥/2 .基本公式,=V,A為實際頻數(ActualFrMjueocy)為理論頻數一T(MrehslFrwigKy.四格表;檢驗的專用公式正是由此公式推導出來的,用
28、專用公式與用基本公式計算出的無二侑是一致的.2、 四格表資料X2檢驗和校正X2檢驗的應用條件及方法。表s-l12檢臉的用途、假設的設立及基本計算公式資料形式用途的設立與計算公式自由度四格表獨立資料兩杵水率的比凝院對皆匕兩樣本率的比較兩總體沖相兩總體率不營專用公式2(ad-be)'n”(a+rf)節總之鋪但1WT<5時.校正公式b+c1RMC裝學個樣本率、構應比的比撲兩個變量之間關聯性外和H驍各個前體辛(構成匕相等:網種網性間仃在關聯);必個息體率(梅或比)不全相等電。兩種屬性間內在關聯),1dX=4一DJntnc碑數分布表頻數分布的報合優度橙臉Hy堂*-朋從蕓已知的理論分布:生應
29、不服從某已犯的埋沒分布,乙T步忙蘇表的匍數而定3、 計數資料相關分析的設計特點和推斷目的。4、 行X列表資料x2檢驗的注意事項。X檢驗的應用條件及注意事項1 .分析四格表資料時,應注意連續性校正的問題,當1<T<5,n>40時,用連續性校正X2檢驗;T<=1,或n<=40時,用Fisher精確概率法。2 .對于R*C表資料應注意以下兩點:(1)理論頻數不宜太小,一般要求:理論頻數<5的格子數不應超過全部格子的1/5;(2)注意考察是否有有序變量存在。對于單向有序R*C表資料,當指標分組變量是有序的時,宜用秩和檢驗;對于雙向有序且屬性不同的R*C表資料,若希望
30、弄清兩有序變量之間是否存在線性相關關系或存在線性變化趨勢,應選用定性資料的相關分析或線性趨勢檢驗;對于雙向有序且屬性相同的R*C表資料,為考察兩種方法檢測的一致性,應選用Kappa檢驗。<三>一般復習的問題:行x列表資料所包括的設計類型及2檢驗法。秩和檢驗<一>重點復習的問題:等級資料的秩和檢驗(成組設計兩樣本比較的秩和檢驗(Wilcoxon兩樣本比較法)1 .檢驗步驟:假設:H0:兩總體分布相同H1:兩總體分布不同a=0.05(2)編秩:將兩組原始數據分別由小到大排隊,再將原始數據從小到大統一編秩。編秩時遇同組相同數據,順次編秩,遇不同組相同數據取平均秩次。(3)求秩
31、和并確定檢驗統計量:當兩樣本例數不等時,以樣本例數小者為n1,其秩和為To相等時,可任取一組的秩和為To(4)確定P值和作出推斷結論:查T界值表,得出P值。若檢驗統計量T值在上、下界值范圍內,其P值大于表上方相應概率水平;若T值在上、下界值上若范圍外,其P值小于表上方相應概率水平。<二>一般復習的名詞:還有一些資料的總體分布的函數式是未知的,只知道非參數統計:樣本所來自的總體分布難以用某種函數式來表達,總體分布是連續型的或離散型的,解決這類問題的一種不依賴總體分布的具體形式的統計方法。由于這類方法不受總體參數的限制,故稱非參數統計法(non-parametricstatistics
32、),或稱為不拘分布(distribution-freestatistics)的統計分析方法,又稱為無分布型式假定(assumptionfreestatistics)的統計分析方法。它檢驗的是分布,而不是參數。非參數統計不需對總體分布(總體參數)作出特殊假設。三一般復習的問題:1、配對比較的符號秩和檢驗。2、配伍組設計的多個樣本比較的秩和檢驗。3、兩個或多個計量樣本比較的秩和檢驗。4、參數統計和非參數統計的優缺點。直線相關與回歸一重點復習的名詞:相關系數:相關系數又稱積差相關系數(coefficientofproduct-momentcorrelation),以符號r表示樣本相關系數,p表示總體
33、相關系數。它是說明具有直線關系的兩個變量間,相關關系的密切程度與相關方向的指標。回歸系數:回歸系數(regressioncoefficient)即直線的斜率(slope),在直線回歸方程中用b表示,b的統計意義為X每增(減)一個單位時,丫平均改變b個單位。二重點復習的問題:1、 使用電子計算器計算相關系數r、回歸系數b、截距a。2、 散點圖的作用和繪制方法。(1)散點圖可考察兩變量是否有直線趨勢;(2)可發現異常點(outlier)3、 描述直線關系的密切程度和方向時,r值的變化。相關系數r沒有單位,其值為-iwrwi。其絕對值愈接近1,兩個變量間的直線相關愈密切;愈接近0,相關愈不密切。r值
34、為正表示正相關,說明一變量隨另一變量增減而增減,方向相同;r值為負表示負相關,說明一變量增加、另一變量減少,即方向相反;r的絕對值等于1為完全相關。直線回歸方程的一般形式及最小二乘法原理的內容。丫?abX(121)回歸參數的估計一一最小二乘原則原則:最小二乘法(leastsumofsquares),即可保證各實測點至直線的縱向距離的平方和最小4、 應用直線相關與回歸分析的注意事項。1 .根據分析目的選擇變量及統計方法直線回歸用于定量刻畫應變量Y對自變量X在數值上的依存關系,其中應變量的定奪主要依專業要求而定,可以考慮把易于精確測量的變量作為X,另一個隨機變量作Y,例如用身高估計體表面積。兩個變
35、量的選擇一定要結合專業背景,不能把毫無關聯的兩種現象勉強作回歸分析。2 .進行回歸分析前應繪制散點圖(1)散點圖可考察兩變量是否有直線趨勢;(2)可發現異常點(outlier)3 .資料的要求直線回歸要求至少對于每個X相應的Y要服從正態分布,X可以是服從正態分布的隨機變量也可以是能精確測量和嚴格控制的非隨機變量;*對于雙變量正態分布資料,根據研究目的可選擇由X估1tY或者由Y估1tX,一般情況下兩個回歸方程不相同)。4 .結果解釋及正確應用反應兩變量關系密切程度或數量上影響大小的統計量應該是回歸系數的絕對值,而不是假設檢驗的P值。P值越小只能說越有理由認為變量間的直線關系存在,而不能說關系越密
36、切或越顯著"。另外,直線回歸用于預測時,其適用范圍一般不應超出樣本中自變量的取值范圍。當實際資料不能滿足直線回歸模型的要求而無法用最小二乘法估計回歸方程時,可使用秩回歸三一般復習的名詞:剩余標準差Sy.x四一般復習的問題:1、直線相關系數的假設檢驗。2、等級相關的應用條件。3、直線相關和回歸分析的聯系和區別。正常值范圍的估計一重點復習的名詞:正常人:第X百分位數:二重點復習的問題:1、 研究設計的六個方面的內容。2、 正態性檢驗的推斷目的和正態概率紙的特點。3、 正態分布法的應用條件和估計單側(上、下限),雙側95%正常值范圍界限值的計算。4、 百分位數法的應用條件及單、雙側界限,不
37、同百分范圍時應確定的百分位數。三一般復習的名詞:正常值范圍、假陽性錯誤、假陰性錯誤、概率單位。四一般復習的問題:1、醫學正常值范圍的意義2、D檢驗中,查D界值表確定P值的方法。統計表與統計圖一重點復習的問題:1、 根據資料正確編制統計表。(1)標題位于表的上方,概括表的主要內容,一般需注明時間與地點。(2)標目有橫、縱標目之分,分別說明橫行和縱行數字的含義,應做到文字簡明,層次清楚。(3)線條多采用三條半線,即頂線、底線、縱標目下的橫隔線及合計上的半線。忌斜線和豎線。(4)數字表內數據一律采用阿拉伯數字。同一指標小數點位數要一致,位次要對齊。表內不應有空項,無數字用“一”表示,數字若為零則填“
38、0",暫缺項或未記錄用“?”表示。(5)備注不為表的必備內容,如有必要,可在表內用“*”號標記,然后在表的下方加以說明。2、 對錯表的評價和正確修改。1)編制整理時,未將有聯系的項目安排適當,不便說明事物之間相互的規律性。2)分組不合理3)有意將過高或過低的數據篩選掉或無意舍棄掉,使原始資料所提供的信息變樣。4)統計表編制不規范。5)計算錯誤3、 根據資料性質和分析目的正確選用統計圖類型。表12-1常用統計圖的定義和制圖要求抬府定義笈圖用筆寬有郭的應也未表了相II獨一的耳績針指標的數值人小普通線閑適用于速續件資料,用線稅的升鼾憶在示出物制司用物變化的總處.半時數注圖用純白的汁群來去;齊一冏物睛號一平仲變化力速寶.mU!K.起點為。的等寬直茶.恭問即唱等拉高低嘴序H列u到演兩軸均為算術尺度,相輻兩一點向以折統相逢,國內馥條不宜也43條.橫箱為打木尺陽,耕輔為燈數尺附象同普迪線田.同閣以同曲枳表示事期的全部.用隔暗面水各部燈的比我與方圖用地形的加快也表.某士:型變量的一乾分布以圜面根為1Q/,將祚構戌比分別乘以武5度得周心用度數后再皖扇根而枳“通常以12點為始士依次曾國常以橫軸表示連續瞿笠量的能段t整求等即,颯軸表示翻數或胤豐.其尺度廿J卜始.各白條回工條簾群.原點的理集程度和蠟勢表不網沖功期間的相關大條給制方法山線是.只是點與點之阿不連接.二一般復習的問題:1、統
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 交換機銷售合同模板
- 華中地區蜜蜂養殖合作經營合同協議書
- 2025建筑工程施工管理合同
- 2025石油采購合同委托書模板
- 2025年度建筑工程沙石供應合同協議書
- 2025所有權質押合同協議書
- 《解析油畫與水彩畫》課件
- 車位轉讓合同模板
- DB13-T556-2017-舍飼養羊技術規程-河北省
- 小學優化業務流程課件
- 招標代理服務投標方案(技術標)
- 2024年(學習強國)思想政治理論知識考試題庫與答案
- 《三氣周瑜》兒童故事繪本ppt課件(圖文演講)
- GB/T 13007-2011離心泵效率
- 2022年物流倉儲行業REITs研究
- 小豬佩奇Peppa-Pig第一季1-2集英文臺詞
- 民法表格理解記憶版
- 消防給水及消火栓系統工程驗收記
- 本科畢業設計論文霓虹燈PLC控制與監控組態設計
- 揚塵防治教育培訓記錄(共11頁)
- 2020年TDLTE無線網絡主設備功能測試規范基本功能分冊
評論
0/150
提交評論