




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統計方法介紹上海第二醫科大學生物統計教研室 根據不同的資料類型及不同的統計要求選擇不同的統計方法。 資料類型:資料一般可分成三大類:計量資料、計數資料和等級資料。 (1)計量資料: 它是測量每個觀察單位某項指標值的大小所得的資料。 (2)計數資料:將觀察單位按某種屬性或類別分組計數,得到各類別觀察單位計數的資料,稱為計數資料。 (3)等級資料又稱為半定量資料:將觀察單位按某種屬性的不同程度分組計算所得出的各個不同程度的觀察單位計數的資料。統計分析方法:(1)統計描述:指用統計指標、統計表、統計圖等方法,對資料的數量特征及其分布規律進行描述。(2)統計推斷:指用樣本推斷總體,主要是假設檢驗,例如
2、檢驗:兩個總體均數是否有差異,兩總體率是否有差異,兩個因素之間是否有關。(3)因素之間的關系:如相關和回歸分析等。一. 計量資料的描述性統計1. 計量資料的描述性統計指標包括: (1)集中位置的指標,用以描述觀察值的平均水平。 如算術均數、幾何均數、中位數、百分位數等。 (2)資料變異的指標,用以描述觀察值間參差不齊的程度,即離散度或稱變異度。 如全距、標準差、方差、變異系數、四分位數間距等。(1)算術平均數,簡稱為均數。觀察值全部相加再除以總例數。均數適用于服從對稱分布的計量資料,尤其是正態分布的資料(2)幾何均數。用G表示, 為觀察值的總乘積開n 次方根。常用對數計算,求對數值的均數。再查
3、反對數得出G。幾何均數適用于成倍數關系的資料,如抗體滴度、效價等,也用于對數正態分布的資料如某些傳染病的潛伏期、細菌計數等。 (3)中位數:用M表示,它將總體或樣本的全部觀察 值分成兩部分,每部分各有50%個觀察值。 中位數計算方法為:先將原始觀察值按由小到大順序排列后,位次處于中間的那個觀察值為中位數。觀察值數為奇數時,處于中間的那個數為中位數,偶數時處于中間的兩個數的均數為中位數。 中位數適用于表示任何分布資料的平均水平。但常用于非正態分布資料。由于中位數不受個別特大,特小數值的影響, 因此它比均數穩健,常用于資料分布不明,或明顯偏態,或分布的一端無確定值的情況。(4)百分位數:第X百分位
4、數以Px表示,它將全部觀察值分成二個部分,其中有x%個觀察值小于Px, (100-x)%個觀察值大于Px。 用途:1.描述一組資料在各個百分位置上的水平,用一組百分位數如P5,P25, P50, P75, P95,可以描述總體或樣本的分布特征,如集中位置、變異度等。 2.確定醫學正常值范圍。 X%(100-X)%PX P25稱為第1四分位數;記為Q1。 P50稱為第2四分位數;記為Q2,就是中位數M P75稱為第3四分位數;記為Q3。(5)全距:是最大與最小觀察值之差。全距計算方便,但僅利用最大與最小二個數據來代表全部數據的離散程度,信息利用差。全距受特大與特小值影響大,不穩定。 通常:最小值
5、最大值, 如:3.9805.875(6)標準差與方差: 標準差常用SD表示,方差是標準差的平方。標準差是一種常用的離散指標,結合均數能給出正態分布的特征。實際應用時常以均數標準差的寫法綜合觀察值的集中和離散特征。(7)變異系數:變異系數是一種離散指標,簡記為CV,它是標準差與均數之比,用百分數表達。 由于CV無量度單位,而且消除了原始資料的平均水平的影響,因此常用于比較量度單位不相同的指標或者平均水平相差懸殊的指標的變異程度。(8)四分位數間距: 四分位數間距是第3四分位數與第1四分位數之差,即P75P25。 四分位數間距受特大值或特小值影響小,較穩定。 中位數和四分位數間距相結合常用于表示非
6、正態分布資料的平均水平和離散程度。 t檢驗也稱為Student t檢驗。主要用于兩組計量資料比較的顯著性檢驗。包括:樣本均數與總體均數的比較,兩配對樣本均數的比較和非配對兩樣本均數的比較。 二.t檢驗樣本均數與總體均數比較的t檢驗 檢驗樣本是否來自均數為0的已知總體 。 如:要研究現在13歲男孩的身高是否比20年前的13歲男孩高。 20年前的13歲男孩平均身高為1.30。現測量了13歲男孩100名平均身高為1.35,標準差為0.12,要檢驗現在13歲男孩身高的總體均數是否高于1.30。2. 配對t檢驗處理前后的比較例號 用藥前 用藥后 1 118 112 2 110 98 10 122 108
7、治療前后舒張壓的改變兩種處理的比較 對子號 A藥 B藥 1 0.2 -0.1 2 1.0 1.8 10 0.4 0.8兩種藥物治療白細胞降低療效的比較(表中為白細胞升高數)。團體t檢驗 用于非配對兩樣本均數的比較。 如:兩組雌鼠,分別飼以高蛋白和低蛋白飼料, 8周后記錄各鼠體重增加量(克)如下,問兩組動物增重的均數差別是否顯著? 高蛋白組: 134 146 104 119 124 161 107 83 113 129 97 123 低蛋白組: 70 118 101 85 107 132 94 t檢驗的條件1. 樣本均數和總體均數比較的t檢驗: 樣本來自正態分布的總體。2 . 配對t檢驗: 差值
8、的總體為正態分布。3 . 團體t檢驗: 1)兩個樣本都來自正態分布的總體。 2)兩個總體方差相等。t檢驗條件不滿足時的對策1. 進行變量變換,如對數變換,變換成正態分布后再進行t檢驗。2. 用非參數檢驗的方法。3 . 兩樣本比較的t檢驗時,如正態分布但方差不齊,可用t檢驗。 方差分析主要用于檢驗計量資料中兩個或兩個以上樣本均數間差別的顯著性。 常見的錯誤是進行各組之間的兩兩t檢驗。這將增加第一類誤差的概率。 兩組以上均數的比較不能用兩兩t檢驗,而必須用方差分析。如差別有統計學意義,然后再進一步用SNK等方法作兩兩比較。三. 方差分析 例: 小白鼠給藥前后發生咳嗽的推遲時間(秒) 復方 復方 可
9、待因 40 50 60 15 -10 30 -5 105 77 例數 15 15 10 均值 31.67 44 60.7 隨機單位組設計方差分析: 欲比較因素的K個水平的各變量均值,同時控制另一個因素的作用。試驗設計時,先將受試對象按其它控制因素性質相同或相近者組成單位組,每個單位組有K個受試對象,分別隨機分配至因素的K個水平上。這時每個水平的受試對象不僅數量相同, 而且性質亦相同或相近,就能縮小誤差,提高實驗效率。它是兩樣本配對試驗的擴大。 單位組 處理1 處理2 . 處理k 1 X11 X12 . X1k 2 X21 X22 . X2k . b Xb1 Xb2 Xbk 大白鼠注射不同劑量雌
10、激素后的子宮重量(g) 雌激素劑量(g/100g) 大白鼠種系 0.2 0.4 0.8 A 106 116 145 B 42 68 115 C 70 111 133 D 42 63 87 欲比較一個因素中K個水平的各均數,同時要控制另二個因素作用時,可用拉丁方設計的方差分析。 要同時研究幾個因素的作用,同時要考察因素間的交互作用,可用析因設計的方差分析。協方差分析: 在各種試驗設計中,對主要變量Y 研究時,常希望其他可能影響Y的變量保持基本一致,以達到均衡可比。例如:比較幾種藥物的降壓作用,各試驗組在原始血壓、性別、年齡等指標應無顯著差異。有時這些變量不能控制,須在統計分析時,通過一定方法來消
11、除這些變量的影響后,再對主要變量y作出統計推斷。 如果所控制的變量是分類變量時,可用多因素的方差分析。 當要控制的變量是連續型變量時,可用協方差分析。 稱這些影響變量為協變量,消除協變量的影響后,或將協變量化成相等后,對y的修正均數所作的方差分析稱為協方差分析。例如:比較幾種不同飼料對動物體重增加的作用,可把動物的進食量作為協變量。 比較大學生和運動員的肺活量時,可把身高作為協變量。 比較治療后二組舒張壓的大小,可把治療前的舒張壓作為協變量。 如:比較初生至三周歲兒童男女兩組體表面積Y之間有無差異,以身高X1和體重X2為協變量比較對身高和體重修正后的體表面積修正均數。四. 計數資料的描述性統計
12、:率和構成比是計數資料的主要描述性指標。率說明某種現象發生的頻率或強度,其公式為: 率=某現象實際發生的例數/某現象可能發生的例數。 常見的率有發病率、患病率、死亡率、痊愈率、有效率等。 構成比表示事物或現象內部各構成部分的比重,通常以100作為比例基數, 故常稱為百分比。構成比=事物內部某一構成部分的觀察單位數/事物內部各組成部分的觀察單位總數 。如性別的構成比,病種的構成比,職業的構成比等。 構成比和率是兩個不同的相對數,用途不一樣,不能混淆。最容易犯的錯誤是把構成比當作率來用。 用率作比較時,應注意其可比性。應審慎思考影響的因素,不能憑表面數值貿然下結論。對于內部構成不同的兩個率,應先作
13、標準化處理,才能進行比較, 這稱為率的標準化,經標準化后的率稱為標準化率。 例:某醫院門診部近視眼患者情況: 職業 患者人數 所占比例() 工人 1500 50.00 農民 1000 33.33 學生 250 8.33 干部 250 8.33 結論為:工人患近視眼最多,其次是農民,學生和干部患近視眼都比較少。正確的調查方法: 職業 調查人數 患者人數 患病率() 工人 2000 100 5.00 農民 2000 100 5.00 學生 1000 100 10.00 干部 1000 100 10.00五. 四格表和行列表卡方檢驗 四格表和行列表卡方檢驗用于兩個或多個率或構成比差異的顯著性檢驗以及
14、兩種屬性間獨立性檢驗。兩種藥物治療某病有效率的比較藥物 有效 無效 合計 有效率西藥 63 16 79 79.75 中藥 47 7 54 87.04合計 110 23 133 82.71 兩組有效率的差異是否有統計學意義? 有效 無效 合計 有效率西藥組 63 16 79 79.75中藥組 47 7 54 87.04 中西結合 65 3 68 95.59 合計 175 26 201 二個或多個構成比的比較或兩個屬性之間有無關系: 血 型 民族 A B O AB 合計 傣族 f11 f12 f13 f14 n1+ 佤族 f21 f22 f23 f24 n2+ 土家族 f31 f32 f33 f3
15、4 n3+ 合計 n+1 n+2 n+3 n+4 n六. 非參數統計 在統計推斷中,如t檢驗,方差分析等,假定樣本所來自的總體分布為已知的函數形式,但其中有的參數為未知,統計推斷的目的就是對這些未知參數進行估計或檢驗。這類統計推斷方法稱為參數統計。 非參數統計是一種不依賴總體分布的具體形式的統計方法。優點: (1)適用于任何總體分布。 (2)計算簡便。 (3)易于理解和掌握。 (4)可應用于不能精確測量的資料,如等級資料。缺點: (1)對適宜用參數方法的資料,若用非參數處理,常損失部分信息,降低效率。 (2)雖然許多非參數法計算簡便,但不少問題的計算,特別樣本較大時,比較繁雜。1.符號秩和檢驗
16、用于配對資料。相當于配對t檢驗。2.兩樣本秩和檢驗,又稱Wilcoxon秩和檢驗,適用于未配對樣本的差異顯著性檢驗。 相當于團體t檢驗。3. Kruskal Wallis 檢驗(KW檢驗)用于兩個以上樣本的比較,相當于方差分析。4. Friedman秩和檢驗用于試驗按隨機單位組設計時的秩和檢驗。七. 等級資料 等級資料的描述性統計和計數治療相同,是率和構成比。 等級資料的顯著性檢驗都用非參數檢驗。 八. 考察兩指標間有無關系1. 兩指標均為正態計量指標用相關系數。2. 兩指標為非正態計量指標用秩相關系數。3. 兩指標均為等級指標用秩相關系數。4. 兩指標為計數指標用列聯系數,卡方檢驗。5. 一
17、個為等級指標,另一個為計量指標用秩相關系數,或者用方差分析。6. 一個為計數指標,另一個為計量指標用 t 檢驗或者方差分析。 如要分析一個連續的正態變量(應變量)和其他幾個變量(自變量)間有無關系。用多元相關和多元回歸分析。 如要分析一個二值變量(反應變量)和其他幾個變量(協變量)間有無關系。用LOGISTIC回歸分析。九. 生存分析對于腫瘤等疾病的療效及預后的考核常常不用通常的治愈率、好轉率等表示,而用生存期表示。 生存分析是指對于生存期這一變量進行分析的一系列特殊的統計分析方法。 生存期從某個標準時刻(發病、確診、開始治療或手術等)算起至死亡為止的存活時間。 生存期不同于一般指標的兩個特點
18、:(1)有截尾數據。 (2)生存期不服從正態分布。生存分析起先只用于分析生存期,但以后又發展成可分析一切從某種起始事件達到某終點事件所經歷的時間跨度。如:起效時間,緩解時間,等。生存時間不一定專用于死與活的情況,生存時間(存活時間)可定義為從某種起始事件到達某終點事件所經歷的時間跨度。例如急性白血病病人從治療開始到復發為止之間的緩解期;冠心病病人在兩次發作之間的時間間隔;已作輸卵管結扎的婦女從施行輸卵管吻合手術后至受孕的時間間隔;在流行病學研究中,從開始接觸危險因素到發病所經歷的時間等都可作為生存時間用作生存分析。 有時還收集一些有關因素(稱為自變量或協變量), 以分析這些協變量是否對生存時間有影響,影響的大小,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 20236-2025非金屬材料的聚光加速戶外暴露試驗方法
- GB/T 196-2025普通螺紋基本尺寸
- 有效準備2025年國際金融理財師考試試題及答案
- 移動學習課題申報書
- 聲樂類課題申報書怎么寫
- 行政管理師職業素養考試內容的探討與試題及答案
- 項目管理資格考試的全面透視與試題答案
- 項目管理認證考試實務能力試題及答案
- 項目管理專業考試內容試題及答案
- 職業生涯規劃的證券考試試題及答案
- 2024年阜陽太和縣第二人民醫院招聘筆試真題
- 癌癥治療協議書模板
- 2025年平頂山文化藝術職業學院高職單招職業技能測試近5年常考版參考題庫含答案解析
- 弘揚航天精神中國航天日主題宣教課件
- 上海市寶山區上海交大附中2024-2025學年高考生物試題模擬試卷(8)生物試題含解析
- 私募基金財務管理制度版本
- 人教部編版語文四年級下冊第七單元大單元教學設計
- 2025-2030全球及中國煉油廠服務行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025中國海洋大學輔導員考試題庫
- 土地房屋測繪項目投標方案技術標
- 產品平臺與CBB_技術管理PPT課件
評論
0/150
提交評論