




已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
對定量結(jié)果進(jìn)行差異性分析1. 單因素設(shè)計(jì)一元定量資料差異性分析1.1. 單因素設(shè)計(jì)一元定量資料t檢驗(yàn)與符號秩和檢驗(yàn)T檢驗(yàn)前提條件:定量資料滿足獨(dú)立性和正態(tài)分布,若不滿足則進(jìn)行單因素設(shè)計(jì)一元定量資料符號秩和檢驗(yàn)。1.2. 配對設(shè)計(jì)一元定量資料t檢驗(yàn)與符號秩和檢驗(yàn)配對設(shè)計(jì):整個(gè)資料涉及一個(gè)試驗(yàn)因素的兩個(gè)水平,并且在這兩個(gè)水平作用下獲得的相同指標(biāo)是成對出現(xiàn)的,每一對中的兩個(gè)數(shù)據(jù)來自于同一個(gè)個(gè)體或條件相近的兩個(gè)個(gè)體。1.3. 成組設(shè)計(jì)一元定量資料t檢驗(yàn)成組設(shè)計(jì)定義:設(shè)試驗(yàn)因素A有A1,A2個(gè)水平,將全部n(n最好是偶數(shù))個(gè)受試對象隨機(jī)地均分成2組,分別接受A1,A2,2種處理。再設(shè)每種處理下觀測的定量指標(biāo)數(shù)為k,當(dāng)k=1時(shí),屬于一元分析的問題;當(dāng)k2時(shí),屬于多元分析的問題。在成組設(shè)計(jì)中,因2組受試對象之間未按重要的非處理因素進(jìn)行兩兩配對,無法消除個(gè)體差異對觀測結(jié)果的影響,因此,其試驗(yàn)效率低于配對設(shè)計(jì)。T檢驗(yàn)分析前提條件:獨(dú)立性、正態(tài)性和方差齊性。1.4. 成組設(shè)計(jì)一元定量資料Wilcoxon秩和檢驗(yàn)不符合參數(shù)檢驗(yàn)的前提條件,故選用非參數(shù)檢驗(yàn)法,即秩和檢驗(yàn)。1.5. 單因素k(k=3)水平設(shè)計(jì)定量資料一元方差分析方差分析是用來研究一個(gè)控制變量的不同水平是否對觀測變量產(chǎn)生了顯著影響。這里,由于僅研究單個(gè)因素對觀測變量的影響,因此稱為單因素方差分析。方差分析的假定條件為: (1)各處理?xiàng)l件下的樣本是隨機(jī)的。 (2)各處理?xiàng)l件下的樣本是相互獨(dú)立的,否則可能出現(xiàn)無法解析的輸出結(jié)果。(3)各處理?xiàng)l件下的樣本分別來自正態(tài)分布總體,否則使用非參數(shù)分析。(4)各處理?xiàng)l件下的樣本方差相同,即具有齊效性。1.6. 單因素k(k=3)水平設(shè)計(jì)定量資料一元協(xié)方差分析協(xié)方差分析(Analysis of Covariance)是將回歸分析與方差分析結(jié)合起來使用的一種分析方法。在這種分析中,先將定量的影響因素(即難以控制的因素)看作自變量,或稱為協(xié)變量(Covariate),建立因變量隨自變量變化的回歸方程,這樣就可以利用回歸方程把因變量的變化中受不易控制的定量因素的影響扣除掉,從而,能夠較合理地比較定性的影響因素處在不同水平下,經(jīng)過回歸分析手段修正以后的因變量的樣本均數(shù)之間的差別是否有統(tǒng)計(jì)學(xué)意義,這就是協(xié)方差分析解決問題的基本計(jì)算原理。在試驗(yàn)中,試驗(yàn)因素有時(shí)會(huì)受到某個(gè)重要的定量的非試驗(yàn)因素的影響,為了消除這種定量非試驗(yàn)因素對定量觀測結(jié)果的影響和干擾。前提條件:一、要求各組定量資料(主要指觀測結(jié)果)來自方差相等的正態(tài)總體;二、各組的總體回歸斜率要相等且不等于零。1.7. 單因素k(k=3)水平設(shè)計(jì)一元定量資料Kruskal-Wallis秩和檢驗(yàn)定量資料不滿足參數(shù)檢驗(yàn)的前提條件時(shí),則可選擇秩和檢驗(yàn)2. 單因素設(shè)計(jì)一元生存資料差異性分析生存分析(Survival Analysis)是將重點(diǎn)事件的出現(xiàn)與否和達(dá)到終點(diǎn)所經(jīng)歷的時(shí)間結(jié)合起來的一種統(tǒng)計(jì)分析方法,其主要特點(diǎn)就是考慮了每個(gè)觀察對象達(dá)到終點(diǎn)所經(jīng)理的時(shí)間長短。終點(diǎn)事件不限于死亡,可以是疾病的發(fā)生、一種處理(治療)的反映、疾病的復(fù)發(fā)等。生存分析可用于生存曲線估計(jì)、生存曲線比較、影響因素分析和生存預(yù)測。生存分析有一套完整的方法:統(tǒng)計(jì)描述(包括求生存時(shí)間的分位數(shù)、中位生存期、平均數(shù)、生存函數(shù)的估計(jì)、判斷生存時(shí)間分布的圖示法)、非參數(shù)檢驗(yàn)(檢驗(yàn)分組變量各水平所對應(yīng)的生存曲線是否一致)、COX模型(半?yún)?shù))回歸分析、參數(shù)模型回歸分析。研究者比較k條生存曲線之間是否有顯著差別時(shí),SAS軟件提供了3種常用的方法:對數(shù)秩檢驗(yàn)(log-rank Test)、威爾考克森(Wilcoxon Test)和似然比檢驗(yàn)(Likelihood Ratio Test)。當(dāng)生存時(shí)間的分布為Weibull分布或?qū)儆诒壤L(fēng)險(xiǎn)比模型時(shí),Log-Rank檢驗(yàn)效率較高;當(dāng)生存時(shí)間的分布為對數(shù)正態(tài)分布時(shí),Wilcoxon檢驗(yàn)效率較高;因似然比檢驗(yàn)是建立在指數(shù)分布模型上的,故當(dāng)資料偏離此模型時(shí),其結(jié)果不如前兩種檢驗(yàn)方法穩(wěn)健。非參數(shù)法估計(jì)生存率有乘積極限法(Product-Limit Method,PL)和壽險(xiǎn)法(Life Table Method),其中乘積極限法又稱為Kaplan-Meier法(簡稱KM法)。前者適用于小樣本或大樣本未分組資料,后者適用于觀察倒數(shù)較多的分組資料。3. 多因素設(shè)計(jì)一元定量資料差異性分析3.1. 隨機(jī)區(qū)組設(shè)計(jì)一元定量資料方差分析與Friedman秩和檢驗(yàn)隨機(jī)區(qū)組設(shè)計(jì)(Randomized block design),亦稱完全隨機(jī)區(qū)組設(shè)計(jì)(random complete block dsign)。這種設(shè)計(jì)的特點(diǎn)是根據(jù)“局部控制”的原則,將試驗(yàn)地按肥力程度劃分為等于重復(fù)次數(shù)的區(qū)組,一區(qū)組安排一重復(fù),區(qū)組內(nèi)各處理都獨(dú)立的隨機(jī)排列。參數(shù)檢驗(yàn)前提條件:獨(dú)立性、正態(tài)性和方差齊性若不滿足參數(shù)檢驗(yàn)的前提條件,采用秩和檢驗(yàn)。3.2. 雙因素?zé)o重復(fù)實(shí)驗(yàn)設(shè)計(jì)一元定量資料方差分析有兩個(gè)試驗(yàn)因素,全部試驗(yàn)條件由兩因素各水平全面組合而成,在每個(gè)條件下獲得定量資料的均值數(shù)據(jù)。3.3. 平衡不完全隨機(jī)區(qū)組設(shè)計(jì)一元定量資料方差分析所謂平衡不完全隨機(jī)區(qū)組試驗(yàn)(Balanced Incomplete Block Design,簡稱BIB試驗(yàn))就是試驗(yàn)方案因受地塊限制,不能把試驗(yàn)處理全部安置在試驗(yàn)區(qū)組內(nèi)的情況下,所進(jìn)行的試驗(yàn)設(shè)計(jì)。其缺點(diǎn)是:區(qū)組數(shù)必須嚴(yán)格按規(guī)定數(shù)目設(shè)立,缺一不可,否則各處理之間的比較將失去均衡性。BIB試驗(yàn)設(shè)計(jì)需滿足如下條件:N=b*k=*=(k-1)-1其中N為試驗(yàn)小區(qū)總數(shù);為任兩處處理在同一區(qū)組中出現(xiàn)的次數(shù);是每個(gè)處理的重復(fù)數(shù);b是不完全隨機(jī)區(qū)組數(shù);k是每區(qū)組內(nèi)的小區(qū)數(shù)。3.4. 拉丁方設(shè)計(jì)一元定量資料方差分析拉丁方設(shè)計(jì)(Latin square design)使研究人員得以在統(tǒng)計(jì)上控制兩個(gè)不相互作用的外部變量并且操縱自變量。每個(gè)外部變量或分區(qū)變量被劃分為一個(gè)相等數(shù)目的區(qū)組或級別,自變量也同樣被分為相同數(shù)目的級別。拉丁方以表格的形式被概念化,其中行和列代表兩個(gè)外部變量中的區(qū)組,然后將自變量的級別分配到表中各單元中。簡單的說就是某一變量在其所處的任意行或任意列中,只出現(xiàn)一次。假設(shè)我現(xiàn)在要做一個(gè)實(shí)驗(yàn),被試一共要進(jìn)行5個(gè)小測試,并且需要重測多次,因此對這5個(gè)測試的排序就需要列入變量控制之內(nèi),不可能多次都一樣的順序,因此為了平衡這種順序效應(yīng),采取拉丁方設(shè)計(jì),先命名5個(gè)小測試分別為1,2,3,4,5。那么對其的排序就是這樣的: 第一組測試順序:1,2,5,3,4 第二組測試順序:2,3,1,4,5 第三組測試順序:3,4,2,5,1 第四組測試順序:4,5,3,1,2 第五組測試順序:5,1,4,2,3 其順序是這樣確定的,橫排:1,2,n,3,n-1,4,n-2(n代表要排序的量的個(gè)數(shù)) 豎排:1,2,3,4,5 再輪回。3.5. 二階段交叉設(shè)計(jì)一元定量資料方差分析在醫(yī)學(xué)研究中,要將A、B兩種處理先后施加于同一批試驗(yàn)對象,隨機(jī)地使半數(shù)受試者先接受A后接受B,而另一半受試者正好相反,即先接受B再接受A。由于兩種處理在全部試驗(yàn)過程中交叉進(jìn)行,這種設(shè)計(jì)稱為交叉設(shè)計(jì)(cross-over design)。在交叉設(shè)計(jì)中,A、B兩種處理先后以同等的機(jī)會(huì)出現(xiàn)在兩個(gè)試驗(yàn)階段中,故又稱為兩階段交叉設(shè)計(jì)。試驗(yàn)效應(yīng)受到3個(gè)因素的影響,一個(gè)是處理因素,一個(gè)是處理順利因素,還有一個(gè)是試驗(yàn)階段因素,而且必須保證這3個(gè)因素之間沒有交互作用。雖然交叉試驗(yàn)的處理是單因素,但影響試驗(yàn)結(jié)果的因素還有非人為控制的受試者的個(gè)體差異和試驗(yàn)階段這兩個(gè)因素。因此,該設(shè)計(jì)不僅平衡了處理順序的影響,而且能把處理方法間的差別、時(shí)間先后之間的差別和受試者之間的差別分別進(jìn)行分析。3.6. 析因設(shè)計(jì)一元定量資料方差分析析因設(shè)計(jì)是一種多因素的交叉分組設(shè)計(jì)。它不僅可檢驗(yàn)每個(gè)因素各水平間的差異,而且可檢驗(yàn)各因素間的交互作用。兩個(gè)或多個(gè)因素如存在交互作用,表示各因素不是各自獨(dú)立的,而是一個(gè)因素的水平有改變時(shí),另一個(gè)或幾個(gè)因素的效應(yīng)也相應(yīng)有所改變;反之,如不存在交互作用,表示各因素具有獨(dú)立性,一個(gè)因素的水平 有所改變時(shí)不影響其他因素的效應(yīng)。3.7. 含區(qū)組因素的析因設(shè)計(jì)一元定量資料方差分析3.8. 嵌套設(shè)計(jì)一元定量資料方差分析試驗(yàn)中涉及兩個(gè)或多個(gè)試驗(yàn)因素,且依據(jù)專業(yè)知識可以認(rèn)為各試驗(yàn)因素對觀測指標(biāo)的影響有主次之分,主要因素各水平下嵌套著次要因素,次要因素各水平下又嵌套著更次要的因素,這樣的試驗(yàn)設(shè)計(jì)稱為嵌套設(shè)計(jì)。此類設(shè)計(jì)有兩種情形:第一種情形是,受試對象本身具有分組再分組的各種分組因素,處理(即最終的試驗(yàn)條件)是各因素各水平的全面組合,且因素之間在專業(yè)上有主次之分(如年齡與性別對心室射血時(shí)間的影響,性別的影響大于年齡);第二種情形是,受試對象本身并非具有分組再分組的各種分組因素,處理(即最終的試驗(yàn)條件)不是各因素各水平的全面組合,而是各因素按其隸屬關(guān)系系統(tǒng)分組,且因素之間在專業(yè)上有主次之分(如研究不同代次不同家庭成年男性的身高資料,不同家庭之間的差別大于同一個(gè)家庭內(nèi)部不同代次之間的差別)。3.9. 裂區(qū)設(shè)計(jì)一元定量資料方差分析試驗(yàn)因素分兩階段進(jìn)入試驗(yàn)過程,通常由先進(jìn)入試驗(yàn)的試驗(yàn)因素(設(shè)為A)構(gòu)成單因素多水平設(shè)計(jì)或由先進(jìn)入試驗(yàn)的試驗(yàn)因素(設(shè)為A)與區(qū)組因素(設(shè)為B)構(gòu)造出含m次獨(dú)立重復(fù)試驗(yàn)的隨機(jī)區(qū)組設(shè)計(jì);再把接受因素A各水平處理或接受因素A與因素B各組合水平處理的m個(gè)受試對象隨機(jī)地分配給在第二階段進(jìn)入試驗(yàn)的試驗(yàn)因素C的m個(gè)水平,這樣安排試驗(yàn)因素的方法稱為裂區(qū)設(shè)計(jì)或分割設(shè)計(jì)。結(jié)合實(shí)際問題,當(dāng)試驗(yàn)研究過程自然形成2個(gè)或多階段(有時(shí)稱為工序),各階段涉及的試驗(yàn)因素彼此不同,但需要等整個(gè)試驗(yàn)過程結(jié)束后,才能觀測定量指標(biāo)的結(jié)果,就需要用到此設(shè)計(jì)。3.10. 正交設(shè)計(jì)一元定量資料方差分析正交試驗(yàn)設(shè)計(jì)(Orthogonal experimental design)是研究多因素多水平的又一種設(shè)計(jì)方法,它是根據(jù)正交性從全面試驗(yàn)中挑選出部分有代表性的點(diǎn)進(jìn)行試驗(yàn),這些有代表性的點(diǎn)具備了“均勻分散,齊整可比”的特點(diǎn),正交試驗(yàn)設(shè)計(jì)是分析因式設(shè)計(jì)的主要方法。是一種高效率、快速、經(jīng)濟(jì)的實(shí)驗(yàn)設(shè)計(jì)方法。正交表是一整套規(guī)則的設(shè)計(jì)表格,每個(gè)因素的每個(gè)水平與另一個(gè)因素各水平各碰一次,這就是正交性。進(jìn)行c因素t水平n次試驗(yàn)的正交表為Lntc,其中,L為正交表的代號,n為試驗(yàn)的次數(shù),t為水平數(shù),c為列數(shù),也就是可能安排最多的因素個(gè)數(shù)。3.11. 重復(fù)測量設(shè)計(jì)一元定量資料方差分析重復(fù)測量設(shè)計(jì)指將一組或多組被試者先后重復(fù)地施加不同的實(shí)驗(yàn)處理, 或在不同場合和時(shí)間點(diǎn)被測量至少兩次的情況。重復(fù)測量設(shè)計(jì)大體有兩類. 一類是對每個(gè)人在同一時(shí)間不同因子組合間測量; 另外一類是對每個(gè)人在不同時(shí)間點(diǎn)上重復(fù). 前者常見于裂區(qū)設(shè)計(jì),而后者常見于經(jīng)典試驗(yàn)設(shè)計(jì)即包括前測,處理,一次或幾次后測的情況. 后者比前者要多見。3.12. 常見多因素實(shí)驗(yàn)設(shè)計(jì)一元定量資料協(xié)方差分析試驗(yàn)中存在極為重要的非試驗(yàn)因素,需進(jìn)行協(xié)方差分析,判斷其對主要因素的影響。3.13. 多個(gè)單因素兩水平設(shè)計(jì)定量資料Meta分析Meta分析是指用統(tǒng)計(jì)學(xué)方法對收集的多個(gè)研究資料進(jìn)行分析和概括,以提供量化的平均效果來回答研究的問題.其優(yōu)點(diǎn)是通過增大樣本含量來增加結(jié)論的可信度,解決研究結(jié)果的不一致性。meta分析是對同一課題的多項(xiàng)獨(dú)立研究的結(jié)果進(jìn)行系統(tǒng)的、定量的綜合性分析。它是文獻(xiàn)的量化綜述,是以同一課題的多項(xiàng)獨(dú)立研究的結(jié)果為研究對象,在嚴(yán)格設(shè)計(jì)的基礎(chǔ)上,運(yùn)用適當(dāng)?shù)慕y(tǒng)計(jì)學(xué)方法對多個(gè)研究結(jié)果進(jìn)行系統(tǒng)、客觀、定量的綜合分析?;痉治霾襟E: (1)明確簡潔地提出需要解決的問題。 (2)制定檢索策略,全面廣泛地收集隨機(jī)對照試驗(yàn)。 (3)確定納入和排除標(biāo)準(zhǔn),剔除不符合要求的文獻(xiàn)。 (4)資料選擇和提取。 (5)各試驗(yàn)的質(zhì)量評估和特征描述。 (6)統(tǒng)計(jì)學(xué)處理。 a異質(zhì)性檢驗(yàn)(齊性檢驗(yàn))。 b統(tǒng)計(jì)合并效應(yīng)量(加權(quán)合并,計(jì)算效應(yīng)尺度及95的置信區(qū)間)并進(jìn)行統(tǒng)計(jì)推斷。 c圖示單個(gè)試驗(yàn)的結(jié)果和合并后的結(jié)果。 d敏感性分析。 e通過“失安全數(shù)”的計(jì)算或采用“倒漏斗圖”了解潛在的發(fā)表偏倚。 (7)結(jié)果解釋、作出結(jié)論及評價(jià)。 (8)維護(hù)和更新資料。4. 單因素設(shè)計(jì)多元定量資料差異性分析4.1. 單因素設(shè)計(jì)定量資料多元方差和協(xié)方差分析在某試驗(yàn)設(shè)計(jì)之下,若每次只分析一個(gè)或多個(gè)定性影響因素對一個(gè)定量指標(biāo)的影響,常采用一元方差分析;若每次用參數(shù)法同時(shí)分析一個(gè)或多個(gè)定性影響因素對兩個(gè)或者兩個(gè)以上在專業(yè)上有一定聯(lián)系的定量指標(biāo)的影響時(shí),就稱為多元方差分析(Multivariate Analysis of Variance, MANOVA)。做方差分析時(shí),影響因素都是定性的。當(dāng)除了定性的影響因素之外還有定量的影響因素存在(或者不可忽略)時(shí),要分析各影響因素對定量指標(biāo)的影響,則需要采用另外一種統(tǒng)計(jì)學(xué)分析方法,即協(xié)方差分析(Analysis of Covariance)才能達(dá)到目的。5. 多因素設(shè)計(jì)多元定量資料差異性分析5.1. 多因素設(shè)計(jì)定量資料多元方差分析和協(xié)方差分析對定性結(jié)果進(jìn)行差異性分析6. 單因素設(shè)計(jì)一元定性資料差異性分析6.1. 單組設(shè)計(jì)一維表資料統(tǒng)計(jì)分析groupcount19782226.2. 配對設(shè)計(jì)四格表資料統(tǒng)計(jì)分析1.先將實(shí)驗(yàn)對象配對后隨機(jī)安排到兩個(gè)不同處理組,所得的二分類結(jié)果的資料。2.同一批對象兩個(gè)時(shí)間點(diǎn)(或兩個(gè)部位)的測定,或同一對象用兩種方法(或兩種儀器、兩名化驗(yàn)員、兩種條件)的測定,所得的二分類(如陽性、陰性)結(jié)果的資料。6.3. 配對設(shè)計(jì)擴(kuò)大形式的方表資料統(tǒng)計(jì)分析配對設(shè)計(jì)擴(kuò)大形式的方表形式甲乙-+合計(jì)-1502320+2191224+1317021+02068合4. 成組設(shè)計(jì)橫斷面研究四格表資料統(tǒng)計(jì)分析性 別人數(shù)通過未通過合計(jì)男413273女43851合計(jì)8440124該表設(shè)計(jì)上屬于結(jié)果變量為二值變量的成組設(shè)計(jì)定性資料,列聯(lián)表分類上屬于橫截面研究設(shè)計(jì)四格表資料。6.5. 成組設(shè)計(jì)隊(duì)列研究四格表資料統(tǒng)計(jì)分析血壓情況例數(shù)患者未患病合計(jì)偏好196180正常20465485合 計(jì)39526565該資料是成組設(shè)計(jì)隊(duì)列研究四格表資料。隊(duì)列研究設(shè)計(jì)是通過對不同暴露水平的對象進(jìn)行追蹤觀察,隨訪觀察疾病發(fā)生情況,從而判斷該因素與發(fā)病之間有無關(guān)聯(lián)。6.6. 成組設(shè)計(jì)病例對照研究四格表資料統(tǒng)計(jì)分析喂養(yǎng)方式例數(shù)患齲未患齲合計(jì)母乳3781118人工或混合6676142合 計(jì)103157260該表是成組設(shè)計(jì)病例對照研究四格表資料。病例對照設(shè)計(jì)是以確診的患者作為病例,以不患該病但具有可比性的個(gè)體作為對照,收集以往危險(xiǎn)因素的暴露史,用統(tǒng)計(jì)學(xué)方法比較兩組中危險(xiǎn)因素的暴露比例,從而判斷因素與疾病之間是否存在統(tǒng)計(jì)學(xué)關(guān)聯(lián)。6.7. 成組設(shè)計(jì)結(jié)果變量為多值有序變量的2C表資料統(tǒng)計(jì)分析6.8. 成組設(shè)計(jì)結(jié)果變量為多值名義變量的2C表資料統(tǒng)計(jì)分析6.9. 單因素多水平設(shè)計(jì)無序原因變量R2表資料統(tǒng)計(jì)分析6.10. 單因素多水平設(shè)計(jì)有序原因變量R2表資料統(tǒng)計(jì)分析6.11. 單因素多水平設(shè)計(jì)雙向無序 RC表資料統(tǒng)計(jì)分析6.12. 單因素多水平設(shè)計(jì)有序結(jié)果變量RC表資料統(tǒng)計(jì)分析6.13. 單因素多水平設(shè)計(jì)雙向有序RC表資料統(tǒng)計(jì)分析7. 多因素設(shè)計(jì)一元定性資料差異性分析7.1. 用加權(quán)x2檢驗(yàn)處理結(jié)果變量為二值變量的高維列聯(lián)表資料在三維列聯(lián)表中,通常有兩個(gè)原因變量和一個(gè)結(jié)果變量,不同的研究目的決定了選用不同的統(tǒng)計(jì)分析方法。對于結(jié)果變量為二值變量的高維列聯(lián)表,可選用加權(quán)x2檢驗(yàn)、CMHx2檢驗(yàn)、多重logistic回歸、對數(shù)線性模型等。若不想用復(fù)雜的對數(shù)線性模型模型或logistic回歸模型來分析三維列聯(lián)表資料,并且資料又不合適采用簡單“合并”方式處理時(shí),就可采用加權(quán)x2檢驗(yàn)(消除掉一個(gè)原因變量對結(jié)果變量的影響,考察另一個(gè)原因變量與結(jié)果變量之間是否獨(dú)立)、CMHx2檢驗(yàn)(消除掉一個(gè)原因變量對結(jié)果變量的影響,計(jì)算優(yōu)勢比OR或相對危險(xiǎn)度RR,并對其進(jìn)行假設(shè)檢驗(yàn))。這兩種檢驗(yàn)方法都無法回答被合并掉的那個(gè)原因變量對結(jié)果變量的影響作用有多大,只是對其進(jìn)行分層計(jì)算,即評價(jià)另一個(gè)原因變量對結(jié)果變量的影響時(shí)將其對結(jié)果變量的影響扣除掉。7.2. 用CHMx2檢驗(yàn)處理結(jié)果變量具有3種性質(zhì)的高維列聯(lián)表資料結(jié)果變量為二值變量的三維列聯(lián)表,可以選用加權(quán)x2檢驗(yàn),CMHx2檢驗(yàn)、logistic回歸和對數(shù)線性模型。CMH統(tǒng)計(jì)分析(Cochran Mantel Haenszel Statics)是在MH統(tǒng)計(jì)分析方法的基礎(chǔ)上發(fā)展并提出來的,現(xiàn)在統(tǒng)稱為擴(kuò)展的MH卡方統(tǒng)計(jì)量,也統(tǒng)稱為MH檢驗(yàn),用于分層分析即控制混雜因素后對二維列聯(lián)表資料的統(tǒng)計(jì)處理。結(jié)果變量為多值有序變量的高維列聯(lián)表資料,可以選用CMHx2檢驗(yàn)(即CMH校正的秩和檢驗(yàn))和有序變量logistic回歸分析進(jìn)行處理。對數(shù)線性模型無法利用資料的有序性,因此不宜選用。若采用有序變量多重logistic回歸分析,應(yīng)注意結(jié)合原因變量是否存在多值名義變量或多值有序變量而決定對原因變量的賦值方法。結(jié)果變量為多值無序變量的高維列聯(lián)表資料,可以采用CMHx2檢驗(yàn)、擴(kuò)展的logistic回歸分析和對數(shù)線性模型。注,CMHx2檢驗(yàn)包含三種檢驗(yàn)方法:(1)非零相關(guān)檢驗(yàn)(適合于原因變量與結(jié)果變量都是多值有序變量)(2)行平均得分檢驗(yàn)(僅考察原因變量全部水平組之間在結(jié)果上的差別是否具有統(tǒng)計(jì)學(xué)意義,結(jié)果變量必須是多值有序變量)。(3)一般關(guān)聯(lián)性檢驗(yàn)(適合于原因變量和結(jié)果變量都是名義變量)。這里所提及的“原因變量”是指在多個(gè)原因變量中被保留下來的那個(gè)原因變量。7.3. 用Meta分析分別合并處理多個(gè)成組設(shè)計(jì)定性資料7.4. ROC方法分析診斷試驗(yàn)資料8. 多因素設(shè)計(jì)一元定性資料對數(shù)線性模型分析8.1. 用對數(shù)線性模型分析列聯(lián)表資料對數(shù)線性模型是分析高維列聯(lián)表行之有效的方法,最先由Yule、Bartlett利用Yule(1900年)定義的交叉乘積比分析三維交互作用,然后由Kullback(1968年)引入方差分析的思想發(fā)展而來。對數(shù)線性模型把各分組變量(包括自變量和因變量)水平組合下期望(理論頻數(shù))的自然對數(shù)表示為各組變量及其交互作用的線性函數(shù),通過迭代計(jì)算求得模型中參數(shù)的估計(jì)值,進(jìn)而運(yùn)用方差分析的思想檢驗(yàn)各主效應(yīng)和交互作用的效應(yīng)大小。對定量結(jié)果進(jìn)行預(yù)測性分析9. 兩變量簡單線性回歸分析9.1. Pearson線性相關(guān)分析當(dāng)兩個(gè)變量取值之間出現(xiàn)一個(gè)增大,另一個(gè)也增大(或減?。┑那闆r時(shí),則稱這種現(xiàn)象為共變,也就是說這兩個(gè)變量之間有“相關(guān)關(guān)系”。簡單線性相關(guān)關(guān)系是描述兩定量變量間是否含有直線關(guān)系以及直線關(guān)系的方向和密切程度的分析方法。此分析方法主要通過計(jì)算相關(guān)系數(shù)的大小并對其進(jìn)行假設(shè)檢驗(yàn)以及結(jié)合專業(yè)知識來評價(jià)得到的相關(guān)系數(shù)是否有實(shí)際意義來完成。前提條件:兩變量需滿足正態(tài)分布。9.2. Spearman秩相關(guān)分析在做Pearson相關(guān)分析時(shí),要求兩變量服從正態(tài)分布,然而當(dāng)?shù)玫降脑紨?shù)據(jù)并不服從正態(tài)分布或其總體分布未知,有時(shí)3數(shù)據(jù)中還存在所謂“超限值”(如限于儀器的靈敏度,僅知道血樣某物質(zhì)濃度小于0.001ug/ml),甚至數(shù)據(jù)本身就是等級材料。此時(shí),宜采用等級相關(guān)或稱秩相關(guān)來分析兩變量的線性聯(lián)系程度與方向。這類方法是利用兩變量的秩次大小做線性相關(guān)分析,對原變量分布不做要求,屬非參數(shù)統(tǒng)計(jì)分析方法。9.3. 簡單線性回歸分析簡單線性回歸分析是用直線回歸方程表示兩個(gè)定量變量間依存關(guān)系的統(tǒng)計(jì)分析方法。此分析方法主要由三部分組成:(1)計(jì)算反映兩定量變量依賴關(guān)系的直線回歸方程,即計(jì)算直線回歸方程的截距a、斜率b。(2)根據(jù)樣本截距a、斜率b,檢驗(yàn)樣本所抽自的總體截距是否為0、總體斜率是否為0。(3)結(jié)合專業(yè)知識,評價(jià)此直線回歸方程是否有實(shí)用價(jià)值。前提條件:線性(linear):即X和Y之間的關(guān)系為線性關(guān)系;獨(dú)立(independent):即n個(gè)個(gè)體的觀察資料間必須是獨(dú)立的;正態(tài)(normal):即給定X后,Y為正態(tài)分布,且Y的均數(shù)就是回歸線上對應(yīng)于X值的點(diǎn);等方差(equal variance):即不同X值對應(yīng)的Y的分布具有相同的方差,換句話說Y的方差與X無關(guān)。9.4. 加權(quán)線性回歸分析此方法未弄明白。10. 兩變量可直線化曲線回歸分析10.1. 對數(shù)函數(shù)、冪函數(shù)和雙曲函數(shù)曲線回歸分析1.對數(shù)函數(shù)對數(shù)函數(shù):y=a+b*lg(x) 變化方法:x=lg(x) 直線化結(jié)果:y=a+b*x2.冪函數(shù)冪函數(shù):y=axb 變換方法:y=lny, x=lnx直線化結(jié)果:y=lna+b*x3.雙曲線函數(shù)雙曲線函數(shù):1y=a+bx (a0) 變換方法:y=1y, x=1x直線化結(jié)果:y=a+b*x10.2. 指數(shù)函數(shù)曲線回歸分析指數(shù)函數(shù):y=aebx 變換方法:y=lgy直線化結(jié)果:y=lna+b*x10.3. Logistic函數(shù)曲線回歸分析Logistic曲線:y=L+K1+aebx 變換方法:y=lnK-(y-L)y-L直線化結(jié)果:y=lna+b*x11. 各種復(fù)雜曲線回歸分析11.1. 多項(xiàng)式曲線回歸分析二項(xiàng)式的可能曲線形式有:三項(xiàng)式的可能曲線形式有:11.2. Logistic曲線回歸分析11.3. Gompertz曲線回顧分析Gompertz曲線方程:y=Le-ae-bx,L為上漸近線。11.4. 二項(xiàng)型指數(shù)曲線回歸分析二項(xiàng)式指數(shù)曲線:y=A*e-x+B*e-x11.5. 三項(xiàng)型指數(shù)曲線回歸分析三項(xiàng)式指數(shù)曲線: y=N*e-kax+L*e-x+M*e-x12. 多重線性回歸分析多重線性回歸是指因變量為一個(gè)、自變量為多個(gè)的線性回歸分析。前提條件:1、自變量與因變量之間存在線性關(guān)系;2、各觀測間相互獨(dú)立;3、殘差服從正太分布;4、方差齊性。需要注意的是,在回歸方程中,不能直接根據(jù)各自變量回歸系數(shù)絕對值的大小來評價(jià)該自變量的作用大小,因?yàn)樽宰兞康膯挝徊槐M相同,回歸系數(shù)的大小要收到單位的影響。如果要比較各自變量的作用大小,應(yīng)消除自變量單位的影響,這就需要求標(biāo)準(zhǔn)化的回歸系數(shù)。標(biāo)準(zhǔn)化回歸系數(shù)沒有量綱,統(tǒng)計(jì)學(xué)上常用它的絕對值大小來衡量自變量對因變量影響的相對重要性,標(biāo)準(zhǔn)化回歸系數(shù)的絕對值越大,說明該自變量對隱變量的作用越大。13. 主成分回歸分析主成分回歸分析是將多個(gè)彼此相關(guān)、信息重疊的指標(biāo)通過適當(dāng)?shù)木€性組合,使之成為彼此獨(dú)立而又提取了原指標(biāo)變異信息并帶有特定專業(yè)含義的綜合潛變量,即主成分,建立潛變量和因變量間的線性回歸方程,再將回歸方程中的潛變量轉(zhuǎn)換為原自變量的一種統(tǒng)計(jì)學(xué)方法。多重線性回歸分析和主成分回歸分析都是用于分析單因素設(shè)計(jì)多元定量資料的統(tǒng)計(jì)學(xué)方法?;静襟E:(1)進(jìn)行多重線性回歸分析,并進(jìn)行共線性診斷;(2)如果自變量之間存在共線性,則可選擇進(jìn)行主成分分析,以解決由于共線性的影響,造成回歸結(jié)果不合理或無法解釋的問題。(3)用主成分分析求自變量的主成分和主成分得分,將貢獻(xiàn)率小的主成分舍棄。(4)將因變量對保留的主成分得分進(jìn)行回歸分析。(5)將主成分的表達(dá)式回代,最后得到因變量與原始變量的回歸模型,并給予專業(yè)解釋。14. 嶺回歸分析用REG過程進(jìn)行多重線性回歸分析,在進(jìn)行參數(shù)估計(jì)時(shí)常用最小二乘法。該方法在數(shù)據(jù)滿足GM(Gauss-Markov)定理時(shí),保證了在線性無偏估計(jì)類中的方差最小。如果進(jìn)一步假設(shè)誤差服從正態(tài)分布,那么最小二乘法還具有更多更好的性質(zhì)。但是,在實(shí)際應(yīng)用中,許多應(yīng)用實(shí)踐證明,有些情況在運(yùn)用最小二乘法時(shí)并不是很理想,在個(gè)別情況下可能不是很好。自20實(shí)際50年代特別是60年代以來,許多統(tǒng)計(jì)學(xué)家做了很多努力,試圖改進(jìn)最小二乘法估計(jì)。Stein于1955年證明了:當(dāng)維數(shù)大于2時(shí),能夠找到另外一個(gè)估計(jì),它在某種意義下一致優(yōu)于最小二乘法估計(jì)。據(jù)此,在后來的發(fā)展中,統(tǒng)計(jì)學(xué)家提出了許多新的估計(jì)方法,主要有嶺估計(jì)、主成分估計(jì)以及特征根估計(jì)等。這些估計(jì)的一個(gè)共同特點(diǎn)是有偏性。單組設(shè)計(jì)多元定量資料,可能的分析方法有多重共線性回歸分析、響應(yīng)曲面回歸分析、嶺回歸分析、病態(tài)數(shù)據(jù)回歸分析等。哪一種方法最好或者比較好呢?正確的分析方案將是:分別用不同的回歸分析方法對此資料進(jìn)行分析,然后對不同回歸分析方法得出的結(jié)果進(jìn)行比較,哪一種方法得到的結(jié)果最符合專業(yè)實(shí)際,也就是最好或者比較好的方法。當(dāng)然也有可能用現(xiàn)有的各種方法所得到的結(jié)果不具有推廣應(yīng)用的價(jià)值,如果是這樣,則需要尋找別的方法。15. Poisson回歸分析Poisson回歸屬于廣義線性模型,專門適用于響應(yīng)變量是計(jì)數(shù)資料的情形,可以定量地分析多個(gè)響應(yīng)因素與計(jì)數(shù)的響應(yīng)變量之間的關(guān)系。Poisson分布是由法國數(shù)學(xué)家S.D.Possion作為二項(xiàng)分布的近似而引入的,常用于描述單位時(shí)間、平面或空間中罕見“質(zhì)點(diǎn)”數(shù)的隨機(jī)分布規(guī)律。Poisson回歸是基于Poisson分布,用于單位時(shí)間、單位面積或單位空間內(nèi)某時(shí)間發(fā)生數(shù)(事件的發(fā)生服從Poisson分布)的響應(yīng)因素分析的一種方法。前提條件:要求事件的發(fā)生是獨(dú)立的。小結(jié):Poisson回歸用于描述結(jié)果變量服從Poisson分布的資料。Poisson回歸模型與logistic回歸模型均屬于廣義線性模型,在建模的過程中除了連接函數(shù)不同外,主要的不同之處在于數(shù)據(jù)服從何種分布,適合于用何種方法建模。Poisson回歸一般用于單位時(shí)間、單位面積、單位空間內(nèi)某時(shí)間發(fā)生數(shù)的影響因素的探討,時(shí)間的發(fā)生服從Poisson分布。當(dāng)結(jié)果變量是二分類或多分類時(shí),應(yīng)根據(jù)數(shù)據(jù)的分布情況看數(shù)據(jù)是滿足Poisson分布還是可通過logit變化進(jìn)行l(wèi)ogistic回歸分析。16. 負(fù)二項(xiàng)回歸與Probit回歸分析Poisson回歸分析是以計(jì)數(shù)資料為響應(yīng)變量的標(biāo)準(zhǔn)回歸模型。但是在Poisson回歸分析中要求均數(shù)和方差相等,實(shí)際數(shù)據(jù)往往并不符合這一假定,方差有時(shí)會(huì)大于均數(shù),也就是所謂的過離散(Overdispersion),這將導(dǎo)致模型參數(shù)估計(jì)值的標(biāo)準(zhǔn)誤差偏小,參數(shù)wald檢驗(yàn)的假陽性率增加。這種情況的出現(xiàn)可能是由于觀測之間不獨(dú)立導(dǎo)致的;而在醫(yī)學(xué)研究中,很多事件的發(fā)生是非獨(dú)立的。對于這類資料,可以采用負(fù)二項(xiàng)回歸分析。過離散在理解負(fù)二項(xiàng)回歸分析中居于中心地位,負(fù)二項(xiàng)回歸的每一個(gè)應(yīng)用幾乎都與Poisson回歸中發(fā)現(xiàn)過離散有關(guān)。統(tǒng)計(jì)學(xué)分析的目的都是建立觀測個(gè)體產(chǎn)生某種響應(yīng)的概率與各自變量水平的關(guān)系,以便通過某觀測個(gè)體各自變量的水平取值來預(yù)測其產(chǎn)生某種影響的概率。這可以通過logistic回歸分析來間接實(shí)現(xiàn),也可以通過probit回歸分析來直接實(shí)現(xiàn)。Probit回歸分析與logistic回歸分析的最大不同點(diǎn)在于:probit回歸分析中的響應(yīng)變量不再是二值變量(取值為0或1,如是否罹患心臟病),而是0-1之間的百分比變量。17. 生存資料COX模型回歸分析目前,對生存資料的多因素分析最常用的方法是COX比例風(fēng)險(xiǎn)回歸模型(Proportional Hazards Regression Model),簡稱COX模型。該模型是一種多因素的生存分析法,它可同時(shí)分析眾多因素對生存期的影響,分析帶結(jié)尾生存時(shí)間的資料,并且不要求估計(jì)資料的生存分布類型。COX模型屬比例風(fēng)險(xiǎn)模型簇,其基本假定之一是比例風(fēng)險(xiǎn)假定(簡稱PH假定)。只有在滿足該假定前提條件下,基于此模型的分析預(yù)測才是可靠有效的。正像我們所熟知的t檢驗(yàn)中的正態(tài)分布假定一樣,當(dāng)使用比例風(fēng)險(xiǎn)模型時(shí),比例風(fēng)險(xiǎn)假定應(yīng)看成一個(gè)基本前提。檢查某斜變量是否滿足PH假定,最簡單的方法是觀察按該變量分組的Kaplan-Meier生存曲線。若生存曲線交叉,則提示不滿足PH假定。第2種方法是繪制按該變量分布的ln(-lnS(t)對生存時(shí)間t的圖,曲線應(yīng)大致平行或等距。如各斜變量均滿足或近似滿足PH假定,可直接應(yīng)用基本COX模型。18. 生存資料參數(shù)模型回歸分析生存資料參數(shù)模型回歸分析的一個(gè)重要內(nèi)容是擬合或分布擬合。描述生存時(shí)間分布的模型通常有指數(shù)分布、Weibull分布、對數(shù)正態(tài)分布、Gamma分布等。常見生存時(shí)間分布的概率密度函數(shù)f(t)、生存函數(shù)S(t)和風(fēng)險(xiǎn)函數(shù)h(t)如下表。實(shí)際對生存數(shù)據(jù)作分布擬合時(shí),可用上述模型分別進(jìn)行擬合,根據(jù)擬合優(yōu)度檢驗(yàn)的結(jié)果選擇適當(dāng)?shù)哪P汀S袝r(shí),對于一批生存數(shù)據(jù),事先不知道生存時(shí)間分布的總體趨勢,也不好判斷用什么樣的模型最合適,許多研究者一般直接采用非參數(shù)方法或半?yún)?shù)法。但是如果一批數(shù)據(jù)確實(shí)符合某特定的參數(shù)模型,由于非參數(shù)方法的精度一般低于參數(shù)方法,因此,按照非參數(shù)方法進(jìn)行的分析就不能有效地利用和闡述樣本數(shù)據(jù)所包含的信息,同時(shí)它對樣本量的要求也高于參數(shù)方法。常見生存時(shí)間分布的概率密度函數(shù)f(t)、生存函數(shù)S(t)和風(fēng)險(xiǎn)函數(shù)h(t)分 布f(t)S(t)h(t)指數(shù)分布exp(-t)exp(-t)weibull分布t-1exp-texp-(t)t-1gamma分布t-1exp(-t)()1-I(t,r)f(t)s(t)對數(shù)正態(tài)分布exp-12(lnt-)2t21-lnt-f(t)S(t)對數(shù)logistic分布(tr)-11+(t)211+(t)t-11+(t)廣義gamma分布kt-1exp(-t)(k)1-I(t,)f(t)S(t)19. 時(shí)間序列分析按某種(相等或不想等)的時(shí)間間隔對客觀事物進(jìn)行動(dòng)態(tài)觀察,由于隨機(jī)因素的影響,各次觀察的指標(biāo)x1,x2,x3,xi都是隨機(jī)變量,這種按時(shí)間順序排列的隨機(jī)變量的一組實(shí)測值稱為時(shí)間序列。時(shí)間序列中每一時(shí)期的數(shù)值,都是由許多不同的因素共同作用的結(jié)果,而這些因素往往交織在一起,這樣就增加了分析時(shí)間序列的困難。因此,時(shí)間序列分析通常對各種可能發(fā)生作用的因素進(jìn)行分類,如長期趨勢、季節(jié)變動(dòng)、循環(huán)變動(dòng)和不規(guī)則變動(dòng)。時(shí)間序列分析的目的是利用所擬合的模型對某研究領(lǐng)域的動(dòng)態(tài)數(shù)據(jù)的未來狀況進(jìn)行預(yù)測。時(shí)間序列分析大致包括三方面的內(nèi)容:(1)選擇模型并進(jìn)行參數(shù)估計(jì);(2)模型的適用性檢驗(yàn);(3)預(yù)測預(yù)報(bào)。19.1. 指數(shù)平滑法指數(shù)平滑(Exponential Smoothing)是由Brown等(Brown和Meyers于1961年;Brown于1972年)發(fā)展起來的計(jì)算模式,它擬合一種使用平滑方案的時(shí)間趨勢模型。通式是St=axt+(1-a)St-1,式中St為第t期平滑值(t0),a為平滑系數(shù)(取值范圍0a1),xt為第t期實(shí)際觀測值,系數(shù)a和(1-a)都是表示權(quán)重。在此方案中,權(quán)重大小隨著時(shí)間的向后推移而呈現(xiàn)幾何級數(shù)下降。所以對于事物未來發(fā)展的回評,新近的觀測值比早期的觀測值的預(yù)測價(jià)值更大,所以在預(yù)測時(shí),新近觀測值應(yīng)比早期觀測值具有更大權(quán)重。作為一種預(yù)測方法,指數(shù)平滑預(yù)測效果的好壞取決于對這個(gè)序列選擇一個(gè)怎樣的平滑系數(shù)a。a值為0-1。一般來說,平滑系數(shù)a的取值大小應(yīng)當(dāng)視預(yù)測對象的特點(diǎn)及預(yù)測周期的長短而定。a取值偏低時(shí),預(yù)測結(jié)果主要取決于歷史情形,不能及時(shí)跟蹤數(shù)據(jù)新的變化趨勢;a取值偏高時(shí),預(yù)測模型具有較高的靈敏度,能夠迅速跟蹤新數(shù)據(jù)的變化,但對歷史數(shù)據(jù)的信息利用較少。在實(shí)際應(yīng)用中,通常采用多個(gè)水平的a值進(jìn)行試算比較,選擇其中的最優(yōu)值做為平滑系數(shù),原則是使預(yù)測誤差平方和(SSE)、平均平方誤差(MSE)或平均絕對誤差(MAE)最小。在根據(jù)上述原則進(jìn)行優(yōu)選后,還應(yīng)該對根據(jù)預(yù)測結(jié)果所得到的參數(shù)的合理性進(jìn)行檢驗(yàn)。19.2. ARIMA模型19.3. 譜分析應(yīng)用時(shí)間序列分析的目的是進(jìn)行預(yù)測和控制。時(shí)域分析是,通過建立時(shí)間序列模型對時(shí)間數(shù)據(jù)樣本進(jìn)行預(yù)測和估計(jì),展現(xiàn)數(shù)據(jù)內(nèi)在的特性。頻域數(shù)據(jù)則是從頻率角度展現(xiàn)時(shí)間序列數(shù)據(jù)的特點(diǎn)和規(guī)律,其中最主要的任務(wù)是通過譜分析來獲得時(shí)間數(shù)據(jù)的周期性特點(diǎn),這一特點(diǎn)對于了解數(shù)據(jù)變化的規(guī)律來說是一個(gè)關(guān)鍵點(diǎn)。時(shí)間序列研究對數(shù)據(jù)的要求是比較高的。最關(guān)鍵的是,數(shù)據(jù)必須是平穩(wěn)序列。首先要進(jìn)行時(shí)間序列分析,對序列的長度是有要求的,長度不能太短,應(yīng)該是大樣本;但是也不能太長,至少是周期的2倍以上。當(dāng)然,時(shí)間序列的頻域研究同樣也要求測量的時(shí)間間隔為等間隔。另外,若欲表達(dá)時(shí)間序列中周期值為T的信息成分,則采樣間隔不能大于T/2,該采樣定理就是Nyquist采樣定理。在進(jìn)行譜分析之間要先進(jìn)行數(shù)據(jù)的去趨勢化,可以通過回歸過程求剩余殘差實(shí)現(xiàn),也可以通過選項(xiàng)ADJMEAN來實(shí)現(xiàn)。SAS軟件的SPECTRA過程中是不允許缺失數(shù)據(jù)出現(xiàn)的,缺失數(shù)據(jù)將無法參與分析,被自動(dòng)排除于分析之外。如果分析變量中出現(xiàn)缺失值時(shí),程序自作主張將變量中沒有缺失值的最長的連續(xù)數(shù)據(jù)部分作為分析變量。在分析要注意檢查缺失數(shù)據(jù),也可以通過補(bǔ)充缺失數(shù)據(jù)來實(shí)現(xiàn)。19.4. X12方法X12過程是根據(jù)美國人口普查局X-12-ARIMA季節(jié)調(diào)整程序改編的,用于調(diào)整月度或季度時(shí)間序列數(shù)據(jù)。該過程包含了X-11過程、X-11-ARIMA/88模型以及一些新的特征。X12過程較X11的一個(gè)主要提高是應(yīng)用regARIMA模型帶有ARIMA(Autoregressive Integrated Moving Average)誤差的回歸模型,利用該模型進(jìn)行移動(dòng)假日、月份長度、交易日效應(yīng)等固定效應(yīng)的調(diào)整。X-12-ARIMA模型包含了美國人口統(tǒng)計(jì)局和加拿大統(tǒng)計(jì)局開發(fā)的季節(jié)調(diào)整模型的主要特征。對序列進(jìn)行季節(jié)調(diào)整是基于這樣的假定:季節(jié)性波動(dòng)可以由原始序列(Qt,t=1,n)中測得,并能與趨勢起伏、交易日及不規(guī)則波動(dòng)分離開:這一時(shí)間序列的季節(jié)成分(St)定義為年內(nèi)的變動(dòng),從一年到一年之間恒定地取值或緩慢地變化;趨勢起伏項(xiàng)(Ct)包含由長期趨勢,經(jīng)濟(jì)起伏及其他長期起伏因素引起的變化;交易日成分(Dt)是由歷史交易日位置變化引起的;不規(guī)則成分(It)是殘余的變化量。對定性結(jié)果進(jìn)行預(yù)測性分析20. 非配對設(shè)計(jì)定性資料多重logistic回歸分析在生物醫(yī)學(xué)研究中最常見的問題之一是探索各種影響因素(自變量X)與疾病或健康(響應(yīng)變量Y)之間的關(guān)系。在許多情況下,疾病和健康狀況屬于分類變量,包括二值變量、多值有序變量和多值名義變量。當(dāng)響應(yīng)變量為分類變量時(shí),就不適合使用線性回歸進(jìn)行分析,這時(shí)可以考慮采用多重logistic回歸。按照因變量的類型可以將logistic回歸分為三類:因變量為二值變量的logistic回歸;因變量為多值有序變量的logistic回歸,稱為累積logistic回歸模型或序次logistic回歸模型;因變量為多值名義變量的logistic回歸,稱為多項(xiàng)logit模型。按照設(shè)計(jì)類型可以將logistic回歸模型分為非條件logistic回歸和條件logistic回歸,其中非條件logistic回歸就是指一般的logistic模型,適用于成組設(shè)計(jì)資料;條件logistic回歸則是針對配對設(shè)計(jì)資料。20.1. 二值變量的多重logistic回歸分析20.2. 多值有序變量的多重logistic回歸分析20.3. 多值名義變量的多重logistic回歸分析21. 配對設(shè)計(jì)定性資料多重logistic回歸分析配對設(shè)計(jì)能夠改善兩組研究對象的齊同性,提高研究效率。配對的因素一般是年齡、行唄等重要的混雜因素。最常見的配對形式是每個(gè)匹配組中有一個(gè)病例和若干個(gè)對照,稱為1:m配對設(shè)計(jì);當(dāng)然,不同匹配組中病例和對照的人數(shù)也可以是任意的,也就是說不同匹配中病例數(shù)與對照數(shù)的比例可以不相等,稱為m:n配對設(shè)計(jì)。討論此類問題時(shí),因關(guān)心的是在某一給定的條件下某事件發(fā)生的概率,這一概率稱為條件概率,故將此類logistic回歸稱為條件logistic回歸,將非配對設(shè)計(jì)資料的logistic回歸稱為非條件logistic回歸。21.1. 1:1配對設(shè)計(jì)定性資料的多重logistic回歸分析21.2. m:n配對設(shè)計(jì)定性資料的多重logistic回歸分析22. 原因變量為定量變量的判別分析根據(jù)明確分類的受試對象(或樣品)的多個(gè)定量指標(biāo)的取值建立一個(gè)或多個(gè)關(guān)系式(判別函數(shù)式,通常具有一定程度的出錯(cuò)概率),再根據(jù)某種或某些規(guī)則,基于已建立的判別函數(shù)式實(shí)現(xiàn)對歸屬尚不明確的哪些新個(gè)體的分類或判別,這樣一種研究方法被稱為判別分析。很顯然,判別分析中的結(jié)果變量為分類變量(二分類變量或多分類變量)。小結(jié):適于處理定量資料的判別分析方法比較多,其中又分為參數(shù)法和非參數(shù)法。參數(shù)法通常要求定量資料服從多元正態(tài)分布,最好類與類之間方差和協(xié)方差矩陣相等。但是,SAS軟件中并沒有提供檢驗(yàn)定量資料是否服從多元正態(tài)分布的方法,故只能假定該條件滿足。在多元正態(tài)分布的假定成立的前提下,若方差和協(xié)方差矩陣相等,則將各類資料合并求方差和協(xié)方差矩陣,進(jìn)而計(jì)算線性判別函數(shù)的系數(shù);否則,采用各類資料的方差和協(xié)方差矩陣計(jì)算二次型判別函數(shù)的系數(shù)。有時(shí),非參數(shù)判別法的效果很好,它可以通過改變其待定系數(shù)的值,來獲得比較滿意的判別結(jié)果。例如,可以改變K最近鄰判別法中的K值或改變核密度判別法中的兩個(gè)選項(xiàng),即改變R值或和核密度的形式(共有正態(tài)核密度、均勻核密度等5中選項(xiàng))。在采用參數(shù)法和非參數(shù)法對定量資料進(jìn)行判別分析之前,最好采用逐步判別分析方法進(jìn)行變量篩選,以便淘汰掉無區(qū)分能力的定量變量,有利于提供判別的效果。而且,對于原因變量為定量變量的判別分析,宜先采用逐步判別分析法篩選變量,再對保留下來的定量變量采用參數(shù)法和非參數(shù)法進(jìn)行判別分析,并盡可能將可變系數(shù)或選項(xiàng)取遍各種可能的情況,從中選擇從中選擇使交叉驗(yàn)證的誤判率最低的方法。SAS中的典型判別分析并太常用,因?yàn)樗鼪]有提供回代判別和交叉驗(yàn)證的結(jié)果,只能借用FREQ過程間接實(shí)現(xiàn)回代判別。另外,盡量不要采用多重logistic回歸分析來間接實(shí)現(xiàn)判別分析,因?yàn)槌5貌坏椒匠讨袇?shù)的最大似然估計(jì)值,有時(shí)即便得到了參數(shù)估計(jì)值,也只能用FREQ過程得到回代判別結(jié)果,沒有交叉驗(yàn)證結(jié)果,而且一般情況下誤判率比較高;雖然用二值線性回歸分析間接實(shí)現(xiàn)判別分析比較簡單,但其誤判率一般也比較高,并且只能用FREQ過程間接實(shí)現(xiàn)回代判別。23. 原因變量為定性變量的判別分析結(jié)果變量是定性的,原因變量也是定性的,對這類資料進(jìn)行判別分析時(shí),所用的方法叫做原因變量為定性變量的判別分析。適于處理這種資料的判別分析方法很少,一般只有最大似然判別法和貝葉斯公式判別法。24. 決策樹分析25. 神經(jīng)網(wǎng)絡(luò)分析多變量間相互與依賴關(guān)系分析26. 主成分分析主成分分析(principal components analysis),它是將多個(gè)變量(或指標(biāo))化為少數(shù)幾個(gè)互不相關(guān)的綜合變量(指標(biāo))的統(tǒng)計(jì)分析方法。主成分實(shí)際上就是由原變量X1Xm線性組合出來的m個(gè)互不相關(guān)且未丟失任何信息的新變量,也稱為綜合變量。多指標(biāo)的主成分常被用來需找判斷某種十五或現(xiàn)象的綜合指標(biāo),并給綜合指標(biāo)所蘊(yùn)藏的信息以恰當(dāng)解釋,以便更深刻地揭示事物內(nèi)在的規(guī)律。對于單組設(shè)計(jì)多元定量資料,根據(jù)不同的研究目的,可有多種不同的統(tǒng)計(jì)統(tǒng)計(jì)分析方法供選用。目的一:希望以互不相關(guān)的較少的綜合指標(biāo)(這些綜合指標(biāo)是不能直接測量的)來反映原始指標(biāo)所提供的大部分信息時(shí),即希望找出“幕后”操縱原變量取值規(guī)律的隱變量時(shí),可選用主成分分析。目的二:希望用較少的互相獨(dú)立的公共因子反映原有變量的絕大部分信息,即希望以最少的信息丟失將眾多原有變量濃縮成少數(shù)幾個(gè)具有一定命名解釋性的公共因子,可選用探索性因子分析。主成分分析是將主成分表示為原始變量的線性組合,而因子分析是將原始變量表示為公共因子和特殊因子的線性組合。探索性因子分析比主成分分析更強(qiáng)調(diào)隱變量的實(shí)際意義,并且由于因子分析允許特殊因子的存在將得到較主成分分析更為精確的結(jié)果。一般而言,僅想把現(xiàn)有變量縮減為少數(shù)幾個(gè)新變量而從進(jìn)行后續(xù)的分析,采用主成分分析即可。小結(jié):1、主成分是原變量的線性組合,是對原變量信息的一種提取,主成分不增加總信息量,也不減少總信息量,只是對原信息進(jìn)行了重新分配。當(dāng)變量之間的相關(guān)性較小時(shí),應(yīng)用主成分分析是沒有意義的。2、主成分個(gè)數(shù)的確定依賴于主成分的貢獻(xiàn)大小。3、主成分分析本身往往并不是目的,而是達(dá)到目的的一種手段;可用于多重回歸分析,主要解決自變量間的共線性問題;可用于因子分析、聚類分析、判別分析等,主要目的是減少變量個(gè)數(shù)(統(tǒng)計(jì)上成為降維)等。27. 探索性因子分析因子分析最早由Charles Spearman在1904年提出,其基本思想是通過對原始變量(或樣品)的相關(guān)系數(shù)矩陣(對樣品而言)內(nèi)部結(jié)構(gòu)的研究,找出能控制所有變量(或樣品)的少數(shù)幾個(gè)隨機(jī)變量去描述多個(gè)變量(或樣品)之間的相關(guān)(相似)關(guān)系。但這幾個(gè)隨機(jī)變量是不可觀測的,通常稱為公共因子。然后根據(jù)相關(guān)性(或相似性)的大小把變量(或樣品)分組,使得同組內(nèi)的變量(或樣品)之間的相關(guān)性(或相似性)較高,而不同組的變量相關(guān)性(或相似性)較低。由于各變量存在一定的相關(guān)關(guān)系,因此,有可能用較少的不相關(guān)的公共因子來綜合存在于變量中的各類信息。同時(shí),提取出的公共因子保持了相互獨(dú)立的良好特性,有效地克服了變量間可能存在的多重共線性問題。從全部計(jì)算過程來看,對同一批觀測數(shù)據(jù),R型因子分析和Q型因子分析是一樣的,只不過出發(fā)點(diǎn)不同,R型從相關(guān)系數(shù)矩陣出發(fā),Q型從相似系數(shù)矩陣出發(fā)。小結(jié):1、因子分析是用較少的互相獨(dú)立的公共因子反映原有變量的絕大部分信息的多元統(tǒng)計(jì)分析方法,即研究如何以最少的信息丟失將眾多原有變量濃縮成少數(shù)幾個(gè)具有一定命名解釋性的公共因子。2、因子載荷aij是第i個(gè)變量xi與第j個(gè)公共因子fj的相關(guān)系數(shù),即表示xi依賴fj的份量(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 佳木斯市向陽區(qū)2024-2025學(xué)年三年級數(shù)學(xué)第二學(xué)期期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 江蘇省蘇州昆山市、太倉市2025屆中考沖刺預(yù)測卷(六)語文試題含解析
- 昆明幼兒師范高等??茖W(xué)校《藥用高分子材料》2023-2024學(xué)年第一學(xué)期期末試卷
- 華中科技大學(xué)《大學(xué)英語寫作》2023-2024學(xué)年第一學(xué)期期末試卷
- 山西科技學(xué)院《城市地理學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 江西生物科技職業(yè)學(xué)院《生物教材分析與應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 寧夏醫(yī)科大學(xué)《城市設(shè)計(jì)1》2023-2024學(xué)年第二學(xué)期期末試卷
- 烏海職業(yè)技術(shù)學(xué)院《工程制圖(Ⅱ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 云南外事外語職業(yè)學(xué)院《英語國家社會(huì)與文化(1)》2023-2024學(xué)年第二學(xué)期期末試卷
- 上海師范大學(xué)天華學(xué)院《綠色建筑檢測與評價(jià)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年人民保險(xiǎn)筆試題型及答案
- 2025-2030中國TPU膜行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展研究報(bào)告
- 2024年內(nèi)江市事業(yè)單位醫(yī)療崗招聘考試真題
- 中醫(yī)護(hù)理學(xué)(第5版)課件 第4章 病機(jī)
- 2025年泰語初級考試試題及答案
- 造瘺口還納護(hù)理
- 《尼爾斯騎鵝旅行記》讀書分享課件
- 浙江省溫州市瑞安市2023-2024學(xué)年六年級下學(xué)期數(shù)學(xué)期中分項(xiàng)評價(jià)試卷(含答案)
- 山東省德州市2024年中考化學(xué)試卷(含答案)
- Unit 2 Morals and Virtues Listening and Speaking教學(xué)設(shè)計(jì)-2024-2025學(xué)年人教版高中英語必修第三冊
- (統(tǒng)編2024版)語文一年級下冊第七單元解析+任務(wù)目標(biāo)+大單元教學(xué)設(shè)計(jì)
評論
0/150
提交評論