2023年完全隨機設計配對設計隨機區組設計交叉設計拉丁方_第1頁
2023年完全隨機設計配對設計隨機區組設計交叉設計拉丁方_第2頁
2023年完全隨機設計配對設計隨機區組設計交叉設計拉丁方_第3頁
2023年完全隨機設計配對設計隨機區組設計交叉設計拉丁方_第4頁
2023年完全隨機設計配對設計隨機區組設計交叉設計拉丁方_第5頁
已閱讀5頁,還剩9頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據分析的策略在研究設計思緒指導下進行醫學科學研究,研究結果經常以數據形式呈現,這些數據提供了豐富的信息。然而,如何從大量的看似雜亂無章的數據中萃取和提煉有用的信息,以揭示其中隱含的內在規律,幫助研究者進行判斷或推理,還需要對這些紛繁復雜的數據進行分析。數據分析是分析和解決變量間關系的理論與方法,所涉及變量常被分為解釋變量和反映變量,解釋變量又稱分組變量、協變量等,反映變量是表達實驗效應的變量或指標。變量的觀測值構成數據或資料,常有計量資料、計數資料和等級資料之分。數據分析指的是對數據進行記錄分析,就是根據抽樣研究的方法,運用概率論與數理記錄的原理,對樣本信息進行分析和研究,從而對所研究的事物的記錄規律性作出概率性的估計和推斷。具體內容涉及數據的變量變換、記錄量的選擇策略、參數估計與假設檢查方法應用策略。第一部分數據的變量變換策略許多記錄分析方法對數據有一定規定,如檢查、檢查,規定樣本獨立地來自正態總體,方差齊同;又如直線回歸分析規定自變量與應變量呈線性關系,每個相應的總體為正態分布,各個正態分布的總體方差相等,各次觀測彼此獨立。然而,仍有大量的醫學資料往往不滿足上述規定,在分析過程中對資料進行變量變換(transformationofvariable)是解決問題的途徑之一。恰當的數據變換可以一定限度上使資料滿足記錄分析方法的規定,如使資料符合正態化、方差齊同化、曲線直線化等規定。常用的變量變換方法有對數變換(transformationoflogarithm)、平方根變換(transformationofsquareroot)、平方根反正弦變換(transformationofinversesine)、倒數變換(transformationofreciprocal)、概率單位變換(transformationofprobabilityunit)、logit變換(transformationoflogit)、反雙曲正切變換(transformationofinversehyperbolictangent)、得分變換(transformationofscore)、box-cox變換(transformationofbox-cox)等。第二節記錄量的選擇策略一、概念記錄量(statistic)是由樣本觀測值計算出來的,反映樣本分布特性的指標。對反映變量特性的描述中,計量資料有集中趨勢指標與離散限度指標,計數資料與等級資料有相對數指標;對于解釋變量和反映變量間關系的描述,有互依關系指標、依存關系指標等。如何從眾多記錄量中選擇適宜的記錄量描述樣本分布特性是至關重要的。二、選擇記錄量的策略數據分析涉及眾多記錄量,基于分析目的,通常依據資料類型、資料特性、解釋變量和反映變量個數等來選擇適宜的記錄量。表9-1計量資料常用記錄量的選擇策略反映變量數資料特性不同分析目的下的常用記錄量平均水平變異限度單個反映變量單峰對稱分布,特別正態分布資料算術均數方差、標準差、變異系數*單個反映變量各種分布類型資料,但重要是偏態分布資料,分布一端或兩端無確切數值的資料中位數四分位間距、全距單個反映變量等比級數資料,經對數變換呈對稱分布資料,特別對數正態分布資料幾何均數—多個反映變量多元正態分布均數向量協方差矩陣*重要用于度量衡單位不同或均數相差懸殊的多個變異限度的比較表9-2計數資料與等級資料常用記錄量的選擇策略資料特性重要分析目的常用記錄量二分類計數資料某現象發生的頻率或強度率二分類或多分類計數資料、等級資料某事物內部各組成部分所占比重構成比此外,相對比也是常用的派生記錄量指標,是兩個有關指標之比,旨在描述兩個指標間比例關系。這兩個有關的指標可以是基于計量資料、計數資料而計算出的記錄量,也可以是某絕對數。表9-3解釋變量與反映變量間關聯性常用記錄量的選擇策略解釋變量()個數反映變量()個數資料類型資料特性重要分析目的分析方法常用記錄量11計量資料線性、獨立、正態、等方差與的線性依存關系直線回歸分析回歸系數21計量資料線性、獨立、正態、等方差、、…與的線性依存關系多元線性回歸分析偏回歸系數21為計數資料、等級資料非線性各因素危險度大小logistic回歸分析回歸系數優勢比21截尾變量為計數資料;時間變量為計量資料非線性各因素危險度大小Cox回歸分析回歸系數風險比11計量資料線性、獨立、二元正態、等方差相關的限度與方向直線相關分析Pearson相關系數11計量資料或等級資料不服從雙變量正態分布、總體分布類型未知、有不擬定值、雙向有序且、屬性不同的列聯表相關的限度與方向等級相關分析Spearman等級相關系數、Kendall等級相關系數11計數資料列聯表關聯限度關聯性分析Pearson列聯系數11二分類計數資料配對四格表關聯限度關聯性分析點相關系數11為計量資料,為二分類變量服從正態分布關聯限度關聯性分析點雙序列相關系數21計量資料多元正態分布多個變量同時與某一變量相關的限度多元線性相關分析復相關系數21計量資料多元正態分布其他變量固定期,某兩個變量間相關限度與方向多元線性相關分析偏相關系數22計量資料—兩組變量之間的相關限度典型相關分析典型相關系數第三節參數估計方法應用策略一、概念描述某總體特性的指標稱為參數(parameter),但在抽樣研究中,參數往往是未知的,抽樣研究的目的正是通過樣本推斷參數。參數估計(estimationofpopulationparameters)是記錄推斷重要內容之一,分為點估計(pointestimation)與區間估計(intervalestimation)兩種形式。點估計就是用相應樣本記錄量直接作為其總體參數的估計值,區間估計是按預先給定的概率()所擬定的包含未知總體參數的一個范圍。二、常用參數估計方法應用策略數據分析中常用記錄量均是其總體參數的點估計量,如樣本均數是總體均數的點估計量,樣本率是總體率的點估計量。良好的參數點估計量必須滿足:①無偏性:記錄量的數學盼望等于被估計參數;②一致性:即當樣本含量無窮大時,記錄量等于參數;③有效性:方差最小估計量為有效的估計量。對于參數的區間估計,可綜合考慮分析目的、準確度與精度、資料分布特性、樣本含量及其他有關條件等來選擇具體的估計方法。重要參數的區間估計方法(雙側)如下。(一)正態總體均數的可信區間1.總體標準差已知或樣本含量足夠大時,總體均數的可信區間為(9-13)或(9-14)其中,是標準正態分布水準雙側分位數。一般求其95%可信區間,=1.96.2.總體標準差未知時,總體均數的可信區間為(9-15)其中是自由度的分布水準雙側分位數。一般求其95%可信區間,查t界值表得。(二)總體幾何均數的可信區間(9-18)其中,。(三)總體率的可信區間1.若較小(),采用查表法,獲得的(95%或99%)可信區間;2.若充足大且,采用正態近似法獲得的可信區間,的可信區間為(9-26)(四)Poisson分布資料總體均數的可信區間1.若樣本計數,采用查表法,獲得的(95%或99%)可信區間。2.若樣本計數,采用正態近似法獲得的可信區間,的可信區間為(9-29)(五)總體回歸系數的1-可信區間(9-30)其中,為回歸系數的標準誤,(六)總體均數的可信區間運用直線回歸方程,在處的總體均數的可信區間為(9-31)其中,為剩余標準差,。(七)總體相關系數的可信區間第一步,對樣本相關系數作反雙曲正切函數變換:(9-32)或(9-33)第二步,求的可信區間(,):(9-34)第三步,對(,)作反變換,求的可信區間:(9-35)第四節假設檢查方法應用策略一、概念假設檢查(hypothesistest)是對總體的參數或分布作出某種假設,然后采用適當的方法,根據樣本提供的信息,根據小概率原理,推斷此假設是否成立,而作出應當拒絕或不拒絕該假設的一種記錄推斷方法,分為參數法與非參數法兩種,是數據分析的重要手段。根據分析目的,有對反映變量所服從的分布進行推斷的假設檢查;亦有對解釋變量不同組別間某個(或多個)反映變量進行比較的假設檢查,如對均數、方差或均數向量、率、構成比等的假設檢查;尚有對解釋變量與反映變量間關系進行推斷的假設檢查,如對回歸模型、回歸系數、相關系數的假設檢查等。二、常用假設檢查方法應用策略假設檢查分為參數法與非參數法,在一般情況下,若資料滿足參數法應用條件,一方面考慮參數法,不滿足時才考慮非參數法。具體假設檢查方法的擬定離不開對以下幾個問題的思考。分析目的:明確假設檢查的目的,是推斷某樣本來自何種分布?是對兩組或多組反映變量進行比較?還是對解釋變量與反映變量間關系作出推斷?設計方案:辨析設計方案,把握眾多設計方案的區別與聯系。資料類型:判斷資料類型,面對的資料是計量的,還是計數或是等級的。解釋變量(分組變量)與反映變量的個數:確認解釋變量(分組變量)與反映變量的個數,是單個解釋變量對單個反映變量,還是“多”對“單”,“多”對“多”……。同時,須注意解釋變量的水平數。樣本含量:考慮樣本含量的大小,是小樣本還是大樣本。應用條件:不能忽略具體的應用條件,根據應用條件,選擇對的的假設檢查方法是獲得對的、可靠結論的基本保證。常用假設檢查方法應用策略如下。(一)單個反映變量的完全隨機設計研究1.計量資料(1)單樣本分析目的:推斷某個總體均數與已知總體均數(一般為標準值、理論值或通過大量觀測所得穩定值等)是否不等。應用條件及方法選擇:樣本含量足夠大()時,可采用單樣本檢查或單樣本檢查。樣本含量不太大,資料滿足正態性規定或通過數據變換滿足規定期,可采用單樣本檢查;樣本含量不太大且資料不滿足正態性規定期,可采用非參數檢查,如單樣本wilcoxon符號秩檢查,其目的是推斷某個總體分布位置如中位數與已知總體分布位置是否不同。(2)兩樣本分析目的:推斷兩個總體均數是否不等。應用條件及方法選擇:兩組的樣本含量均較大(和)時,可采用兩大樣本比較的檢查或兩樣本檢查;樣本含量不太大,資料滿足正態性與方差齊性規定或通過數據變換滿足規定期,可采用兩樣本檢查或完全隨機設計資料的方差分析。樣本含量不太大滿足正態性不滿足方差齊性,可采用近似(’)檢查。若不滿足正態性或/和方差齊性,采用非參數檢查,如兩樣本wilcoxon秩和檢查、Kruskal-Wallis秩和檢查,其目的是推斷兩個總體分布位置是否不同。(3)多樣本分析目的:推斷多個總體均數是否不等。應用條件及方法選擇:資料滿足正態性與方差齊性規定或通過數據變換滿足規定期,可采用完全隨機設計資料的方差分析即檢查。資料不滿足正態性但不滿足方差齊性,可采用近似(’)檢查。若滿足正態性或/和方差齊性,采用非參數檢查,如Kruskal-Wallis秩和檢查,其目的是推斷多個總體分布位置是否不同。2.計數資料(1)單樣本分析目的:推斷某個總體率與已知總體率(一般為標準值、理論值或通過大量觀測所得穩定值等)是否不等。應用條件及方法選擇:樣本含量較大且與均不太小,如且時,可采用單樣本檢查、單樣本檢查或二項分布直接計算概率法檢查;樣本含量較小時,可采用二項分布直接計算概率法檢查;樣本含量較大,如,或很小,如或時,可采用Poisson分布直接計算概率法檢查。(2)兩樣本或多樣本分析目的:推斷兩個或多個總體率(或構成比)是否不等。應用條件及方法選擇:對于兩樣本率比較的四格表資料,樣本總例數且時,可采用兩樣本率比較的檢查、檢查或Fisher確切概率檢查;樣本總例數且時,可采用兩樣本率比較的校正檢查、校正檢查或Fisher確切概率檢查;樣本總例數、或四格表其他假設檢查方法所得概率十分接近檢查水準時,可采用Fisher確切概率檢查。對于多樣本率或兩組(或多組)樣本構成比比較的表資料,的格子數不超過1/5時,可采用檢查或Fisher確切概率檢查;1/5以上格子的,或有一個格子的時,可采用Fisher確切概率檢查。3.等級資料對于等級資料,重要采用秩轉換的非參數檢查。分析目的:推斷兩個(或多個)總體分布(或分布位置)是否不同。應用條件及方法選擇:兩樣本比較時,可采用wilcoxon秩和檢查或Kruskal-Wallis秩和檢查;多樣本比較時,可采用Kruskal-Wallis秩和檢查。(二)單個反映變量的配對(配伍)設計研究1.計量資料(1)兩樣本(配對設計)分析目的:推斷兩個總體均數是否不等(或差值的總體均數與0是否不等)。應用條件及方法選擇:對子數較大()時,可采用配對差值的單樣本檢查;配對差值滿足正態性規定或通過數據變換滿足規定期,可采用配對檢查或配伍組設計(隨機區組設計)資料的方差分析;對子數不太大且差值不滿足正態性規定期,可采用非參數檢查,如配對wilcoxon符號秩檢查、配伍組設計(隨機區組設計)資料的Friedman秩和檢查,其目的是推斷兩個總體分布位置是否不同。(2)多樣本(配伍組設計,隨機區組設計)分析目的:推斷多個總體均數是否不等。應用條件及方法選擇:資料滿足正態性與方差齊性規定或通過數據變換滿足規定期,可采用配伍組設計(隨機區組設計)資料的方差分析;資料不滿足正態性與方差齊性規定期,可采用非參數檢查,如Friedman秩和檢查,其目的是推斷多個總體分布位置是否不同。2.計數資料分析目的:推斷兩個總體率是否不等。應用條件及方法選擇:配對四格表資料中,不相同結果頻數為與,如,可采用配對四格表資料檢查或Fisher確切概率檢查;如,可采用校正的配對四格表資料檢查或Fisher確切概率檢查。3.等級資料對于等級資料,重要采用秩轉換的非參數檢查。分析目的:推斷兩個或多個總體分布位置是否不同。應用條件及方法選擇:配對設計,兩樣本比較時,可采用wilcoxon符號秩和檢查;配伍組設計(隨機區組設計),多樣本比較時,可采用Friedman秩和檢查。(三)單個反映變量的其他設計研究其他常見設計方案有交叉設計、拉丁方設計、正交實驗設計、嵌套設計、析因實驗設計、反復測量設計等,若獲取資料為計量資料,當滿足相應條件時,可分別采用該設計方案相應的單變量方差分析。(四)雙變量關聯性對于具有一個解釋變量,一個反映變量的雙變量資料,可從相關與回歸兩方面進行分析,因此有相關系數的假設檢查、整個回歸模型的假設檢查以及回歸系數的假設檢查。1.相關分析分析目的:推斷兩變量的線性相關關系是否存在(總體相關系數是否不為0)。應用條件及方法選擇:雙變量計量資料,滿足線性、獨立、二元正態與等方差條件時,對Pearson相關系數進行檢查,可采用P

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論