數據的變異程度課件_第1頁
數據的變異程度課件_第2頁
數據的變異程度課件_第3頁
數據的變異程度課件_第4頁
數據的變異程度課件_第5頁
已閱讀5頁,還剩37頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據的變異程度什么是中位數?中位數適用于什么樣的數據分布?中位數的應用(1)對任何資料(對稱分布、偏態分布、分布未知或分布末端有極端值、不確定值)都適用。日常應用中,對稱分布資料更常用均數。百分位數計算公式是什么?2025/2/25百分位數百分位數:如果將一組變量值的分布范圍平均為100等分,那么位于第x百分位次的變量值就稱為第x百分位數,用Px表示。Px的計算式為:L—Px所在組段下限值i—Px所在組段組距fx—Px所在組段的頻數

L—Px所在組段之前各組的累計頻數178例傷寒患者潛伏期百分位數計算尿氟值頻數累計頻數累計頻率%2~4~6~8~10~12~14~16~合計2023364840524178204379127167172174178——11.224.244.471.393.896.697.8100.0——注意:計算的Px關鍵也在于正確確定Px所在的組段。本例求P95P95=12+2/5(178×95%-167)=12.84

(天)P50=M

廣州市118名慢性鼻竇炎患者生命質量評估總分的頻數分布表(求中位數)組段(1)頻數(2)頻率(%)(3)累計頻數(4)累計頻率(%)(5)10~21.6921.6920~43.3965.0830~119.331714.4140~2521.194235.5950~2924.587160.1760~2521.199681.3670~1411.8611093.2280~65.0811698.3190~10021.69118100.00合計118100.00——數據的變異程度1.變異(variation)

一組數據中個體值之間的差異。描述變異程度的常見指標有:(1)極差(2)四分位數間距(inter-quartilerange,IQR)(3)方差(variance)(4)標準差(standarddeviation,SD)(5)變異系數(coefficientofvariation,CV)(一)極差1.極差(range,R)也稱全距,為所有觀測值中最大值與最小值之差。極差越大說明數據變異程度越大。可用來反映傳染病、食物中毒的最短和最長潛伏期等。2.極差的不足之處(1)僅用到最大值和最小值的信息,不能反映組內其他數據的變異情況。(2)極差與樣本例數有關。一般地,樣本量越大,得到較大或較小變量值的可能性越大,極差就可能越大,故樣本量相差較大時,不宜采用極差進行比較。

采用SF-36自測健康量表測得118名慢性鼻竇炎患者的生命質量評估總分如下:(一)頻數分布表723080577272723065251052758252606572356245353066816555656780626245524745575267525740665562454552725757574555507755724550357260475752604045456760404535507225604062405555926561353515658792408565577272724030524553505257454530256540254565451.頻數表的編制方法(1)找出最小值和最大值,本例為10與92。(2)計算全距(range,R):最大值與最小值之差,本例

R=92?10=82。(3)確定組距:相鄰兩組之間的距離,組距=全距/組段數,通常組段數取8~12組。本例共設9個組段,組距取10。(4)確定組段的上、下限:每個組段的起點為下限(lowerlimit),終點為上限(upperlimit)。每個組段均包含組段的下限值,最后一組的組段寫出上限值。(5)列表整理:計算頻數、頻率、累計頻數及累計頻率。(一)頻數分布表(二)四分位數間距四分位數間距(inter-quartilerange,IQR)IQR可看做中間一半觀測值的極差R,適于偏態分布或分布未知資料,由于不受兩端極大或極小數據的影響,四分位數間距比極差更為穩定,但仍未考慮每個觀測值的變異。常與中位數一起使用,綜合反映數據的平均水平和變異程度,寫成M(P25,P75)。適于P0P25P50P75P100Min

下四分位數(QL)中位數上四分位數(QU)MaxIQR=P75?P25

表2-4某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂頻數累積頻數累積頻率(%)0.10~

27

27

4.30.40~169196

31.10.70~167363

57.61.00~

94457

72.51.30~

81538

85.41.60~

42580

92.11.90~

28608

96.52.20~

14622

98.72.50~

4626

99.42.80~

3629

99.83.10~

1630100.0

合計630

-

-2025/2/2520

說明有50%女性的甘油三酯在63.2和135.7之間,其四分位數間距為72.5(mg/dl)。

四分位數間距可以看作是在中間的一半變量值的極差(R)嗎?表4-1的四分位數間距:

廣州市118名慢性鼻竇炎患者生命質量評估總分的頻數分布表組段(1)頻數(2)頻率(%)(3)累計頻數(4)累計頻率(%)(5)10~21.6921.6920~43.3965.0830~119.331714.4140~2521.194235.5950~2924.587160.1760~2521.199681.3670~1411.8611093.2280~65.0811698.3190~10021.69118100.00合計118100.00——下表是成都市238名正常居民發汞含量測量結果,求發汞含量的四分位數間距。組段(1)頻數(2)頻率(%)(3)累計頻數(4)累計頻率(%)(5)0.3~197.98197.980.7~6226.058134.031.1~6326.4714460.501.5~5121.4319581.931.9~229.2421791.182.3~135.4623096.642.7~41.6923498.323.1~10.4223598.743.5~20.8423799.583.9~4.310.42238100.00合計238100.00238—238名居民發汞含量(μg/g)的頻數分布表數據的變異程度什么叫變異?

描述變異程度的常見指標有哪些?1.變異(variation)

一組數據中個體值之間的差異。描述變異程度的常見指標有:(1)極差(2)四分位數間距(inter-quartilerange,IQR)(3)方差(variance)(4)標準差(standarddeviation,SD)(5)變異系數(coefficientofvariation,CV)四分位數間距怎么計算?下表是成都市238名正常居民發汞含量測量結果,求發汞含量的四分位數間距。組段(1)頻數(2)頻率(%)(3)累計頻數(4)累計頻率(%)(5)0.3~197.98197.980.7~6226.058134.031.1~6326.4714460.501.5~5121.4319581.931.9~229.2421791.182.3~135.4623096.642.7~41.6923498.323.1~10.4223598.743.5~20.8423799.583.9~4.310.42238100.00合計238100.00238—238名居民發汞含量(μg/g)的頻數分布表知識點1算數平均數問題1一家公司打算招聘一名英文翻譯,對甲、乙兩名應試者進行了聽、說、讀、寫的英語水平測試,他們的各項成績如下表:應試者聽說讀寫甲85788573乙73808283(1)兩名應試者的四門成績誰的更均勻?2025/2/25甲的平均成績為乙的平均成績為知識點1算數平均數(三)方差與標準差

如果要比較我們班同學的身高變異程度大還是體重變異程度大應該如何比較?【例】某年級一、二兩班某門課的平均成績分別為82分和76分,其成績的標準差分別為15.6分和14.8分,比較兩班平均成績代表性的大小。【例】某年級一、二兩班某門課的平均成績分別為82分和76分,其成績的標準差分別為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論