統計分析社會調查統計_第1頁
統計分析社會調查統計_第2頁
統計分析社會調查統計_第3頁
統計分析社會調查統計_第4頁
統計分析社會調查統計_第5頁
已閱讀5頁,還剩14頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統計分析社會調查統計第1頁,課件共19頁,創作于2023年2月1.集中趨勢分析集中趨勢分析指的使用一個典型值來反映一組數據的一般水平,別的數值圍繞在它的周圍.最常見的集中量數有平均數(也稱為均值),眾數和中位數三種.第2頁,課件共19頁,創作于2023年2月(1)平均數(mean)

平均數數是指總體各單位數值之和除以總體單位數目所得之商統計分析中習慣以X來表示.其計算公式如下

∑Xn第3頁,課件共19頁,創作于2023年2月例:某班10名學生的年齡分別為20、21、19、19、19、20、20、21、22、18、20歲,求他們的平均年齡。第4頁,課件共19頁,創作于2023年2月(2)眾數(m0)總體中出現次數最多的標志值是眾數。例:7名工人日產量(件)為4、5、6、6、6、7、8。眾數是6。第5頁,課件共19頁,創作于2023年2月(3)中位數(Md)

把一組數據按值的大小順序排列起來,處于中央位置的那個數值就叫中位數.它的含義是整個數據中有一半數值在她之上,另一半數值在它之下.

公式為:Md=(n+1)÷2第6頁,課件共19頁,創作于2023年2月

1、標志值的個數是奇數

例:7名工人生產某種產品,日產量(件)分別為4、6、6、8、9、12、14。位于中間位置的第四名工人的日產量8件為中位數。2、標志值的個數是偶數.上例增加為8名工人,日產量為4、6、6、8、9、12、13、14。中位數位置在第四和第五名中間,取這兩者的平均數為中位數。第7頁,課件共19頁,創作于2023年2月3、離散趨勢分析離散趨勢分析指用一個特別的數值來反映一組數據相互之間的差異程度。最常見的離散量數有全距(極差)、異眾比率、四分位差、標準差、離散系數.第8頁,課件共19頁,創作于2023年2月(1)全距(極差)(Range)

全距指一組數據的最大值與最小值之差.全距(極差)越大,在一定程度上說明這組數據的離散程度越大,集中量數的代表性越低。計算公式:第9頁,課件共19頁,創作于2023年2月

例:

5名學生的成績為50、69、76、88、97

則R=97-50=47

第10頁,課件共19頁,創作于2023年2月(2)異眾比率VariationRatio異眾比率指一組數據中非眾數的次數相對于總體全部單位的比率。異眾比率越小,說明眾數的代表性越好,反之,異眾比率越大,則說明眾數的代表性越差。公式如下:

其中n是全部個案總數,是眾數出現的頻數,二者之差就是非眾數的頻數。這個公式所要求出的,是在全部的個案中有多少是偏離眾數。不屬于眾數的個案所占的比率愈大,就表示眾數的代表性愈小,以之作估計或預測時所犯的錯誤也就愈大。

第11頁,課件共19頁,創作于2023年2月例:假設甲校有學生550名,其中父親職業最多的是農民,有288人;乙校有學生480名,其中父親職業最多的也是農民,有295人。則:甲校VR=550-288/550=0.476

乙校VR=480-295/480=0.385甲、乙兩校學生的父親職業,眾數都是農民,但離異程度不同。甲校有47.6%的個案不是農民,而乙校只有38.5%不是農民。因此,根據異眾比率,甲校的離異幅度大于乙校。也就是說,在兩校作估計或預測時,雖然應用同一個眾數,但在甲校所犯的錯誤會大于乙校。第12頁,課件共19頁,創作于2023年2月(3)四分位差InterquartileRange先將一組數據按大小排列順序,然后將其4等分,去掉序列中最高的1/4和最低的1/4,僅就中間的一半數值來測定序列的全距。Q1的位置(第一個四分位點)=(n+1)/4Q3的位置(第三個四分位點)=3(n+1)/4Q=Q3—Q1第13頁,課件共19頁,創作于2023年2月例:調查11位同學的年齡如下:17歲、18歲、18歲、19歲、19歲、20歲、20歲、21歲、21歲、22歲、。首先,求出Q1和Q3的位置:

Q1

的位置===3Q3的位置===9其次,從數序中找出Q1=18,Q3=21則四分位差Q=Q3—Q1=21—18=3第14頁,課件共19頁,創作于2023年2月(4)標準差StandardDeviation標準差是各數值與其均值之差的平方和除以總體數的平方根。它是一組數據平均值分散程度的一種度量。一個較大的標準差,代表大部分數值和其平均值之間差異較大;一個較小的標準差,代表這些數值較接近平均值。第15頁,課件共19頁,創作于2023年2月例1:在調查甲地的十個鄉的衛生情況時,發現每個鄉的衛生戶比率如下:818141481512171219則標準差是3.6。換言之,平均每鄉有13.7%是衛生戶,而反映各鄉差異的標準差數值是3.6。在這里要解釋的是,標準差數值在相互比較中更能突出其意義。例如,在調查乙鄉的衛生戶比率時,假定均值是18.5,標準差是1.7,對比之下,乙地各鄉的差異程度小于甲地。第16頁,課件共19頁,創作于2023年2月例2:某校三個系各選5名同學,參加智力競賽,他們的成績如下:中文系:7879808182數學系:6572808895英語系:35788998100無論從團體總分來看,還是從平均分來看,這三個系代表隊的成績都是相同的。那么,均值到底對哪一個代表隊的代表性高呢?用前面的公式可得:中文系=1.414數學系=10.8英語系=23.8由此證明,平均成績對中文系代表隊的代表性最大,對英語系的代表性最小。第17頁,課件共19頁,創作于2023年2月(5)離散系數CoefficientofVariation離散系數:標準差與平均數的比值,用百分比表示.離散系數越大,說明總體內部數值之間的差異越大;反之則越小。公式:第18頁,課件共19頁,創作于2023年2月例:一項調查得到下列結果,某市人均月平均收入為92元,標準差為1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論