社會學研究方法課件-分析和綜合之定量(統計)分析_第1頁
社會學研究方法課件-分析和綜合之定量(統計)分析_第2頁
社會學研究方法課件-分析和綜合之定量(統計)分析_第3頁
社會學研究方法課件-分析和綜合之定量(統計)分析_第4頁
社會學研究方法課件-分析和綜合之定量(統計)分析_第5頁
已閱讀5頁,還剩56頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

社會學-研究方法分析和綜合之定量(統計)分析所謂定量(統計)分析,就是對社會研究收集來的數據資料進行計算、統計檢驗、分析解釋,并以此為依據,做出科學推斷,揭示社會現象中所蘊涵的規律的一種方法。統計分析包括描述統計和推斷統計兩種類型。統計分析方法的內容還可以根據變量的多少劃分為單變量分析、雙變量分析和多變量分析,前兩者可稱為初等統計,后者可稱為高等統計。1.描述統計描述統計主要是對所收集的資料進行整理、分類和簡化,描述數據的全貌以表明研究對象的某些特性。描述統計包括數據的初步整理,數據集中趨勢和離散趨勢以及相關系數的度量等方面。描述統計的目的在于使雜亂無章的數據更清晰直觀地顯示研究對象的特征,以利于進一步分析。1.描述統計(1)描述統計的基本技術(2)集中趨勢測量(3)離散趨勢測量(1)描述統計的基本技術頻數(Frequency):也稱為次數,它是指分布在各類別中的數據個數。頻數分布(FrequencyDistribution):是指一組數據中取不同值的個案的次數分布情況,它一般是以頻數分布表的形式表達。頻數分布表的作用:簡化資料。將調查得到的雜亂的原始數據,以十分簡潔的統計表反映出來.清楚地了解調查數據的眾多信息。(1)描述統計的基本技術頻率分布(PercentagesDistribution):是一組數據中不同取值的頻數相對于總數的比率分布情況。這種比率在社會調查中經常是以百分比的形式來表達。頻率分布表:是不同類別在總體中的相對數量分布。它十分便于不同總體和不同類別之間的比較。(1)描述統計的基本技術統計表:表示被說明的事物及其統計指標和數值的表格。統計表的種類按總體分組的情況分:簡單表(P272表11-10)分組表單項分組表(P269表11-6)組距分組表(P269表11-7)復合表(又稱交互分類表)P271表11-9(1)描述統計的基本技術統計表的結構從外表形式上看,統計表由表號、總標題(上端中部)、橫行標題(左端)、縱欄標題(表上方)、指標數值、注釋和資料來源等要素組成。從內容上看,統計表由主詞和賓詞兩部分構成。P271表11-8(1)描述統計的基本技術統計圖統計圖是利用統計資料繪制成的幾何圖形或具體形象,它可以從數量方面顯示出研究對象的規模、水平、結構、發展趨勢和比例關系,是表現統計資料的一種重要形式。條形圖餅形圖折線圖直方圖線性圖(1)描述統計的基本技術統計圖──條形圖條形圖是用寬度相同的直條的高低或長短來表示各項統計指標數值大小的圖形。根據條形圖表現統計資料內容的不同,條形圖又分為單式條形圖、復式條形圖和結構條形圖。單式條形圖單式條形圖:是以若干距離相等的單一條形的高低、長短來表明指標數值大小的一種圖形。復式條形圖復式條形圖:是以兩個以上的條形為一組,來進行比較的一種圖形,它既可以進行組與組之間的比較,又可以進行組內的比較。它常常用來表現分組資料。結構條形圖結構條形圖:是以一個獨立的條形或幾個條形的全部長度代表被說明現象的總體,并把條形分割為幾個小段,用來表示構成這一總體的各個組成部分。它既可以比較現象的各部分在總體中所占比重的大小,又可以說明現象在不同時期的構成資料。這些資料可以是絕對數,也可以是百分數。(1)描述統計的基本技術統計圖──餅形圖餅形圖通常是以圓形面積或以圓內各扇形面積的大小來表示統計指標數值大小的圖形。(1)描述統計的基本技術統計圖──直方圖直方圖是由緊挨著的長條構成的,與條形圖不同的是,它的條的寬度是有意義的,實際上它不是用長條的高度而是用長條的面積表示頻率的大小,長條的縱軸高度表示頻率密度(頻率密度=頻率/組距),長條的寬度表示組距。某班統計學考試成績分布圖2101518505101520

成績(分)60708090100人數(1)描述統計的基本技術統計圖──折線圖折線圖是用直線連接直方圖中條形頂端的中點而成的。當組距逐漸減小時,折線將逐漸變為平滑,趨向為曲線。

某班統計學考試成績折線圖210151850510152095

成績(分)人數060708090100(1)描述統計的基本技術統計圖──線性圖線性圖:表示兩個變量之間的函數關系的曲線圖,可以表明事物的發展規律、總體單位的分配情況、揭示事物間的依存關系或表明計劃執行的進度。1.描述統計(1)描述統計的基本技術(2)集中趨勢測量(3)離散趨勢測量(2)集中趨勢測量集中趨勢分析:是從一組數據中抽象出一個代表值,以代表現象的共性和一般水平。除可以說明某一社會現象在一定條件下數量的一般水平外;集中趨勢還可以對不同空間的同類現象或同一現象在不同時間的狀態進行比較;以及分析某些社會現象之間的依存關系。最常見的集中量數有算術平均數(簡稱平均數,也稱為均值)、眾數和中位數三種。(2)集中趨勢測量眾數眾數是一組數據中出現次數最多(即頻數最高)的那個數值,用Mo

表示。適用條件:只有集中趨勢明顯時,才能用眾數作為總體的代表值。例:有16例高血壓病人的發病年齡(歲)為:42,45,48,51,52,54,55,55,,61,61,62,62,試求眾數。58,58,58,58(2)集中趨勢測量眾數需要注意的幾個問題:定性數據可以存在眾數。眾數是一組數據中出現次數最多的數據,是一組數據中的原數據,而不是相應的次數。例對于某些數據而言,例如均勻分布,并不存在眾數。如,原始數據:10591268對于某些數據存在兩個或多于兩個的眾數。如,原始數據:252828

364242

某城市居民關注廣告類型的頻數分布

廣告類型人數(人)比例頻率(%)

商品廣告服務廣告金融廣告房地產廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100

這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調查的200人當中,關注商品廣告的人數最多,為112人,占總被調查人數的56%,因此眾數為“商品廣告”這一類別,即

Mo=商品廣告(2)集中趨勢測量眾數眾數的計算方法(1)單項數列確定眾數,即出現次數最多(頻率最大)的標志值就是眾數。(2)組距數列確定眾數:在等距數列條件下,先確定眾數組,然后再通過公式進行具體計算,找出眾數點的標志值。(2)集中趨勢測量眾數計算公式:

是眾數所在組的下限;是眾數所在組前一組的次數;是眾數所在組后一組的次數;是眾數所在組的次數;

是眾數組的組距。27按成績分組(分)學生人數(人)60以下60—6970—7980—8990以上21519153合計54例對某公司員工獎金情況進行調查,得到資料如下表所示:獎金數額員工人數600以下84600-800161800-10002441000-12001571200-1400361400以上18合計700也可以作圖求解眾數暨南大學統計學系M0=897.65方法:即先畫相鄰三組次數分布直方圖,然后連接相鄰兩組次數差的對角線,再以對角線的交點向x軸引一條垂線,它與X軸的交點即為眾數.眾數示意圖(2)集中趨勢測量中位數中位數:將總體單位的某一數量標志的各個數值按照大小順序排列,居于中間位置的那個數值就是中位數。它的含義是全部數據中有一半數值在它之上,另一半數值在它之下。Md50%50%(2)集中趨勢測量中位數計算方法①由未分組資料確定中位數排序:確定中位數位置奇數:中間位置的標志值為中位數。偶數:中間位置相鄰兩個變量值的簡單平均數是中位數。原始數據:

2422212620排序: 2021222426位置: 123 45位置===n+125+123中位數22原始數據:

105 91268排序: 56891012位置: 123 456位置n+126+123.5中位數8+928.5(2)集中趨勢測量中位數②由定序分組資料求中位數中位數的位置為:

(300+1)/2=150.5從累計頻數看,中位數的在“一般”這一組別中。因此

Md=一般某城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)累計頻數

非常不滿意

不滿意一般滿意非常滿意2410893453024132225270300合計300—(2)集中趨勢測量中位數③由單值分組資料求中位數先計算中間位置:(n+1)÷2=(150+1)÷2=75.5再找出其對應值④由組距分組資料求中位數第一步:確定中位數所處位置,按確定(f為次數)。第二步:采用公式計算上限法:用“以上累計”法確定中位數。下限法:用“以下累計”法確定中位數。其中:U是中位數所在組的上限,L是中位數所在組的下限,fm是中位數所在組的次數,Sm+1是中位數所在組后面各組累計數,Sm-1是中位數所在組前面各組累計數,i是中位數所在組的組距。例現檢測某廠生產的一批電子產品的耐用時間,得到資料如下表所示:耐用時間產品個數累計次數以下累計以上累計600以下8484700600-800161245(Sm-1)616800-1000244(fm)4894551000-1200157646211(Sm+1)1200-140036682541400以上1870018合計700--(2)集中趨勢測量算術平均數(TheArithmeticMean)簡稱均數(Mean)或均值,定義為所有測量值之和除以變量值個數(即,樣本含量SampleSize)。反映一組呈對稱分布的變量值在數量上的平均水平。(2)集中趨勢測量算術平均數(TheArithmeticMean)①直接計算法計算公式:例:試計算1,3,7,9的均數?(2)集中趨勢測量算術平均數(TheArithmeticMean)②加權算術平均法當數據已分組,形成了變量數列:成績

x人數f708085122合計5平均成績=(70+80+85)/3

?平均成績=所有人的成績總和/總人數

=(70+80*2+85*2)/5=80(2)集中趨勢測量算術平均數(TheArithmeticMean)②加權算術平均法計算公式例:由單值分組求算術平均值工人日產量(件)工人人數(人)工人人數比重(%)1011121314701503801501008.7512.5047.501872512.50合計800100.00平均指標的種類平均指標靜態平均數動態平均數位置平均數數值平均數幾何平均數調和平均數算術平均數中位數眾數集中趨勢(Centraltendency)——平均指標一組數據向其中心值靠攏的傾向和程度;測度集中趨勢就是尋找數據一般水平的代表值或中心值;不同類型的數據用不同的集中趨勢測度值;選用哪一個測度值來反映數據的集中趨勢,要根據所掌握的數據的類型來確定。眾數、中位數、平均數的特點和應用眾數不受極端值影響具有不惟一性數據分布偏斜程度較大時應用中位數不受極端值影響數據分布偏斜程度較大時應用平均數易受極端值影響數學性質優良數據對稱分布或接近對稱分布時應用左偏分布均值

中位數

眾數對稱分布

均值=中位數=

眾數右偏分布眾數

中位數均值眾數、中位數和平均數的關系圖示中位數、眾數和平均數之間的數量關系決定于總體內次數分配的狀況。1.描述統計(1)描述統計的基本技術(2)集中趨勢測量(3)離散趨勢測量(3)離散趨勢測量所謂離散趨勢(又稱離中趨勢),是指數列中各變量值之間的差距和離散程度。離勢小,平均數的代表性高;離勢大,平均數代表性低。離中趨勢(差異程度)——變異指標變異指標用以反映總體各單位標志值的變動范圍或參差程度,與平均指標相對應,從另一個側面反映了總體的特征。(3)離散趨勢測量全距(極差Range)R=最大值—最小值(R=Xmax–Xmin)優、缺點計算簡便,意義清楚,但反映現象的差異程度較粗略,實用價值甚小。(3)離散趨勢測量異眾比率所謂異眾比率,是指非眾數的頻數與總體單位數的比值,用VR來表示

其中:fmo為眾數的頻數;n是總體單位數異眾比率能表明眾數所不能代表的那一部分變量值在總體中的比重。例:根據下表中的數據,計算異眾比率。某城市居民關注

廣告類型的頻數分布解:根據公式,得廣告類型人數(人)頻率(%)

商品廣告11256.0

服務廣告5125.5

金融廣告94.5

房地產廣告168.0

招生招聘廣告105.0

其他廣告21.0

合計200100.0

這說明在所調查的200人當中,關注非商品廣告的人數占44%,即關注商品廣告的人數占56%。由于異眾比率值較大,從而用“商品廣告”來反映城市居民對廣告關注的一般趨勢,代表性還不是很好。(3)離散趨勢測量異眾比率例:某項調查發現,現今三口之家的家庭最多(32%),求異眾比率。某開發商根據這一報導,將房屋的戶型大部分都設計為適合三口之家居住的樣式和面積,你認為如何呢?(3)離散趨勢測量四分位差(Quartiledeviation)四分位數(Quartile)(三個四分位數)一組數據按從小到大排列時,處于1/4位置上的變量值稱為第一個四分位數(下四分位數),處于3/4位置上的變量值稱為第三個四分位數(上四分位數),而中位數就是第二個四分位數。四分位數通常用符號Q表示。在未分組時下四分位數(Q1)的位置=上四分位數(Q3)的位置=顯然,中間的四分位數(Q2)就等于Md。(3)離散趨勢測量四分位差(Quartiledeviation)四分位數的確定例:根據下表中的數據,計算甲城市家庭對住房滿意狀況評價的四分位數。甲城市家庭對住房狀況的評價解:已知N=300,得下四分位數的位置上四分位數的位置則根據累積頻數

Q1

=不滿意,Q3=滿意回答類別甲城市戶數(戶)累積戶數(戶)非常不滿意2424不滿意108132一般93225滿意45270非常滿意30300合計300—(3)離散趨勢測量四分位差四分位差是第三四分位數(上四分位數)和第一四分位數(下四分位數)的半距。其作用是避免全距受極端值影響大的缺點。計算公式在定距和定比變量中在定序變量中(3)離散趨勢測量標準差(Standarddeviation)各變量值對其算術平均數的離差平方的算術平均數的平方根,又稱均方差,用S表示。標準差是最常用的離散程度測度值。基本公式:

或(3)離散趨勢測量標準差未分組資料標準差的計算

例:求72、81、86、69、57這些數字的標準差。

72-1181864861316969-41657-162563650506(3)離散趨勢測量標準差分組資料標準差的計算計算公式式中fi為第i組的次數例:調查大一男生60人的身高情況如下表所示,求他們身高的標準差。

計算左邊數列的標準差組距f150~1541154~1582158~1627162~16610166~17016170~17412174~1787178~1825合計60組距fx

150~1541152-16.5272272.3154~1582156-12.5156312.5158~1627160-8.572.3505.8162~16610164-4.520.3202.5166~17016168-0.50.254170~174121723.512.3147174~17871767.556.3393.8178~182518011.5132661.3合計60---0---2499一、資料的整理和分析(一)資料整理1.定性資料整理2.定量資料整理(二)資料定性分析1.定性分析基本步驟2.定性分析方法(三)資料定量分析1.描述統計2.

推論統計2.推論統計推論統計就是利用樣本的統計值對總體的參數值進行估計的方法。推論統計的內容主要包括兩個方面:(1)區間估計(2)假設檢驗(1)區間估計(IntervalEstimation)以樣本統計量的抽樣分布為理論依據,按一定概率要求,由樣本統計量的值來估計總體參數的值所在的范圍,叫做總體參數的區間估計。區間估計的實質就是在一定的可信度(置信度)下,用樣本統計值的某個范圍(置信區間)來估價總體的參數值。范圍的大小反映的是這種估計的精確性問題,而可信度高低反映的則是這種估計的可靠性或把握性的問題。(1)區間估計區間估計的結果通常可以采取下述方式來表述:我們有95%的把握認為,全市職工的月收入在182元至218元之間。全市人口中,女性占50%至52%的可能性為99%。區間估計中的可靠性或把握性是指用某個區間去估計總體參數值時,成功的可能性有多大。它可以這樣來解釋:如果從這個總體中重復抽樣100次,約有95次所抽樣本的統計值都落在這個區間。說明這個區間估計的可靠性為95%。對于同一總體和同一抽樣規模來說①所給區間的大小與做出這種估計所具有的把握性形成正比;②區間大小所體現的是估計的精確性,區間越大,精確性程度越低,區間越小精確性越高,二者成反比;③從精確性出發,要求所估計的區間越小越好,從把握性出發,要求所估計的區間越大越好,因此人們總是需要在這二者之間進行平衡和選擇。在社會統計中,常用的置信度分別為90%,95%和99%。與他們所對應的允許誤差(α)分別為10%,5%和1%。在計算中,置信度常用1-α來表示。(2)假設檢驗利用樣本信息,根據一定的概率,對總體參數或分布的某一假設作出拒絕或保留的決斷,稱為假設檢驗。假設檢驗實際上就是先對總體的某一參數作出假設,然后用樣本的統計量去進行驗證,以決定假設是否為總體所接受。(2)假設檢驗假設檢驗的依據假設檢驗所依據的是概率論中的“小概率原理”,即“小概率事件在一次觀察中不可能出現的原理”,但是如果現實的情況恰恰是在一次觀察中小概率事件出現了,應該如何判斷呢?一種意見認為該事件的概率仍然很小,只不過偶然被遇上了。另一種則是懷疑和否定該事件的概率未必很小,即認為該事件本身就不是一種小概率事件,而是一種大概率事件。

后一種意見代表的正是假設檢驗的基本思想。舉例說明假設檢驗的基本思路某單位職工上月平均獎金為210元,這個月的情況與上月沒有大的變化,我們設想平均獎金還是210元。為了驗證這一假設是否可靠,我們抽取100人作調查,結果得出月平均獎金為220元,標準差為15元。顯然,樣本的結果與總體結果之間出現了誤差,這個誤差是由于我們假設錯誤引起的,還是由于抽樣誤差引起的呢?如果是抽樣誤差引起的,我們就應該承認原來的假設,而如果是假設錯誤引起的,我們就應該否定原假設。方法通過將原假設作為虛無假設,而將與之對立的假設作為研究假設,然后用樣本的數據計算統計量并與臨界值比較。當統計值的絕對值小于臨界值,即│Z│<Zα/2時則接受虛無假設,否定研究假設;當統計值的絕對值大于或等于臨界值:即│Z│≥

Zα/2時則拒絕虛無假設,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論