心理統計學-課程講義3_第1頁
心理統計學-課程講義3_第2頁
心理統計學-課程講義3_第3頁
心理統計學-課程講義3_第4頁
心理統計學-課程講義3_第5頁
免費預覽已結束,剩余12頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、【課程講義】第三章集中量數【教學目標】明確一批數據的特征包括兩個方面的內容:集中趨勢、離散性;明確集中量數是描述數據集中趨勢的量數,可以作為一批數據的代表值;明確算術平均數是所有集中量數中運用最 廣泛、最優的量數;明確各種集中量數的含義、計算方法、使用條件、性質及優缺點。【學習方法】了解、理解、計算與應用。【重點難點】算術平均數的概念及適用條件;算術平均數的計算方法; 中位數的概念及適用條件;中位數的計算方法。【講義內容】前一章所講的統計分組、統計表、統計圖等,只是對研究工作中所獲得的數據進行初步 整理,其目的是對數據的性質、 分布特征、差異情況及數據的一般規律有一直觀和形象的認 識。因此說這

2、一步還不是應用統計方法的步驟。為了進一步發現和表示一組數據的規律性, 需要計算出一些能夠反映這組數據的統計特征的數字一一稱為統計量或特征數。對于一組數據來講,最常用的統計量有兩類。 一類是表現數據集中性質或集中程度的,另一類是表現數據分散性質或分散程度的。 數據的集中情況指一組數據的中心位置。集中趨勢的度量,即確定一組數據的代表值。描述數據集中情況的統計量有多種,包括算術平均數、中數、幾何平 均數等。由于這些統計量的作用在于度量數據的集中趨勢,因此它們都稱為集中量數。 本章主要介紹幾種常用的集中量數。集中量數只描述數據的集中趨勢和典型情況,它還不能說明一組數據的全貌。數據除典型情況之外, 還有

3、變異性的特點。 對于數據變異性即離中趨勢進 行度量的一組統計量,稱作差異量數,這些差異量數有方差、標準差、全距、平均差、四分 差及各種百分差等等,下一章中將對常用的差異量數進行介紹。第一節算術平均數一、算術平均數的概念和適用條件(一)概念算術平均數一般簡稱為平均數或均數(Mean)。只有在與其他幾種集中量數如幾何平均數、加權平均數相區別的時候,才把它叫彳算術平均數。如果平均數是由X變量計算的,就記為X (讀作X杠),若由Y變量求得,則記為 Y。由于任何平均數都是由特定的變量計算而來,因此 X或Y自然人便成為算術平均數的符號了。本書采用X或Y表示平均數。算術平均數是一組同質數據值得總和除以數據總

4、個數所得到的商,其計算公式為: Xi X N公式中匯Xi表示所有數據的和,即匯 Xi=Xi+X2+Xi; N為數據的個數。 X為一組 數據的算術平均數。(二)適用條件1 .適用于同質數據。不同質的數據,不能計算算術平均數。2 .要求一組數據中每個數據都比較準確、可靠,若數據模糊不清,或分組資料又不確定組 限時,不能計算算術平均數。3 .無極端值出現。因為算術平均數容易受極端數據的影響。4 .需要得到一個相對精確可靠的集中量數或進一步參與其他運算時。二、算術平均數的計算方法(一)、簡單算術平均數的計算方法直接用公式 XiX 求算術平均數。N算術平均數的計算公式很易理解,就是將所有的數據相加,再被

5、數據的個數除。例1 某班選八名同學參加年級數學競賽,成績分別為82, 90, 95, 88, 90, 94, 80, 93。求其平均成績。解:將 X1=82, X2 =90 X3 =95 X 4=88 X 5=90 X 6=94 X7 =80 X8 =93,N=8代入公式(3.1),得8990 95 88 90 94 80 80 938(二)加權算術平均數的計算方法在實際的教育測量或教育評價中,經常會遇到這樣的情況,在計算算術平均數時,每個數據在其整體中的地位并不一樣,即各個數據代表的事物在其整體中所占權重(重要程度) 不同。像這種考慮到權重的不同而求出的算術平均數,即為加權算術平均數。加權算

6、術平均數是指一組數據中每個數據與其權重乘積的總和除以權重總和所得的商,用符號X w表示。公式為:qW1X1 W2X2WnXnWXX wW W2WnW1式中Wi為權數,所謂權數是指各變量在構成總體中的相對重要性,每個變量的權數大小, 由觀測者依據一定的理論或實踐經驗而定,雖然是可變的,但絕不是沒有根據的。在教育工作中,我們時常遇到對測量數據進行加權的情況。例如,在考試時教師共出10道考題。由于各題的大小不同,難易程度不同.在滿分為100的要件下.絕不是每題都以10分為滿分,而是有的題 5分,有的10分、20分,甚至30分。再如高校入學考試共包括語 文、政治、外語、數學、物理、化學及生物7科,而計

7、算總分時并不是各科平等,在語文、政治等科都以100為滿分的情況下,數學定 120分,生物定50分,也是考慮到各門學科的 相對重要性而進行加權的結果。加權的道理不難理解,但有時卻容易被人忽略。由各小組平均數計算總平均數是應用加權平均數的一個特例。在心理與教育研究中, 經常會遇到由各個平均數計算總平均數這類實際的統計計算問題。在這個問題中,可以把各小組的平均分數,視為該小組每個個體的分數,而把每個小組的人數,視為權數。下面通過幾個例子來說明家錢所屬平均數的應用。例2某年級四個班的學生人數分別為50人,52人,48人,51人,期末數學考試各班的平均成績分別為90分,85分,88分,92分,求年級的平

8、均成績。解:根據本題所給條件,應按公式(3.2)計算。將各數值代入上述公式,得X W90 50 8552884892 5188.74W50524851例3某小學三年級數學期末總評成績規定為平時占2 0 % ,期中考試占3 0 % ,期末考試占5 0 % .某學生數學平時成績為9 6分,期中考試成績為8 0分, 期末考試成績為9 2分.求該生期末數學總評成績為多少分?解:本題為求加權算術平均數的問題.題中的權數分別為0.2,0.3,0.5。將各數值代入公式(3.2),X W 96 0.2 80 0.3 92 0.5 89.2W0.2 0.3 0.5(三)次數分布表中算術平均數的計算對于已經列成次

9、數分布表的數據,其算術平均數的計算公式為:fXCCN式中,Xc為各組的組中值,f為各組的次數,N為總次數,即 N f o例4 某班50人外語期末考試成績的次數分布表如下,求全班學生的平均成績組別組中值XC次數ffXc90s 9492327685s 89871087080s 848215123075s 7977861670s 7472536065s 6967320160s 6462424855s 59572114503915解:將表中數據代入公式(3.3),得- fXC 276 870 1230114XC N50需要說明的是,利用次數分布表求出的算術平均數是一個近似值。391578.350原因在

10、于計算算術平均數時,我們假設各組內的數值是均勻分布的,利用各組的組中值來分別代表各組數據,這顯然與實際的情況不完全相符, 因此求出的算術平均數與真實的算術平均數之間有一定的差異,也就是分組誤差,但是這并不影響以后的統計分析。三、平均數的意義與應用算術平均數是應用最普遍的一種集中量數。它是“真值”漸近、最佳的估計值。在科研實驗中人們進行觀測,是想知道被觀測事物真正的值是多少,例如想研究人的反應時間,用計時器進行測量,人們是想測到真正的反應時間是多少。再如,使用某種測驗,是想測量某個人或某些人的真實的能力水平到底有多么高。但是由于主客觀各種隨機因素的影響,如儀器的精密程度,測量方法,實驗情景,人的

11、觀測力及觀測標準等等都不能做到盡善盡美,因 此想獲得真值是不大可能的,人們只能用一些集中量數作為它的估計值、算術平均數在大多數情況下,是真值的最好的估計值,對這一點概率統計有嚴密的數學證明。算術平均數具備一個良好的集中量數應具備的一些條件:反應靈敏。觀測數據中任何一個數值的或大或小的變化,甚至細微的變化,在計算平均數時,都能反應出來。確定嚴密。計算平均數有確定的公式,不管何人,在何種場合, 只要是同一組觀測數據,所計算的平均數都是相同的,不憑主觀確定。簡明易解。平均的概念簡單明白,容易理解。較少數學抽象。計算簡單。計算公式只是用簡單的四則運算。符合代數方法進一步演算。不但平均數的計算過程應用代

12、數方法,而且,還可應用平均數作進一步的數學演算。例如求離均差X,以及將要講到的求方差等等。較少受抽樣變動的影響。在進行觀測時,樣本大小或個體的變化, 對計算平均數影響很小。但是算術平均數也有一些缺點,在一定程度上限制了它的應用,這些缺點是:易受極端數據的影響。 由于平均數反應靈敏, 因此數據中若出現極端數據 (或大或小) ,就要影響平均數。 在心理與教育方面的實驗觀測中, 偶然因素十分復雜, 經常會出現極端數目,例如,一個重點班的 50 名水平相當的學生,在通過一項教育測驗時,絕大多數學生得分較高, 但個別人卻由于身體不適或一時性情緒障礙而得到很低的分數, 這時若用平均數代表全班學生的知識水平

13、,則肯定偏低,并且不符合實際情況。為此,我們還需要學習,了解其他表示一組事物的典型情況的統計方法和統計值。 在心理物理學實驗、 學習遷移實驗和迷津學習實驗等觀測中,都常有出現極端數目的情況。若出現模糊不清的數據時, 無法計算平均數, 因為計算平均數時需要每一個數據都加入計算。在次數分布中只要有一個數據含糊不清, 都無法計算平均數。 在這種情況下, 一般采用中數作為該組數據的代表值,描述其集中趨勢。此外, 必須注意, 凡不同質的數據不能計算平均數。 所謂同質數據是指使用同一個觀測手段, 采用相同的觀測標準, 能反映某一問題的同一方面特質的數據。 如果使用了不同質的數據計算平均數,則該平均數,不能

14、作為這一組數據的代表值。不僅如此, 有時它反而會造成掩蓋事物的本來面貌,使人產生誤解等問題。 例如在教育方面,計算平均成績時, 如果各科考試的難易水平和評分標準等各不相同,這時若用總平均分數表示一個學生的學習成績,就是不準確的, 因為這是應用不同質的數據計算平均數的結果。即使是同一門課程,通過前后幾次不同的考試, 亦很難使每次的難易度和評分標準等相同。 因此, 如果用平均分數表示該門課程的學習成績, 也同樣存在著數據是否同質的問題。 再如, 在研究某個團體中人們的生活水平變化時, 如果使用平均工資, 常會掩蓋所欲研究的問題。 因為當大多數人收入少而且在降低, 但只有少數人財產急驟增加且數目很大

15、時, 計算出來的平均數可能增加, 但實際上人們的平均生活水平不是提高而是下降了, 這就是由于在計算平均數時, 使用了不同質的數據所造成,即工資在人不同人的生活上起作用不同。由上可見,判別數據是否同質,并不是一件容易的事情, 需要研究者根據實際情況認真分析, 盡管平均數是一個較普遍應用的集中量數,但要用得恰到好處,也并非易事。根據以上對平均數優缺點的分析,可以明確,如果一組數據是比較準確,可靠又同質,而且需要每一個數據都加入計算, 同時還要作進一步代數運算時, 這時就要用算術平均數表示其集中趨勢。如果一組數據中出現兩極端的數目,或有一些數據不清楚,數據不同質時,就不宜使用算術平均數, 除此之外還

16、有一些適用幾何平均數或調和平均數的情境, 也不宜用算術平均數。【小結】本節主要涉及到算術平均數的定義以及計算。算術平均數是一組同質數據的數據除以數據總個數所得到的商。對于算術平均數的計算,可以利用定義直接求算術平均數;對于各個數據所占權重不等的情況,用加權平均數;對于次數分布表中的數據, 計算算術平均數的方法為:一fXC, 一,,一 ,一 一 ,X 式中Xc為各組的組中值,f為各組的次數,N為總次數,即N f。N第二節中位數一、中位數的概念及適用條件(一)概念中位數是位于一組有序數據中間位置的量數。也稱中數,用符號Mdn表示。中位數是將一組有序數據的個數分為相等兩部分的那個數據, 它可能是原始

17、數據中的一個, 也可能是通過 計算得到的某個數值。(二)適用條件中數是根據觀測數據計算而來,不能憑主觀臆定。計算簡單,容易理解,中數的概念簡單明白,這是它的優點。但它也有些不足,如:它反應不夠靈敏,兩極端數目變化,對中數 不產生影響;計算中數時,不是每個數據都加人計算, 受抽樣的影響較大,不如平均數穩定; 中數乘以總數與數據的總和不相等(只有少數情況:Md=X時例外);中數不能作進一步代數運算等等。因此,在一般情況下,中數不被普遍應用。但在一些特殊情況下,它的應用受 到重視。這些特殊情況是:1 .當一組數據有極端值出現時;2 .當一組有序數據兩端有個別數據模糊不清或分組資料有不確定組限時;3

18、.當需要快速估計一組數據的代表值時。二、中位數的計算方法(一)未分組數據中位數的計算方法如果一組數據未分組,須先把數據按照其大小順序排列,然后再確定中位數。中位數的確定取決于一組數據的個數是奇數還是偶數。當數據的個數為奇數時,則以第(N+1) /2個位置上的數據作為中位數。例如,求 7個數據92, 80, 85, 87, 91, 83, 90的中位數。現將這 7個數據按照從大到小或者從小到大的順 序排列,如從小到大排列為:80, 83, 85, 87, 90, 91, 92。第(N+1) /2個位置上的數,即第4個數為87,因此這7個數據的中位數為 87。當數據的個數為偶數時,則取據中間兩個數

19、據的平均數為中位數。即取第N/2個位置上的數據與第N/2+1個位置上的數據的平均數作為中位數。例如求8個數據:80, 93, 90, 81, 85,88, 92, 84的中位數。現將這 8個數據按照從小到大排列為:80, 81, 84, 85, 88, 90,92, 93。第N/2個位置上的數,即第 4個數為85,第N/2+1個位置上的數,即第 5個數為 88,因此這8個數據的中位數為(85+88) /2=86.5 。實際上,對于偶數個數據,中位數所在的位置也可以看成是在(N+1) /2個位置上的數據。(二)分組數據中位數的計算方法對于分組數據,因為通常情況下的N都比較大,N/2與(N+1)

20、/2相差很小,因此在分組數據中粗略地講中位數所在的位置看成是在N/2的位置。N F Fb 分組數據中,中位數的計算公式為:Md Lb 2?inf其中Mdn為中位數;Lb為中位數所在組的精確下限;Fb為中位數所在組下限以下的累加次數;f為中位數所在組的次數;i為組距;N為總次數。具體計算步驟如下:(1)求 N/2 ;(2) 確定中數所在的組;具體方法:由下向上計算累加次數,直到大于或等于N/2 一組為止,改組就是中位數所在的組。(3) 求出中位數所在一組的精確下限;(4) 求出中位數所在組以下的累加次數;(5) 確定組距及中位數所在組的次數;(6) 將以上各值代入上述分組計算中位數的公式求出中位

21、數。例5 對50人外語期末考試成績的次數分布表求學生成績的中位數組別組中值XC次數f累加次數90s 949235085s 8987104780s 8482153775s 797782270s 747251465s 69673960s 64624655s 595722503915N 50解:一 一 2522(2)由下向上積累次數,75s 79組對應的累積次數為22,80 s 84組對應的累積次數為37,故中位數在80s 84組 Lb 79.5 (4) Fb2 3 5 8 22(5) i 5, f 15(6)將以上各值代入公式(3.4),得LbFb79 .5252215? i80 .5小結:中位數

22、是位于一組有序數據中間位置的量數。當一組數據有極端值出現時、當一組有序數據兩端有個別數據模糊不清或分組資料有不確定組限時、或當需要快速估計一組數據的代表值時,會用到中位數表示一組數據的集中趨勢。當數據的個數為奇數時,則以第(N+1) /2個位置上的數據作為中位數。當數據的個數為偶數時,則取據中間兩個數據的平均數為中位數。即取第N/2個位置上的數據與第 N/2+1個位置上的數據的平均數作為中位數。對于已經分組的次數分布表中的數據,中位數的計算N Fb公式為:Mdn Lb 2?i,其中Mdn為中位數;Lb為中位數所在組的精確下限;Fb為中位數所在組下限以下的累加次數;f為中位數所在組的次數;i為組

23、距;N為總次數。第三節幾何平均數一、幾何平均數的概念及應用時機(一)概念幾何平均數是N個數值連乘積的N次方根,用符號 M G表示,其計算公式為:Mg NXXXN(3.5)式中:Mg表示幾何平均數,Xi,X2, ,Xn表示原始數據,N為數據的個數。(二)應用時機1 .求一組等比或近似等比數據的平均數時;2 . 一組數據中有少數偏大或偏小的數據,數據分布呈偏態時;3 .教育上,關于平均發展速度或者是對某項目標進行預估。二、幾何平均數的計算方法(一)直接用定義公式求一組原始數據的幾何平均數例6 求2, 8, 32, 125, 502的幾何平均數。解:由于這組數據屬于近似等比數列,因此求平均數時應求其

24、幾何平均數。將各數值代入公式(3.5)得M g NX1X2XN 5 2 8 32 125 502 31.72該組數據的幾彳S平均數為31.72 。例7已知某校四年中各年度的學生人數分別為上一年1.12 倍,1.09 倍,1.08 倍和 1.06 倍,求每年的平均增長率。解:此問題給出了每年的發展速度。此題應首先計算年平均發展速度,再用公式:平均增長率=平均發展速度-1 ,求出年平均增長率。將 X二1.12, X2 =1.09, X3 =1.08, X4 =1.06,代入公式(3.5),得MG 4 1.12 1.09 1.08 1.06 1.09求得的Mg =1.09,即為年平均發展速度,年平均

25、發展速度是各年度發展速度的平均值。平均增長率=平均發展速度-1=1.09-1=0.09 ,故所求的年平均增長率為9%。(二)只用首末項求幾何平均數上面例7種的資料是給出每一年度與上一年度的比值,即年發展速度,故直接用所給的數據求幾何平均數;若給出的不是每一年度與上一年度的比值,而是每一年度的數值量, 則可以通過首項和末項計算幾何平均數。設a0,a1, ,aN是N個年度中各年度某種數量值,其中a0為初期量,aN為末期量。Xo,Xi,XiXo,Xi,Xn為各年度發展速度,即:亙 Va"VaN,X2, Xna0alaN 1,Xn的幾何平均數便為平均發展速度。MG N X1X2XN N

26、9; -N- N.'(3.6),a0 a1aN 1: a0這個公式只涉及首項和末項及N,用起來比較方便,但是應該注意,N為實際跨年度數。例8某重點高中19941999年招收新生人數如下表,求年平均增長率。人數統計表年份199419951996199719981999人數594600612630650700解:由于a0 594,aN 700,期間跨5個年度,故N=5,所以年平均發展速度為:Mg naN5700a。, 5941.03年平均增長率為(1.03-1) 100%=3%例8已知某校1980年教育經費是20萬元,1997年教育經費是135萬元,求該校教育經費的年平均增長率。解:由于a

27、029,aN135, N 17,所以年平均發展速度為aN17135201.12年平均增長率為(1.12 1)100%=12%。3.6),只不過需作一些變形。MgNaoM(NaN從而 aN = a。M g 5又由于Mg=1 +平均增長率,所以aN=a0(1 +平均增長率)N。例10 某校辦公廠在1984年創產值10萬元該廠計劃以年平均增長率為5%的速度遞增,試估計到2004年該廠可創產值多少萬元?解:本題屬于求年平均增長率的逆運算題目,所用公式仍為(N ,即可估計出2004年該廠a0=10, N=20 ,平均增長率 5%代入aN=ag (1+平均增長率)創造的產值為20一aN =10(1+0.05)=26.53(萬兀)教育事業的發展不是恒速進行的,為了掌握其發展規律,了解它在各個發展階段的特征,如學生人數的年平均增長率,學校就需要用幾何平均數計算其平均發展速度和平均增長率, 經費的年平均增長率等。【思考練習及參考答案】思考和練習一、是非題1 平均數不易受極端數據的影響。2 中位數是一組數據的中間數值。3 對于數據較多的資料,其算術平均數與中位數的值不會相差太大。4 根據次數分布表求平均數亦屬加權平均的性質。5 在教育上常用幾何平均數來預測教育現象的發展變化。二、選擇題1 有 8 個數據 80, 90 , 82, 85, 91, 88 , 84, 92 ,則它

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論