教育統計學集中趨勢的度量_第1頁
教育統計學集中趨勢的度量_第2頁
教育統計學集中趨勢的度量_第3頁
教育統計學集中趨勢的度量_第4頁
教育統計學集中趨勢的度量_第5頁
已閱讀5頁,還剩35頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

教育統計學課件集中趨勢的度量第1頁,課件共40頁,創作于2023年2月本章要點:1.眾數;2.中數;3.算術平均數;4.其它集中量數(加權平均數、幾何平均數等)第2頁,課件共40頁,創作于2023年2月什么是集中量數(MeasuresofCentralTendency)?Descriptivestatisticsthatsummarizedatabydescribingthemosttypicalorrepresentativevalueinthedataset,includingmode,medianandmean.通過描述數據集中最典型最有代表性的值的方式來總結數據的統計量數。描述數據集中趨勢的統計量數稱為集中量數,集中量數包括眾數、中數和算術平均數等。這些量數反映數據向某個方向集中的趨勢。第3頁,課件共40頁,創作于2023年2月什么是眾數(Mode)?Ameasureofcentraltendencythatrepresentsthemostfrequentlyoccurringscoreinadataset.集中量數的一種,數據集最常出現的(出現次數最多)的分數。眾數又稱范數,是指次數分布中出現次數最多的那個數的數值。眾數的符號:第4頁,課件共40頁,創作于2023年2月什么是眾數(Mode)?Ameasureofcentraltendencythatrepresentsthemostfrequentlyoccurringscoreinadataset.眾數有理論眾數和粗略眾數兩種定義方法。粗略眾數是指一組數據(或次數分布)中次數出現最多的那個數的數值。理論眾數是指與次數分布曲線最高點相對應的橫坐標上的一點。第5頁,課件共40頁,創作于2023年2月眾數的計算方法用觀察法直接尋找粗略眾數在一組原始數據中,次數出現最多的那個數值就是眾數;在次數分布表中,次數最多一組的組中值就是粗略眾數。第6頁,課件共40頁,創作于2023年2月720005400026400240001920019200192001800016800168001680014400144001440014400眾數:最常出現的那個值。Mode=第7頁,課件共40頁,創作于2023年2月眾數的計算方法用經驗公式求理論眾數的近似值

①皮爾遜經驗法(適合正態分布)②金氏插補法(適合偏態分布)

為含眾數這一區間的精確下限;為組距;為高于眾數所在組一個組距那一分組區間的次數;為低于眾數所在組一個組距那一分組區間的次數;第8頁,課件共40頁,創作于2023年2月分數段頻數52.5~62.5462.5~72.51072.5~82.51382.5~92.51192.5~102.52合計40表2-1某班一次數學測驗成績的頻數分布表注:本數據純屬虛構,如有雷同,定是巧合53,53,61,61,63,65,67,67,69,69,69,70,70,71,74,75,75,76,77,78,79,80,81,81,81,81,82,84,85,86,87,87,87,88,89,90,91,91,94,95第9頁,課件共40頁,創作于2023年2月

眾數的優缺點眾數雖然簡明易懂,較少受兩極端數值的影響,但它并不具備一個良好集中量數的基本條件。如極不準確、穩定,反應不靈敏,不適合代數運算,受抽樣的影響較大等。在一般情況下,眾數應用也不廣泛,但在一些特殊情況下也常有應用。第10頁,課件共40頁,創作于2023年2月眾數適用的情況當需要快速而粗略地尋求一組數據的代表值時;當一組數據出現不同質的情況時;當次數分布中有兩極端的數目時;當粗略估計次數分布的形態時。第11頁,課件共40頁,創作于2023年2月

學校要召開運動會,決定從高一年級8個班中抽調40名男生組成一個整齊的彩旗方陣隊,如果從高一(1)班的體檢表中任意抽出10份男生表格,得到10個男同學的身高(單位:米)如下:

1.631.601.681.661.661.631.751.661.581.65請根據這10個身高值提供的信息確定參加方隊學生的最佳身高值應取多少?并說明理由。思考題:第12頁,課件共40頁,創作于2023年2月

參加方隊學生的最佳身高值應取1.66。這是因為從這10個身高值可以看出,1.66出現的次數最多,是這組數的眾數,既然這10個男生中有3個身高為1.66米,而一個班遠不止10個男生,那么8個班的男生中應該能選出40名這種身高的人。答:第13頁,課件共40頁,創作于2023年2月什么是中數(Median)?Ameasureofcentraltendencythatrepresentsthemidpointofthedistributionofscores.One-halfthescoresfallaboveandone-halfbelowthispoint.也是集中量數的一種,代表數據分布的中點。這個點以下和以上均有一半的數據。中數又稱中位數,是指位于一組數據數列中間位置的那個數。它的符號記為。第14頁,課件共40頁,創作于2023年2月什么是中數(Median)?Ameasureofcentraltendencythatrepresentsthemidpointofthedistributionofscores.One-halfthescoresfallaboveandone-halfbelowthispoint.也是集中量數的一種,代表數據分布的中點。這個點以下和以上均有一半的數據。中數可以是某個原始數據,也可以是一個計算值。它應該是將一組按大小順序排列的數據平均分為大小相等兩部分的那個數。第15頁,課件共40頁,創作于2023年2月中數的計算方法數據中無重復數值的情況指一組數據中沒有相同的數,這時取處于序列中間位置的那個數為中數。如果數據個數為奇數,則中數為位置的那個數;如果數據個數為偶數,則中數為居于中間位置兩個數的平均數,即第與第位置的兩個數據的平均數。第16頁,課件共40頁,創作于2023年2月中數的計算方法數據中有重復數值的情況指一組數據中有相同數值的數據,這時計算中數的方法基本與無重復數值的單列數據相同。但根據重復數值數據在該組數據中所處的位置又細分為以下兩種情況:①當重復數值沒有位于數列中間時,求中數的方法與無重復數據時求中數的方法相同。②當重復數目位于數列中間時,需要假設位于中間的幾個重復數目為連續數目,取序列中上下各

那一點上的數值為中數。第17頁,課件共40頁,創作于2023年2月7200054000264002400019200192001920018000中數:數據分布中的中間值。16800168001680014400144001440014400Median=眾數:最常出現的那個值。Mode=第18頁,課件共40頁,創作于2023年2月中數的計算方法分組數據將原始數據整理成次數分布表后,求中數的原理同重復數目求中數是一樣的,也是取序列中將N平分為兩半的那一點的值作為中數。

或式中

為中數所在分組區間的精確下限,

為中數所在分組區間的精確上限,

為該組以下各組的累加次數,

為該組以上各組的累加次數,

為該組的次數。第19頁,課件共40頁,創作于2023年2月分數段頻數52.5~62.5462.5~72.51072.5~82.51382.5~92.51192.5~102.52合計40表2-1某班一次數學測驗成績的頻數分布表注:本數據純屬虛構,如有雷同,定是巧合53,53,61,61,63,65,67,67,69,69,69,70,70,71,74,75,75,76,77,78,79,80,81,81,81,81,82,84,85,86,87,87,87,88,89,90,91,91,94,95第20頁,課件共40頁,創作于2023年2月

中數的優缺點中數雖然也具備一個良好集中量數所應具備的一些條件,如計算簡單,嚴密確定,簡明易懂;但與算術平均數相比是相形見絀的,如反應不夠靈敏,受抽樣的影響較大,不適合代數運算等。因此,在一般情況下,中數不被普遍應用,但在一些特殊情況下,它的應用受到重視。第21頁,課件共40頁,創作于2023年2月

中數適用的情況當一組觀測結果中出現極端數目時;當次數分布的兩端數據或個別數據不清楚時;當需要快速估計一組數據的代表值時。第22頁,課件共40頁,創作于2023年2月

由于這19名大學生的月消費中存在極端數據,算術平均數不能很好地反映他們的平均月消費,應求中數:

答:這些大學生的平均月消費是239元。

一項研究調查了19名大學生,他們的月消費(單位:人民幣元)如下:

220,227,230,231,232,232,235,236,

237,239,240,245,246,249,253,258,

260,510,600現欲了解他們的平均月消費?思考題:解:第23頁,課件共40頁,創作于2023年2月什么是算術平均數(Mean)?AmeasureofcentraltendencythatisthesumofallthevaluesinthedatasetdividedbyN.也是集中量數的一種,用所有數據之和除以N就得到算術平均數。算術平均數是所有觀察值的總和除以總頻數所得之商。統計學中常常區分樣本平均數()和總體平均數()。第24頁,課件共40頁,創作于2023年2月算術平均數的計算方法原始數據的計算方法第25頁,課件共40頁,創作于2023年2月72000540002640024000算術平均數:所有觀測值的總和除以觀測數值的個數所得的商數。19200192001920018000Mean=中數:數據分布中的中間值。16800168001680014400144001440014400Median=眾數:最常出現的那個值。Mode=第26頁,課件共40頁,創作于2023年2月算術平均數的計算方法分組數據的計算方法

表示對次數分布表計算的算術平均數;表示各組的組中值;表示各組對應的次數;表示總次數。第27頁,課件共40頁,創作于2023年2月分數段頻數52.5~62.5462.5~72.51072.5~82.51382.5~92.51192.5~102.52合計40表2-1某班一次數學測驗成績的頻數分布表注:本數據純屬虛構,如有雷同,定是巧合53,53,61,61,63,65,67,67,69,69,69,70,70,71,74,75,75,76,77,78,79,80,81,81,81,81,82,84,85,86,87,87,87,88,89,90,91,91,94,95第28頁,課件共40頁,創作于2023年2月

算數平均數的性質①在一組數據中每個變量與平均數之差的總和等于0,即:②在一組數據中,每一個數都加上一常數C,則所得的平均數為原來的平均數加常數C,即:③在一組數據中,每一個數都乘以一常數C,則所得的平均數為原來的平均數乘以常數C,即:第29頁,課件共40頁,創作于2023年2月

算數平均數的性質④一列數據中每個數乘以一個常數C,再加上一常數d,其平均數等于原平均數乘以常數C再加上常數d。⑤一組數據中每個數與任意常數c的差的平方和,不小于該組數據中每個數與平均數的差的平方和。第30頁,課件共40頁,創作于2023年2月第31頁,課件共40頁,創作于2023年2月算術平均數的優缺點①優點:算術平均數是一個良好的集中量數,具有反應靈敏、計算嚴密、簡明易解、計算簡單、適合進一步演算和較小受抽樣變化的影響等。②缺點:算術平均數易受極端數據的影響,這是因為平均數反應靈敏,每個數據的或大或小的變化都會影響到最終結果;出現模糊不清的數據時,無法計算平均數。注意:不同質的數據不能計算平均數(同質數據是指使用同一觀測手段,采用相同的觀測標準,能反映某一問題同一方面特質的數據),因為不同質的數據觀測手段、測量標準不一致。第32頁,課件共40頁,創作于2023年2月算術平均數、眾數和中數的關系①當次數分布呈正態時:②當次數分布呈正偏態時:且③當次數分布呈負偏態時:且第33頁,課件共40頁,創作于2023年2月負偏分布均值

中位數

眾數對稱分布

均值=中位數=

眾數正偏分布眾數

中位數均值第34頁,課件共40頁,創作于2023年2月比較的項目平均數(M)中數(Md)眾數(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論