




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第十四課 教育研究資料的整理一、常用統計數據二、常用統計量三、統計推斷之總體參數估計四、統計推斷之統計檢驗五、常用間斷型數據統計分析一、常用統計數據教育研究資料通常由三部分組成:靜態資料:年齡、性別、年級、班級、職稱、學歷、戶籍、地區等行為資料:表明“是否”、“能否”、“有無”、“常否”、“做否”、“程度”等態度資料:表明滿意度、贊同度、擇優度等教育統計數據類型:連續型數據(數字資料)如分數、身高、體重等間斷型數據(計數資料)表明類別、品質、等級等按品質分類人次、次數、性別等等行為資料態度資料5-24-1302112等級優良中及差滿意度很滿意滿意一般不滿意很不滿意贊同度很贊同同意一般不同意很不
2、贊同 二、常用統計量(一)頻數(f)某些數據呈現的次數例1某班級英語考試成績頻數分布 3人:45;48;49 7人:50;54;55;56;57;57;5913人:60;60;61;64;64;64;65;65;66;67;67;67;6815人:70;70;70;71;72;72;73;73;74;74;75;75;76;77;7911人:80;81;81;82;82;83;86;87;87;88;89 5人:90;92;93;94;99 354合計05 0-1001510-2002520-3003530-404540-5075550-60136560-70157570-80118580-9
3、059590-100頻 數組中值組 距某班級英語成績頻數分布表347.545-50252.550-55557.555-60662.560-65767.565-7072.570-75577.575-80682.580-85587.585-90492.590-95197.595-100頻數(f)組中值組 距某班級英語成績頻數分布表10頻數分布表的編制1、求全距(R) R=最大值最小值=99-45=542、定組數(K)和組距(I) K=R/I=54/5113、定組限(上下限或組中值)4、登記頻數(間斷型數據的頻數)問卷題目1:你對課的滿意程度如何?55204030頻數(f)12345很不滿意不滿意一
4、般滿意非常滿意 等級頻數(二)集中量描述一組數據典型水平或集中趨勢的統計量 問卷題目1:你對課的滿意程度如何?算術平均數:例1加權算術平均數:例1(問卷) 3.85平均數 =38551060160150各級分值XW=10055204030頻數(W) M =3.012345權重分(x)合 計很不滿意不滿意一般滿意很滿意等級(三)差異量描述一組數據的離散趨勢的統計量 1、全距(R)=最大值最小值 2、方差(S2)和標準差(S) 例1問卷題目1:你對課的滿意程度如何?20X4(1-3)220201很不滿意20X1(2-3)240202不滿意0 (3-3)260203一般20X1(4-3)280204
5、滿意1.414220X4(5-3)23.0100205很滿意地理10X4(1-3)210101很不滿意20X1(2-3)240202不滿意0 (3-3)2120403一般20X1(4-3)280204滿意1.0951.210X4(5-3)23.050105很滿意物理SS2均值M得分頻數等級分滿意度班級(四)相關量描述兩列變量之間的相關程度的統計量 相關分正相關、負相關和零相關。相關程度用相關系數表示。相關系數介于1.00和+1.00之間相關系數絕對值越大,相關程度越高相關系數為1.00時,為完全負相關相關系數為 +1.00時,為完全正相關相關系數為 0時,為完全無關相關系數計算與適用范圍:積差
6、相關(r)皮爾遜積差相關 適用范圍:兩列呈正態分布的連續變量之間的相關關系;對數大于30等級相關(rp)斯皮爾曼等級相關 適用范圍:等級變量和非正態分布的變量之間的相關關系點二列相關(rpb) 適用范圍:一列變量為連續變量,另一列變量為二分變量 1、積差相關(rxy)(1)用平均數與標準差計算積差相關公式(1)例2求10名學生政治與語文成績的積差相關系數積差相關公式(2)rXY=04891801880719840837 756總計 272 40021188 4982068 742 602228 59252828975697292809289280918490091369108925622161
7、936883601619619657762562561787275317534303373316464494041414761616827581898289888480877471808576777768747412345678910 xi yiYi2 xi2 yi XiYiXiYiXi語文政治學生 10名學生政治與語文成績的相關系數計算表(2)用原始數據計算積差相關公式()10名學生政治與語文成績的相關系數計算表rXY=048633697024557352837 756總計606853256480656562326853677657125920643867245625656179216724
8、792177447056640075695476504164007225577659295929462454765476827581898289888480877471808576777768747412345678910i ii2i2語文Yi政治Xi學號2、等級相關( r )例求10名學生教育統計學與普通心理學成績的等級相關系數=21.59n=1000.252.25900190000.51.5300130012.52.57468591012444678910939292708375667664619490868686706865626012345678910D2DRYRX普通心理學Yi教育統
9、計學Xi學號2Drp=0.8710名學生教育統計學與普通心理學成績的相關系數計算表等級相關公式、點二列相關( rb )點二列相關公式例4求10名學生化學成績與性別的相關系數rpb= 0.15相關系數n=10q=0.471.7591805660女P=0.6SX=12.7869.4=67.83677283746546男占總體比例總體平均數與標準差二列平均數成績二分稱名10名學生化學成績與性別的相關系數計算表三、推斷統計之總體參數估計描述統計:集中量、差異量、相關量由樣本數據求得的描述性數量統計量推斷統計:總體的描述性數量參數樣本的平均數、標準差、相關系數分別符號 、S、r表示 可通過樣本計算求得;
10、總體參數用、分別 代表處總體的平均數、標準差 和相關系數,總體參數不能通過直接計算求得,是通過對 樣本統計量進行推斷得出的。 總體參數估計(一)點估計 例:某市10000名高三學生語文會考平均成績估計(抽500名,65分)(二)區間估計總體平均數區間估計總體百分數區間估計 例:某市高一學生數學平均成績估計 估計為8086分之間;估計100次,95次在此區間。 則正確概率95%。估計正確的概率稱為置信系數或置信度。置信系數一般為95%和99%兩種。例5隨機抽取某年高考100份作文試卷,平均數為26,標準差為1.5, 試估計其總體平均數 當置信系數為95%時,代入公式:得出 當置信系數為95%時,
11、代入公式:得出 結論:25.707,26.294,估計可靠性為95%;25.613,26.387,估計可靠性為99%95%的置信區間1.96(理論Z值) 99%的置信區間2.58(理論Z值)1、大樣本(n30)總體平均數的估計 標準誤()樣本平均數的標準誤(標準差) 當n30以S代替 2、小樣本(n30)總體平均數的估計95%的置信區間95%的置信區間例6隨機抽取某校二年級學生17名,測其平均身高為120cm,標準差為10 cm,估計該校二年級學生平均身高 當置信系數為95%時,查 t 值表,df=171=16, t(16)0.05= 2.11 代入公式: 114.725 125.725 當置
12、信系數為99%時,查 t 值表,df=171=16, t(16)0.01= 2.92 代入公式: 112.7 127.3 結論:在114.725,125.725區間時,這個估計的可靠性為95%, 在112.7 ,127.3 區間時,這個估計的可靠性為99%。n30時,標準誤計算公式中 通常以(n1)代替n 3、總體百分數的區間估計公式:樣本百分數標準差:例7某縣調查學生流失率,以某校753名學生為樣本,結果流 失18名學生,問該縣學生流失率的置信區間(置信度95%)。 解: n=753;p=18/753=0.024; q=1-p=0.976 樣本百分數標準差:SEp=0.00558 因此,置信
13、度為95%的總體比率的置信區間為: 0.0241.96X0.00558 0.024+1.96X0.00558,即1.3% 3.5%。 所以,該縣學生流失率的置信區間為1.3%,3.5%。四、推斷統計之統計假設檢驗統計假設檢驗既差異顯著性檢驗統計檢驗的目的: 檢驗樣本與總體之間或樣本之間的差異是否顯著,推斷差異 產生原因是否是由抽樣誤差引起差異的顯著性水平差異由隨機誤差所造成的概率的大小(a)a=0.05水平:P0.05,則差異不顯著; P 0.05,則差異顯著a=0.01水平:P0.01,則差異不顯著; P 0.01,則差異顯著統計檢驗類型根據檢驗的統計量平均數差異檢驗相關系數差異檢驗根據樣本
14、容量大樣本Z檢驗小樣本 t 檢驗根據樣本形式獨立樣本檢驗相關樣本檢驗多樣本F檢驗根據數據類型 連續性數據間斷性數據x2檢驗(一)Z檢驗(大樣本n30平均數差異的顯著性檢驗)1、一個樣本平均數與一個已知的總體平均數差異檢驗公式:例7高一五個班的物理期末平均成績為50分,標準差為10分,張老師講 授高一(3)班物理課程,該班49名學生,期末物理平均成績47.5分。 學校認為張老師的教學效果低于學校平均水平,張老師不同意。 問(3)班成績與學校平均水平有無顯著性差異?學校評價是否科學?檢驗步驟:提出假設H0:兩者無顯著性差異(零假設)選擇檢驗統計量并計算其值:Z=-1.75確定檢驗形式:因無資料表明
15、(3)班與全校平均水平的高低, 故采用雙側檢驗 統計推斷:因Z= 1.750.05,在0.05顯著性水平上保留 零假設,即(3)班成績與學校平均水平無顯著性差異,學校對張老師 的評價是不科學的。2、獨立大樣本Z檢驗獨立樣本:兩個彼此獨立的樣本。兩個樣本不存在任何關系。例8高三學生英語測試成績如下:男生180人,平均成績75.6分,標準差 11.5分;女生160人,平均成績77.2分,標準差10.5分。 問男女生英語成績有無顯著性差異?公式:檢驗步驟:提出假設H0:男女英語成績無顯著性差異(零假設)選擇檢驗統計量并計算其值:Z=-1.424確定檢驗形式:因無資料表明其英語成績的高低,故采用雙側檢
16、驗 統計推斷:因Z= 1.4240.05,在0.05顯著性水平上保留 零假設,即高三男女英語成績無顯著性差異3、相關大樣本Z檢驗同一組被試在不同條件下形成的樣本(實驗前后分數或兩次實驗結果)兩組被試在成對匹配的情況下形成的樣本公式:例9抽取某小學二年級學生50名做實驗,實驗前測閱讀平均成績 為 76.5分, 標準差為8分;實驗后測參加學生46人,平均成績79.5分,標準差為7分, 兩次測驗的相關系數為0.6。問前后兩次測驗成績有無顯著性差異?檢驗步驟:提出假設H0 :實驗前后兩次測驗成績無顯著性差異(零假設)選擇檢驗統計量并計算其值:Z=3.09確定檢驗形式:采用雙側檢驗 統計推斷:因Z= 3
17、.092.58,則P 2.093,則P2.567,則P3.25,則P8.02,則P0.01 所以,在0.01顯著性水平上拒絕 零假設,即三組平均數之間至少 有一對存在顯著性差異數學測驗錯誤頻數 =8 =22 = 24 =154 =42 =452114258471210812組3(無噪音)X3組2(中噪音)X2組1(強噪音)X1=(452+154+22) (42+24+8)2/12=171.67=(422/4+242/4+82/4) (42+24+8)2/12=144.6724.11MSW =3dfW =9SSW =27組內MSB =72.33dfB =2SSB =144.67組間dfT = 1
18、1SST =171.67總計F 值均 方自由度平方和變異來源方差分析表(四)相關系數差異的顯著性檢驗例14某校122名高一學生的物理成績與數學成績的相關系數從總體來說, 高一學生的物理成績和數學成績是否存在相關公式:檢驗步驟:提出假設H0 :兩個成績之間不存在顯著性相關(零假設)選擇檢驗統計量并計算其值: Z=4.88確定檢驗形式:采用雙側檢驗 統計推斷:Z=4.882.58,則P5例15問卷題目2(某師范大學教師素質調查問卷): 你認為教師最重要的能力是什么?(A.自學能力;B.教學能力;C. 科研能力) 回收54份問卷中選自學能力15人,選教學能力23人,選科研能力16人,問對 這三種能力
19、的看法有無顯著性差異?檢驗步驟:提出假設H0 :對這三種能力的看法無顯著性差異(零假設)選擇檢驗統計量并計算其值: fe=54/3=18, x2=2.11確定檢驗形式:采用雙側檢驗 統計推斷: df=3-1=2,查 x2(2)0.05=5.99 x2=2.115.99,則P0.05,在0.05顯著性水平上接受零 假設,即對三種能力的看法無顯著性差異。五、常用間斷型數據(問卷資料)的統計分析(一)百分比統計法(二)得分率統計法(三)排序統計法(四)差異統計法(五)相關統計法(一)百分比統計法公式:P為反應項目的百分率n為對問卷某一反應項目的填答人數N為填答該問卷的總人數 選項問卷題目中國內地香港
20、美國其他你愿意在那個國家或地區生活?1883685百分率79.3%15.2%3.4%2.1%可用于總體百分數的區間估計(二 )得分率統計法公式:a為等級分值; an為最高等級分值n為選答某反應項目人數; N為參與填答問卷的總人數 等級問題全部理解大部分理解部分理解少部分理解得分率F均值M43211.獨立大樣本Z檢驗7610270.4651.862.獨立小樣本t檢驗2414840.793.163.相關大樣本Z檢驗18121460.712.844.多樣本F檢驗2018840.773.085.計數資料X2檢驗81212180.552.2N=50例16問卷題目3:你對以下問題的理解程度如何?請在表中每
21、個問題的右邊 選擇一項,并打“”(三 )排序統計法公式:a為排序等級的分值; 為排序的各等級分值的和n為選答某等級的人數; N為參與填答問卷的總人數例17問卷題目4:你認為目前師范生不重視教師教育公共課程的主要原因是 什么?根據你的看法,把下列原因選項代號,按其重要程度填在表中。 A.課程內容枯燥B.課程應用性差C. 教師水平不高D. 合班上課效果差N=50/結果:WCWAWBWDDCB2.762.202.962.080.2760.2200.2960.2088166201216101214101412168206A1234均值M排序指數(W)第四位第三位第二位第一位 排序等級原因可用于教育項目
22、權重的的計算(四 )差異檢驗法1、單組樣本X2檢驗法公式:f0為觀察次數;fe為理論次數例18問卷題目5:你對教師職業的滿意程度如何? 1.很滿意 2.滿意 3. 不滿意 4. 很不滿意 分析:學生的態度有無顯著性差異?選項 n滿意度1234x2x2(df)0.01P很滿意滿意不滿意很不滿意觀察頻數f0261323X2 =23.09df=X2(3)0.01 =11.345P 0.01合 計N=44人2、多組樣本X2檢驗法(列聯表法:RL表)22列聯表公式:NR為行的觀察次數;NL為理論次數R為行的數量;L為列的數量例19問卷題目6:你是否喜歡聽教育研究方法課? 1.喜歡 2.一般 3. 不喜歡 分析:兩個專業學生的態度有無顯著性差異?選項很喜歡一般不喜歡行總計NLX2dfx2(df)0.05P1中文專業34 ( )41( )25( )100X2=19.94df=x2(2)0.05 =5.991P 0.052歷史專業64 ( )17( )19( )100列總計NR985844200合 計N=200(五 )相關分析法(類別與類別)22類別 相關分析公式:例20 基本信息部分:你的家庭住址:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電阻焊鋼管采購合同協議
- 玩具雕塑轉讓合同協議
- 電商行業轉讓合同協議
- 玉米桿子采購合同協議
- 白酒總經銷合同協議
- 電氣公司勞動合同協議
- 球場管理維護合同協議
- 特惠裝修合同協議書范本
- 玉米黃貯收購合同協議
- 玉米種植協議合同協議
- 探究膜分離技術在水處理中的應用
- 洋流課件2024-2025學年高中地理人教版(2019)選擇性必修一
- 2024-2025學年中職數學拓展模塊一 (下冊)高教版(2021·十四五)教學設計合集
- 電梯維保工程施工組織設計方案
- 2024-2030年中國消防行業市場發展分析及發展趨勢與投資前景研究報告
- 外研版(2019) 必修第三冊 Unit 2 Making a Difference教案
- 醫院科研成果及知識產權管理規范
- DB32T-公路橋梁水下結構檢測評定標準
- 高職藥學專業《藥物制劑技術》說課課件
- 低碳環保管理制度
- 急診科提高出診車物品放置規范率PDCA項目
評論
0/150
提交評論