北大心理統計_第1頁
北大心理統計_第2頁
北大心理統計_第3頁
北大心理統計_第4頁
北大心理統計_第5頁
已閱讀5頁,還剩7頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、北大心理統計第一章 緒論&1.隨機現象與統計學確定現象 隨機現象本人性別 生男生女光的速度 學習成績種豆得豆 (人的)反應速度隨機現象:具有以下三個特性的現象稱為隨機現象(i) 一次試驗有多種可能結果,其所有可能結果是已知的。(ii) 試驗之前不能預料哪一種結果會出現(iii) 在相同條件下可以重復試驗隨機事件:隨機現象的每一種結果叫做一個隨機事件。隨機變量:把能表示隨機現象各種結果的變量稱為隨機變量統計學的研究對象是隨機現象規律性隨機變量的分布:(i)正態分布 eg:學習成績圖(略)(ii)雙峰分布 eg:汽車擁擠程度圖(略)(iii)另一種分布 eg:如下圖(略)&2.總體

2、和樣本總體:是我們所研究的具有某種共同特性的個體的總和樣本:是從總體中抽取的作為觀察對象的一部分個體。(i) 總體:有限總體:總體所包含的個體數目有限時無限總體:總體所包含的個體數目無限時 參數:總體上的各種數字特征(ii) 總體抽樣 樣本:大樣本:>30 >50小樣本:30 50(更精神)(樣本容量:樣本中包含的個體數目) 統計量:樣本上的數字特征根據統計量來估計參數&3.心理統計學的內容1 描述統計:對已獲得的數據進行整理,概括,顯現其分布特征的統計方法。集中量 平均數 描述 差異量 標準差S: S大:差異大/不穩定 對個別S?。翰町愋?穩定 對個別統計 相關量:相關系

3、數(表示兩件事情的相互關系)r.r-1,1(r表示從無關道完全相關,相關:正相關,相關,負相關)2 推斷統計參數估計:s推斷 r統計 假設檢驗:參數檢驗非參數檢驗3 實驗設計初級的,用平均數,百分比后來,平均數 T檢驗(2個對象)標準差 中級的,(2個或2個以上對象)(方差分析)下檢驗。高級的,相關回歸(用相關系數)再高級的,(研究生學) 因素分析(探索性的)兩兩相關,寫相關系數更高級的,協方差結構方程(驗證性的)前程:相同符號的一串非參數檢驗中的一種第二章 數據整理&1.數據種類一間斷變量與連續變量 eg:人數 間斷二四種量表。1稱名量表。 Eg:307室,學好,電話好嗎 不能進行數

4、學運算(也包括不能大小比較)2順序量表。Eg:名次。能力大小,不能運算3等距量表。可以運算(做加減法),不能乘除要求:沒有絕對0年齡有絕對0時間(年代,日歷。)位移無絕對0,可能有相對0,即有正負4等比量表??勺龀顺?。要有絕對零。成績中的,0分不是絕對0(因為并不說明此人一竅不通)分數代表的意義。Eg:010分與90100分。 每一分的"距離"不一樣因為嚴格來說,成績是順序量表。但為了實際運用中的各種統計,把它作為等距量表&2.次數分布表一 簡單次數分布表eg: 組別 次數(人次)100 29099 58089 147079 156069 760分以下 31 求全

5、距 R=Max - Min(連續變量)(間斷變量)-R=MaxMin+12 定組數 K(組數)1.87(N1)。 取整 N-總數 3 定組距 I=R/K。一般,取奇數或5的倍數(此種更多)。4 定各組限5 求組值 X=(上限下限)/2 上限-指最高值加或取10的倍數等)6 歸類劃記7 登記次數例題: 99 96 92 90 90 (I) R=99-57+1=4387 86 84 83 83 82 82 80 79 78 (II)K=1.87(50-1)。978 78 78 77 7777 76 76 76 7675 75 74 74 73 (III)I=R/K =43/9572 72 72 7

6、1 7171 70 70 69 6968 67 67 67 65 (iu)組別 組值 次數64 62 62 61 57 9599 97 29094 92 38589 87 28084 82 67579 77 147074 72 116569 67 76064 62 4 5559 57 1總和 50二 相對(比值)次數分布表。 累積次數分布表 相對(比值)累積次數:累積次數值/總數N注:一般避免不等距組("以上""以下"稱為開口組)相對次數 累積次數(此處意為"每組上限以下的人次)"小于制".04 50 .06 48.04 4

7、5 .12 43.28 37.22 23.14 12.08 5.02 11.00&3.次數分布圖一直方圖1 標出橫軸,縱軸(5:3)標刻度2 直方圖的寬度(一個或半個組距)3 編號,題目4 必要時,頂端標數)圖二次數多邊圖1 畫點,組距正中2 連接各點3 向下延伸到左右各自一個組距的中央最大值即y軸最大值相對次數分布圖,只需將縱坐標改為比率。(累積次數,累積百分比也同樣改縱坐標即可)"S形"曲線是正態分布圖的累積次數分布圖 圖第三章 常用統計量數&1.集中量一算術平均數公式算術平均數的優缺點。P3637算術平均數的特征。(X-#)=0 離(均數)差(X-#)

8、(X-#)取#時,得最小值即:離差平方和是一最小值二幾何平均數g= 略long#g=1/NlogXi根據按一定比例變化時,多用幾何平均數eg: 91年 92 93 94 95 9612 10 11 9 9 8%求平均增長率xg=加權平均數甲:600人 #=70分乙:100人 #=80分加權平均數:=(70*600+80*100)/(600+100) (總平均數)eg:600人,100人簡單平均數:(7080)/2三中(位)數。(Md)1.原始數據計算法分:奇、偶。2頻數分布表計算法(不要求)3優點,缺點,適用情況(p42)四眾數(o)1理論眾數粗略眾數2計算方法:Mo=3Md-2#Mo=Lmo

9、+fa/(fa+fb)*I計算不要求3優缺點平均數,中位數,眾數三者關系。&2.差異量數一全距R=Max-Min二平均差(MD或AD)MD=|x-#(或Md)|/N三方差總體方差的估計值S2 =(X #)2 反編樣本的方差:2 x有編N很小時,用S2 估計總體N>30時,用S2 或2 x 都可以計算方法:2 xx2 /N (X/N) 2 標準差x2 x2/1 四差異系數(CV)CV=x/# *100% CV5%,35%3個用途五偏態量與鋒態量(SK)1.偏態量:sk=(#-Mo)/x動差(一級四級) a3= (x-#)3 、 / N/x3 三級動差計算偏態系數)2峰態量:高狹峰

10、a4>0 (a4=0 -正態峰)低調峰。A4<0用四級動差 a4=(X - #)4/N/x43&3.地位量數一百分位數eg:P30=60(分) "60分以下的還有30%的人"二百分等級3060(在30的人的位置上,相應分數為60)SoMd第四章 概率與分布&1概率一概率的定義W(A)=m/n (頻率/相對頻數)后驗概率: P(A)=lim m/n先驗概率:不用做試驗的二概率的性質和運算1性質:oP1p=1 必然可能事件p=0 不可能事件2加法。P(a+b)=P(a)+P(b)"或":兩互不相克事件和。推廣:"有限個&

11、quot; P(A1+A2+An)=P(A1)+P(A2)+P(An)eg:(1)A=出現點數不超過4(x4)P(A)=P(x=1)+P(x=2)+P(x=3)+P(x=4)=1/6+1/6=4/6=2/3(2)完全憑猜測做判斷題,(共2道),做對1題的概率為:A=T.Ti B=F.Ti C=T.Fi D=F.FiP=P(B)+P(C)=1/4+1/4=0.53.乘法:P(A1,A2An)=P(A1),P(A2)P(An)Eg:(1)四選1。(十道)完全憑猜測得滿分得概率:(1/4)*(1/4)*(1/4)=1/410&2.二項分布一二項分布P(x)=Cnxpxgn-x 做對的概率 p

12、x :做錯的概率 gn-x :X:對的數量pxgn-x -每一種分情況的概率。一種情況:pxgn-x 再乘上系數。Eg:產品合格率為90 取n=3(個)TTT的情況 90 * 90*90=P3 0.729TFT 90*0.10*90=P2g1 0.081兩個合格的情況 TTFFTT其概率 C32P2g1=3p2g1.Cn0P0gn+CnP1gn-1+CnPng0=1注:二項分布可能的結果只有兩種。F 0r T合格 Or 不合格選對 Or 選錯例:(1)10道是非題,憑猜測答對5,6,7,8,9,10題的概率?至少答對5題的概率?P(x=5)C510P5g5=C510(1/2)51/2)5=.2

13、4609P(x=6)=C610P6g4=C610(1/2)6(1/2)4=.20508P(x=7)=C710P7g3=C710(1/2)7(1/2)3=.11719=.04395=.00977+P(x=10)=C1010P10g0=(1/2)10 =.000098至少答對5題:P(X5) = 0.62306(2)四選一,猜中8,9,10題的概率?P(x=8)=C819P8g2=C819(1/4)8(3/4)2=.0039二二項分布圖(P8485)三二項分布的平均數與標準差(前提np5且ng5)平均數-M=np 標準差-r=npg1/2&3.正態分布一正態分布曲線二標準正態分布。(P38

14、7附表可查面積P)Z=(x-)/r (x:原始分數)標準分數(有正有負) Z=0三正態分布表的使用查表 P(0Z1)=0.34134-Z的范圍中的人數比例(百分數)P(0Z1.645)=0.45001.64 .44950=0.451.65 .45053=0.45之上,標準分數高于2個標準差,則非常聰明。Eg:1. =70(分) 10P(70x80)=p(oz1)P(60x70)=P(-1z0)2.P(0z1)=P(x+)P(-1z0)=P(-x)圖(略)例:某地區高考,物理成績 57。08(分) 18。04(分)總共47000人。 (1)成績在90分以上多少人?(2)成績在(80,90)多少人

15、?(3)成績在60分以下多少人?解: XN(57.08,18.042) - 參數(,2)Normal 表示符合正態分布令Z= (x-57.08)/18.04) ,則ZN(0,12)標準分數平均數一定為0,標準差一定為1。(1)Z1=(9057。08)/18.04=1.82P(Z>1.82)=.0344N1=np=47000*0.0344=1616(人)(2)Zz=(80-57.08)/18.04=1.27P(1.27<Z<1,82)=.46562-.39796=0.677N2=NP=3177(人)(3)Z3=(60-57.08)/18.04=0.16P(Z<0.16)=

16、.56356N3=26487(人)四正態分布的應用T=KZ+C TN(C,K2)IQ=15Z+100 IQ=100 一般IQ130 -超常(30=2x*15)IQ<70 - 弱智70幾 -bndenlineeg:1.某市參加一考試2800人,錄取150人,平均分數75分,標準差為8。問錄取分數定為多少分?解: XN(75.82)Z=(x-#)/x=(x-15)/8 N(0,12)P=150/2800=0.0530.5-0.053=0.447Z=1.615X=1.615*8+7588(分)2某高考,平均500分,標準差100分,一考生650分,設當年錄取10,問該生是否到錄取分?解: Zo

17、=(650-500)/100=1.5 (XN(500,1002)(ZN(0,12)Po=0.5-0.43319=0.06681=6.681%<10% 所以可錄取。第五章 抽樣分布(概率P)&1.抽樣方法一 簡單隨機抽樣二 等距抽樣三 分層抽樣四 整群抽樣五 有意抽樣&2.抽樣分布(1) (2) (3) (4) (5)20 25 30 35 40(1) 20 22.5 25 27.5 30(2) 22.5 25 27.5 30 32.5(3) 25 27.5 30 32.5 35(4) 27.5 30 32.5 35 37.5(5) 30 32.5 35 37.5 40總體

18、分布圖抽樣分布圖一平均數E(#)=二。標準差,方差。x=/n1/2 #2=2/n&3.樣本均值(#)的抽樣分布一總體方差2已知時,的抽樣分布1正態總體,2 已知時,的抽樣分布設(X1,X2,Xn)為抽自正態總體XN(, 2 )的一個簡單隨機樣本,則其樣本均值也是一個正態分布的隨機變量,且有:E(#)=, x2 =2 /n即N(, 2 /n)Z=(#-)/n1/2 Eg:一次測驗,=100 5從該總體中抽樣一個容量為25的簡單隨機樣本,求這一樣本均值間于99到101的概率?解: 已知XN(100,52)n=25.則N(100,12)Z=(#-100)/1 N(0,1)當#=99時,Z=-

19、1當#=101時,Z=1所以P(99#101)=P(-1Z1)=.68268 2.非正態總體,2已知時,#的抽樣分布設(X1,X2,Xn)是抽自非正態總體的一個簡單1隨機樣本。當n30時,其樣本均值接近正態分布,且有:E(#)=, x2 =2 /n即#N(, 2 /n)若是小樣本,題目無解。Eg(1)一種燈具,平均壽命5000小時,標準差為400小時(無限總體)從產品中抽取100盞燈,問它們的平均壽命不低于4900小時的概率。解:已知:5000,400,n=100>30是大樣本所以近似正態分布N(5000,402)當4900時,Z=(4900-5000)/400/1001/2=-2.5P

20、(#4900)=P(Z-2.5)=0.993793.有限總體的修正系數(引出)(2)同上題,從2000(有限總體)盞中不放回地抽取100盞,問。(概念)設總體是有限的總體,其均值為,方差為2 (X1,X2Xn)是以不放回形式從該總體抽取的一個簡單隨機樣本。則樣本均值的數學期望(E(#))與方差為E(#)=#= 和2 (N-n)/(N-1)*( 2 /n)N時,修正系數不計。 (N-n)/(N-1)*( 2 /n)1/2 .n/N0.05%,要用修正系數如題(2),n/N0.05 所以要用修正系數所以解題2:x2 (N-n)/(N-1) *( 2 /n)2000100)/2000-1=4002

21、/100=1520#=15201/2 =38.987Z=(4900-5000)/38.987= -2.565P(Z-2.565)=.9949二總體方差2 未知時,樣本均值的抽樣分布。用S2(總體方差的估計值)代替 2 t=(x-)/s/n1/2 tn-1dp(自由度)=n-1設(X1,X2,Xn)為抽自正態總體的一個容量為n的簡單隨機樣本,即t=(x-)/s/n1/2符合自由度為n-1的t分布當總體為非正態分布,且2 未知。則樣本 ?。簾o解大:接近七分布 t t=(x-)/s/n1/2 tn-1Z t=(x-)/s/n1/2 N(0,1)(也可用Z)總體均值為80,非正態分布,方差未知,從該總

22、體中抽一容量為64的樣本,得S=2,問樣本均值大于80.5得概率是多少?解:因為64>30 是大樣本P(#>80.5)=P(t>(x-)/s/n1/2 )=P(t>2) df=63 P0.025若用Z,P(Z>z) 0.02275(若N24,總體正態,則Z分布1不能用,只能用七分布)非正態總體:小樣本-無解大樣本-Z(x-)/n1/22 已知 正態總體 Z=(x-)/n1/2非正態總體:小樣本 - 無解2 未知: 大樣本-t(x-)/n1/2 Z正態總體:小樣本-t=(x-)/n1/2 大樣本-Zt=(x-)/n1/2&3.兩個樣本均值之差(#1-#2)的

23、抽樣分布若1是獨立地抽自總體X1N(1,2 )的一個容量為n,的簡單隨機樣本的均值;是。X2N(2, 22 )的。n2.的。則兩樣本均值之差(#1#2)N(1-2,12/n1,22/n2)復雜計算一種鋼絲的拉強度,服從正態分布總體均值為80,總體標準差6,抽取容量為36的簡單隨機樣本,求樣本均值79,81的概率XN(80,62)ZN(0,12)Z=(x-)/6/361/2 =(x-8)/1x79,8081Z -1,1P=.68268若不知。S=b,則 X(80, 2 )用公式t=(# -)/s/n1/2 tn-1 =t35 某種零件平均長度0.50cm,標準差0.04cm,從該總零件中隨機抽1

24、6個,問此16個零件的平均長度小于0.49cm的概率無解。抽100個,則概率?Z(x-)/n1/2 =(# - 0.50)/0.004#<0.49 P(Z<-0.01/0.004)=P(Z<-2.5)=.49379=從500件產品中不放回地抽25件。25/500=0.05 要修正系數(N-n)/(N-1).95某校一教師采用一種他認為有效的方法,一年后,從該師班中隨機抽取9名學生的成績,平均分84.5分,S=3。而全年級總平均分為82分,試問這9名學生的<84.5分的概率為多大?#N(82, 2 ) tt8t=(# -)/s/n1/2 =84.5-82)/3/3=2.5

25、df=80.975P(t<2.5)說明方法有效(S=3是的估計值,兩組數據都很整齊。圖(略)&4.有關樣本方差的抽樣分布一f2分布1f2 分布的密度函數 f(x)=1/2n/2*r*n/2)* e-x/2*xn/2-1 (x>0)f(x)=0 (x0)圖(略)2.定理:設(X1,X2,X3Xn)為抽自正態總體 XN(,2 )的一個容量為n的簡單隨機樣本,則#=(X-#)2/n-1為相互獨立的隨機變量,且N(, 2 /n)(X-#)2 /2 =(n-1)S2 /2 X2n-1(I=1,2,n)若抽自非正態總體:小樣本 - 無解大樣本 - X2((n-1)S2 /2 二F分布1F分布的密度函數f(x)= (n1+n2)/2/(n1/2)(n2/2) (n1/n2)(n1/n2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論