




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、h教育統計學總復習一、問答題1什么是描述統計和推斷統計?描述統計:用來描述或概括獲得數據的基本情況,顯示其基本特征。 推斷統計:根據樣本數據提供的信息,運用概率理論進行分析論證,在一定可靠程度上推斷總體的有關特征。2為什么要使用抽樣推斷,而不用全體研究原因:3樣本容量的大小對統計研究有何影響?影響:4變量有哪些種類,各有什么特點,能否相互轉換?5數值變量就是連續變量嗎?為什么6頻數分布的作用是什么7什么是集中量數,哪些屬于集中量數?集中量數是代表一組數據的典型水平或集中趨勢的量;常用的集中量數有平均數、中位數和眾數8什么是差異量數,哪些屬于差異量數?差異量數是指表示一組數據彼此間的變異程度或離
2、散程度的統計量,又稱為離中趨勢。9平均數和標準差有哪些特點 平均數使用廣泛,簡單易懂,能反映一組數據資料的集中趨勢,包括算數平均數、加權平均數、幾何平均數和調和平均數;標準差是方差的平方根,標準差的單位和原始數據的單位一致,且對極值得敏感程度較低,標準差的值越小,說明數據離散程度越小,數據月整齊和集中,反之就情況相反。10差異系數的概念與應用差異系數(coefficient of variation),也稱變差系數、離散系數、變異系數,用CV表示。它是一組數據的標準差與其算數平均均數的百分比,是測算數據離散程度的相對指標。計算公式為:CV=標準差÷算術平均數·100%11什
3、么是百分等級,有哪些應用一個測驗分數的百分等級是指在常模樣本中低于這個分數的人數百分比。因此,85的百分等級表示在常模樣本中有85%的人比這個分數要低。換句話說,百分等級指出的是個體在常模團體中所處的位置,百分等級越低,個體所處的位置越低。運算公式為:PR=100-(100R-50)/N|,其中R是原始分數排列順序數,N是指總人數(樣本的總人數)。例如小東在30名同學中語文成績是80分,排列第5名,則其百分等級為:PR=100-(100*5-50)/30=85,百分等級為85即指,在100名被試中,語文成績低于小東的80分的有85人12什么是標準分數,有哪些應用對于來自不同均值的和標準差的總體
4、的個體數據,往往不能直接對比,需要將其化為統一規格、尺度的數據后再比較。即標準分數。標準分數= (X - 均值)| 標準差。運用:a用于比較不同對象相同科目成績在整體中所處的位置,b用于比較不同對象幾個科目的綜合成績在整體中的位置13如何理解兩個變量的相關關系,相關關系是與函數關系嗎?兩個變量的相關關系是指兩個變量之間的不精確、不穩定的變化關系;函數關系刻畫了事物之間的嚴格的依存關系,當自變量發生變化時,因變量也是隨之發生確定性的、可在數量上準確預測的變化,即是一種一一對應的關系。14什么是正相關與負相關正相關:兩個變量之間的得變化方向一致,一個變量變大,另一個變量也隨之變大,一個變量變小,另
5、一個變量也隨之變小。 負相關:兩個變量的變化方向相反,一個變量變大,另一個變量隨之變小,一個變量變小,另一個變量隨之變大。15相關分析的方法有哪些方法有:積差相關系數、等級相關系數、質量相關系數、四分相關系數。16積差相關的條件是什么條件是:1兩列數據都是等距連續變量的觀察數據或是等比的測量數據;2都來自于正態分布的數據整體;3兩列數據必須具備一一對應的關系。17等級相關的條件是什么條件是:兩列具有等級順序的測量數據,或總體為非正態分布的等距、等比數據。18·什么是二列相關和點二列相關兩個變量都是來自于正態總體的等距或等比變量,而且其中一個被認為的劃分為兩個類別,成為二分變量。當兩變
6、量都是正態連續變量,其中一個變量被人為地劃分成二分變量,表示這兩個變量之間的相關,稱為二列相關;點二列相關是指兩個變量中的一個是來自正態總體的等距或等比數據,另一個是二分稱名變量,即按事物的某一性質只能分為相互獨立的兩類變量,譬如男與女,生與死等等。19解釋相關系數時要注意什么1、相關系數常以小數表示。 2、正值表示正相關,負值表示負相關。 3、注意:完全正相關,完全負相關,零相關。 4、判定相關是否密切時,考慮計算相關系數時樣本量的大小相關系數表明兩個變量之間的關系密切程度,比較相關系數時,不能用倍數關系說明。相關系數的大小表明了兩列測量數據相互間的相關程度;絕對值相同的正負相關系數值表示的
7、相關關系程度一樣,方向不同。當兩個變量間的關系受其他變量影響時,兩者之間可出現偽相關,這時兩列變量之間的相關系數沒有任何實際意義。相關關系不是因果關系,相關值較大的兩類事物之間,不一定存在因果關系。20·什么是回歸分析,回歸方程有什么意義回歸分析(regression analysis)是確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法;回歸方程的意義:x和y之間本來沒有嚴格的關系,也不是對群體中任一個體都適用,而是用一個簡練的形式總括了x,y之間的復雜關系的大趨勢,使我們能從量的角度認識兩個變量之間的依存關系。21·簡述相關分析和回歸分析的區別和聯系1、在回歸
8、分析中,y被稱為因變量,處在被解釋的特殊地位,而在相關分析中,x與y處于平等的地位,即研究x與y的密切程度和研究y與x的密切程度是一致的; 2、相關分析中,x與y都是隨機變量,而在回歸分析中,y是隨機變量,x可以是隨機變量,也可以是非隨機的,通常在回歸模型中,總是假定x是非隨機的; 3、相關分析的研究主要是兩個變量之間的密切程度,而回歸分析不僅可以揭示x對y的影響大小,還可以由回歸方程進行數量上的預測和控制。22·統計推斷的基本問題是什么統計推斷:通過選取適當的樣本作為總體的代表,去推斷總體的統計特征;樣本要對總體有良好的代表性,關鍵是找到樣本和總體的特定關系,并用數學語言表達出來,
9、也就是建立數學模型。23·什么是隨機事件與概率隨機試驗的每一種結果或隨機現象的每一種表現稱為隨機事件;隨機事件發生可能性的大小稱為概率。24·概率分布有什么意義25·什么是正態分布,正態分布曲線有什么特點正態分布(Normal distribution)是一種概率分布。正態分布是具有兩個參數x和2的連續型隨機變量的分布,第一參數是遵從正態分布的隨機變量的均值,第二個參數2是此隨機變量的方差,所以正態分布記作N(,2 )。遵從正態分布的隨機變量的概率規律為取 鄰近的值的概率大 ,而取離越遠的值的概率越小;越小,分布越集中在附近,越大,分布越分散。特點:x均值,x標準
10、差。 正態分布概率密度曲線f(x)特點: 1, 以x為對稱,曲線與X軸間的面積在x兩邊各為05, 2, 曲線在x±x處有拐點, 3, 在x±x區間的面積為6826,在x±2x區間的面積為9544,在x±3x區間的面積為9973。26什么是點估計和區間估計點估計也稱定值估計,它是以抽樣得到的樣本指標作為總體指標的估計量,并以樣本指標的實際值直接作為總體未知參數的估計值的一種推斷方法。(2)區間估計也是參數估計的一種形式。通過從總體中抽取的樣本,根據一定的正確度與精確度的要求,構造出適當的區間,以作為總體的分布參數(或參數的函數)的真值所在范圍的估計。前者得
11、出的是一個具體的值,后者是一個區間。 聯系:都是統計學中常用的參數估計方法。27簡述什么是抽樣分布抽樣分布:從已知的總體中以一定的樣本容量進行隨機抽樣,由樣本的統計數所對應的概率分布稱為抽樣分布。抽樣分布是統計推斷的理論基礎。(如果從容量為N的有限總體抽樣,若每次抽取容量為n的樣本,那么一共可以得到N取n的組合個樣本(所有可能的樣本個數)。抽樣所得到的每一個樣本可以計算一個平均數,全部可能的樣本都被抽取后可以得到許多平均數。如果將抽樣所得到的所有可能的樣本平均數集合起來便構成一個新的總體,平均數就成為這個新總體的變量。由平均數構成的新總體的分布,稱為平均數的抽樣分布。隨機樣本的任何一種統計數都
12、可以是一個變量,這種變量的分布稱為統計數的抽樣分布。)28·中心極限定理的主要內容是什么?設從均值為、方差為2;(有限)的任意一個總體中抽取樣本量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為、方差為2/n 的正態分布。設隨機變量序列X1,X2,、Xn,、相互獨立,均具有相同的數學期望與方差,且E(Xi)= Ui,D(Xi)=Ri2>0,i=1,2,、,令:Yn=X1+X2+、+XnZn=Yn-E(Yn)/D(Yn)=(Xi-Ui)/Ri2 (i=1,2、n)則稱隨機變量Zn為隨機變量序列X1,X2,、,Xn的規范和。29·標準誤及其意義標準誤(英文:St
13、andard Error)衡量對應樣本統計量抽樣誤差大小的尺度。標準誤用來衡量抽樣誤差。標準誤越小,表明樣本統計量與總體參數的值越接近,樣本對總體越有代表性,用樣本統計量推斷總體參數的可靠度越大。因此,標準誤是統計推斷可靠性的指標。此外,還需要特別指出的是,標準誤還可以指樣本標準差、方差等統計量的標準差,不僅僅只是樣本均數的標準差。30·假設檢驗的思想與步驟假設檢驗的基本思想是小概率反證法思想。基本依據是“小概率原理”. 所謂小概率原理就是:概率很小的隨機事件在一次試驗中一般不會發生. 根據這一原理,我們從H0 出發,在一定的顯著性水平下,從總體中抽取一個子樣進行檢驗,在H0 成立的
14、條件下,若發現“相應統計量(即隨機變量) 取到此子樣代入統計量后的值”是一個小概率事件,亦即小概率事件在一次試驗中發生了,這與“小概率原理”矛盾,所以,此時就拒絕H0 并接受H1 ;反之,就只有被迫接受H0 . 假設檢驗的一般步驟 1) 根據實際問題提出原假設H0與備選假設H1,即說明需要檢驗的假設的具體內容; 2) 選擇適當的檢驗統計量,并在原假設H0成立的條件下確定該統計量的分布及原H0的拒絕域的形式; 3) 按問題的具體要求,選取適當的顯著性水平,并根據統計量的分布查表,確定對應于的臨界值,求出H0的拒絕域;31·什么是原假設和備擇假設原假設就是關于樣本所代表的總體參數(如平均
15、數、方差、相關系數等)與假設總體參數(如平均數、方差、相關系數等)之間無差異的假設,或者兩個以及多個樣本所代表的總體參數之間的無差異假設。 備擇假設是關于樣本所代表的總體參數與假設總體參數之間存在差異的假設,或者兩個以及多個樣本所代表的總體參數之間存在差異假設。32·簡述假設檢驗中零假設和研究假設的作用研究者可以根據數據分析、經驗判斷或經過周密思考后確定零假設,研究者依據樣本信息的計算直接證明零假設是否正確;如果研究者拒絕了零假設,那么就必須用研究假設,并推定研究假設的真實性,然后做出拒絕零假設接受研究假設的統計決策。什么是小概率原理與顯著性水平小概率事件:概率很小的事件在一次試驗中
16、幾乎不可能發生 顯著性水平:假設檢驗運用了小概率原理,事先確定的作為判斷的界限,即允許的小概率的標準,稱為顯著性水平。如果根據命題的原假設所計算出來的概率小于這個標準,就拒絕原假設;大于這個標準則接受原假設。這樣顯著性水平把概率分布分為兩個區間:拒絕區間,接受區間。(通常假設檢驗時只考慮到了第一類錯誤,而忽視掉了第二類錯誤,所以將此時的假設檢驗稱為顯著性檢驗)33單側檢驗和雙側檢驗有什么不同根據是否強調檢驗的方向性,將檢驗分為單側檢驗和雙側檢驗。雙側檢驗只關心兩個總體參數之間是否有差異,而不關心誰大誰小;單側檢驗則強調差異的方向性,即關心研究對象是高于還是低于某一總體水
17、平。在實際操作中要根據研究的目的和假設來選擇單側檢驗還是雙側檢驗,如果假設中有一參數和另一參數方向性的比較,比如"大于"、"好于"、"差于"等,一般選擇單側檢驗。如果只是檢驗兩參數之間是否有差異,就選擇雙側檢驗。雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。雙總體t檢驗又分為兩種情況,一是獨立樣本t檢驗,一是配對樣本t檢驗。34.統計假設檢驗的判斷法則是什么35.單總體、雙總體平均數檢驗的假設是什么單總體檢驗:檢驗一個樣本平均數與它的總體平均數之間差異的顯著性程度 雙總體檢驗:根據兩個平均數之差檢驗與之對應的兩個
18、總體平均數之間差異的顯著性程度。假設是:兩個樣本對應的總體平均數之間沒有差異的虛無假設36.方差齊性檢驗的作用是什么方差齊性檢驗是對控制變量不同水平下各觀測變量總體方差是否相等進行檢驗,是方差分析的重要前提,是方差可加性原則應用的一個條件。 方差齊性檢驗是對兩樣本方差是否相同進行的檢驗。 方差齊性檢驗和兩樣本平均數的差異性檢驗在假設檢驗的基本思想上是沒有什么差異性的。只是所選擇的抽樣分布不一樣。方差齊性檢驗所選擇的抽樣分布為F分布38.對平均數進行差異顯著性檢驗時,需要考慮的因素有哪些?在考慮總體分布和總體方差的基礎上,還要分析兩個總體方差是否已一致,、兩個樣本是否相關以及兩個樣本容量是否相同
19、等一系列條件。39.簡單敘述T檢驗的條件。t檢驗的適用條件(1) 已知一個總體均數;(2) 可得到一個樣本均數及該樣本標準差;(3) 樣本來自正態或近似正態總體。40.統計假設檢驗中的兩類錯誤是什么?在進行假設檢驗時提出原假設和備擇假設,原假設實際上是正確的,但我們做出的決定是拒絕原假設,此類錯誤稱為第一類錯誤。原假設實際上是不正確的,但是我們卻做出了接受原假設的決定,此類錯誤稱為第二類錯誤。第一類錯誤(類錯誤)也稱為 錯誤,是指當虛無假設(H0)正確時,而拒絕H0所犯的錯誤。這意味著研究者的結論并不正確,即觀察到了實際上并不存在的處理效應。可能產生原因:1、樣本中極端數值。2、采用決策標準較
20、寬松。第二類錯誤(類錯誤)也稱為錯誤,是指虛無假設錯誤時,反而接受虛無假設的情況,即沒有觀察到存在的處理效應。可能產生的原因:1、實驗設計不靈敏。2、樣本數據變異性過大。3、處理效應本身比較小。41.方差分析的基本思想和作用是什么方差分析的基本思想是根據研究目的和設計類型,將總變異中的離均差平方和SS及其自由度分別分解成相應的若干部分,然后求各相應部分的變異;再用各部分的變異與組內(或誤差)變異進行比較,得出統計量F值;最后根據F值的大小確定P值,作出統計推斷。方差分析的目的是通過數據分析找出對該事物有顯著影響的因素,各因素之間的交互作用,以及顯著影響因素的最佳水平等。方差分析是在可比較的數組
21、中,把數據間的總的“變差”按各指定的變差來源進行分解的一種技術。對變差的度量,采用離差平方和。方差分析方法就是從總離差平方和分解出可追溯到指定來源的部分離差平方和,這是一個很重要的思想。經過方差分析若拒絕了檢驗假設,只能說明多個樣本總體均值不相等或不全相等。若要得到各組均值間更詳細的信息,應在方差分析的基礎上進行多個樣本均值的兩兩比較。 多個樣本均值間兩兩比較:多個樣本均值間兩兩比較常用q檢驗的方法,即Newman-kueuls法,其基本步驟為:建立檢驗假設->樣本均值排序->計算q值->查q界值表判斷結果。 多個實驗組與一個對照組均值間兩兩比較:多個實驗組與一個對照組均值間
22、兩兩比較,若目的是減小第II類錯誤,最好選用最小顯著差法(LSD法);若目的是減小第I類錯誤,最好選用新復極差法,前者查t界值表,后者查q'界值表。42.簡述方差分析的過程(1)提出假設(2)計算平方和(3)計算自由度(4)計算均方(5)計算F值并作統計決斷(6)列出方差分析表43.試比較方差分析與回歸分析的異同方差分析和回歸分析總體上都屬于一個類別,一般線性模型(general linear model,GLM)。 從資料類型來看,方差分析的因變量是連續型資料,自變量是分類變量,一般都以組別的形式出現。 回歸分析的因變量是連續型資料,自變量既可以是分類資料,也可以是連續型資料,也可以
23、兩種資料都有。 從目的來看,大多數方差分析的目的都是比較組間差異,比如3組人群的身高是都有差異等。而回歸分析主要是看自變量對因變量的影響,或因變量是否隨著自變量的變化而變化,如血壓是否隨年齡而變化等。44.²檢驗的概念和思想是什么卡方檢驗的統計量是卡方值。卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬于非參數檢驗的范疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。其根本思想就是在于比較理論頻數和實際頻數的吻合程度或擬合優度問題卡方檢驗是以2分布為基礎的一種常用假設檢驗方法,它的無效假設H0是:觀察頻數與期望頻數沒有差別。該檢驗的基本思想是:首先假設H
24、0成立,基于此前提計算出2值,它表示觀察值與理論值之間的偏離程度。根據2分布及自由度可以確定在H0假設成立的情況下獲得當前統計量及更極端情況的概率P。如果P值很小,說明觀察值與理論值偏離程度太大,應當拒絕無效假設,表示比較資料之間有顯著差異;否則就不能拒絕無效假設,尚不能認為樣本所代表的實際情況和理論假設有差別45.什么是適合性檢驗,其原假設是什么適合性檢驗:就是檢驗某個類別變量的實際數據分布是否與某種理論分布相吻合 。原假設:Ho:Fo=Fe 或者“該類別變量的數據分布與理論假設相同”46.什么是獨立性檢驗,其原假設是什么獨立性檢驗:統計學的一種檢驗方式。與適合性檢驗同屬于X2檢驗,它是根據
25、次數資料判斷兩類因子彼此相關或相互獨立的假設檢驗 原假設:兩個變量之間彼此獨立而互不相關聯47.各種假設檢驗情況下拒絕原假設的依據是什么?(統計量落入的區間是什么?如雙總體Z檢驗時,拒絕H0的條件是:| Z | > Z =1.96)某同學語文考了90分,數學考了80分,他的語文比數學考得好一些,這句話對嗎?如果已知兩考生的各科高考成績,要客觀判斷兩名考生的高考成績哪一個更好,可以采用什么方法?某研究者欲研究學習動機和學習成績之間的關系,用動機量表測得學生的學習動機,再用標準化考試測得學業成績,兩組數據均可視為連續變量的數據,問應當用什么方法?為研究職業類型(工人、農民、教師、公務員、商人
26、)對生活滿意度(滿意、不滿意)是否有影響,應選用什么樣的統計方法?某校長根據自己的經驗預測今年高考全區的平均分為530分,全區隨機抽取100名畢業生高考平均成績為520分,標準差42。問該校長的預測是否準確?某研究者想考查教師教學效能感和教師教學效果之間的數量關系,分別用量表測得兩組數據均可視為連續正態數據。從某地區的六歲兒童中隨機抽取男童30人,測量身高,平均數為114cm,標準差為5cm,抽取女童27人,平均身高為112.5cm,標準差為6.5cm,問該地區六歲男女兒童身高是否有顯著差異?16名小學生隨機分成4組,每組被試分別解決加、減、乘、除,各10道算術問題,記錄下平均解題時間,問應當
27、用什么方法分析小學生解決這四類算術問題的解題時間有否顯著差異。要研究高校教師的職稱是否影響學生評教的分數,可能用到什么統計方法,說明理由。二、計算題1某校規定教師的教學效果評定由三方面的成績組成,學生評分占0.3,同行評分占0.4,領導及專家評分占0.3。某位老師的三種分數分別為94分,72分和79分,求該教師的總平均分數。2. 有100名學生是從全地區中隨機抽選出來的, 他們在一次英語水平測試中平均得分73分, 標準差8分, 求全區平均分數99的置信區間。3.下表是甲、乙兩個學生三門學科的成績及該班的平均成績和標準差。問甲、乙兩生誰考得更好? 考試科目甲乙班平均成績班標準差物理5373654化學7870746數學82707112總和2132134某中學二年級學生中隨機抽取15人,學期初與學期末測試他們的某項能力,取得的成績見下表。試用等級
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 英語就業協議書
- 考學輔導協議書
- 配合工作協議書
- 村集體學校收購協議書
- 小紅書開店合作協議書
- 退伙結算協議書
- 維護代理協議書
- 幼兒園長期服藥協議書
- 股東租車協議書
- 工程款劃分合同協議書
- 杭州市2025年中考作文《勇敢自信》寫作策略與范文
- 起重機司機(限橋式)Q2特種設備作業人員資格鑒定參考試題(附答案)
- 熱點主題作文寫作指導:古樸與時尚(審題指導與例文)
- 河南省洛陽市2025屆九年級下學期中考一模英語試卷(原卷)
- 成都設計咨詢集團有限公司2025年社會公開招聘(19人)筆試參考題庫附帶答案詳解
- 2025年上海市金融穩定發展研究中心招聘考試模擬測試
- 河北開放大學2025年《醫用基礎化學#》形考任務4答案
- 江蘇南京茉莉環境投資有限公司招聘筆試題庫2025
- 針刺傷預防與處理(中華護理學會團體標準)
- 光伏組件項目合作計劃書(范文)
- 常用扣型總結
評論
0/150
提交評論