生物統計學答案_第1頁
生物統計學答案_第2頁
生物統計學答案_第3頁
生物統計學答案_第4頁
生物統計學答案_第5頁
已閱讀5頁,還剩10頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第一章緒論一、名詞解釋1、總體:根據研究目的確定的研究對象的全體稱為總體。2、個體:總體中的一個研究單位稱為個體。3、樣本:總體的一部分稱為樣本。4、樣本含量:樣本中所包含的個體數目稱為樣本含量(容量)或大小。5、隨機樣本:從總體中隨機抽取的樣本稱為隨機樣本,而隨機抽取是指總體中的每一個個體都有同等的機會被抽取組成樣本。6、參數:由總體計算的特征數叫參數。7、統計量:由樣本計算的特征數叫統計量。8、隨機誤差:也叫抽樣誤差,是由于許多無法控制的內在和外在的偶然因素所造成,帶有偶然性質,影響試驗的精確性。9、系統誤差:也叫片面誤差,是由于一些能控制但未加控制的因素造成的,其影響試驗的準確性。10、

2、 準確性:也叫準確度,指在調查或試驗中某一試驗指標或性狀的觀測值與真值接近的程度。11、 精確性:也叫精確度,指調查或試驗研究中同一試驗指標或性狀的重復觀測值彼此接近的程度。二、簡答題1、什么是生物統計?它在畜牧、水產科學研究中有何作用?答:(1)生物統計是數理統計的原理和方法在生物科學研究中的應用,是一門應用數學。(2)生物統計在畜牧、水產科學研究中的作用主要體現在兩個方面:一是提供試驗或調查設計的方法,二是提供整理、分析資料的方法。2、統計分析的兩個特點是什么?答:統計分析的兩個特點是:通過樣本來推斷總體。有很大的可靠性但也有一定的錯誤率。3、如何提高試驗的準確性與精確性?答:在調查或試驗

3、中應嚴格按照調查或試驗計劃進行,準確地進行觀察記載,力求避免認為差錯,特別要注意試驗條件的一致性,即除所研究的各個處理外,供試畜禽的初始條件如品種、性別、年齡、健康狀況、飼養條件、管理措施等盡量控制一致,并通過合理的調查或試驗設計,努力提高試驗的準確性和精確性。4、如何控制、降低隨機誤差,避免系統誤差?答:隨機誤差是由于一些無法控制的偶然因素造成的,難以消除,只能盡量控制和降低;主要是試驗動物的初始條件、飼養條件、管理措施等在試驗中要力求一致,盡量降低差異。系統誤差是由于一些可以控制但未加控制的因素造成的,一般只要試驗工作做得精細是可以消除的。避免系統誤差的主要措施有:盡量保證試驗動物初始條件

4、的一致(年齡、初始重、性別、健康狀況等),盡量控制飼料種類、品質、數量、飼養條件等,測量儀器要準確,標準試劑要校正,要避免觀測、記載、抄錄、計算中的錯誤。第二章資料的整理一、名詞解釋1、數量性狀資料:數量性狀是指能夠以量測或記數的方式表示其特征的象狀,觀察測定數量性狀而獲得的數據稱為數量性狀資料。2、質量性狀資料:質量性狀是指能觀察到而不能直接測量的性狀,觀察質量性狀而獲得的資料稱為質量性狀資料。3、半定量(等級)資料:是指將觀察單位按所考察的性狀或指標的等級順序分組,然后清點各組觀察單位的次數而得到的資料。4、計數資料:指用計數方式獲得的數量性狀資料。5、計量資料:指用量測手段得到的數量性狀

5、資料,即用度、量、衡等計量工具直接測定的數量性狀資料。6、全距(極差):是資料中最大值與最小值之差。7、組中值:分組后每一組的中點值稱為組中值,是該組的代表值。二、簡答題1、資料可以分為哪幾類?它們有何區別與聯系?答:資料一般可以分為數量性狀資料、質量性狀資料、半定量資料三大類,其中數量性狀資料又包括計量資料和計數資料。區別:數量性狀資料是能夠以量測或計數的方式獲得的資料,質量性狀資料是只能觀察而不能直接測量的資料,半定量資料既有計數資料的特點又有程度或量的不同。聯系:三種不同類型的資料有時可根據研究目的和統計方法的要求將一種類型資料轉化成另一種類型的資料。2、為什么要對資料進行整理?對于計量

6、資料,整理的基本步驟怎樣?答:(1)由調查或試驗收集來的原始資料往往是零亂的,無規律可循。只有通過統計整理,才能發現其內部的聯系和規律性,從而揭示事物的本質。資料整理是進行統計分析的基礎。(2)計量資料整理的基本步驟包括:求全距,全距即為資料中最大值與最小值之差。確定組數,一般根據樣本含量及資料的變動范圍大小確定組數。確定組距,通常根據等距離分組的原則,組距等于全距除以組數。確定組限和組中值,各組的最大值為組上限,最小值為組下限;每一組的中點值稱為組中值。歸組劃線計數,作次數分布表。3、在對計量資料進行整理時,為什么第一組的組中值以接近或等于資料中的最小值為好?答:在對計量資料進行整理時,第一

7、組的組中值以接近或等于資料中的最小值可以避免第一組中觀察值過多的情況,同時也確保資料中最小值不會遺漏。4、統計表與統計圖有何用途?常用統計圖有哪些?常用統計表有哪些?列統計表、繪統計圖時,應注意什么?答:(1)統計表用表格形式來表示數量關系;統計圖用幾何圖形來表示數量關系。用統計表和統計圖可以把研究對象的特征、內部構成、相互關系等簡明、形象地表達出來,便于比較分析。(2)常用的統計圖有長條圖、圓圖、線圖、直方圖和折線圖等。(3)常用的統計表有簡單表和復合表兩大類。(4)列統計表的注意事項:標題要簡明扼要、準確地說明表的內容,有時須注明時間、地點。標目分橫標目和縱標目兩項,橫標目列在表的左側,用

8、以表示被說明事物的主要標志;縱標目列在表的上端,說明橫標目各統計指標內容,并注明計算單位。數字一律用阿拉伯數字,數字小數點對齊,小數位數一致,無數字的用“”表示,數字是“0”的須寫“0”。表的上下兩條邊線略粗,縱、橫標目間及合計用細線分開,表的左右邊線可以省去,表的左上角一般不用斜線。(5)繪統計圖的注意事項:標題簡明扼要并列于圖的下方。縱、橫兩軸應有刻度,注明單位。橫軸由左至右,縱軸由上而下,數值由小到大;圖形長寬比例約為5:4或6:5。圖中需用不同顏色或線條表示不同事物時應有圖例說明。第三章平均數、標準差與變異系數一、名詞解釋1、算術平均數:是指資料中各觀測值的總和除以觀測值個數所得的商,

9、簡稱平均數或均數。2、無偏估計:當一個統計量的數學期望等于所估計的總體參數時,則稱此統計量為該總體參數的無偏估計。3、幾何均數:n個觀測值相乘之積開n次方所得的方根稱為幾何均數,記為G。4、中位數:將資料內所有觀測值從小到大依次排列,位于中間的那個觀測值稱為中位數,記為Md。5、眾數:資料中出現次數最多的那個觀測值或次數最多一組的組中值稱為眾數,記為Mo。6、調和平均數:資料中各觀測值倒數的算術平均數的倒數稱為調和平均數,記為H。7、標準差:統計學上把樣本方差S2的平方根叫做樣本標準差,記做S8、方差:統計量2(x-)2/(n-1)稱為均方,又稱樣本方差,記為S2。9、離均差平方和(平方和):

10、各個觀測值與平均數的離差(x-)稱為離均差,各個離均差平方再求和即為離均差平方和,簡稱平方和,記為SS。10、變異系數:標準差與平均數的比值稱為變異系數,是衡量資料中各觀測值變異程度的另一個統計量,記做C.V。二、簡答題1 、生物統計中常用的平均數有幾種?各在什么情況下應用?答:生物統計中常用的平均數有算術平均數、幾何平均數、調和平均數、中位數和眾數。算術平均數較常用,簡稱平均數,當資料呈正態分布時可用算術平均數描述其中心位置。幾何均數主要應用于畜牧、水產業的動態分析,畜禽疾病及藥物效價的統計分析,如畜禽、水產養殖的增長率,抗體的滴度,藥物的效價,畜禽疾病的潛伏期等。調和均數主要用于反映畜群不

11、同階段的平均增長率或畜群不同規模的平均規模。當所獲得的數據資料呈偏態分布時中位數的代表性優于算術平均數。眾數也適用于資料呈偏態分布的情況。2、算術平均數有哪些基本性質?答:算術平均數的兩個基本性質是:離均差之和等于零。離均差平方和最小。3、標準差有哪些特性?答:標準差的特性主要表現在四個方面:標準差的大小受資料中每個觀測值的影響,若觀測值間變異大求得的標準差也大,反之則小。在計算標準差時,在各觀測值加上或減去一個常數,其數值不變。當每個觀測值乘以或除以一個常數a,則所得的標準差是原來標準差的a倍或1/a倍。在資料服從正態分布的條件下,資料中約有68.26%的觀測值在平均數左右1倍標準差(士S)

12、范圍內;約有95.43%的觀測值在平均數左右2倍標準差(±2S)范圍內;約有99.73%的觀測值在平均數左右3倍標準差(±3S庖圍內。4、為什么變異系數要與平均數、標準差配合使用?答:變異系數是標準差與平均數的比值,是衡量資料中各觀測值變異程度的另一個統計量。當進行兩個或多個資料變異程度的比較時,若度量單位與平均數相同,可以直接利用標準差來比較;若單位和(或)平均數不同時,比較其變異程度就不能采用標準差,而要用變異系數。變異系數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。第四章常用概率分布一、名詞解釋1、必然現象:某類現象是可預言其結果的,即在保持條件

13、不變的情況下,重復進行試驗,其結果總是確定的,這類現象稱為必然現象。2、隨機現象:某類現象事前不可預言其結果的,即在保持條件不變的情況下,重復進行試驗,其結果未必相同,這類現象稱為隨機現象。3、隨機試驗:一個試驗若滿足下述三個特性則稱為隨機試驗,簡稱試驗:試驗可以在相同條件下多次重復進行。每次試驗的可能結果不止一個,并且事先知道會有哪些可能的結果。每次試驗總是恰好出現這些可能結果中的一個,但在一次試驗之前卻不能肯定這次試驗會出現哪個結果。4、隨機事件:隨機試驗的每一種可能結果,在一定條件下可能發生,也可能不發生,稱為隨機事件,簡稱事件。5、概率的統計定義:在相同條件下進行n次重復試驗,若隨機事

14、件A發生的次數為m,那么m/n稱為隨機事件A的頻率;當試驗重復數n逐漸增大時,隨機事件A的頻率越來越穩定地接近某一數值P,那么就把P稱為隨機事件A的概率。這樣定義的概率稱為統計概率,也叫后驗概率。6、小概率原理:若隨機事件的概率很小,例如小于0.05、0.01、0.001,稱之為小概率事件;在統計學上,把小概率事件在一次試驗中看成是實際不可能發生的事件稱為小概率事件實際不可能性原理,簡稱小概率原理。7、隨機變量:作一次試驗,其結果有多種可能,每一種可能結果都可以用一個數來表示,把這些數作為變量x的取值范圍,則試驗結果可用隨機變量x來表示。8、離散型隨機變量:如果表示試驗結果的變量x,其可能取值

15、至多為可數個,且以各種確定的概率取這些不同的值,則稱x為離散型隨機變量。9、連續型隨機變量:如果表示試驗結果的變量x,其可能取值為某范圍內的任何數值,且x在其取值范圍內的任一區間中取值時,其概率是確定的,則稱x為連續型隨機變量。9、標準正態分布:科=0,82=1的正態分布稱為標準正態分布。10、標準正態變量(標準正態離差):任何一個服從正態分布N(科,82)的隨機變量x,都可以通過標準化變換:u=(x-)/S,將其變換為服從標準正態分布的隨機變量u,u稱為標準正態變量。11、雙側概率(兩尾概率):隨機變量x落在平均數科加減不同倍數標準差8區間之外的概率稱為雙側概率。12、單側概率(一尾概率):

16、隨即變量x小于科-kS或大于科+kS的概率稱為單側概率。13、貝努利試驗:對于n次獨立的試驗,如果每次試驗結果出現且只出現對立事件A與A之一,在每次試驗中出現A的概率是常數p(014、返置抽樣:由總體隨即抽樣時,每次抽出一個個體后,這個個體還返置回原總體,則稱為返置抽樣。15、 不返置抽樣:由總體隨即抽樣時,每次抽出的個體不返置回原總體,則稱為不返置抽樣。16、 標準誤:即平均數抽樣總體的標準差,其大小反映樣本平均數的抽樣誤差的大小,即精確性的高低。17、 樣本平均數的抽樣總體:樣本平均數也是一個隨機變量,其概率分布叫做樣本平均數的抽樣分布,由樣本平均數構成的總體稱為樣本平均數的抽樣總體。18

17、、中心極限定理:若隨機變量x服從正態分布N(科,82),x1,x2,,xn是由總體得來的隨機樣本,則統計量=Sx/n的概率分布也是正態分布,且有科=W,8=8/n,即服從正態分布N(科,S2/n);若隨機變量服從平均數是科,方差是82的分布(不是正態分布),x1,x2,xn是由總體得來的隨機樣本,則統計量=Sx/n的概率分布,當n相當大時逼近正態分布N(科,S2/n)o二、簡答題1、事件的概率具有那些基本性質?答:事件的概率一般具有以下三個基本性質:對于任何事件A,有0WP(A)<1必然事件的概率為1,即P(Q)=1不可能事件的概率為0,即P()=02、離散型隨機變量概率分布與連續型隨機

18、變量概率分布有何區別?答:離散型隨機變量概率分布常用分布列來表示,其具有PiA0和NPi=1兩個基本性質。連續型隨機變量的概率分布不能用分布列來表示,其可能取的值是不可數的,一般用隨機變量x在某個區間內取值的概率P(awx)3、標準誤與標準差有何聯系與區別?答:樣本標準差與樣本標準誤是既有聯系又有區別的兩個統計量,二者的聯系是:樣本標準誤等于樣本標準差除以根號下樣本含量。二者的區別在于:樣本標準差是反映樣本中各觀測值x1,x2,,xn變異程度大小的一個指標,它的大小說明了對該樣本代表性的強弱。樣本標準誤是樣本平均數1,2,k的標準差,它是抽樣誤差的估計值,其大小說明了樣本間變異程度的大小及精確

19、性的高低。4、樣本平均數抽樣總體與原始總體的兩個參數間有何聯系?答:樣本平均數抽樣總體的平均數等于原始總體的平均數。樣本平均數抽樣總體的標準差等于與原始總體的標準差除以根號下樣本含量。5、 t分布與標準正態分布有何區別與聯系?答:t分布與標準正態分布曲線均以縱軸為對稱軸,左右對稱。與標準正態分布曲線相比t分布曲線頂部略低,兩尾部稍高而平;df越小這種趨勢越明顯。df越大,t分布越趨近于標準正態分布,當n>30時,正態分布相同;n>°°時,t 分布與標準正態分布的區別很小; t 分布與標準正態分布完全一致。n>100 時, t 分布基本與標準第五章t檢驗一、

20、名詞解釋1 、假設檢驗(顯著性檢驗):主要包括提出無效假設和備擇假設,再根據小概率實際不可能性原理來否定或接受無效假設,實際上是應用“概率性質的反證法”對試驗樣本所屬總體所做的無效假設的統計推斷。2、無效假設:是顯著性檢驗中被檢驗的假設,其意義是試驗的表面效應是試驗誤差,處理無效,記作H0。3、備擇假設:顯著性檢驗時在無效假設被否定時準備接受的假設,其意義是試驗的表面效應是處理效應,處理有效,記做HA。4、顯著水平:顯著性檢驗中用來確定否定或接受無效假設的概率標準叫顯著水平,記做a,在生物學研究中常取a=0.05或a=0.01。5、I型錯誤:真實情況是H0成立卻否定了它,犯了“棄真”錯誤,稱為

21、I型錯誤。6、n型錯誤:真實情況是H0不成立卻接受了它,犯了“納偽”錯誤,稱為H型錯誤。7、檢驗功效(檢驗力、把握度):犯n型錯誤的概率用3表示,而1-3稱為檢驗功效,其意義是當兩總體確有差別(即HA成立)時,按a水平能發現它們有差別的能力。8、雙側檢驗(雙尾檢驗):利用兩尾概率進行的檢驗叫雙側檢驗,ta為雙側檢驗的臨界t值。9、單側檢驗(單尾檢驗):利用一尾概率進行的檢驗叫單側檢驗,此時ta為單側檢驗的臨界t值;顯然單側檢驗的ta=雙側檢驗的t2a。10 、非配對設計(成組設計):是指當進行只有兩個處理的試驗時,將試驗單位完全隨機地分成兩組,然后對兩組隨機施加一個處理,兩組的試驗單位相互獨立

22、,所得的兩個樣本相互獨立,其含量不一定相等。11 、配對設計:是指先根據配對的要求將試驗單位兩兩配對,然后將配成對子的兩個試驗單位隨機地分配到兩個處理組中去;配對的要求是配成對子的兩個試驗單位的初始條件盡量一致,不同對子間試驗單位的初始條件允許有差別。12、自身配對:指同一試驗單位在兩個不同時間上分別接受前后兩次處理,用其前后兩次的觀測值進行自身對照比較;或同一試驗單位的不同部位的觀測值或不同方法的觀測值進行自身對照比較。13、同源配對:指將來源相同、性質相同的兩個個體配成一對,如將畜別、品種、窩別、性別、年齡、體重相同的兩個試驗動物配成一對,然后將配對的兩個個體隨機地實施不同處理。14、參數

23、估計:是統計推斷的一個重要內容,就是用樣本統計量來估計總體參數。15、點估計:將樣本統計量直接作為總體相應參數的估計值叫點估計。16、區間估計:在一定概率的保證下指出總體參數的可能范圍叫區間估計。17、置信區間:區間估計時所給出的可能范圍叫置信區間。18、置信度(置信概率):區間估計時給出的概率保證稱為置信度。二、簡答題1、為什么在分析試驗結果時需要進行顯著性檢驗?檢驗的目的是什么?答:通過樣本來推斷總體是生物統計的基本特點,即通過抽樣研究用樣本信息來推斷總體的特征。由一個樣本平均數來估計總體平均數時,樣本平均數包含抽樣誤差,用包含抽樣誤差的樣本平均數來推斷總體,其結論并不是絕對正確的。所以在

24、分析試驗結果時需要進行顯著性檢驗。顯著性檢驗的目的是通過樣本對其所在的總體作出符合實際的推斷,即分析試驗的表面效應是由試驗處理效應還是由試驗誤差引起的,推斷試驗的處理效應是否存在。2、什么是統計假設?統計假設有哪幾種?各有何含義?答:統計假設(統計推斷)是根據樣本和假定模型對總體作出的以概率形式表述的推斷。統計假設主要包括假設檢驗(顯著性檢驗)和參數估計兩個內容。假設檢驗(顯著性檢驗)的含義:提出無效假設和備擇假設,再根據小概率實際不可能性原理來否定或接受無效假設,實際上是應用“概率性質的反證法”對試驗樣本所屬總體所做的無效假設的統計推斷。參數估計的含義:用樣本統計量來估計總體參數。3、顯著性

25、檢驗的基本步驟是什么?根據什么確定顯著水平?答:1、顯著性檢驗的基本步驟:(1)首先對試驗樣本所在的總體作假設。(2)在無效假設成立的前提下,構成合適的統計量,并研究試驗所得統計量的抽樣分布,計算無效假設正確的概率。(3)根據“小概率實際不可能性原理”否定或接受無效假設。2、確定顯著水平的標準通常采用小概率事件的標準,即0.05和0.01。選擇顯著水平應根據試驗的要求或試驗結論的重要性而定。若試驗中難以控制的因素較多,試驗誤差可能較大,則顯著水平標準可選低些,即a值取大些;反之若試驗耗費較大,對精確度的要求較高,不容許反復,或者試驗結論的應用事關重大,則所選顯著水平標準應高些,即a值取小些。4

26、、什么是統計推斷?為什么統計推斷的結論有可能發生錯誤?有哪兩類錯誤?如何降低兩類錯誤?答:(1)統計推斷是根據樣本和假定模型對總體作出以概率形式表述的推斷。(2)統計推斷是根據“小概率實際不可能性原理”來否定或接受無效假設的,所以不論是接受還是否定無效假設都沒有100%的把握,會發生錯誤。(3)在檢驗無效假設H0時可能犯兩種錯誤,其中真實情況是H0成立卻否定了它,犯了“棄真”錯誤,稱為I型錯誤;真實情況是H0不成立卻接受了它,犯了“納偽”錯誤,稱為H型錯誤。(4)犯I型錯誤的概率用a表示,犯H型錯誤的概率用3表示。”即是顯著水平,3的大小與a值的大小有關,所以在選用檢驗的顯著水平時應考慮犯I、

27、n型錯誤所產生后果嚴重性的大小,還應考慮到試驗的難以及試驗結果的重要程度。降低a值可降低犯I型錯誤的概率但會加大犯H型錯誤的概率(在其他因素確定時,a值越小3值越大)。若一個試驗耗費大,可靠性要求高,不允許反復,或試驗結論的使用事關重大,容易產生嚴重后果,a值應取小些;對于一些試驗條件不易控制、試驗誤差較大的試驗a值取大些。同時,在提高顯著水平即減小a值時,為了減小犯H型錯誤的概率可適當增大樣本含量。5、雙側檢驗、單側檢驗各在什么條件下應用?二者有何關系?答:(1)選用雙側檢驗還是單側檢驗應根據專業知識及問題的要求在試驗設計時確定。一般若事先不知道所比較的兩個處理效果誰好誰壞,分析的目的在于推

28、斷兩個處理效果有無差別,則選用雙側檢驗;若根據理論知識或試驗經驗判斷甲處理的效果不會比乙處理的效果差(或相反),分析的目的在于推斷甲處理是否比乙處理好(或差),則用單側檢驗。一般情況下不做特殊說明均用雙側檢驗。(2)二者的關系:單側檢驗的ta=雙側檢驗的12a,可見雙側檢驗顯著單側檢驗一定顯著,單側檢驗顯著雙側檢驗未必顯著。6、進行顯著性檢驗應注意什么問題?如何理解顯著性檢驗結論中的“差異不顯著”、“差異顯著”、“差異極顯著”?答:(1)顯著性檢驗中應注意的問題:為了保證試驗結果的可靠及正確,要有嚴密合理的試驗或抽樣設計,保證各樣本是從相應同質總體中隨機抽取的,并且處理要有可比性,即除比較的處

29、理外,其他影響因素應盡可能控制相同或基本接近。選用的顯著性檢驗方法應符合其應用條件。要正確理解差異顯著或極顯著的統計意義。合理建立統計假設,正確計算檢驗統計量。結論不能絕對化。報告結論時應列出,由樣本算得的檢驗統計量值,注明是單側檢驗還是雙側檢驗,并寫出P值的確切范圍,如0.01(2)顯著性檢驗結論中的“差異不顯著”表示P>0.05,接受H0,否認HA,處理無效,記作“ns”;“差異顯著”表示0.010,接受HA,處理有效,記作“*”;“差異極顯著”表示PW0.01,更加否認H0,接受HA,處理有效,嘉作“*”。7、配對試驗設計與非配對試驗設計有何區別?答:非配對設計(成組設計)是指當進

30、行只有兩個處理的試驗時,將試驗單位完全隨機地分成兩組,然后對兩組隨機施加一個處理,兩組的試驗單位相互獨立,所得的兩個樣本相互獨立,其含量不一定相等。配對設計是指先根據配對的要求將試驗單位兩兩配對,然后將配成對子的兩個試驗單位隨機地分配到兩個處理組中去。非配對設計要求試驗單位盡可能一致,配對設計要求配成對子的兩個試驗單位的初始條件盡量一致,不同對子間試驗單位的初始條件允許有差別。一般說來,相對于非配對設計,配對設計能夠提高試驗的精確性。第六章方差分析一、名詞解釋1、方差分析:是將k個處理的觀測值作為一個整體看待,把觀測值總變異的平方和及自由度分解為相應的不同變異來源的平方和及自由度,進而獲得不同

31、變異來源總體方差估計值;通過計算這些總體方差的估計值的適當比值,檢驗各樣本所屬總體平均數是否相等。2、試驗指標:為衡量試驗結果的好壞或處理效應的高低,在試驗中具體測定的性狀或觀測的項目稱為試驗指標。3、試驗因素:試驗中所研究的影響試驗指標的因素叫試驗因素。4、因素水平:試驗因素所處的某種特定狀態或數量等級稱為因素水平,簡稱水平。5、試驗處理:事先設計好的實施在試驗單位上的具體項目叫試驗處理,簡稱處理。6、試驗單位:在試驗中能接受不同試驗處理的獨立的試驗載體叫試驗單位。7、重復:在試驗中,將一個處理實施在兩個或兩個以上的試驗單位上,稱為處理有重復。8、多重比較:方差分析差異顯著或極顯著時,進行多

32、個平均數兩兩間的相互比較稱為多重比較。9、主效應:由于因素水平的改變而引起的平均數的改變量稱為主效應。10、簡單效應:在某因素同一水平上,另一因素不同水平對試驗指標的影響稱為簡單效應。11、交互作用:在多因素試驗中,一個因素的作用要受到另一個因素的影響,表現為某一因素在另一因素的不同水平上所產生的效應不同,這種現象稱為該兩因素存在交互作用。二、簡答題1、多個處理平均數間的相互比較為什么不宜用t檢驗法?答:主要有三方面的原因:檢驗過程煩瑣。若有k個處理,則要做Ck2次檢驗。無統一的試驗誤差,誤差估計的精確性和檢驗的靈敏性低。推斷的可靠性低,檢驗的I型錯誤率大,主要是由于沒有考慮相互比較的兩個平均

33、數的秩次問題。2、方差分析在科學研究中有何意義?答:t檢驗法適用于樣本平均數與總體平均數及兩個樣本平均數間的差異顯著性檢驗,但在生產和科學研究中經常會遇到比較多個處理優劣的問題,即需要進行多個平均數間的差異顯著性檢驗,而此時采用t檢驗法是不適宜的。而方差分析是將k個處理的觀測值作為一個整體看待,把觀測值總變異的平方和及自由度分解為相應的不同變異來源的平方和及自由度,進而獲得不同變異來源總體方差估計值;通過計算這些總體方差的估計值的適當比值,檢驗各樣本所屬總體平均數是否相等,其實質上關于觀測值變異原因的數量分析,在科學研究中應用十分廣泛。3、方差分析的基本假定是什么?答:方差分析的基本假定(前提

34、)也是單因素方差分析的數學模型,包括效應的可加性、分布的正態性、方差的同質性;一般而言,具有了方差的同質性,同時就具有效應的可加性和分布的正態性。4、進行方差分析的基本步驟為何?答:(1)計算各項平方和與自由度。(2)列出方差分析表,進行F檢驗。(3)若F檢驗顯著,則進行多重比較。5、多個平均數相互比較時,LSD法與一般t檢驗法相比有何優點?還存在什么問題?如何決定選用哪種多重比較法?答:(1)多個平均數相互比較時,LSD法與一般t檢驗法相比的優點:利用F檢驗中的誤差自由度dfe查臨界t“值,利用誤差均方MSe計算均數差異標準誤,解決了t檢驗法檢驗方法中過程煩瑣、無統一的試驗誤差且估計誤差的精

35、確性和檢驗的靈敏性低的問題。(2)存在的問題:未解決推斷的可靠性低、犯I型錯誤的概率變大的問題。(3)常用的多重比較的方法有LSD法、新復極差法和q檢驗法,其檢驗尺度的關系是LSD法w新復極差法wq檢驗法。一般而言,一個試驗資料究竟采用哪一種多重比較方法,主要應根據否定一個正確的H0和接受一個不正確的H0的相對重要性來決定。若否定正確的H0是事關重大或后果嚴重的,或對試驗要求嚴格時,用q檢驗法較為妥當;若接受一個不正確的H0是事關重大或后果嚴重的,則宜用新復極差法;生物試驗中由于試驗誤差較大,常采用新復極差法;為了簡便有時可采用LSD法。6、為什么說兩因素交叉分組單獨觀測值的試驗設計是不完善的

36、試驗設計?在多因素試驗時,如何選取最優水平組合?答:(1)單因素試驗只能解決一個因素各水平之間的比較問題,而科學研究中往往需要同時考察多個因素,這樣才能作出更加符合客觀實際的科學結論,才有更大的應用價值。兩因素試驗資料的方差分析就是對試驗指標同時受到兩個試驗因素作用的試驗資料的方差分析。兩因素交叉分組單獨觀測值的試驗設計只適用于兩個因素間無交互作用的情況;若兩因素間有交互作用,則每個水平組合只設一個試驗單位的試驗設計是不正確的或不完善的。(2)以兩因素為例說明在多因素試驗時選取最優水平組合的原則:若A、B因素交互作用不顯著,則可從A、B因素主效應檢驗中分別選出A、B因素的最優水平相組合,得到最

37、優水平組合;若A、B因素交互作用顯著,則應進行水平組合平均數間的多重比較,以選出最優水平組合,同時可進行簡單效應的檢驗。7、兩因素系統分組資料的方差分析與交叉分組資料的方差分析有何區別?答:(1)兩因素交叉分組:設試驗考察因素A、B兩個因素,A因素分a個水平,B因素分b個水平,A因素每個水平與B因素每個水平都要碰到,兩者交叉搭配形成ab個水平組合即處理,試驗因素A、B在試驗中處于平等地位,試驗單位分成ab個組,每組隨機接受一種處理,因而試驗數據也按兩因素兩方向分組。(2)兩因素系統分組:在安排兩因素試驗方案時,將A因素分為a個水平,在A因素每個水平Ai下又將B因素分成b個水平,這樣得到兩因素水

38、平組合的方式稱為系統分組。在系統分組中,首先劃分水平的因素叫一級因素,其次劃分水平的因素叫二級因素,類此還有三級因素等;在系統分組中,次級因素的各水平套在一級因素的每個水平下,它們之間是從屬關系而不是平等關系,分析側重于一級因素第七章次數資料分析卡方檢驗一、名詞解釋1、c2的連續性矯正:由c2值計算公式計算的c2只是近似地服從連續型隨機變量c2分布,在對次數資料進行c2檢驗利用連續型隨機變量c2分布計算概率時,常常偏低,特別是當自由度為1時偏差較大,此時需要將c2值矯正為較小的c2C值,稱為c2的連續性矯正。2、適合性檢驗:判斷實際觀察的屬性類別分配是否符合已知屬性類別分配理論或學說的假設檢驗

39、稱為適合性檢驗。3、 c2檢驗的再分割法:當c2檢驗為差異顯著或差異極顯著時,有必要進一步檢驗確定哪樣表現型的實際觀察次數與理論次數不符合,此時采用c2檢驗的再分割法;將一張列聯表的總c2統計量,分割為數目等于該表總自由度的多個分量,每個分量的c2值對應于由原始數據所產生的一特殊列聯表,且每個分量獨立于其他分量,這樣各分量的c2值之和等于總c2值。4、獨立性檢驗:根據次數資料判斷兩類因子彼此相關或相互獨立的假設檢驗稱為獨立性檢驗。二、簡答題1 、c2檢驗與t檢驗、F檢驗在應用上有什么區別?答:t檢驗、F檢驗是計量資料的統計分析方法,c2是對次數資料和等級資料進行統計分析的方法。2、適合性檢驗和

40、獨立性檢驗有何區別?答:(1)研究目的不同。(2)獨立性檢驗的次數資料是按兩因子屬性類別進行歸組,而適合性檢驗只按某一因子的屬性類別將次數資料歸組。(3)適合性檢驗按已知的屬性分類理論或學說計算理論次數,獨立性檢驗在計算理論次數時沒有現成的理論或學說可資利用,理論次數是在兩因子相互獨立的假設下進行計算。(4)在適合性檢驗中確定自由度時df=k-1(k為屬性類別數),獨立性檢驗中確定自由度是df=(r-1)(c-1),其中r為橫行屬性類別數,c為直列屬性類別數。3、什么情況下c2檢驗需作矯正?如何矯正?什么情況下先將各組合并后再作檢驗?答:(1)由c2值計算公式計算的只是近似地服從連續型隨機變量

41、c2分布,在對次數資料進行c2檢驗利用連續型隨機變量c2分布計算概率時,c2常常偏低,特別是當自由度為時偏差較大,此時需要將c2值矯正。(2)用矯正公式將c2矯正為較小的c2C,矯正公式為c2c=2(IA-TI-0.5)2/T(3)主要是在用適合性檢驗來判斷實際觀測得來的資料是否服從某種理論分布(正態分布、二項分布、泊松分布)時,當組段內理論次數小于5時,必須與相鄰組段進行合并,直至合并的理論次數大于5時為止。4、在什么情況下需應用c2檢驗的再分割法?如何對總c2值進行分割?答:當c2檢驗為差異顯著或差異極顯著時,有必要進一步檢驗確定哪樣表現型的實際觀察次數與理論次數不符合,此時采用c2檢驗的

42、再分割法。再分割的方法:將一張列聯表的總c2統計量,分割為數目等于該表總自由度的多個分量,每個分量的c2值對應于由原始數據所產生的一特殊列聯表,且每個分量獨立于其他分量,這樣各分量的c2值之和等于總c2值。第八章直線回歸與相關一、名詞解釋1、相關變量:變量間的關系不存在完全的確定性關系,但都存在十分密切的關系,統計中把這些變量間的關系稱為相關關系,把存在相關關系的變量稱為相關變量。2、回歸分析:相關變量間為因果關系,即一個變量的變化受另一或幾個變量的影響,研究呈因果關系的相關變量間的關系稱回歸分析。3、一元回歸分析:回歸分析中表示原因的變量稱為自變量,表示結果的變量稱為依變量,一個自變量與一個

43、依變量的回歸分析稱為一元回歸分析。4、多元回歸分析:回歸分析中表示原因的變量稱為自變量,表示結果的變量稱為依變量,多個自變量與一個依變量間回歸分析稱為多元回歸分析。5、相關分析:研究呈平行關系的相關變量之間的關系稱為相關分析。6、簡單相關分析(直線相關分析):對兩個變量間的直線關系進行相關分析稱為簡單相關分析。7、復相關分析:對多個變量進行相關分析時,研究一個變量與多個變量間的線性相關稱為復相關分析。8、偏相關分析:研究其余變量保持不變的情況下兩個變量間的線性相關稱為偏相關分析。9、樣本回歸系數:建立直線回歸方程=a+bx,其中b叫樣本回歸系數,表示x改變一個單位y平均改變的數量;b的符號反映

44、了x影響y的性質,b的絕對值大小反映了x影響y的程度。10、樣本回歸截距:建立直線回歸方程=a+bx,其中a叫做樣本回歸截距,是回歸直線與y軸交點的縱坐標。11、離回歸標準誤:根據使偏差平方和2(y-)2最小建立直線回歸方程,偏差平方和2(y-)2的大小表示了實測點與回歸直線偏離的程度,又稱為離回歸平方和,離回歸平方和的平方根叫離回歸標準誤。12、決定系數:比值2(-y)2/2(y-y)2叫做x對y的決定系數,記做r2,決定系數的大小表示了回歸方程估測可靠程度的高低,即表示了回歸直線擬合度的高低。13、相關系數:決定系數r2的平方根稱為x與y的相關系數,記為r,表示了y與x的直線相關的程度與性

45、質。二、簡答題1、回歸截距、回歸系數與回歸估計值的統計意義是什么?答:建立直線回歸方程=a+bx,其中a叫做樣本回歸截距,是回歸直線與y軸交點的縱坐標,當x=0時=a;b叫樣本回歸系數,表示x改變一個單位y平均改變的數量;b的符號反映了x影響y的性質,b的絕對值大小反映了x影響y的程度;回歸估計值,是當x在其研究范圍內取某一個值時,y值平均數取a+3x估計值。2、決定系數、相關系數的意義是什么?如何計算?答:(1)決定系數的大小表示了回歸方程估測可靠程度的高低,即表示了回歸直線擬合度的高低,記作r2,r2=2(-y)2/2(y-y)2。(2)相關系數表示了y與x的直線相關的程度與性質,記為r,

46、r的計算方法是決定系數r2的平方根。3、直線相關系數與回歸系數的關系如何?直線相關系數與配合回歸直線有何關系?答:(1)直線相關系數與回歸系數的關系可以表示為b=rx(sy/sx)或r=bx(sx/sy)。(2)直線相關分析不區分自變量與依變量,側重于揭示它們之間的聯系程度和性質,即計算出相關系數;進行顯著性檢驗時,相關系數顯著則回歸系數也顯著,相關系數不顯著則回歸系數必然不顯著。利用查表法對相關系數進行檢驗十分簡便,在實際進行直線回歸分析時,可用相關系數顯著性檢驗代替直線回歸關系顯著性檢驗;即可先計算出相關系數r并對其進行顯著性檢驗,若檢驗結果r不顯著,則不用再建立直線回歸方程;若r顯著,在

47、計算回歸系數b、回歸截距a,建立直線回歸方程,此時所建立的直線回歸方程代表的直線關系是真實的,可用來進行預測和控制。第九章多元線性回歸與多項式回歸*一、名詞解釋:多元回歸分析、多元線性回歸分析、偏回歸系數、復相關系數、最優多元線性回歸方程、標準偏回歸系數(通徑系數)、簡答題1、如何建立多元線性回歸方程?偏回歸系數有何意義?2、多元線性回歸的顯著性檢驗包含哪些內容?如何進行?3、在多元線性回歸分析中,如何剔除不顯著的自變量?怎樣重新建立多元線性回歸方程?第十章非參數檢驗一、名詞解釋1、非參數檢驗:是一種與總體分布狀況無關的檢驗方法,它不依賴于總體分布的形式,應用時可以不考慮被研究的對象為何種分布

48、以及分布是否已知;主要是利用樣本數據之間的大小比較及大小順序,對兩個或多個樣本所屬總體是否相同進行檢驗,而不是對總體分布的參數如平均數、標準差等進行統計推斷。2、符號檢驗:是根據樣本各對數據之差的正負符號多少來檢驗兩個總體分布位置的異同,而不去考慮差值的大小;每對數據之差為正值用“+”表示,負值用“-”表示,若兩個總體分布位置相同,則正或負出現的次數應該相等;若不完全相等,至少不應相差過大;超過一定的臨界值就認為兩個樣本所來自的來年各個總體差異顯著,分布的位置不同。3、秩和檢驗(符號秩和檢驗):是一種改進的符號檢驗,其統計效率遠較符號檢驗高,;除了比較各對數據差值的符號外,還要比較各對數據差值

49、大小的秩次高低;將觀測值按由大到小的次序排列,編定秩次,求出秩和進行假設檢驗。4、等級相關分析:是常用的分析兩個變量間是否相關的非參數法,分析x、y兩個變量的等級間是否相關;先按x、y兩變量的大小次序,分別由于小到大編上等級(秩次),再看兩個變量的等級間是否相關。5、等級相關系數:也稱為秩相關系數,樣本等級相關系數記為rs,具有與相關系數r相同的特性,值介于-1和1之間,表示兩個變量等級間相關的性質和程度。二、簡答題1、參數檢驗與非參數檢驗有何區別?各有什么優缺點?答:(1)參數檢驗要求總體服從一定的分布(如t檢驗和F檢驗都要求總體服從正態分布),對總體參數的檢驗是建立在這種分布基礎上的,以推

50、斷兩個或多個總體平均數是否相等。非參數檢驗是一種與總體分布狀況無關的檢驗方法,它不依賴于總體分布的形式,應用時可以不考慮被研究的對象為何種分布以及分布是否已知;主要是利用樣本數據之間的大小比較及大小順序,對兩個或多個樣本所屬總體是否相同進行檢驗,而不是對總體分布的參數如平均數、標準差等進行統計推斷。當樣本所屬總體分布無法肯定或明顯偏態分布時常用非參數檢驗。(2)參數檢驗的優點是充分利用樣本內所有的數量信息,檢驗的效率高于非參數檢驗。非參數檢驗的優點是計算簡便、直觀、易于掌握及檢驗速度較快。, 而同一組的相同2、 為什么在秩和檢驗編秩次時不同組間出現相同數據要給予數據不必計算“平均秩次”?3、兩

51、樣本比較的秩和檢驗的檢驗假設是否可用表示?為什么?第十一章試驗設計一、名詞解釋1 、試驗設計:試驗設計狹義的理解是指試驗單位(如動物試驗的畜、禽)的選取、重復數目的確定及試驗單位的分組,生物統計中的試驗設計主要是指狹義的試驗設計。2、試驗方案:是指根據試驗目的與要求而擬定的進行比較的一組試驗處理的總稱,是整個試驗工作的核心部分。3、完全方案:是多因素試驗方案中的一種,在列出因素水平組合(即處理)時,要求每一個因素的水平都要碰見一次,這時,水平組合數等于各個因素水平數的乘積。4、不完全方案:也是多因素試驗方案的一種,是將試驗因素的某些水平組合在一起形成少數幾個水平組合,其目的在于探討試驗因素中某些水平組合的綜合作用,而不在于考察試驗因素對試驗指標的影響和交互作用;這種在全部水平中挑選部分水平組合獲得的方案稱為不完全方案。5、唯一差異原則:是指在進行處理間比較時,除了試驗處理不同外,其他所有條件應當盡量一致或相同,使其具有可比性,使處理間的比較結果可靠。6、局部控制:是指在試驗時采取一定的技術措施或方法來控制或降低非試驗因素

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論