第二章試驗的_第1頁
第二章試驗的_第2頁
第二章試驗的_第3頁
第二章試驗的_第4頁
第二章試驗的_第5頁
已閱讀5頁,還剩61頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一節試驗資料的整理第二節描述試驗資料的特征數第二章試驗資料的整理

與描述主要內容及難點試驗資料的性質和整理方法;次數分布表的制作;統計表、統計圖的繪制及其特點;平均數、方差、標準差及變異系數的計算方法和各自的統計意義;一、試驗資料的分類1、數量性狀資料

數量性狀是指能夠以量測或計數的方法表示其特征的性狀。如作物單株產量、株高和單株光合葉面積、單株籽粒數等。觀察測定數量性狀而獲得的數據就是數量性狀資料。第一節試驗資料的整理1)計量資料用稱量、測量等量測手段獲得的數量性狀資料。因為兩相鄰數據間允許有帶小數的任何數值出現,即兩數間的變異是連續的,所以也稱為連續性變異資料。2)計數資料用計數方式得到的數據資料。各觀察值均為整數形式,每兩數據間不允許有小數存在,即兩數間的變異是不連續的,因此,也稱間斷性資料或不連續性變異資料。2、質量性狀資料質量性狀是指只能觀察而不能測量的性狀,如花藥、莖、種子、果實、葉片的顏色、籽粒的飽滿度、芒的有無等。質量性狀本身不能用數值表示,要獲得這類性狀的數據資料,須對其觀察結果作數量化處理。

1)統計次數法

在一定總體或樣本內,根據質量性狀類別統計次數,以次數作為質量性狀的數據。這種數量化的資料又叫次數資料。例如白花與紅花豌豆雜交,統計F2代不同花色植株數,1000株中有紅色266株,紫色494株,白色240株。例如,調查作物受某種病蟲害危害情況,將作物性狀分為高抗、抗、中抗、中感、感病5個級別,分別用1,2,3,4,5表示,統計樣本內各種級別的植株數。2)分級賦值法先根據性狀的變異情況分級,給每個分級分別賦予一個適當的數值作代表值,然后統計屬于各個級別的個體數。病情指數是全面考慮發病率與嚴重度的綜合指標。計算公式有兩種:當嚴重度用分級代表值表示時,病情指數=100×∑(各級病葉數×各級代表值)/(調查總葉數×最高級代表值);當嚴重度用百分率表示時,病情指數=普遍率×嚴重度二、試驗資料的整理根據數據出現的一定范圍,從最小值到最大值劃分成若干個互斥的組區間,再統計各組區間內觀察值個數,則可從中尋找到一定的規律,這種由不同組區間內觀察值出現的次數組成的分布,簡稱次數分布。1、計數資料的整理

觀察值不多,變異范圍不大的計數資料,以每一觀察值為一組進行分組,然后統計次數制成次數分布表。表2-1、100個麥穗的每穗小穗數18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917表2-2、100個麥穗每穗小穗數的次數分布表

每穗小穗數(x)劃線計數次數(?)15╫╫│

616╫╫

╫╫

╫╫

1517╫╫

╫╫

╫╫

╫╫

╫╫

╫╫

║3218╫╫

╫╫

╫╫

╫╫

╫╫

2519╫╫

╫╫

╫╫

1720╫╫

5總次數

100表2-3、200個稻穗每穗粒數的次數分布表

每穗粒數(x)次數(?)

26—301 31—353 36—4010 41—4521 46—5032 51—5541 56—6038 61—6525 66—7016 71—758 76—803 81—852

合計2002、計量資料的整理

計量資料在分組前需要確定全距、組數、組距、組中值及組限,然后將全部觀測值歸組,制成次數分布表。下面以表2-4中140行水稻產量為例,說明計量資料整理的方法與步驟。17716121498163131183116173192215214959717618997254181231197125158129102911192391881639717583143194142181160211159123219137179145140149172197158159118801741731541871791751592451921381597515213115112217711917615116513016321519815114711917518713614912311112417119413195126108150205186179166227149136196101161149118135175141152199134141155155150184143169167116206148111131155168190124104165137168158209197169213159表2-4140行水稻產量(單位:g)(1)求全距:全距是資料中最大值與最小值之差,又稱為極差(range),用R表示,即R=Max(x)-Min(x)

此例最大觀測值為254g,最小為75g,全距

R=254–75=179(g)(2)確定組數與組距:組數的確定依據:1)觀察值多少,2)極差,3)計算方便,4)能保持資料真實性。表2-4中觀測值個數即樣本容量為n=140,查表2-5,組數為10—12,這里分為12組。樣本容量組數30—605—860—1008—10100—20010—12200—50012—18500以上18—30表2-5樣本容量與組數

組距:指每組的最大值與最小值之差,記為i。分組時要求各組的組距相等。組距的大小由全距和組數確定,計算公式為:組距(i)=全距/組數本例組距(i)=179/12=14.9(g)為了計算方便,以15g作為組距。(3)、確定組中值與組限:第一組的組中值一般選接近資料中的最小值為宜,而且便于計算。此例為75。(4)、數據歸組。第一組的下限為:75-15/2=67.5;上限為:75+15/2=82.5;組限組中值(x)劃線計數次數(?)累加次數67.5—75║2282.5—90╫╫║7997.5—105╫╫║716112.5—120╫╫╫╫╫1329127.5—135╫╫╫╫╫╫║1746142.5—150╫╫╫╫╫╫╫╫2066157.5—165╫╫╫╫╫╫╫╫╫╫2591172.5—180╫╫╫╫╫╫╫╫│21112187.5—195╫╫╫╫╫13125202.5—210╫╫║║9134217.5—225╫3137232.5—240║2139247.5—255│1140合計(n)

140140表2-6、140行水稻產量數據的次數分布表3、質量性狀資料的整理

對于質量性狀資料可按性狀或屬性進行分組,分別統計各組的次數,然后制成次數分布表。例如,水稻雜種F2植株米粒性狀的分離情況,見表2-7。

性狀分組次數(?)頻率(%)

紅米非糯

9654

紅米糯稻

3721

白米非糯

3117

白米糯稻

158

合計

179100表2-7、水稻雜種F2植株米粒性狀分離情況統計表:用表格形式表示數據間的數量關系。統計圖:用幾何圖形表示數據間的數量關系。使用統計表和統計圖,可以把研究對象的特征、內部構成、相互關系等簡明、形象地表達出來,便于分析比較。三、常用統計表與統計圖表2-8大豆花色一對等位基因雜種二代

分離情況統計表

花色次數(f)頻率(%)紫色22173.42白色8026.58合計301100.00x(產量,g/行)圖2-1、140行水稻產量次數分布直方圖(histogram)x(產量,g/行)圖2-2、140行水稻產量次數分布多邊形圖(polygon)

圖2-3、水稻雜種F2米粒性狀分離條形圖單式條形圖(bardiagram)

復式條形圖

圖2-4、四個水稻品種不同發育時期葉綠素含量品種復式條形圖圖2-5、水稻雜種F2米粒性狀分離餅形圖圖2-6、小麥生產年降水情況單式線圖圖2-7、不同小麥品種灌漿結實期葉片蒸騰速率(○陜229;

長武134;△晉麥47;◆偃師9號;▲咸農151)

蒸騰速率(mmol/m2.s)復式線圖第二節描述試驗資料的

特征數除了用統計表和統計圖來直觀、形象地表示研究對象的數量特征外,統計數也可用來描述研究對象的內在規律。把這些統計數稱為特征數。描述資料集中性的特征數是平均數,描述資料離散性的特征數是變異數。參數:用總體的全體觀察值計算的、描述總體的特征數稱為參數(parameter)。參數是一個常量,一般未知,通常用希臘字母表示,如總體平均數μ,總體方差σ2

等。統計數:由樣本全體觀察值計算的,描述樣本的特征數稱為統計數(statistics)。統計數是一個變量,隨樣本的不同而不同,統計數一般用拉丁字母表示,如樣本平均數,樣本均方等。統計上,通常由統計數去估計或推斷所在總體的相應參數??傮w與樣本的關系圖總體(隨機變量)參數:μ,σ2,N樣本統計數:,s2,n(次數分布圖、表)數據分析(不同的假設測驗)一、平均數(mean)平均數可綜合反映研究對象在一定條件下的一般水平,是數量資料的代表數,常用來進行資料間的比較。1、算術平均數(arithmeticmean)1)定義與公式總體平均數:樣本平均數2)平均數的基本性質:簡記為(a≠x)例測某水稻單株粒重的樣本5個觀察值分別為3,8,7,6,4g,試計算該樣本離均差之和。

x

3

8

7

6

4

-2.6

2.4

1.4

0.4

-1.66.765.761.960.162.56964493616總和=28平均=5.60

17.2174【例2·1】

在大豆區域試驗中,吉農904的6個小區產量分別為25.0、26.0、22.0、21.0、24.5、23.5(kg)。求該品種的小區平均產量。

即吉農904的小區平均產量為23.5kg3)平均數的計算

直接法加權法式中,xi-各組組中值;fi-各組次數;K-分組數。各組的次數fi是權衡各組中值xi在資料中所占比重大小的數量,因此f被稱為組中值xi的“權”。【例2·2】用加權法計算表2-6資料中140行水稻平均產量。即140行水稻平均產量為157.93g。采用直接法算得=157.47g,用加權法計算的結果與其十分接近。樣本平均數是總體平均數的無偏估計統計上定義:當一個統計數的數學期望等于相應的總體參數時,則稱該統計數為其總體參數的無偏估計。統計數的無偏性有兩個含義:第一是無系統性偏差,把這些正負偏差在概率上平均起來,其值為零;第二是當統計數使用次數無限增大時,取其平均值,能無限逼近被估計的量。因此無偏估計不等于在任何時候都給出正確無誤的估計。例:有一總體:1,6,4,5,6,3,8,7.則μ=∑x/N=5如從中取樣本容量為3的樣本,則有個樣本.其中只有4個樣本:數學期望是指所有樣本平均數的平均值等于μ,這就是無偏估計的概念.

平均數有二個缺點:一是它易受較大值或較小值的影響;二是在有些情況下不具有實際意義。因此在反映資料的集中性或代表性時,還需要引入其他平均數的概念。

例:買100元某基金,5年凈值如下,計算平均年收益率.11013010016017114.4%1101308016017119.3%2、中位數和眾數中位數又稱中數(median),記為Md。將觀察值按大小依次排列,當觀察值數目為奇數時,最中間的觀察值就是中數Md;當觀察值數目為偶數時,最中間的兩個觀察值的算術平均數為中數Md。在資料中出現次數最多的數或組中值稱為眾數(mode),記作M0。3、幾何平均數和調和平均數

設有n個觀察值,其乘積開n次方所得的值,即為幾何平均數,常用Mg表示,即:幾何平均數常用在生長率、生產動態及藥物效價分析上。調和平均數設有n個觀察值,各觀察值倒數的算術平均數之倒數就稱為調和平均數,用H表示,調和平均數主要求一個過程不同階段的平均速度。調和平均數主要用于反映研究對象在不同階段的平均速度。如土壤毛細管中水分上升速度。二、變異數變異數就是表示資料變異大小的統計數,最常見的變異數有極差、標準差、變異系數。甲200198201197204206

(meansquare),記為orMS。在計算樣本方差時,是離均差的平方和除以(n-1)而不是樣本容量n。把(n-1)稱為自由度(degreeoffreedom),記為df或DF。自由度的概念在計算離均差平方和時,能夠自由變動的離均差個數。n個離均差受到這一條件的約束,能自由變動的離均差個數是n-1,第n個離均差不能再任意變動。一般情況下,計算離均差平方和有k個約束條件,則其自由度d?=n-k。計算樣本方差為什么要用自由度作分母?因此將比偏小。統計學已經證明:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論