




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、上機實習內容2幾種常見的統計指標與參數一、描述地理數據集中趨勢的指標1、平均數(Mean)(1)算術平均數(Arithmetic mean),其算數平均數x可按下式計算: 簡單算術平均數(Simple arithmetic mean) 設有n個地理數據x , x , ,其算數平均數x可按下式計算: TOC o 1-5 h z 123j_x + x + x +A + x _ 1 ynx T 23n HYPERLINK l bookmark57 o Current Document nni1練習1求上海市1873-1940年100年內的年平均降水量的簡單算術平均數。 /*調用Excel中的aver
2、age()函數求樣本的簡單算數平均數*/ 注意:樣本的簡單算術平均數易受極端值的影響,如有以下樣本資料:表1-1 13個樣本的屬性值樣本序號12345678910111213屬性 值57546785478620全部資料的簡單算術平均數約為7.08,實際上大部分數據(有10個)不超過7,如果去掉 第13個屬性值20,則剩下的12個數的平均數為6。 加權算術平均數(Weighted arithmetic average)設有n個地理數據x , x , x ,A , x,其權重系數分別為f, f , f ,A , f,其加權算術平均數x123n123n可按下式計算:Xxf_ xf + x f + x
3、f +A + xf _ iix T1 22 3_3nn f + f + f +A + f123n練習2根據黃土高原西部地區某山區縣的人工造林地調查的分組數據求其加權算術平均數。表1-2某縣人工造林地面積的統計分組數據(單位:ha)分組序號1234567891011組中值0.51.52.53.54.55.56.57.58.59.510.5頻數25961362142532862602031548524/*運用Excel中的相對引用功能和求和sum()函數*/25 + 96+A + 24x = 5*25 + 卩*96 +人+ 曲*24.5.49425 + 96+A + 24(2)幾何平均數(Geom
4、etric mean)設有n個地理數據x , x , x ,A , x,其幾何平均數X可按下式計算:123ngx = n;xxxxg12i n練習3一位投資者持有一種股票,1997-2000年收益率如下表,計算該投資者在這四年內的平均收 益率。表1-3投資者4年的收益率年份1997199819992000收益率1.0451.021.0351.054/*調用Excel中的geomean()函數求樣本的幾何平均數*/4:1.045*1.02*1.035*1.054 沁 1.0382、中位數(Median) 將各個數據從小到大排列,居于中間位置的那個數就是中位數。(1) 未分組資料的中位數n +1當
5、地理數據項數n為奇數時,變量按大小順序排列,第位數是中位數m,即2 em = xen+12練習4求某地9年年平均氣溫的中位數。表1-4某地9年年平均氣溫表(單位:。C)4.854.53.94.75.14.44.65.2計算步驟:對原始數據序列排序/*運用Excel中的排序功能*/3.94.44.54.64.74.855.15.2根據公式求得中位數m = x = x = 4.7 TOC o 1-5 h z e9+152nn當地理數據項數n為偶數時,變量按大小順序排列,第-項與第2+1項的平均數為中位數m,即e HYPERLINK l bookmark30 o Current Document m
6、 = (x + x ) e 2 nn+122練習5求某地8年季節性凍土深度的中位數。表1-5某地8年季節性凍土深度(單位:mm)505153.55353.6525758計算步驟:對原始數據序列排序/*運用Excel中的排序功能*/5051525353.553.65758根據公式求得中位數1 1 1m 二一(x + x )二(x + x )二 *(53.5 + 53)二 53.25 e 2 88+12 4522 2(2) 分組資料的中位數對于分組的資料,可按下式計算中位數=L +=L +mem式中,n為樣本大小,L為中位數所在組的下限值,f 為中位數所在組的前一組的累積 mem-1頻數,f為中位
7、數所在組的頻數,h為組距。mM = M = 1006.7 +e呼 一24)*119沁 1121.293練習6求上海市1873-1940年100年內的年平均降水量的分組資料的中位數。 計算步驟:首先求出分組資料的累積頻數,如表組序組上限組下限頻數累積頻數1649.7768.7112768.7887.7783887.71006.7162441006.71125.7275151125.71244.7227361244.71363.7148771363.71482.789581482.71601.739891601.71720.72100由樣本的大小(數據個數,為100)和累積頻數可知,中位數所在的分
8、組為累積頻數小于51 的分組,即中位數在第4組。則根據公式可求出該分組資料的中位數為有沒有更簡單的方法?直接調用Excel中的median()函數。3、眾數(Mode)眾數是一個地理觀測系列中出現頻數(次數)最多的數。(1)未分組資料的眾數根據每一個數據出現的頻數大小直接確定眾數。練習7求如下數據序列的眾數。序號 123456789 屬性值 1617316316574767273169根據目視結果可知,屬性值73出現了兩次,其他屬性值只出現一次,因此該數據序列的眾 數為73。/*當樣本較大時,可先運用Ecxel中的排序功能對數據排序,再確定眾數*/(2)分組資料的眾數對于分組的資料,可按下式計
9、算眾數Mof TOC o 1-5 h z HYPERLINK l bookmark46 o Current Document M = L +m+tx homo f + fm 一1m+1式中,L為眾數所在組的下限值,f 為眾數所在組的前一組的頻數,f 為眾數所在 mom-1m+1組的后一組的頻數,h為組距。練習8求上海市1873-1940年100年內的年平均降水量的分組資料的眾數。計算步驟:組序組上限組下限頻數1649.7768.712768.7887.773887.71006.71641006.71125.72751125.71244.72261244.71363.71471363.71482
10、.7881482.71601.7391601.71720.72根據頻數分布表可知眾數所在組為第4組。 則根據公式可求出該分組資料的眾數為22M = 1006.7 +x 119 沁 1075.6e16 + 22有沒有更簡單的方法?直接調用Excel中的mode()函數。/*在調用mode()函數時,若樣本中無重復屬性值,則函數出錯*/二、描述地理數據分散趨勢的指標1、極差(Range)2、離差(Deviation)每一個地理數據與平均值的差。d - x 一 x (i =1,2,A ,n)i i/*缺點:離差會得到一系列的數據,不便于兩個樣本的比較。如:我國遼寧省朝陽縣和寧夏回族自治區固原縣兩地多
11、年平均降水量資料如下表,分別計算 兩地多年平均降水量的離差,得到結果如下表2-1兩地多年平均降水量及離差(單位:mm)年份1961196219631964朝年降水陽量412633.7608606.3-109.112.6PaJ86.9685.26046固年降水原量732.4412.5373.4766.4214.0-105.-144.248.0離783937196519661967196819691970520.526.436.2402.7371.9692.853-84.8-118.-149.171.7-0.545.26434146475.434.619.2515.6501.1352.692-42
12、.4100.8-17.2-165.-84.1-2.73373733由表可得到每個地區的多年平均降水量波動情況,但兩個地區的多年平均降水量變動幅度大 小很難比較*/4、離差平方和(Sum of squares)各數據的離差平方后再相加。目的:一是為了消除正負號;二是使離散程度更清楚。iiiii=1i=1/*調用Excel中的devsq()函數求樣本的離差平方和*/ 5、方差(variance) 各離差平方和除以其數據的個數。對于總體方差& 2,其計算公式為nini=1(X 一 X)2i/*調用Excel中的varp()函數求總體方差*/對于樣本的方差S 2,其計算公式為_ 1 5T_S 2 =(
13、X _ X)2n _ 1 ii=1/*調用Excel中的var()函數求樣本的方差*/ /*式中n-1稱為自由度。其含義可做如下解釋。設一個樣本含有n個變量,從理論上講n個變量都同樣用來計算方差,每一x與x比較就有n個離差。但均值本身也是從樣本資料中 i估算出來的,即由每一個變量各貢獻1而組成,如每一個變量與X作一次比較,這無形中 n就等于各個變量與其自身的1做比較,因此每一離差比獨立比較時要稍微減小些,表面上 n雖有n個比較,但實質上僅相當于n -1個獨立比較。所以,在估計方差時,用n -1來除。*/6、標準差(Standard deviation)標準差為方差的算術平方根。總體的標準差計算
14、公式為工(X - X)2I /*調用Excel中的stdevp()函數求總體的標準差*/樣本的標準差計算公式為/*調用Excel中的stdev()函數求樣本的標準差*/ 7、變異系數(Variation coefficient)標準差與均值的比值。當兩個系列數值的單位不同或均值相差較大,或它們的標準差相同時,就不能簡單地用標準 差的絕對值來比較不同均值時隨機系列的離散程度。變異系數C的計算公式為v(X X)2 in 1三、描述地理數據分布特征的指標1、偏度系數(Coefficient of skewness)描述了地理數據分布的不對稱性,刻畫了以平均值為中心的偏向情況,其計算公式為=2i=1g 0,表示正偏,即均值在峰值的右邊;g =0,1 1 1表示對稱分布。/*調用Excel中的skew()函數求樣本的偏度系數*/2、峰度系數(Coefficient of kurtosis)描述了地理數據在均值附近的集中程度,其計算公式為)4 -標準正
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/SCIA 002-2024建材產品碳足跡核算與評價技術通則
- T/CECS 10400-2024固廢基膠凝材料
- T/CHCA 009-2024道路地下病害雷達檢測評估規程
- 上海初中試卷題庫及答案
- 上海二中數學試題及答案
- 股東會股權轉讓協議書范本8篇
- 律師代理關系解除合同7篇
- 自有場地承租合同7篇
- 個人財產抵押貸款合同6篇
- 貨物供給合同書4篇
- 細致解讀wps考試內容的試題及答案
- 2025屆高考語文寫作押題范文8篇及分析
- 臺球股東合同協議書
- 紙張印刷與印后加工考核試卷
- 2025屆山東省濱州地區物理八下期末學業水平測試模擬試題含解析
- 2025年汽車維修工職業資格考試重點試題及答案
- 2024年四川西華師范大學招聘輔導員真題
- 2025年安全生產考試題庫:安全生產隱患排查治理安全生產責任制試題
- 角膜塑形鏡護理流程
- 2025年高考英語語法填空熱點語法填空熱點話題06(學生版+解析)
- 湛江漓源農牧科技有限公司年產36萬噸飼料項目環境影響報告表
評論
0/150
提交評論