統計學原理重要公式_第1頁
統計學原理重要公式_第2頁
統計學原理重要公式_第3頁
統計學原理重要公式_第4頁
統計學原理重要公式_第5頁
已閱讀5頁,還剩1頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、.-一加權算術平均數和加權調和平均數的計算 加權算術平均數:或 加權調和平均數:頻數也稱次數。在一組依大小順序排列的測量值中,當按一定的 HYPERLINK :/baike.baidu /view/1060320.htm t _blank 組距將其 HYPERLINK :/baike.baidu /view/1969786.htm t _blank 分組時出現在各組內的測量值的 HYPERLINK :/baike.baidu /view/1161260.htm t _blank 數目,即落在各類別分組中的數據個數。 再如在3.14159265358979324中,9出現的頻數是3,出現的頻率是

2、3/18=16.7% 一般我們稱落在不同小組中的數據個數為該組的頻數,頻數與 HYPERLINK :/baike.baidu /view/703922.htm t _blank 總數的 HYPERLINK :/baike.baidu /view/132137.htm t _blank 比為 HYPERLINK :/baike.baidu /view/30964.htm t _blank 頻率。 頻數也稱“次數,對總數據按某種標準進行分組,統計出各個組內含個體的個數。而頻率那么每個小組的頻數與數據總數的比值。 在變量分配數列中,頻數頻率說明對應組標志值的作用程度。頻數頻率數值越大說明該組標志值對

3、于總體水平所起的作用也越大,反之,頻數頻率數值越小,說明該組標志值對于總體水平所起的作用越小。 擲硬幣實驗:在10次擲硬幣中,有4次正面朝上,我們說這10次試驗中正面朝上的頻數是4 例題:我們經常擲硬幣,在擲了一百次后,硬幣有40次正面朝上,那么,硬幣反面朝上的頻數為_. 解答,擲了硬幣100次,40次朝上,那么有100-40=60次反面朝上,所以硬幣反面朝上的頻數為60.一加權算術平均數和加權調和平均數的計算 加權算術平均數:或代表算術平均數;是總和符合;f為標志值出現的次數。加權算術平均數是具有不同比重的數據或平均數的算術平均數。比重也稱為權重,數據的權重反映了該變量在總體中的相對重要性,

4、每種變量的權重的確定與一定的理論經驗或變量在總體中的比重有關。依據各個數據的重要性系數(即權重)進行相乘后再相加求和,就是加權和。加權和與所有權重之和的比等于加權算術平均數。加權平均數 = 各組變量值 次數之和 / 各組次數之和 = xf / f 加權調和平均數:加權算術平均數以各組單位數f為權數,加權調和平均數以各組標志總量m為權數但計算內容和結果都是相同的。二標準差和標準差系數的計算方法標準差:=或公式標準差也被稱為 HYPERLINK :/baike.baidu /view/663819.htm t _blank 標準偏差,或者實驗標準差,公式如圖。 簡單來說,標準差是一組數據 HYPE

5、RLINK :/baike.baidu /view/1199275.htm t _blank 平均值分散程度的一種度量。一個較大的標準差,代表大部分數值和其平均值之間差異較大;一個較小的標準差,代表這些數值較接近平均值。 例如,兩組數的集合 0, 5, 9, 14 和 5, 6, 8, 9 其平均值都是 7 ,但第二個集合具有較小的標準差。 標準差可以當作不確定性的一種測量。例如在物理科學中,做重復性測量時,測量數值集合的標準差代表這些測量的精確度。當要決定測量值是否符合預測值,測量值的標準差占有決定性重要角色:如果測量平均值與預測值相差太遠同時與標準差數值做比較,那么認為測量值與預測值互相矛

6、盾。這很容易理解,因為如果測量值都落在一定數值范圍之外,可以合理推論預測值是否正確。 標準差應用于投資上,可作為量度回報穩定性的指標。標準差數值越大,代表回報遠離過去平均數值,回報較不穩定故風險越高。相反,標準差數值越細,代表回報較為穩定,風險亦較小。 例如,A、B兩組各有6位學生參加同一次語文測驗,A組的分數為95、85、75、65、55、45,B組的分數為73、72、71、69、68、67。這兩組的平均數都是70,但A組的標準差為17.07分,B組的標準差為2.37分此數據時在R統計軟件中運行獲得,說明A組學生之間的差距要比B組學生之間的差距大得多。 如是總體,標準差公式根號內除以n 如是

7、樣本,標準差公式根號內除以n-1) 因為我們大量接觸的是樣本,所以普遍使用根號內除以n-1) 公式意義 所有數減去其平均值的平方和,所得結果除以該組數之個數或個數減一),再把所得值開根號,所得之數就是這組數據的標準差。 標準差的意義標準差越高,表示實驗數據越離散,也就是說越不精確 反之,標準差越低,代表實驗的數據越精確 離散度標準差是反應一組數據離散程度最常用的一種量化形式,是表示精密確的最要指標。說起標準差首先得搞清楚它出現的目 的。我們使用方法去檢測它,但檢測方法總是有 HYPERLINK :/baike.baidu /view/40051.htm t _blank 誤差的,所以檢測值并不

8、是其真實值。檢測值與真實值之間的差距就是評價檢測方法最有決定性的指標。但是真實值 是多少,不得而知。因此怎樣量化檢測方法的準確性就成了難題。這也是臨床工作質控的目的:保證每批實驗結果的準確可靠。 雖然樣本的真實值是不可能知道的,但是每個樣本總是會有一個真實值的,不管它究竟是多少。可以想象,一個好的檢測方法,基檢測值應該很緊密的分散在真實值周圍。如何不緊密,那距真實值的就會大,準確性當然也就不好了,不可能想象離散度大的方法,會測出準確的結果。因此,離散度是評價方法的好壞的 最重要也是最基本的指標。標準差系數:標準差系數又均方差系數。反映標志變動程度的相對指標。 式中:V為標準差系數;為標準差;

9、為平均數。當以樣本標準差系數稱 HYPERLINK :/baike.baidu /view/356141.htm t _blank 變異系數/離散系數估計總體標準差系數時,VS= 式中:VS為變異系數;S為樣本標準差。對于不同水平的總體不宜直接用標準差指標進行對比,標準差系數能更好的反映不同水平總體的標志變動度。 標準差變動系數為標志變異系數的一種。標志變異系數指用標志變異指標與其相應的平均指標對比,來反應總體各單位標志值之間離散程度的相對指標,一般用v表示。標志變異指標有全距、平均差和標準差,相對應的,便有全距系數、平均差系數和標準差系數3種。計算方法為: 標志變異系數=標志變異值/相對應的

10、平均值三總體平均數和總體成數的區間估計。抽樣平均誤差的計算公式: 1總體平均數: 重復抽樣:重復抽樣又稱放回式抽樣。 每次從總體中抽取的樣本單位,經檢驗之后又重新放回總體,參加下次 HYPERLINK :/baike.baidu /view/64216.htm t _blank 抽樣,這種抽樣的特點是總體中每個 HYPERLINK :/baike.baidu /view/315109.htm t _blank 樣本單位被抽中的 HYPERLINK :/baike.baidu /view/45320.htm t _blank 概率是相等的。 不重復抽樣: 不重復抽樣亦稱不放回式抽樣。 每次從總體

11、中抽取的樣本單位,經檢驗之后不再放回總體,在下次 HYPERLINK :/baike.baidu /view/64216.htm t _blank 抽樣時不會再次抽到前面已抽中過的樣品單位。 總體每經一次抽樣,其樣品單位數就減少一個,因此每個 HYPERLINK :/baike.baidu /view/307185.htm t _blank 樣品單位在各次抽樣中被抽中的 HYPERLINK :/baike.baidu /view/45320.htm t _blank 概率是不同的。 2總體成數: 重復抽樣: 不重復抽樣: 抽樣極限誤差:抽樣極限誤差又稱“置信區間和抽樣允許誤差范圍,是指在一定的

12、把握程度P下保證樣本指標與總體指標之間的抽樣誤差不超過某一給定的最大可能范圍,記作。 抽樣極限誤差是指用絕對值形式表示的 樣本指標與總體指標偏差的可允許的最大范圍。它說明被估計的總體指標有希望落在一個以樣本指標為基礎的可能范圍。它是由抽樣指標變動可允許的上限或下限與總體指標之差的絕對值求得的。 由于總體平均數和總體成數是未知的,它要靠實測的抽樣平均數成數來估計。因而抽樣極限誤差的實際意義是希望總體平均數落在抽樣平均數的范圍內,總體成數落在抽樣成數的范圍內。 基于理論上的要求,抽樣極限誤差需要用抽樣平均誤差或為標準單位來衡量。即把極限誤差x或p相應除以或,得出相對的誤差程度t倍,t稱為抽樣誤差的

13、概率度。于是有: 總體平均數:定義:總體中所有個體的平均數叫做總體平均數。 原理:考察的對象中的每一個考察對象的平均數叫做總體平均數。2. 總體成數:pp總體成數。它是指總體中具有某一相同標志表現的單位數占全部總體單位數的比重,一般用P表示。總體中具有相同標志表現的單位數用N1表示。總體平均數和總體成數的區間估計:總體平均數: x -tux X x +tux總體成數: p - tup p p + tup樣本單位數的確定:總體平均數: 重復抽樣: n = t22/2x不重復抽樣:n = t22N /( N2x + t22)總體成數:重復抽樣: n = t2p(1-p)/2p不重復抽樣:n = t2p(1-p)N /( N2p + t2p(1-p)四相關系數的計算、回歸方程的建立和應用 相關系數的計算: 簡單線性回歸方程的建立: Y = a + bx其中: 五.統計指數的編制和兩因素分析綜合指數的計算數量指標指數:( -) 質量指標指數: - 2.平均指數的計算 算術平均數指數:.Kq / .Kq- 調和平均數指數: / (/Kp) - /Kp 3.復雜現象總體總量指標變動的因素分析相對數變動分析:= 絕對值變動分析:-= ( -)- 六.平均發展水平的計算 1.由總量指標動態數列計算序時平均數(1)由時期數列計算序時平均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論