幾種統計分析模型介紹_第1頁
幾種統計分析模型介紹_第2頁
幾種統計分析模型介紹_第3頁
幾種統計分析模型介紹_第4頁
幾種統計分析模型介紹_第5頁
已閱讀5頁,還剩48頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

幾種統計分析模型介紹福建省國家調查隊系統統計建模培訓主講人:張業圳2009年6月8日張業圳福建師范大學經濟學院副教授、博士、財金系副主任主要教學研究方向:數量經濟學與金融實證分析聯系電話:8736908713609525129Email:zhangyz1971@126.comQQ:107345901地址:福建師范大學經濟學院郵編:350108經濟統計分析統計學研究如何測定、收集、整理、歸納和分析反映客觀現象總體數量的數據,以便給出正確認識的方法論科學。

經濟統計分析就是用統計方法來分析經濟現象數量特征和經濟變量之間的關系。主要的工作有:1)分析經濟現象中變量之間相互關系2)經濟預測3)政策評價什么是經濟統計分析模型模型對現實的描述和模擬。用不同方法對現實進行描述和模擬,就構成不同的模型。語義模型、物理模型、幾何模型、數學模型和計算機模擬模型。經濟數學模型:用數學方法描述經濟活動。采用的數學方法不同,對經濟活動提示的程度不同,構成各類不同的經濟數學模型。數理經濟模型計量經濟學模型

本次培訓主要模型1、聚類分析2、回歸分析3)因子分析和主成分分析4)時間序列分析第一部分:預備知識樣本與統計量總體與樣本

在數理統計中,把研究對象的全體稱為總體(population)或母體,而把組成總體的每個單元稱為個體。抽樣

要了解總體的分布規律,在統計分析工作中,往往是從總體中抽取一部分個體進行觀測,這個過程稱為抽樣。樣本與統計量子樣

子樣是n個隨機變量,抽取之后的觀測數據稱為樣本值或子樣觀察值。在抽取過程中,每抽取一個個體,就是對總體X進行一次隨機試驗,每次抽取的n個個體,稱為總體X的一個容量為n的樣本(sample)或子樣;其中樣本中所包含的個體數量稱為樣本容量。隨機抽樣方法的基本要求獨立性——即每次抽樣的結果既不影響其余各次抽樣的結果,也不受其它各次抽樣結果的影響。滿足上述兩點要求的子樣稱為簡單隨機子樣.獲得簡單隨機子樣的抽樣方法叫簡單隨機抽樣.代表性——即子樣()的每個分量與總體具有相同的概率分布。從簡單隨機子樣的含義可知,樣本是來自總體、與總體具有相同分布的隨機變量.簡單隨機抽樣

例如:要通過隨機抽樣了解一批產品的次品率,如果每次抽取一件產品觀測后放回原來的總量中,則這是一個簡單隨機抽樣。但實際抽樣中,往往是不再放回產品,則這不是一個簡單隨機抽樣。但當總量N很大時,可近似看成是簡單隨機抽樣。

例如:為了分析福建省居民家庭收入狀況,對福建省居民家庭收入進行調查。統計量

定義設()為總體X的一個樣本,為不含任何未知參數的連續函數,則稱為樣本()的一個統計量。則例如:設是從正態總體中抽取的一個樣本,其中為已知參數,為未知參數,是統計量不是統計量幾個常用的統計量樣本均值(samplemean)設是總體的一個樣本,樣本方差(samplevariance)樣本均方差或標準差它們的觀測值用相應的小寫字母表示.反映總體X取值的平均,或反映總體X取值的離散程度。幾個常用的統計量設是總體的一個樣本,子樣的K階(原點)矩幾個常用的統計量設是總體的一個樣本,子樣的K階中心矩它包括兩個方面——數據整理計算樣本特征數數據的簡單處理為了研究隨機現象,首要的工作是收集原始數據.一般通過抽樣調查或試驗得到的數據往往是雜亂無章的,需要通過整理后才能顯示出它們的分布狀況。數據的簡單處理是以一種直觀明了方式加工數據。計算樣本特征數:數據的簡單處理數據整理:將數據分組計算各組頻數作頻率分布表作頻率直方圖(1)反映趨勢的特征數樣本均值中位數:數據按大小順序排列后,位置居中的那個數或居中的兩個數的平均數。眾數:樣本中出現最多的那個數。數據的簡單處理(2)反映分散程度的特征數:極差、四分位差極差——樣本數據中最大值與最小值之差,四分位數——將樣本數據依概率分為四等份的3個數椐,依次稱為第一、第二、第三四分位數。第一四分位數Q1:第二四分位數Q2:第三四分位數Q3:第二部分:參數估計第一節參數的點估計

一、點估計問題設總體X的分布函數的形式為已知的F(

x,θ

),其中x是自變量,θ為未知參數(它可以是一個數,也可以是一個向量).借助于總體X的一個樣本(X

1,X

2,…,X

n),來估計未知參數θ的值的問題,稱為參數的點估計問題.點估計的問題就是要構造一個適當的統計量(X1,X2,…,Xn),用樣本的一組觀察值(x1,x2,…,xn),得到的觀察值(x1,x2,…,xn),以此來估計未知參數θ.稱統計量(X

1,X

2,…,X

n)為θ的估計量,稱(x1,x2,…,xn)為θ的估計值.二、矩估計法的函數,記作μl=μl()即,l=1,2,…,k.設總體X的分布函數為,其中為k個未知參數.

假設總體X的各階原點矩存在,則E(Xl)是對于總體X的樣本(X1,X2,…,Xn),樣本的l階原點矩為,l=1,

2,…,k.令μl=

Al,l=1,2,…,k,即從上述方程組中解出,分別記作以此作為未知參數的估計量,稱為矩估計量.如果樣本觀察值為(x1,x2,…,xn),則得未知參數的矩估計值為上述估計未知參數的方法就叫做矩估計法.解此方程組得到與的矩估計量為令即解

例1設總體X的均值為μ,方差為,且,但μ與均未知,又設總體X的一個樣本為(X1,

X2,

,

Xn),求μ與的矩估計量.解由例4可得例2某廠生產一批鉚釘,現要檢驗鉚釘頭部直徑,從這批產品中隨機抽取12只,測得頭部直徑(單位:mm)如下:13.30 13.38 13.40 13.43 13.32 13.4813.54 13.31 13.34 13.47 13.44 13.50設鉚釘頭部直徑這一總體X服從正態分布,試求與的矩估計值.注此例說明,無論總體X服從什么分布,樣本均值都是總體均值的矩估計量,樣本二階中心矩就是總體方差的矩估計量.三、極大似然估計法1.設總體X為離散型隨機變量,其分布律為其中θ為未知參數,取值范圍為.設X1,X2,,Xn為來自X的樣本,則X1,X2,,Xn的聯合分布律為.又設x1,x2,,xn為一組樣本值,令

稱L(θ)為樣本的似然函數.(1)若有,使得對一切,有成立,則稱為θ的極大(或最大)似然估計值,相應的統計量稱為θ的極大(或最大)似然估計量.我們規定,使得的就是θ的極大似然估計值.由于lnx是單增函數,所以

與有相同的駐點,因此只需從

中解出就是θ的極大似然估計值,稱方程(2)(2)為極大似然方程.

例3設總體,與未知,(X1,X2,…,Xn)為總體X的樣本,求與的極大似然估計量.解

X的概率密度為設x1,x2,…,xn為樣本值,似然函數為令解得與的極大似然估計值為因此,與的極大似然估計量為四、估計量的評選標準1.無偏性估計量是樣本的函數,它是一個隨機變量,由不同的方法得到的估計量可能相同也可能不同.而對同一估計量,由不同的樣本觀察值得到參數的估計值也可能不同.我們很自然地要求估計量的期望等于參數的真值,即無偏性.定義設是未知參數θ的估計量,若,則稱為θ的無偏估計(量).例4設總體X的均值為,(X1,X2,X3)是總體X的樣本,證明下列兩個估計量都是的無偏估計.

證由于所以與都是的無編估計.(只需k1+

k2++

kn

=1,則=k1X1+

k2X2++

knXn就是的無偏估計)設為參數θ的估計量,若當時,按概率收斂于θ,即對于任意正數ε,有,則稱為θ的一致估計(量).3.一致性根據大數定律可知,樣本均值是總體均值的一致估計量.設與是參數θ的兩個無偏估計量,若,則稱比有效.2.有效性第二節參數的區間估計點估計是通過構造統計量(X1,X2,…,

Xn)來對總體X中的未知參數θ進行估計,由一個樣本值(x1,x2,…,

xn)可得到θ的估計值(x1,x2,…,

xn).這種估計值是無法知道誤差的.我們要定出一個范圍,并要求以一定的概率保證這個范圍包含著θ的真值.這個范圍通常以區間的形式給出,我們把這個區間稱為置信區間.定義設總體X的分布中含有一個未知參數θ,(X1,X2,…,

Xn)是來自總體X的一個樣本.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論