計量經(jīng)濟學(xué)基礎(chǔ)知識梳理超全_第1頁
計量經(jīng)濟學(xué)基礎(chǔ)知識梳理超全_第2頁
計量經(jīng)濟學(xué)基礎(chǔ)知識梳理超全_第3頁
計量經(jīng)濟學(xué)基礎(chǔ)知識梳理超全_第4頁
計量經(jīng)濟學(xué)基礎(chǔ)知識梳理超全_第5頁
已閱讀5頁,還剩167頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

計量經(jīng)濟學(xué)基礎(chǔ)知識梳理超全第1頁,課件共172頁,創(chuàng)作于2023年2月如果表示n個數(shù)的一個序列,那么我們就把這n個數(shù)的總和寫為:第一節(jié)高數(shù)知識一、求和第2頁,課件共172頁,創(chuàng)作于2023年2月二、算術(shù)平均算術(shù)平均(arithmeticmean)就是我們?nèi)粘I钪惺褂玫钠胀ǖ钠骄鶖?shù),其定義如下式:第3頁,課件共172頁,創(chuàng)作于2023年2月三、加權(quán)算術(shù)平均加權(quán)平均是將各數(shù)據(jù)先乘以反映其重要性的權(quán)數(shù)(w),再求平均的方法。其定義如下式:第4頁,課件共172頁,創(chuàng)作于2023年2月四、變化率變化率的定義如下式:第5頁,課件共172頁,創(chuàng)作于2023年2月五、幾何平均幾何平均是n個數(shù)據(jù)連乘積的n次方根,其定義如下式:

第6頁,課件共172頁,創(chuàng)作于2023年2月六、線性函數(shù)

如果兩個變量x和y的關(guān)系是:我們便說y是x的線性函數(shù):而和是描述這一關(guān)系的兩個參數(shù),為截距(Intercept),為斜率。一個線性函數(shù)的定義特征在于,y的改變量總是x的改變量的倍:其中,表示“改變量”。換句話說,x對y的邊際效應(yīng)是一個等于的常數(shù)。第7頁,課件共172頁,創(chuàng)作于2023年2月例:線性住房支出函數(shù)假定每月住房支出和每月收入的關(guān)系式是Housing=164+0.27income那么,每增加1元收入,就有0.27元用于住房支出,如果家庭收入增加200元,那么住房支出就增加0.27×200=54元。

機械解釋上述方程,即時一個沒有收入的家庭也有164元的住房支出,這當(dāng)然是不真實的。對低收入水平家庭,這個線性函數(shù)不能很好的描述housing和income之間的關(guān)系,這就是為什么我們最終還得用其他函數(shù)形式來描述這種關(guān)系。第8頁,課件共172頁,創(chuàng)作于2023年2月多于兩個變量的線性函數(shù):假定y與兩個變量和有一般形式的關(guān)系:由于這個函數(shù)的圖形是三維的,所以相當(dāng)難以想象,不過仍然是截距(即=0和=0時y的取值),且和都是特定斜率的度量。由方程(A.12)可知,給定和的改變量,y的改變量是若不改變,即,則有因此是關(guān)系式在坐標上的斜率:第9頁,課件共172頁,創(chuàng)作于2023年2月因為它度量了保持固定時,y如何隨而變,所以常把叫做對y的偏效應(yīng)。由于偏效應(yīng)涉及保持其他因素不變,所以它與其他條件不變(CeterisParibus)的概念有密切聯(lián)系,參數(shù)可作類似解釋:即若,則因此,是對y的偏效應(yīng)。線性函數(shù)的性質(zhì)第10頁,課件共172頁,創(chuàng)作于2023年2月假定大學(xué)生每月對CD的需求量與CD的價格和每個月的零花錢有如下關(guān)系:式中,price為每張碟的價格,income以元計算。需求曲線表示在保持收入(和其他因素)不變的情況下,quantity和price的關(guān)系。例:

對CD的需求第11頁,課件共172頁,創(chuàng)作于2023年2月線性函數(shù)的基本性質(zhì):不管x的初始值是什么,x每變化一個單位都導(dǎo)致y同樣的變化。x對y的邊際效應(yīng)是常數(shù),這對許多經(jīng)濟關(guān)系來說多少有點不真實。例如,邊際報酬遞減這個重要的經(jīng)濟概念就不符合線性關(guān)系。

為了建立各種經(jīng)濟現(xiàn)象的模型,我們需要研究一些非線性函數(shù)。

非線性函數(shù)的特點是,給定x的變化,y的變化依賴于x的初始值。七、若干特殊函數(shù)第12頁,課件共172頁,創(chuàng)作于2023年2月1.二次函數(shù)

刻畫報酬遞減規(guī)律的一個簡單方法,就是在線性關(guān)系中添加一個二次項。考慮方程式式中,,和為參數(shù)。當(dāng)時,y和x之間的關(guān)系呈拋物線狀,并且可以證明,函數(shù)的最大值出現(xiàn)在第13頁,課件共172頁,創(chuàng)作于2023年2月1.二次函數(shù)例如,若y=6+8x-2x2。(從而=8且=-2),則y的最大值出現(xiàn)在x*=8/4=2處,并且這個最大值是6+8×2-2×(2)2=14。第14頁,課件共172頁,創(chuàng)作于2023年2月

對方程式意味著x對y的邊際效應(yīng)遞減,這從圖中清晰可見,應(yīng)用微積分知識,也可以通過求這個二次函數(shù)的一階導(dǎo)數(shù)得出。斜率=方程右端是此二次函數(shù)對x的導(dǎo)數(shù)。同樣,則意味著x對y的邊際效應(yīng)遞增,二次函數(shù)的圖形就呈U行,函數(shù)的最小值出現(xiàn)在點處。1.二次函數(shù)第15頁,課件共172頁,創(chuàng)作于2023年2月

在計量經(jīng)濟分析中起著最重要作用的非線性函數(shù)是自然對數(shù),或簡稱為對數(shù)函數(shù),記為還有幾種不同符號可以表示自然對數(shù),最常用的是或。當(dāng)對數(shù)使用幾個不同的底數(shù)時,這些不同的符號是有作用的。目前,只有自然對數(shù)最重要,因此我們都用表示自然對數(shù)。2.自然對數(shù)第16頁,課件共172頁,創(chuàng)作于2023年2月2.自然對數(shù)圖2.1.4y=log(x)的圖形第17頁,課件共172頁,創(chuàng)作于2023年2月2.自然對數(shù)

有如下性質(zhì):

1.log(x)可正可負:log(x)<0,0<x<1;log(1)=0;log(x)>0,x>12.一些有用的性質(zhì)(牢記):

log(x1·x2)=log(x1)+log(x2),x1,x2>0log(x1/x2)=log(x1)-log(x2),x1,x2>0

log(xc)=c·log(x),x>0,c為任意實數(shù)第18頁,課件共172頁,創(chuàng)作于2023年2月2.自然對數(shù)

對數(shù)可用于計量經(jīng)濟學(xué)應(yīng)用中的各種近似計算。1.對于x≈0,有l(wèi)og(1+x)≈x。這個近似計算隨著x變大而越來越不精確。2.兩對數(shù)之差可用作比例變化的近似值。令x0和x1為兩個正數(shù),可以證明(利用微積分),對x的微小變化,有如果我們用100乘以上述方程,并記那么,對x的微小變化,便有“微小”的含義取決于具體情況。第19頁,課件共172頁,創(chuàng)作于2023年2月2.自然對數(shù)近似計算的作用:定義y對x的彈性(elasticity)為換言之,y對x的彈性就是當(dāng)x增加1%時y的百分數(shù)變化。若y是x的線性函數(shù):,則這個彈性是它明顯取決于x的取值(彈性并非沿著需求曲線保持不變)。第20頁,課件共172頁,創(chuàng)作于2023年2月2.自然對數(shù)不僅在需求理論中,在許多應(yīng)用經(jīng)濟學(xué)領(lǐng)域,彈性都是非常重要的。在許多情況下,使用一個常彈性模型都很方便,而對數(shù)函數(shù)能幫助我們設(shè)定這樣的模型。如果我們對x和y都使用對數(shù)近似計算,彈性就近似等于因此,一個常彈性模型可近似描述為方程式中,為y對x的彈性(假定x,y>0)。這類模型在經(jīng)驗經(jīng)濟學(xué)中扮演著重要角色。目前,式中的只是接近于彈性這一事實并不重要,可以忽略。第21頁,課件共172頁,創(chuàng)作于2023年2月例:常彈性需求函數(shù)若q代表需求量而p代表價格,并且二者關(guān)系為則需求的價格彈性是-1.25.初略地說,價格每增加1%,將導(dǎo)致需求量下降1.25%。第22頁,課件共172頁,創(chuàng)作于2023年2月2.自然對數(shù)在經(jīng)驗研究工作中還經(jīng)常出現(xiàn)使用對數(shù)函數(shù)的其他可能性。假定y>0,且則,從而。由此可知,當(dāng)y和x有上述方程所示關(guān)系時,第23頁,課件共172頁,創(chuàng)作于2023年2月例:對數(shù)工資方程假設(shè)小時工資與受教育年數(shù)有如下關(guān)系:根據(jù)前面所述方程,有由此可知,多受一年教育將使小時工資增加約9.4%。通常把%△y/△x稱為y對x的半彈性,半彈性表示當(dāng)x增加一個單位時y的百分數(shù)變化。在上述模型中,半彈性是個常數(shù)并且等于,在上述例子中,我們可以方便的把工資和教育的關(guān)系概括為:多受一年教育——無論所受教育的起點如何——都將使工資提高約9.4%。這說明了這類模型在經(jīng)濟學(xué)中的重要作用。第24頁,課件共172頁,創(chuàng)作于2023年2月2.自然對數(shù)另一種關(guān)系式在應(yīng)用經(jīng)濟學(xué)中也是有意義的:其中,x>0。若取y的變化,則有,這又可以寫為。利用近似計算,可得當(dāng)x增加1%時,y變化個單位。第25頁,課件共172頁,創(chuàng)作于2023年2月例:勞動供給函數(shù)假定一個工人的勞動供給可描述為式中,wage為小時工資而hours為每周工作小時數(shù),于是,由方程可得:換言之,工資每增加1%,將使每周工作小時增加約0.45或略小于半個小時。若工資增加10%,則或約四個半小時。注意:不宜對更大的工資百分數(shù)變化應(yīng)用這個近似計算。第26頁,課件共172頁,創(chuàng)作于2023年2月考慮方程此處log(y)是x的線性函數(shù),但是怎樣寫出y本身作為x的一個函數(shù)呢?指數(shù)函數(shù)給出了答案。我們把指數(shù)函數(shù)寫為y=exp(x),有時也寫為,但在我們課程中這個符號不常用。指數(shù)函數(shù)的兩個重要的數(shù)值是exp(0)=1和exp(1)=2.7183(取4位小數(shù))。

3.指數(shù)函數(shù)第27頁,課件共172頁,創(chuàng)作于2023年2月3.指數(shù)函數(shù)圖2.1.4y=exp(x)的圖形第28頁,課件共172頁,創(chuàng)作于2023年2月從上圖可以看出,exp(x)對任何x值都有定義,而且總大于零。指數(shù)函數(shù)在如下意義上是對數(shù)函數(shù)的反函數(shù):對所有x,都有l(wèi)og﹝exp(x)﹞=x,而對x>0,有exp﹝log(x)﹞=x。換言之,對數(shù)“解除了”指數(shù),反之亦然。對數(shù)函數(shù)和指數(shù)函數(shù)互為反函數(shù)。指數(shù)函數(shù)的兩個有用性質(zhì)是

exp(x1+x2)=exp(x1)exp(x2)和exp﹝c·log(x)﹞=xc3.指數(shù)函數(shù)第29頁,課件共172頁,創(chuàng)作于2023年2月記憶:經(jīng)濟學(xué)中常用的一些函數(shù)及其導(dǎo)數(shù)有

4.微分學(xué)第30頁,課件共172頁,創(chuàng)作于2023年2月當(dāng)y是多元函數(shù)時,偏導(dǎo)數(shù)的概念便很重要。假定y=f(x1,x2),此時便有兩個偏導(dǎo)數(shù),一個關(guān)于x1,另一個關(guān)于x2。y對x1的偏導(dǎo)數(shù)記為,就是把x2看做常數(shù)時方程對x1的普通導(dǎo)數(shù)。類似的,就是固定x1時方程對x2的導(dǎo)數(shù)。若則這些偏導(dǎo)數(shù)可被視為經(jīng)濟學(xué)所定義的偏效應(yīng)。4.微分學(xué)第31頁,課件共172頁,創(chuàng)作于2023年2月把工資與受教育年數(shù)和工作經(jīng)驗(以年計)相聯(lián)系的一個函數(shù)是exper對wage的偏效應(yīng)就是上式對exper的偏導(dǎo)數(shù):這是增加一年工作經(jīng)驗所導(dǎo)致工資的近似變化。注意這個偏效應(yīng)與exper和educ的初始水平都有關(guān)系。例如,一個從educ=12和exper=5開始的工人,再增加一年工作經(jīng)驗,將使工資增加約0.19-0.08×5+0.007×12=0.234元。準確的變化通過計算,結(jié)果是0.23,和近似計算結(jié)果非常接近。例:含交互項的工資方程第32頁,課件共172頁,創(chuàng)作于2023年2月一、隨機變量及其概率分布假設(shè)我們擲一枚錢幣10次,并計算出現(xiàn)正面的次數(shù),這就是一個實驗的例子。一般地說,一個實驗是指至少在理論上能夠無限重復(fù)下去的任何一種程序,并且它有一個定義完好的結(jié)果集。

一個隨機變量是指一個具有數(shù)值特征并由一個實驗來決定其結(jié)果的變量。

第二節(jié)概率論基礎(chǔ)第33頁,課件共172頁,創(chuàng)作于2023年2月按照概率和統(tǒng)計學(xué)的慣例,我們一律用大寫字母如常見的W,X,Y和Z表示隨機變量,而用相應(yīng)的小寫字母w,x,y和z表示隨機變量的特定結(jié)果。例如,在擲幣實驗中,令X為一枚錢幣投擲10次出現(xiàn)正面的次數(shù)。所以X并不是任何具體數(shù)值,但我們知道X將在集合中取一個值。比方說,一個特殊的結(jié)果是x=6。我們用下標表示一系列隨機變量。例如,我們記錄隨機選擇的20個家庭去年的收入。可以用X1,X2,··,X20表示這些隨機變量,并用x1,x2,···,x20表示其特殊結(jié)果。一、隨機變量及其概率分布第34頁,課件共172頁,創(chuàng)作于2023年2月如定義所言,即使隨機變量描述的是一些定性事件,我們也總定義它的結(jié)果是數(shù)值。例如,考慮只擲一枚錢幣,其兩個結(jié)果是正面和反面。我們可以定義一個隨機變量如下:如果出現(xiàn)正面則X=1;如果出現(xiàn)反面則X=0。一個只能取0和1兩個值的隨機變量叫做貝努利隨機變量。X~Bernoulli(θ)(讀作“X服從一個成功概率為θ的貝努利分布):P(X=1)=θ,P(X=0)=1-θ一、隨機變量及其概率分布第35頁,課件共172頁,創(chuàng)作于2023年2月1.離散隨機變量

離散隨機變量是指一個只取有限個或可數(shù)的無限個數(shù)值的隨機變量。“可數(shù)的無限個”:雖然隨機變量可取無限個值,但這些值可以和正整數(shù)一一對應(yīng)。貝努力隨機變量是離散隨機變量的最簡單的例子。

一、隨機變量及其概率分布第36頁,課件共172頁,創(chuàng)作于2023年2月一個離散隨機變量要由它的全部可能值和取每個值的相應(yīng)概率來完整描述。如果X取k個可能值其概率p1,p2,···,pk被定義為

pj=P(X=xj),j=1,2,···

,k(讀作:“X取值xj的概率等于pj”。)其中,每個pj都在0-1之間,并且

p1+p2+···+pk=11.離散隨機變量第37頁,課件共172頁,創(chuàng)作于2023年2月X的概率密度函數(shù)(probabilitydensityfunction,pdf)概括了X的可能結(jié)果及其相應(yīng)概率的信息:

而且對某個j,凡是不等于xj的x都有f(x)=0。換言之,對任何實數(shù)x,f(x)都是隨機變量X取該特定值x的概率。當(dāng)我們設(shè)計多于一個隨機變量時,有時需要給所考慮的pdf加一個下標:例如fx是X的pdf,fY是Y的pdf等等。1.離散隨機變量第38頁,課件共172頁,創(chuàng)作于2023年2月給定任一離散隨機變量的pdf,就不難計算關(guān)于該隨機變量的任何事件的概率。例如,設(shè)X為一名籃球運動員在兩次罰球中的命中次數(shù)。因此X的三個可能值是{0,1,2}。假定X的pdf是f(0)=0.20,f(1)=0.44和f(2)=0.36這三個概率之和必然為1.利用這個pdf,我們能算出該運動員至少投中一球的概率:P(X≥1)=P(X=1)+P(X=2)=0.44+0.36=0.80。X的pdf如下圖示:1.離散隨機變量第39頁,課件共172頁,創(chuàng)作于2023年2月2.連續(xù)隨機變量

連續(xù)隨機變量是指一個取任何實數(shù)的概率都為零的變量。這個定義有點違背直覺,因為在任何應(yīng)用中,我們最終都會觀測到一個隨機變量取得的某種結(jié)果。這里的思想是,一個連續(xù)隨機變量X的可能取值如此之多,以致我們無法用正整數(shù)去計算,因而,邏輯上的一致性就要求X必須以零概率取每一個值。

一、隨機變量及其概率分布第40頁,課件共172頁,創(chuàng)作于2023年2月在計算連續(xù)隨機變量的概率時,討論一個連續(xù)隨機變量取某特定值的概率是沒有意義的,最方便的是使用累積分布函數(shù)(cumulativedistributionfunction,cdf)。設(shè)X為任意隨機變量,它對任何實數(shù)x的cdf被定義為F(x)≡P(X≤x)對于一個連續(xù)隨機變量,F(xiàn)(x)就是概率密度函數(shù)f之下、點x以左的面積。因為F(x)就是一個概率,所以它總是介于0-1之間。此外,若x1<x2,則P(X≤x1)≤P(X≤x2),即F(x1)≤F(x2)。這意味著cdf是x的一個增(至少非減)函數(shù)。2.連續(xù)隨機變量第41頁,課件共172頁,創(chuàng)作于2023年2月cdf有如下兩個對計算概率頗為有用的重要性質(zhì):

1.對任何數(shù)c,P(X>c)=1-F(c)

2.對任何兩個數(shù)a<b,P(a<X≤b)=F(b)-F(a)

在我們學(xué)習(xí)計量經(jīng)濟學(xué)時,用cdf僅計算連續(xù)隨機變量的概率,所以在概率命題中的不等式是否嚴格不等便無所謂。也就是說,對于一個連續(xù)隨機變量X,有P(X≥c)=P(X>c)和P(a<X<b)=P(a≤X≤b)=P(a≤X<b)=P(a<X≤b)

對于概率和統(tǒng)計學(xué)中所有重要的連續(xù)分布,其累積分布函數(shù)已被制成表格,其中最為人們熟知的是正態(tài)分布。2.連續(xù)隨機變量第42頁,課件共172頁,創(chuàng)作于2023年2月1.聯(lián)合分布與獨立性令X和Y為離散隨機變量。那么(X,Y)的聯(lián)合分布由它們的聯(lián)合概率密度函數(shù)充分描述:上式右端是X=x和Y=y的概率。若我們知道X和Y的pdf,就容易得到它們的聯(lián)合pdf。具體而言,我們說X和Y相互獨立的充要條件是,對所有x和y,都有式中,fX為X的pdf而fY為Y的pdf。二、聯(lián)合分布、條件分布與獨立性第43頁,課件共172頁,創(chuàng)作于2023年2月在多個隨機變量的背景中,fX和fY這兩個pdf常被稱為邊緣概率密度函數(shù),以區(qū)別于聯(lián)合pdf,即fX,Y。上述獨立性定義適用于離散和連續(xù)隨機變量。如果X和Y都是離散的,那么上式就等同于P(X=x,Y=y)=P(X=x)·P(Y=y)因為僅需要知道P(X=x)與P(Y=y),所以計算聯(lián)合概率相當(dāng)容易。

若兩隨機變量不獨立,則稱它們是相依的。1.聯(lián)合分布與獨立性第44頁,課件共172頁,創(chuàng)作于2023年2月考慮籃球運動員的兩次罰球。令X為貝努利隨機變量:如果第一次命中它等于1,否則等于0。再令Y為貝努利隨機變量:如果第二次命中它等于1,否則等于0。假設(shè)該運動員每次罰球的命中率都是80%,即P(X=1)=P(Y=1)=0.8,問兩罰兩中的概率是多少?例:罰球命中率若X和Y獨立,則很容易回答這個問題:P(X=1,Y=1)=P(X=1)·P(Y=1)=0.8×0.8=0.64。因此,有64%的機會兩罰兩中。若第二次命中的機會依賴于第一次是否命中,即X和Y不獨立,這種簡單計算便不再正確。第45頁,課件共172頁,創(chuàng)作于2023年2月隨機變量的獨立性是一個十分重要的概念。若X和Y獨立,則知道X的結(jié)果并不改變Y出現(xiàn)的各種可能結(jié)果的概率,反之亦然。

關(guān)于獨立性的一個有用結(jié)論是,若X和Y獨立,而我們對任意函數(shù)g和h定義兩個新的隨機變量g(X)和h(Y),則這些新的隨機變量也是獨立的。1.聯(lián)合分布與獨立性第46頁,課件共172頁,創(chuàng)作于2023年2月在計量經(jīng)濟學(xué)中,我們通常也對一個隨機變量(稱之為Y)與另外一個或多個隨機變量的聯(lián)系感興趣。暫且假設(shè)我們只對一個變量的影響感興趣,并稱之為X。關(guān)于X如何影響Y,我們所能知道的,都包含在給定X時Y的條件分布中,由條件概率密度函數(shù)概括的這一信息被定義為:對所有滿足的x值,都有2.條件分布第47頁,課件共172頁,創(chuàng)作于2023年2月當(dāng)X和Y都是離散變量時,上式可解釋為其中,上式右端讀作“給定X=x時Y=y的概率”。當(dāng)Y是連續(xù)變量時,由于前述理由,不能直接解釋為概率,但可以通過計算條件概率密度函數(shù)之下的面積來求出條件概率。條件分布的一個重要性質(zhì)是,若X和Y是獨立隨機變量,知道X取什么值無助于確定Y取各值的概率(反之亦然)。這就是說,且。2.條件分布第48頁,課件共172頁,創(chuàng)作于2023年2月再次考慮籃球員兩次投籃的例子。假定條件密度是這意味著球員第二次罰球命中的概率依賴于第一次罰球是否命中:如果第一次命中,則第二次命中的概率是0.85;如果第一次失誤,則第二次命中的概率是0.70。這就是說,X和Y不是獨立的,而是相關(guān)的。我們?nèi)糁繮(X=1),便可以計算P(X=1,Y=1)。假定第一次命中的概率是0.8,即P(X=1)=0.8,那么我們得到兩罰兩中的概率為P(X=1,Y=1)=P(Y=1|X=1)·P(X=1)=0.85×0.8=0.68例:罰球命中率第49頁,課件共172頁,創(chuàng)作于2023年2月多數(shù)情況下我們只對隨機變量分布的少數(shù)幾個性質(zhì)感興趣。這些特征可分成三類:集中趨勢的度量、變異或分散程度的度量以及兩個隨機變量之間關(guān)聯(lián)性的度量。1.集中趨勢的一種度量:期望值期望值是我們在計量經(jīng)濟學(xué)學(xué)習(xí)中遇到的最重要的概率性概念之一。設(shè)X為一隨機變量。它的期望值,記做E(X),就是對X的所有可能值的一個加權(quán)平均。權(quán)數(shù)由概率密度函數(shù)決定。有時期望值又被稱為總體均值,特別是在我們強調(diào)X代表了總體中的某個變量時。三、概率分布的特征第50頁,課件共172頁,創(chuàng)作于2023年2月當(dāng)X是取有限個值[比方說]的離散隨機變量時,期望值的準確定義最為簡單。令f(x)表示X的概率密度函數(shù),則X的期望值為加權(quán)平均:給定pdf在X的每個可能結(jié)果處的取值,這很容易計算。1.集中趨勢的一種度量:期望值第51頁,課件共172頁,創(chuàng)作于2023年2月假定X分別以概率1/8、1/2和3/8取值-1、0和2,則

E(X)=(-1)×1/8+0×(1/2)+2×(3/8)=5/8例:計算一個期望值第52頁,課件共172頁,創(chuàng)作于2023年2月例:假定X分別以概率1/8、1/2和3/8取值-1、0和2,則:

E(X)=(-1)×1/8+0×(1/2)+2×(3/8)=5/8

對于例2.2.3中的隨機變量,令g(X)=X2,便有E(X2)=(-1)2×1/8+(0)2×(1/2)+(2)2×(3/8)=13/8例:X2期望值第53頁,課件共172頁,創(chuàng)作于2023年2月性質(zhì)1.對任意常數(shù)c,E(c)=c。性質(zhì)2.對任意常數(shù)a和b,E(aX+b)=aE(X)+b。性質(zhì)3.如果是常數(shù)而是隨機變量,則或者,利用求和符號,作為一個特例,取每個aj=1,我們有因此,和的期望值就是期望值之和。在數(shù)理統(tǒng)計的推導(dǎo)中常常用到這個性質(zhì)。2.期望值的性質(zhì)第54頁,課件共172頁,創(chuàng)作于2023年2月令X1,X2和X3分別為比薩店在某日出售的小、中、大比薩個數(shù)。這些隨機變量的期望值是E(X1)=25,E(X2)=57和E(X3)=40。小、中、大比薩的價格分別是5.50、7.60和9.15美元。因此,該日出售比薩的期望收入是E(5.5X1+7.60X2+9.15X3)=5.50E(X1)+7.60E(X2)+9.15E(X3)=5.5×25+7.60×57+9.15×40=936.70即936.70美元。這不過是期望收入,具體某一天的實際收入一般都會有所差異。例:求期望收入第55頁,課件共172頁,創(chuàng)作于2023年2月度量集中趨勢的另一種方法是用中位數(shù)。若X是連續(xù)的,則X的中位數(shù)(比方說m)就是這樣一個數(shù):pdf之下的一半面積在m之左,另一半面積在m之右。當(dāng)X是離散的且取有奇數(shù)個值時,中位數(shù)就是按大小排序后居中的一個數(shù)。若X可能取偶數(shù)個值,則實際上有兩個中位數(shù);有時取這兩個數(shù)的平均,便得到唯一的一個中位數(shù)。一般而言,中位數(shù),有時記為Med(X),和期望值E(X)是不相同的。作為集中趨勢的度量,不能說哪一個比另一個更好,兩者都是度量X分布中心的有效方法。2.集中趨勢的另一種度量:中位數(shù)第56頁,課件共172頁,創(chuàng)作于2023年2月對一個隨機變量X,令μ=E(X)。為了度量X離其期望值多遠,有許多種方法,而最簡單的一種代數(shù)方法就是用差異的平方(X-μ)2。(平方是為了消除距離度量的符號,由此得到的正值符合我們對距離的直觀認識。)因這一距離隨X的每一結(jié)果而變,故本身就是一個隨機變量。正如我們需要用一個數(shù)來總結(jié)X的集中趨勢那樣,我們也需要用一個數(shù)來告訴我們X平均而言離μ有多遠。一個這樣的數(shù)就是方差(variance),它告訴我們X對其均值的期望距離:方差有時記為,由方程知方差必定非負。3.方差第57頁,課件共172頁,創(chuàng)作于2023年2月方差S2的定義如下式(樣本):

第58頁,課件共172頁,創(chuàng)作于2023年2月(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y為相互獨立的隨機變量,則Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(x)=E(x2)-(E(x))2方差的重要性質(zhì)第59頁,課件共172頁,創(chuàng)作于2023年2月一個隨機變量的標準差,記為sd(X),就是它的方差的正的平方根:sd(X)≡+。標準差有時又記做。標準差有兩個重要性質(zhì)可從方差的兩個性質(zhì)中直接推出。

性質(zhì)1.對任意常數(shù)c,sd(c)=0性質(zhì)2.對任意常數(shù)a和b,sd(aX+b)=|a|sd(X)特別是,若a>0,則sd(aX)=a·sd(X)。4.標準差第60頁,課件共172頁,創(chuàng)作于2023年2月標準差S的的定義分別如下式:第61頁,課件共172頁,創(chuàng)作于2023年2月作為方差和標準差性質(zhì)的一個應(yīng)用——而且本身也是有實際意義的一個問題——假如給定隨機變量X,我們將它減去其均值μ并除以其標準差б,便定義了一個新的隨機變量

Z≡這又可寫為Z=aX+b,其中a=(1/б)而b=-(μ/б)。可得:E(Z)=aE(X)+b=(μ/б)-(μ/б)=0Var(Z)=a2Var(X)=б2/б2=1因此,隨機變量Z的均值為零,方差(或者標準差)為1。這一過程有時被稱為將隨機變量X標準化,而Z則叫做標準化隨機變量。5.標準化一個隨機變量第62頁,課件共172頁,創(chuàng)作于2023年2月1.關(guān)聯(lián)度:協(xié)方差與相關(guān)雖然兩個隨機變量的聯(lián)合pdf完整地描述了它們之間的關(guān)系,但對于它們大致如何互相變動,仍需要一個扼要的度量手段。正如期望值和方差一樣,這類似于用一個數(shù)字來概括整個分布的某一方面,現(xiàn)在要概括的便是兩個隨機變量的聯(lián)合pdf。四、聯(lián)合與條件分布的特征第63頁,課件共172頁,創(chuàng)作于2023年2月兩個隨機變量X和Y之間的協(xié)方差(有時也叫做總體協(xié)方差,以強調(diào)它考慮的是描述一個總體的兩個隨機變量之間的關(guān)系),被定義為乘積(X-μX)(Y-μY)的期望值:有時又記為。若,則平均而言,當(dāng)X超過其均值時,Y也超過其均值;若,則平均而言,當(dāng)X超過其均值時,Y低于其均值。2.協(xié)方差第64頁,課件共172頁,創(chuàng)作于2023年2月計算的幾個有用表達式如下:協(xié)方差度量兩個隨機變量之間的線性相依性。一個正的協(xié)方差表示兩隨機變量同向移動,而一個負的協(xié)方差則表示兩隨機變量反向移動。2.協(xié)方差第65頁,課件共172頁,創(chuàng)作于2023年2月

性質(zhì)Cov.1:若X和Y相互獨立,則注意:此性質(zhì)的反命題并不成立:X和Y之間的協(xié)方差為零并不意味著X和Y相互獨立。

性質(zhì)Cov.2:對任意常數(shù)a1,b1,a2和b2,都有此性質(zhì)的重要含義在于,兩個隨機變量之間的協(xié)方差會因為將兩者或者兩者之一乘以一個常數(shù)倍而改變。這在經(jīng)濟學(xué)中之所以重要,是因為諸如貨幣變量和通貨膨脹率等,都可使用不同的度量單位進行定義而不改變其實質(zhì)。協(xié)方差的性質(zhì)第66頁,課件共172頁,創(chuàng)作于2023年2月取決于度量單位是協(xié)方差的一個缺陷。為克服這一缺陷,現(xiàn)引進X和Y的相關(guān)系數(shù)(correlationcoefficient):X和Y的相關(guān)系數(shù)有時記做(而且有時稱總體相關(guān))。所謂相關(guān)系數(shù)是用來測量諸如收入與消費、氣溫和啤酒的消費量、匯率與牛肉的進口價格等兩個變量X、Y之間的相互關(guān)系的大小和方向(正或負)的系數(shù)。通過計算相關(guān)系數(shù),可以知道X與Y之間具有多大程度的線性(linear)關(guān)系。相關(guān)系數(shù)R的定義如下式:3.相關(guān)系數(shù)第67頁,課件共172頁,創(chuàng)作于2023年2月第68頁,課件共172頁,創(chuàng)作于2023年2月性質(zhì)Corr.1

-1≤Corr(X,Y)≤1若Corr(X,Y)=0,或等價地Cov(X,Y)=0,則X和Y之間就不存在線性關(guān)系,并稱X和Y為不相關(guān)隨機變量;否則X和Y就是相關(guān)的。Corr(X,Y)=1意味著一個完全的正線性關(guān)系,意思是說,我們對某常數(shù)a和某常數(shù)b>0可以寫Y=a+bX。Corr(X,Y)=-1則意味著一個完全的負線性關(guān)系,使得對某個b<0有Y=a+bX。+1和-1兩個極端情形很少出現(xiàn)。接近1或-1的值便意味著較強的線性關(guān)系。3.相關(guān)系數(shù)第69頁,課件共172頁,創(chuàng)作于2023年2月性質(zhì)Corr.2

對于常數(shù)a1,b1,a2和b2,若a1a2>0,則Corr(a1X+b1,a2Y+b2)=Corr(X,Y)若a1a2<0,則Corr(a1X+b1,a2Y+b2)=-Corr(X,Y)作為一個例子,假定薪水和教育的總體相關(guān)系數(shù)是0.15.這一度量將與用美元、千美元或任何其他單位計算薪水都無關(guān);與用年、季、月或其他單位來衡量受教育時間也無關(guān)。3.相關(guān)系數(shù)第70頁,課件共172頁,創(chuàng)作于2023年2月一旦定義了協(xié)方差和相關(guān)系數(shù),就可以把方差的主要性質(zhì)完整地列出來。

性質(zhì)VAR.3對于常數(shù)a和b,有由此可知,若X和Y不相關(guān)(從而Cov(X,Y)=0)則和在后一情形中,要注意為什么差的方差是(兩個)方差之和,而不是方差之差。4.隨機變量之和的方差第71頁,課件共172頁,創(chuàng)作于2023年2月例:令X為星期五夜晚某酒店賺到的利潤,而Y為接下來星期六夜晚賺到的利潤。因此,Z=X+Y就是這兩個夜晚賺的利潤。假定X和Y都有一個300美元的期望值和一個15美元的標準差(因而方差為225)。兩夜晚的期望利潤將是E(Z)=E(X)+E(Y)=2×300=600美元。若X和Y獨立,從而它們也不相關(guān),則總利潤的方差便是兩個方差之和:Var(Z)=Var(X)+Var(Y)=2×225=450。于是總利潤的標準差是,約為21.21美元。4.隨機變量之和的方差第72頁,課件共172頁,創(chuàng)作于2023年2月從兩個變量推廣到多于兩個變量的情形。若隨機變量中的每一個變量與集合中其他任何一個變量都不相關(guān),我們便稱其為兩兩不相關(guān)的隨機變量。也就是說,對所有的,都有4.隨機變量之和的方差第73頁,課件共172頁,創(chuàng)作于2023年2月

性質(zhì)VAR.4若是兩兩不相關(guān)的隨機變量且是常數(shù),則用求和符號便可寫為此性質(zhì)的一個特殊情形就是,對所有i都取ai=1.這時,對兩兩不相關(guān)的隨機變量來說,和的方差就是方差之和:4.隨機變量之和的方差第74頁,課件共172頁,創(chuàng)作于2023年2月協(xié)方差和相關(guān)系數(shù)都是對兩個隨機變量之間線性關(guān)系的度量,并且對稱地處理兩者。在社會科學(xué)中更多的情況是,我們想用一個變量X去解釋另一個變量Y。而且,若Y和X有非線性形式的關(guān)系,則我們還希望知道這個形式。把Y叫做被解釋變量,而X叫做解釋變量。例如Y代表小時工資,而X代表受過正式教育的年數(shù)。可以通過給定X下Y的條件期望(有時又稱條件均值)來概括Y和X之間的關(guān)系。即,一旦我們知道X取了某個特定值x,就能根據(jù)X的這個結(jié)果算出Y的期望值。記作E(Y|X=x)或簡記E(Y|x)。一般情形是,隨著x的改變,E(Y|x)也會改變。5.條件期望第75頁,課件共172頁,創(chuàng)作于2023年2月當(dāng)Y是取值為的離散隨機變量時,則有當(dāng)Y連續(xù)時,E(Y|x)便由對的y的所有可能值求積分來定義。好比無條件期望那樣,條件期望也是對Y所有可能值的一個加權(quán)平均,只不過這時的權(quán)數(shù)反映了X已取了某個特殊值的情形。因此,E(Y|x)是x的某個函數(shù),這個函數(shù)告訴我們Y的期望值如何隨x而變化。5.條件期望第76頁,課件共172頁,創(chuàng)作于2023年2月例令(X,Y)代表一個工人總體,其中X為受教育年數(shù),Y為小時工資。那么,E(Y|x=12)便是總體中所有受了12年教育(相當(dāng)于讀完高中)的工人的平均小時工資。E(Y|x=16)則是所有受過16年教育的工人的平均小時工資。跟蹤各種教育水平的期望值,便為工資和教育之間的關(guān)系提供了重要信息。5.條件期望第77頁,課件共172頁,創(chuàng)作于2023年2月原則上,可以在每個教育水平上求出小時工資的期望值,然后將這些期望值列表。由于教育的變化范圍很大——且可度量為一年的某個分數(shù)——所以用這種方法顯示平均工資和受教育程度之間的關(guān)系很煩瑣。計量經(jīng)濟學(xué)中的典型方法是,設(shè)定一些足以刻畫這種關(guān)系的簡單函數(shù)。作為一個例子,假設(shè)WAGE在給定EDUC時的期望值是如下線性函數(shù):E(WAGE|EDUC)=1.05+0.45EDUC假定這一關(guān)系對工人總體成立,則受8年和16年教育者的平均工資分別是多少?EDUC的系數(shù)如何解釋?5.條件期望第78頁,課件共172頁,創(chuàng)作于2023年2月條件期望的一些基本性質(zhì)對計量經(jīng)濟分析中的推導(dǎo)頗為有用。

性質(zhì)CE.1對任意函數(shù)c(X),都有E[c(X)|X]=c(X)。這意味著,當(dāng)我們計算以X為條件的期望值時,X的函數(shù)可視為常數(shù)。例如E(X2|X)=X2。直觀上,這無非就是說,若知道了X,也就知道了X2。

6.條件期望的性質(zhì)第79頁,課件共172頁,創(chuàng)作于2023年2月性質(zhì)CE.2對任意函數(shù)a(X)和b(X),有

例如,我們能很容易地計算像XY+2X2這種函數(shù)的條件期望:6.條件期望的性質(zhì)第80頁,課件共172頁,創(chuàng)作于2023年2月性質(zhì)CE.3若X和Y相互獨立,則E(Y|X)=E(Y)。這個性質(zhì)意味著,若X和Y相互獨立,則Y在給定X時的期望值與X無關(guān),這是E(Y|X)必定等于Y的(無條件)期望。在工資與教育一例中,假設(shè)工資獨立于教育,則高中畢業(yè)生和大學(xué)畢業(yè)生的平均工資便相同。這幾乎無疑是錯誤的,所以我們不能假定工資與教育是獨立的。6.條件期望的性質(zhì)第81頁,課件共172頁,創(chuàng)作于2023年2月性質(zhì)CE.4E[E(Y|X)]=E(Y)。這個性質(zhì)意味著,如果我們先把E(Y|X)看做X的函數(shù),再求這個函數(shù)的期望值,那么結(jié)果就是E(Y)。

例:令Y=WAGE和X=EDUC,其中WAGE為小時工資,而EDUC為受教育年數(shù)。假定給定EDUC下WAGE的期望值是E(WAGE|EDUC)=4+0.6EDUC,且E(EDUC)=11.5。則有E(WAGE)=E(4+0.6EDUC)=4+0.6E(EDUC)=10.90美元/小時。6.條件期望的性質(zhì)第82頁,課件共172頁,創(chuàng)作于2023年2月性質(zhì)CE.5若E(Y|X)=E(Y),則Cov(X,Y)=0(因而Corr(X,Y)=0。事實上X的每個函數(shù)都與Y不相關(guān)。該性質(zhì)的含義是,若對X的了解不能改變Y的期望值,則X和Y必然不相關(guān)。注意:此性質(zhì)的逆命題不成立。若X和Y不相關(guān),E(Y|X)仍然可能取決于X。6.條件期望的性質(zhì)第83頁,課件共172頁,創(chuàng)作于2023年2月1.正態(tài)分布正態(tài)分布和由它衍生出來的分布是統(tǒng)計學(xué)和計量經(jīng)濟學(xué)中最廣泛使用的分布。假定在總體上定義的隨機變量是正態(tài)分布,將使概率計算得以簡化。五、正態(tài)及其有關(guān)分布圖正態(tài)概率密度函數(shù)的一般形狀第84頁,課件共172頁,創(chuàng)作于2023年2月當(dāng)連續(xù)的隨機變量的概率密度函數(shù)形式為時,稱X的分布為正態(tài)分布,記為X~,密度函數(shù)中和是X的數(shù)學(xué)期望和方差。當(dāng)和時,稱X服從標準正態(tài)分布,記為X~。第85頁,課件共172頁,創(chuàng)作于2023年2月表正態(tài)分布與標準正態(tài)分布第86頁,課件共172頁,創(chuàng)作于2023年2月x0x-x圖

標準正態(tài)分布的分布函數(shù)第87頁,課件共172頁,創(chuàng)作于2023年2月卡方分布(分布)是一種連續(xù)型隨機變量的概率分布。這個分布是由別奈梅(Benayme)、赫爾默特(Helmert)、皮爾遜分別于1858年、1876年、1900年所發(fā)現(xiàn),它是由正態(tài)分布派生出來的,主要用于列聯(lián)表檢驗。1.卡方分布的數(shù)學(xué)形式設(shè)隨機變量X1,X2,…Xk,相互獨立,且都服從同一的正態(tài)分布N(μ,σ2)。那么,我們可以先把它們變?yōu)闃藴收龖B(tài)變量Z1,Z2,…Zk,k個獨立標準正態(tài)變量的平方和被定義為卡方分布(分布)的隨機變量(讀作卡方)六、卡方分布第88頁,課件共172頁,創(chuàng)作于2023年2月X即所謂具有n個自由度(degreesoffreedom,df)的分布。自由度概念在我們計量經(jīng)濟學(xué)中扮演著重要角色。1.卡方分布的數(shù)學(xué)形式第89頁,課件共172頁,創(chuàng)作于2023年2月

t分布在經(jīng)典統(tǒng)計學(xué)和多元回歸分析中廣為應(yīng)用:它可以從一個標準正態(tài)和一個分布得到。設(shè)Z服從標準正態(tài)分布,而X服從自由度為n的分布。于是,隨機變量便服從自由度為n的t分布,記為T~tn。t分布的自由度得子分母中的隨機變量。t分布的特點是:左右對稱;當(dāng)n很大時,非常接近正態(tài)分布。七、t分布第90頁,課件共172頁,創(chuàng)作于2023年2月如果隨機變量X服從標準正態(tài)分布N(0,1);隨機變量服從自由度為n、方差為2n的分布。并且X和相互獨立,則統(tǒng)計量:服從t分布(注:可以將分子理解為符合正態(tài)分布的參數(shù),分母看作其標準差。第91頁,課件共172頁,創(chuàng)作于2023年2月對于從標準正態(tài)分布中的總體中抽的容量為n的簡單隨機樣本,其樣本均值與樣本標準差S構(gòu)成如下統(tǒng)計量。服從自由度為n-1的t分布,記為t~t(n-1)。注意:這里的分母是子樣標準差除以自由度,實際上是子樣均值的標準差!只有這樣才與分子保持一致性。分子被平均了,分母當(dāng)然也要平均!t分布在小樣本(n<30)統(tǒng)計推斷中占有重要的地位。第92頁,課件共172頁,創(chuàng)作于2023年2月T分布圖形:正態(tài)分布相當(dāng)于標準差為1的t分布。而t分布的標準差多小于1。因而出現(xiàn)這種尾部肥大的現(xiàn)象。正態(tài)分布T分布第93頁,課件共172頁,創(chuàng)作于2023年2月統(tǒng)計學(xué)和計量經(jīng)濟學(xué)中的另一重要分布是F分布。特別是在多元回歸分析中,要用F分布去檢驗假設(shè)。為了定義F隨機變量,令

和,并假定X1和X2獨立,則隨機變量服從一個自由度為(k1,k2)的F分布。記為。F分布即是兩個消去自由度的分布變量的比值八、F分布第94頁,課件共172頁,創(chuàng)作于2023年2月如果隨機變量Xi(i=1,2,3,…n),Yi(i=1,2,3,…n)是相互獨立的,而且服從相同的正態(tài)分布。令第95頁,課件共172頁,創(chuàng)作于2023年2月則統(tǒng)計量服從第一自由度、第二自由度的F分布。記為F~F(,)注:F分布在方差分析中有著重要的作用。例如判斷兩個正態(tài)分布總體的方差是否有顯著差異,需要利用F分布。其分子與分母其實是兩個方差,在進行回歸檢驗時正是利用F函數(shù)這個特點。第96頁,課件共172頁,創(chuàng)作于2023年2月九、分位點0

z(1)標準正態(tài)分布雙側(cè)分位點第97頁,課件共172頁,創(chuàng)作于2023年2月

α

1-α

z0(1)標準正態(tài)分布單側(cè)分位點第98頁,課件共172頁,創(chuàng)作于2023年2月(2)雙側(cè)分位點xf(x)α/2α/21-α1-α/20第99頁,課件共172頁,創(chuàng)作于2023年2月xf(x)0(2)單側(cè)分位點第100頁,課件共172頁,創(chuàng)作于2023年2月(3)T分布的雙側(cè)分位點圖2-9T分布的雙側(cè)分位點xf(x)α/2α/21-α0第101頁,課件共172頁,創(chuàng)作于2023年2月(3)T分布的單側(cè)分位點xf(x)α0第102頁,課件共172頁,創(chuàng)作于2023年2月(4)F分布的雙側(cè)分位點xf(x)α/2α/201-α第103頁,課件共172頁,創(chuàng)作于2023年2月(4)F分布的單側(cè)分位點xf(x)0第104頁,課件共172頁,創(chuàng)作于2023年2月表

隨機變量分布的比較第105頁,課件共172頁,創(chuàng)作于2023年2月一、總體、參數(shù)與隨機抽樣統(tǒng)計推斷指利用來自總體的一個樣本而獲知該總體的某些情況。所謂總體,指任何定義完好的一組對象,這些對象可以是個人、企業(yè)、城市或其他諸多可能性。所謂“獲知”,可以有很多含義,但大致歸類為估計和假設(shè)檢驗兩個范疇。

第三節(jié)數(shù)理統(tǒng)計基礎(chǔ)1、點估計——用某一數(shù)值作為參數(shù)的近似值2、區(qū)間估計——在要求的精度范圍內(nèi)指出參數(shù)可能的取值范圍第106頁,課件共172頁,創(chuàng)作于2023年2月例1:勞動經(jīng)濟學(xué)家想了解中國全體就業(yè)成人的教育回報,問再多受一年教育,工作平均增加的百分數(shù)是多少?要獲得中國全體就業(yè)人口的工資和教育信息既不現(xiàn)實又不經(jīng)濟,但我們可以獲得總體中的一個子集的數(shù)據(jù)。利用收集到的這些數(shù)據(jù),一位勞動經(jīng)濟學(xué)家也許能報告他對再受一年教育的回報的最好估計為7.5%。這就是點估計的一個例子。或者,他想報告一個范圍,比方說“教育的回報在5.6%~9.4%之間”。這是區(qū)間估計的一個例子。一、總體、參數(shù)與隨機抽樣第107頁,課件共172頁,創(chuàng)作于2023年2月例2:城市經(jīng)濟學(xué)家想知道鄰里犯罪計劃是否與低犯罪率有關(guān)。經(jīng)過在取自總體的一個樣本中比較了安排和不安排監(jiān)控計劃的鄰里犯罪率,他可以得到兩結(jié)論之一:鄰里犯罪監(jiān)控計劃對犯罪率確實有影響,或者沒有影響。這個例子就屬于假設(shè)檢驗的范疇。一、總體、參數(shù)與隨機抽樣第108頁,課件共172頁,創(chuàng)作于2023年2月統(tǒng)計推斷的第一步就是要明確所關(guān)注的總體,而且一定要使之非常具體。一旦明確了總體是什么,就可對所關(guān)注的總體關(guān)系建立或設(shè)定一個模型。這個模型將涉及一些概率分布或概率分布的特征,而這又取決于一些未知參數(shù)。所謂參數(shù),就是決定變量關(guān)系之方向和強度的一些常數(shù)。如勞動經(jīng)濟學(xué)的例子中,所關(guān)注的參數(shù)是總體中的教育回報(率)。一、總體、參數(shù)與隨機抽樣第109頁,課件共172頁,創(chuàng)作于2023年2月令Y為一個隨機變量,代表著概率密度函數(shù)為f(y;θ)的一個總體,其中f(y;θ)依賴于單個參數(shù)θ

。假定除了θ值未知外,Y的概率密度函數(shù)pdf是已知的。不同的θ值將意味著不同的概率分布,因此我們對θ值感興趣。如果我們能得到該總體的某種樣本,就能了解θ的某些情況。最容易處理的抽樣方案是隨機抽樣。抽樣第110頁,課件共172頁,創(chuàng)作于2023年2月若Y1,Y2,···Yn是具有同一概率密度函數(shù)f(y;θ)的獨立隨機變量,我們稱為來自f(y;θ)的隨機樣本[或者說來自由所代表的總體的一個隨機樣本]。

當(dāng)是來自密度f(y;θ)的一個隨機樣本時,我們又稱Yi是取自f(y;θ)的獨立同分布樣本。抽樣第111頁,課件共172頁,創(chuàng)作于2023年2月“有限樣本”一詞來自如下事實:無論樣本容量如何,所討論的性質(zhì)對任何樣本容量都成立。有時把這些性質(zhì)叫做小樣本性質(zhì)。1.估計量與估計值給定一個隨機樣本,它來自一個取決于某未知參數(shù)θ的總體分布,θ的一個估計量就是賦予樣本每個可能結(jié)果一個θ值的法則。這個法則在進行抽樣之前就已經(jīng)確立,具體而言,無論實際得到什么樣的數(shù)據(jù),這個法則都不會改變。二、估計量的有限樣本性質(zhì)第112頁,課件共172頁,創(chuàng)作于2023年2月作為估計量的一個例子,令為取自均值為μ的總體的一個隨機樣本。μ的一個估計量,就是這個隨機樣本的均值我們把叫做樣本均值,但是它不同于我們在代數(shù)知識中作為一個描述統(tǒng)計量而定義的一個數(shù)集的樣本均值。這里是一個估計量。給定隨機變量Y1,Y2,···Yn的任何一種結(jié)果,我們都用同樣的法則去估計μ:取其平均。對于實際結(jié)果,估計值就是該樣本的均值:1.估計量與估計值第113頁,課件共172頁,創(chuàng)作于2023年2月假設(shè)我們得到美國10個城市的如下失業(yè)率樣本:例:城市失業(yè)率城市失業(yè)率123456789105.16.49.24.17.58.32.63.55.87.5我們對美國平均城市失業(yè)率的估計值是。一般地說,每個樣本都有一個不同的估計值,但是求估計值的法則是一樣的,不管在樣本中出現(xiàn)的是哪些城市,也不管樣本中有多少個城市。第114頁,課件共172頁,創(chuàng)作于2023年2月一個估計量的第一個重要性質(zhì)就是關(guān)于它的期望值。

無偏估計量:若θ的估計量W對一切可能的θ值,都有E(W)=θ則W是一個無偏估計量(unbiasedestimator)2.無偏性第115頁,課件共172頁,創(chuàng)作于2023年2月一個估計量若是無偏的,則其概率分布的期望值就等于它所估計的參數(shù)。無偏性并不是說我們用任何一個特定樣本得到的估計值等于θ,或者很接近θ。而是說,如果我們能夠從總體中抽取關(guān)于Y的無限多個樣本,并且每次都計算一個估計值,那么將所有隨機樣本的這些估計值平均起來,我們便得到θ。由于在大多數(shù)應(yīng)用中,我們僅使用一個隨機樣本,所以這個思維實驗有點抽象。2.無偏性第116頁,課件共172頁,創(chuàng)作于2023年2月一個估計量的無偏性和可能偏誤的大小取決于Y的分布和函數(shù)h。通常,Y的分布不是我們所能控制的(雖然我們常常為這個分布選擇一個模型):它由自然規(guī)律或社會力量來決定。但法則h的選擇則操縱在我們手中,我們?nèi)粝胍粋€無偏估計量,就必須對h作相應(yīng)的選擇。可以證明,有些估計量在一般情形下是無偏的。2.無偏性第117頁,課件共172頁,創(chuàng)作于2023年2月現(xiàn)在我們來證明,樣本均值是總體均值μ的一個無偏估計量,不管其背后的總體如何分布。2.無偏性第118頁,課件共172頁,創(chuàng)作于2023年2月令Wn為θ基于容量為n的一個樣本Y1,Y2,···Yn的一個估計量。那么,若隨著,對任一ξ>0,都有Wn便是θ的一個一致估計量。若Wn不是θ的一致估計量,則說它是非一致性的。當(dāng)Wn是一致的,我們也說θ是Wn的概率極限,記作plim(Wn)=θ。3.一致性第119頁,課件共172頁,創(chuàng)作于2023年2月和無偏性不一樣——無偏性是估計量在給定樣本容量下的一個特征——一致性描述了估計量的抽樣分布在樣本容量變大時的形態(tài)。為了強調(diào)這一點,我們在陳述上述定義時,就已對估計量加上了樣本容量n這個下標,并將在本節(jié)中始終保持這個慣常做法。前述方程意味著,Wn的分布越來越集中于θ,粗略地講,對于越來越大的樣本容量,Wn離開θ很遠的可能性越來越小。3.一致性第120頁,課件共172頁,創(chuàng)作于2023年2月無偏估計量不一定是一致的,但那些隨著樣本容量增大而方差縮減至零的無偏估計量是一致的。這個結(jié)果可規(guī)范陳述如下:若Wn是θ的無偏估計量,且隨著有Var(Wn)→0,則plim(Wn)=θ。利用全部數(shù)據(jù)樣本的無偏估計量,通常其方差都隨著樣本容量的擴大而縮減至零,因而是一致的。一致估計量的一個很好的例子,是取自均值為μ和方差為的總體的一個隨機樣本的均值。該樣本均值對μ是無偏的。對于任何一個樣本容量n,我們都推導(dǎo)出。因此,隨著n→∞,有,所以,除了無偏外,還是μ的一致估計量。3.一致性第121頁,課件共172頁,創(chuàng)作于2023年2月

是μ的一致估計量,即使不存在Var(),這一結(jié)論也是成立的。這個經(jīng)典的結(jié)論被稱為大數(shù)定律。

大數(shù)定律令Y1,Y2,···Yn是均值為μ的獨立同分布隨機變量,于是plim()=μ大數(shù)定律意味著,如果我們對估計總體均值μ感興趣,通過選取一個足夠大的樣本,便能得到一個任意接近μ的數(shù)。這個基本結(jié)論和概率極限的基本性質(zhì)相結(jié)合,便可以證明一些相當(dāng)復(fù)雜的估計量時一致的。3.一致性第122頁,課件共172頁,創(chuàng)作于2023年2月

中心極限定理是概率與統(tǒng)計學(xué)中最強有力的結(jié)論之一。它表明任何(具有有限方差)的總體的一個隨機樣本的均值,經(jīng)過標準化后,都服從一個漸近標準正態(tài)分布。

中心極限定理令為一個均值為μ和方差為б2的隨機樣本。于是,服從一個漸近標準正態(tài)分布。4.漸近正態(tài)性第123頁,課件共172頁,創(chuàng)作于2023年2月上式中的變量Zn就是的標準化形式:我們從中減去了,然后除以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論