




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章回憶:《計量經濟學》基本數學工具代數知識數理統計基礎主要內容概率論基礎第1頁求和運算子(SummationOperator)是用以表達多種數求和運算一種縮略符號。假如表達n個數一種序列,那么我們就把這n個數總和寫為:第一節代數知識一、求和運算子與描述記錄量1、求和運算子第2頁性質SUM.1:對任意常數c,
求和運算子性質性質SUM.2:對任意常數c,
性質SUM.3:若是n個數對構成一種集合,且a和b是常數,則
第3頁2、平均數給定n個數,我們把它們加起來再除以n,便算出它們平均數(average)或均值:當這些是某特定變量(如受教育年數)一種數據樣本時,我們常稱之為樣本均值,以強調它是從一種特定數據集計算出來。樣本均值是描述記錄量(DescriptiveStatistic)一種例子;此時,這個記錄量描述了點集集中趨勢。第4頁均值性質假設我們取x每次觀測值并從中減去其均值:(這里“d”表達對均值離差)。那么,這些離差之和必為零:第5頁均值離差重要性質離差平方和等于平方和減去平方n倍:請加以證明。另請證明:給定兩個變量數據集
第6頁集中趨勢另一種表達:中位數均值是我們所關注集中趨勢指標,但有時用中位數(Median)或樣本中位數表達中心值也有價值。為了得到n個數中位數,我們先把值按從小到大次序排列。然后,若n是奇數,則樣本中位數就是按次序居中那個數,例如,給定一組數字,中位數就是2。一般說來,中位數和均值相比,對數列中級(大或小)值變化沒那么敏感。若n是偶數,則居中數字便有兩個,此時定義中位數措施就不是唯一。一般把中位數定義為兩個居中數字均值(仍指從小到大排序數列)。第7頁二、線性函數性質
假如兩個變量x和y關系是:我們便說y是x線性函數(LinearFunction):而和是描述這一關系兩個參數,為截距(Intercept),為斜率(Slope)。一種線性函數定義特性在于,y變化量總是x變化量倍:其中,表達“變化量”。換句話說,x對y邊際效應(MarginalEffect)是一種等于常數。第8頁例2.1.1線性住房支出函數假定每月住房支出和每月收入關系式是Housing=164+0.27ine那么,每增長1元收入,就有0.27元用于住房支出,假如家庭收入增長200元,那么住房支出就增長0.27×200=54元。機械解釋上述方程,即時一種沒有收入家庭也有164元住房支出,這當然是不真實。對低收入水平家庭,這個線性函數不能很好描述housing和ine之間關系,這就是為何我們最終還得用其他函數形式來描述這種關系。第9頁圖2.1.1Housing=164+0.27ine圖形例2.1.1線性住房支出函數第10頁例2.1.1線性住房支出函數在上述方程中,把收入用于住房邊際消費傾向(MPC)是0.27。它不一樣樣于平均消費傾向(APC):APC并非常數,它總比MPC大,但伴隨收入增長越來越靠近MPC。第11頁線性函數性質多于兩個變量線性函數:假定y與兩個變量和有一般形式關系:由于這個函數圖形是三維,因此相稱難以想象,不過仍然是截距(即=0和=0時y取值),且和都是特定斜率度量。由方程(A.12)可知,給定和變化量,y變化量是若不變化,即,則有因此是關系式在坐標上斜率:第12頁由于它度量了保持固定期,y怎樣隨而變,因此常把叫做對y偏效應(PartialEffect)。由于偏效應包括保持其他原因不變,因此它與其他條件不變(CeterisParibus)概念有親密聯絡,參數可作類似解釋:即若,則因此,是對y偏效應。線性函數性質第13頁假定大學生每月對CD需求量與CD價格和每月零花錢有如下關系:式中,price為每張碟價格,ine以元計算。需求曲線表達在保持收入(和其他原因)不變狀況下,quantity和price關系。例2.1.2對CD需求第14頁圖2.1.2quantity=120-9.8price+0.03ine在ine固定為900元時圖形例2.1.2對CD需求第15頁圖2.1.2描繪了在收入水平為900元時二維圖形。需求曲線斜率-9.8是價格對數量偏效應:保持收入固定不變,假如CD碟價格增長1元,那么需求量就下跌9.8。(我們把CD碟只能離散購置事實抽象化。)收入增長只是使需求曲線向上移動(變化了截距),但斜率仍然不變。例2.1.2對CD需求第16頁線性函數基本性質:不管x初始值是什么,x每變化一種單位都導致y同樣變化。x對y邊際效應是常數,這對許多經濟關系來說多少有點不真實。例如,邊際酬勞遞減這個重要經濟概念就不符合線性關系。為了建立多種經濟現象模型,我們需要研究某些非線性函數(nonlinearfunction)。非線性函數特點是,給定x變化,y變化依賴于x初始值。三、若干特殊函數及其性質第17頁1.二次函數刻畫酬勞遞減規律一種簡樸措施,就是在線性關系中添加一種二次項。考慮方程式式中,,和為參數。當時,y和x之間關系呈拋物線狀,并且可以證明,函數最大值出目前第18頁1.二次函數例如,若y=6+8x-2x2。(從而=8且=-2),則y最大值出目前x*=8/4=2處,并且這個最大值是6+8×2-2×(2)2=14。圖2.1.3y=6+8x-2x2
圖形第19頁對方程式意味著x對y邊際效應遞減(diminishingmarginaleffect),這從圖中清晰可見,應用微積分知識,也可以通過求這個二次函數一階導數得出。斜率=方程右端是此二次函數對x導數(derivative)。同樣,則意味著x對y邊際效應遞增(increasingmarginaleffect),二次函數圖形就呈U行,函數最小值出目前點處。1.二次函數第20頁在計量經濟分析中起著最重要作用非線性函數是自然對數(naturelogarithm),或簡稱為對數函數(logfunction),記為尚有幾種不一樣樣符號可以表達自然對數,最常用是或。當對數使用幾種不一樣樣底數時,這些不一樣樣符號是有作用。目前,只有自然對數最重要,因此我們都用表達自然對數。2.自然對數第21頁2.自然對數圖2.1.4y=log(x)圖形第22頁2.自然對數從圖能看出如下性質:1.當y=log(x)時,y和x關系體現出邊際酬勞遞減。2.當y=log(x)時,x對y永遠沒有負效應:函數斜率伴隨x增大越來越靠近零,然而這個斜率永遠到不了零,因此更不會是負。3.log(x)可正可負:log(x)<0,0<x<1;log(1)=0;log(x)>0,x>14.某些有用性質(牢記):log(x1·x2)=log(x1)+log(x2),x1,x2>0log(x1/x2)=log(x1)-log(x2),x1,x2>0log(xc)=c·log(x),x>0,c為任意實數第23頁2.自然對數對數可用于計量經濟學應用中多種近似計算。1.對于x≈0,有log(1+x)≈x。這個近似計算伴隨x變大而越來越不精確。2.兩對數之差可用作比例變化近似值。令x0和x1為兩個正數,可以證明(運用微積分),對x微小變化,有假如我們用100乘以上述方程,并記那么,對x微小變化,便有“微小”含義取決于詳細狀況。第24頁2.自然對數近似計算作用:定義y對x彈性(elasticity)為換言之,y對x彈性就是當x增長1%時y百分數變化。若y是x線性函數:,則這個彈性是它明顯取決于x取值(彈性并非沿著需求曲線保持不變)。第25頁2.自然對數不僅在需求理論中,在許多應用經濟學領域,彈性都是非常重要。在許多狀況下,使用一種常彈性模型都很以便,而對數函數能協助我們設定這樣模型。假如我們對x和y都使用對數近似計算,彈性就近似等于因此,一種常彈性模型(constantelasticitymodel)可近似描述為方程式中,為y對x彈性(假定x,y>0)。此類模型在經驗經濟學中飾演著重要角色。目前,式中只是靠近于彈性這一事實并不重要,可以忽視。第26頁例2.1.3常彈性需求函數若q代表需求量而p代表價格,并且兩者關系為則需求價格彈性是-1.25.初略地說,價格每增長1%,將導致需求量下降1.25%。第27頁2.自然對數在經驗研究工作中還常常出現使用對數函數其他也許性。假定y>0,且則,從而。由此可知,當y和x有上述方程所示關系時,第28頁例2.1.4對數工資方程假設小時工資與受教育年數有如下關系:根據前面所述方程,有由此可知,多受一年教育將使小時工資增長約9.4%。一般把%△y/△x稱為y對x半彈性(semi-elasticity),半彈性表達當x增長一種單位時y百分數變化。在上述模型中,半彈性是個常數并且等于,在上述例子中,我們可以以便把工資和教育關系概括為:多受一年教育——不管所受教育起點怎樣——都將使工資提高約9.4%。這闡明了此類模型在經濟學中重要作用。第29頁2.自然對數另一種關系式在應用經濟學中也是故意義:其中,x>0。若取y變化,則有,這又可以寫為。運用近似計算,可得當x增長1%時,y變化個單位。第30頁例2.1.5勞動供應函數假定一種工人勞動供應可描述為式中,wage為小時工資而hours為每周工作小時數,于是,由方程可得:換言之,工資每增長1%,將使每周工作小時增長約0.45或略不不小于半個小時。若工資增長10%,則或約四個半小時。注意:不適宜對更大工資百分數變化應用這個近似計算。第31頁考慮方程此處log(y)是x線性函數,不過怎樣寫出y自身作為x一種函數呢?指數函數(exponentialfunction)給出了答案。我們把指數函數寫為y=exp(x),有時也寫為,但在我們課程中這個符號不常用。指數函數兩個重要數值是exp(0)=1和exp(1)=2.7183(取4位小數)。
3.指數函數第32頁3.指數函數圖2.1.4y=exp(x)圖形第33頁從上圖可以看出,exp(x)對任何x值均有定義,并且總不小于零。指數函數在如下意義上是對數函數反函數:對所有x,均有log﹝exp(x)﹞=x,而對x>0,有exp﹝log(x)﹞=x。換言之,對數“解除了”指數,反之亦然。對數函數和指數函數互為反函數。指數函數兩個有用性質是exp(x1+x2)=exp(x1)exp(x2)和exp﹝c·log(x)﹞=xc3.指數函數第34頁記憶:經濟學中常用某些函數及其導數有
4.微分學第35頁當y是多元函數時,偏導數(partialderivative)概念便很重要。假定y=f(x1,x2),此時便有兩個偏導數,一種有關x1,另一種有關x2。y對x1偏導數記為,就是把x2看做常數時方程對x1一般導數。類似,就是固定x1時方程對x2導數。若則這些偏導數可被視為經濟學所定義偏效應。4.微分學第36頁把工資與受教育年數和工作經驗(以年計)相聯絡一種函數是exper對wage偏效應就是上式對exper偏導數:這是增長一年工作經驗所導致工資近似變化。注意這個偏效應與exper和educ初始水平均有關系。例如,一種從educ=12和exper=5開始工人,再增長一年工作經驗,將使工資增長約0.19-0.08×5+0.007×12=0.234元。精確變化通過計算,成果是0.23,和近似計算成果非常靠近。例2.1.6含交互項工資方程第37頁在最小化或最大化單或多變量函數時,微分計算起著重要作用。假如是一種k元可微函數,則在所有也許xj值中最小化或最大化f必要條件是換言之,f所有偏導數在處都必須取值為零。這些條件被稱為函數最小化或最大化一階條件(firstordercondition)。4.微分學第38頁參看附件習題冊。思索題第39頁一、隨機變量及其概率分布假設我們擲一枚錢幣10次,并計算出現正面次數,這就是一種試驗(experiment)例子。一般地說,一種試驗是指至少在理論上可以無限反復下去任何一種程序,并且它有一種定義完好成果集。一種隨機變量(randomvariable)是指一種具有數值特性并由一種試驗來決定其成果變量。
第二節概率論基礎第40頁按照概率和記錄學通例,我們一律用大寫字母如常見W,X,Y和Z表達隨機變量,而用對應小寫字母w,x,y和z表達隨機變量特定成果。例如,在擲幣試驗中,令X為一枚錢幣投擲10次出現正面次數。因此X并不是任何詳細數值,但我們懂得X將在集合中取一種值。比方說,一種特殊成果是x=6。我們用下標表達一系列隨機變量。例如,我們記錄隨機選擇20個家庭去年收入。可以用X1,X2,··,X20表達這些隨機變量,并用x1,x2,···,x20表達其特殊成果。一、隨機變量及其概率分布第41頁如定義所言,雖然隨機變量描述是某些定性事件,我們也總定義它成果是數值。例如,考慮只擲一枚錢幣,其兩個成果是正面和背面。我們可以定義一種隨機變量如下:假如出現正面則X=1;假如出現背面則X=0。一種只能取0和1兩個值隨機變量叫做貝努利(或二值)隨機變量〔Bernoulli(orbinary)randomvariable〕。X~Bernoulli(θ)(讀作“X服從一種成功概率為θ貝努利分布):P(X=1)=θ,P(X=0)=1-θ一、隨機變量及其概率分布第42頁1.離散隨機變量離散隨機變量(discreterandomvariable)是指一種只取有限個或可數無限個數值隨機變量。“可數無限個”:雖然隨機變量可取無限個值,但這些值可以和正整數一一對應。貝努力隨機變量是離散隨機變量最簡樸例子。
一、隨機變量及其概率分布第43頁一種離散隨機變量要由它所有也許值和取每個值對應概率來完整描述。假如X取k個也許值其概率p1,p2,···,pk被定義為pj=P(X=xj),j=1,2,···,k(讀作:“X取值xj概率等于pj”。)其中,每個pj都在0-1之間,并且p1+p2+···+pk=11.離散隨機變量第44頁X概率密度函數(probabilitydensityfunction,pdf)概括了X也許成果及其對應概率信息:
并且對某個j,但凡不等于xjx均有f(x)=0。換言之,對任何實數x,f(x)都是隨機變量X取該特定值x概率。當我們設計多于一種隨機變量時,有時需要給所考慮pdf加一種下標:例如fx是Xpdf,fY是Ypdf等等。1.離散隨機變量第45頁給定任一離散隨機變量pdf,就不難計算有關該隨機變量任何事件概率。例如,設X為一名籃球運動員在兩次罰球中命中次數。因此X三個也許值是{0,1,2}。假定Xpdf是f(0)=0.20,f(1)=0.44和f(2)=0.36這三個概率之和必然為1.運用這個pdf,我們能算出該運動員至少投中一球概率:P(X≥1)=P(X=1)+P(X=2)=0.44+0.36=0.80。Xpdf如下圖示:1.離散隨機變量第46頁012xf(x)1.離散隨機變量圖2.2.1兩次罰球命中次數pdf第47頁2.持續隨機變量持續隨機變量(continuousrandomvariable)是指一種取任何實數概率都為零變量。這個定義有點違反直覺,由于在任何應用中,我們最終都會觀測到一種隨機變量獲得某種成果。這里思想是,一種持續隨機變量X也許取值如此之多,以致我們無法用正整數去計算,因而,邏輯上一致性就規定X必須以零概率取每一種值。
一、隨機變量及其概率分布第48頁在計算持續隨機變量概率時,討論一種持續隨機變量取某特定值概率是沒故意義,最以便是使用累積分布函數(cumulativedistributionfunction,cdf)。設X為任意隨機變量,它對任何實數xcdf被定義為F(x)≡P(X≤x)對于一種持續隨機變量,F(x)就是概率密度函數f之下、點x以左面積。由于F(x)就是一種概率,因此它總是介于0-1之間。此外,若x1<x2,則P(X≤x1)≤P(X≤x2),即F(x1)≤F(x2)。這意味著cdf是x一種增(至少非減)函數。2.持續隨機變量第49頁cdf有如下兩個對計算概率頗為有用重要性質:1.對任何數c,P(X>c)=1-F(c)2.對任何兩個數a<b,P(a<X≤b)=F(b)-F(a)在我們學習計量經濟課時,用cdf僅計算持續隨機變量概率,因此在概率命題中不等式與否嚴格不等便無所謂。也就是說,對于一種持續隨機變量X,有P(X≥c)=P(X>c)和P(a<X<b)=P(a≤X≤b)=P(a≤X<b)=P(a<X≤b)對于概率和記錄學中所有重要持續分布,其累積分布函數已被制成表格,其中最為人們熟知是正態分布。2.持續隨機變量第50頁1.聯合分布與獨立性令X和Y為離散隨機變量。那么(X,Y)聯合分布(jointdistribution)由它們聯合概率密度函數充足描述:上式右端是X=x和Y=y概率。若我們懂得X和Ypdf,就輕易得到它們聯合pdf。詳細而言,我們說X和Y互相獨立充要條件是,對所有x和y,均有式中,fX為Xpdf而fY為Ypdf。二、聯合分布、條件分布與獨立性第51頁在多種隨機變量背景中,fX和fY這兩個pdf常被稱為邊緣概率密度函數(marginalprobabilitydensityfunction),以辨別于聯合pdf,即fX,Y。上述獨立性定義合用于離散和持續隨機變量。假如X和Y都是離散,那么上式就等同于P(X=x,Y=y)=P(X=x)·P(Y=y)由于僅需要懂得P(X=x)與P(Y=y),因此計算聯合概率相稱輕易。若兩隨機變量不獨立,則稱它們是相依。1.聯合分布與獨立性第52頁考慮籃球運動員兩次罰球。令X為貝努利隨機變量:假如第一次命中它等于1,否則等于0。再令Y為貝努利隨機變量:假如第二次命中它等于1,否則等于0。假設該運動員每次罰球命中率都是80%,即P(X=1)=P(Y=1)=0.8,問兩罰兩中概率是多少?例2.2.1罰球命中率若X和Y獨立,則很輕易回答這個問題:P(X=1,Y=1)=P(X=1)·P(Y=1)=0.8×0.8=0.64。因此,有64%機會兩罰兩中。若第二次命中機會依賴于第一次與否命中,即X和Y不獨立,這種簡樸計算便不再對旳。第53頁隨機變量獨立性是一種十分重要概念。若X和Y獨立,則懂得X成果并不變化Y出現多種也許成果概率,反之亦然。有關獨立性一種有用結論是,若X和Y獨立,而我們對任意函數g和h定義兩個新隨機變量g(X)和h(Y),則這些新隨機變量也是獨立。1.聯合分布與獨立性第54頁在計量經濟學中,我們一般也對一種隨機變量(稱之為Y)與此外一種或多種隨機變量聯絡感愛好。暫且假設我們只對一種變量影響感愛好,并稱之為X。有關X怎樣影響Y,我們所能懂得,都包括在給定X時Y條件分布(conditionaldistribution)中,由條件概率密度函數概括這一信息被定義為:對所有滿足x值,均有2.條件分布第55頁當X和Y都是離散變量時,上式可解釋為其中,上式右端讀作“給定X=x時Y=y概率”。當Y是持續變量時,由于前述理由,不能直接解釋為概率,但可以通過計算條件概率密度函數之下面積來求出條件概率。條件分布一種重要性質是,若X和Y是獨立隨機變量,懂得X取什么值無助于確定Y取各值概率(反之亦然)。這就是說,且。2.條件分布第56頁再次考慮籃球員兩次投籃例子。假定條件密度是這意味著球員第二次罰球命中概率依賴于第一次罰球與否命中:假如第一次命中,則第二次命中概率是0.85;假如第一次失誤,則第二次命中概率是0.70。這就是說,X和Y不是獨立,而是有關。我們若懂得P(X=1),便可以計算P(X=1,Y=1)。假定第一次命中概率是0.8,即P(X=1)=0.8,那么我們得到兩罰兩中概率為P(X=1,Y=1)=P(Y=1|X=1)·P(X=1)=0.85×0.8=0.68例2.2.2罰球命中率第57頁多數狀況下我們只對隨機變量分布少數幾種性質感愛好。這些特性可提成三類:集中趨勢度量、變異或分散程度度量以及兩個隨機變量之間關聯性度量。1.集中趨勢一種度量:期望值期望值是我們在計量經濟學學習中碰到最重要概率性概念之一。設X為一隨機變量。它期望值(expectedvalueorexpectation),記做E(X),就是對X所有也許值一種加權平均。權數由概率密度函數決定。有時期望值又被稱為總體均值,尤其是在我們強調X代表了總體中某個變量時。三、概率分布特性第58頁當X是取有限個值[比方說]離散隨機變量時,期望值精確定義最為簡樸。令f(x)表達X概率密度函數,則X期望值為加權平均:給定pdf在X每個也許成果處取值,這很輕易計算。1.集中趨勢一種度量:期望值第59頁假定X分別以概率1/8、1/2和3/8取值-1、0和2,則
E(X)=(-1)×1/8+0×(1/2)+2×(3/8)=5/8例2.2.3計算一種期望值第60頁假如X是一種持續隨機變量,則E(X)被定義為一種積分:這仍然可以解釋為一種加權平均。和離散情形不一樣樣,E(X)總是X也許成果之一。本課程中,雖然我們需要用到概率論中某些特殊隨機變量期望值有關熟悉結論,但我們并不需要用積分去計算期望值。1.集中趨勢一種度量:期望值第61頁給定隨機變量X和函數g(·),可以產生一種新隨機變量g(X)。例如,若X是一隨機變量,則X2和log(X)(X>0)也是隨機變量。g(X)期望值仍然是一種加權平均:
或者,對一種持續隨機變量來說,1.集中趨勢一種度量:期望值第62頁例2.2.3:假定X分別以概率1/8、1/2和3/8取值-1、0和2,則:
E(X)=(-1)×1/8+0×(1/2)+2×(3/8)=5/8
對于例2.2.3中隨機變量,令g(X)=X2,便有E(X2)=(-1)2×1/8+(0)2×(1/2)+(2)2×(3/8)=13/8例2.2.4X2期望值第63頁性質1.對任意常數c,E(c)=c。性質2.對任意常數a和b,E(aX+b)=aE(X)+b。性質3.假如是常數而是隨機變量,則或者,運用求和符號,作為一種特例,取每個aj=1,我們有因此,和期望值就是期望值之和。在數理記錄推導中常常用到這個性質。2.期望值性質第64頁令X1,X2和X3分別為比薩店在某日發售小、中、大比薩個數。這些隨機變量期望值是E(X1)=25,E(X2)=57和E(X3)=40。小、中、大比薩價格分別是5.50、7.60和9.15美元。因此,該日發售比薩期望收入是E(5.5X1+7.60X2+9.15X3)=5.50E(X1)+7.60E(X2)+9.15E(X3)=5.5×25+7.60×57+9.15×40=936.70即936.70美元。這不過是期望收入,詳細某一天實際收入一般都會有所差異。例2.2.5求期望收入第65頁度量集中趨勢另一種措施是用中位數(median)。若X是持續,則X中位數(比方說m)就是這樣一種數:pdf之下二分之一面積在m之左,另二分之一面積在m之右。當X是離散且取有奇數個值時,中位數就是按大小排序后居中一種數。若X也許取偶數個值,則實際上有兩個中位數;有時取這兩個數平均,便得到唯一一種中位數。一般而言,中位數,有時記為Med(X),和期望值E(X)是不相似。作為集中趨勢度量,不能說哪一種比另一種更好,兩者都是度量X分布中心有效措施。2.集中趨勢另一種度量:中位數第66頁盡管一種隨機變量集中趨勢頗有價值,但它還不能告知我們有關這個隨機變量分布一切。下圖給出了兩個具有相似均值隨機變量pdf。顯然X分布比Y分布更緊密地集中在其中心周圍。3.變異性度量:方差與原則差圖2.2.2有相似均值但不相似分布隨機變量fXfY第67頁對一種隨機變量X,令μ=E(X)。為了度量X離其期望值多遠,有許多種措施,而最簡樸一種代數措施就是用差異平方(X-μ)2。(平方是為了消除距離度量符號,由此得到正值符合我們對距離直觀認識。)因這一距離隨X每一成果而變,故自身就是一種隨機變量。正如我們需要用一種數來總結X集中趨勢那樣,我們也需要用一種數來告訴我們X平均而言離μ有多遠。一種這樣數就是方差(variance),它告訴我們X對其均值期望距離:方差有時記為,由方程知方差必然非負。4.方差第68頁性質1.當且僅當存在常數c使得P(X=c)=1時[此時E(X)=c],Var(X)=0。也就是說,任何常數方差都是零,并且,若一種隨機變量有零方差,則它本質上就是常量。性質2.對任意常數a和b,均有Var(aX+b)=a2Var(X)。這意味著,把一種常數加到一種隨機變量上不會變化其方差,但用一種常數去乘一種隨機變量使其方差增大該常數平方倍。例如,若X指攝氏溫度,而Y=32+(9/5)X為華氏溫度,則Var(Y)=(9/5)2Var(X)=(81/25)Var(X)方差兩個重要性質第69頁一種隨機變量原則差,記為sd(X),就是它方差正平方根:sd(X)≡+。原則差有時又記做。原則差有兩個重要性質可從方差兩個性質中直接推出。性質1.對任意常數c,sd(c)=0性質2.對任意常數a和b,sd(aX+b)=|a|sd(X)尤其是,若a>0,則sd(aX)=a·sd(X)。5.原則差第70頁作為方差和原則差性質一種應用——并且自身也是有實際意義一種問題——假如給定隨機變量X,我們將它減去其均值μ并除以其原則差б,便定義了一種新隨機變量Z≡這又可寫為Z=aX+b,其中a=(1/б)而b=-(μ/б)。可得:E(Z)=aE(X)+b=(μ/б)-(μ/б)=0Var(Z)=a2Var(X)=б2/б2=1因此,隨機變量Z均值為零,方差(或者原則差)為1。這一過程有時被稱為將隨機變量X原則化,而Z則叫做原則化隨機變量(standardizedrandomvariable)。5.原則化一種隨機變量第71頁1.關聯度:協方差與有關雖然兩個隨機變量聯合pdf完整地描述了它們之間關系,但對于它們大體怎樣互相變動,仍需要一種扼要度量手段。正準期望值和方差同樣,此類似于用一種數字來概括整個分布某首先,目前要概括便是兩個隨機變量聯合pdf。四、聯合與條件分布特性第72頁兩個隨機變量X和Y之間協方差(covariance)(有時也叫做總體協方差,以強調它考慮是描述一種總體兩個隨機變量之間關系),被定義為乘積(X-μX)(Y-μY)期望值:有時又記為。若,則平均而言,當X超過其均值時,Y也超過其均值;若,則平均而言,當X超過其均值時,Y低于其均值。2.協方差第73頁計算幾種有用表達式如下:協方差度量兩個隨機變量之間線性相依性(lineardependence)。一種正協方差表達兩隨機變量同向移動,而一種負協方差則表達兩隨機變量反向移動。2.協方差第74頁性質Cov.1:若X和Y互相獨立,則注意:此性質反命題并不成立:X和Y之間協方差為零并不意味著X和Y互相獨立。性質Cov.2:對任意常數a1,b1,a2和b2,均有此性質重要含義在于,兩個隨機變量之間協方差會由于將兩者或者兩者之一乘以一種常數倍而變化。這在經濟學中之因此重要,是由于諸如貨幣變量和通貨膨脹率等,都可使用不一樣樣度量單位進行定義而不變化其實質。協方差性質第75頁最終,懂得任何兩隨機變量之協方差絕對值必然不會超過它們原則差之積也有用處,此即著名柯西-施瓦茨不等式(Cauchy-Schwartzinequality)。性質COV.3協方差性質第76頁假定我們想懂得勞動總體中受教育程度和年薪之間關系,我們就可令X代表教育,Y代表薪水,然后計算它們協方差。然而我們得到答案卻取決于教育和薪水度量單位。協方差性質Cov.2意味著,教育和薪水之間協方差,視薪水是以美元還是以千美元度量或者教育是以月還是以年計算而定。很明顯,變量度量單位選擇對它們有多強關系并沒有影響。不過它們之間協方差卻與度量單位有關。3.有關系數第77頁取決于度量單位是協方差一種缺陷。為克服這一缺陷,現引進X和Y有關系數(correlationcoefficient):X和Y有關系數有時記做(并且有時稱總體有關)。3.有關系數第78頁性質Corr.1-1≤Corr(X,Y)≤1若Corr(X,Y)=0,或等價地Cov(X,Y)=0,則X和Y之間就不存在線性關系,并稱X和Y為不有關隨機變量(uncorrelatedrandomvariables);否則X和Y就是有關。Corr(X,Y)=1意味著一種完全正線性關系,意思是說,我們對某常數a和某常數b>0可以寫Y=a+bX。Corr(X,Y)=-1則意味著一種完全負線性關系,使得對某個b<0有Y=a+bX。+1和-1兩個極端情形很少出現。靠近1或-1值便意味著較強線性關系。3.有關系數第79頁性質Corr.2對于常數a1,b1,a2和b2,若a1a2>0,則Corr(a1X+b1,a2Y+b2)=Corr(X,Y)若a1a2<0,則Corr(a1X+b1,a2Y+b2)=-Corr(X,Y)作為一種例子,假定薪水和教育總體有關系數是0.15.這一度量將與用美元、千美元或任何其他單位計算薪水都無關;與用年、季、月或其他單位來衡量受教育時間也無關。3.有關系數第80頁一旦定義了協方差和有關系數,就可以把方差重要性質完整地列出來。性質VAR.3對于常數a和b,有由此可知,若X和Y不有關(從而Cov(X,Y)=0)則和在后一情形中,要注意為何差方差是(兩個)方差之和,而不是方差之差。4.隨機變量之和方差第81頁例:令X為星期五夜晚某酒店賺到利潤,而Y為接下來星期六夜晚賺到利潤。因此,Z=X+Y就是這兩個夜晚賺利潤。假定X和Y均有一種300美元期望值和一種15美元原則差(因而方差為225)。兩夜晚期望利潤將是E(Z)=E(X)+E(Y)=2×300=600美元。若X和Y獨立,從而它們也不有關,則總利潤方差便是兩個方差之和:Var(Z)=Var(X)+Var(Y)=2×225=450。于是總利潤原則差是,約為21.21美元。4.隨機變量之和方差第82頁從兩個變量推廣到多于兩個變量情形。若隨機變量中每一種變量與集合中其他任何一種變量都不有關,我們便稱其為兩兩不有關隨機變量(pairwiseuncorrelatedrandomvariables)。也就是說,對所有,均有4.隨機變量之和方差第83頁性質VAR.4若是兩兩不有關隨機變量且是常數,則用求和符號便可寫為此性質一種特殊情形就是,對所有i都取ai=1.這時,對兩兩不有關隨機變量來說,和方差就是方差之和:4.隨機變量之和方差第84頁協方差和有關系數都是對兩個隨機變量之間線性關系度量,并且對稱地處理兩者。在社會科學中更多狀況是,我們想用一種變量X去解釋另一種變量Y。并且,若Y和X有非線性形式關系,則我們還但愿懂得這個形式。把Y叫做被解釋變量,而X叫做解釋變量。例如Y代表小時工資,而X代表受過正式教育年數。可以通過給定X下Y條件期望(conditionalexpectation)(有時又稱條件均值)來概括Y和X之間關系。即,一旦我們懂得X取了某個特定值x,就能根據X這個成果算出Y期望值。記作E(Y|X=x)或簡記E(Y|x)。一般情形是,伴隨x變化,E(Y|x)也會變化。5.條件期望第85頁當Y是取值為離散隨機變量時,則有當Y持續時,E(Y|x)便由對y所有也許值求積分來定義。好比無條件期望那樣,條件期望也是對Y所有也許值一種加權平均,只不過這時權數反應了X已取了某個特殊值情形。因此,E(Y|x)是x某個函數,這個函數告訴我們Y期望值怎樣隨x而變化。5.條件期望第86頁例令(X,Y)代表一種工人總體,其中X為受教育年數,Y為小時工資。那么,E(Y|x=12)便是總體中所有受了教育(相稱于讀完高中)工人平均小時工資。E(Y|x=16)則是所有受過教育工人平均小時工資。跟蹤多種教育水平期望值,便為工資和教育之間關系提供了重要信息。5.條件期望第87頁5.條件期望4812EDUCE(WAGE|EDUC)1620圖2.2.3小時工資在給定多種教育水平下期望值第88頁原則上,可以在每個教育水平上求出小時工資期望值,然后將這些期望值列表。由于教育變化范圍很大——且可度量為一年某個分數——因此用這種措施顯示平均工資和受教育程度之間關系很啰嗦。計量經濟學中經典措施是,設定某些足以刻畫這種關系簡樸函數。作為一種例子,假設WAGE在給定EDUC時期望值是如下線性函數:E(WAGE|EDUC)=1.05+0.45EDUC假定這一關系對工人總體成立,則受8年和教育者平均工資分別是多少?EDUC系數怎樣解釋?5.條件期望第89頁條件期望也也許是個非線性函數。例如,令E(Y|x)=10/x,其中X是一種恒不小于零隨機變量。這個函數圖形如下圖。它可以代表一種需求函數,其中Y為需求量,而X為價格。若Y和X關系確實如此,則諸如有關分析一類線性關聯分析便不合適。5.條件期望E(Y|x)x第90頁條件期望某些基本性質對計量經濟分析中推導頗為有用。性質CE.1對任意函數c(X),均有E[c(X)|X]=c(X)。這意味著,當我們計算以X為條件期望值時,X函數可視為常數。例如E(X2|X)=X2。直觀上,這無非就是說,若懂得了X,也就懂得了X2。
6.條件期望性質第91頁性質CE.2對任意函數a(X)和b(X),有
例如,我們能很輕易地計算像XY+2X2這種函數條件期望:6.條件期望性質第92頁性質CE.3若X和Y互相獨立,則E(Y|X)=E(Y)。這個性質意味著,若X和Y互相獨立,則Y在給定X時期望值與X無關,這是E(Y|X)必然等于Y(無條件)期望。在工資與教育一例中,假設工資獨立于教育,則高中畢業生和大學畢業生平均工資便相似。這幾乎無疑是錯誤,因此我們不能假定工資與教育是獨立。6.條件期望性質第93頁性質CE.4E[E(Y|X)]=E(Y)。這個性質意味著,假如我們先把E(Y|X)看做X函數,再求這個函數期望值,那么成果就是E(Y)。
例:令Y=WAGE和X=EDUC,其中WAGE為小時工資,而EDUC為受教育年數。假定給定EDUC下WAGE期望值是E(WAGE|EDUC)=4+0.6EDUC,且E(EDUC)=11.5。則有E(WAGE)=E(4+0.6EDUC)=4+0.6E(EDUC)=10.90美元/小時。6.條件期望性質第94頁性質CE.5若E(Y|X)=E(Y),則Cov(X,Y)=0(因而Corr(X,Y)=0。實際上X每個函數都與Y不有關。該性質含義是,若對X理解不能變化Y期望值,則X和Y必然不有關。注意:此性質逆命題不成立。若X和Y不有關,E(Y|X)仍然也許取決于X。6.條件期望性質第95頁給定隨機變量X和Y,Y以X=x為條件方差,無非就是在給定X=x下與Y條件分布相聯絡方差:公式常用于計算。性質CV.1若X和Y互相獨立,則Var(Y|X)=Var(Y)。由于在給定X下Y分布與X無關,而Var(Y|X)無非就是這個分布特性之一,因此這個性質相稱明顯。7.條件方差第96頁1.正態分布正態分布和由它衍生出來分布是記錄學和計量經濟學中最廣泛使用分布。假定在總體上定義隨機變量是正態分布,將使概率計算得以簡化。五、正態及其有關分布μx一個正態隨機變量fx圖2.2.4正態概率密度函數一般形狀第97頁在數學上,Xpdf可寫為:其中,和。我們說X有一種均值為μ和方差為б2正態分布(normaldistribution),記作X~Normal(μ,б2)。因正態分布對稱于μ,故μ也是X中位數。有時又把正態分布叫做高斯分布,以紀念注明記錄學家高斯()。1.正態分布第98頁某些隨機變量粗略地看似乎遵照正態分布。人類身高和體重、考試得分以及某縣失業率,大體上均有類似于正態分布圖形pdf。另某些分布如收入分布,則不像正態密度函數那樣分布。在大多數國家里,收入都不對稱于任何數值而分布;分布是朝上端偏斜。有時一種變量可通過變換而獲得正態性。一種常見變換是取自然對數,這對取正值隨機變量來說是故意義。若X是正隨機變量(例如收入),而Y=log(X)具有正態分布,我們便說X服從一種對數正態(lognormal)分布。人們發現,對數正態分布頗適合許多國家收入分布。諸如商品價格等另某些變量,看來也適合描述為對數正態分布。1.正態分布第99頁正態分布一種特殊情形是它均值為0和方差(因而原則差)為1。若隨機變量Z服從Normal(0,1)分布,我們便說它服從原則正態分布(standardnormaldistribution),一種原則正態隨機變量pdf被記為φ(z);根據μ=0和б2=1式,它由下式給出:2.原則正態分布第100頁-303z010.5圖2.2.5原則正態累積分布函數原則正態累積分布函數被記為φ(z),即位于φ之下、z以左面積;φ(z)=P(Z≤z);因Z是持續,故也可以寫成φ(z)=P(Z<z)。2.原則正態分布第101頁沒有可用來求φ(z)值簡樸公式[由于φ(z)是函數積分,而這個積分沒有一種封閉形式]。然而φ(z)值很輕易制成表格。對于z≤-3.1,φ(z)不不小于0.001,而對于z≥-3.1,φ(z)不小于0.999.大多數記錄學和計量經濟學軟件包都具有計算原則正態cdf值簡樸命令,因此我們完全能防止使用印刷表格而獲得對應于任意z值概率。2.原則正態分布第102頁借助于概率論中基本結論——尤其是有關cdf性質——我們可以運用原則正態cdf計算包括一種原則正態隨機變量任何事件概率。最重要公式是P(Z>z)=1-φ(z)P(Z<-z)=P(Z>z)和P(a≤Z≤b)=φ(b)-φ(a)由于Z是持續隨機變量,因此不管不等式與否嚴格,這三個公式全都成立。2.原則正態分布第103頁在大多數應用中,我們首先碰到是一種正態分布隨機變量X~Normal(μ,б2),其中μ不等于0且б2≠1。運用如下性質,可將任何一種正態隨機變量轉換成一種原則正態分布。性質NORMAL.1:若X~Normal(μ,б2),則(X-μ)/б~Normal(0,1)。這闡明了怎樣把任意一種正態隨機變量轉換成原則正態。例如,X~Normal(3,4),而我們要計算P(X≤1)。我們總是把X規范化為一種原則正態變量:P(X≤1)=P(X-3≤1-3)=P[(X-3)/2≤-1]=P(Z≤-1)=φ(-1)=0.1592.原則正態分布第104頁首先我們計算當X~Normal(4,9)時P(2<X≤6)(由于X是持續隨機變量,因此用或都無關緊要)。目前下面我們來計算P(|X|>2):例2.2.6正態隨機變量概率第105頁性質NORMAL.2:若X~Normal(μ,б2),則aX+b~Normal(aμ+b,a2б2)。性質NORMAL.3:若X和Y聯合正態分布,則它們獨立充要條件是Cov(X,Y)=0性質NORMAL.4:獨立同分布正態隨機變量任意線性組合都是正態分布。這闡明了,獨立正態分布隨機變量平均是一種正態分布變量。若Y1,Y2,···,Yn為獨立隨機變量,且每一遍了都服從Y~Normal(μ,б2)分布,則這個結論在對正態總體均值記錄推斷中起關鍵作用。3.正態分布其他性質第106頁卡方分布(分布)是一種持續型隨機變量概率分布。這個分布是由別奈梅(Benayme)、赫爾默特(Helmert)、皮爾遜分別于1858年、1876年、19所發現,它是由正態分布派生出來,重要用于列聯表檢查。1.卡方分布數學形式設隨機變量X1,X2,…Xk,互相獨立,且都服從同一正態分布N(μ,σ2)。那么,我們可以先把它們變為原則正態變量Z1,Z2,…Zk,k個獨立原則正態變量平方和被定義為卡方分布(分布)隨機變量(讀作卡方)六、卡方分布第107頁X即所謂具有n個自由度(degreesoffreedom,df)分布。自由度概念在我們計量經濟學中飾演著重要角色。1.卡方分布數學形式第108頁下圖為具有不一樣樣自由度pdf圖形。2.卡方分布性質圖2.2.6有多種自由度分布第109頁t分布在經典記錄學和多元回歸分析中廣為應用:它可以從一種原則正態和一種分布得到。設Z服從原則正態分布,而X服從自由度為n分布。于是,隨機變量便服從自由度為nt分布(tdistribution),記為T~tn。t分布自由度得子分母中隨機變量。t分布pdf有一種類似于原則正態分布形狀,只是它更散開某些,因而尾端有較大面積。伴隨自由度不停變大,t分布越來越靠近于原則正態分布。七、t分布第110頁圖2.2.7有多種自由度t分布七、t分布第111頁記錄學和計量經濟學中另一重要分布是F分布。尤其是在多元回歸分析中,要用F分布去檢查假設。為了定義F隨機變量,令和,并假定X1和X2獨立,則隨機變量服從一種自由度為(k1,k2)F分布(Fdistribution)。記為。八、F分布第112頁圖2.2.8多種自由度k1和k2分布八、F分布第113頁參看附件習題冊。思索題第114頁一、總體、參數與隨機抽樣記錄推斷指運用來自總體一種樣本而獲知該總體某些狀況。所謂總體(population),指任何定義完好一組對象,這些對象可以是個人、企業、都市或其他諸多也許性。所謂“獲知”,可以有諸多含義,但大體歸類為估計(estimation)和假設檢查(hypothesistesting)兩個范圍。
第三節數理記錄基礎第115頁例1:勞動經濟學家想理解中國全體就業成人教育回報,問再多受一年教育,工作平均增長百分數是多少?要獲得中國全體就業人口工資和教育信息既不現實又不經濟,但我們可以獲得總體中一種子集數據。運用搜集到這些數據,一位勞動經濟學家也許能匯報他對再受一年教育回報最佳估計為7.5%。這就是點估計(pointestimate)一種例子。或者,他想匯報一種范圍,比方說“教育回報在5.6%~9.4%之間”。這是區間估計(intervalestimate)一種例子。一、總體、參數與隨機抽樣第116頁例2:都市經濟學家想懂得鄰里犯罪計劃與否與低犯罪率有關。通過在取自總體一種樣本中比較了安排和不安排監控計劃鄰里犯罪率,他可以得到兩結論之一:鄰里犯罪監控計劃對犯罪率確實有影響,或者沒有影響。這個例子就屬于假設檢查范圍。一、總體、參數與隨機抽樣第117頁記錄推斷第一步就是要明確所關注總體,并且一定要使之非常詳細。一旦明確了總體是什么,就可對所關注總體關系建立或設定一種模型。這個模型將包括某些概率分布或概率分布特性,而這又取決于某些未知參數。所謂參數,就是決定變量關系之方向和強度某些常數。如勞動經濟學例子中,所關注參數是總體中教育回報(率)。一、總體、參數與隨機抽樣第118頁令Y為一種隨機變量,代表著概率密度函數為f(y;θ)一種總體,其中f(y;θ)依賴于單個參數θ。假定除了θ值未知外,Y概率密度函數pdf是已知。不一樣樣θ值將意味著不一樣樣概率分布,因此我們對θ值感愛好。假如我們能得到該總體某種樣本,就能理解θ某些狀況。最輕易處理抽樣方案是隨機抽樣。抽樣第119頁若Y1,Y2,···Yn是具有同一概率密度函數f(y;θ)獨立隨機變量,我們稱為來自f(y;θ)隨機樣本(randomsample)[或者說來自由所代表總體一種隨機樣本]。
當是來自密度f(y;θ)一種隨機樣本時,我們又稱Yi是取自f(y;θ)獨立同分布(independent,identicallydistributed,i.i.d)樣本。抽樣第120頁在隨機抽樣定義中,Y1,Y2,···Yn隨機性質反應了這樣事實:在抽樣實際完畢之前,許多不一樣樣成果均有也許。例如,我們獲取了n=100個中國家庭家庭收入,那么對于由100個家庭構成每個不一樣樣本,我們觀測到收入都將有所不一樣樣。一旦得到了一種樣本,我們就得到一種數集,比方說,這就是我們要加以研究數據。假定這個樣本來自一種隨機抽樣模式與否合適,還規定我們對實際抽樣過程有所理解。抽樣第121頁“有限樣本”一詞來自如下事實:不管樣本容量怎樣,所討論性質對任何樣本容量都成立。有時把這些性質叫做小樣本性質。1.估計量與估計值給定一種隨機樣本,它來自一種取決于某未知參數θ總體分布,θ一種估計量(estimator)就是賦予樣本每個也許成果一種θ值法則。這個法則在進行抽樣之前就已經確立,詳細而言,不管實際得到什么樣數據,這個法則都不會變化。二、估計量有限樣本性質第122頁作為估計量一種例子,令為取自均值為μ總體一種隨機樣本。μ一種估計量,就是這個隨機樣本均值我們把叫做樣本均值(sampleaverage),不過它不一樣樣于我們在代數知識中作為一種描述記錄量而定義一種數集樣本均值。這里是一種估計量。給定隨機變量Y1,Y2,···Yn任何一種成果,我們都用同樣法則去估計μ:取其平均。對于實際成果,估計值(estimate)就是該樣本均值:1.估計量與估計值第123頁假設我們得到美國10個都市如下失業率樣本:例2.3.1:都市失業率城市失業率123456789105.16.49.24.17.58.32.63.55.87.5我們對美國平均都市失業率估計值是。一般地說,每個樣本均有一種不一樣樣估計值,不過求估計值法則是同樣,不管在樣本中出現是哪些都市,也不管樣本中有多少個都市。第124頁更一般地說,參數θ一種估計量W可表達為一種抽象數學公式:其中,h代表隨機變量Y1,Y2,···Yn某個已知函數。如同樣本均值特殊情形那樣,W也因取決于隨機樣本而成為一種隨機變量:W伴隨我們從總體中抽到不一樣樣隨機樣本而也許變化。當我們把一種特定數集[例如]帶入函數h中時,我們便得到θ一種估計值,記為:。有時把W叫做點估計量,而把w叫做點估計值,以辨別區間估計量和區間估計值。1.估計量與估計值第125頁為了評價不一樣樣估計措施,我們研究隨機變量W之概率分布多種性質。一種估計量分布常被稱為抽樣分布(samplingdistribution),由于這個分布描述了W在不一樣樣隨機樣本上取多種成果也許性。由于有無限種組合數據以估計參數法則,我們需要某些故意義準則來挑選估計量,或者至少淘汰某些估計量。因此,我們必須辭別描述記錄量范圍,不再僅為總結一組數據而計算諸如樣本均值之類東西。在數理記錄學中,我們研究是估計量抽樣分布。1.估計量與估計值第126頁原則上,給定Yi概率分布和函數h,我們就能求出W整個抽樣分布。一般在評價W作為θ一種估計量時,集中考慮W分布少數幾種特性比較簡樸。一種估計量第一種重要性質就是有關它期望值。無偏估計量:若θ估計量W對一切也許θ值,均有E(W)=θ則W是一種無偏估計量(unbiasedestimator)2.無偏性第127頁一種估計量若是無偏,則其概率分布期望值就等于它所估計參數。無偏性并不是說我們用任何一種特定樣本得到估計值等于θ,或者很靠近θ。而是說,假如我們可以從總體中抽取有關Y無限多種樣本,并且每次都計算一種估計值,那么將所有隨機樣本這些估計值平均起來,我們便得到θ。由于在大多數應用中,我們僅使用一種隨機樣本,因此這個思維試驗有點抽象。2.無偏性第128頁對于一種不是無偏估計量,我們定義它偏誤如下。假如W是一種偏誤估計量(biasedestimator),則它偏誤(bias)可定義為:Bias(W)≡E(W)-θ2.無偏性Wθ=E(W1)E(W2)W2pdfW1pdff(w)圖2.3.1一種無偏估計量W1和一種有正偏誤估計量W2第129頁一種估計量無偏性和也許偏誤大小取決于Y分布和函數h。一般,Y分布不是我們所能控制(雖然我們常常為這個分布選擇一種模型):它由自然規律或社會力量來決定。但法則h選擇則操縱在我們手中,我們若想要一種無偏估計量,就必須對h作對應選擇。可以證明,有些估計量在一般情形下是無偏。2.無偏性第130頁目前我們來證明,樣本均值是總體均值μ一種無偏估計量,不管其背后總體怎樣分布。2.無偏性第131頁為了作假設檢查,我們尚有必要從均值為μ總體中估計方差。令隨機樣本取自E(Y)=μ和總體,定義估計量為
它常被稱為樣本方差(samplevariance)。可以證明是無偏估計量:。用n-1而不用n作除數,是由于均值μ使用是估計而非已知。假如μ已知,則一種無偏估計量將是。然而實踐中很少懂得μ。2.無偏性第132頁雖然無偏性作為估計量一種性質頗有吸引力——它反義詞“偏誤”確實有些消極含義——但它并非沒有問題。無偏性一種缺陷是,某些合理甚至相稱好估計量卻不是無偏。我們很快就會看到這方面一種例子。無偏性另一種重要缺陷是,實際上存在著相稱糟糕無偏估計量。考慮我們在估計一種總體均值μ。假定我們不用樣本均值去估計μ,而是在搜集了一種容量為n樣本后,只保留第一種觀測,并拋棄所有其他觀測,然后用作為μ估計量,由于,因此這個估計量也是無偏。這種做法把樣本中大部分信息都丟棄了,并非明智之舉。2.無偏性第133頁無偏性缺陷表明我們還需要用更多準則來評價一種估計量好壞。無偏性僅保證估計量概率分布有一種等于它所估計參數均值。這自然是好,但我們還需懂得這個估計量分布究竟有多么分散。一種估計量可以在平均意義下等于θ,但它仍然會以很大概率偏離到很遠處。
3.估計量抽樣方差圖2.3.2θ兩個無偏估計量抽樣分布Wf(w)θW2pdfW1pdf第134頁目前,我們來求用以估計總體均值樣本均值μ方差:3.估計量抽樣方差若是取自均值為μ和方差為總體一種隨機樣本。則有和總體同樣均值,但它方差等于總體方差除以樣本容量n。第135頁如圖3.3.2所示,在無偏估計量中,我們偏好有最小方差估計量。這就使我們能淘汰某些估計量。對一種來自均值為μ和方差為總體隨機樣本,我們懂得是無偏,且。那么僅用第一次觀測Y1估計量又怎樣呢?既然Y1是來自總體一種隨機抽取,就應有。因此,即便樣本較小,和之間差異也也許大。假如n=10,那么便是10倍。這就給我們一種規范措施,排除Y1作為μ估計量。3.估計量抽樣方差第136頁3.估計量抽樣方差y112345678910-0.641.064.271.033.162.771.682.982.252.041.981.431.651.882.342.581.582.231.962.11表2.3.1對μ=2一種Normal(μ,1)分布估計量模擬表2.3.1給出了一種小型模擬研究成果,運用記錄軟件,從一種μ=2和=1正態分布中生成樣本容量為1010個隨機樣本。我們愛好在于估計μ。對10個隨機樣本中每一種,我們都計算兩個估計值y1和。由表可見,y1值遠比分散。此外10個樣本中有8個樣本比y1更靠近于μ=2。所有模擬中y1平均值約為2.188,而平均值為1.976。這兩個平均值都靠近于2,闡明這兩個估計量無偏性。不過只比較這些隨機抽樣平均值,就會掩蓋樣本均值作為μ估計量遠勝于y1事實。第137頁相對有效性假如W1和W2是θ兩個無偏估計量,那么,假如對所有θ均有,且至少對一種θ值不等式嚴格成立,則稱W1比W2更有效。前面我們證明了,為估計總體均值μ,只要n>1,對任何值均有。因此在估計上,比Y1相對更有效。3.估計量抽樣方差第138頁從前面例子我們看到,作為總體均值μ估計量,Y1盡管是無偏,卻是一種糟糕估計量,它方差也許比樣本均值方差大得多。Y1一種明顯特性是,對任何大小樣本容量它都具有同樣方差。看來,規定任何估計程序都必須伴隨樣本容量擴大而改善也是合乎情理。為了估計總體均值μ
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廠房協議委托租賃協議書
- 家具搬運服務委托協議書
- 易地搬遷民房補償協議書
- 公司股權置換轉讓協議書
- 家庭自購房屋裝修協議書
- 地理信息系統就業協議書
- 婚內對方背叛婚姻協議書
- 個人烤鴨合同轉包協議書
- 勞務合同糾紛解除協議書
- 學生傷害他人安全協議書
- 基于PLC的藥房取藥系統設計
- 2023年南方科技大學機試樣題練習
- GB/T 24282-2021塑料聚丙烯中二甲苯可溶物含量的測定
- GB/T 16447-2004煙草及煙草制品調節和測試的大氣環境
- 講義配電房可視化管理標準課件
- 建筑大師伊東豐雄簡介及作品集課件
- 《新疆精河縣烏蘭達坂脈石英礦資源儲量核實報告》礦產資源儲量
- 管理學原理第六章 指揮課件
- 工序標準工時及產能計算表
- 2023年最新的馬季吹牛相聲臺詞
- 幼兒園大班數學口算練習題可打印
評論
0/150
提交評論