《統計學》期末復習課件_第1頁
《統計學》期末復習課件_第2頁
《統計學》期末復習課件_第3頁
《統計學》期末復習課件_第4頁
《統計學》期末復習課件_第5頁
已閱讀5頁,還剩41頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

《統計學》期末復習教學課件《統計學》期末復習第1章總論統計學是搜集數據、整理數據并從數據中獲取有用信息的一門方法論科學。我們從數據中獲取的有用信息是來說明社會經濟現象總體

數量特征的。有限總體和無限總體(1)認識事物的現實狀況;(2)認識隨機現象的統計規律;(3)減少人們對某種系統知識的無知而產生的認識上的不確定性。《統計學》期末復習第2章數據的搜集一、一些基本概念總體單位總體標志指標數量指標質量指標數量標志品質標志數據的搜集也就是統計調查,它是保證我們獲取有用信息的關鍵。變量分為連續變量和離散變量,數量型和屬性變量《統計學》期末復習例1:調查天津市工業企業2001年增加值的規模。總體是“全部工業企業”,總體單位是“每一工業企業”,標志是“每一工業企業的增加值”——數量標志,指標是“增加值總和”——數量指標。例2:調查天津市學齡兒童入學情況。總體是“所有兒童”,總體單位是“每一個兒童”,標志是“是否入學”——品質標志,指標是“入學率”——質量指標。例3:調查天津市2001年居民年收入情況。總體是“所有居民”,總體單位是“每位居民”,標志是“每位居民的年收入”——數量標志,指標是年均收入———質量指標。《統計學》期末復習二、統計分組1.將統計調查所獲取的零散的不系統的資料,按照一定的研究目的和任務,進行加工和整理的一種行之有效的統計方法。它可以幫助我們完成4種任務。2.分組時應該正確選擇分組標志,以免不能準確的完成4種任務;同時應遵循互斥性和包容性原則,以免重復或遺漏。3.組距式分組中,應該弄清一些概念:組數、組距及組距的類型(如等組距、異組距、開口組距、閉口組距)、組限(上限、下限、如何確定組限)、組中值(它的假定性、開口組距的組中值如何計算、用組中值計算的平均數是一個準確值嗎)。三、統計調查方案是在背景分析的前提下,制定出的周密完整的,以指導調查工作順利完成的一項計劃任務書。一項完整的統計調查方案包括8方面的內容。《統計學》期末復習第3章數據和統計指標的基本類型一、數據的類型

它分為總體總量和標志總量(兩者要成對出現才能判斷,比如職工人數如何判斷,只有將它和工資總額或者和工業企業數結合在一起才能判斷出它的歸屬,即它和工資總額結合在一起,它是總體總量;它和工業企業數結合在一起,它是標志總量);時期數又稱流量指標和時點數又稱存量指標(兩者判斷的正確與否對序時平均數的計算有至關重要的影響,序時平均數的計算將在第13章里講解,而如何判斷呢,二、指標的類型

有數量型數據(用數來表示且數的計算有意義)和品質型數據(用文字來表示也可用數來表示但數的計算沒有意義)。1.總量指標《統計學》期末復習應根據其特點即(1)與時間長短是否相關,(2)前后時間上的數值相加是否有意義來判斷)。2.平均指標

在同質總體內,通過“填平補齊”,“取長補短”的方式,獲得的描繪總體一般水平的指標。3.相對指標

它有5種形式:動態相對指標,比較相對指標,計劃完成相對指標,結構相對指標,強度相對指標。

平均指標和相對指標統稱為比率型變量,我們在第4章里將涉及到這個概念,到時在詳談。《統計學》期末復習第4章數據的描述性整理一、數據分布狀態的描述方法1.分布列:有品質型和數量型分布列。它們是通過統計表來描述數據的分布狀態。

在這里還應該弄清楚以下概念:次數又叫頻數、頻率、頻數密度、頻率密度。因為這些概念可以幫助我們了解數據的分布狀態。2.分布圖:有棒圖、直方圖、折線圖、曲線圖。它們是通過統計圖來描述數據的分布狀態。它們與分布列相比更加直觀。

畫圖時如果是等組距,那么可用頻數或頻率來做圖;如果是異組距,那么應該用頻數密度或頻率密度來做圖。《統計學》期末復習二、數據分布的特征及特征數分布特征分布特征數位置特征平均數、中位數、眾數離散特征全距、平均差、標準差、離散系數偏斜特征偏態系數峰度特征峰度系數

三、幾種常用的位置特征數(一)平均數常見的有算術平均數、調和平均數、幾何平均數。幾何平均數在第13章里會詳細加以解釋,這里主要講解前兩個。《統計學》期末復習對于絕對數和比率變量如何計算平均數,我們可這樣做:1.先確定變量。根據題意平均“誰”,“誰”就是變量。比如,求平均日產量,則“日產量”就是變量;又如,求50家企業的平均計劃完成百分比,則“計劃完成百分比”就是變量。2.判別“所確定變量”的類型是絕對數變量,還是比率變量。3.如果是絕對數變量,那么權數是次數(頻數)或頻率,并采用加權算術平均數的公式來計算。如:“日產量”是絕對數變量,則權數是各組的人數或人數比重。4.如果是比率變量,那么要找出比率變量的基本比式,然后再根據已知資料來確定權數和計算公式。如:“計劃完成百分比”是比率變量,其基本比式是實際數與《統計學》期末復習計劃數的比值。那么權數和公式這樣選擇:(1)若已知資料是比率變量和基本比式的分母資料,則權數為分母資料,用f表示,并采用加權算術平均數。(2)若已知資料是比率變量和基本比式的分子資料,則權數為分子資料,用M表示,并采用加權調和平均數。例如:通過調查獲取了15個企業的產值計劃執行情況,如下表(單位:萬元)計劃完成% 企業數 計劃產值80——902 10090——1003 200100——1106 400110以上4300

合計 15 1000計算15個企業的平均計劃完成百分比。《統計學》期末復習(1)在這道題中,我們平均的是“計劃完成百分比”,那么,它就是變量,用x表示,變量值為各組的組中值。(2)該變量的性質是比率變量,其基本比式是實際產值與計劃產值之比。(3)從已知資料中可知條件是比率變量和基本比式的分母資料,則權數是分母資料“計劃產值”,用f來表示,采用加權算術平均數公式來計算即可。(二)中位數

平均數的著眼點在于抵消各觀察值之間的數量差異,表明將各個觀察值“截長補短”以后的平均水平。中位數的著眼點在于尋求全部觀察值按其大小順序排列,居中間位置的一般水平。例如:人口的年齡分布往往近似J型:嬰兒數最多,隨著年齡的增大,人數逐漸下降,到了百歲左右,所剩的人《統計學》期末復習(三)眾數

眾數的著眼點在于尋求各組中頻數最多的觀察值。用來反映要了解的現象中最普通、最常見的數值水平。數就很少了。如果計算年齡的算術平均數,老年人口數雖然較少,但其年齡數值很高,這樣一來,計算的平均年齡就會偏向老年一方。因此,各國的人口統計資料中,平均年齡的計算一般采用中位數。

比如,一位食品部經理想按照預期的銷售量來分配貨物架的空間。從這個意義上來說,我們應該依據眾數,而不是平均數或中位數來確定,即過去具有最高銷售量的食品將得到最大限度的貨物架空間。

又如,如果你的業務是提供足球運動衫的號碼,那么,哪一種度量對你來說更為有用:平均數、中位數或眾數?當然是眾數。《統計學》期末復習四、離散特征數有4種:一是全距:在實際生產中稱之為極差,用R表示。

二是平均差:有簡單式和加權式之分。當平均數是簡單算術平均數時,平均差便采用簡單式;當平均數是加權算術平均數時,平均差便采用加權式。

三是標準差(方差):也有簡單式和加權式之分。和平均差一樣,選擇哪種形式要依賴于平均數的計算。

四是離散系數:有全距系數、平均差系數和標準差系數。一般地,標準差系數的應用場合較多。

例1.甲、乙兩個企業平均每月的勞動生產率都是8000元,它們的標準差分別是320元和240元,那么哪個企業的勞動生產率的代表性更強?

對于這種情況,因為甲乙兩個企業的總體平均水平是相同的,所以,我們可以直接根據標準差的大小來判別乙企《統計學》期末復習業的勞動生產率的代表性強。

例2.A、B兩個商場2000年平均每月的銷售額分別為16000元和8000元,它們的標準差各為320元和240元,那么哪個商場的銷售額穩定些?

例3.對某系一年級的100名男生進行調查,得到平均身高為172厘米,平均體重68公斤,各自的標準差分別為6厘米和4公斤,那么100名男生的身高和體重何者離散較嚴重?

對于例2和例3這兩種情況,由于面對的一個是兩個總體水平相差很懸殊,一個是兩個總體的性質或計量單位不同,我們不能直接根據已知的標準差的大小來判別總體內變量值的離散程度,應該計算兩個總體各自的標準差系數。結果是例2中,A商場的標準差系數是2%,B商場的標準差系數是3%,即A商場的銷售額穩定。例3中,身高的標準差系數是3.49%,體重的標準差系數是5.88%,即100名男生體重的離散較嚴重。《統計學》期末復習第5章隨機試驗和隨機變量一、隨機現象在給定條件下,不能確切預見其結果的現象。1.由于存在著不能確定的和不能完全預見的偶然性的影響因素,隨機現象便產生了。2.隨機現象具有一定的規律性。規律值附近發生的可能大,規律值遠處發生的可能小。3.要保證給定的條件是相同的。二、隨機試驗(可重復、不可重復)、事件(基本事件、復合事件;必然事件、不可能事件)三、概率《統計學》期末復習有主觀概率和客觀概率之分。在以后章節中涉及到的概率是指客觀概率,即大量觀察條件下頻率的穩定值。四、隨機變量及其分布

書中127頁第1個例子的隨機變量是“可能出現的點數”,第2個例子的隨機變量是“等待時間”,第3個例子的隨機變量是“取出球的顏色”。

從上述3個例子中可以看到例1和例3是離散型隨機變量,例2是連續型隨機變量。

我們通過“分布”來刻畫隨機變量的特征。也可以通過特征數來認識隨機變量的特征。《統計學》期末復習第6章有限總體概率抽樣一、一般問題

抽取樣本時我們應該作到:對每一次抽取行為都應精心組織,使得此時尚留在總體中的所有單位都有可能被抽到,且有確定的,不等于零的被抽中的概率。

例如,一個籠子里裝有800只兔子,調查人員閉上眼睛將手伸入籠中抓取兔子的行為,是不是符合隨機抽取的原則。

正確的作法是:在800只兔子身上編上號碼,并做好800個鬮,放在盒子里充分攪勻,從盒子里隨機抽取一個號碼,號碼是幾,就從籠子中抓出相同號碼的兔子。這就符合隨機抽取的原則了。

如果向例子中所描述的那樣“閉上眼抓兔子”那屬于隨便抓取,因為在籠口附近的兔子被抓住的可能大于遠離籠口的兔子。《統計學》期末復習

等概率和不等概率抽樣的共同點:各單位都有確定的不等于零的被抽中的概率。二、一些基本概念

例:某微波爐生產廠家想要了解微波爐進入居民家庭生活的深度。為此從某地區已購買了微波爐的2200個居民戶中用簡單隨機抽樣方法以戶為單位抽取了30戶,詢問每戶一個月使用微波爐的時間。調查結果依次為(分鐘):45090050700400520600340280800750550201100440460580650430460450400360370560610710200試估計該地區已購買了微波爐的居民戶平均一戶一個月使用微波爐的時間,并以95.45%的置信概率做保證對平均使用微波爐的時間進行區間估計。《統計學》期末復習根據該例子我們來了解一下一些概念。1.題中的N=2200就是“有限總體”,n=30就是“概率樣本”。2.30戶居民的平均使用微波爐的時間:(分鐘)和方差是“統計量”。3.我們用樣本統計量作為對有限總體指標的估計,用來表示,稱之為“估計量”。4.點估計:用樣本估計量及其觀察值來表達對總體指標的估計。即5.區間估計:用一個取值區間來表達對總體指標的估計。這個數值區間叫作置信區間。《統計學》期末復習該題的置信區間為至

區間的左端為置信下限,右端為置信上限。式中的臨界值z,根據置信概率來確定。本題的樣本容量為30,屬大樣本,應查標準正態分布表,不過本題給的置信概率所對應的臨界值為常見值,即z=2。那么,將所知數據帶入置信區間得:

下限

上限《統計學》期末復習如果我們的樣本容量n小于30,那么在確定臨界值時要改用自由度為n-1的t分布雙尾面積。即如果我們的已知資料是無限總體,樣本容量時,置信區間為,與有限總體相比少一個小尾巴。書后習題6.6和6.7便是無限總體。另外,對于對“總體總值、總體比例和相應單位數目”的進行估計時,估計的情景和上述例子相似,可“以次類推”。《統計學》期末復習第7章顯著性檢驗的基本問題

顯著性檢驗又稱假設檢驗。就是事先對無限總體的參數或分布作出一個假設,然后利用樣本信息來判斷這個假設是否合理。例如,咖啡的分袋包裝生產線按裝袋凈重150克的技術標準控制操作。現從生產線抽取簡單隨機樣本n=100袋,測得其平均重量為克,樣本標準差s=0.872克。問該生產線是否處于控制狀態?(顯著水平為0.1)

根據上述問題,我們怎么引入顯著性檢驗這一問題呢?在給定的條件下,從生產線上生產的袋裝茶葉所組成的總體為無限總體,而裝袋凈重要符合技術標準的150克是對總體所做的假設,我們稱之為原假設,用來表示,但是如果裝袋凈重與技術標準的150克有出入,如何與原假設相協調,那么還提出了備擇假設,用表示。這樣原假設和備擇假設合在一起,就涵蓋了我們《統計學》期末復習所研究的總體特征的所有可能性。結合例子,可以這樣表示原假設和備擇假設。其中,原假設指觀察到的差異只反映機會差異,即通過樣本數據計算的袋裝茶葉的平均凈重和總體平均凈重之間的差異,只是一個偶然變動造成的,不會影響整條生產線的質量;備擇假設指觀察到的差異是真實的,即“樣本”的平均凈重和總體的平均凈重之間的差異,表明生產線上生產的袋裝茶葉的凈重已偏離了質量技術標準,應該予以調整。

根據備擇假設確定是雙尾檢驗還是單尾檢驗。拒絕域位置

原假設

備擇假設雙尾

左單尾

右單尾《統計學》期末復習該題中的備擇假設為因此應該采用雙尾檢驗。在原假設成立的情況下,我們如何來構造統計量呢?具體情況如下:

已知條件

統計量1.總體為正態分布,總體方差已知,不論樣本大小

(公式中的方差要用已知總體方差而不用)。2.總體分布未知,總體方差已知,大樣本

(公式中的方差要用已知總體方差而不用)。3.總體為正態分布,總體方差未知,小樣本4.總體分布未知,總體方差未知,大樣本

(這里要和第2種情況區別開,即方差用,而統計量用Z,而不是t。《統計學》期末復習例題中的已知條件符合第4種情況,所以應計算Z統計量,即:接下來根據給定的顯著水平和所構造的統計量是Z還是t,是雙尾還是單尾,來確定臨界值。如果是Z統計量、雙尾,那么就查標準正態分布表:;若是單尾那么就查標準正態分布表:。如果是t統計量、雙尾,那么就查自由度為n-1的t分布表:;若是單尾,則查自由度為n-1的t分布表:。例題中所構造的統計量是Z、雙尾,則應查標準正態分布表《統計學》期末復習有了臨界值,我們就可以依此來確定拒絕域和接受域。若是Z統計量、雙尾,則拒絕域為,;接受域為,本例題符合該條件,則將上面確定的臨界值1.645代入得,拒絕域為接受域為對于Z統計量、單尾;t統計量、雙尾或單尾過程和上述確定Z統計量、雙尾一樣,這里就不在重述。最后,將算出的統計量的具體值和確定的臨界值比較,即若,則落入拒絕域,結論為:樣本水平和總體水平之間存在著真實差異;若,則落入接受域,結論為樣本水平和總體水平之間的差異是機會差異。同樣對于對于Z統計量、單尾;t統計量、雙尾或單尾過程和上述確定Z統計量、雙尾一樣,這里就不在重述。《統計學》期末復習例題中的統計量的具體數值那么落入拒絕域,則說明生產線生產的袋裝茶葉的平均重量已偏離了質量技術標準,應予以調整。我們將上述過程根據例題再完整的敘述一下:1.提出假設:2.構造統計量:3.依給定的顯著水平,確定臨界值和拒絕域以及接受域4.作出判斷:因則落入拒絕域,則說明生產線生產的袋裝茶葉的平均重量已偏離了質量技術標準,應予以調整。《統計學》期末復習第8章兩個總體的比較第9章方差分析第10章皮爾遜檢驗

當我們熟悉了“第7章顯著性檢驗”的問題后,第8、9、10三章就好處理了。因為這三章也是顯著性檢驗問題,只不過是檢驗的對象發生了變化,即兩總體(第8章)、多總體(第9章方差分析)以及獨立性檢驗和擬合優度檢驗(第10章)。所以,我們將它們放在一起來講,使同學們的整體感更強些。《統計學》期末復習兩個總體

多總體比較

(方差分析)皮爾遜檢驗均值比較比例比較擬合優度檢驗獨立性檢驗1.提出假設不全相等

服從正態分布不服從正態分布

變量之間獨立兩者不獨立2.構造統計量3.給定顯著水平,確定臨界值和拒絕域根據備擇假設做雙尾或單尾檢驗.給定顯著水平確定臨界值和拒絕域同左因F的比值恒為正,則為右單尾,給定顯著性水平,確定臨界值和拒絕域。因值恒為正,則為右單尾,給定顯著水平,確定臨界值和拒絕域

同左4.根據上述結果作出結論若是雙尾拒絕原假設接受原假設若是單尾,略同左如果那么拒絕原假設,如果那么接受原假設。如果則拒絕原假設,若則接受原假設。同左《統計學》期末復習

另外,(1)要注意方差分析中的因變量是數量型變量,自變量可以是品質型變量,也可以是數量型變量;而獨立性檢驗中的因變量和自變量都是品質型變量。(2)要理解方差分析中因子和處理的含義。每一“處理”就是一個總體。(3)要將方差分析表中的各數字的來源及它們之間的關系弄清。如:方差來源離差平方和自由度均方差F值組間變差SSR=7112.1423組內變差MSE=2341.863總變差20《統計學》期末復習如何將表中數字填全呢?1.組內變差的自由度(m-1)=總變差的自由度(n-1)-組間變差的自由度(n-m)=20-3=17,2.因組內均方差MSE=組內方差SSE/m-1=2341.863所以組內方差SSE=組內均方差*自由度(m-1)=2341.863*17=39811.6673.總變差SST=組內變差SSE+組間變差SSR=39811.667+7112.142=46923.814.組間均方差MSR=組間變差SSR/m-1=7112.142/3=2370.7145.F=MSR/MSE=2370.714/2341.863=1.06《統計學》期末復習第12章統計指數

指數是反映復雜經濟現象總體(即復雜總體)變動的特殊相對數。如果有限總體中的各個單位不能直接相加匯總得到總體單位總量,這樣的有限總體叫復雜總體。與之相對應的是簡單總體。我們引入“同度量因素”這一概念,復雜總體中的各個單位就變得可以直接相加了。同度量因素是指使不能相加的事物過渡到可以直接相加的因素。弄清同度量因素的作用和選擇時應遵循的條件,對同度量的理解更深刻。指數編制的基本途徑有兩個:一是綜合的方法,形成綜合指數;一是平均的方法,形成平均指數。《統計學》期末復習

在這一章節中要能準確地區分數量指標和質量指標,這有助于計算指數,還要能夠準確地判斷分析對象是總量指標還是平均指標,這有助于我們進行因素分析。我們以因素分析為例。例如,某企業工資和人數資料:分析由于各組平均工資和職工人數的變化對工資總額的影響。我們的分析對象是“工資總額”,這一指標是總量指標,工資總額=職工人數*平均工資。應選擇兩因素的綜合指數因素分析。職工分組工資總額(元)職工人數(人)基期報告期基期報告期中老年人青年人2100080003120025200300200400600合計29000564005001000《統計學》期末復習

接上例,如果我們的問題是:分析職工總體內部人數構成和各組平均工資的變化對總平均工資的影響。那么我們的分析對象“總平均工資”是加權算術平均數(平均指標)。總平均工資=工資總額/職工人數。應選擇加權算術平均數變動的因素分析即《統計學》期末復習

如習題12.14中題目的要求是(1)分析產量和單位成本的變動對總成本的影響。(2)分析產量和價格的變動對總產值的影響。要求(1)和(2)中的分析對象分別是“總成本”和“總產值”,這兩個指標是都是總量指標。總成本=產量q*單位成本p;總產值=產量q*價格p。應選擇綜合指數變動的因素分析。即:如習題12.19中題目的要求是對全廠的勞動生產率的變動進行因素分析。要求中的分析對象是“勞動生產率”,這一指標是加權算術平均數(平均指標)勞動生產率=總產值或總產量/職工人數。應選擇加權算術平均《統計學》期末復習數變動的因素分析。即

平均指數是指個體指數的平均數。它在實際工作中應用非常廣泛。那是因為(1)平均指數可以使用附加權數,這就為通過分類選樣觀察一部分商品來計算全部商品的總指數提供了可能。(2)平均指數可以使用比重權數,這個比重可以用抽樣調查資料來估計,同時通過比重權數可以反映總體中各個部分的相對重要性。習題12.2和12.3就是常見的平均指數在實際中的應用,我們應予以掌握。《統計學》期末復習

我們還可以根據指數進行推算或剔除價值量指標中的價格因素。指數推算的例子:如習題12.9題目(1)的要求是以價格水平提高后同樣多的人民幣少購商品10%,求價格指數?該題目中的指數體系是:銷售額指數=銷售量指數*價格指數則價格指數=銷售額指數/銷售量指數,根據題目中已知條件可知“以同樣多的人民幣”是銷售額指數100%,少購商品10%是銷售量指數110%,則將數據代入指數體系中得價格指數=100%/110%=90.91%.剔除價值量指標中的價格因素的例子:如書中例12.8。題目的要求是剔除職工人均月生活費收入中價格因素的影響。1991年的人均月生活費收入為428.5元,但該年的價格水平也有所上升為100.5%,要想真實的衡量收入的提高情況,應剔除價格的變化即:428.5/100.5%=426.4。《統計學》期末復習第13章時間數列數據研究

本章涉及三部分內容:一是序時平均數的計算;二是增量與速度的計算;三是預測。一、序時平均數的計算1.“絕對數”的序時平均數的計算在這一問題中,關鍵是要能夠準確地判斷出所要平均的絕對數的時間所屬性質是“時期數”還是“時點數”。因為它們的計算公式有很大差別。比如,某企業2001年第一季度每月的鋼產量如表(萬噸)根據資料計算每月平均鋼產量。月份一二三鋼產量404642《統計學》期末復習

我們知道該題被平均的對象“鋼產量”是一“時期數”,用來表示,那么應采用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論