




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
統計學原理第五版李潔明著知識點總結
統計學知識點
第一章緒論
1、統計包含三種涵義
(1)統計工作:一種調查研究活動。資料搜集、整理和分析。
統計資料:即統計信息,工作成果。包括統計數據和分析報告。
統計學:研究如何搜集、整理、分析數據資料的一門方法論科學。
(2)統計資料:對現象的數量進行搜集、整理和分析的活動過程。
統計資料:通過統計實踐活動取得的說明對象某種數量特征的數據
原始資料:直接從各調查單位搜集的用來反映個體特征的數據資料
次級資料:由原始資料加工得到的在一定程度上能反映總體特征的數據資料
(3)統計學:是研究總體一定條件下的數量特征及其規律性的方法論學科
統計學的性質:統計學是通用的方法論科學;統計學使用大量觀察和歸納推理的方法,得出對事物總體的綜合認識;統計學結合現象的“質”研究現象的“量”
特點:數量性(統計研究過程是從質和量的辯證統一中研究現象的數量特征,從數量上認識事物的性質和規律)、總體性(統計所研究的是由同類事物構成的群體現象的數量特征)、具體性、社會性
2、統計學的分類
理論統計學:研究的內容是統計的一般理論和方法,包括描述統計學、推斷統計學
應用統計學:研究的內容是運用于某一特定領域的統計問題,國民經濟統計學、社會統計學、人口統計學
3、統計研究方法
(1)方法論——大數定律
(2)統計研究的基本方法
大量觀察法:是指對所研究的事物的全部或足夠數量進行觀察的方法。它可以使影響個體的偶然因素相互抵消,顯示出現象的一般特征。其數理依據是反映隨機現象基本規律的大數定律。諸如,各種基本的、必要的統計報表、普查、重點調查和抽樣調查等。
統計描述法:指通過對客觀實際的調查了解,并對搜集到的數據進行加工整理、綜合分析,從而計算出各種能反映總體數量特征的綜合指標,借以反映現象總體的總量規模、結構比例、速度快慢等實際狀況。統計描述的內容包括統計分組法、綜合指標法和統計模型法。
統計推斷法:是以一定的置信標準要求,根據樣本數據來判斷總體數量特征的歸納推理的方法。統計推斷是邏輯歸納法在統計推理的應用,所以稱為歸納推理的方法。統計推斷是現代統計學的基本方法。
(3)統計活動過程
統計設計:統計指標和指標體系的設計、統計分類分組的設計、統計表的設計、統計資料搜集方法的設計、統計工作各個部門和各個階段的協調與聯系、統計力量的組織與安排,
統計調查:就是搜集統計資料的工作階段。
統計整理:對調查階段搜集的原始資料,按照一定標志進行科學的分組和匯總,使之條理化、系統化。
統計分析:對經整理后的各項綜合指標進行分析計算,揭示被研究現象的比例關系和發展過程,闡明現象的變化趨勢和規律性,通過分析研究作出科學的結論。
4:統計總體和總體單位統計總體:由客觀存在的、在同一性質基礎上結合起來的許多個別單位所形成的集合
具有客觀性、大量性、同質性、變異性、相對性等特點。
總體單位:指構成總體的個體即每一個單位。總體由總體單位構成,要認識總體必須從總體單位開始,總體是統計認識的對象。
總體或總體單位的區分不是固定的,在一定條件下可以相互轉化。
5、統計總體的種類
有限總體和無限總體,大總體和小總體,可加總體和不可加總體
6、標志:指總體單位所具有的屬性和特征,標志的具體表現稱為標志值
品質標志:是表明事物“質”的特性的標志。如性別、民族
數量標志:是表明事物“量”的特性的標志。如身高。其中,可變的數量標志又被叫作變量。
統計研究是從登記標志開始,并通過對標志的綜合來反映總體的數量特征,因此標志是統計研究的起點。
7、總體單位標志:不變標志(標志表現無差別),決定總體的同質性
變異標志(標志表現有差別),決定總體的差異性,包括品質標志和數量標志
8、變量的種類:確定性變量(由確定性因素:明確的、可解釋的、人為的或者受人控制的因素影響所形成,使變量按一定方向變動)、隨機變量(由隨機因素:不確定的、偶然的、非人為控制的、不可解釋的因素所形成的變量);離散變量(只能取整數)、連續變量(可取小數)
9、統計指標:反映社會經濟現象總體數量特征的概念及其具體數值
構成要素:時間限制、空間限制、計算方法、(指標名稱、指標數值)、計量單位
性質:數量性(統計指標是數量范疇,“沒有沒有數量的指標”)、具體性(總體在具體時間、地點、條件下的數量特征,即統計指標“質的規定性”)、綜合性(對總體數量特征的綜合說明,是由個體數量綜合而來的。
)
10、標志與指標的聯系與區別:
聯系:(1)一些數量標志匯總可以得到指標的數值(2)數量標志與指標之間存在變換關系。
區別:(1)標志是說明總體單位特征的,而指標是說明統計總體數量特征的;
(2)標志的具體表現,有的用數值有的用文字表示,而指標都是用數值表示的。
11:、統計指標的分類
(1)按表現形式、產銷比率、盈利水平、勞動效率、償債能力指標體系的作用:全面、綜合地對客觀事物進行描述、分析。
第二章統計調查與整理
13、統計調查就是按照統計任務的要求,運用科學的調查方法,有組織地向社會實際搜集資料的過程。
14、統計調查的基本要求:準確性、及時性。準確性要求和及時性要求是相互結合相互依存的,及時性在準確性要求的前提下才有意義,而準確性也不能損害及時性的要求
15、統計調查的設計(即統計調查方案)
(1)確定調查的目的——即為什么調查
(2)確定調查對象和調查單位——即向誰做調查。調查對象就是我們需要進行研究的總體范圍,即調查總體。它是由性質相同的許多調查單位所組成的。作為調查單位乃是進行登記的標志表現的直接承擔者。
(3)擬訂調查提綱和制定調查表——即用什么方法調查。擬訂調查項目時要注意幾個原則:-調查項目要少而精;-調查項目含義要明確;-盡可能做到各個調查項目之間有一定的聯系。
調查表分為:一覽表(把許多調查單位和相應的項目按次序登記在一張表格里。這便于匯總,但缺點是分不開,故調查深度不夠;)單一表(將一個調查單位的項目登記在一份表或一種卡片上。這便于容納較多的項目,且便于整理、分類,缺點是繁瑣。)
(4)確定調查時間——即在什么時間調查。要區別調查時間和調查期限的不同:-調查時間是指調查資料所屬的時間(時點或時期);-調查期限是指調查工作的起訖時間。
(5)制定調查的組織實施計劃
16、統計調查的方法:直接觀察法、報告法、采訪法、網上調查法。另外,還有電話調查、座談會、個別深度訪談等方法。
17、統計調查的組織(即調查的種類)——按調查的范圍分,統計調查可以分為:全面調查和非全面調查;按登記事物的連續性分,統計調查可以分為:經常調查和一時調查;按組織形式分,統計調查可以分為:統計報表和專門調查。
18、統計報表分為:基本統計報表,專門統計報表。
按報送周期長短不同統計報表分為:定期報表(日報、旬報、月報、季報、半年報)、年報
專門調查:分為普查、重點調查、抽樣調查、典型調查。普查為全面調查,后三者為非全面調查。
普查:專門組織的一次性調查,用來調查屬于一定時點的社會現象的總量。例:每5年一次的經濟普查
重點調查:對重點單位進行調查。重點單位指的是這些單位數占總體的很少部分,而研究的標志總量占絕大部分(或絕大比重)。
抽樣調查:按隨機原則從總體中抽取一部分單位進行調查。
典型調查:先對總體進行分析,然后選擇有代表性的單位進行調查。例,選取部分企業進行調查,以了解企業股份制改革后的成果及問題。
19、統計分組
概念:把同質總體中的具有不同特點的單位分開,從而正確地認識事物的本質及其規律性。
作用:類型分組——揭露社會經濟現象的類型,反映各類型的特點。
結構分組——說明社會經濟現象的單項式數量分組——運用于變量變動幅度小、項目少的分組。
-組距式分組——運用于變量變動幅度大、項目多的分組。
(2)按總體所選擇標志的個數分:
簡單分組——按一個標志對總體進行分組
復合分組——按兩個或兩個以上標志對同一總體進行分組
對社會經濟現象需要從各方面進行觀察和分析研究,需要采用一系列相互聯系、相互補充的標志對現象進行多種分組,這些分組結合起來構成一個體系,叫做分組體系。
21、分配數列
概念:統計總體按照某一標志分組以后,用以反映總體各單位分配情況的統計數列,稱分配數列,又可稱次數分配,或次數分布。
種類:以分組標志特征不同分為——品質數列、變量數列
變量數列:(1)單項變量數列(單項數列)——按每個變量值分別列組編制數列,適用于不連續變量或變量能以整數表示,
其變動范圍不大時。
組距變量數列(組距數列)——按組距分組編制數列。適用于連續變量或變量可用小數表示,其變動范圍較大時。
(2)連續變量數列——可有小數,采取組距式。
非連續變量數列——整數,采取單項式或組距式(例:一個地區的企業按職工人數分組)。
22、組距數列的編制
組限:組距兩端的數值。分為上限和下限。
組距:某一組的上限和下限的距離,分等距和異距。組距=上限-下限,等距數列組距=全距R/組數
全距:分組數列中最大值的上限與最小值的下限之差。
組中值:組的上限和下限的中間值。
因數列兩端組限形式不同分:開口式組距—最低組與最高組不封口;閉口式組距。
編制步驟:確定組距和組數;確定組限和組中值。
23、關于組限問題
對連續變量,組數也要連續。在登記次數時,習慣上遵守:上組限不在組中值組的上限組的下限
或下限上限下限開口式分組的組中值求法:缺下限的開口組的組中值上限1鄰組組距缺上限的開口組的組中值下限1鄰組組距
24、次數分布的表示方法
表示法——即用統計表來表示次數分布。以下累計次數(上限)——即較小制累計。每一組的累計次數表示小于該組上限(變量)值的次數共有多少;以上累計次數(下限)——即較大制累計。每一組的累計次數表示大于該組下限(變量)值的次數共有多少。
圖示法:用統計圖來表示次數分布——直方圖、折線圖(在直方圖的基礎上連接各條形頂邊的中點成折線圖)、曲線圖(組數趨向于無限多時折線圖的極限描繪,是一種理論曲線)
25、次數分布的主要類型
一般次數分布呈正態分布曲線,或稱正態曲線:對稱型;很多是偏態分布曲線,或稱偏態曲線:右偏型(上偏型)、左偏型(下偏型);還有其他形態:U型分配曲線、J型分配曲線、雙峰曲線
26、統計表的結構和(間斷計數,與時間間隔無關,不能累計)
33、總量指標的計算
計算原則:現象的同類性;明確的統計含義;計量單位必須一致。
根據總量指標所反映的社會經濟現象性質不同,計量單位分三種形式:
(1)實物單位:a.自然單位:輛、雙、頭、根、個??
b.度量衡單位:噸、米、克、立方米??
c.雙重單位:公里/小時、人/平方公里??
d.復合單位:噸公里、公斤米、千瓦小時??
對有些性質相同但規格或含量不同的產品總量的計算,要按折合標準實物量的方法計算。
安排合理;行復合分組基線;編號:3?;有計量資料則用“-
(2)價值單位(貨幣單位):貨幣單位有現行價格和不變價格之分。價值單位使不能直接相加的產品產量過渡到能夠加總,用于綜合說明具有不同使用價值的產品生產總量或商品銷售量等的總規模、總水平。
(3)勞動單位:工時——工人數和勞動時數的乘積;臺時——設備臺數和開動時數的乘積。
由于具體條件不同,不同企業的勞動量指標不具有可比性,因此,勞動量指標只限于企業某條件下的某類指標數值比較相對數100%另一條件下的同類指標數值
計算比較相對數時,作為比較基數的分母可取不同的對象,一般有兩種情況:
①比較標準是一般對象,這時,分子與分母的位置可以互換。
如:
比較相對數甲地區(單位)某一現象的水平100%乙地區(單位)同類現象的水平
②比較標準(基數)典型化,如:把企業的各項技術經濟指標都和國家規定的質量水平比較,和同類企業的先進水平比較,
和國外先進水平比較等,這時,分子與分母的位置不能互換。
(五)強度相對指標
計算公式為:某一總量指標數值強度相對數另一性質不同但有一定聯系的總量指標數值
強度相對數的數值表示有兩種方法:①一般用復名數表示;②也有少數用百分數或千分數表示。
有些強度相對數有正、逆兩種計算方法。
(六)動態相對指標
計算公式為:
動態相對數報告期水平基期水平100%
基期——作為對比標準的時間;報告期——同基期比較的時期,也稱計算期
36、正確運用相對指標的原則:注意二個對比指標的可比性;相對指標要和總量指標結合起來運用;多種相對數結合運用;在比較二個相對數時,是否適宜相除再求一個相對數,應視情況而定。若除出來有實際意義,則除;若不宜相除,只宜相減
求差數,用百分點表示之。(百分點—即百分比中相當于百分之一的單位)
37、平均指標的意義和作用
概念:平均指標是指在同質總體集中趨勢代表性
作用:比較作用(a.同類現象在不同空間的對比。b.同一總體在不同時間上的比較);
-利用平均指標可以分析現象之間的依存關系
-利用平均指標可以進行數量上的推算,還可以作為論斷事物的一種數量標準或參考
種類:數值平均數(算術平均數—位置平均數(眾數—
38、算術平均數
算術平均數的基本公式:
簡單算術平均數:;調和平均數—Xh;幾何平均數—XG)Mo,中位數—Me)算術平均數總體標志總量總體單位總數X——各單位的標志值
n——總體單位數
——總和符號Xn式中:——算術平均數
加權算術平均數:式中:——算術平均數
——各組數值
f——各組數值出現的次數(即權數)
在掌握比重權數的情況下,可以直接利用權數系數來求加權算術平均數,其公式為:
XXffXXffXf
f
加權算術平均數與簡單算術平均數不同在于:加權算術平均數受變量值大小、次數多少的影響;而簡單算術平均數只反映變量值大小這一因素的影響。
39、算術平均數的數學性質
①各個變量值與算術平均數離差之和等于零簡單平均數:(XX)0加權平均數:(XX)f0
2③各個變量值與算術平均數離差平方之和等于最小值
簡單平均數:(XX)最小值
2(XX)f最小值加權平均數:40、算術平均數的特點
算術平均數適合用代數方法運算,因此運用比較廣泛;易受極端變量值的影響,使的代表性變??;受極大值的影響大于受極小值的影響;當組距數列為開口組時,由于組中點不易確定,使的代表性也不很可靠。
41X又稱“倒數平均數”)
調和平均數是各個變量值倒數的算術平均數的倒數。
計算方法:(1).先計算各個變量值的倒數,即1(2).計算上述各個變量值倒數的算術平均數,即nXn(3).再計算這種算術平均數的的倒數,就是調和平均數,即1X
X1Xhn1X在加權的情況下:Xhf1Xf在社會經濟統計學中經常用到的僅是一種特定權數的加權調和平均數。即有以下數學關系式成立:XXfXfmXf1Xfm
XX
m
Xh式中:mXf,f
m是一種特定權數,它不是各組變量值出現的次數,而是各組標志值總量。
42、調和平均數的特點
如果數列中有一標志值等于零,則無法計算XXh;較之算術平均數,h受極端值的影響要小。
43、幾何平均數(又稱“對數平均數”)
簡單幾何平均數:XGX1X2XnX
lgXGlgX
n計算時要進行對數變換,即:加權幾何平均數:X
lgXG
GXGarcXGf1f2L式中:f為各變量值的次數或權數將公式兩邊取對數,則為:f1lgX1f2lgX2LfnlgXnf1f2LfnflgXfXGarc(lgXG)
44、幾何平均數的特點
如果數列中有一個標志值等于零或負值,就無法計算;受極端值的影響較和??;它適用于反映特定現象的平均水hXG
平,即現象的總標志值是各單位標志值的連乘積。
45、眾數M0
概念:眾數是在總體中出現次數最多的那個標志值
眾數存在的條件:①只有總體單位數比較多,而且又有明顯的集中趨勢時才存在眾數。若有兩個次數相等的眾數,則稱復眾數。②在單位數很少,或單位數雖多但無明顯集中趨勢時,計算眾數是沒有意義的。
46、眾數的計算方法:①根據單項數列確定眾數;②根據組距數列確定眾數(由最多次數來確定眾數所在組;利用比例插值法推算眾數的近似值)
計算眾數的近似值:下限公式:
上限公式:
47、眾數的特點
眾數是一個位置平均數,它只考慮總體分布中最頻繁出現的變量值,而不受各單位標志值的影響,從而增強了對變量數列一般水平的代表性。不受極端值和開口組數列的影響。
眾數是一個不容易確定的平均指標,當分布數列沒有明顯的集中趨勢而趨均勻分布時,則
無眾數可言;當變量數列是不等距分組時,眾數的位置也不好確定。
48、中位數Me
概念:將總體中各單位標志值按大小順序排列,居于中間位置的那個標志值就是中位數。
中位數的計算方法:
①由未分組資料確定中位數:MXUdMXLd中位數的位置n1
2(n為總體單位數)
⑴n為奇數時,則居于中間位置的那個標志值就是中位數。
⑵n為偶數時,則中間位置的兩個標志值的算術平均數為中位數
②由單項數列確定中位數
③由組距數列確定中位數:
下限公式(較小制累計時用):
上限公式(較大制累計時用):
fMeXLMeXUSmffm
fmdSmd
49、中位數的特點
①中位數不受極端值及開口組的影響,具有穩健性。
②各單位標志值與中位數離差的絕對值之和是個最小值。
即:XMemin或XMefmin
④對某些不具有數學特點或不能用數字測定的現象,可用中位數求其一般水平。
50、各種平均數之間的相互關系(一)XhXGX
即XMeM0
(1).如果分布右偏,則XMeM0(二)當總體分布呈對稱狀態時,三者合而為一,當總體分布呈非對稱狀態時,
(2).如果分布左偏,則XMeM0
所以:(XMo)0則說明分布右偏(或上偏)
(XMo)0則說明分布左偏(或下偏)
(Mo)0則說明分布對稱
根據卡爾·皮爾遜經驗公式,還可以推算出:
51、平均指標的運用原則:平均指標只能適用于同質總體;用組平均數補充說明總平均數;用分配數列補充說明平均數。MMeXMeMoXXMeMo
52、標志變動度
概念:標志變動度是指總體中各單位標志值差別大小的程度,又稱離散程度或離中程度。
作用:①標志變動度是評價平均數代表性的依據。②標志變動度可用來反映社會生產和其他社會經濟活動過程的均衡性或協調性,以及產品質量的穩定程度。
種類:即測定標志變動度的方法,主要有:全距、四分位差、平均差、標準差、離散系數等。
全距R;四分位差Q.D.;平均差A.D.;標準差S.D.(σ);離散系數Vσ
53、全距
全距是總體各單位標志值最大值和最小值之差,
方法,不能全面反映總體各單位標志的變異程度。
54、四分位差即:RXmax-Xmin全距的特點:①優點:計算方便,易于理解。②缺點:全距只考慮數列兩端數值差異,它是測定標志變動度的一種粗略
概念:將總體各單位的標志值按大小順序排列,然后將數列分為四等分,形成三個分割點(Q1、Q2、Q3),這三個分割點稱為四分位數,(其中第二個四分位數Q2就是數列的中位數Me)。四分位差Q.D.=Q3-Q1
計算:①根據未分組資料求Q.D.
②根據分組資料求Q.D.
f3f1)Q1的位置,Q3的位置44n1,4(n為變量值的項數)Q1的位置Q3的位置3(n1)4
2)若單項數列,則Q1與Q3所在組的標志值就是Q1與Q3的數值;
若組距數列,確定了Q1與Q3所在組后,還要用以下公式求近似值:
fQ1L1SQ11f13fd1Q3L3SQ31f3d3
四分位差的特點:①四分位差不受兩端各25%數值的影響,能對開口組數列的差異程度進行測定;②用四分位差可以衡量
中位數的代表性高低;③四分位差不反映所有標志值的差異程度,它所描述的只是次數分配中一半的離差,所以也是一個比較粗略的指標。
55、平均差
概念:平均差是數列中各單位標志值與平均數之間絕對離差的平均數。
其計算公式為:
(1)未分組資料:A.D.
(2)分組資料:A.D.X-Xn
平均差的特點:①平均差是根據全部標志值與平均數離差而計算出的變異指標,能全面反映標志值的差異程度;②平均差計算有絕對值符號,不適合代數方法的56演算使其應用受到限制。
56、標準差
概念:標準差是離差平方平均數的平方根,故又稱“均方差”。其意義與平均差基本相同。
57、交替標志的標準差
在社會經濟統計中,有時把社會經濟現象的總體單位,分為具有某種標志的單位和不具有這種標志的單位兩組。統計中,用“是”、“否”或“有”、“無”來表示的標志,稱為交替標志,也稱是非標志。
N:N1,N
N1是具有某種標志的單位數N1=P;N2是不具有這種標志的單位數N2=1-P;具有某種標志——變量為1;不具有這種標志——變量為
0
X-Xff
d式中:A為數列中間組的組中值,d為該組組距在組距數列中,結合算術平均數的簡捷公式,可得標準差的簡捷法公式如上:
58、標準差與全距、平均差的關系
①σ與R的關系:經驗表明,當分布數列接近于正態分布時,R和σ之間存在以下經驗公式——R為4至6個σ:;當標志值項數較少時,R≈4;當標志值項數較多時,R≈6σ
②σ與A.D.的關系:對同一資料,所求的平均差一般比標準差要小,即A.D.≤σ
59、離散系數Vσ
離散系數,是各種變異指標與平均數的比率。反映總體各單位標志值的相對離散程度,最常用的是標準差系數。標準差系數計算公式為:
V
第四章動態數列
60、動態數列X100%
概念:動態數列又稱時間數列。它是將某種統計指標,或在不同時間上的不同數值,按時間先后順序排列起來,以便于研究其發展變化的水平和速度,并以此來預測未來的一種統計方法。
動態數列由兩個基本要素構成:①時間,即現象所屬的時間;②不同時間上的統計指標數值,即不同時間上該現象的發展水平。
動態數列按照所列入指標數值的不同可分為:絕對數動態數列(時期數列、時點數列)、相對數動態數列、平均數動態數列61:時期數列:在絕對動態數列中,如果各項指標都是反映某種現象在一段時期n時期項數aa1a2a3Lanann序時平均數各時期發展水平式中:aa1,a2,a3,Lan
(1)如果資料是連續時點資料,可分為二種情況:
對連續變動的連續時點數列(即未分組資料):
對非連續變動的連續時點數列(即分組資料):aaanaff
⑵如果資料是間斷時點資料,也可分為二種情況:
對間隔相等的間斷時點資料:上面計算過程概括為一般公式:
aaa1a2a2a3n1n
an1aaa2a3an1n
n1這種計算方法稱為"首末折半法"
a2a3an1ana1a2對間隔不等的間斷時點資料:1
a2f12f2Li2fn1f
i1n1
㈡相對數動態數列的序時平均數
aa由兩個時期數列對比組成的相對數動態數列的序時平均數:一般公式為:bab
nb
由兩個時點數列對比組成的相對數動態數列的序時平均數:
aaLnnaaLn
acbbbbbbbLnnbbLn
aaaa
若為間隔不等的二個間斷時點數列對比組成的相對數動態數列的序時平均數為:
aaaaaaffLfn112
bb1b2fb2b3fLbn1bnf
12n1
若由二個連續時點數列對比組成的相對數動態數列的序時平均數:
aaaf連續變動時點:用簡單平均,即c非連續變動時點:用加權平均,即c
bbbbf
a
由一個時期數列和一個時點數列對比組成的相對數動態數列的序時平均數:
㈢平均數動態數列的序時平均數一般公式為:c
ab
b1an
b2b3
n1
bnc
由一般平均數組成的平均數動態數列的序時平均:以時間為權數:
由序時平均數組成的平均數動態數列的序時平均數:
可見,當時期相等時,可直接用簡單算術平均法計算。67、增長量
概念:說明某種現象在一定時期發展速度:反映社會經濟現象發展程度的動態相對指標。
發展速度報告期水平100%基期水平a
na0a可分為:a
a0i1ai1
i1
推理:
aaa00i1
增長速度:反映社會經濟現象增長程度的動態相對指標。
增長速度發展速度-1(100%)
無關系
定基增長速度
環比增長速度
增長量前一時期水平
增長百分比100
基期水平或
100
增長1%的絕對值
70、平均發展速度和平均增長速度
平均發展速度是各個環比發展速度的動態平均數(序時平均數),說明某種現象在一個較長時期中逐年平均發展變化的程度;平均增長速度是各個環比增長速度的動態平均數,說明某種現象在一個較長時期中逐年平均增長變化的程度。㈠平均發展速度
幾何平均法,又稱水平法:
X
n
X
n
an
a0
R
aa1a2a3
na0a1a2an1
X1X2X3Xn
方程法,又稱累計法:
在實踐中,如果長期計劃按累計法制定,則要求用方程法計算平均發展速度。
a1a2a3anai
i1
n
n
a0Xa0Xa0Xa0Xai
i1
23n
n
XX
nn1
XX
2
ai
i1
解這樣的高次方程,用查表法。
n
㈡平均增長速度
平均增長速度=平均發展速度-1(100%)
平均發展速度大于“1”,平均增長速度就為正值,則稱“平均遞增速度”或“平均遞增率”。平均發展速度小于“1”,平均增長速度就為負值,則稱“平均遞減速度”或“平均遞減率”。71、長期趨勢的測定與預測
長期趨勢就是指某一現象在一個相當長的時期73、移動平均法
注1:若采用奇數項移動平均(如上例“三項”),則平均值是對準在奇項的居中時間處。一次可得趨勢值;若采用偶數項移動平均,則平均值也居中,因未對準原來的時間,還要再計算一次平均數,故一般都用奇數項移動平均。注2:修勻后的數列,較原數列項數少。(在進行統計分析時,若需要兩端數據,則此法不宜使用)注3:取幾項進行移動平均為好,一般若現象有周期變動,則以周期為長度。例,季度資料
可四項移動平均;各年月資料,可十二項移動平均;五年一周期,可五項移動平均。移動平均法可消除周期變動。74、最小平方法
即對原有動態數列配合一條適當的趨勢線來進行修勻。這條趨勢線可以是直線,也可以是曲線;這條趨勢線必須滿足最基本的要求。即:
(yyc)2minyyc
實際值,即原數列值趨勢值或理論值
㈠直線方程
當現象的發展,其逐期增長量大體上相等時。該方程的一般形式為:
方程組可簡化為:
(二)拋物線方程
當現象的發展,
其二級增長量大體
上相同時。
㈢指數曲線方程ycabtyNatybt由聯立方程也可直接推導出:ntytytybnt2(t)2t2(t0)ytyaybtnbnn該方程的一般形式為:ycabtct2(a、b、c均為未定參數)同樣用求偏導數的方法,導出以下聯立方程組:yNabtct223tyatbtct322tyatbtct4
當現象的發展,環比增長速度大體上相等時。
tyab該方程的一般形式為:c先對上述方程兩邊各取對數:lgyclgatlgb
設Ylgyc,Alga,Blgb
則:YABt
應用最小平方法求得的聯立方程組為:
YNABt2tYAtBt
(同樣設t,使t0)75、季節變動分析的意義測定季節變動的資料時間至少要有三個周期以上,如季節資料,至少要有12季,月度資料至少要有36個月等,以避免資料太少而產生偶然性。測定季節變動的方法有二種:
按月平均法,不考慮長期趨勢的影響(假定不存在長期趨勢),直接利用原始動態數列來計算;
移動平均趨勢剔除法,即考慮長期趨勢的存在,剔除其影響后再進行計算,故常用此法。
76、按月平均法測定季節變動
也稱按季平均法。若為月度資料就按月平均;若為季度資料則按季平均。
其步驟如下:列表,將各年同月(季)的數值列在同一欄內;將各年同月(季)數值加總,并求出月(季)平均數;將所有同月(季)數值加總,求出總的月(季)平均數;求季節比率(或季節指數)。
77、時間序列預測法是將歷史資料和數據,按照時間順序排列成一系列,根據時間序列所反映的經濟現象的發展過程、方向和趨勢,將時間序列外推或延伸,以預測經濟現象未來可能達到的水平。
78、時間序列又稱動態序列,它是將某個經濟變量的觀測值,按時間先后順序排列所形成的數列。時間可以是周、月、季度或年等。如商場計算銷售額是按月排列數據,國家計算國民生產總值是按年度來排列數據的
時間序列預測法是世界各國普遍采用的經濟預測的基本方法。
79、在時間序列中,數據的大小受到各種因素的影響,數據的變化趨勢也就表現出各種性狀,通常根據這些影響因素將數據的變化趨勢分為四大類:長期趨勢、季節變動、循環變動和不規則變動。對于前三種數據趨勢預測問題,由于數據均呈現出某種規律性,因此我們能夠將數據進行簡化、分析,從而使預測成為可能;而不規則變動是指由某種偶然因素引起的突然變動,如戰爭的發生、政權的更迭、重大自然災害的發生等,不規則變動沒有周期性。
第五章指數
80、統計指數
概念:廣義指數是指同類事物變動程度的相對數,包括動態相對數、比較相對數、計劃完成相對數,即所有的動態比較指標。
狹義指數是綜合反映多種不同事物在不同時間上的總變動的特殊的相對數。即專門用來綜合說明那些不能直接相加和對比的復雜社會經濟現象的變動情況。
作用:綜合反映多種不同事物的總的變動程度;測定復雜經濟現象的總變動中,各個因素變化的影響;測定平均指標中各因素變動對平均指標變動的影響程度。81、受多種因素影響的現象叫做復雜現象。
(1)現象的總量是各因素的總和;(2)現象的總量是若干因素的乘積。
82、在分組條件下,加權算術平均數的大小受到兩因素的影響:一是現象水平的影響,二是現象PPPPPPPP作為基期,,L稱為環比指數。作為基期,,L稱為定基指數。
012n10000
(3)數量指標指數和質量指標指數——按其所反映的現象性質的不同
反映某一現象規模大小、數量多少,稱數量指標,而表明這些指標變動程度的相對數是數量指數(簡稱),如,產品產量指數、商品銷售量指數、職工人數指數等。
說明工作質量的好壞或事物質的屬性,稱質量指標,而表明這些指標變動程度的相對數,稱質量指數(簡稱),如,產品成本指數、商品價格指數、勞動生產率指數等。84、綜合指數
“同度量因素”的概念:同度量因素有二個作用——①同度量作用②權數作用。利用同度量因素計算的總指數稱為綜合指數。
稱為拉氏數量指數公式Kp85、拉氏指數和派氏指數
(1)拉氏指數公式:拉斯貝爾提出,在綜合指數公式中,同度量因素宜固定于基期。q1p0
q
0
pq
稱為拉氏質量指數公式
1
00
(2)派氏指數:派許提出,在綜合指數公式中,同度量因素宜固定在報告期。q1p1pq
K
q
pq
p11
01
數量指標綜合指數的編制——其同度量因素往往取p
QKp,p01p1
p0K質量指標綜合指數的編制——其同度量因素往往取
pq
p11
87、平均數指數——綜合指數的變形Kp1q1
(1)加權調和平均數指數——通常用于編制質量
權數為原綜合指數基本公式的分子
(右邊把綜合價格指數公式變形為加權調和平均數我國現行農產品收購價格指數和集市貿易價格
指數就采用此公式一切綜合指數)
0
稱為派氏數量指數公式
p
1
0
11
稱為派氏質量指數公式
基期的質量指標報告期的數量指標指標綜合指數。指數的原則適用于
1
86、如何編制綜合指數?
例:
qp
q10
00
q
QKq1,q01q1
0qp
q10
Kq1p0
(2)加權算術平均數指數——通常用于編制數量指標綜合指數
(右邊把綜合產量指數公式變形為加權算術平均數指數的原則適用于一切綜合指數)例:
pq
pp0q1
p
QKp,p1Kp0
p0
Kpq
Kpp0q1
以綜合產量指數為例:
qpKq
q0p0
q
QKq1q1Kq0
Kqp
q
q0p0
88、社會經濟現象是錯綜復雜的,它往往受制于多個相互聯系的因素影響,這種聯系往往表現為一種連乘的關系。分析各構成因素變動對總體變動的影響方向和影響程度,這種方法,也稱連乘因素分析法。89、統計上把互相聯系的指數所構成的體系,叫做指數體系——因素分析法的基礎。例:商品銷售額指數=商品價格指數×商品銷售量指數
生產費用支出額指數=單位成本指數×產品產量指數利用指數體系,可進行指數因素之間的互相換算。90、兩因素現象的變動分析
p1q1p1q1q1p0000100
p1q1p0q0(p1q1p0q1)(q1p0q0p0)91、多因素現象的變動分析
例:總產值=工人人數×工人勞動生產率
ADCB
=工人人數×時勞動生產率×平均工作日長度×平均工作月長度
若引入“共變影響指數”,則:pqpqqppq1
1
1
1
1
11
若建立指數體系為:
pq10
00
仍以上例數據為例,經計算后得相對數變動的關系式為:
129.02%=110.19%117.11%99.98%
多因素則包含二個以上的因素。實際中,采用“連鎖替代法”。
A1B1C1D1A1B0C0D0A1B1C0D0A1B1C1D0A1B1C1D1
A0B0C0D0A0B0C0D0A1B0C0D0A1B1C0D0A1B1C1D0
92、平均指標指數的因素分析
X1f1X1f1X0f1
從公式可看出,總平均數動態指標同時受各組平均水平X和fff
KX11f各組構成變動的影響。這個平均數動態指標,稱"可變000X0f1X0f0
0f1f0構成指數"。
fX1f1X11
f11即
01f1
X01f
稱“固定構成指數”
1
XffX01
ff即稱“結構影響指數”
Xff0fX00
f0
故:可變構成指數=固定構成指數結構影響指數
93、兩種指數體系:
總量指標指數的因素分析
若建立指數體系:
XfXf
XfXfXfXf
()()
ffff
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
(即綜合指數體系)受數量指標變動和質量指標變動的影響大?。?/p>
平均指標指數的因素分析則是指質量指標(平均指標)
(即平均指標指數體系)在分組的條件下受各組水平
以工資總額變動為例:
首先,工資總額變動其次,將質量指標(平均工資)進一步分解為:Xf分解為:XfXfX0f0X0f11.01ffff100f11.數量指標(工人數)變動影響或ffX1f1X0f1X1f12.Xfff11X0f12.質量指標(平均工資)變動影響或f1100101000111
001
94、常用的統計指數
(1)商品零售價格指數的編制方法如下:1.選擇恰當的調查地區和調查點2.選擇代表商品和代表規格品3.搜集價格資料
4.確定權數5、計算平均價格6、編制價格指數
(2)居民消費價格指數簡稱CPI(consumerpriceindex),用于反映居民家庭購買的消費品及服務價格水平的變動情況。我國CPI的調查抽樣調查
95、抽樣調查的意義:一般所講的抽樣調查,即指狹義的抽樣調查(隨機抽樣):按照隨機原則從總體中抽取一部分單位進行觀察,并運用數理統計的原理,以被抽取的那部分單位的數量特征為代表,對總體作出數量上的推斷分析。
抽樣調查方法是市場經濟國家在調查方法上的必然選擇,和普查相比,具有準確度高、成本低、速度快、應用面廣等優點。
96、抽樣調查的適用范圍
實際工作不可能進行全面調查觀察,而又需要了解其全面資料的事物;雖可進行全面調查觀察,但比較困難或并不必要;對普查或全面調查統計資料的質量進行檢查和修正;抽樣方法適用于對大量現象的觀察,即組成事物總體的單位數量較多的情況;利用抽樣推斷的方法,可以對于某種總體的假設進行檢驗,判斷這種假設的真偽,以決定取舍。
97、全及總體和抽樣總體(總體和樣本)
全及總體:所要調查觀察的全部事物??傮w單位數用N表示。
抽樣總體:抽取出來調查觀察的單位。抽樣總體的單位數用n表示。n≥30大樣本n<30小樣本
98、全及指標:全及總體的那些指標。抽樣指標:抽樣總體的那些指標。
99、樣本數——指從總體中可能抽取的樣本的數量。樣本容量——指一個樣本所包括的單位數。
100、抽樣調查的組織形式
(1)簡單隨機抽樣(純隨機抽樣):即從總體單位中不加任何分組、排隊,完全隨機地抽取調查單位。
隨機抽選可有各種不同的具體做法,如:直接抽選法;抽簽法;隨機數碼表法;
(2)類型抽樣(分類抽樣):先對總體各單位按一定標志加以分類(層),然后再從各類(層)中按隨機原則抽取樣本,組成一個總的樣本。
類型的劃分:一是必須有清楚的劃類界限;二是必須知道各類中的單位數目和比例;
三是分類型的數目不宜太多。
類型抽樣的好處是:樣本代表性高、抽樣誤差小、抽樣調查成本較低。如果抽樣誤差的要求相同的話則抽樣數目可以減少。兩種類型:等比例類型抽樣(類型比例抽樣);不等比例類型抽樣(類型適宜抽樣)。
(3)機械抽樣(等距抽樣):先將全及總體的所有單位按某一標志順序排隊,然后按相等的距離抽取樣本單位。
排列次序用的標志有兩種:選擇標志與抽樣調查所研究內容無關,稱無關標志排隊(研究工人的平均收入水平時,按工號
排隊);選擇標志與抽樣調查所研究的B、半距起點等距抽樣
C、對稱等距抽樣
機械抽樣的好處:可以使抽樣過程大大簡化,減輕抽樣的工作量;如果用有關標志排隊,還可以縮小抽樣誤差,提高抽樣推斷效果。
機械抽樣,實際上是一種特殊的類型抽樣。因為,如果在類型抽樣中,把總體劃分為若干相等部分,每個部分只抽一個樣本,在這種情況下,則類型抽樣就成了機械抽樣。(4)整群抽樣
即從全及總體中成群地抽取樣本單位,對抽中的群Nn
2
()
抽樣平均誤差()
n
10(元)
25
(n為樣本配合總數)
抽樣誤差是所有可能出現的樣本指標的標準差。它是由于抽樣的隨機性而產生的樣本指標與總體指標之間的平均離差。103、純隨機抽樣的抽樣平均誤差(一)平均數的抽樣平均誤差重復抽樣:
x
取得σ的途徑有:1.用過去全面調查或抽樣調查的資料,若同時有n個σ的資料,應選用數值較大的那個;2.用樣本標準差S代替全及標準差σ;3.在大規模調查前,先搞個小規模的試驗性的調查來確定S,代替σ;4.用估計的方法
或不重復抽樣:
(二)成數的抽樣平均誤差已證明得:成數的方差為p(1-p)
104、類型抽樣的抽樣平均誤差在重復抽樣情況下:
x
但實際中,
往往N很大,n很小,故改用下列公式:x
在重復抽樣情況下:在不重復抽樣情況下:
p
p
x
i
n
i
iNi
N
在不重復抽樣情況下:x在成數情況下:
重復抽樣:p若按無關標志排隊
不重復抽樣:p
p
105、機械抽樣(等距抽樣)的抽樣平均誤差公式用以上純隨機抽樣的公式,一般采用不重復抽樣公式:若按有關標志排隊公式用類型抽樣的公式:
106、整群抽樣的抽樣平均誤差
為簡便起見,也可采用重復抽樣公式。
p
整群抽樣的抽樣平均誤差受三個因素影響:(1)
抽出的群數(r)多少(反比關系)(2)群間方差(計算方法如下:
x
2
2
)(正比關系)
r
2
(xix)x為全及總體各群的平均數2i1
i
rx為全及平均數
i1
2
(xix)r
r
r
i1
2
(pip)
或:xi為抽樣各群的平均數
x為抽樣各群的總平均數
pi為全及總體各群的成數
r
2
(3)抽樣方法
整群抽樣都采用不重復抽樣。所以在計算抽樣誤差時要使用
修正系數R
r,當R的數目較大時,可用(1r)來代替。R1R整群抽樣的抽樣平均誤差計算公式為:
p
107
以兩階段抽樣為例
設總體分R組,每組包含Mi個單位,若各組M相等,則N=RM
在抽樣第一階段,從R組中抽出r組;在抽樣第二階段,在中選的r組中隨機抽選Mi個單位,若各組m相等,則n=rm則:在重復抽樣下在不重復抽樣下
108、抽樣平均誤差的公式歸納如下:
最基本的是:xx2r2xrm2Rr2Mm)()rR1rmM1,p1-(1)若為不重復抽樣:乘以Nn
(2)若為類型抽樣:
(3)若為整群抽樣:222x
2
pp1-pp1-p2p1-p
RN
n109、點估計和區間估計
(一)點估計:
r就是由樣本指標直接代替全及指標,不考慮p直接代表P。
只要在樣本代表性大,且對全及指標精確性要求不高的情況下,可采用點估計法。如能滿足無偏性、一致性、有效性三個準則,就會得到合理的估計。
(二)區間估計:是根據樣本指標和抽樣誤差去推斷全及指標的可能范圍,它能說清楚估計的準確程度和把握程度。
*置信區間:根據中心極限定理,得知當n足夠大時,抽樣總體為正態分布,根據正態分布規律可知,樣本指標是以一定的
概率落在某一特定的區間抽樣極限誤差△=tμ,(t為概率度)
可見,抽樣極限誤差,即擴大或縮小了以后的抽樣誤差范圍。
抽樣誤差范圍的實際意義是要求被估計的全及指標或PX
落在或的范圍即σ2或P(1P)的大小(正比)
2.允許誤差的大小(反比)
113、必要抽樣數目的計算公式
(一)簡單隨機抽樣
重復抽樣:
t22
n2
復抽樣:不重復抽樣:n2t2P(1P)Nt222nNtP(1P)(二)類型抽樣2n22222;Nt重復抽樣:不重
(三)機械抽樣
在有總體差異程NtP(1P)2tn2x22t2n2pntN222Nt22t2Nn2pNt2p(1p)
度和比重的全面資料時,可采用類型抽樣的公式;
沒有總體的全面資料時,可采用簡單隨機抽樣的公式。
(四)整群抽樣
222nr;NR;2;ppxx
114、假設檢驗的意義
不重復抽樣:r
rtxR222Rtxx22所謂假設檢驗,就是對某一總體參數先作出假設的數值;然后搜集樣本資料,用這些樣本資料確定假設數值與樣本數值之間的差異;最后,進一步判斷兩者差異是否顯著,若兩者差異很小,則假設的參數是可信的,作出“接受”的結論,若兩者的差異很大,則假設的參數準確的可能性很小,作出“拒絕”的結論。
2
ptRRt2p222p
115、假設檢驗的程序
(一)提出原假設和替代假
原假設(又稱虛無假設)是接受檢驗的假設,記作H0;替代假設(又稱備選假設)是當原假設被否定時的另一種可成立的假設,記作H1;H0與H1兩者是對立的,如H0真實,則H1不真實;如H0不真實,則H1為真實。H0和H1在統計學中稱為統計假設。例:關于總體平均數的假設有三種情況:
(1)H0:μ=μ0;H1:μ≠μ0
(2)H0:μ≥μ0;H1:μ<μ0
(3)H0:μ≤μ0;H1:μ>μ0
以上三種類型,對第一種類型的檢驗,稱雙邊檢驗,因為μ≠μ0,包含μ>μ0和μ<μ0。而對第二、三種類型的檢驗,稱單邊檢驗。
(二)選擇顯著性水平
當原假設H0為真時,卻因為樣本指標的差異而被否定,這種否定真實的原假設的概率就是顯著性水平。用α表示。例:α=0.05(即5%)或α=0.01(即1%)
在假設檢驗中,要分析樣本數值與參數假設值之間的差異,若兩者差異越小,假設值真實的可能性則越大;反之,假設值真實的可能性越小。因此,要分析兩者差異是否顯著,如兩者差異是顯著的,就要否定原假設,因此,假設檢驗又稱顯著性檢驗。
(三)選定檢驗統計量及其分布
檢驗總體平均值的統計量有:
檢驗統計量的基本形式
如下:XX
Z,t
檢驗統計量樣本統計量-被假設參數
統計量的標準差
(四)計算檢驗統計量
在計算檢驗統計量時,要注意是雙邊檢驗還是單邊檢驗。要根據顯著性水平α的值確定統計量的否定域、接受域及臨界值。(五)根據樣本指標計算的檢驗統計量的數值作出決策
如果檢驗統計量的數值落在否定域Z1.645
0.1,
1.645,Z1.645
,當單邊檢驗時,取2因為正態分布是雙邊的Z再查得臨界值
第七章相關分析
117、相關關系的概念(注意相關關系與函數關系的區別)
(一)函數關系:它反映著現象之間存在著嚴格的依存關系,也就是具有確定性的對應關系,這種關系可用一個數學表達式
反映出來。
(二)相關關系:它反映著現象之間的數量上不嚴格的依存關系,也就是說兩者之間不具有確定性的對應關系,這種關系有二個明顯特點:1.現象之間確實存在數量上的依存關系,即某一社會經濟現象變化要引起另一社會經濟現象的變化;2.現象之間的這種依存關系是不嚴格的,即無法用數學公式表示。
在具有相互依存關系的兩個變量中,作為根據的變量稱自變量,一般用X表示;發生對應變化的變量稱因變量,一般用y表示。
118、相關關系的種類
(1)按相關關系涉及的因素多少來分,可分為:單相關和復相關。
二因素之間的相關關系稱單相關,即只涉及一個自變量和一個因變量。
三個或三個以上因素的相關關系稱復相關,或多元相關,即涉及二個或二個以上的自變量和因變量。
在實際工作中,如存在多個自變量,可抓住其中主要的自變量,研究其相關關系,而保持另一些因素不變,這時復相關可轉化為偏相關。
(2)按相關關系的性質來分,可分為:正相關和負相關
正相關是指兩相關現象變化的方向是一致的。負相關是指兩相關現象變化的方向是相反的。
(3)按相關關系的形式來分,可分為:直線相關和曲線相關
直線相關是指兩個相關現象之間,當自變量X的數值發生變動時,因變量y隨之發生近似于固定比例的變動,在相關圖上的散點近似地表現為直線形式,因此稱其為直線相關關
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年6月6日全國愛眼日宣傳活動方案
- 小學生種植綜合實踐課程
- 護理核心制度培訓
- 2025年幼兒園愛耳日活動方案
- 2025年八班級物理學期教學方案
- 酒業采購知識培訓課件
- 2025年幼兒園班主任工作方案
- 研究開發與工藝選擇概論
- 廣州城市理工學院《管理案例分析》2023-2024學年第二學期期末試卷
- 2025屆云南省玉溪市名校初三第一套原創猜題(新課標I)英語試題試卷含答案
- 2024年河南應用技術職業學院單招職業適應性測試題庫必考題
- 專用車輛安全管理制度罐式容器
- 2024年河南師范大學附中中招二模英語試卷含答案
- 第22課 現代科技革命和產業發展(教學設計)-【中職專用】《世界歷史》同步課堂(高教版2023?基礎模塊)
- 婦科分級護理標準
- 山東省青島市城陽區2023-2024學年八年級下學期期中考試語文試題
- 武漢大學介紹PPT
- 廣西桂林市國龍外國語學校2022-2023學年下學期期中考試八年級數學試題+
- 《雷鋒的故事》試題和答案
- 新各種疾病門診病歷范文(通用十二篇)
- 露天煤礦水文地質類型劃分報告編制細則
評論
0/150
提交評論