




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四部分統計一一第二十四章描述統計
考情分析:
年份單選題多選題合計
2016年2題2分2題4分6分
2015年4題4分2題4分8分
本章重點:
1.集中趨勢的測度指標:均值、中位數和眾數。
2.離散程度的測度指標:方差、標準差和離散系數。
3.分布形態的測度:偏態系數、標準分數。
4.變量相關關系的分類、散點圖、相關系數。
知識點一:集中趨勢的測度
1.均值。均值也叫做平均數,就是數據組中所有數值的總和除以該組數值的個數。設一組數據
為Xi,X2,為平均數X的計算公式為:
n
nn
【注意1】:均值主要適用于數值型數據,但不適用于分類和順序數據。
【注意2】:均值容易受到極端值的影響,極端值會使得均值向極大值或極小值方向傾斜,使
得均值對數據組的代表性減弱。
2.中位數。把一組數據按從小到大或從大到小的順序進行排列,位置居中的數值叫做中位數,
用風表不:
(等)當n為奇數時
{5cJ當n為偶數時
【注意1]:中位數是一個位置代表值,主要用于順序數據和數值型數據,但不適用于分類數
據。
【注意2】:中位數的優點是不受極端值的影響,抗干擾性強。
3.眾數:指一組數據中出現次數(頻數)最多的變量值。適用于描述分類數據和順序數據,不
適用于定量數據。
【注意】:有些情況下可能出現雙眾數、多眾數或者沒有眾數,難以描述數據的集中趨勢。
總結:均值VS中位數VS眾數:
指標適用特點
利用全部信息,受極端值影響
均值定量變量
如有明顯極端值,則代表性差
沒有充分利用全部信息,不受極端值影響
中位數順序變量和定量變量
適用于分布不對稱的數據
沒有充分利用全部信息,不受極端值影響
眾數分類變量和順序變量
適用于分布明顯呈偏態的數據
【例題?單選題】在對數據集中趨勢的測度中,適用于偏斜分布的數值型數據的是()。
A.中位數B.均值
C.標準差D.方差
r正確答案」A
「答案解析」本題考查中位數。中位數主要適用于順序數據,也適生于數值型數據,但不適用
于分類數據,中位數不受極端值的影響,抗干擾性強,尤其適用于收入這類偏斜分布的數值型
數據。
【例題?單選題】(2015年)下列統計量中,適于描述分類數據集中趨勢的是()。
A.均值
B.眾數
C.中位數
D.變異系數
「正確答案」B
r答案解析」本題考查集中趨勢的測度。眾數適于描述分類數據和順序數據的集中趨勢,不適
用于定量數據。
【例題?單選題】在某企業中隨機抽取7名員工來了解該企業2013年上半年職工請假情況,這
7名員工2013年上半年請假天數分別為1、5、3、10、0、7、2,這組數據中的位數是()。
A.3B.10C.4D.0
「正確答案」A
「答案解析」本題考查中位數。首先要排序,由小到大排序后的數據是0、1、2、3、5、7、10,
中位數直觀觀察即可知道是“3”。
知識點二:離散程度的測度
(一)方差和標準差
集中趨勢對一組數據的代表程度,取決于該組數據的離散水平。數據的離散程度越大,集中趨
勢的測度值對該組數據的代表性就越差,離散程度越小,其代表性就越好°
1.方差。方差是數據組中各數值與其均值離差平方的平均數,它能較好地反映出數據的離散程
度.是實際中應用最廣泛的離散程度測度值.
方差越小,說明數據值與均值的平均距離越小,均值的代表性越好。
總體數據,常用的方差計算公式有兩種:
f(\-X)2
(J2=252_______
N
1萬-
S2=—y(Y.-Y)2
1
樣本數據,常用的方差計算公式:
T二---------------
(n-1)
2.標準差。標準差即方差的平方根。
1n-1
(二)離散系數
1.名稱:變異系數或標準差系數:
2.公式:標準差/均值:CV=s/'X
3.應用:不同類別數據離散程度的比較,消除了測度單位和觀測值水平不同的影響。
【示例】某學校學生的平均年齡為20歲,標準差為3歲;該校教師的平均年齡為38歲,標準
差為3歲。比較該校學生年齡和教師年齡的離散程度。
「解析」
學生年齡的離散系數=3/20=0.15
教師年齡的離散系數=3/38=0.Q789
結論:學生年齡的離散程度更大C
【例題?多選題】(2015年)下列統計量中,容易受極端值影響的有()。
A.均值B.方差
C.眾數D.中位數
E.標準差
「正確答案」ADE
「答案解析」本題考查集中趨勢和離散程度的測度指標。均值、方差、標準差容易受極端值的
影響。
【例題?單選題】(2015年)根據2014年某城市金融業和制造業各1000人的年薪樣本數據來
比較這兩個行業從業人員年薪的離散程度,應采用的統計量是()。
A.標準分數B.相關系數
C.變異系數D.偏態系數
「正確答案」C
「答案解析」本題考查離散系數,離散系數也稱為變異系數或標準差系數,即標準差與均值的
比值,主要用于不同類別數據離散程度的比較。
知識點三:分布形態的測度
(一)偏態系數(SK):
1.偏態系數:測度數據分布偏度的指標;偏度指數據分布的偏斜方向和程度,描述的是數據分
布對稱程度。(單選)
3
SK=n/[(n_l)(n_2)]Z[(xi-x)/s]
2.應用:偏態系數的絕對值越大,數據分布偏斜程度越大。
(1)SK=0:數據分布是對稱的;
(2)SK>0:數據分布右偏;
0~0.5(輕度)0.5-1(中度)大于1(嚴重)
(3)SK<0:數據分布左偏;
0?-0.5(輕度)(中度)大于-1(嚴重)
【例題?多選題】(2016年)在某電商網站上,商品甲得到6個評價得分,分別是1、4、4、5、
5、5;商品乙得到5個評分,分別是3、3、3、4、4。關于這兩組數據的說法,正確的有()。
A.商品甲的評分中位數高于商品乙
B.商品甲的評分均值低于商品乙
C.商品甲的評分眾數高于商品乙
D.商品甲的評分分布離散程度大于商品乙
E.商品甲的評分分布是左偏的
「正確答案」ACDE
r答案解析」本題考查集中趨勢、離散程度的測度。
商品甲:評分中位數=(4+5)/2=4.5,眾數=5,均值=(1+4+4+5+5+5)/6=4,
標準差=1.55,離散系數=1.55/4=0.3875,偏態系數=-2.09。
商品乙:評分中位數=3,眾數=3,均值=3.4,標準差=0.55,離散系數=0.55/3.4=0.16。
【例題?多選題】(2015年)某企業員工年收入數據分布的偏態系數為3.0,則該組數據的分
布形態為()。
A.右偏
B.左偏
C.嚴重偏斜
D.輕度偏斜
E.中度偏斜
「正確答案」AC
「答案解析」本題考查偏態系數c偏態系數為0,說明數據的分布是對稱的。為正,說明分布
是右偏的:取值在0—0.5之間說明輕度右偏;取值在0.5-1之間,說明中度右偏;取值大于
1說明嚴重右偏。為負,說明分布為左偏:取值在0^^-0.5之間,說明輕度左偏;取值在-0.5?
一1之間,說明中度左偏;取值小于一1,說明嚴重左偏。本題中,偏態系數為3,說明嚴重右
偏。
(二)標準分數
1.標準分數也稱Z分數,是統計學上常用的一種標準化方法。標準分數可以給出數值距離均值
的相對位置,用于比較不同分布的變量值。(單選)
2.公式:標準分數2=(數值一均值)+標準差
3.結果:標準分數Z越大越好.
【示例】:某班期末考試。語文考試全班平均成績73分,標準差7分,甲得了78分;數學考
試全班平均成績80分,標準差6.5分,甲得了83分。甲哪一門成績更優秀?
因為兩科分布(均值、標準差)不同,不能用原始數據直接比較,需要轉換成標準分數,然后
比較。
Z(語文)=(78-73)/7=0.71
Z(數學)=(83-80)/6.5=0.46
因此,甲的語文成績更優秀。
4.實際應用:當數據服從對稱的鐘形分布時,可以運用經驗法則來判斷與均值的距離在特定倍
數標準差之內的數據項所占比例。
99.00%
約有68%的數據與平均數的距離在1個標準差之內,標準分數在[T,1]范圍內;
約有95%的數據與平均數的距離在2個標準差之內,標準分數在[-2,2]范圍內;
約有99%的數據與平均數的距離在3個標準差之內,標準分數在[-3,3]范圍內。
【示例】語文考試全班平均成績73分,標準差7分,則95用的得分在59和87之間。
【例題?多選題】(2016年)某企業客戶滿意度數據服從對稱的鐘形分布,均值為75,標準差
為5。根據經驗法則,關于該企業客戶滿意度的說法,正確的有()。
A約有68%的客戶滿意度在[70,S0]范圍內
B約有68%的客戶滿意度在[75,35]范圍內
C約有95%的客戶滿意度在[75,95]范圍內
D約有95%的客戶滿意度在[65,35]范圍內
E約有99%的客戶滿意度在[60,90]范圍內
「正確答案」ADE
r答案解析」本題考查標準分數c經驗法則表明:約有68%的數據與平均數的距離在1個標準
差之內,約有95%的數據與平均數的距離在2個標準差之內,約有99%的數據與平均數的距離在
3個標準差之內。
【例題?單選題】(2015年)根據經驗法則,服從對稱鐘形分布的標準分數在[-2,2]范圍內
的概率是()。
A.95%B.50%
C.68%D.99%
「正確答案」A
I■答案解析」本題考查標準分數。對于服從對稱的鐘形分布的標準分數,68%的標準分數在[T,
+1]范圍內,約有95%的標準分數在[-2,+2]范圍之內,約有99%的標準分數在[-3,+3]范圍
之內。
知識點四:變量間的相關分析
(一)相關關系分類
1.按相關的程度可分為:完全相關、不完全相關和不相關。
2.按相關的方向可分為:正相關和負相關。
3.按相關的形式可分為:線性相關和非線性相關。
【注意】:相關關系并不等同于因果關系。
(二)兩變量的散點圖:兩個變量間的關系可以用散點圖來展示。
1.觀測點分布無規律:不相關。
2.觀測點分布密集在一條線周圍:線性相關
正相關:直線向右上傾斜
負相關:直線向右下傾斜
3.觀測點呈現曲線模式:兩個變量非線性相關。
(三)相關系數的定義和計算
LPearson相關系數:度量的是兩個變量之間的線性相關關系。
2.Pearson相關系數的取值范圍:TWrWl。
OVrWl:變量X和Y之間存在正線性相關關系;
-l<r<0:變量X和Y之間存在負線性相關關系;
r=l:變量X和Y之間為完全正線性相關;
r=-l:變量X和Y之間為完全負線性相關。
【注意】:Pearson相關系數只適用于線性相關關系的判斷。因此r=0只表示兩個變量之間不
存在線性相關關系,并不說明變量之間沒有任何關系,比如它們之間可能存在非線性相關關系。
3.相關程度:
(1)|r|^0.8:高度相關;
(2)0.5^|r|<0,8:中度相關;
(3)0.3W|r|V0.5:低度相關;
(4)|r|<0.3:說明兩個變量之間的相關程度極弱,可視為無線性相關關系。
【例題?單選題】(2016年)下列統計量中,適用于分析兩個定量變量間相互關系的是()。
A.離散系數
B.標準分數
C.相關系數
D.偏態系數
r正確答案」c
「答案解析」本題考查相關系數°相關系數是度量兩個變量間相關關系的統計量。
【例題?單選題】(2016年)根據下面的變量X和變量Y的散點圖,可以看出這兩個變量的Pearson
相關系數r的取值范圍是()。
A.r<-l
B.OWrVl
C.r^l
D.-l<r<0
Y
ISO-
100?-????*
???,.
50-??:???
iX
n0-----------------------,---------'-----------1---------
2040”??.??6080100
-50-?????..
?????
i
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年川南幼兒師范高等專科學校高職單招語文2019-2024歷年真題考點試卷含答案解析
- 2025年山西管理職業學院高職單招職業適應性測試歷年(2019-2024年)真題考點試卷含答案解析
- 2025年山西體育職業學院高職單招語文2019-2024歷年真題考點試卷含答案解析
- 2025年宜春職業技術學院高職單招語文2019-2024歷年真題考點試卷含答案解析
- 2025年安徽廣播影視職業技術學院高職單招職業適應性測試歷年(2019-2024年)真題考點試卷含答案解析
- 2025年寧德職業技術學院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 2025年寧夏民族職業技術學院高職單招職業適應性測試歷年(2019-2024年)真題考點試卷含答案解析
- 2025年寧夏體育職業學院高職單招職業適應性測試歷年(2019-2024年)真題考點試卷含答案解析
- 2025年天津鐵道職業技術學院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- ASNT培訓課件教學課件
- 2024年專業技術人員繼續教育考試必考100題含答案(完整版)
- 新版人教版高中英語選修一、選修二詞匯表
- 江蘇省南京市聯合體2023-2024學年七年級下學期期中英語試卷
- (正式版)JBT 14449-2024 起重機械焊接工藝評定
- 2024年中國人保招聘筆試參考題庫附帶答案詳解
- 2024年共青團入團考試題目及答案
- 提高旅游導游服務技能的培訓課程
- 展廳維保方案
- 酒店貸款報告
- 小學三年級下冊信息技術全冊教案
- 鐵路機車電工
評論
0/150
提交評論