




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025年統(tǒng)計(jì)學(xué)專業(yè)期末考試:數(shù)據(jù)分析計(jì)算題庫與數(shù)據(jù)清洗算法試題考試時(shí)間:______分鐘總分:______分姓名:______一、描述性統(tǒng)計(jì)計(jì)算要求:根據(jù)給出的數(shù)據(jù),計(jì)算以下統(tǒng)計(jì)量:均值、中位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差、極差、四分位數(shù)。1.已知一組數(shù)據(jù):3,5,7,9,11,13,15,17,19,21。請(qǐng)計(jì)算:(1)均值(2)中位數(shù)(3)眾數(shù)(4)方差(5)標(biāo)準(zhǔn)差(6)極差(7)第一四分位數(shù)(8)第三四分位數(shù)2.已知一組數(shù)據(jù):2,4,6,8,10,12,14,16,18,20。請(qǐng)計(jì)算:(1)均值(2)中位數(shù)(3)眾數(shù)(4)方差(5)標(biāo)準(zhǔn)差(6)極差(7)第一四分位數(shù)(8)第三四分位數(shù)二、概率計(jì)算要求:根據(jù)給出的條件,計(jì)算以下概率。1.拋擲一枚公平的六面骰子,求:(1)出現(xiàn)偶數(shù)的概率(2)出現(xiàn)大于3的概率(3)出現(xiàn)1或6的概率(4)出現(xiàn)偶數(shù)且大于3的概率2.從一副52張的標(biāo)準(zhǔn)撲克牌中隨機(jī)抽取一張牌,求:(1)抽到紅桃的概率(2)抽到黑桃的概率(3)抽到方塊的概率(4)抽到紅桃或方塊的概率(5)抽到紅桃且方塊的概率三、假設(shè)檢驗(yàn)要求:根據(jù)給出的假設(shè)檢驗(yàn)問題,進(jìn)行以下步驟。1.已知某工廠生產(chǎn)的產(chǎn)品重量服從正態(tài)分布,均值為100克,標(biāo)準(zhǔn)差為5克。現(xiàn)從該工廠抽取10個(gè)樣本,計(jì)算樣本均值為105克的置信區(qū)間(置信水平為95%)。2.某公司聲稱其產(chǎn)品的使用壽命為500小時(shí),現(xiàn)從該產(chǎn)品中抽取10個(gè)樣本,計(jì)算樣本均值為450小時(shí)的置信區(qū)間(置信水平為99%)。3.某項(xiàng)調(diào)查結(jié)果顯示,某地區(qū)居民的平均年收入為8萬元,現(xiàn)從該地區(qū)抽取100個(gè)樣本,計(jì)算樣本均值為7.5萬元的置信區(qū)間(置信水平為90%)。4.某工廠生產(chǎn)的產(chǎn)品重量服從正態(tài)分布,均值為100克,標(biāo)準(zhǔn)差為5克。現(xiàn)從該工廠抽取10個(gè)樣本,進(jìn)行假設(shè)檢驗(yàn),檢驗(yàn)假設(shè)H0:μ=100,H1:μ≠100,顯著性水平為0.05。5.某項(xiàng)調(diào)查結(jié)果顯示,某地區(qū)居民的平均年收入為8萬元,現(xiàn)從該地區(qū)抽取100個(gè)樣本,進(jìn)行假設(shè)檢驗(yàn),檢驗(yàn)假設(shè)H0:μ=8,H1:μ≠8,顯著性水平為0.01。6.某工廠生產(chǎn)的產(chǎn)品重量服從正態(tài)分布,均值為100克,標(biāo)準(zhǔn)差為5克。現(xiàn)從該工廠抽取10個(gè)樣本,進(jìn)行假設(shè)檢驗(yàn),檢驗(yàn)假設(shè)H0:σ=5,H1:σ≠5,顯著性水平為0.10。7.某項(xiàng)調(diào)查結(jié)果顯示,某地區(qū)居民的平均年收入為8萬元,現(xiàn)從該地區(qū)抽取100個(gè)樣本,進(jìn)行假設(shè)檢驗(yàn),檢驗(yàn)假設(shè)H0:σ=8,H1:σ≠8,顯著性水平為0.05。8.某工廠生產(chǎn)的產(chǎn)品重量服從正態(tài)分布,均值為100克,標(biāo)準(zhǔn)差為5克。現(xiàn)從該工廠抽取10個(gè)樣本,進(jìn)行假設(shè)檢驗(yàn),檢驗(yàn)假設(shè)H0:μ=100,H1:μ≠100,顯著性水平為0.10。9.某項(xiàng)調(diào)查結(jié)果顯示,某地區(qū)居民的平均年收入為8萬元,現(xiàn)從該地區(qū)抽取100個(gè)樣本,進(jìn)行假設(shè)檢驗(yàn),檢驗(yàn)假設(shè)H0:μ=8,H1:μ≠8,顯著性水平為0.01。10.某工廠生產(chǎn)的產(chǎn)品重量服從正態(tài)分布,均值為100克,標(biāo)準(zhǔn)差為5克。現(xiàn)從該工廠抽取10個(gè)樣本,進(jìn)行假設(shè)檢驗(yàn),檢驗(yàn)假設(shè)H0:σ=5,H1:σ≠5,顯著性水平為0.05。四、回歸分析要求:根據(jù)給出的數(shù)據(jù),進(jìn)行線性回歸分析,并解釋結(jié)果。1.已知某城市房?jī)r(jià)(萬元)與面積(平方米)的數(shù)據(jù)如下:面積(平方米):80,90,100,110,120,130,140,150,160,170房?jī)r(jià)(萬元):120,135,150,165,180,195,210,225,240,255請(qǐng)進(jìn)行線性回歸分析,求出回歸方程,并計(jì)算R2值。2.某公司員工的工作經(jīng)驗(yàn)(年)與年收入(萬元)的數(shù)據(jù)如下:工作經(jīng)驗(yàn)(年):1,2,3,4,5,6,7,8,9,10年收入(萬元):5,7,9,10,12,14,16,18,20,22請(qǐng)進(jìn)行線性回歸分析,求出回歸方程,并解釋工作經(jīng)驗(yàn)對(duì)年收入的影響。五、時(shí)間序列分析要求:根據(jù)給出的時(shí)間序列數(shù)據(jù),進(jìn)行以下分析。1.某城市近10年的年降水量數(shù)據(jù)如下:年份:2015,2016,2017,2018,2019,2020,2021,2022,2023,2024降水量(毫米):600,650,700,750,800,850,900,950,1000,1050請(qǐng)對(duì)降水量數(shù)據(jù)進(jìn)行時(shí)間序列分析,并預(yù)測(cè)2025年的降水量。2.某公司近5年的銷售額數(shù)據(jù)如下:年份:2019,2020,2021,2022,2023銷售額(萬元):500,550,600,650,700請(qǐng)對(duì)銷售額數(shù)據(jù)進(jìn)行時(shí)間序列分析,并預(yù)測(cè)2024年的銷售額。六、分類與聚類分析要求:根據(jù)給出的數(shù)據(jù),進(jìn)行以下分類與聚類分析。1.某地區(qū)居民消費(fèi)水平的數(shù)據(jù)如下:收入水平:低,中低,中等,中高,高消費(fèi)水平:低,中低,中等,中高,高請(qǐng)使用K-means聚類算法對(duì)消費(fèi)水平進(jìn)行聚類,并解釋聚類結(jié)果。2.某公司員工的性別、年齡、職位、薪資水平的數(shù)據(jù)如下:性別:男,女年齡:20-30,31-40,41-50,51-60職位:普通員工,主管,經(jīng)理,總監(jiān)薪資水平:低,中低,中等,中高,高請(qǐng)使用決策樹算法對(duì)薪資水平進(jìn)行分類,并解釋分類結(jié)果。本次試卷答案如下:一、描述性統(tǒng)計(jì)計(jì)算1.(1)均值=(3+5+7+9+11+13+15+17+19+21)/10=11(2)中位數(shù)=(11+13)/2=12(3)眾數(shù)=數(shù)據(jù)中無重復(fù)值,故無眾數(shù)(4)方差=[(3-11)2+(5-11)2+(7-11)2+(9-11)2+(11-11)2+(13-11)2+(15-11)2+(17-11)2+(19-11)2+(21-11)2]/10=14(5)標(biāo)準(zhǔn)差=√方差=√14≈3.74(6)極差=最大值-最小值=21-3=18(7)第一四分位數(shù)=(3+5)/2=4(8)第三四分位數(shù)=(13+15)/2=142.(1)均值=(2+4+6+8+10+12+14+16+18+20)/10=10(2)中位數(shù)=(10+12)/2=11(3)眾數(shù)=數(shù)據(jù)中無重復(fù)值,故無眾數(shù)(4)方差=[(2-10)2+(4-10)2+(6-10)2+(8-10)2+(10-10)2+(12-10)2+(14-10)2+(16-10)2+(18-10)2+(20-10)2]/10=16(5)標(biāo)準(zhǔn)差=√方差=√16=4(6)極差=最大值-最小值=20-2=18(7)第一四分位數(shù)=(4+6)/2=5(8)第三四分位數(shù)=(12+14)/2=13二、概率計(jì)算1.(1)出現(xiàn)偶數(shù)的概率=3/6=1/2(2)出現(xiàn)大于3的概率=4/6=2/3(3)出現(xiàn)1或6的概率=2/6=1/3(4)出現(xiàn)偶數(shù)且大于3的概率=2/6=1/32.(1)抽到紅桃的概率=13/52=1/4(2)抽到黑桃的概率=13/52=1/4(3)抽到方塊的概率=13/52=1/4(4)抽到紅桃或方塊的概率=(13/52)+(13/52)=26/52=1/2(5)抽到紅桃且方塊的概率=0/52=0三、假設(shè)檢驗(yàn)1.樣本均值=105樣本標(biāo)準(zhǔn)差=5樣本量=10置信區(qū)間公式:均值±(Zα/2*標(biāo)準(zhǔn)差/√樣本量)Zα/2=Z0.975(對(duì)應(yīng)95%置信水平)置信區(qū)間=(100-(1.96*5/√10),100+(1.96*5/√10))≈(95.06,104.94)2.樣本均值=450樣本標(biāo)準(zhǔn)差=未知(需計(jì)算)樣本量=10置信區(qū)間公式:均值±(Zα/2*標(biāo)準(zhǔn)差/√樣本量)由于樣本標(biāo)準(zhǔn)差未知,無法計(jì)算置信區(qū)間。3.樣本均值=750樣本標(biāo)準(zhǔn)差=未知(需計(jì)算)樣本量=100置信區(qū)間公式:均值±(Zα/2*標(biāo)準(zhǔn)差/√樣本量)由于樣本標(biāo)準(zhǔn)差未知,無法計(jì)算置信區(qū)間。四、回歸分析1.回歸方程:y=ax+b其中,a為斜率,b為截距a=∑(x-x?)(y-?)/∑(x-x?)2b=?-a*x?計(jì)算得:a=2.2b=90.2R2=0.892.回歸方程:y=ax+b其中,a為斜率,b為截距a=∑(x-x?)(y-?)/∑(x-x?)2b=?-a*x?計(jì)算得:a=0.6b=1.8回歸方程:年收入=0.6*工作經(jīng)驗(yàn)+1.8工作經(jīng)驗(yàn)對(duì)年收入的影響是正相關(guān)的,每增加一年工作經(jīng)驗(yàn),年收入增加0.6萬元。五、時(shí)間序列分析1.通過時(shí)間序列分析,我們可以使用移動(dòng)平均法、指數(shù)平滑法等方法進(jìn)行預(yù)測(cè)。這里以簡(jiǎn)單移動(dòng)平均法為例,計(jì)算過去5年的移動(dòng)平均值,并以此為基礎(chǔ)預(yù)測(cè)2025年的降水量。移動(dòng)平均值=(2015年降水量+2016年降水量+...+2023年降水量)/5預(yù)測(cè)2025年降水量=2024年降水量+移動(dòng)平均值-2024年降水量2.同樣,使用簡(jiǎn)單移動(dòng)平均法進(jìn)行預(yù)測(cè):
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《深入了解硫酸生產(chǎn)》課件
- 《阿里巴巴商業(yè)模式分析》課件
- 鐵路旅客運(yùn)輸服務(wù)高鐵時(shí)代的客運(yùn)服務(wù)課件
- 《三峽人家風(fēng)光覽》課件
- 房屋買賣糾紛調(diào)解協(xié)議
- 鐵道機(jī)車專業(yè)教學(xué)鄭州鐵路毛乾亞課件
- 鐵路班組管理建設(shè)班組創(chuàng)新文化課件
- 鐵路市場(chǎng)營銷產(chǎn)品生命周期概述課件
- 鐵路線路安全防護(hù)邵鵬飛年課件
- 河底固定電纜施工方案
- (完整)教育心理學(xué)-各章節(jié)重點(diǎn)學(xué)習(xí)筆記
- T-ZZB 3624-2024 1000kV交流架空輸電線路金具
- 2025年河南應(yīng)用技術(shù)職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫匯編
- 2025年中國雞尾酒行業(yè)市場(chǎng)運(yùn)行態(tài)勢(shì)及投資戰(zhàn)略規(guī)劃報(bào)告
- 學(xué)生會(huì)述職報(bào)告:文體部工作匯報(bào)
- 冀教版 八年級(jí)英語下冊(cè) 第二學(xué)期 期中綜合測(cè)試卷(2025年春)
- 民兵國防知識(shí)教育教案
- 隱私安全與用戶滿意度關(guān)系-洞察分析
- 心理健康C證面試15題
- DB33T 2202-2019 公安警察院校警務(wù)化管理規(guī)范
- 2025湖南長(zhǎng)沙水業(yè)集團(tuán)限公司招聘35人高頻重點(diǎn)提升(共500題)附帶答案詳解
評(píng)論
0/150
提交評(píng)論