




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
思考與練習思考題分類數據的圖示方法,其中包括條形圖、Pareto圖、對比條形圖和餅圖等。順序數據除了上文提到的條形圖、pareto圖、對比條形圖、餅圖之外還可以借助累積頻數分布圖和環形圖來進行描述。條形圖、餅圖、環形圖、累積分布圖、直方圖、莖葉圖、箱形圖、散點圖、線圖、三維散點圖、氣泡圖、雷達圖等。數據分組按照分組標志的不同可以分為單變量值分組和組距分組兩種。根據組距不同還可以分為等距分組和不等距分組。分組和編制頻數分布表的具體步驟如下:第1步:排序。將變量按照一定的大小順序進行排序,通常是由小至大的遞增順序,使用計算機軟件進行整理時此步可以忽略。第2步:確定組數。一般與數據本身的特點及數據的多少有關。由于分組的目的之一是為了觀察數據分布的特征,因此組數的多少應適中。如組數太少,數據的分布就會過于集中,組數太多,數據的分布就會過于分散,這都不便于觀察數據分布的特征和規律。組數的確定應以能夠顯示數據的分布特征和規律為目的。一般情況下,一組數據所分的組數K不應少于5組且不多于15組,即5<K<15。在實際分組時,也可以借助經驗公式來確定組數K,其中n為數據的個數,對結果四舍五入取整數即為組數。第3步:確定各組的組距。在組距分組中,一個組的最小值稱為下限(lowlimit);一個組的最大值稱為上限(upperlimit),組距(classwidth)是一個組的上限與下限的差。組距可根據全部數據的最大值和最小值及所分的組數來確定,即,組距=(最大值—最小值)/組數。餅圖是用圓形及圓內扇形的角度來表示數值大小的圖形,它主要用于表示一個樣本(或總體)中各組成部分的數據占全部數據的比例,對于研究結構性問題十分有用。環形圖中間有一個“空洞”,樣本或總體中的每一部分數據用環中的一段表示。餅圖只能顯示一個總體和樣本各部分所占的比例,而環形圖則可以同時繪制多個總體或樣本的數據系列,每一個總體或樣本的數據系列為一個環。因此環形圖可顯示多個總體或樣本各部分所占的相應比例,從而有利于進行比較研究。直方圖與條形圖是不同的,首先,條形圖是用條形的長度(橫置時)表示各類別頻數的多少,其寬度(表示類別)則是固定的;直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或頻率,寬度則表示各組的組距,因此其高度與寬度均有意義。其次,由于分組數據具有連續性,直方圖的各矩形通常是連續排列,而條形圖則是分開排列。最后,條形圖主要用于展示分類數據,而直方圖則主要用于展示數值型數據。莖葉圖類似于橫置的直方圖,與直方圖相比,莖葉圖既能給出數據的分布狀況,又能給出每一個原始數值,即保留了原始數據的信息。而直方圖雖然能很好地顯示數據的分布,但不能保留原始的數值。在應用方面,直方圖通常適用于大批量數據,莖葉圖通常適用于小批量數據。統計圖一般由下面幾個部分構成:(1)標題,即圖的名稱,簡明扼要說明資料的中心內容,必要時注明時間和地點,一般寫在圖的正下方位置,同時將圖形的編號寫在標題的前面。(2)標目,分為縱標目與橫標目,分別表示縱軸與橫軸數字刻度的意義,一般注明度量衡單位。(3)點線條面,借以用來顯示數據的元素,這是圖形的主體部分,用于顯示數據和展示數據的規律和關系。(4)刻度,指在縱軸或橫軸上的坐標。(5)圖例,其目的是為了使讀者能區分統計圖中各種圖形的意義。一般用“圖優性(Graphicalexcellency)”來描述一個好的統計圖。“圖優性”是指圖形能夠在最短的時間內,用最少的筆墨,在最小的空間里,給觀眾最多的思想。一張好的圖形應包括如下基本特性:顯示數據,集中反映圖形的內容,避免歪曲,數據之間可進行有效比較,目的明確且唯一,統計描述和文字說明清晰。常見的統計表一般由4個主要部分組成,即表頭、行標題、列標題和數據,此外,必要時可以在統計表的下方加上表外附加說明。在具體編制統計表時,應當遵循以下幾點規則:(1)統計表的結構要合理,內容要簡練,形式要美觀。比如行標題、列標題、數字資料的位置應安排合理。如果有合計一項,一般放在最后一行或最后一列。有時,由于強調的問題不同,行標題和列標題可以互換,但應使統計表的橫豎長度比例適當,避免出現過高或過長的表格形式。(2)統計表一般使用“三線表”的形式,如表3—24所示,表的上下兩端橫線一般用粗線條繪制,用細線把行標題和數字資料進行分離,統計表的左右兩端不封口。這樣使人看起來清楚、醒目、美觀。如果數據關系復雜,單靠三條線是不夠的,在這種情況下,數據資料也可用橫線或豎線對數據資料進行分開,以表明數據的隸屬關系,但必須用細線,總之表中盡量少用橫豎線。(3)表頭一般應包括表號、總標題和表中數據的單位等內容。總標題應簡明確切地概括出統計表的內容,一般需要表明統計數據的時間(When)、地點(Where)以及何種數據(What),即標題內容應滿足3W要求。如果表中的全部數據都是同一計量單位,可放在表的右上角標明,若各變量的計量單位不同,則應放在每個變量后或單列出一列標明。(4)表中的數據一般是右對齊,有小數點時應以小數點對齊,而且小數點的位數應統一。當數字因小可略而不計時,可寫上“0”;當缺某項數字資料時,可用符號“…”表示;不應有數字時用符號“一”表示,一張填好的統計表不應出現空白單元格。(5)在繪制統計表時,為保證統計資料的科學性與嚴肅性,在統計表下,應注明資料來源,以表明表中數據的可靠性,或是方便讀者查閱使用。必要時,也可在統計表下添加注解,以對變量或數據進行必要的解釋和文字說明。二、單項選擇題1-5CACCD6-10CBBBC11-15CDDBC16-20CDDBB21-25BBBCB26-30ACABD三、練習題1、(1)屬于順序數據(2)計數項:成績成績匯總ABCDE82526156總計80(3)成績人數累計頻率A880.1B25330.4125C26590.7375D15740.925E6801總計80801(4)2、(1)(2)正態分布3、(1)接收頻率累積%接收頻率累積%49510.00791530.0059520.00891152.00691040.00691072.00791570.0049582.00891192.0059592.00994100.00994100.00合計0-合計0-(2)(3)VAR00001Stem-and-LeafPlotFrequencyStem&Leaf2.004.133.004.6673.005.0032.005.895.006.011445.006.577997.007.00013448.007.556667886.008.0113445.008.577893.009.0221.009.7Stemwidth:10.00Eachleaf:1case(s)4、(2)接收頻率%累積%接收頻率累積%6944.00991122.00%791216.00109940.00%891632.0089856.00%991854.00119770.00%1091672.0079682.00%1191486.00129490.00%129894.0069294.00%139498.00139298.00%1492100.00其他1100.00%100——(3)VAR00004Stem-and-LeafPlotFrequencyStem&Leaf2.006.896.007.2335668.008.011234569.0010.0024666787.0011.23558994.0012.46782.0013.241.0014.1Stemwidth:10.00Eachleaf:1case(s)5、(1)VAR00003Stem-and-LeafPlotFrequencyStem&Leaf1.0011.62.0012.021.0012.82.0013.042.0013.562.0014.222.0014.78.0015.1.0015.52.0016.021.0016.84.0017.0233Stemwidth:100.00Eachleaf:1case(s)6、(1)計數項:時間時間匯總7:0037:3048:0048:3079:002總計20(2)7、(1)、(2)8、(1)(2)(3)9、(1)接收頻率%累積%接收頻率%累積%291010.0020-30510.00391626.0030-40826.00491238.0040-50638.00591664.0050-601364.00692084.0060-701084.00791296.0070-80696.00894100.0080-902100.00合計100-合計100-(2)(3)10、(1)(2)11、(1)(2)(3)第四章二、單項選擇題1-5CADBD6-10BCBDD11-15BACCC16-20BBBCD21-25CDACC26-28DAA三、計算分析題4.1(1)首先將數據由小到大進行排列,中位數的位置為,即排在第7位的數值為中位數,即民生銀行的營業收入為中位數,350.17億元。平均數(2)即在第3個數值(145.13)和第4個數值(176.11)之間0.25的位置上,因此(億元)即在第9個數值(1295.31)和第10個數值(3340.37)之間0.75的位置上,因此(億元)(3)百分位數的位置由于不是整數,百分位數的位置就是第個位置的數據的整數部分,則第30個百分位數是第4個數,即華夏銀行的營業收入176.11億元為第30個百分數。(4)=1786.559(億元),4.2通常情況下,這種比賽對選手的打分是計算切尾均值,即同時集中平均數和中位數兩種統計量的優點,且考慮到歌手B的得分中存在極端高分,故用切尾均值比較合適。首先將歌手A的分數按升序整理為順序統計量,得到,,,,,,,,7.9,8.1,8.2,8.3,8.5,8.6,8.6,8.7,8.9因為極端高分只有一個,因此去掉一個最高分,去掉一個最低分,取。則歌手A的最后得分為:歌手B的最后得分為:由以上計算結果,可知歌手A的分數略高于歌手B。4.3若按單利計算:設本金為V,則該筆本金12年應得的利息總和=V(0.03×3+0.05×1+0.08×2+0.1×3+0.15×1)=0.75V則平均年利率若按復利計算:則平均年利率4.4已知(元),(元),則(元)因為,因此該公司職工月工資收入呈左偏分布。4.5(1)眾數72和74.3中位數的位置為則中位數為排序后處于15位和16位的兩個數值的平均數,即平均數為(2)即在第7個數值(71.2)和第8個數值(71.2)之間0.5的位置上,因此(g/L)即在第22個數值(75.8)和第23個數值(75.9)之間0.5的位置上,因此(g/L)(3)眾數72和74.3的頻數均為4,故兩種情況下異眾比率均為極差為標準差(4)用Excel求得偏態系數為-0.013,峰態系數為-0.446。(5)由于眾數與平均數非常接近,可知數據分布應較為對稱,又由于標準差數值較小,可知數據離散程度應不大。這一點同時可由偏態系數-0.013和峰態系數-0.446得到印證,即女大學生血清總蛋白含量數據屬輕微的左偏分布,同時略有扁平。4.6已知,,根據經驗法則,有95.45%的年份里二氧化硫超標的天數在21~37天之間,有2.275%的年份里超標天數大于37天,有0.00135%的年份里超標天數大于41天,有15.865%的年份里超標天數少于25天。4.7(元/人)(元/人)(元/人)(元/人)由以上計算可得:(1)B企業的平均工資高于A企業的平均工資。(2)由于,所以A企業的平均工資更具有代表性。4.8(1)2023年粗鋼產量的平均數(百萬噸)2023年粗鋼產量的中位數的位置為,故中位數(百萬噸)(2)2023年粗鋼產量的四分位數為即為第3個數值,即(百萬噸)即為第9個數值,即(百萬噸)則2023年粗鋼產量的四分位差為(百萬噸)2023年粗鋼產量的平均數(百萬噸)因此2023年粗鋼產量的標準差為(百萬噸)(3)2023年粗鋼產量的標準差為(百萬噸)因此2023年中國、印度、俄羅斯和巴西的值分別為:2023年中國、印度、俄羅斯和巴西的值分別為:由以上計算結果可知,中國、俄羅斯、巴西三國的標準分數變數不大,而印度則有明顯提高,因此印度粗鋼產量的排名也由2023年的第5位上升到2023年的第3位。4.9(1)由20-30歲年齡組的分數計算離散系數為由60-64歲年齡組的分數計算離散系數為因此,60-64歲年齡組的分數差異較大。(2)由于20-30歲年齡組的WAIS分數大致是正態分布,根據經驗法則,可知20-30歲年齡組中有68.27%的人分數在85~135之間。(3)由于60-64歲年齡組的WAIS分數大致是正態分布,根據經驗法則,可知60-64歲年齡組中有68.27%的人分數在65~115之間。(4)莎拉的標準分為母親的標準分為由計算結果可知,莎拉的母親在60-64年齡組中分數比較高。4.104.11(1)莖葉圖如下:數莖樹葉數據個數638937012678999991180001126(2)最省油自動擋SUV耗油量的平均數和標準差分別為(3)最省油手動擋SUV耗油量的平均數和標準差分別為因此由以上結果可知,自動擋SUV耗油量的離散程度較大。(4)平均來看,自動擋SUV的耗油量要高于手動擋,且離散程度較大,如果購買一款SUV,從經濟省油的角度考慮,選擇手動擋較合適。第五章二.單項選擇題:1-5BCDAA6-10DDBBD11-15BBDBD16-20AABAC21-25DBCAB26-30ACDBA三計算分析題解:(1)根據原始數據,計算可得:(小時);=735(小時);則其68.27%的置信區間為:(2),n=100,,則其68.27%的置信區間為:2、解:(1),,n=100,(2)已知:,n=100,,則其95.45%的置信區間為:3、解:(1)已知:n=20,,,由方差未知時,小樣本的區間估計公式得:(2)已知:,,,則其置信區間為:4、解:已知:,,,則其置信區間為:5、解:已知:,,,則其置信區間為:6、解:已知(件)7、解:已知(個)8、解:已知:,n=136,,則其95%的置信區間為:9、解:(1)已知:n=16,,,由方差未知時,小樣本的區間估計公式得:即該單位平均每個家庭每天看電視的95%的置信區間為5.55小時到7.95小時。(2)若已知總體標準差,且要求區間估計的邊際誤差與上一題的相同,即取邊際誤差。當時,,估計總體均值時樣本容量的確定公式為:只需增加一個樣本就能滿足精度需要。10、解:已知:,,,則其置信區間為:第六章二單選1-5ABABC6-10ACDAB11-15BABBD16-20DBDAD21-25CCCAA26-30BABAD31-35CBADA36-40DADAC三計算分析解:建立原假設與備擇假設為:,(1)檢驗統計量<,所以拒絕原假設,認為該批元件的厚度不符合規定的要求。(2)利用P值決策。用【NORMSDIST】計算出的P值為0.00146<=0.01,所以拒絕原假設,認為該批元件的厚度不符合規定的要求,與統計量決策結果一致。6.2解:(1),。(2)樣本數據表明應該拒絕原假設時,意味著該生產線生產的玻璃紙平均橫向延伸率不符合規格,必須對生產線進行調整。(3)樣本數據無法支持拒絕原假設時意味著質量控制監督人員沒有充分的理由認為該生產線所處狀態不正常,無需停產調整。6.3解:(1)發生第一類錯誤指的是實際上獎勵計劃并未提高銷售人員的平均銷售額,而公司董事長卻認為它提高了銷售人員的平均銷售額,這將導致公司錯誤的推行新的獎勵計劃,卻無法獲得更高的銷售額。(2)發生第二類錯誤指的是實際上獎勵計劃提高了銷售人員的平均銷售額,公司董事長卻沒有意識到,這將使公司錯過推行新的獎勵計劃的機會,也就無法進一步提高銷售額。6.4解:建立原假設與備擇假設為:,;(1)檢驗統計量<,在5%的顯著性水平下,拒絕原假設,既有足夠的證據認為新的教學方法使100米成績有所提高。(2)利用P值決策。用【NORMSDIST】計算出的P值為0.0337<=0.05,拒絕原假設,有足夠的證據認為新的教學方法使100米成績有所提高,與統計量決策結果一致。6.5解:建立原假設與備擇假設為:;(1)檢驗的臨界值是,檢驗統計量,所以拒絕原假設,即在5%的顯著性水平下,認為該化肥能夠使小麥增產。(2)利用P值決策。用【NORMSDIST】計算出的P值為0.0004<=0.05,所以拒絕原假設,即在5%的顯著性水平下,認為該化肥能夠使小麥增產,與統計量決策結果一致。6.6建立原假設與備擇假設為:;,由Excel中的【TINV】函數得因為,所以拒絕原假設,即在5%的顯著性水平下,認為該化肥能夠使小麥增產。(2)利用P值決策。用【TDIST】計算出的P值為0.0014<=0.05,所以拒絕原假設,即在5%的顯著性水平下,認為該化肥能夠使小麥增產,與統計量決策結果一致。6.7建立原假設與備擇假設為:,(1)檢驗統計量,所以拒絕原假設,認為該城市平均人口有所下降。(2)利用P值決策。用【NORMSDIST】計算出的P值為0.0000374749<=0.05,所以拒絕原假設,即在5%的顯著性水平下,認為該城市平均人口有所下降,與統計量決策結果一致。6.8建立原假設與備擇假設為:,(1)檢驗統計量,所以拒絕原假設,認為該廠的平均成本有所下降。(2)利用P值決策。用【NORMSDIST】計算出的P值為0.001<=0.01,所以拒絕原假設,即在5%的顯著性水平下,認為該廠的平均成本有所下降,與統計量決策結果一致。6.9建立原假設與備擇假設為:;(1)檢驗統計量<,不能拒絕原假設,因此沒有充分的理由認為該批皮鞋優質率達到96%,所以不接受該批訂貨。(2)利用P值決策。用【NORMSDIST】計算出的P值為0.671>=0.05,所以不能拒絕原假設,沒有充分的理由認為該批皮鞋優質率達到96%,不接受該批訂貨,與統計量決策結果一致。6.10建立原假設與備擇假設為:;(1)檢驗統計量<,同時也小于,所以不拒絕原假設,因此沒有充分的理由認為超過80%的行人有違章行為。(2)利用P值決策。用【NORMSDIST】計算出的P值為0.4022>=0.05或=0.01,所以不拒絕原假設,沒有充分的理由認為超過80%的行人有違章行為,與統計量決策結果一致。第7章相關與回歸分析二單項選擇題1-5BCBAC6-10CCABA11-15BCCAA16-20CCBDB21-25CBBAA26_30BCBBA31_35CBABA36_40BAAAA三計算分析題7.1(1)散點圖如下:從散點圖可以看出,銷售收入與廣告費用之間為正的線性相關關系。(2)利用Excel的“CORREL”函數計算的相關系數為。(3)首先提出如下假設:,。計算檢驗的統計量當時,。由于檢驗統計量,拒絕原假設。表明產量與生產費用之間的線性關系顯著。7.2(1)散點圖如下:從散點圖可以看出,復習時間與考試分數之間為正的線性相關關系。(2)利用Excel的“CORREL”函數計算的相關系數為。相關系數,表明復習時間與考試分數之間有較強的正線性相關關系。7.3(1)散點圖如下:7.3利用Excel的“CORREL”函數計算的相關系數為。由Excel輸出的回歸結果如下表:得到的回歸方程為:回歸系數表示運送距離每增加1公里,運送時間平均增加0.003585天。7.4(1)散點圖如下:從散點圖可以看出,航班正點率與被投訴次數之間為負的線性相關關系。(2)由Excel輸出的回歸結果如下表:回歸統計MultipleR0.868643RSquare0.75454AdjustedRSquare0.723858標準誤差18.88722觀測值10方差分析dfSSMSFSignificanceF回歸分析18772.5848772.58424.591870.001108殘差82853.816356.727總計911626.4Coefficients標準誤差tStatP-valueIntercept430.189272.154835.9620290.000337XVariable1-4.700620.947894-4.959020.001108得到的回歸方程為:。回歸系數表示航班正點率每增加1%,顧客投訴次數平均下降4.7次。(3)回歸系數檢驗的P-Value=0.001108<),拒絕原假設,回歸系數顯著。(4)(次)。(5)當時,,。置信區間為:即(37.7,70.7)。預測區間為:即(7.6,100.8)。7.5Excel輸出的回歸結果如下:回歸統計MultipleR0.968167RSquare0.937348AdjustedRSquare0.916463標準誤差3.809241觀測值5方差分析dfSSMSFSignificanceF回歸分析1651.2691651.269144.883180.006785殘差343.5309414.51031總計4694.8Coefficients標準誤差tStatP-valueIntercept13.625414.3994283.0970860.053417XVariable12.3029320.3437476.6994910.006785由上述結果可知:回歸方程為,回歸系數表明,每增加一個單位平均增加2.3029個單位;判定系數,表明回歸方程的擬合程度較高;估計標準誤差,表明用來預測時平均的預測誤差為3.8092。7.5(1)方差分析表中所缺的數值如下:變差來源dfSSMSFSignificanceF回歸11622708.61622708.6359.192.17E-09殘差1040158.074015.807——總計111642866.67———(2)根據方差分析表計算的判定系數。表明汽車銷售量的變差中有98.7%是由于廣告費用的變動引起的。(3)相關系數可由判定系數的平方根求得:。(4)回歸方程為:。回歸系數表示廣告費用每增加一個單位,銷售量平均增加1.420231個單位。(5)由于SignificanceF=2.17E-09<,表明廣告費用與銷售量之間的線性關系顯著。當時,。當,。的平均值的95%的置信區間為:即(1.98,3.94)。(2)當時,。當,。的平均值的95%的預測區間為:(-2.08,7.62)第八章第8章時間序列分析和預測8.1(1)時間序列圖如下:從時間序列圖可以看出,國家財政用于國防的支出額大體上呈指數上升趨勢。(2)年平均增長率為:。(3)。8.2(1)時間序列圖如下:(2)2023年的預測值為:(3)由Excel輸出的指數平滑預測值如下表:2023年時的預測值為:時的預測值為:比較誤差平方可知,更合適。8.3(1)第19個月的3期移動平均預測值為:(2)由Excel輸出的指數平滑預測值如下表:月份營業額預測0.3誤差平方預測0.4誤差平方預測0.5誤差平方12952283295.0144.0295.0144.0295.0144.03322291.4936.4290.21011.2289.01089.04355300.62961.5302.92712.3305.52450.35286316.9955.2323.81425.2330.31958.16379307.65093.1308.74949.0308.15023.37381329.02699.4336.81954.5343.61401.68431344.67459.6354.55856.2362.34722.39424370.52857.8385.11514.4396.6748.510473386.67468.6400.75234.4410.33928.7
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 征收土地協議書3篇
- 辦理土地證委托書范本的歷史演變3篇
- 工程款支付簡單協議書2篇
- 建筑項目承攬合同2篇
- 學習保證書學長的見證3篇
- 建筑揚塵防治合同承諾書3篇
- 低碳出行和諧共生3篇
- 勞務分包公司二次結構協議3篇
- 2025蛇年除夕感受500字(10篇)
- 繁星春水讀書心得體會40(15篇)
- 全過程工程咨詢投標方案(技術方案)
- 《住宅室內防水工程技術規范JGJ298-2013》
- 2《建筑機械使用安全技術規程》JGJ33-2012
- 病人呼吸心跳驟停搶救流程
- GB/T 4802.2-2008紡織品織物起毛起球性能的測定第2部分:改型馬丁代爾法
- GB 14934-2016食品安全國家標準消毒餐(飲)具
- 英語高考3500詞帶音標
- 泥水平衡頂管施工方案(專家論證)
- 框架結構柱、梁板模板安裝技術交底
- 呼吸衰竭臨床表現及鑒別診療精編ppt
- 自然辯證法(2023修訂版)課后思考題
評論
0/150
提交評論