統計學第四版課后習題答案_第1頁
統計學第四版課后習題答案_第2頁
統計學第四版課后習題答案_第3頁
統計學第四版課后習題答案_第4頁
統計學第四版課后習題答案_第5頁
已閱讀5頁,還剩44頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGEPAGE14第1章緒論1.什么是統計學?怎樣理解統計學與統計數據的關系?2.試舉出日常生活或工作中統計數據及其規律性的例子.3..一家大型油漆零售商收到了客戶關于油漆罐分量不足的許多抱怨。因此,他們開始檢查供貨商的集裝箱,有問題的將其退回。最近的一個集裝箱裝的是2440加侖的油漆罐.這家零售商抽查了50罐油漆,每一罐的質量精確到4位小數。裝滿的油漆罐應為4。536kg。要求:(1)描述總體;(2)描述研究變量;(3)描述樣本;(4)描述推斷。答:(1)總體:最近的一個集裝箱內的全部油漆;(2)研究變量:裝滿的油漆罐的質量;(3)樣本:最近的一個集裝箱內的50罐油漆;(4)推斷:50罐油漆的質量應為4。536×50=226.84.“可樂戰”是描述市場上“可口可樂”與“百事可樂”激烈競爭的一個流行術語。這場戰役因影視明星、運動員的參與以及消費者對品嘗試驗優先權的抱怨而頗具特色。假定作為百事可樂營銷戰役的一部分,選擇了1000名消費者進行匿名性質的品嘗試驗(即在品嘗試驗中,兩個品牌不做外觀標記),請每一名被測試者說出A品牌或B品牌中哪個口味更好。要求:(1)描述總體;(2)描述研究變量;(3)描述樣本;(4)一描述推斷。答:(1)總體:市場上的“可口可樂”與“百事可樂”(2)研究變量:更好口味的品牌名稱;(3)樣本:1000名消費者品嘗的兩個品牌(4)推斷:兩個品牌中哪個口味更好。第2章統計數據的描述——練習題●1.為評價家電行業售后服務的質量,隨機抽取了由100家庭構成的一個樣本。服務質量的等級分別表示為:A.好;B。較好;C。一般;D。差;E。較差。調查結果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(1)指出上面的數據屬于什么類型;用Excel制作一張頻數分布表;(3)繪制一張條形圖,反映評價等級的分布。解:(1)由于表2。21中的數據為服務質量的等級,可以進行優劣等級比較,但不能計算差異大小,屬于順序數據.(2)頻數分布表如下:服務質量等級評價的頻數分布服務質量等級家庭數(頻數)頻率%A1414B2121C3232D1818E1515合計100100(3)條形圖的制作:將上表(包含總標題,去掉合計欄)復制到Excel表中,點擊:圖表向導→條形圖→選擇子圖表類型→完成(見Excel練習題2.1).即得到如下的條形圖:●2。某行業管理局所屬40個企業2002年的產品銷售收入數據如下(單位:萬元):1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126(1)根據上面的數據進行適當的分組,編制頻數分布表,并計算出累積頻數和累積頻率;(2)如果按規定:銷售收入在125萬元以上為先進企業,115萬~125萬元為良好企業,105萬~115萬元為一般企業,105萬元以下為落后企業,按先進企業、良好企業、一般企業、落后企業進行分組.解:(1)要求對銷售收入的數據進行分組,全部數據中,最大的為152,最小的為87,知數據全距為152-87=65;為便于計算和分析,確定將數據分為6組,各組組距為10,組限以整10劃分;為使數據的分布滿足窮盡和互斥的要求,注意到,按上面的分組方式,最小值87可能落在最小組之下,最大值152可能落在最大組之上,將最小組和最大組設計成開口形式;按照“上限不在組內"的原則,用劃記法統計各組內數據的個數—-企業數,也可以用Excel進行排序統計(見Excel練習題2.2),將結果填入表內,得到頻數分布表如下表中的左兩列;將各組企業數除以企業總數40,得到各組頻率,填入表中第三列;在向上的數軸中標出頻數的分布,由下至上逐組計算企業數的向上累積及頻率的向上累積,由上至下逐組計算企業數的向下累積及頻率的向下累積。整理得到頻數分布表如下:40個企業按產品銷售收入分組表按銷售收入分組(萬元)企業數(個)頻率(%)向上累積向下累積企業數頻率企業數頻率100以下100~110110~120120~130130~140140以上591274312。522。530.017.510.07.55142633374012.535。065。082。592。5100.04035261473100.087。565。035。017.57.5合計40100.0-———(2)按題目要求分組并進行統計,得到分組表如下:某管理局下屬40個企分組表按銷售收入分組(萬元)企業數(個)頻率(%)先進企業良好企業一般企業落后企業11119927。527。522。522。5合計40100.03。某百貨公司連續40天的商品銷售額如下(單位:萬元):41252947383430384340463645373736454333443528463430374426384442363737493942323635根據上面的數據進行適當的分組,編制頻數分布表,并繪制直方圖.解:全部數據中,最大的為49,最小的為25,知數據全距為49-25=24;為便于計算和分析,確定將數據分為5組,各組組距為5,組限以整5的倍數劃分;為使數據的分布滿足窮盡和互斥的要求,注意到,按上面的分組方式,最小值24已落在最小組之中,最大值49已落在最大組之中,故將各組均設計成閉口形式;按照“上限不在組內”的原則,用劃記法或用Excel統計各組內數據的個數—-天數,(見Excel練習題2.3)并填入表內,得到頻數分布表如下表中的左兩列;將各組天數除以總天數40,得到各組頻率,填入表中第三列;得到頻數分布表如下:某百貨公司日商品銷售額分組表按銷售額分組(萬元)頻數(天)頻率(%)25~3030~3535~4040~4545~5046159610。015。037。522。515。0合計40100.0直方圖:將上表(包含總標題,去掉合計欄)復制到Excel表中,點擊:圖表向導→柱形圖→選擇子圖表類型→完成.即得到如下的直方圖:(見Excel練習題2。3)●4。為了確定燈泡的使用壽命(小時),在一批燈泡中隨機抽取100只進行測試,所得結果如下:700716728719685709691684705718706715712722691708690692707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用計算機對上面的數據進行排序;(2)以組距為10進行等距分組,整理成頻數分布表,并繪制直方圖;(3)繪制莖葉圖,并與直方圖作比較。解:(1)排序:將全部數據復制到Excel中,并移動到同一列,點擊:數據→排序→確定,即完成數據排序的工作。(見Excel練習題2.4)(2)按題目要求,利用已排序的Excel表數據進行分組及統計,得到頻數分布表如下:(見Excel練習題2.4)100只燈泡使用壽命非頻數分布按使用壽命分組(小時)燈泡個數(只)頻率(%)650~66022660~67055670~68066680~6901414690~7002626700~7101818710~7201313720~7301010730~74033740~75033合計=SUM(ABOVE)100=SUM(ABOVE)100制作直方圖:將上表(包含總標題,去掉合計欄)復制到Excel表中,選擇全表后,點擊:圖表向導→柱形圖→選擇子圖表類型→完成。即得到如下的直方圖:(見Excel練習題2。4)(3)制作莖葉圖:以十位以上數作為莖,填入表格的首列,將百、十位數相同的數據的個位數按由小到大的順序填入相應行中,即成為葉,得到莖葉圖如下:651866145686713467968112333455588996900111122233445566677888899700011223456667788897100223356778897201225678997335674147將直方圖與莖葉圖對比,可見兩圖十分相似。●5.下面是北方某城市1~2月份各天氣溫的記錄數據:-32-4-7—11-1789-6—7-14-18—15-9-6-105—4-9—3-6—8-12-16-19-15—22-25-24-19-21—8—6—15—11—12-19-25—24-18—17-24-14-22-13-9—60-15—4—9—3—32—4—4-16-175-6-5指出上面的數據屬于什么類型;對上面的數據進行適當的分組;繪制直方圖,說明該城市氣溫分布的特點。解:(1)由于各天氣溫的記錄數據屬于數值型數據,它們可以比較高低,且0不表示沒有,因此是定距數據。(2)分組如下:由于全部數據中,最大的為9,最小的為-25,知數據全距為9-(-25)=34;為便于計算和分析,確定將數據分為7組,各組組距為5,組限以整5的倍數劃分;為使數據的分布滿足窮盡和互斥的要求,注意到,按上面的分組方式,最小值-25已落在最小組之中,最大值9已落在最大組之中,故將各組均設計成閉口形式;按照“上限不在組內”的原則,用劃記法(或Excel排序法,見Excel練習題2.5)統計各組內數據的個數-—天數,并填入表內,得到頻數分布表如下表;北方某城市1~2月份各天氣溫分組天數(天)-25~—208-20~—158—15~—1010—10~-514-5~0140~545~107合計=SUM(ABOVE)65(3)制作直方圖:將上表(包含總標題,去掉合計欄)復制到Excel表中,點擊:圖表向導→柱形圖→選擇子圖表類型→完成。即得到如下的直方圖:(見Excel練習題2。5)●6.下面是某考試管理中心對2002年參加成人自學考試的12000名學生的年齡分組數據:年齡18~1921~2122~2425~2930~3435~3940~4445~59%1。934。734.117.26。42。71.81.2對這個年齡分布作直方圖;從直方圖分析成人自學考試人員年齡分布的特點。解:(1)制作直方圖:將上表復制到Excel表中,點擊:圖表向導→柱形圖→選擇子圖表類型→完成。即得到如下的直方圖:(見Excel練習題2。6)(2)年齡分布的特點:自學考試人員年齡的分布為右偏。7。下面是A、B兩個班學生的數學考試成績數據:A班:4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396B班:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100將兩個班的考試成績用一個公共的莖制成莖葉圖;比較兩個班考試成績分布的特點.解:(1)將樹莖放置中間,A班樹葉向左生長,B班樹葉向右生長,得莖葉圖如下:A班樹莖B班數據個數樹葉樹葉數據個數03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2)比較可知:A班考試成績的分布比較集中,且平均分數較高;B班考試成績的分布比A班分散,且平均成績較A班低.8.1997年我國幾個主要城市各月份的平均相對濕度數據如下表,試繪制箱線圖,并分析各城市平均相對濕度的分布特征.月份北京長春南京鄭州武漢廣州成都昆明蘭州西安149707657777279655167241687157758083654167347507768818081584974450397267758479614670555566863718375584158657547357748782724342769708274818684845862874798271738478745755968667167718175775565104759755372807876456511665982777872787153731256578265827582715272資料來源:《中國統計年鑒1998》,中國統計出版社1998,第10頁。解:箱線圖如下:(特征請讀者自己分析)●9。某百貨公司6月份各天的銷售額數據如下(單位:萬元):257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295(1)計算該百貨公司日銷售額的均值、中位數和四分位數;(2)計算日銷售額的標準差。解:(1)將全部30個數據輸入Excel表中同列,點擊列標,得到30個數據的總和為8223,于是得該百貨公司日銷售額的均值:(見Excel練習題2.9)===274。1(萬元)或點選單元格后,點擊“自動求和”→“平均值”,在函數EVERAGE()的空格中輸入“A1:A30",回車,得到均值也為274.1。在Excel表中將30個數據重新排序,則中位數位于30個數據的中間位置,即靠中的第15、第16兩個數272和273的平均數:Me==272.5(萬元)由于中位數位于第15個數靠上半位的位置上,所以前四分位數位于第1~第15個數據的中間位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,從而:QL=261+=261。25(萬元)同理,后四分位數位于第16~第30個數據的中間位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,從而:QU=291-=290。75(萬元)。(2)未分組數據的標準差計算公式為:s=利用上公式代入數據計算是個較為復雜的工作。手工計算時,須計算30個數據的離差平方,并將其求和,()再代入公式計算其結果:得s=21。1742。(見Excel練習題2.9)我們可以利用Excel表直接計算標準差:點選數據列(A列)的最末空格,再點擊菜單欄中“∑”符號右邊的小三角“▼”,選擇“其它函數”→選擇函數“STDEV”→“確定”,在出現的函數參數窗口中的Number1右邊的空欄中輸入:A1:A30,→“確定”,即在A列最末空格中出現數值:21。17412,即為這30個數據的標準差。于是:(萬元)。(見Excel練習題2.9)●10。甲乙兩個企業生產三種產品的單位成本和總成本資料如下:產品名稱單位成本(元)總成本(元)甲企業乙企業ABC152030210030001500325515001500比較哪個企業的總平均成本高?并分析其原因。解:設產品單位成本為x,產量為f,則總成本為xf,由于:平均成本==,而已知數據中缺產量f的數據,又因個別產品產量f==從而=,于是得:甲企業平均成本===19.41(元),乙企業平均成本===18.29(元),對比可見,甲企業的總平均成本較高.原因:盡管兩個企業的單位成本相同,但單位成本較低的產品在乙企業的產量中所占比重較大,因此拉低了總平均成本。●11.在某地區抽取的120家企業按利潤額進行分組,結果如下:按利潤額分組(萬元)企業數(個)200~30019300~40030400~50042500~60018600以上11合計120計算120家企業利潤額的均值和標準差。解:設各組平均利潤為x,企業數為f,則組總利潤為xf,由于數據按組距式分組,須計算組中值作為各組平均利潤,列表計算得:按利潤額分組(萬元)組中值企業數(個)總利潤xfxf200~300250194750300~4003503010500400~5004504218900500~600550189900600以上650117150合計—12051200于是,120家企業平均利潤為:===426。67(萬元);分組數據的標準差計算公式為:s=手動計算須列表計算各組數據離差平方和(x-426。67)2f,列表計算如下組中值企業數(個)(x-426.67)2xf25019593033。489135030176348。6674504222860.133855018273785.200265011548639。1779合計1201614666。668表格中(x-426.67)2f方法一:將表格復制到Excel表中,點擊第三列的頂行單元格后,在輸入欄中輸入:=(a3-426.67)*(a3-426.67)*b3,回車,得到該行的計算結果;點選結果所在單元格,并將鼠標移動到該單元格的右下方,當鼠標變成黑“+"字時,壓下左鍵并拉動鼠標到該列最后一組數據對應的單元格處放開,則各組數據的(x-426.67)2f計算于是得標準差:(見Excel練習題2.11)s===116。48(萬元).點擊第三列的合計單元格后,點擊菜單欄中的“∑”號,回車,即獲得第三列數據的和。方法二:將各組組中值x復制到Excel的A列中,并按各組次數f在同列中復制,使該列中共有f個x,120個數據生成后,點選A列的最末空格,再點擊菜單欄中“∑”符號右邊的小三角“▼”,選擇“其它函數”→選擇函數“STDEV”→“確定”,在出現的函數參數窗口中的Number1右邊的空欄中輸入:A1:A30,→“確定”,即在A列最末空格中出現數值:116.4845,即為這120個數據的標準差.(見Excel練習題2.11)于是得標準差:s=116。4845(萬元)。●12。為研究少年兒童的成長發育狀況,某研究所的一位調查人員在某城市抽取100名7~17歲的少年兒童作為樣本,另一位調查人員則抽取了1000名7~17歲的少年兒童作為樣本。請回答下面的問題,并解釋其原因。(1)哪一位調查研究人員在其所抽取的樣本中得到的少年兒童的平均身高較大?或者這兩組樣本的平均身高相同?(2)哪一位調查研究人員在其所抽取的樣本中得到的少年兒童身高的標準差較大?或者這兩組樣本的標準差相同?(3)哪一位調查研究人員有可能得到這1100名少年兒童的最高者或最低者?或者對兩位調查研究人員來說,這種機會是相同的?解:(1)(2)兩位調查人員所得到的平均身高和標準差應該差不多相同,因為均值和標準差的大小基本上不受樣本大小的影響。(3)具有較大樣本的調查人員有更大的機會取到最高或最低者,因為樣本越大,變化的范圍就可能越大.●13。一項關于大學生體重狀況的研究發現,男生的平均體重為60公斤,標準差為5公斤;女生的平均體重為50公斤(1)是男生的體重差異大還是女生的體重差異大?為什么?(2)以磅為單位(1公斤=2.2磅(3)粗略地估計一下,男生中有百分之幾的人體重在55公斤到65公斤之間?(4)粗略地估計一下,女生中有百分之幾的人體重在40公斤到60公斤之間?解:(1)由于兩組的平均體重不相等,應通過比較離散系數確定體重差異較大的組:因為女生的離散系數為V===0。1男生體重的離散系數為V===0。08對比可知女生的體重差異較大.(2)男生:==27。27(磅),s==2。27(磅);女生:==22.73(磅),s==2。27(磅);(3)68%;(4)95%。14.對10名成年人和10名幼兒的身高(厘米)進行抽樣調查,結果如下:成年組166169172177180170172174168173幼兒組68696870717372737475(1)要比較成年組和幼兒組的身高差異,你會采用什么樣的指標測度值?為什么?(2)比較分析哪一組的身高差異大?解:(1)應采用離散系數,因為成年人和幼兒的身高處于不同的水平,采用標準差比較不合適。離散系數消除了不同組數據水平高低的影響,采用離散系數就較為合理。(2)利用Excel進行計算,得成年組身高的平均數為172.1,標準差為4.202,從而得:成年組身高的離散系數:;又得幼兒組身高的平均數為71。3,標準差為2。497,從而得:幼兒組身高的離散系數:;由于幼兒組身高的離散系數大于成年組身高的離散系數,說明幼兒組身高的離散程度相對較大.15。一種產品需要人工組裝,現有三種可供選擇的組裝方法。為檢驗哪種方法更好,隨機抽取15個工人,讓他們分別用三種方法組裝。下面是15個工人分別用三種方法在相同的時間內組裝的產品數量(單位:個):方法A方法B方法C164129125167130126168129126165130127170131126165130128164129127168127126164128127162128127163127125166128126167128116166125126165132125你準備采用什么方法來評價組裝方法的優劣?如果讓你選擇一種方法,你會作出怎樣的選擇?試說明理由.解:(1)下表給計算出這三種組裝方法的一些主要描述統計量:方法A方法B方法C平均165.6平均128.73平均125。53中位數165中位數129中位數126眾數164眾數128眾數126標準偏差2。13標準偏差1。75標準偏差2.77極差8極差7極差12最小值162最小值125最小值116最大值170最大值132最大值128評價優劣應根據離散系數,據上得:方法A的離散系數VA==0。0129,方法B的離散系數VB==0。0136,方法C的離散系數VC==0.0221;對比可見,方法A的離散系數最低,說明方法A最優。(2)我會選擇方法A,因為方法A的平均產量最高而離散系數最低,說明方法A的產量高且穩定,有推廣意義。16.在金融證券領域,一項投資的的預期收益率的變化通常用該項投資的風險來衡量。預期收益率的變化越小,投資風險越低,預期收益率的變化越大,投資風險就越高.下面的兩個直方圖,分別反映了200種商業類股票和200種高科技類股票的收益率分布.在股票市場上,高收益率往往伴隨著高風險。但投資于哪類股票,往往與投資者的類型有一定關系。(1)你認為該用什么樣的統計測度值來反映投資的風險?(2)如果選擇風險小的股票進行投資,應該選擇商業類股票還是高科技類股票?(3)如果你進行股票投資,你會選擇商業類股票還是高科技類股票?頻數025頻數0255002550頻數—3003060-3003060收益率收益率(a)商業類股票(b)高科技類股票解:(1)方差或標準差;(2)商業類股票;(3)(略)。17。下圖給出了2000年美國人口年齡的金字塔,其繪制方法及其數字說明與【例2.10】相同,試對該圖反映的人口、政治、社會、經濟狀況進行分析。第3章概率與概率分布—-練習題1。某技術小組有12人,他們的性別和職稱如下,現要產生一名幸運者。試求這位幸運者分別是以下幾種可能的概率:(1)女性;(2)工程師;(3)女工程師,(4)女性或工程師。并說明幾個計算結果之間有何關系?序號123456789101112性別男男男女男男女男女女男男職稱工程師技術員技術員技術員技術員工程師工程師技術員技術員工程師技術員技術員解:設A=女性,B=工程師,AB=女工程師,A+B=女性或工程師(1)P(A)=4/12=1/3(2)P(B)=4/12=1/3(3)P(AB)=2/12=1/6(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/22.某種零件加工必須依次經過三道工序,從已往大量的生產記錄得知,第一、二、三道工序的次品率分別為0.2,0.1,0。1,并且每道工序是否產生次品與其它工序無關。試求這種零件的次品率。解:求這種零件的次品率,等于計算“任取一個零件為次品”(記為A)的概率.考慮逆事件“任取一個零件為正品”,表示通過三道工序都合格.據題意,有:于是3.已知參加某項考試的全部人員合格的占80%,在合格人員中成績優秀只占15%。試求任一參考人員成績優秀的概率。解:設A表示“合格”,B表示“優秀”。由于B=AB,于是=0。8×0.15=0。124.某項飛碟射擊比賽規定一個碟靶有兩次命中機會(即允許在第一次脫靶后進行第二次射擊)。某射擊選手第一發命中的可能性是80%,第二發命中的可能性為50%.求該選手兩發都脫靶的概率。解:設A=第1發命中.B=命中碟靶。求命中概率是一個全概率的計算問題。再利用對立事件的概率即可求得脫靶的概率。=0.8×1+0.2×0.5=0.9脫靶的概率=1-0.9=0.1或(解法二):P(脫靶)=P(第1次脫靶)×P(第2次脫靶)=0.2×0。5=0.15.已知某地區男子壽命超過55歲的概率為84%,超過70歲以上的概率為63%。試求任一剛過55歲生日的男子將會活到70歲以上的概率為多少?解:設A=活到55歲,B=活到70歲。所求概率為:6.某企業決策人考慮是否采用一種新的生產管理流程.據對同行的調查得知,采用新生產管理流程后產品優質率達95%的占四成,優質率維持在原來水平(即80%)的占六成。該企業利用新的生產管理流程進行一次試驗,所生產5件產品全部達到優質.問該企業決策者會傾向于如何決策?解:這是一個計算后驗概率的問題.設A=優質率達95%,=優質率為80%,B=試驗所生產的5件全部優質。P(A)=0.4,P()=0。6,P(B|A)=0.955,P(B|)=0.85,所求概率為:決策者會傾向于采用新的生產管理流程。7。某公司從甲、乙、丙三個企業采購了同一種產品,采購數量分別占總采購量的25%、30%和45%。這三個企業產品的次品率分別為4%、5%、3%。如果從這些產品中隨機抽出一件,試問:(1)抽出次品的概率是多少?(2)若發現抽出的產品是次品,問該產品來自丙廠的概率是多少?解:令A1、A2、A3分別代表從甲、乙、丙企業采購產品,B表示次品.由題意得:P(A1)=0。25,P(A2)=0.30,P(A3)=0。45;P(B|A1)=0。04,P(B|A2)=0。05,P(B|A3)=0.03;因此,所求概率分別為:(1)=0。25×0.04+0。30×0。05+0.45×0。03=0。0385(2)8。某人在每天上班途中要經過3個設有紅綠燈的十字路口。設每個路口遇到紅燈的事件是相互獨立的,且紅燈持續24秒而綠燈持續36秒.試求他途中遇到紅燈的次數的概率分布及其期望值和方差、標準差。解:據題意,在每個路口遇到紅燈的概率是p=24/(24+36)=0。4。設途中遇到紅燈的次數=X,因此,X~B(3,0.4)。其概率分布如下表:xi0123P(X=xi)0。2160.4320。2880。064期望值(均值)=1。2(次),方差=0.72,標準差=0.8485(次)9.一家人壽保險公司某險種的投保人數有20000人,據測算被保險人一年中的死亡率為萬分之5。保險費每人50元。若一年中死亡,則保險公司賠付保險金額50000元。試求未來一年該保險公司將在該項保險中(這里不考慮保險公司的其它費用):(1)至少獲利50萬元的概率;(2)虧本的概率;(3)支付保險金額的均值和標準差.解:設被保險人死亡數=X,X~B(20000,0。0005).(1)收入=20000×50(元)=100萬元。要獲利至少50萬元,則賠付保險金額應該不超過50萬元,等價于被保險人死亡數不超過10人。所求概率為:P(X≤10)=0.58304。(2)當被保險人死亡數超過20人時,保險公司就要虧本。所求概率為:P(X>20)=1-P(X≤20)=1-0.99842=0.00158(3)支付保險金額的均值=50000×E(X)=50000×20000×0。0005(元)=50(萬元)支付保險金額的標準差=50000×σ(X)=50000×(20000×0。0005×0。9995)1/2=158074(元)10.對上述練習題3.09的資料,試問:(1)可否利用泊松分布來近似計算?(2)可否利用正態分布來近似計算?(3)假如投保人只有5000人,可利用哪種分布來近似計算?解:(1)可以.當n很大而p很小時,二項分布可以利用泊松分布來近似計算。本例中,λ=np=20000×0.0005=10,即有X~P(10).計算結果與二項分布所得結果幾乎完全一致.(2)也可以。盡管p很小,但由于n非常大,np和np(1—p)都大于5,二項分布也可以利用正態分布來近似計算。本例中,np=20000×0。0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9。995,即有X~N(10,9。995)。相應的概率為:P(X≤10.5)=0.51995,P(X≤20。5)=0。853262。可見誤差比較大(這是由于P太小,二項分布偏斜太嚴重)。【注】由于二項分布是離散型分布,而正態分布是連續性分布,所以,用正態分布來近似計算二項分布的概率時,通常在二項分布的變量值基礎上加減0.5作為正態分布對應的區間點,這就是所謂的“連續性校正”。(3)由于p=0。0005,假如n=5000,則np=2。5<5,二項分布呈明顯的偏態,用正態分布來計算就會出現非常大的誤差.此時宜用泊松分布去近似。11。某企業生產的某種電池壽命近似服從正態分布,且均值為200小時,標準差為30小時。若規定壽命低于150小時為不合格品。試求該企業生產的電池的:(1)合格率是多少?(2)電池壽命在200左右多大的范圍內的概率不小于0。9。解:(1)=0.04779合格率為1—0。04779=0.95221或95。221%。(2)設所求值為K,滿足電池壽命在200±K小時范圍內的概率不小于0.9,即有:即:,K/30≥1.64485,故K≥49。3456。12。某商場某銷售區域有6種商品。假如每1小時內每種商品需要12分鐘時間的咨詢服務,而且每種商品是否需要咨詢服務是相互獨立的。求:(1)在同一時刻需用咨詢的商品種數的最可能值是多少?(2)若該銷售區域僅配有2名服務員,則因服務員不足而不能提供咨詢服務的概率是多少?解:設X=同一時刻需用咨詢服務的商品種數,由題意有X~B(6,0.2)(1)X的最可能值為:X0=[(n+1)p]=[7×0。2]=1(取整數)(2)=1—0。9011=0。0989第4章抽樣與抽樣分布——練習題1。一個具有個觀察值的隨機樣本抽自于均值等于20、標準差等于16的總體。⑴給出的抽樣分布(重復抽樣)的均值和標準差⑵描述的抽樣分布的形狀。你的回答依賴于樣本容量嗎?⑶計算標準正態統計量對應于的值。⑷計算標準正態統計量對應于的值。解:已知n=64,為大樣本,μ=20,σ=16,⑴在重復抽樣情況下,的抽樣分布的均值為a。20,2b.近似正態c.—2。25d。1。502.參考練習4。1求概率。⑴<16;⑵>23;⑶>25;⑷.落在16和22之間;⑸〈14。解:a.0。0228b。0.0668c.0.0062d.0。8185e。0。00133.一個具有個觀察值的隨機樣本選自于、的總體。試求下列概率的近似值:解:a.0。8944b.0.0228c。0。1292d.0。96994。一個具有個觀察值的隨機樣本選自于和的總體。⑴你預計的最大值和最小值是什么?⑵你認為至多偏離多么遠?⑶為了回答b你必須要知道嗎?請解釋。解:a.101,99b.1c。不必5。考慮一個包含的值等于0,1,2,…,97,98,99的總體。假設的取值的可能性是相同的。則運用計算機對下面的每一個值產生500個隨機樣本,并對于每一個樣本計算。對于每一個樣本容量,構造的500個值的相對頻率直方圖.當值增加時在直方圖上會發生什么變化?存在什么相似性?這里和。解:趨向正態6.美國汽車聯合會(AAA)是一個擁有90個俱樂部的非營利聯盟,它對其成員提供旅行、金融、保險以及與汽車相關的各項服務.1999年5月,AAA通過對會員調查得知一個4口之家出游中平均每日餐飲和住宿費用大約是213美元(《旅行新聞》TravelNews,1999年5月11日).假設這個花費的標準差是15美元,并且AAA所報道的平均每日消費是總體均值。又假設選取49個4描述(樣本家庭平均每日餐飲和住宿的消費)的抽樣分布。特別說明服從怎樣的分布以及的均值和方差是什么?證明你的回答;對于樣本家庭來說平均每日消費大于213美元的概率是什么?大于217美元的概率呢?在209美元和217美元之間的概率呢?解:a。正態分布,213,4.5918b.0.5,0。031,0。9387.技術人員對奶粉裝袋過程進行了質量檢驗.每袋的平均重量標準為克、標準差為克.監控這一過程的技術人者每天隨機地抽取36袋,并對每袋重量進行測量。現考慮這36袋奶粉所組成樣本的平均重量.(1)描述的抽樣分布,并給出和的值,以及概率分布的形狀;假設某一天技術人員觀察到,這是否意味著裝袋過程出現問題了呢,為什么?解:a.406,1。68,正態分布b。0.001c.是,因為小概率出現了8.在本章的統計實踐中,某投資者考慮將1000美元投資于種不同的股票。每一種股票月收益率的均值為,標準差。對于這五種股票的投資組合,投資者每月的收益率是。投資者的每月收益率的方差是,它是投資者所面臨風險的一個度量.假如投資者將1000美元僅投資于這5種股票的其中3種,則這個投資者所面對的風險將會增加還是減少?請解釋;假設將1000美元投資在另外10種收益率與上述的完全一樣的股票,試度量其風險,并與只投資5種股票的情形進行比較。解:a。增加b。減少9.某制造商為擊劍運動員生產安全夾克,這些夾克是以劍鋒刺入其中時所需的最小力量(以牛頓為單位)來定級的.如果生產工藝操作正確,則他生產的夾克級別應平均840牛頓,標準差15牛頓。國際擊劍管理組織(FIE)希望這些夾克的最低級別不小于800牛頓。為了檢查其生產過程是否正常,某檢驗人員從生產過程中抽取了50個夾克作為一個隨機樣本進行定級,并計算,即該樣本中夾克級別的均值。她假設這個過程的標準差是固定的,但是擔心級別均值可能已經發生變化。如果該生產過程仍舊正常,則的樣本分布為何?假設這個檢驗人員所抽取樣本的級別均值為830牛頓,則如果生產過程正常的話,樣本均值≤830牛頓的概率是多少?在檢驗人員假定生產過程的標準差固定不變時,你對b部分有關當前生產過程的現狀有何看法(即夾克級別均值是否仍為840牛頓)?現在假設該生產過程的均值沒有變化,但是過程的標準差從15牛頓增加到了45牛頓。在這種情況下的抽樣分布是什么?當具有這種分布時,則≤830牛頓的概率是多少?解:a。正態b.約等于0c.不正常d.正態,0。0610.在任何生產過程中,產品質量的波動都是不可避免的。產品質量的變化可被分成兩類:由于特殊原因所引起的變化(例如,某一特定的機器),以及由于共同的原因所引起的變化(例如,產品的設計很差)。一個去除了質量變化的所有特殊原因的生產過程被稱為是穩定的或者是在統計控制中的.剩余的變化只是簡單的隨機變化。假如隨機變化太大,則管理部門不能接受,但只要消除變化的共同原因,便可減少變化(Deming,1982,1986;DeVor,Chang,和Sutherland,1992)。通常的做法是將產品質量的特征繪制到控制圖上,然后觀察這些數值隨時間如何變動。例如,為了控制肥皂中堿的數量,可以每小時從生產線中隨機地抽選塊試驗肥皂作為樣本,并測量其堿的數量,不同時間的樣本含堿量的均值描繪在下圖中。假設這個過程是在統計控制中的,則的分布將具有過程的均值,標準差具有過程的標準差除以樣本容量的平方根,。下面的控制圖中水平線表示過程均值,兩條線稱為控制極限度,位于的上下3的位置。假如落在界限的外面,則有充分的理由說明目前存在變化的特殊原因,這個過程一定是失控的。當生產過程是在統計控制中時,肥皂試驗樣本中堿的百分比將服從和的近似的正態分布。假設則上下控制極限應距離多么遠?假如這個過程是在控制中,則落在控制極限之外的概率是多少?假設抽取樣本之前,過程均值移動到,則由樣本得出這個過程失控的(正確的)結論的概率是多少?解:a。0.015b。0。0026c。0.15874.11。參考練習4。10。肥皂公司決定設置比練習4。10中所述的這一限度更為嚴格的控制極限。特別地,當加工過程在控制中時,公司愿意接受落在控制極限外面的概率是0.10。若公司仍想將控制極限度設在與均值的上下距離相等之處,并且仍計劃在每小時的樣本中使用個觀察值,則控制極限應該設定在哪里?假設a部分中的控制極限已付諸實施,但是公司不知道,現在是3%(而不是2%)。若,則落在控制極限外面的概率是多少?若呢?解:a.(0.012,0。028)b。0.6553,0.72784.12.參考練習4.11。為了改進控制圖的敏感性,有時將警戒線與控制極限一起畫在圖上。警戒限一般被設定為。假如有兩個連續的數據點落在警戒限之外,則這個過程一定是失控的(蒙哥馬利,1991年)。假設肥皂加工過程是在控制中(即,它遵循和的正態分布),則的下一個值落在警戒限之外的概率是什么?假設肥皂加工過程是在控制中,則你預料到畫在控制圖上的的這40個值中有多少個點落在上控制極限以上?假設肥皂加工過程是在控制中,則的兩個未來數值落在下警戒線以下的概率是多少?解:a。0.05b。1c。0。000625參數估計●1。從一個標準差為5的總體中抽出一個容量為40的樣本,樣本均值為25。樣本均值的抽樣標準差等于多少?在95%的置信水平下,允許誤差是多少?解:已知總體標準差σ=5,樣本容量n=40,為大樣本,樣本均值=25,(1)樣本均值的抽樣標準差===0.7906(2)已知置信水平1-=95%,得=1。96,于是,允許誤差是E==1.96×0.7906=1。5496。●2。某快餐店想要估計每位顧客午餐的平均花費金額,在為期3周的時間里選取49名顧客組成了一個簡單隨機樣本。假定總體標準差為15元,求樣本均值的抽樣標準誤差;在95%的置信水平下,求允許誤差;如果樣本均值為120元,求總體均值95%的置信區間.解:(1)已假定總體標準差為=15元,則樣本均值的抽樣標準誤差為===2.1429(2)已知置信水平1-=95%,得=1。96,于是,允許誤差是E==1。96×2。1429=4。2000。(3)已知樣本均值為=120元,置信水平1-=95%,得=1.96,這時總體均值的置信區間為=120±4。2=可知,如果樣本均值為120元,總體均值95%的置信區間為(115.8,124。2)元。●3。某大學為了解學生每天上網的時間,在全校7500名學生中采取不重復抽樣方法隨機抽取36人,調查他們每天上網的時間,得到下面的數據(單位:小時):3。33。4。15.44.53。24.42.05.42.66。41。83.55。72。32.11。91.25。14。34.23。60.81。54。71.41.22。93。52。40.53.62。5求該校大學生平均上網時間的置信區間,置信水平分別為90%、95%和99%。解:⑴計算樣本均值:將上表數據復制到Excel表中,并整理成一列,點擊最后數據下面空格,選擇自動求平均值,回車,得到=3。316667,⑵計算樣本方差s:刪除Excel表中的平均值,點擊自動求值→其它函數→STDEV→選定計算數據列→確定→確定,得到s=1.6093也可以利用Excel進行列表計算:選定整理成一列的第一行數據的鄰列的單元格,輸入“=(a7—3.316667)^2”=90。65再對總和除以n-1=35后,求平方根,即為樣本方差的值s===1.6093。⑶計算樣本均值的抽樣標準誤差:已知樣本容量n=36,為大樣本,得樣本均值的抽樣標準誤差為===0。2682⑷分別按三個置信水平計算總體均值的置信區間:置信水平為90%時:由雙側正態分布的置信水平1-=90%,通過2-1=0.9換算為單側正態分布的置信水平=0。95,查單側正態分布表得=1。64,計算得此時總體均值的置信區間為=3。3167±1.64×0。2682=可知,當置信水平為90%時,該校大學生平均上網時間的置信區間為(2。87,3。76)小時;置信水平為95%時:由雙側正態分布的置信水平1-=95%,得=1.96,計算得此時總體均值的置信區間為=3.3167±1。96×0.2682=可知,當置信水平為95%時,該校大學生平均上網時間的置信區間為(2.79,3。84)小時;置信水平為99%時:若雙側正態分布的置信水平1-=99%,通過2-1=0.99換算為單側正態分布的置信水平=0.995,查單側正態分布表得=2.58,計算得此時總體均值的置信區間為=3。3167±2。58×0.2682=可知,當置信水平為99%時,該校大學生平均上網時間的置信區間為(2。62,4。01)小時。4。從一個正態總體中隨機抽取容量為8的樣本,各樣本值分別為:10,8,12,15,6,13,5,11。求總體均值95%的置信區間。解:(7.1,12.9)。5。某居民小區為研究職工上班從家里到單位的距離,抽取了由16個人組成的一個隨機樣本,他們到單位的距離(公里)分別是:103148691211751015916132求職工上班從家里到單位平均距離95%的置信區間。解:(7。18,11.57).●6。在一項家電市場調查中,隨機抽取了200個居民戶,調查他們是否擁有某一品牌的電視機。其中擁有該品牌電視機的家庭占23%。求總體比率的置信區間,置信水平分別為90%和95%。解:已知樣本容量n=200,為大樣本,擁有該品牌電視機的家庭比率p=23%,擁有該品牌電視機的家庭比率的抽樣標準誤差為===2.98%⑴雙側置信水平為90%時,通過2-1=0.90換算為單側正態分布的置信水平=0.95,查單側正態分布表得=1.64,此時的置信區間為=23%±1。64×2.98%=可知,當置信水平為90%時,擁有該品牌電視機的家庭總體比率的置信區間為(18.11%,27。89%)。⑵雙側置信水平為95%時,得=1.96,此時的置信區間為=23%±1.96×2。98%=可知,當置信水平為95%時,擁有該品牌電視機的家庭總體比率的置信區間為;(17。16%,28。84%)。●7.某居民小區共有居民500戶,小區管理者準備采取一項新的供水設施,想了解居民是否贊成。采取重復抽樣方法隨機抽取了50戶,其中有32戶贊成,18戶反對。(1)求總體中贊成該項改革的戶數比率的置信區間,置信水平為95%;(2)如果小區管理者預計贊成的比率能達到80%,應抽取多少戶進行調查?解:已知總體單位數N=500,重復抽樣,樣本容量n=50,為大樣本,樣本中,贊成的人數為n1=32,得到贊成的比率為p===64%(1)贊成比率的抽樣標準誤差為==6.788%由雙側正態分布的置信水平1-=95%,得=1.96,計算得此時總體戶數中贊成該項改革的戶數比率的置信區間為=64%±1。96×6。788%=可知,置信水平為95%時,總體中贊成該項改革的戶數比率的置信區間為(50。70%,77.30%).(2)如預計贊成的比率能達到80%,即p=80%,由=6.788%,即=6。788%得樣本容量為n==34.72取整為35,即可得,如果小區管理者預計贊成的比率能達到80%,應抽取35戶進行調查.8.從兩個正態總體中分別抽取兩個獨立的隨機樣本,它們的均值和標準差如下表:來自總體1的樣本來自總體2的樣本求90%的置信區間;求95%的置信區間。解:(1。86,17。74);(0。19,19.41)。9。從兩個正態總體中分別抽取兩個獨立的隨機樣本,它們的均值和標準差如下表:來自總體1的樣本來自總體2的樣本(1)設,求95%的置信區間;(2)設,,求95%的置信區間;(3)設,,求95%的置信區間;(4)設,,求95%的置信區間;(5)設,,求95%的置信區間。解:(1)2±1.176;(2)2±3。986;(3)2±3.986;(4)2±3.587;(5)2±3.364。10.下表是由4對觀察值組成的隨機樣本:配對號來自總體A的樣本來自總體B的樣本1202573106485(1)計算A與B各對觀察值之差,再利用得出的差值計算和;(2)設和分別為總體A和總體B的均值,構造95%的置信區間。解:(1),;(2)1.75±4.27。11.從兩個總體中各抽取一個的獨立隨機樣本,來自總體1的樣本比率為,來自總體2的樣本比率為。(1)構造90%的置信區間;(2)構造95%的置信區間。解:(1)10%±6。98%;(2)10%±8.32%。12.生產工序的方差是共需質量的一個重要度量.當方差較大時,需要對共需進行改進以減小方差。下面是兩部機器生產的袋茶重量(克)的數據:機器1機器23.453。223.903.223。283。353。202.983.703.383.193.303。223。753。283.303.203.053.503。383。353.303.293.332。953。453.203。343.353。273.163。483.123.283。163。283。203.183。253.303。343.25構造兩個總體方差比95%的置信區間.解:(4.06,14.35)。●13.根據以往的生產數據,某種產品的廢品率為2%。如果要求95%的置信區間,若要求允許誤差不超過4%,應抽取多大的樣本?解:已知總體比率=2%=0。02,由置信水平1-α=95%,得置信度=1.96,允許誤差E≤4%即由允許誤差公式E=整理得到樣本容量n的計算公式:n===≥=47.0596由于計算結果大于47,故為保證使“≥"成立,至少應取48個單位的樣本.●14.某超市想要估計每個顧客平均每次購物花費的金額。根據過去的經驗,標準差大約為120元,現要求以95%的置信水平估計每個購物金額的置信區間,并要求允許誤差不超過20元,應抽取多少個顧客作為樣本?解:已知總體標準差=120,由置信水平1-α=95%,得置信度=1.96,允許誤差E≤20即由允許誤差公式E=整理得到樣本容量n的計算公式:n=≥=138。2976由于計算結果大于47,故為保證使“≥”成立,至少應取139個顧客作為樣本。15。假定兩個總體的標準差分別為:,,若要求誤差范圍不超過5,相應的置信水平為95%,假定,估計兩個總體均值之差時所需的樣本容量為多大?解:57.16。假定,允許誤差,相應的置信水平為95%,估計兩個總體比率之差時所需的樣本容量為多大?解:769。第6章假設檢驗——練習題研究者想要尋找證據予以支持的假設是“新型弦線的平均抗拉強度相對于以前提高了”,所以原假設與備擇假設應為:,。=“某一品種的小雞因為同類相殘而導致的死亡率”,,。,。(1)第一類錯誤是該供應商提供的這批炸土豆片的平均重量的確大于等于60克,但檢驗結果卻提供證據支持店方傾向于認為其重量少于60克;(2)第二類錯誤是該供應商提供的這批炸土豆片的平均重量其實少于60克,但檢驗結果卻沒有提供足夠的證據支持店方發現這一點,從而拒收這批產品;(3)連鎖店的顧客們自然看重第二類錯誤,而供應商更看重第一類錯誤。(1)檢驗統計量,在大樣本情形下近似服從標準正態分布;(2)如果,就拒絕;(3)檢驗統計量=2。94〉1.645,所以應該拒絕。=3。11,拒絕。=1.93,不拒絕。=7。48,拒絕。=206.22,拒絕。=—5。145,拒絕。=1.36,不拒絕.=—4。05,拒絕。=8.28,拒絕.(1)檢驗結果如下:t—檢驗:雙樣本等方差假設變量1變量2平均100.7109.9方差24.1157894733.35789474觀測值2020合并方差28。73684211假設平均差0df38tStat-5。427106029P(T<=t)單尾1.73712E—06t單尾臨界1。685953066P(T〈=t)雙尾3。47424E-06t雙尾臨界2.024394234t-檢驗:雙樣本異方差假設變量1變量2平均100.7109。9方差24。1157894733.35789474觀測值2020假設平均差0df37tStat-5.427106029P(T〈=t)單尾1.87355E-06t單尾臨界1.687094482P(T〈=t)雙尾3.74709E—06t雙尾臨界2。026190487(2)方差檢驗結果如下:F-檢驗雙樣本方差分析變量1變量2平均100。7109.9方差24.1157894733。35789474觀測值2020df1919F0.722940991P(F<=f)單尾0.243109655F單尾臨界0。395811384第7章方差分析與試驗設計——練習題(或),不能拒絕原假設。(或),拒絕原假設。,拒絕原假設;,不能拒絕原假設;,拒絕原假設.方差分析表中所缺的數值如下表:差異源SSdfMSFP-valueFcrit組間42022101。4780.2459463。354131組內383627142。07———總計425629——-—(或),不能拒絕原假設。有5種不同品種的種子和4種不同的施肥方案,在20快同樣面積的土地上,分別采用5種種子和4種施肥方案搭配進行試驗,取得的收獲量數據如下表:(或),拒絕原假設。(或),拒絕原假設。(或),不能拒絕原假設。(或),不能拒絕原假設.(或),拒絕原假設。(或),不能拒絕原假設。(或),不能拒絕原假設。第8章相關與回歸分析--練習題●1。表中是道瓊斯工業指數(DJIA)和標準普爾500種股票指數(S&P500)1988年至1997年對應股票的收益率資料:年份DJIA收益率(%)S&P500收益率(%)年份DJIA收益率(%)S&P500收益率(%)198816.016。6199316。810.1198931。731。519944。91。31990-0。4-3。2199536.437。6199123.930。0199628.623。019927。47.6199724.933。4計算兩種指數收益率的相關系數,分析其相關程度,以0。05的顯著性水平檢驗相關系數的顯著性。解:(1)解法一:利用Excel進行表格計算相關系數設DJIA收益率為x,S&P500收益率為y,將已知表格復制到Excel中,列出計算x2、xy、y2及其合計數的欄目并進行計算,得結果如下:(利用Excel計算進行表格計算的方法類似于標準差的Excel計算)年份DJIA收益率(%)S&P500收益率(%)X2xyy2xy198816.016。6256265。6275.56198931。731。51004。89998.55992.251990-0。4-3.20.161。2810.24199123.930。0571。2171790019927.47。654。7656.2457.76199316。810。1282.24169。68102.0119944.91.324.016.371。69199536.437.61324。961368。641413。76199628.623。0817.96657.8529199724.933.4620。01831。661115.56合計190.2187。94956.25072。825397。83代入相關系數計算公式得:r===0。948138解法二:利用Excel函數“CORREL”計算相關系數(Correlationcoefficient,相關系數)=1\*GB3①將已知數據表復制到Excel中,同類數據置于同一列;②在表格外選擇某一單元格后,點選菜單欄中“∑”右邊的“▼"后,選擇“其它函數”,在“插入函數”窗口中,點擊“或選擇類別(C)”輸入欄右邊的“∨”,選擇“統計”,再在“選擇函數(N)”中選擇函數“CORREL",然后點擊“確定”;③在“函數參數"窗口中,點擊“Array1”輸入欄后,在Excel表中刷取“DJIA收益率”數據,再點擊“Array2”輸入欄后,在Excel表中刷取“S&P500收益率"數據,然后點擊“確定”。(由于相關系數中,兩變量是對等的,故兩列數據的選擇順序可以對換,而計算結果是相同的。)這時即在第②步驟中所選擇的單元格中出現相關系數的計算結果。可知,相關系數為,以上相關系數的計算結果說明,DJIA收益率與S&P500收益率的相關程度屬于高度正相關.(2)計算t統計量(免)給定顯著性水平=0.05,查t分布表得自由度n—2=10-2=8的臨界值為2。306,顯然,表明相關系數r在統計上是顯著的.2.利用【例8—3】的表8.3中提供的各省市人均GDP和第一產業中就業比例的數據,試分析各省市人均GDP與第一產業就業比例的相關性,并對其顯著性作統計檢驗。解:表8.3中提供的各省市人均GDP和第一產業中就業比例的數據為:序號地區GDP就業比例%序號地區GDP就業比例%1北京2845。6511.217湖北4662。2848。42天津1840。1020.018湖南3983.0060。53河北5577。7849。619廣東10647。7040.04山西1779.9746.920廣西2231.1961。85內蒙古1545。7953.921海南545.9660。36遼寧5033.0837。222重慶1749。7754.77吉林2032.4850。723四川4421.6758。88黑龍江3561。0049.624貴州1084。9066。49上海4950.8412。525云南2074.7173。610江蘇9511.9141。426西藏138.7371。811浙江6748。1535.727陜西1844。2755.712安徽3290.1358。728甘肅1072.5159。413福建4253.6845.829青海300.9560.014江西2175.6851。630寧夏298.3856.515山東9438.3152.331新疆1485.4856。616河南5640。1163.1利用Excel中的”數據分析”計算各省市人均GDP和第一產業中就業比例的相關系數,方法同上第1題,即應用統計函數“CORREL”進行計算,也可以構成計算表格進行計算:解法一:構成Excel計算表格對相關系數計算公式中的計算元素進行列表計算:序號地區GDP就業比例%x2xyy2xy1北京2845。6511.28097723.922531871。3125.442天津1840.1020.03385968.010036802.0400。003河北5577.7849.631111629。7284276657.92460.164山西1779.9746。93168293。200983480。62199。615內蒙古1545.7953。92389466。724183318。12905.216遼寧5033。0837.225331894。2864187230.61383。847吉林2032.4850。74130974。9504103046.72570.498黑龍江3561.0049。612680721。0000176625。62460.169上海4950。8412.524510816。705661885。5156。2510江蘇9511。9141。490476431。8481393793。11713。9611浙江6748。1535。745537528。4225240909。01274。4912安徽3290。1358.710824955。4169193130.63445。6913福建4253。6845.818093793。5424194818.52097.6414江西2175。6851。64733583.4624112265.12662。5615山東9438.3152.389081695.6561493623.62735.2916河南5640.1163。131810840。8121355890。93981.6117湖北4662。2848.421736854.7984225654。42342.5618湖南3983.0060。515864289.0000240971。53660。2519廣東10647。7040。0113373515。2900425908。01600。0020廣西2231。1961.84978208.8161137887.53819。2421海南545.9660.3298072。321632921。43636。0922重慶1749.7754.73061695。052995712.42992。0923四川4421.6758.819551165.5889259994.23457.4424貴州1084.9066。41177008。010072037.44408。9625云南2074。7173.64304421.5841152698。75416.9626西藏138。7371。819246.01299960.85155。2427陜西1844。2755。73401331.8329102725。83102.4928甘肅1072。5159.41150277.700163707.13528.3629青海300.9560。090570.902518057。03600。0030寧夏298。3856.589030.624416858.53192.2531新疆1485.4856.62206650。830484078。23203.56合計106766.161564。7596668656。05404964521.985687.89將計算結果代入相關系數計算公式中,由上得r=====-0.342391解法二:應用Excel中的函數“CORREL”計算,=1\*GB3①將已知數據表復制到Excel中;②在表格外選擇某一單元格,點選菜單欄中“∑”右邊的“▼”后,選擇“其它函數”,在“插入函數”窗口中,點擊“或選擇類別(C)”輸入欄右邊的“∨",選擇“統計”,再在“選擇函數(N)”中選擇函數“CORREL",然后點擊“確定”;③在“函數參數”窗口中,點擊“Array1”輸入欄后,在Excel表中刷取“就業比例%"數據,再點擊“Array2”輸入欄后,在Excel表中刷取“GDP”數據,然后點擊“確定”。這時即在第②步驟中所選擇的單元格中出現相關系數的計算結果。結果也是r=-0。34239,這說明人均GDP與第一產業中就業比例是負相關,但相關系數只有-0。34239,表明二者相關程度并不大,屬于低度負相關關系.相關系數檢驗:(免)在總體相關系數的原假設下,計算t統計量:查t分布表,自由度為31-2=29,當顯著性水平取時,=2。045;當顯著性水平取時,=1.699。由于計算的t統計量的絕對值1.9624小于=2。045,所以在的顯著性水平下,不能拒絕相關系數的原假設。即是說,在的顯著性水平下不能認為人均GDP與第一產業中就業比例有顯著的線性相關性。但是計算的t統計量的絕對值1。9624大于=1。699,所以在的顯著性水平下,可以拒絕相關系數的原假設。即在的顯著性水平下,可以認為人均GDP與第一產業中就業比例有一定的線性相關性。●3.表中是16支公益股票某年的每股賬面價值和當年紅利:公司序號賬面價值(元)紅利(元)公司序號賬面價值(元)紅利(元)122。442。4912.140。80220.892.981023。311。94322.092。061116。233.00414.481.09120.560。28520.731.96130.840.8467819.2520。3726.431。552.161。6014151618。0512.4511。331。801.211.07根據上表資料:(1)建立每股賬面價值和當年紅利的回歸方程;(2)解釋回歸系數的經濟意義;(3)若序號為6的公司的股票每股賬面價值增加1元,估計當年紅利可能為多少?解:(1)設當年紅利為Y,每股帳面價值為X則回歸方程為,下面分別應用兩種方法計算回歸參數:方法一:利用Excel進行表格運算計算公式元素:公司序號賬面價值(元)紅利(元)x2xyxy122。442。4503。553653。856220。892.98436。392162.2522322.092。06487。968145。5054414。481。09209.670415。7832520。731。96429。732940。6308619。251。55370。562529。8375720.372.16414.936943。9992826.431。6698。544942。288912.140.8147。37969。7121023。311。94543。356145.22141116.233263。412948。69120。560.280。31360。1568130.840。840.70560。70561418。051。8325.802532。491512.451.21155。002515。06451611.331。07128.368912.1231合計261.5926.745115.703498。3157將計算結果代入回歸系數計算公式,得:回歸系數==0.07287590初始值===0.47977458方法二:應用Excel函數計算直線回歸方程的兩個參數:=1\*GB2⑴應用統計函數“SLOPE”計算直線斜率:(slope,斜率)=1\*GB3①在表格外選定某單元格,作為直線斜率的放置位置,點擊:菜單欄中“∑”右邊的“▼”后,選擇“其它函數”,在“插入函數”窗口中,點擊“或選擇類別(C)"輸入欄右邊的“∨”,選擇“統計",再在“選擇函數(N)”中選擇函數“SLOPE”,然后點擊“確定”;=2\*GB3②在“函數參數”窗口中,點擊“Known_y's”輸入欄后,在Excel表中刷取y列數據,再點擊“Known_x’s"輸入欄后,在Excel表中刷取x列數據,然后點擊“確定”。這時即在選定的單元格中出現直線斜率的計算結果0.072876=2\*GB2⑵應用統計函數“INTERCEPT”計算直線與y軸的截距-—直線起

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論