大學統計學期末考復習_第1頁
大學統計學期末考復習_第2頁
大學統計學期末考復習_第3頁
大學統計學期末考復習_第4頁
大學統計學期末考復習_第5頁
免費預覽已結束,剩余2頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第一章1.4 舉例說明類別變量和數值變量。類別變量:表現為不同類別的變量稱為類別變量,也稱分類變量或定性變量(分 為名義值類別變量和順序值類別變量)如“性別”表現為“男”或“女”,“企業 所屬的行業”表現為“制造業”、“零售業”、“旅游業”等,“學生所在的學院” 可能是“商學院”、“法學院”等數值變量:可以用數字記錄其觀察結果,這樣的變量稱為數值變量,如“企業銷 售額”、“生活費支出”、“擲一枚骰子出現的點數”。1.5 獲得數據的概率抽樣方法簡單隨機抽樣,分層抽樣,系統抽樣,整群抽樣第二章2.1 條形圖和餅圖各有什么用途條形圖是用寬度相同的條形來表示數據多少的圖形,用于展示不同類別頻數的多少或

2、分布狀況,餅圖是用圓形及圓內扇形的角度來表示數值大小的圖形,用于表示一個樣本(或總體)中各類別的頻數占全部頻數的百分比, 對于研究結構性問 題十分有用。2.2 反映數值數據分布特征的圖形有哪些直方圖,莖葉圖,箱線圖,垂線圖,誤差圖2.3 直方圖與條形圖有何區別首先條形圖中的每一矩形表示一個類別, 其寬度沒有意義,而直方圖的寬度則表 示各組的組距。其次,由于分組數據具有連續性,因此直方圖的各矩形通常是連 續排列的,條形圖則是分開排列的。最后,條形圖主要用于觀察各類別中頻數的 多少,直方圖則主要用于觀察數據額的分布形狀。2.4 莖葉圖與直方圖相比有什么優點?它們的應用場合時怎樣的?利用直方圖觀察數

3、據的分布很方便, 但觀察不到原始數據。莖葉圖則不同,它不 僅可以展示數據的分布,而且能保留原始數據的信息。在應用方面,直方圖一般 適用于大批量數據,莖葉圖通常適用于小批量數據。2.5 箱線圖的主要用途是什么?對多組數據的分布特征進行比較。2.6 散點圖和輪廓圖各有什么用途?散點圖可以用來觀察各變量之間的關系, 輪廓圖可以比較多個樣本在多個變量上 的相似性。2.7 使用圖表應注意哪些問題?1應盡可能簡潔,以清晰地展示數據、合理地表達統計信息。2圖表應有編號和標題。3圖表的標題應明示表中數據所屬的時間、地點和內容,即3W準則。4表的標題通常放在表的上方;圖的標題可以放在圖的上方,也可以放在圖的下方

4、。第三章3.1 一組數據分布的數值特征可以從哪幾個方面進行描述?數據的水平,數據的差異,分布的形狀3.2 說明平均數、中位數和眾數的特點及應用場合平均數也稱為均值,它是一組數據相加后除以數據的個數而得到的結果。平均數 是度量數據水平的常用統計量,在參數估計以及假設檢驗中經常用到。中位數是一組在數據排序后處于中間位置上的數值,用 Me表示。中位數是用中 間位置上的值代表數據水平,具特點是不受極端值影響,在研究收入分配中很有用。眾數與數據出現的次數有關,著眼于對各數據出現的頻率的考察, 具大小只與這 組數據中的部分數據有關,其特點是不受極端值的影響,具有不惟一性,一組數 據中可能會有一個人眾數,也

5、可能會有多個或沒有。3.3 一家公司在招收職員時,對其進行兩項能力測試.在A項測試中,其平均分數 是100分,標準差是15分;在B項測試中,其平均分數是400分,標準差是50分. 一位應試者在A項測試中的了 115分,在B向測試中得了 425分.與平均分數比, 這位應試者哪一項測試的成績更為理想.解:根據題意可知,該問題需要用標準分數。A項測試,標準分數為(115-100)/15=1歸項測試,標準分數為(425-400)/50=0.5 說明在A項測試中該應試者比平均分數高出1個標準差,而在B項測試中只高出 平均分數0.5個標準差,由于A項測試的標準化值高于B項測試,所以A項測試 比較理想。第四

6、章4.1 隨機變量(離散型隨機變量、連續型隨機變量)4.2 伯努利試驗條件1 一次試驗只有兩個可能結果,即成功和失敗.2 一次試驗成功的概率為p,失敗 的概率為q=1-p,而且概率p對每次試驗都相同。3實驗室相互獨立的,重復進 行n次。4.3描述正態分布曲線的特點(性質)1正態曲線的圖形是關于x=u對稱的鐘形曲線,且峰值在 x=u處。2正態分布的 兩個參數u和6一旦確定,正態分布的具體形式也惟一確定, 不同參數取值的正 態分布構成一個完整的“正態分布族” 。3當X的取值向橫軸左右兩個方向無限 延伸時,正態曲線的左右兩個尾端也無限漸近橫軸, 但理論上永遠不會與之相交。4正態曲線下的總面積等于14

7、.5 解釋中心極限定理的含義2從均值為小、方差為的總體中,抽取容量為n的隨機樣本,當n充分大時(通 常要求n呈30),樣本均值x的抽樣分布近似服從均值為11、方差為/n的正 態分布。4.6 x2分布和F分布的圖形各有什么特點x2分布的特點:1分布的變量值始終為正。2分布的形狀取決于其自由度n的大 小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱F分布的特點:5.1 參數統計是用樣本統計量去估計總體的參數。5.2 簡述評價估計量好壞的標準1、無偏性:估計量抽樣分布的數學期望等于被估計的總體參數2、有效性:對同一總體參數的兩個無偏點估計量,有更小標準差的估計量更有效3、一致性:隨著樣本量

8、的增大時,點估計量的值越來越接近被估總體的參數。5.3 解釋置信水平的含義也稱置信度或置信系數,在重復構造的總體參數的多個置信區間中包含總體參數真值的區間所占的比例5.4 怎樣理解置信區問由樣本統計量構造出的總體參數在一定置信水平下的估計區間。5.1某快餐店想要估計每位顧客午餐的平均花費,在為期3周的時間里選取49位顧客組成了 一個簡單隨機樣本。1)假定總體標準差為15元,求樣本均值的抽樣標準誤差。6灌荒囹本標準差為1$元,求樣本均值的抽樣標酒醞仃 15、仃丁 = -2.143xbt <49在95%的置僖水平再 求邊際誤差.1 a,由于居大樣本抽樣,因此樣本此偃服其正態分布,因此概求度t

9、=':因此,115 = 口,or- =1,96X2.143=4.2 El*1Q)如果樣本均值為120元,求總體均值的第的雷信區何.汽信區間為:(V-A, V + A, = 12C4.2,120 4 2= (1158, 124 25.2利用下面的信息,構建總體均值小的95%勺置信區問(1) 總體服從正態分布,且已知 (t=500, n=15, ?=8900,置信水平為95%(2) 總體不服從正態分布,且已知=500, n=35, ?=8900,置信水平為95%(3) 總體不服從正態分布,6未知,n=35, x = 8900 , s=500,置信水平為90%(4) 總體不服從正態分布,6未

10、知,n=35,?=8900,s=500,置信水平為99% 6(1)解:tL知b = 500, M = 15 , T = S900 ,二行=L9N_ b500 r -V ±= S90Q+ I.90x j = (®&4Z915$1 小V15解:所以總體均值小勺置信區間為(8647, 9153)S)解二 J知 b 500, = 35,1=的00, l-a=95%,=1.96b500.7± 多= 8900±L96k;= =(8734906電二 J"J35C)解:知打= 35, 4=8900,幺=5。0,由苣+體"室未知,但為大樣本,河

11、用樣本方裝來代普以體力差m砧水產i一0二乳% 二二0=1萬45,VSQO上宣信聞為主士工& -= = (S 76 19039kJ"V35%已知用=33 T=8900,由于總體方差糊,戰屈,可用林方秣儲總體方差5no-=(?st)S291 后1置啟水平1一口 =99%,、二工58二置信區間為了± 2衣; =S900+ 2,5 8 >J a1N :以總體均值"內置信區間為(S682 . 9118)5.4某居民小區共有居民500戶,小區管理者準備采取一項新的供水設施,想了解居民是否贊成。采取重復抽樣方法隨機抽取了50戶,其中有32戶贊成,18戶反對。(1)

12、求總體中贊成該項改革的戶數比率的置信區間, 置信水平為95%。如果小區管理者預計贊成的比率能達到 80%。要求估計誤差不超過10%,應 抽 取 多 少 戶 進 行 調 查?已知:口 =50,外蘭=0.64,。=0. 05 +,加總體中期成該項改常的戶數比例的95%的置值區間為:p師六千=°&上】-96儼包端無”二°。54 ± °F即(0.5110.77),C)已知士姓把0.80,)=0.。5,= L96O應抽取的樣本量為: =人匕學二1 -】. .*0出 誓二9a .61. 47eo. iJ故應至少抽取0戶進行調春。5.10 某超市想要估計每個顧

13、客平均每次購物花費的金額。根據過去的經驗,標 準差大約為120元,現要求以95%勺置信水平估計每個購物金額的置信區間,并 要求允許誤差不超過20元,應抽取多少個顧客作為樣本?幗 已輒總體標準差門犯 由置信水平I心舞如 超置信度允許誤差R3 可(1因國元訐溫差公式E=Z/T=整理得到樣本容量的訃算公式:* W自二)-12!上)小=620由于計算鉆果大于4r故為保證使成立,至少應取136個眄笈仆為桿本.5.11 假定兩個總體的標準差分別為:1=12,62=15,若要求誤差范圍不超過5。相應的置信水平為95%,假定n1=n2,估計兩個總體均值之差(以1-仙2)時所需的 樣 本 量 為 多 大?已JS

14、I;± 12= 15.也=5. ri=則. 當 U =0,05 時.玲osr I-96«.則M抽取的樣本量為!Us)'k:*M) L96、(】+W)5 3ni *'工-56. 70枚應至少抽取樣本最為57的樣本工5.12 假定n1=n2,允許誤差E=0. 05,相應的置信水平為95%,估計兩個總體比 率之差(冗1-冗2)時所需的樣本量為多大?巳知工£=0.05,凡尸當口 =&05時,曲干沒有m和外的信息, 此時用QS作為仍和f的近似僮,則應抽取的肆本屆為二(工。)"仃I( %)+ TTj ( 1 - -7T,)fl| = H3 M

15、 -"- 爐-L96? x0.5 x( 1 -0. 5) +0,5x( 0. 5Jj0.時-7的3故所需的樣本此至少為769。第八章8.1 什么是方差分析?它研究的是什么?方差分析是分析各類別自變量對數值因變量影響的一種統計方法。它所研究的是分類型自變量對數值型因變量的影響8.2 方差分析中有哪些基本假定1正態性:每個總體都應服從正態分布2方差齊性:每個總體的方差必須相同 3獨立性:觀測值是獨立的8.3 說明誤差分解的基本原理8.4 解釋總誤差、處理誤差和隨機誤差的含義總誤差:反映全部觀測數據的誤差。處理誤差:由不同處理造成的誤差。隨機誤差:由其他隨機因素對觀測數據造成的誤差。9.1

16、 相關關系是度量兩個變量之間線性關系強度的統計量9.2 簡述相關系數的性質r的取值范圍在-1和+1之間,即-&r01。r具有對稱性r數值的大小與x 和y的原點及尺度無關r僅僅是x與y之間線性關系的一個度量,它不能用于 描述非線性關系r雖然是兩個變量之間線性關系的一個度量, 但不意味著x與 y一定有因果關系。9.3 簡述一元線性回歸建模的基本步驟第一步:確定變量間的關系。第二步:確定因變量和自變量,并建立變量間的關 系模型。第三步:對模型進行評估和檢驗。第四步:利用回歸方程進行預測。第 五步:利用預測的殘差分析模型的假定。9.5 一元線性回歸模型中有哪些基本的假定?2(1)正態性:E(

17、9=0(2)方差齊性:對于所有的x值,e的方差都相同。(3)獨立性:對于一個特定的X值,它所對應的e與其他X值所對應e的不相關。9.6簡述參數最小二乘估計的基本原理使因變量的觀測值yi與估計值J之間的離茶平方和達到最小模型擬合優度(回歸直線與各觀測點的接近程度稱為回歸直線對數據的擬合優度)1判定系數(重要統計量)2估計標準誤差9.4某汽車生產商欲了解廣告費用x對銷售量y的影響,收集了過去12年的有 關數據。通過計算得到下面的有關結果:(1)完成上面的方差分析表變差來源dfSSMSFSignificance F回歸11602708.61602708.63992.17E-09殘差1040158.074015.807-總計111642866.67-(2)汽車銷售量的變差中有多少是由廣告支出的變動引起的?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論