人大統計學作業答案_第1頁
人大統計學作業答案_第2頁
人大統計學作業答案_第3頁
人大統計學作業答案_第4頁
人大統計學作業答案_第5頁
已閱讀5頁,還剩74頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、79、【104308】(單項選擇題)設連續型隨機變量的分布函數是,密度函數是,則對于任意實數,有( )。A.B.C.D.以上都不對 【答案】C80、【150761】(單項選擇題)設,則為( )。A.B.C.D. 【答案】B81、【104317】(簡答題)正態分布概率密度函數的圖形有何特點? 【答案】正態分布概率密度函數的圖形有以下特點:,即整個概率密度曲線都在軸上方。曲線關于對稱,并在處達到最大值。曲線的隨緩程度由決定,越大,曲線越平緩;越小,曲線越陡峭。當趨于無窮時,曲線以軸為其漸近線。由以上特性可見,正態分布的概率密度曲線是一條對稱的鐘形曲線。82、【104318】(簡答題)一事件的概率,

2、能否肯定事件是不可能事件?為什么? 【答案】不能肯定A是不可能事件。不可能事件是指在同一組條件下每次試驗都一定不出現的事件。而,并不能肯定A就是不可能事件。例如在閉區間上隨意投擲一點,顯然該區間上任一點都可能被碰上,但每一點發生的概率都為,因此概率為的事件不一定都是不可能事件。83、【104319】(簡答題)常見的隨機變量分為哪兩種類型?各自都包含哪些常見的分布? 【答案】常見的隨機變量分為離散型隨機變量和連續型隨機變量。離散型隨機變量包括均勻分布、-分布、二項分布、泊松分布。連續型隨機變量包括均勻分布、正態分布。正態分布衍生卡方分布、分布、分布。84、【104313】(填空題)甲、乙、丙三人

3、參加同一項考試,及格的概率分別為,則三人均及格的概率為_;三個人都不及格的概率為_;至少有一個人及格的概率為_;至少有一個人不及格的概率為_。 【答案】;,()()()()85、【104314】(填空題)正態分布的概率密度函數曲線為一對稱鐘形曲線,曲線的中心由_決定,曲線的陡峭程度由_決定。 【答案】均值;方差或者標準差86、【104315】(填空題)當二項分布的,且時,二次分布可以近似為_,該分布的均值為_,方差為_。 【答案】泊松分布;87、【104322】(計算題)某車間有臺機床,在給定的一天每一臺機床不運行的概率都是,機床之間相互獨立。問在給定的一天內,至少有兩臺機床不運行的概率是多少

4、?(結果保留三位小數) 【答案】設表示在給定的一天內不運行的機床臺數,則,解法一:解法二:因為,可以用泊松分布近似計算二項分布,則有:則88、【150764】(計算題)某廠生產的螺栓的長度服從均值為cm,標準差為的正態分布。按質量標準規定,長度在cm范圍內的螺栓為合格品。試求該廠螺栓的不合格率是多少。(查概率表知,) 【答案】螺栓的長度,則,合格的概率為。第六章 參數估計89、【104324】(單項選擇題)在估計某一總體均值時,隨機抽取個單元作樣本,用樣本均值作估計量,在構造置信區間時,發現置信區間太寬,其主要原因是( )。A.樣本容量太小B.估計量缺乏有效性C.選擇的估計量有偏D.抽取樣本時

5、破壞了隨機性 【答案】A90、【104325】(單項選擇題)根據某地區關于工人工資的樣本資料,估計出的該地區工人平均工資的置信區間為,,則下列說法最準確的是( )。A.該地區平均工資有的可能性落入該置信區間B.該地區只有的可能性落到該置信區間之外C.該置信區間有的概率包含該地區的平均工資D.該置信區間的誤差不會超過 【答案】C91、【104326】(單項選擇題)點估計的缺點是( )。A.不能給出總體參數的準確估計B.不能給出總體參數的有效估計C.不能給出點估計值與總體參數真實值接近程度的度量D.不能給出總體參數的準確區間 【答案】C92、【104327】(單項選擇題)總體參數的置信區間是由樣本

6、統計量的點估計值加減( )得到的。A.樣本統計量的抽樣標準差B.總體標準差C.邊際誤差D.置信水平的臨界值 【答案】C93、【104328】(單項選擇題)估計量是指( )。A.用來估計總體參數的統計量的名稱B.用來估計總體參數的統計量的具體數值C.總體參數的名稱D.總體參數的具體數值 【答案】A94、【104329】(單項選擇題)若為抽自的一個樣本,總體方差未知,則的的置信區間為( )。A.B.C.D. 【答案】D95、【104330】(單項選擇題)總體均值的置信區間等于樣本均值加減邊際誤差,其中的邊際誤差等于所要求置信水平的臨界值乘以( )。A.樣本均值的抽樣標準差B.樣本標準差C.樣本方差

7、D.總體標準差 【答案】A96、【104332】(單項選擇題)當置信水平一定時,置信區間的寬度( )。A.隨著樣本容量的增大而減小B.隨著樣本容量的增大而增大C.與樣本容量的大小無關D.與樣本容量的平方根成正比 【答案】A97、【104333】(單項選擇題)的置信水平是指( )。A.總體參數落在一個特定的樣本所構造的區間內的概率為B.在用同樣方法構造的總體參數的多個區間中,包含總體參數的區間比率為C.總體參數落在一個特定的樣本所構造的區間內的概率為D.在用同樣方法構造的總體參數的多個區間中,包含總體參數的區間比率為 【答案】B98、【104334】(單項選擇題)估計一個正態總體的方差使用的分布

8、是( )。A.正態分布B.分布C.分布D.分布 【答案】C99、【104335】(單項選擇題)當正態總體的方差未知時,且為小樣本條件下,估計總體均值使用的是分布是( )。A.正態分布B.分布C.分布D.分布 【答案】B100、【104338】(單項選擇題)對于非正態總體,在大樣本條件下,估計總體均值使用的是分布是( )。A.正態分布B.分布C.分布D.分布 【答案】A101、【104339】(單項選擇題)使用正態分布估計總體均值時,要求( )。A.總體為正態分布B.總體為非正態分布C.總體為正態分布但方差未知D.總體為正態分布且方差已知 【答案】D102、【145018】(單項選擇題)當正態總

9、體的方差已知時,且為小樣本條件下,估計總體均值使用的分布是( )。A.正態分布B.分布C.分布D.分布 【答案】A103、【150769】(單項選擇題)當正態總體的方差未知時,且為大樣本條件下,估計總體均值使用的分布是( )。A.正態分布B.分布C.分布D.分布 【答案】A104、【104348】(簡答題)參數估計的方法有哪些? 【答案】參數估計的方法有點估計和區間估計兩種。點估計就是用樣本統計量的某個取值直接作為總體參數的估計值。區間估計是在點估計的基礎上,給出總體參數的估計的一個區間范圍,該區間通常由樣本統計量加減抽樣誤差得到。105、【104349】(簡答題)點估計的方法通常有哪些? 【

10、答案】點估計就是直接以樣本統計量的某個取值作為總體參數的估計值,包括矩法和極大似然法。矩法估計的基本思想:在總體各階矩存在的條件下,用樣本的各階矩去估計總體相應的各階矩,用樣本矩的相應函數估計總體矩的函數。極大似然估計的基本思想是:設總體含有待估參數,它可以取很多值,我們要在的一切可能取值之中選出一個使樣本觀測值出現的概率最大的那個值作為的估計(記為),并稱為的極大似然估計。106、【104343】(填空題)在對總體均值進行估計時,把要估計的總體均值稱之為_,把用來估計總體均值的樣本均值稱作_,把樣本均值的具體觀察值稱為_。 【答案】待估參數;估計量;估計值107、【104344】(填空題)一

11、個由的隨機樣本,算得樣本均值,總體標準差為.總體均值的置信區間為_。 【答案】108、【104345】(填空題)如果估計量與相比滿足_,我們稱是比更有效的一個估計量。 【答案】109、【104346】(填空題)如果估計量滿足_,我們稱是無偏的一個估計量。 【答案】,是總體均值。110、【122755】(計算題)一家調查公司進行一項調查,其目的是為了了解某市電信營業廳大客戶對該電信的服務滿意情況。調查人員隨機訪問了名去該電信營業廳辦理業務的大客戶,發現受訪的大客戶中有名認為營業廳現在的服務質量比兩年前好。試在的置信水平下對大客戶中認為營業廳現在的服務質量比兩年前好的比率進行區間估計。(查概率表可

12、知,) 【答案】解:這是一個求某一屬性所占比率的區間估計問題。已知根據抽樣結果計算出的樣本比率為。計算得111、【145012】(計算題)根據以往經驗,居民家庭人口數服從正態分布,其方差為。現從某地區隨機抽取戶居民家庭,測得樣本的平均家庭人口數為人,試以的可靠程度構造該地區平均居民家庭人口數的置信區間。(結果保留兩位小數)(查概率表可知,) 【答案】解:已知家庭人口數,(可查正態分布表),則總體均值的置信區間為:即以的可靠程度估計該地區平均居民家庭人口數在人至人之間。第七章 假設檢驗112、【104354】(單項選擇題)假設檢驗按原假設和備擇假設的形式可分為( )。A.左側檢驗和右側檢驗B.正

13、向檢驗和反向檢驗C.雙側檢驗和單側檢驗D.正態檢驗和非正態檢驗 【答案】C113、【104355】(單項選擇題)雙側檢驗的特點是( )。A.它有兩個接受域B.它有兩個臨界值C.它有一個拒絕域D.它可能有兩個接受域 【答案】B114、【104356】(單項選擇題)當時,則( )。A.拒絕原假設B.不能拒絕原假設C.接受原假設D.不能確定 【答案】C115、【104357】(單項選擇題)所謂錯誤指的是( )。A.原假設為假,接受原假設B.原假設為假,接受替換假設C.原假設為真,拒絕替換假設D.原假設為真,拒絕原假設 【答案】D116、【104358】(單項選擇題)所謂錯誤指的是( )。A.原假設為

14、假,接受原假設B.原假設為假,接受替換假設C.原假設為真,拒絕替換假設D.原假設為真,拒絕原假設 【答案】A117、【104359】(單項選擇題)若假設形式為,當隨機抽取一個樣本,其均值大于,則( )。A.肯定不拒絕原假設,但有可能犯第類錯誤B.有可能不拒絕原假設,但有可能犯第類錯誤C.有可能不拒絕原假設,但有可能犯第類錯誤D.肯定不拒絕原假設,但有可能犯第類錯誤 【答案】D118、【104360】(單項選擇題)假定總體服從正態分布,下列適用檢驗統計量的場合是( )。A.樣本為大樣本,且總體方差已知B.樣本為小樣本,且總體方差已知C.樣本為小樣本,且總體方差未知D.樣本為大樣本,且總體方差未知

15、 【答案】C119、【104361】(單項選擇題)某一貧困地區所估計的營養不良人數高達,然而有人認為實際上比這個比例還要高,要檢驗說法是否正確,則假設形式為( )。A.B.C.D. 【答案】A120、【104363】(單項選擇題)在雙側檢驗中,如果將兩側的面積之和定義為值,則對于給定的顯著性水平,拒絕原假設的條件是( )。A.B.C.D. 【答案】D121、【104364】(單項選擇題)在假設檢驗中,如果所計算出的值越小,則說明( )。A.不利于原假設的證據越強B.不利于原假設的證據越弱C.不利于備擇假設的證據越強D.不利于備擇假設的證據越弱 【答案】A122、【104365】(單項選擇題)對

16、于給定的顯著性水平,拒絕原假設的準則是( )。A.B.C.D. 【答案】B123、【104374】(簡答題)假設檢驗依據的基本原理是什么? 【答案】假設檢驗依據的基本原理是小概率原理。所謂小概率原理是指,若一個事件發生的概率很小,在一次試驗中就幾乎是不可能發生的。根據這一原理,如果在試驗中很小概率的事件發生了,我們就有理由懷疑原來的假設是否成立,從而拒絕原假設。124、【104375】(簡答題)什么是假設檢驗中的顯著性水平? 【答案】利用樣本信息對原假設進行推斷有犯錯誤的可能。假設檢驗中的顯著性水平是指:當原假設為正確時卻把它拒絕了的概率,實際就是統計決策中所面臨的風險。顯著性水平用表示。12

17、5、【104376】(簡答題)為什么在點估計的基礎上還要引進區間估計?區間估計中各相關要素的含義和作用是什么? 【答案】點估計的方法就是用一個確定的值去估計未知參數,表面看起來很精確,實際上把握程度不高。因為估計量是來自一個隨機抽取的樣本,總是帶有隨機性或偶然性,樣本估計量恰好等于的可能性是很小的;而且點估計并未給出估計精度和可信程度。但估計在某一小區間內,并給出估計的精度和可靠度,則把握程度就高多了。這種估計總體參數在某一區間內的方法稱作區間估計。如果用數學語言來描述區間估計,則應該是這樣的:設是抽自密度為的一個樣本,對于給定的,如能求得統計量和,使,則稱為的置信度為的置信區間,它表達了區間

18、估計的準確性或精確性;和均為樣本估計量的函數,分別稱作置信下限和置信上限;稱作置信度或信度或置信概率或置信水平或概率保證程度,它是區間估計可靠性的概率;稱為顯著性水平,它表達了區間估計不可靠的概率。總之,區間估計可以克服點估計的不足,因而實際應用意義較大。126、【104377】(簡答題)某市調查職工平均每天用于家務勞動的時間。該市統計局主持這項調查的人認為職工用于家務勞動的時間不超過小時。隨機抽取名職工進行調查的結果為:小時,。問:調查結果是否支持調查主持人的看法?() 【答案】解一:,當時。故,拒絕域,拒絕,即可以接受調查主持人的看法。解二:由于為大樣本,可用統計量。,落入接受域,即調查結

19、果支持該調查人的看法。127、【104378】(簡答題)簡述假設檢驗的基本步驟。 【答案】(1)建立原假設和備擇假設。(2)確定檢驗統計量,并確定該統計量的分布情況, 然后依據樣本信息計算該檢驗統計量的實際值。(3)設定檢驗的顯著性水平并確定臨界值。(4)將檢驗統計量的實際值與臨界值進行比較,做出是否拒絕原假設的決策。128、【104369】(填空題)通常把錯誤稱為一類錯誤或_;把錯誤稱為二類錯誤或_。 【答案】棄真錯誤;取偽錯誤129、【104370】(填空題)假設檢驗中確定的顯著性水平越高,原假設為真而被拒絕的概率就_。 【答案】越高130、【104371】(填空題)檢驗一個正態總體的方差

20、時所使用的分布是_。 【答案】分布131、【104372】(填空題)研究者想收集證據予以支持的假設通常稱為_。 【答案】備擇假設132、【122756】(計算題)有一個組織在其成員中提倡通過自修提高水平,目前正考慮幫助成員中還未曾高中畢業者通過自修達到高中畢業的水平。該組織的會長認為成員中未讀完高中的人等于,并且想通過適當的假設檢驗來支持這一看法。他從該組織成員中抽選人組成一個隨機樣本,發現其中有人沒有高中畢業。試問這些數據是否支持這個會長的看法?(,查概率表可知,) 【答案】解:由于,故接受,可以認為調查結果支持了該會長的看法。第八章 列聯分析133、【104382】(填空題)列聯表經常用到

21、的品質相關系數有_、列聯相關系數、相關系數。 【答案】相關系數134、【145090】(計算題)根據下表,請檢查含氟牙膏是否同兒童的齲齒有關。(,查概率表可知, ) 【答案】:使用含氟牙膏和一般牙膏兒童齲患率相等:使用含氟牙膏和一般牙膏兒童齲患率不等,按水準,不拒絕,尚不能認為使用含氟牙膏比使用一般牙膏兒童的齲患率低。第九章 方差分析135、【104384】(單項選擇題)反映了( )的差異程度。A.不同因素水平之間B.由不同因素水平造成的各個總體之間C.由不同因素水平造成的總體內部D.由于抽樣誤差引起的總體內部 【答案】D136、【104385】(單項選擇題)在無交互作用的雙因素方差分析中,因

22、素有個水平,因素有個水平,則對于檢驗因素的統計量( )。A.B.C.D.它服從自由度為的分布 【答案】B137、【104386】(單項選擇題)在單因素方差分析中,統計量分子、分母的自由度分別為( )。A.,B.,C.,D., 【答案】D138、【104387】(單項選擇題)在單因素方差分析中,若,則值為( )。A.B.C.D. 【答案】B139、【104388】(單項選擇題)方差分析的主要目的是判斷( )。A.各總體是否存在方差B.各樣本數據之間是否有顯著差異C.分類型自變量對數值型因變量是否顯著D.分類型因變量對數值型自變量是否顯著 【答案】C140、【104389】(單項選擇題)方差分析是

23、檢驗( )。A.多個總體方差是否相等的統計方法B.多個總體均值是否相等的統計方法C.多個樣本方差是否相等的統計方法D.多個樣本均值是否相等的統計方法 【答案】B141、【104390】(單項選擇題)在方差分析中,所要檢驗的對象稱為( )。A.因子B.方差C.處理D.觀測值 【答案】A142、【104391】(單項選擇題)在方差分析中,假定每個總體都服從( )。A.正態分布B.非正態分布C.任意分布D.分布 【答案】A143、【104392】(單項選擇題)在方差分析中,用于檢驗的統計量是( )。A.統計量B.統計量C.統計量D.統計量 【答案】D144、【104401】(簡答題)什么是方差分析?

24、 【答案】方差分析是研究分類自變量對數值因變量的影響。雖然希望研究均值,但在判斷均值之間是否有差異時借助的是方差這個統計量,還表示通過對數據誤差來源的分析來判斷不同總體的均值是否相等,進而分析自變量對因變量是否有顯著影響。145、【145008】(簡答題)簡述應用方差分析的條件。 【答案】應用方差分析要求符合兩個條件:(1)各個水平的觀察數據,要能看作是從服從正態分布的總體中隨機抽取的樣本。(2)各組觀察數據是從具有相同方差的相互獨立的總體中抽得的。146、【104395】(填空題)在單因素方差分析中,總離差平方和、組間離差平方和與誤差平方和之間的關系式為_。 【答案】147、【104396】

25、(填空題)在無交互作用的雙因素方差分析中,總離差平方和可以分解為、_和_三項。 【答案】,148、【104397】(填空題)在無交互作用的雙因素方差分析中,若因素有個水平,因素有個水平,則的自由度為_,的自由度為_,的自由度為_。 【答案】;149、【104398】(填空題)在方差分析中,自變量的不同水平之間的誤差稱為_。 【答案】系統誤差150、【104403】(計算題)為研究食品的包裝和銷售地區對銷售量是否有影響,在三個不同地區中用三種不同包裝方法進行銷售,表三是一周的銷售量數據:用Excel得出的方差分析表如下:取顯著性水平,檢驗不同地區和不同包裝方法對該食品的銷售量是否有顯著影響。 【

26、答案】解:首先提出如下假設:因素A:,地區對銷售量沒有影響不全相等,地區對銷售量有影響因素B:,包裝對銷售量沒有影響不全相等,包裝對銷售量有影響由于=0.0727,所以接受原假設,這說明地區對銷售量沒有顯著影響。由于=3.1273,所以接受原假設,這說明包裝對銷售量沒有顯著影響。直接用P-value進行分析,結論也是一樣的。151、【193498】(計算題)某廠商想了解銷售地點和銷售時間對銷售量的影響。它在六個試驗點進行銷售,并記錄了五個時期的銷售量,對記錄的數據處理后得到表一,試在下分析不同地點和不同時間對銷售量的影響是否顯著(不存在交互作用)(查概率表可知:,)。 【答案】解:假設因素(銷

27、售地點)的第個水平對銷售量的效應為。設因素(銷售時間)的第個水平對銷售量的效應為。則建立假設:根據已知數據和各自的自由度可計算,則將結果列入方差分析表,見表二。查表得:,因為,所以拒絕,認為銷售地點對銷售量有顯著影響。因為,所以拒絕,認為銷售時間對銷售量有顯著影響。第十章 相關與回歸152、【104404】(單項選擇題)在回歸直線中,若,則與之間的相關系數( )。A.B.C.D. 【答案】B153、【104406】(單項選擇題)若x與y之間存在負相關關系,則下列回歸方程中肯定錯誤的是( )。A.B.C.D. 【答案】B154、【104407】(單項選擇題)擬合優度的值越小,則回歸方程( )。A

28、.擬合程度越低B.擬合程度越高C.擬合程度有可能高,也有可能低D.用回歸方程進行預測越準確 【答案】A155、【104408】(單項選擇題)回歸平方和指的是( )。A.B.C.D. 【答案】C156、【104409】(單項選擇題)如果變量與變量之間沒有線性相關關系,則下列不正確的是( )。A.估計標準誤差B.回歸系數C.相關系數D.判定系數 【答案】A157、【104410】(單項選擇題)在相關分析中,正確的是( )。A.相關系數既可測定直線相關,又可測定曲線相關B.相關系數可以測定直線相關,但不可測定曲線相關C.相關系數可以測定曲線相關,但不可測定直線相關D.相關系數既不能測定直線相關,又不

29、能測定曲線相關 【答案】B158、【104411】(單項選擇題)受教育程度與收入水平之間的相關系數為,則這種相關屬于( )。A.顯著相關B.高度相關C.正相關D.負相關 【答案】C159、【104412】(單項選擇題)相關系數的取值范圍可表示為( )。A.B.C.D. 【答案】B160、【104416】(單項選擇題)當回歸直線與x軸平行時,則x與y之間的簡單相關系數( )。A.B.C.D. 【答案】D161、【104417】(單項選擇題)現根據樣本數據建立的單位產品成本(元)對產量(千件)的一元線性回歸方程為,以下說法錯誤的是( )。A.產量每增加1千件,單位成本平均降低元B.產量為千件時,單

30、位成本為元C.產量每增加千件,單位成本平均增加元D.單位成本與產量之間存在著負相關 【答案】C1、【104134】(單項選擇題)某市分行下屬三個支行的職工人數分別為人、人、人,這三個數字是( )。A.標志B.指標C.變量D.變量值 【答案】D2、【104137】(單項選擇題)統計一詞的三種涵義是( )。A.統計活動、統計資料、統計學B.統計活動、統計調查、統計學C.統計調查、統計整理、統計分析D.統計指標、統計資料、統計學 【答案】A3、【104143】(單項選擇題)一項調查表明,北京市大學生每學期在網上購物的平均花費是元,他們選擇在網上購物的主要原因是“價格實惠”,則“大學生在網上購物的原因

31、”是( )。A.分類型變量B.順序型變量C.數值型變量D.定距變量 【答案】A4、【104147】(單項選擇題)一家研究機構從IT從業者中隨機抽取人作為樣本進行調查,其中回答他們的月收入在元以上,則月收入是( )。A.分類型變量B.順序型變量C.數值型變量D.定距變量 【答案】C5、【104149】(單項選擇題)一家研究機構從IT從業者中隨機抽取人作為樣本進行調查,其中的人回答他們的消費支付方式是信用卡,則消費支付方式是( )。A.分類型變量B.順序型變量C.數值型變量D.定距變量 【答案】A6、【104156】(單項選擇題)絕對不可能發生的事件發生的概率是( )。A.B.C.D. 【答案】A

32、7、【104160】(單項選擇題)必然會發生的事件發生的概率是( )。A.B.C.D. 【答案】D8、【104161】(單項選擇題)拋擲一枚均勻的硬幣,出現正面的概率是( )。A.B.C.D. 【答案】C9、【104176】(簡答題)統計數據可以劃分為哪幾種類型?分別舉例說明。 【答案】統計數據按照所采用計量尺度的不同可劃分為三種類型。一種是數值型數據,是指用數字尺度測量的觀察值。例如,每天進出海關的旅游人數,某地流動人口的數量等。數值型數據的表現就是具體的數值,統計處理中的大多數都是數值型數據;另一種是分類型數據,是指對數字進行分類的結果,例如人口按性別分為男、女兩類,受教育程度也可以按不同

33、類別來區分;再一種是順序型數據,是指數據不僅是分類的,而且類別是有序的,例如滿意度調查中的選項有“非常滿意”,“比較滿意”,“比較不滿意”,“非常不滿意”,等。在這三類數據中,數值型數據由于說明了事物的數量特征,因此可歸為定量數據,分類型數據和順序型數據由于定義了事物所屬的類別,說明了事物的品質特征,因而可統稱為定性數據。10、【104173】(填空題)參數是描述_特征的概括性數字度量。 【答案】總體11、【104174】(填空題)統計量是描述_特征的概括性數字度量。 【答案】樣本12、【145091】(填空題)根據計量尺度的不同,可將數據劃分為三種類型:_、_和_。 【答案】數值型數據;分類

34、型數據;順序型數據第二章 數據的搜集13、【104177】(單項選擇題)下列哪一項不是數據的直接來源( )。A.普查B.二手數據C.統計報表D.抽樣調查 【答案】B14、【104178】(單項選擇題)數據的間接來源有( )。A.普查B.實驗數據C.二手數據D.抽樣調查 【答案】C15、【104180】(填空題)數據的誤差包括:_、_、_。 【答案】抽樣誤差、未響應誤差、響應誤差16、【104181】(填空題)抽樣誤差的影響因素有:_、_。 【答案】樣本量的大小、總體的變異性17、【104182】(填空題)抽樣誤差是由于抽樣的隨機性引起的樣本結果與_之間的誤差。 【答案】總體真值第三章 數據的描

35、述(一)數據的直觀顯示18、【104184】(單項選擇題)統計表的形式應該是( )。A.上下不封頂,左右不開口B.上下要封頂,左右要開口C.上下要封頂,左右不開口D.上下不封頂,左右要開口 【答案】B19、【104186】(單項選擇題)直方圖一般可用于表示( )。A.累計次數的分布B.次數分布的特征C.變量之間的函數關系D.數據之間的相關性 【答案】B20、【104187】(單項選擇題)直方圖相比,莖葉圖( )原始數據的信息。A.沒保留B.保留了C.掩蓋了D.浪費了 【答案】B21、【104188】(單項選擇題)家公司在電視廣告上的花費如下(百萬元):,。下列圖示法不宜用于描述這些數據的是(

36、)。A.莖葉圖B.散點圖C.餅圖D.直方圖 【答案】C22、【122753】(單項選擇題)對某地區人口按年齡分組如下:歲以下、歲、歲、歲、歲、歲以上。第一組與最后一組的組中值分別為( )。A.歲和歲B.歲和歲C.歲和歲D.歲和歲 【答案】B23、【104194】(簡答題)怎樣理解在統計分組過程中的“互斥”、“不重不漏”、“上組限不在組內”、“下限不包括在內”的原則? 【答案】在統計分組中的“互斥”原則,就是指各組中不應相互包含。所謂“不重”就是指一項數據只能歸入其中的一組,而不能同時歸入兩個或兩個以上的組。所謂“不漏”就是指各組別能夠窮盡,即在所分的全部組別中,每項數據都能分在其中的一組而沒有

37、遺漏。為了解決“不重”問題,在統計分組中習慣上規定,對于越大越好的數值,采用“上組限不在組內”的原則,即當采用重疊組限時,某一變量值恰與組限同值,應將其歸入下限組,而不是上限組;對于越小越好的數值,則采用“下限不包括在內”的原則,即當采用重疊組限時,某一變量值恰與組限同值,則應將其歸入上限組,而不是下限組。為了解決“不漏”的問題,在分組時可以采用開口組,這樣可以將極端值包括在分組中,不被遺漏。24、【104190】(填空題)重疊組限對于越大越好的變量按“_”的原則歸組,而對于越小越好的變量則應按照“_”的原則歸組。 【答案】上限不包括在內;下限不包括在內25、【104191】(填空題)統計表一

38、般由_、行標題、_和數據資料構成。 【答案】表頭,列標題26、【104192】(填空題)盒形圖由一組數據的最大值、_、上四分位數、_、最小值五個特征數值組成。 【答案】中位數,下四分位數27、【104199】(計算題)某班級名學生統計學成績被分為四個等級:優;良;中;差。結果如下:(1)根據數據,計算分類頻數,編制頻數分布表;(2)按順序計算累積頻數,編制向上累積頻數分布表和向下累計頻數分布表。 【答案】28、【104202】(計算題)某企業某班組工人日產量資料如下:根據上表指出:(1)上表變量數列屬于哪一種變量數列;(2)上表中的變量、變量值、上限、下限、次數;(3)計算組距、組中值、頻率。

39、 【答案】(1)該數列是等距式變量數列。(2)變量是日產量,變量值是-,下限是上限是次數是;(3)組距是,組中值分別是,頻率分別是。29、【104203】(計算題)甲乙兩班各有名學生,統計學考試成績如下:(1)根據表中的數據,制作甲乙兩班考試成績分類的對比條形圖;(2)比較兩班考試成績分布的特點。 【答案】乙班學生考試成績為優和良的比重均比甲班學生高,而甲班學生考試成績為中和差的比重比乙班學生高。因此乙班學生考試成績平均比乙班好。兩個班學生都呈現出"兩頭大,中間小"的特點,即考試成績為良和中的占多數,而考試成績為優和差的占少數。30、【104205】(計算題)科學研究表明成

40、年人的身高和體重之間存在著某種關系,根據下面一組體重身高數據繪制散點圖,說明這種關系的特征。 【答案】散點圖:可以看出,身高與體重近似呈現出線性關系。身高越高,體重越重。31、【150771】(計算題)某班名學生統計學考試成績分別為: 學校規定:分以下為不及格,-為及格,-分為中,-分為良,-分為優。要求:(1)將該班學生分為不及格、及格、中、良、優五組,編制一張次數分配表。(2)指出分組標志及類型;分組方法的類型;分析本班學生考試情況。 【答案】(1)"學生考試成績"為連續變量,需采組距式分組,同時學生考試成績變動均勻,故可用等距式分組來編制變量分配數列。考試成績學生人數

41、(人)比率(%)60分以下37.560-70615.070-801537.580-901230.090-100410.0合計40100.0(2)分組標志為考試成績,屬于數量標志,簡單分組;從分配數列中可看出,該班同學不及格人數和優秀生的人數都較少,分別為和。大部分同學成績集中在-分之間,說明該班同學成績總體良好。考試成績一般用正整數表示時,可視為離散變量也可用單項式分組,但本班學生成績波動幅度大,單項式分組只能反映成績分布的一般情況,而組距分組分配數列可以明顯看出成績分配比較集中的趨勢,便于對學生成績分配規律性的掌握。第四章 數據的描述(二)重要的統計量32、【104206】(單項選擇題)對于

42、右偏分布,均值、中位數和眾數之間的關系是( )。A.均值>中位數>眾數B.中位數>均值>眾數C.眾數>中位數>均值D.眾數>均值>中位數 【答案】A33、【104207】(單項選擇題)中位數( )。A.不是平均數B.是一種趨勢值C.是一種位置平均數D.是一種位置 【答案】C34、【104208】(單項選擇題)眾數( )。A.不是平均數B.是一種趨勢值C.是一種位置平均數D.是一種位置 【答案】C35、【104209】(單項選擇題)下列不受極端值影響的平均數是( )。A.算術平均數B.眾數C.調和平均數D.上述三種都不對 【答案】B36、【1042

43、10】(單項選擇題)在下列兩兩組合的平均指標中,哪一組的兩個平均數不受極端兩值的影響?( )A.算術平均數和調和平均數B.幾何平均數和眾數C.調和平均數和眾數D.眾數和中位數 【答案】D37、【104211】(單項選擇題)下列說法正確的是( )。A.異眾比率的作用是衡量眾數對一組數據的代表程度B.異眾比率越大,則眾數的代表性越好C.異眾比率不宜用來比較不同總體D.定類尺度數據不能計算異眾比率 【答案】A38、【104214】(單項選擇題)計算平均速度最好用( )。A.算術平均數B.調和平均數C.幾何平均數D.眾數 【答案】C39、【104215】(單項選擇題)測度數據集中趨勢的統計指標有( )

44、。A.方差B.極差C.平均差D.眾數 【答案】D40、【104218】(單項選擇題)測度數據離散趨勢的統計指標有( )。A.中位數B.眾數C.標準差D.均值 【答案】C41、【104220】(單項選擇題)人口數與出生人數( )。A.前者是時點指標而后者是時期指標B.前者是時期指標而后者是時點指標C.兩者都是時期指標D.兩者都是時點指標 【答案】A42、【104221】(單項選擇題)有一組數據,其均值為,樣本方差為,中位數為,則其離散系數等于( )。A.B.C.D. 【答案】C43、【104222】(單項選擇題)關于眾數,下列說法正確的是( )。A.眾數不適用于定距和定比數據B.眾數不受數據極端

45、值的影響C.一組數據只能有一個眾數D.眾數不適用于定類數據 【答案】B44、【104229】(單項選擇題)隨機變量,則其變異系數為( )。A.B.C.D. 【答案】A45、【104230】(單項選擇題)下列說法不正確的是( )。A.在單峰分布條件下,如果數據是對稱的,則眾數和中位數相等B.只有均值對所有類型的數據都適用C.對于偏態分布的數據,均值的代表性較差D.眾數、四分位數和均值都適用于定比數據 【答案】B46、【104231】(單項選擇題)關于均值,下列說法正確的是( )。A.均值不適用于定類數據和定序數據B.均值不適用于定距數據和定比數據C.各變量與其均值的離差之和等于D.幾何平均數不適

46、用于定比數據 【答案】A47、【104232】(單項選擇題)關于方差和標準差,正確的說法是( )。A.方差有量綱B.標準差有量綱C.方差和標準差都有量綱D.方差的實際意義比標準差清楚 【答案】B48、【104233】(單項選擇題)當偏態系數大于零時,則分布是( )。A.左偏B.右偏C.對稱D.無法確定 【答案】B49、【104237】(單項選擇題)當偏態系數小于零時,則分布是( )。A.左偏B.右偏C.對稱D.無法確定 【答案】A50、【104239】(單項選擇題)當峰度系數大于零時,則分布是( )。A.尖峰B.扁平C.右偏D.左偏 【答案】A51、【104242】(單項選擇題)正態分布的偏態

47、系數( )。A.小于零B.等于零C.大于零D.大于或等于零 【答案】B52、【104244】(單項選擇題)正態分布的峰度系數( )。A.小于零B.等于零C.大于零D.大于或等于零 【答案】B53、【104245】(單項選擇題)一組數據有個觀察值,則中位數的位置為( )。A.B.C.D. 【答案】D54、【104246】(單項選擇題)一組數據有個觀察值,則中位數的位置為( )。A.B.C.D. 【答案】B55、【145010】(單項選擇題)對列聯水平進行分析的統計量主要是( )。A.頻數B.頻率C.中位數D.且 【答案】D56、【104262】(簡答題)試回答描述數據的集中趨勢的統計量有哪些?并

48、對這些統計量的特點加以比較。 【答案】常用的描述集中趨勢的統計量主要有均值、中位數、眾數。(1)均值又分為算術平均數、調和平均數和幾何平均數。未經分組整理的原始數據,其算術平均數的計算就是直接將一組數據的各個數值相加除以數值個數,稱為簡單算術平均數。根據分組整理的數據計算的算術平均數,就要以各組變量值出現的次數或頻數為權數計算加權的算術平均數。(2)調和平均數也稱倒數平均數或調和均值。調和平均數和算術平均數在本質上是一致的,實際應用時,當計算算術平均數其分子資料未知時,就采用加權算術平均數計算均值,分母資料未知時,就采用加權調和平均數計算均值。(3)幾何平均數也稱幾何均值,通常用來計算平均比率

49、和平均速度。(4)中位數是將變量取值按大小順序排列后,處于中間位置的那個變量值。中位數很好的代表了一組數據的中間位置,對極端值并不敏感。由于中位數只是數據中間位置的代表取值,因此中位數并沒有利用數據的所有信息,其對原始數據信息的代表性不如均值。(5)眾數是指一組數據中出現次數最多的變量值。眾數具有不唯一性。均值、中位數、眾數是描述數據集中趨勢的主要統計量,它們按照不同的方法來確定,具有不同的特點和應用場合;但是,三者之間存在著一定的數量關系,這種數量關系取決于變量取值的頻數分布狀況。從分布的角度看,均值是一組數據全部數值的平均數,中位數是處于一組數據中間位置上的數值,眾數始終是一組數據分布的最

50、高峰值。對于具有單峰分布的大多數數據而言,均值、中位數、眾數存在以下關系:當變量取值的頻數分布對稱時,則均值與眾數、中位數三者完全相等,即;當變量取值的頻數分布呈現右偏時,三者之間的關系為;當變量取值的頻數分布呈現左偏時,三者之間的關系為。從上面的關系我們可以看出,當頻數分布呈對稱分布或近似對稱分布時,以均值、中位數或眾數來描述數據的集中趨勢都比較理想;當頻數分布呈偏態時,極端值會對均值產生較大影響,而對眾數、中位數沒有影響,此時,用眾數、中位數來描述集中趨勢比較好。均值不適用于定性數據。均值的優點在于它對變量的每一個取值都加以利用;缺點在于其統計量的穩健性較差,即容易受到極端值的干擾。對于偏

51、態分布的數據,均值的代表性較差。因此,當數據分布的偏斜程度很大時,可以考慮選擇中位數或眾數作為集中趨勢的代表。57、【104263】(簡答題)試回答描述數據的離散趨勢的統計量有哪些?并對這些統計量的特點加以比較。 【答案】離散趨勢反映了變量各個取值遠離其中心值的程度。常用的測度離散程度的統計量主要有異眾比率、極差、四分位差、平均差、方差、標準差和離散系數等。(1)異眾比率是指一組數據中非眾數(組)的頻數占總頻數的比例,是衡量眾數對一組數據的代表性程度的指標。異眾比率越大,說明非眾數組的頻數占總頻數的比重就越大,眾數的代表性就越差;反之,異眾比率越小,眾數的代表性就越好。(2)極差是一組數據的最大值與最小值之差,也稱全距,主要用于測度順序數據和定量數據的離散趨勢。極差容易受極端值的影響。(3)四分位差是上四分位數與下四分位數之差。四分位數是指處在位置上的數值(下四分位數)和處在位置上的數值(上四分位數)。四分位差主要用于測度順序數據和定量數據的離散趨勢,它克服了極差容易受數據中兩端極值的影響這一缺陷。數值越小,說明中間的數據越集中;數值越大,說明中間的數據越分散。(4)平均差是一組數據與其均值離差絕對值的平均數

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論