




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
./第一章:什么是統計學?統計學是一門收集、分析、表述、解釋數據的科學和藝術。描述統計:研究的是數據收集、匯總、處理、圖表描述、概括與分析等統計方法。推斷統計:研究的是如何利用樣本數據來推斷總體特征。統計學據可以分成哪幾種類型,個有什么特點?按照計量尺度不同,分為:分類數據、順序數據、數值型數據。分類數據:只能歸于某一類別的,非數字型數據。順序數據:只能歸于某一有序類別的,非數字型數據。數值型數據:按數字尺度測量的觀察值,結果表現為數值。按收集方法不同。分為:觀測數據、和實驗數據觀測數據:通過調查或觀測而收集到的數據;不控制條件;社會經濟領域實驗數據:在試驗中收集到的數據;控制條件;自然科學領域。按時間不同,分為:截面數據、時間序列數據截面數據:在相同或近似相同的時間點上收集的數據。時間序列數據:在不同時間收集的數據。舉例說明總體、樣本、參數、統計量、變量這幾個概念。總體:是包含全部研究個體的集合,包括有限總體和無限總體〔范圍、數目判定樣本:從總體中抽取的一部分元素的集合。參數:用來描述總體特征的概括性數字度量。〔平均數、標準差、比例等統計量:用來描述樣本特征的概括性數字度量。〔平均數、標準差、比例等變量:是說明樣本某種特征的概念,其特點:從一次觀察到下一次觀察結果會呈現出差別或變化。〔商品銷售額、受教育程度、產品質量等級等〔對一千燈泡進行壽命測試,那么這千個燈泡就是總體,從中抽取一百個進行檢測,這一百個燈泡的集合就是樣本,這一千個燈泡的壽命的平均值和標準差還有合格率等描述特征的數值就是參數,這一百個燈泡的壽命的平均值和標準差還有合格率等描述特征的數值就是統計量,變量就是說明現象某種特征的概念,比如說燈泡的壽命。變量可以分為哪幾類?分類變量:說明事物類別;取值是分類數據。順序變量:說明事物有序類別;取值是順序數據數值型變量:說明事物數字特征;取值是數值型數據。變量也可以分為:隨機變量和非隨機變量;經驗變量和理論變量舉例說明離散型變量和連續型變量。離散型變量:只能取有限個、可數值的變量。〔企業個數、產品數量連續型變量:可以在一個或多個區間中取任何值的變量。〔年齡、溫度、零件尺寸誤差請舉出統計應用的幾個例子。市場調查、人口普查等。請舉出應用統計學的幾個領域。社會科學中的經濟分析、政府政策制定等;自然科學中的物理、生物領域等。第二章:什么是二手資料?使用二手資料需要注意些什么?什么是二手資料:已經存在的;跟研究內容有關的;別人所做的調查或研究;會被我們利用的,資料。注意:需要進行評估:考慮原始數據收集人、收集目的、收集途徑、收集時間及數據來源。比較概率抽樣和非概率抽樣的特點。舉例說明什么情況下適合采用概率抽樣,什么情況下適合采用非概率抽樣。概率抽樣:以一定的入樣概率,按照一定的隨機性原則選取樣本〔即樣本被選中的概率已知或可計算;技術含量高、成本高。用于描述性、解釋性、推斷性研究;研究目的在于掌握對象總體的數字特征,得到總體參數的置信區間。非概率抽樣:不按照入樣概率和隨機性原則,而按照方便、滾雪球或配額等抽樣形式選取樣本;技術含量低、成本低、時效快、操作簡便。用于探索性研究;研究目的在于發現問題,為更深入的數量分析提供準備。下面題目〔略2.3除了自填式,面訪式和電話式還有什么搜集數據的辦法試驗式和觀察式等2.4自填式,面訪式和電話式各自的長處和弱點自填式;優點:1調查組織者管理容易2成本低,可進行大規模調查3對被調查者,可選擇方便時間答卷,減少回答敏感問題壓力。缺點:1返回率低2不適合結構復雜的問卷,調查內容有限3調查周期長4在數據搜集過程中遇見問題不能及時調整。面訪式;優點:1回答率高2數據質量高3在調查過程中遇見問題可以及時調整。缺點:1成本比較高2搜集數據的方式對調查過程的質量控制有一定難度3對于敏感問題,被訪者會有壓力。電話式;優點:1速度快2對調查員比較安全3對訪問過程的控制比較容易。缺點:1實施地區有限2調查時間不能過長3使用的問卷要簡單4被訪者不愿回答時,不易勸服。2.6如何控制調查中的回答誤差對于理解誤差,學習一定的心理學知識,記憶誤差,縮短所涉及的時間范圍,有意識誤差,做好被調查者的心理工作,要遵守職業道德,為被調查者保密,盡量在問卷中不涉及敏感問題。2.7怎么減少無回答對于隨機誤差,要提高樣本容量,對于系統誤差,只有做好準備工作并做好補救措施。比如說要一百份的問卷回復,就要做好一百二十到一百三十的問卷準備,進行面訪式的時候要盡量的勸服不愿意回答的被訪者,以小物品的饋贈提高回復率。第三章:數據的預處理包括哪些內容?數據審核:從完整性和準確性方面調查原始數據〔完整性:單位、個體是否遺漏;準確性:檢查錯誤、異常值數據篩選:根據需要找出符合特定條件的某類數據。數據排序:按一定順序將數據排列,體現數據特征或趨勢。分類數據和順序數據的整理和圖示方法各有哪些?分類數據:整理:制作頻數分布表,用比例、百分比、比率進行描述性分析。圖示:條形圖、帕累托圖、餅圖。順序數據::整理:制作頻數分布表,用比例、百分比、比率進行描述性分析。圖示:累積頻數、累計頻率分布圖、環形圖、條形圖、帕累托圖、餅圖。數值型數據的分組方法有哪些?簡述組距分組的步驟。分組方法:單變量分組:把每一個變量值做為一組〔只適合離散型變量,變量值較少組距分組:將全部變量值依次劃分為若干區間,一個區間變量值做為一組。<組距分組又分為:等距分組、異距分組>分組步驟:確定組數〔5,15;確定各組組距〔5倍數;組距>最大變量值-最小變量值;根據分組整理成頻數分布表。直方圖與條形圖有何區別?條形圖用于展示分類數據;直方圖用于展示數值型數據。條形圖用長度表示個類別頻數,寬度固定〔無意義;直方圖用面積表示各組頻數,長度表每組頻數〔或頻率,寬度為組距〔有意義。條形圖各矩形分開排列,直方圖各矩形連續排列。〔分組數據具有連續性繪制線圖應注意哪些問題?時間在橫軸,觀測值在縱軸;橫軸縱軸長度比例大概為10:7;縱軸下端一般從0開始,數據與0距離過大的話用折斷符。餅圖與環形圖有什么不同?餅圖:只能繪制一個樣本或總體各部分的比例。條形圖:可以同時繪制多個樣本或總體各部分的比例。中間有一空洞,每個樣本或總體數據表現為一個環。莖葉圖與直方圖相比有什么優點?他們的應用場合是什么?莖葉圖在給出數據分布情況的同時,又能給出每一個原始數據〔保留了原始數據的信息;直方圖用于大批量數據,莖葉圖用于小批量數據。8、鑒別圖標優劣的準則有哪些?顯示數據、強調數據間的比較、有對圖形的統計描述和文字描述、避免歪曲、把讀者注意力集中于數據內容上、服務于一個明確的目的。制作統計表應注意哪幾個問題?合理安排統計表結構;表頭一般包括表號,總標題和表中數據的單位等內容;表中的上下兩條橫線一般用粗線,中間的其他用細線;在使用統計表時,必要時可在下方加注釋,注明數據來源。公式:組中值=〔上限+下限/2第四章:一組數據的分布特征可以從哪進幾個方面進行測度?可以從以下三方面進行測度:集中趨勢:反映個數據向其中心值的靠攏或集中程度;離散程度:反映各數據遠離其中心值的趨勢;分布形狀:數據分布的峰態和偏態;怎樣理解平均數在統計學中的地位?平均數在統計學中具有重要地位:是集中趨勢的最主要測度,是一組數據的重心所在;是數據誤差相互抵消的結果,利用了全部數據信息,具有無偏性;只適用于數值型數據,不適用于分類或順序數據。簡述四分位數的計算方法:四分位數是一組數據排序后處于25%和75%位置上的值。具體計算方法是:n/4;3n/4對于比例數據的平均為什么采用幾何平均?對于比例數據采用幾何平均比采用算數平均更合理。簡述眾數、中位數和平均數的特點和應用場合。眾數:主要用于分類數據集中趨勢的度量;是一組數據的峰值;優點:不受極值的影響。缺點:具有不唯一性;只有數據量較大時才有效果中位數:主要用于順序數據集中趨勢的度量;是一組數據中間位置的代表制;優點:不受極值的影響;數據分布偏斜程度較大時是一個不錯的選擇。平均數:主要用于數值型數據集中趨勢的度量;是一組數據的重心所在。優點:利用了所有數據信息;數據誤差相互抵消,具有無偏性;缺點:易受極值影響;當數據分布偏斜程度較大時代表性差。簡述異眾比率、四分位差、方差或標準差的應用場合。異眾比率:分類數據的離散程度測度;四分位差:順序數據的離散程度測度;方差:數值型數據的離散程度測度標準分數有哪些用途?標準分數:Xi-/s即:〔變量值減去其平均數/標準差標準分數給出了一組數據中各數據的相對位置〔其離平均數的距離用標準差衡量用途:在對多個具有不同量綱的變量進行處理時,需要對變量進行標準化處理;檢查一組數據中是否有離群值。為什么要計算離散系數?離散系數=標準差/平均數原因:方差和標準差反映的是數據離散程度的絕對值:一方面,受原變量值自身水平高低的影響〔與變量平均數大小有關;另一方面,與原變量值得計量單位有關,計量單位不同,離散程度也不同。因此,為消除變量值水平高低和變量值單位對離散程度的影響,要計算離散系數。測度數據分布形狀的統計量有哪些?峰態系數、偏態系數。第六章:什么是統計量?為什么要引進統計量?統計量為什么不含任何未知參數?定義:設〔X1,X2……Xn是從總體X中抽取的容量為n的樣本,如果由此構造一個函數T〔X1,X2……Xn,不依賴于任何未知參數,則稱函數T〔X1,X2……Xn是一個統計量。為什么:為了使統計推斷成為可能。什么是次序統計量?設〔X1,X2……Xn是從總體X中抽取的容量為n的樣本,,若樣本〔X1,X2……Xn是滿足如下條件的函數:每當樣本得到一個觀測值x1,x1……xn時,其由小到大的排序中,第i個值x<i>就作為次序統計量Xi的觀測值,而X<1>,X<2>……X<n>就稱為次序統計量。什么是充分統計量?統計加工過程中一點信息都不損失的統計量稱為充分統計量。什么是自由度?獨立變量的個數。簡述三個重要分布及正態分布間的關系。卡方分布:設X1,X2,……Xn是n個相互獨立的隨機變量,且Xi~N<0,1>,則X=X1^2+……+Xn^2為服從以n為自由度的卡方分布。F分布:設X~X^2<m>,Y^2~X^2<n>,且X,Y相互獨立,記Z=X/m/Y/n,則Z~F<m,n>Z分布:設X~N<0,1>,Y~X^2<n>,且X,Y相互獨立,記T=X/<Y/n>^<1/2>,有T~t<n>什么是抽樣分布?樣本統計量〔隨機變量的概率分布是一種理論概率分布。簡述中心極限定理的意義。中心極限定理:設從均值為μ,方差為o^2的任意任意總體中抽取樣本量為n的樣本,當n充分大時,樣本均值X的抽樣分布近似服從均值為μ,方差為o^2/n的正態分布。第七章:解釋估計量與估計值。估計量:用于估計總體參數的隨機變量。估計值:估計總體參數時計算出來的估計量的具體值。簡述評價估計量好壞的標準。無偏性:估計量抽樣分布的數學期望=總體參數有效性:對同一參數的兩個無偏點估計量,擁有更小標準差的估計量更有效。一致性:隨著樣本容量的增大,估計量的值越來越接近總體參數。怎樣理解置信區間?由樣本統計量所構造的總體參數的估計區間。解釋95%的置信區間。95%的置信區間值通過某種方法構造的估計區間中,有95%的區間包含總體參數的真值。Za/2是標準正態分布上側面積為a/2的z值,公式是統計總體均值時的邊際誤差。解釋獨立樣本和匹配樣本的含義。獨立樣本:兩個樣本是從兩個總體中獨立抽取的,即一個樣本中的元素與另一個樣本中的元素相互獨立。〔想工人匹配樣本:一個樣本中的數據與另一個樣本中的數據相互對應。簡述樣本量與置信水平、總體方差、估計誤差的關系。樣本量越大,置信水平越高,總體方差和估計誤差越小。第八章:假設檢驗和參數估計有什么相同點和不同點?相同點:是統計推斷的兩部分;都運用樣本對總體進行推斷。不同點:推斷角度不同。參數估計:用樣本統計量估計總體參數,總體參數估計前未知。假設檢驗:對總體參數提出假設,用樣本信息驗證假設成立否。什么是假設檢驗中的顯著性水平?統計顯著是什么意思?顯著性水平:原假設正確時卻被拒絕的概率或風險。統計顯著:指拒絕原假設,即求出的值落在小概率區間上〔拒絕域內什么是假設檢驗中的兩類錯誤?α錯誤〔棄真錯誤:原假設為真,卻被我們拒絕了。β錯誤〔取偽錯誤:原假設為假,卻被我們接受了。兩類錯誤之間存在什么樣的數量關系?在樣本量一定的情況下,二者是此消彼長的關系。解釋假設檢驗中的P值。當原假設為真時所得到的樣本觀察值或更極端值出現的概率。〔它的大小取決于三個因素,一個是樣本數據與原假設之間的差異,一個是樣本量,再一個是被假設參數的總體分布。顯著性水平與P值有何區別?顯著性水平:原假設為真時拒絕原假設的概率,即拒絕域,大小由研究者自己決定。P值:原假設為真時所得的樣本觀察結果或更極端值出現的概率,是實測的顯著性水平。假設檢驗依據的基本原理是什么?假設檢驗基于小概率原理:即小概率事件在一次實驗中是幾乎不可能發生的,而一旦發生,我們就有理由拒絕原假設。在單側檢驗中,原假設和備擇假設的方向應該如何確定?將想收集證據予以支持的假設作為備擇假設;將想收集證據予以否認的假設作為原假設,同時原假設應基于廣泛的社會經驗基礎。備擇假設的方向與想要證明的正確性的方向一致。備擇假設和原假設互斥,且等號總在原假設上。什么是方差分析?它研究的是什么?方差分析:通過驗證個總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。研究內容:研究的是分類型自變量和數值型因變量之間的關系〔有沒有影響。要檢驗多個總體均值是否相等時,為什么不作兩兩比較,而用方差分析方法?提高檢驗效率:兩兩檢驗太過繁瑣。增加分析可靠性,排除錯誤累計概率,減少檢驗誤差。〔多次檢驗會增加犯α錯誤的概率方差分析包括哪些類型?他們有何區別?單因素方差分析和雙因素方差分析。區別:單因素方差分析:一個分類型自變量對一個數值型因變量的影響;雙因素方差分析:涉及兩個分類型自變量。方差分析中有哪些基本假定?正態總體;方差齊性;觀測值獨立簡述方差分析的基本思想。方差分析是通過對誤差來源的分析判別不同總體均值是否相等,進而分析自變量對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 肋骨骨折護理課件
- 直腸肛周疾病圍手術期的護理
- 住宿業消費者權益保護體系企業制定與實施新質生產力戰略研究報告
- 養胃面店行業跨境出海戰略研究報告
- 養生水果茶行業深度調研及發展戰略咨詢報告
- 校園衛生保健服務行業直播電商戰略研究報告
- 特種鏡頭行業直播電商戰略研究報告
- 技工學校教育服務行業跨境出海戰略研究報告
- 鉛筆芯行業跨境出海戰略研究報告
- 跳箱行業直播電商戰略研究報告
- 砌墻施工班組勞務分包合同
- 2025年內蒙古自治區中考一模語文試題(原卷版+解析版)
- 合同范本之消防栓安裝施工合同5篇
- 生物-四川省宜賓市、樂山市、自貢市普通高中2022級(2025屆)第二次診斷性測試(宜賓樂山自貢三市二診)試題和答案
- 【初中生物】食物中營養物質課件2024-2025學年人教版生物七年級下冊
- 2025-2030中國兒科用藥行業深度調研及投資前景預測研究報告
- 礦產資源開發合作框架協議書范本
- 2025年寧波衛生職業技術學院單招職業技能測試題庫附答案
- 2024-2025學年人教版數學七下 第七章 相交線與平行線(含答案)
- GB/T 44994-2024聲學助聽器驗配管理
- 物 理探究凸透鏡成像規律實驗報告+2024-2025學年蘇科版物理八年級上學期
評論
0/150
提交評論