數據的計量尺度有哪些_第1頁
數據的計量尺度有哪些_第2頁
數據的計量尺度有哪些_第3頁
數據的計量尺度有哪些_第4頁
數據的計量尺度有哪些_第5頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1、數據的計量尺度有哪些?各自特征(1)定類尺度:計量層次最低;對事物進行平行的分類;各類別可以指定數字代碼表示;使用時必須符合類別窮盡和互斥的要求;數據表現為“類別”;具有=或¹的數學特性(2)定序尺度:對事物分類的同時給出各類別的順序;比定類尺度精確;未測量出類別之間的準確差值;數據表現為“類別”,但有序;具有>或<的數學特性(例如,產品分為一等品、二等品、三等品、次品等)(3)定距尺度:對事物的準確測度;比定序尺度精確;數據表現為“數值”;沒有絕對零點;具有 + 或 的數學特性,但是倍數關系不成立(如氣溫可以有溫差,但不能有倍數關系)(4)定比尺度:對事物的準確測度

2、;與定距尺度處于同一層次;數據表現為“數值”;有絕對零點;具有 ´ 或 ¸ 的數學特性,也可+或 ,倍數關系成立(如年齡可以有差值也可以有倍數關系)&以上四種計量尺度對事物的測量層次由低級到高級、由粗略到精確逐步地進,高層次計量尺度有低層次計量尺度的全部特征,反之不成立。·對測量尺度層次的判斷(1)較低層次的測量尺度測量精度低,而較高層次的測量尺度測量精度高。(2)較低層次的測量尺度計算方法少,而較高層次的測量尺度計算方法多。(3)較低層次的測量尺度信息數量少,而較高層次的測量尺度信息數量多。2、條形圖與直方圖的不同(1)直方圖表示定量數據(定距、定比數據

3、),條形圖表示定性數據(定類、定序數據)(2)條形圖是用條形的長度表示各類別頻數的多少,其寬度是固定的;直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或百分比,寬度則表示各組的組距,高度與寬度均有意義(3)直方圖的各矩形通常是連續排列,條形圖則是分開排列3、均值、中位數和眾數的特點及之間的關系(1)眾數:不受極端值影響、具有不惟一性、數據分布偏斜程度較大時應用(2)中位數:不受極端值影響、數據分布偏斜程度較大時應用(3)均值:易受極端值影響、數學性質優良、數據對稱分布或接近對稱分布時應用·當分布為適度偏態時,三者之間近似的數量關系是:眾數與算術平均數的距離是中位數與算術

4、平均數距離的3倍,即:根據這一關系,可以得到以下三個關系式: 4、為什么要計算離散系數?如何運用離散系數判斷平均數的代表性?(1)離散系數:標準差與其相應的均值之比,是對數據相對離散程度的測度,消除了數據水平高低和計量單位的影響,用于對不同組別數據離散程度的比較,用V表示。公式如下: (2)離散系數大的離散程度大,平均數代表性??;反之,離散系數小的離散程度小,平均數代表性大。5、什么是參數?什么是統計量?二者有何關系?(1)參數:研究者想要了解的總體的某種特征值??傮w參數通常用希臘字母表示,所關心的參數主要有總體均值(m)、標準差(s)、總體比例()等。推薦精選(2)統計量:根據樣本數據計算出

5、來的一個量。樣本統計量通常用小寫英文字母來表示,所關心的樣本統計量有樣本均值(x)、樣本標準差(s)、樣本比例(p)等(3)關系:6、評價估計量優良的標準是什么?(1)無偏性:估計量抽樣分布的數學期望等于被估計的總體參數。若,則稱為的無偏估計量。(2)有效性:作為優良的估計量,除了滿足無偏性的要求外,其方差應比較小。假定 、 為總體參數 的兩個無偏估計量,其抽樣分布的方差分別用 和 表示,若,則稱為比更有效的估計量。在無偏估計條件下,估計量方差越小,離散程度越小,估計越有效。(3)一致性:指隨著樣本單位數n的增大,樣本估計量將在概率意義下越來越接近于總體真實值。若n越大越小,則稱為的一致估計量

6、。7、什么是假設檢驗中的兩類錯誤?第一類錯誤和第二類錯誤分別指什么?它們發生的概率大小之間存在怎樣的關系?(1)第一類錯誤(棄真錯誤):原假設正確卻拒絕了原假設。第類錯誤的概率記為,被稱為顯著性水平。(2)第二類錯誤(存為錯誤):原假設為假時未拒絕原假設。第類錯誤的概率記為 。(3)關系:在樣本量不變的情況下, 越小,犯第一類錯誤的可能性越小,但 就大,犯第二類錯誤的可能性越大;反之, 越大,犯第一類錯誤的可能性越大, ,但 就小,飯第二類錯誤的可能性越小。不能同時減少兩類錯誤,要使二者同時減小的唯一辦法就是增加樣本量。8、另加:什么是小概率事件原理?(1)在一次試驗中,一個幾乎不可能發生的事

7、件發生的概率(2)在一次試驗中小概率事件一旦發生,我們就有理由拒絕原假設(3)小概率由研究者事先確定9、什么是方差分析,它研究的是什么?(1)方差分析就是從數據差異入手,通過檢驗多個總體均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響的統計方法。(2)方差分析從形式上看是比較多個總體的均值是否相等,但本質上研究的是變量之間的關系,包括他們之間有沒有影響關系,關系的強度如何等。10、方差分析中有哪些基本假定每個總體均服從正態分布。即有:xN(u,2) 對于每個因素中的每一個水平,其觀測值是來自正態分布總體的簡單隨機樣本。每個總體的方差都相同。即:21=22=n2 各組觀測數據是從具有相

8、同方差的正態分布總體中抽取的。各水平下的觀測值相互獨立。11、簡述方差分析的基本思想比較兩類誤差,以檢驗均值是否相等比較的基礎是方差比如果系統(處理)誤差明顯地不同于隨機誤差,則均值就不相等;反之,均值相等推薦精選誤差是由各部分的誤差占總誤差的比例來測度的12、簡述方差分析的基本步驟 (一)提出假設一般提法H0 : m1 = m2 = mk 自變量對因變量沒有顯著影響 H1 : m1 ,m2 , ,mk不全相等 自變量對因變量有顯著影響 注意:拒絕原假設,只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等 (二)構造檢驗的統計量1. 計算各水平的均值(1)假定從第i個總體中抽取一個

9、容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(2)計算公式為式中: ni為第 i 個總體的樣本觀察值個數 xij 為第 i 個總體的第 j 個觀察值 2. 計算全部觀察值的總均值(1)全部觀察值的總和除以觀察值的總個數(2)計算公式為: 3. 計算誤差平方和(1)總誤差平方和(2)水平項誤差平方和 3)誤差平方和(4)三個平方和的關系SST=SSA+SSE(5)三個平方和的作用 SST反映全部數據總的誤差程度;SSE反映隨機誤差的大小;SSA反映隨機誤差和系統誤差的大小 如果原假設成立,則表明沒有系統誤差,組間平方和SSA除以自由度后的均方與組內平方和

10、SSE和除以自由度后的均方差異就不會太大;如果組間均方顯著地大于組內均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統誤差 判斷因素的水平是否對其觀察值有影響,實際上就是比較組間方差與組內方差之間差異的大小4. 計算統計量(1)計算均方差(MS)組間均方差:SSA的均方差,記為MSA,推薦精選組內均方差:SSE的均方差,記為MSE,2)計算檢驗統計量F (三)統計決策Æ 將統計量的值F與給定的顯著性水平a的臨界值Fa進行比較,作出對原假設H0的決策根據給定的顯著性水平a,在F分布表中查找與第一自由度df1k-1、第二自由度df2=n-k 相應的臨界值 Fa 若F>Fa

11、,則拒絕原假設H0 ,表明均值之間的差異是顯著的,所檢驗的因素對觀察值有顯著影響若F<Fa ,則不能拒絕原假設H0 ,表明所檢驗的因素對觀察值沒有顯著影響 13、一元線性回歸模型中有哪些假定?14、相關分析與回歸分析的聯系(1).共同的研究對象:都是對變量間相關關系的分析(2)只有當變量間存在相關關系時,用回歸分析去尋求相關的具體數學形式才有實際意義(3).相關分析只表明變量間相關關系的性質和程度,要確定變量間相關的具體數學形式依賴于回歸分析(4).相關分析中相關系數的確定建立在回歸分析的基礎上15、時期數列和時點數列的區別有哪些?(1)當絕對數時間序列中的數據反映的是現象在所屬時期內發

12、展過程的總量時,就稱為時期序列。其特點:1>序列中不同時間的數據具有可加性。2>序列中每個數據的大小與其所屬時間的長短有直接聯系。3>序列中每個數據需要連續登記取得。如國內生產總值序列(2)當絕對數時間序列中的總量數據反映的是現象在某一時點上所處的總量時,稱該序列為時點序列。 其特點:1>序列中不同時點的數據不具有可加性。2>序列中各數據的大小與其間隔長短沒有直接聯系。3>序列中各數據無需連續登記取得。如我國20002010年全國年末總人口序列16、季節變動分析中的按月(季)平均法和趨勢剔除法有什么不同?(1)按月(季)平均法:直接根據原時間序列通過簡單平均

13、來計算季節指數,適用于包含水平趨勢、季節變動和不規則變動的時間序列,即時間序列中不存在明顯的長期趨勢和循環波動因素。·【基本假定】原時間序列包含水平趨勢、季節變動和不規則變動,沒有明顯的上升或下降的長期趨勢和循環變動推薦精選 ·【計算步驟】第一步:計算時間序列中各年同期(同月或同季)的平均數;第二步:計算時間序列全部數據的總平均數;第三步:計算各年同期(同月或同季)的平均數與總平均數的比值,即為季節指數(S)。公式:(2)趨勢剔除法:該方法的基本思想是,先將時間序列中的長期趨勢予以消除,然后再計算季節指數 。·【基本假定】采用移動平均趨勢剔除法分析季節變動時,假定時間序列各要素的關系結構為:y=T×S×C×I,同時假定各年度的不規則波動I彼此獨立·【計算步驟】第一步:根據各年的月份(或季度)數據,計算12個月(或4個季度)移動平均趨勢值T×C;第二步:將各實際觀察值y除以相應趨勢值T×C,即:第三步:將S×I重新按月(季)排列,求得同月(或同季)平均數,再將其除以總

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論