數據采集與處理 課件 任務4 數據分組認知_第1頁
數據采集與處理 課件 任務4 數據分組認知_第2頁
數據采集與處理 課件 任務4 數據分組認知_第3頁
數據采集與處理 課件 任務4 數據分組認知_第4頁
數據采集與處理 課件 任務4 數據分組認知_第5頁
已閱讀5頁,還剩22頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

項目三數據預處理認知任務4數據分組認知任務導入:為準確了解工人的勞動效率,某企業生產管理部門對機加工車間30名工人完成勞動定額的情況進行數據采集,得到如下原始資料(%):97829584938692102100103105100103108107108106109113114109117125115122119118116129115該企業生產管理部門經理要求該部門工作人員盡快對該資料進行整理,以便提供給公司管理層為制定新的生產定額提供參考。任務要求:1.請你根據上述數據資料幫助該企業生產部門工作人員,整理一下機加工車間30名工人完成勞動定額的情況,以便更好的反映工人生產定額完成情況的分布狀況及其構成。2.通過以上數據整理工作的流程,簡述一下數據分組是什么?數據分組最關鍵問題是什么?一、數據分組的概念及作用數據分組是在數據采集對象內部進行的一種特定分類,是根據數據處理的目的,將數據按照一定的數據處理需求區分為若干個組成部分的數據處理方法。(一)數據分組的概念一、數據分組的概念及作用1.可以揭示社會經濟數據資料的特點及規律性(二)數據分組的作用通過數據采集得到的資料,往往是大量零散的、不系統的第一手數據,僅僅通過這些散亂的資料,難以看出數據采集對象的特點和基本情況,所以需要進行分組。經過數據分組之后,就可以觀察出數據具有的一些特點,進而研究數據采集對象具有的規律性。一、數據分組的概念及作用2.可以區分數據采集對象的類型(二)數據分組的作用例如,消費者按照購物習慣可分為傳統型購物人群和網店型購物人群等類型,網店購物人群可還以按照性別、職業和年齡等來區分,傳統型購物人群也可按照年齡、地域等來分類;當然,還可以按照城鎮購物人群和農村居民購物人群等來區分消費者類型。一、數據分組的概念及作用3.可以分析數據采集對象內部構成和結構特征(二)數據分組的作用把被研究現象按某一標志分組后,計算出各組在數據采集對象中的比重,就可以說明經濟現象的內部結構,例如網購群體中老、中、青購物者構成情況,西瓜視頻、抖音等視媒體愛好者結構等,都反映出不同的購物人群對網購及自媒體的態度。一、數據分組的概念及作用4.可以揭示現象之間的依存關系(二)數據分組的作用數據采集對象都不是孤立存在的,而是相互聯系、相互依存、相互制約的。例如,網絡時代消費者中,年齡與購物習慣存在著一定的關系,一般來說,青年購物者往往喜歡網購,而老年人則喜歡實體店消費;廣告投入和銷售額存在一定的依存關系,一般來說,廣告投入越多,銷售額也比較高。再如商品銷售額和流通費用率之間也存在著一定的依存關系,一般來說,銷售額越高,流通費用率越低(見表3-3-1)。一、數據分組的概念及作用可以看出,商品流通費用率與商品銷售額之間存在的依存關系是?(二)數據分組的作用二、數據分組的方法數據分組的關鍵問題在于選擇分組標志和劃分各組界限,而選擇分組標志則是數據分組的核心問題。二、數據分組的方法1.根據數據處理的目的與任務選擇分組標志(一)選擇分組標志例如,以愛好網購的消費者為數據采集對象進行研究時,這個研究對象就有很多標志,如年齡,性別、職業、收入等。如果數據分析的目的是要分析不同年齡段人群在數據采集對象中的構成,那么就要選擇年齡作為分組標志;如果要研究職業、收入對網購的影響,則可以選擇職業、收入等作為分組標志。二、數據分組的方法2.要從眾多標志中選擇最能反映被研究對象本質特征的標志作為分組標志(一)選擇分組標志在選擇分組標志時,可能遇到既可以使用這種標志,又可以使用另一種標志的情況,這就需要根據被研究對象的特征,選擇最主要的、最能反映事物本質特征的標志進行分組。例如,研究某城市居民生活水平狀況時,既可用居民的個人收入水平作為分組標志,也可以用居民家庭成員人均收入水平作為分組標志。思考:哪個分組標志更能反映其生活水平的高低?二、數據分組的方法3.根據現象所處的歷史條件或經濟條件來選擇數據分組標志(一)選擇分組標志數據采集對象是隨著時間、地點等條件的變化而變化的。例如,在研究公司發展水平高低時,需要對企業按年產量或年產值進行分組。一般來說,反映公司發展水平高低的標志主要有年產值、年產量、固定資產、年利潤額、資本利潤率等。在生產力水平較低的情況下,用年產值的多少來表示企業規模的大小比較適當;而在技術更新的歷史時期或技術裝備比較先進的情況下,有的企業由于采用了機械化生產,雖然年產值可能很大,但發展水平并不一定很高。因此,年產值已不能準確地說明公司發展水平的高低,這時使用年利潤額或資本利潤率等作為反映公司發展水平的分組標志更為恰當。二、數據分組的方法1.按品質標志分組(屬性差異)(二)數據分組的種類例如,網民按性別、民族、文化程度等標志進行分組。按品質標志分組的結果形成品質數列,如下表為某縣區200家企業類型分組表。二、數據分組的方法2.按數量標志分組(數量差異)(二)數據分組的種類例如,消費者按年齡分組,職工按工資水平分組等。按數量標志分組的過程中,根據變量值取值范圍不同,分組的形式可以分為單項式分組和組距式分組。二、數據分組的方法(二)數據分組的種類單項式分組:即每一組只包含一個變量值,這種分組形式只適用于離散變量,而且只能在離散變量的變動范圍較小、變量值個數較少時使用,如,按某工廠機械加工車間工人日產量劃分工人生產情況(見下表)。單項式分組(要點)

用一個變量值作為一組適合于變量值較少的離散變量二、數據分組的方法工人日產量分組表(二)數據分組的種類二、數據分組的方法(二)數據分組的種類二、數據分組的方法(二)數據分組的種類組距式分組:即在變量值變異幅度較大時,將變量值取值范圍人為地劃分為若干個區間,變量在同一區間內取值的現象歸為一組,區間的距離即稱為組距,如商店按銷售額分組等。組距分組(要點)用變量值的一個區間作為一組適合于連續變量和變量值較多的離散變量二、數據分組的方法(二)數據分組的種類二、數據分組的方法(二)數據分組的種類二、數據分組的方法(三)數據分組體系所謂數據分組體系,就是根據數據采集與處理的要求,通過對同一數據采集對象進行不同分組,形成的系列相互聯系、相互補充的組的整體。數據分組體系有平行分組體系與復合分組體系之分。二、數據分組的方法(三)數據分組體系平行分組:平行分組是選擇兩個或兩個以上的標志對總體進行一次次簡單分組后所形成的體系。在平行分組中,各個分組是并列的,每個分組都是基于一個特定的標志或屬性進行的。這種分組方式適用于當各個分組之間沒有直接的邏輯或層次關系,或者當需要同時考慮多個標志時。二、數據分組的方法(三)數據分組體系復合分組:復合分組是將總體按照一個主要的標志進行初步分組,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論