《統計學-基于Excel》(第 4 版)課件 第2章 數據處理(Excel-4)_第1頁
《統計學-基于Excel》(第 4 版)課件 第2章 數據處理(Excel-4)_第2頁
《統計學-基于Excel》(第 4 版)課件 第2章 數據處理(Excel-4)_第3頁
《統計學-基于Excel》(第 4 版)課件 第2章 數據處理(Excel-4)_第4頁
《統計學-基于Excel》(第 4 版)課件 第2章 數據處理(Excel-4)_第5頁
已閱讀5頁,還剩15頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

賈俊平2025/4/10統計學—基于Excel(第4版)21世紀統計學系列教材課程內容描述統計、推斷統計、其他方法使用軟件Excel學分與課時

2或3學分,1~17周,每周2或3課時課程簡介賈俊平2025/4/102.1數據的預處理2.2生成頻數分布表2.3數值數據類別化第2章數據處理問題與思考在你的生活或工作中接觸過數據嗎?如果接觸過,都是些什么樣的數據?這些數據對你有用嗎?如果將2000個家庭的調查問卷交給你處理,你首先會做什么?如何將500個學生的調查問卷數據匯總在一張表格里?如果按收入的多少將家庭分成低收入、中等收入和高收入,你會怎么做?數據審核就是檢查數據中是否有錯誤對于通過調查取得的原始數據(rawdata),主要從完整性和準確性兩個方面去審核。完整性審核主要是檢查應調查個體是否有遺漏,所有的調查項目是否填寫齊全等。準確性審核主要是檢查數據是否有錯誤,是否存在異常值等對于通過其他渠道取得的二手數據,應著重審核數據的適用性和時效性應弄清楚數據的來源、數據的口徑以及有關的背景材料,以便確定這些數據是否符合自己分析研究的需要,不能盲目生搬硬套還要對數據的時效性進行審核,對于有些時效性較強的問題,如果所取得的數據過于滯后,可能失去了研究的意義

2.1

數據的預處理數據審核與錄入——數據審核數據錄入就是生成電子數據文件用Excel進行數據驗證第1步:用鼠標在工作表中選定錄入數據的單元格區域,如A1:B10單元格區域第2步:選擇【數據】→【數據驗證】第3步:在【驗證條件】的【允許】框內選擇要錄入的數據類型,比如,“整數”(默認為任何值)。在【介于】框內選擇驗證條件,或者在“最小值”和“最大值”框內輸入數據范圍。比如,在【最小值】框內輸入0,在【最大值】框內輸入100。出現的界面如下圖所示第4步:點擊【出錯警告】,在【式樣】下選擇“警告”,在【錯誤信息】下輸入警告信息,比如“NA”。然后點擊【確定】,即可完成設置完成上述設置后,在此區域內錄入不符合驗證條件的數據將會出現以下錯誤信息。比如,在A1單元格錄入1000,顯示的錯誤信息。選擇【是】,忽略此錯誤,選擇【否】則返回單元格,再重新錄入

2.1

數據的預處理數據審核與錄入——數據錄入

2.1

數據的預處理數據排序和篩選——數據排序【例2-1】表2-1是50個學生的學生編號、性別、專業和考試分數數據。按考試分數降序排列第1步:將光標放在數據區域的任意單元格。然后點擊【數據】

【排序】第2步:在【主要關鍵字】框中選擇要排序的變量,本例為“考試分數”,在【次序】中選擇降序(默認為升序),然后點擊【確定】(如果要專業排序,點擊【選項】,在【方法】下選中“字母排序”或“筆劃排序”)

2.1

數據的預處理學生編號性別專業考試分數學生編號性別專業考試分數1男會計學8226男管理學782男金融學8127女金融學893女會計學7528男會計學794女管理學8629女金融學845男會計學7730女會計學986女金融學9731女會計學797男管理學7732女金融學768女會計學9233男會計學799女金融學7134男會計學5610男會計學8535女會計學8811女金融學8036女會計學8612男金融學5537男管理學7913男管理學8138男管理學8514男會計學7839男管理學7315男會計學5140女會計學7916女金融學7941男金融學8217男會計學6342男管理學8218男管理學8943男管理學7419女管理學7144女金融學8320男金融學8245女金融學7421男管理學9146女管理學8622男金融學9047男管理學7523女管理學7848男會計學7024男金融學7449女會計學7325男金融學6650女會計學80數據排序和篩選——數據排序——例題分析數據篩選(datafilter)是根據需要找出符合特定條件的某類數據

2.1

數據的預處理用Excel進行數據篩選的過程【例2-2】篩選出考試分數大于等于90的學生第1步:將光標放在數據區域的任意單元格。然后點擊【數據】

【篩選】。這時繪在每個變量名中出現下拉箭頭第2步:點擊要篩選的變量的下拉箭頭即可對該變量進行篩選。比如,要篩選出考試分數大于等于90的學生,點擊考試分數變量的下拉箭頭第3步:點擊“大于或等于”,并在后面的框內輸入90。點擊【確定】數據排序和篩選——數據篩選——例題分析

2.1

數據的預處理【例2-2】篩選出會計學專業考試分數小于60男生—使用【高級篩選】命令第1步:在工作表的上方插入3個空行,將數據表的第一行(變量名)復制到第1個空行;在第2個空行的相應變量名下依次輸入篩選的條件第2步:選擇【數據】→【高級】。在列表區域輸入要篩選的數據區域;在條件區域輸入條件區域單擊【確定】數據排序和篩選——數據排序——例題分析數據抽樣(datasampling)是從一個已知的總體數據集中抽取隨機樣本。在實際應用中,可以使用不同統計軟件抽取一個簡單隨機樣本。下面通過一個例子說明用Excel的【數據分析】工具抽取隨機樣本的過程

2.1

數據的預處理用Excel進行數據篩選的過程【例2-3】沿用例2-1。隨機抽取10個不同專業的學生組成一個樣本第1步:在工作表中點擊【數據】

【數據分析】。第2步:在彈出的對話框中選擇【抽樣】。單擊【確定】。第3步:在出現的對話框【輸入區域】中輸入要抽取一般的數據區域(本例中為學生代碼所在的區域);在【抽樣方法】中單擊【隨機】;在【樣本數】中輸入需要抽樣的樣本量(本例為20);在【輸出區域】中選擇抽樣結果放置的區域。單擊【確定】學生編號性別專業考試分數26男管理學7815男會計學5116女金融學7911女金融學8037男管理學7925男金融學6649女會計學736女金融學9740女會計學7938男管理學85數據抽樣——例題分析產生正態分布隨機數第1步:將光標放在任意空白單元格。然后點擊【數據】

【數據分析】第2步:在彈出的對話框中選擇【隨機數發生器】,單擊【確定】第3步:在【變量個數】中如要產生隨機變量的個數;在【隨機數個數】框中輸入要產生隨機數的個數;在【分布】框中選擇要產生隨機數的分布;在【標準偏差】框內輸入正態分布的標準差(默認為1);在【輸出選項】下選擇輸出隨機數的放置位置(默認為新作表組。單擊【確定】,即可產生隨機數產生均勻分布隨機數在【變量個數】中輸入要產生隨機變量的個數;在【隨機數個數】框中輸入個數數字;在【分布】框中選擇“均勻”;在【參數】下的【介于】框后輸入1和100(默認是0~1);在【輸出選項】下選擇輸出隨機數的放置位置(默認為新作表組);單擊【確定】

2.1

生成隨機數生成隨機數頻數(frequency)落在某一特定類別(或組)中的數據個數頻數分布(frequencydistribution)把各個類別及落在其中的相應頻數全部列出,并用表格形式表現出來由于類別數據本身就是用文字表達的類別,因此,只要先把所有的類別都列出來,然后計算出每一類別的頻數,即可生成一張頻數分布表頻數分布表中落在某一特定類別的數據個數就是頻數根據觀察變量的多少,可以生成簡單頻數表、二維列聯表和多維列聯表等簡單的頻數表也稱為一維列聯表只涉及一個分類變量時,這個變量的各類別(取值)可以放在頻數分布表中“行”的位置,也可以放在“列”的位置,將該變量的各類別及其相應的頻數列出來

2.2

生成頻數分布表類別數據的頻數分布表——簡單頻數表【例2.5】沿用例2-1。分別制作學生性別和專業的簡單頻數表用Excel生成頻數分布表的步驟第1步:選擇【插入】→【數據透視表】第2步:在【表/區域】框內選定數據區域(在操作前將光標放在任意數據單元格內,系統會自動選定數據區域)。選擇放置數據透視表的位置。系統默認是新工作表,如果要將透視表放在現有工作表中,選擇【現有工作表】,并在【位置】框內點擊工作表的任意單元格(不要覆蓋數據)。點擊【確定】第3步:用鼠標右鍵單擊數據透視表,選擇【數據透視表選項】,在彈出的對話框中點擊【顯示】,并選中【經典數據透視表布局】,然后【確定】第4步:將數據透視的一個字段拖至“行”位置,將“另一個字段”拖至“列”的位置(行列可以互換),再將要計數的變量拖至“值字段”位置,即可生成需要的頻數分布表

2.2

生成頻數分布表類別數據的頻數分布表——簡單頻數表——例題分析二維列聯表(contingencytable)也稱為交叉表(crosstable)涉及兩個分類變量時,通常將一個變量的各類別放在“行”的位置,另一個變量的各類別放在“列”的位置(行和列可以互換)生成頻數分布表,這樣表格就是列聯表【例2-5】例如沿用例2-1。將性別放在行的位置、專專業放在列的位置,制作一個二維列聯表

2.2

生成頻數分布表類別數據的頻數分布表——二維列聯表——例題分析頻數表的分析統計量可以使用比例(proportion)、百分比(percentage)、比率(ratio)等統計量進行描述。如果是有序類別數據,還可以計算累積百分比(CumulativePercent)進行分析比例也稱構成比,它是一個樣本(或總體)中各類別的頻數與全部頻數之比,通常用于反映樣本(或總體)的構成或結構。將比例乘以100得到的數值稱為百分比,用%表示。比率是樣本(或總體)中各不同類別頻數之間的比值,反映各類別之間的比較關系。由于比率不是部分與整體之間的對比關系,因而比值可能大于1。累積頻數是將各有序類別的頻數逐級累加的結果(注意:對于無序類別的頻數計算累積頻數沒有意義),累積百分比則是將各有序類別的百分比逐級累加的結果表2-7頻數表的分析

2.2

生成頻數分布表專業人數(人)百分比(%)累積人數(人)累積百分比(%)管理學1530.01530.0會計學1938.03468.0金融學1632.050100.0合計50100.0——類別數據的頻數分布表——頻數表的簡單分析——例題分析

2.3

數值數據類別化數據分組生成數值數據的頻數分布表時,需要先將其類別化,即轉化為類別數據,然后再生成頻數分布表。類別化的方法是將原始數據分成不同的組別數據分組是將數值數據轉化成類別數據的方法之一,它是先將數據按照一定的間距劃分成若干個區間,然后再統計出每個區間的頻數,生成頻數分布表【例2-6】

某電商平臺連續120天的銷售額數據如表所示。對銷售額做適當分組,分析銷售額的分布特征

2.3

數值數據類別化282207235193210227220215201196191246182205232263215227234248235208262206211216222247214226209206197249234258228227234244198209226206212191227228198209250210253208203217224213235245201182256218213182216229232230214244217209271217225217219248202171253262213226275232236206222264177210228215225228238243204181213248245219243236239216251213234210218220226

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論