




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
商務(wù)數(shù)據(jù)處理CONTENTS目錄01數(shù)據(jù)清洗02數(shù)據(jù)轉(zhuǎn)換03數(shù)據(jù)合并01數(shù)據(jù)清洗數(shù)據(jù)重復(fù)分為實體重復(fù)和字段重復(fù)。查找重復(fù)數(shù)據(jù)的方法有:條件格式法,通過標記顏色快速定位;數(shù)據(jù)透視表法,利用頻次統(tǒng)計發(fā)現(xiàn)重復(fù);高級篩選法,直接篩選不重復(fù)記錄;函數(shù)法,使用COUNTIF函數(shù)精確計算重復(fù)次數(shù)。例如,使用條件格式法可將重復(fù)編號標記為紅色,方便識別。查找重復(fù)數(shù)據(jù)的方法查找重復(fù)數(shù)據(jù)后,保留唯一數(shù)據(jù)記錄,刪除其他重復(fù)數(shù)據(jù)。可通過篩選或直接刪除重復(fù)行實現(xiàn)。例如,通過數(shù)據(jù)透視表統(tǒng)計頻次后,刪除頻次大于1的記錄。刪除重復(fù)數(shù)據(jù)在刪除重復(fù)數(shù)據(jù)時,需確保保留能顯示特征的唯一數(shù)據(jù)記錄,避免丟失重要信息。例如,對于商品信息,保留唯一商品編號對應(yīng)的數(shù)據(jù)。保留唯一數(shù)據(jù)處理重復(fù)數(shù)據(jù)找到缺失數(shù)據(jù)缺失數(shù)據(jù)包括記錄缺失和字段信息缺失。可通過“查找和選擇”功能定位空值。例如,使用“查找和選擇”中的“定位條件”選擇“空值”,快速找到缺失數(shù)據(jù)。刪除或插補缺失數(shù)據(jù)缺失數(shù)據(jù)處理方法有:刪除記錄、刪除缺失值、缺失數(shù)據(jù)插補。插補方法包括均值插補、同類均值插補、極大似然估計、多重插補等。例如,對于定距型數(shù)據(jù),可使用均值插補填補缺失值。選擇合適的處理方法根據(jù)數(shù)據(jù)類型和分析需求選擇合適的處理方法。對于關(guān)鍵字段缺失,可考慮插補;對于非關(guān)鍵字段,可刪除記錄。例如,對于客戶年齡字段缺失,可使用均值插補。處理缺失數(shù)據(jù)常用方法有:箱盒圖、描述分析、散點圖。箱盒圖通過最小估計值和最大估計值判斷異常值;描述分析查看極端值;散點圖直觀顯示離群點。例如,通過箱盒圖可直觀發(fā)現(xiàn)數(shù)據(jù)中的異常值。鑒別異常值分析異常值產(chǎn)生的原因,判斷是“偽異常”還是“真異常”。對于“偽異常”,需結(jié)合業(yè)務(wù)背景理解其合理性。例如,某商品銷量突然增加,需結(jié)合促銷活動判斷是否為異常。分析異常值原因處理方法包括:刪除異常值、不處理、視為缺失值、降低異常值權(quán)重。選擇方法需考慮數(shù)據(jù)量和分析需求。例如,對于少量異常值,可直接刪除;對于大量異常值,可視為缺失值處理。處理異常值處理異常值01使用函數(shù)檢測邏輯錯誤,如COUNTIF、IF、OR函數(shù)。COUNTIF函數(shù)統(tǒng)計選項數(shù);IF函數(shù)標記錯誤記錄;OR函數(shù)檢驗條件。例如,使用IF函數(shù)標記選項數(shù)大于3的記錄為“錯誤”。檢測邏輯錯誤修正后需驗證結(jié)果是否符合邏輯和業(yè)務(wù)規(guī)則。可通過再次檢測或人工審核驗證。例如,修正后使用OR函數(shù)再次檢驗,確保無邏輯錯誤。驗證修正結(jié)果02修正邏輯錯誤需結(jié)合業(yè)務(wù)規(guī)則和數(shù)據(jù)背景。對于明顯錯誤的數(shù)據(jù),可直接修正;對于復(fù)雜錯誤,需進一步調(diào)查。例如,對于客戶年齡錯誤,需結(jié)合出生年份修正。修正邏輯錯誤03處理邏輯錯誤值數(shù)據(jù)格式問題包括時間、日期、數(shù)值、半全角等格式不一致。可通過設(shè)置單元格格式或分列功能統(tǒng)一格式。例如,將百分比格式統(tǒng)一為小數(shù)格式。字段中可能包含多余字符,如單位、空格等。可通過替換操作去除多余字符。例如,去除身高字段中的“cm”字符。根據(jù)分析需求調(diào)整數(shù)據(jù)格式,如提取身份證中的出生年月。可使用MID、LEFT、RIGHT等函數(shù)提取數(shù)據(jù)。例如,使用MID函數(shù)提取身份證中的出生年月。010203統(tǒng)一數(shù)據(jù)格式調(diào)整數(shù)據(jù)格式去除多余字符數(shù)據(jù)格式清洗02數(shù)據(jù)轉(zhuǎn)換行列轉(zhuǎn)換可通過“選擇性粘貼”中的“轉(zhuǎn)置”選項實現(xiàn)。適用于從不同維度觀察數(shù)據(jù)。例如,將時間維度數(shù)據(jù)轉(zhuǎn)置為地區(qū)維度數(shù)據(jù)。數(shù)據(jù)轉(zhuǎn)置對于多維度數(shù)據(jù),可通過多次轉(zhuǎn)置或使用數(shù)據(jù)透視表實現(xiàn)多維度轉(zhuǎn)換。例如,將時間、地區(qū)、產(chǎn)品維度數(shù)據(jù)轉(zhuǎn)換為不同組合形式。多維度數(shù)據(jù)轉(zhuǎn)換轉(zhuǎn)置后需調(diào)整數(shù)據(jù)格式和標題,確保數(shù)據(jù)清晰易讀。例如,調(diào)整轉(zhuǎn)置后的日期格式和列標題。轉(zhuǎn)置后的數(shù)據(jù)調(diào)整行列轉(zhuǎn)換數(shù)值轉(zhuǎn)字符可通過“分列”功能實現(xiàn)。適用于長數(shù)字或科學(xué)記數(shù)法數(shù)據(jù)。例如,將手機號碼轉(zhuǎn)換為文本格式。數(shù)值轉(zhuǎn)字符字符轉(zhuǎn)數(shù)字可通過“分列”功能或直接轉(zhuǎn)換實現(xiàn)。適用于文本格式的數(shù)字數(shù)據(jù)。例如,將文本格式的銷售額轉(zhuǎn)換為數(shù)字格式。字符轉(zhuǎn)數(shù)字文本日期轉(zhuǎn)標準日期可通過“分列”功能或日期函數(shù)實現(xiàn)。適用于非標準日期格式數(shù)據(jù)。例如,將“YYYYMMDD”格式日期轉(zhuǎn)換為標準日期格式。文本日期轉(zhuǎn)標準日期類型轉(zhuǎn)換添加排序條件數(shù)據(jù)排序可通過“排序”功能實現(xiàn)。可添加多個排序條件,如按訪客數(shù)降序、下單買家數(shù)升序。例如,將數(shù)據(jù)按訪客數(shù)降序排列,再按下單買家數(shù)升序排列。自定義排序次序多字段排序自定義排序可通過“自定義序列”實現(xiàn)。適用于特定順序的數(shù)據(jù)排序。例如,按流量來源的自定義順序排序。多字段排序可通過添加多個排序條件實現(xiàn)。適用于復(fù)雜數(shù)據(jù)排序需求。例如,按地區(qū)、產(chǎn)品、時間等多個字段排序。數(shù)據(jù)排序常規(guī)計算包括加、減、乘、除運算,以及使用函數(shù)計算統(tǒng)計指標,如AVERAGE、SUM等。例如,計算成交轉(zhuǎn)化率(成交客戶數(shù)/訪客數(shù))。常規(guī)計算日期時間計算包括日期加減、日期函數(shù)計算等。常用函數(shù)有YEAR、MONTH、TODAY等。例如,計算用戶購買間隔時長(最近下單時間-首次下單時間)。日期時間計算復(fù)雜計算可通過組合函數(shù)實現(xiàn)。適用于復(fù)雜數(shù)據(jù)處理需求。例如,計算商品上架天數(shù)(當前日期-上架日期)。復(fù)雜計算數(shù)據(jù)計算字段匹配可通過VLOOKUP函數(shù)實現(xiàn)。適用于關(guān)聯(lián)數(shù)據(jù)表的字段匹配。例如,將“基本信息”表與“考核得分”表匹配,獲取員工考核得分。字段匹配步驟包括:確定關(guān)聯(lián)字段、選擇匹配函數(shù)、設(shè)置參數(shù)、復(fù)制公式。例如,使用VLOOKUP函數(shù)時,需設(shè)置lookup_value、table_array、col_index_num、range_lookup參數(shù)。多表匹配可通過多次使用VLOOKUP函數(shù)或使用其他匹配函數(shù)實現(xiàn)。適用于多個數(shù)據(jù)表的字段匹配。例如,將多個數(shù)據(jù)表的字段進行匹配,獲取完整數(shù)據(jù)。VLOOKUP函數(shù)字段匹配步驟多表匹配字段匹配03數(shù)據(jù)合并使用CONCATENATE函數(shù)字段合并也可通過CONCATENATE函數(shù)實現(xiàn)。適用于復(fù)雜字段合并。例如,使用CONCATENATE函數(shù)將多個字段合并為一段文本。使用“&”運算符字段合并可通過“&”運算符實現(xiàn)。適用于簡單字段合并。例如,將工號和姓名字段合并為“xx的工號是xx”。合并后的數(shù)據(jù)調(diào)整合并后需調(diào)整數(shù)據(jù)格式和內(nèi)容,確保數(shù)據(jù)清晰易讀。例如,調(diào)整合并后的字段格式和內(nèi)容。字段合并剪貼板復(fù)制粘貼工作表合并可通過剪貼板復(fù)制粘貼實現(xiàn)。適用于數(shù)據(jù)量較少的情況。例如,將多個工作表的數(shù)據(jù)復(fù)制到一個工作表中。VBA法工作表合并可通過VBA代碼實現(xiàn)。適用于數(shù)據(jù)量較多的情況。例如,使用VBA代碼批量合并多個工作表的數(shù)據(jù)。PowerQuery法工作表合并也可通過Power
Query實現(xiàn)。適用于Excel2016及以上版本。例如,使用Power
Query批量合并多個工作表的數(shù)據(jù)。工作表合并PowerQuery法工作簿合并可通過Power
Query實現(xiàn)。適用于多個工作簿文件的數(shù)據(jù)合并。例如,使用Power
Query批量合并多個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 留學(xué)服務(wù)與合作協(xié)議合同書
- 貨物運輸合作協(xié)議
- 度化工礦產(chǎn)購銷合同
- 公司股權(quán)回購合同樣本
- 無菌灌腸操作教學(xué)
- 物業(yè)管理勞動合同模板
- 煤炭購銷合同樣本
- 中級制圖員模擬題(附參考答案)
- 辦公設(shè)備租賃服務(wù)合同
- 度木材供應(yīng)合同范本
- 2025年貴州省遵義市中考一模英語試題(含筆試答案無聽力原文及音頻)
- 教育學(xué)基礎(chǔ)復(fù)習(xí)題庫
- 建筑節(jié)能新路徑:嚴寒地區(qū)老舊建筑改造
- 2024年廣州農(nóng)村商業(yè)銀行招聘筆試真題
- 2024年寧波樞智交通科技有限公司招聘考試真題
- 數(shù)學(xué)丨湖北省八市2025屆高三下學(xué)期3月聯(lián)考數(shù)學(xué)試卷及答案
- 第五課+弘揚勞動精神、勞模精神、工匠精神【中職專用】中職思想政治《職業(yè)道德與法治》高效課堂(高教版2023·基礎(chǔ)模塊)
- 旅游景區(qū)旅游安全風險評估報告
- 湖北省武漢市部分重點中學(xué)(六校)2023-2024學(xué)年高二下學(xué)期期中生物試題
- 復(fù)方地蒽酚軟膏(克顯龍)蒽林軟膏說明書副作用不良反應(yīng)高低濃度的使用方法
- 04_微生物農(nóng)藥
評論
0/150
提交評論