




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、基于機器學習方法對銷售預測的研究銷售預測現狀與痛點銷售預測現狀與痛點CONTENTS0102 銷售預測四大步驟銷售預測四大步驟03 銷售預測基本方法銷售預測基本方法04 銷售預測效果評估方法與指標銷售預測效果評估方法與指標05 某電商網站銷售預測案例分享某電商網站銷售預測案例分享銷售預測全景圖銷售預測全景圖供貨鏈條供貨鏈條送貨時間、送貨地點、是否包郵等物流物流市場營銷市場營銷促銷方案促銷方案商品減價、商品促銷、組合銷售等生成和采購生成和采購合理安排生成和采購的時間節點,優化庫存庫存庫存財務財務管理管理財務和會計財務和會計實時反饋公司財務報表,監控公司資金流動管理銷售預測的現狀與痛點銷售預測的現
2、狀與痛點銷售預測是完善客戶需求管理、指導運營、以提高企業利潤為最終目的商業問題。而預測的精確性預測的精確性是銷售預測的核心痛點。銷售預測的痛點銷售預測的痛點商業環境因素眾多,變化極快,難以及時把握和分析供應鏈整體水平低,導致貨物積壓嚴重產品定價、商品服務的單一性,導致企業競爭力小變化模式變化模式預測的基本思想預測的基本思想預測是通過歷史數據或其他外部因素構建模型、學習其變化“模式”,利用該“模式”對未來事物進行預測的一個過程。特點特點:短期預測的精度要遠遠高于長期預測。業務理論業務理論數據量數據量假設銷售預測體系框架銷售預測現狀與痛點銷售預測現狀與痛點CONTENTS0102 銷售預測四大步驟
3、銷售預測四大步驟03 銷售預測基本方法銷售預測基本方法04 銷售預測效果評估方法與指標銷售預測效果評估方法與指標05 某電商網站銷售預測案例分享某電商網站銷售預測案例分享收集數據收集數據確定預測對象、預測目標和需求;預測周期:短、中和長期需求與預測精度的權衡準確性與可解釋性的權衡預測目標預測目標收集數據、整理指標體系數據描述與數據探索數據預處理評價指標評價指標算法的選擇模型的訓練與預測過擬合問題的處理建立建模建立建模RMSE、MAPE等定量評價指標AIC、BIC等模型評價指標需求探索開發完善預測的基本步驟預測的基本步驟預測目標預測目標預測對象:預測對象:性質、結構、業務場景等預測時間:預測時間
4、:短期預測、中期預測和長期預測等精確性可解釋性時間數據量少于5天大于4周或1個月短期預測短期預測長期預測中期預測介于兩者之間業務目標:業務目標:準確性和模型可解釋性的匹配度數據探索對數據檢查和理解:比如庫存量為負值、星期數大于8等對結果變量的分析:包括分布、趨勢性、周期性等對預測變量的分析:包括變量篩選、多重共線性、相關性數據預處理中心化和標準化缺失值處理:鄰近插補、多重插補、線性插補等數據轉換:取對數、Box-Cox變換離群點處理數據降維和特征選擇:PCA、AIC/BIC等收集數據或理解數據收集數據或理解數據數據搜集目標數據(內部數據、外部數據)額外數據:天氣、經緯度、節假日、CPI指數等時
5、期變量2015-05-2310.02015-05-2410.02016-05-099.82016-05-109.8時期變量2015-05-23NA2015-05-2410.02016-05-099.82016-05-10NA處理之前處理之后收集數據或理解數據收集數據或理解數據數據預處理的缺失值部分數據預處理的缺失值部分處理缺失值的兩大類方法:(1) 直接刪除缺失的預測變量(2) 利用不同的方法對預測變量的缺失值進行插補,插補方法有:均值插補、多重插補、隨機插補、K近鄰插補、線性插補等。注意:一般對于帶有時間戳的時序變量,考慮到變量的時效性和經濟因素,通常采用鄰近插補法或者線性插補。一個需要進行
6、數據變換的原因是去除分布的偏度。一個無偏分布是大致對稱的分布,這意味著隨機變量落入分布均值兩側的概率大體一致。數據變換一般有兩種方法:(1) 對數據做變換,如取對數、平方根或倒數(2) Box-Cox變換收集數據或理解數據收集數據或理解數據數據預處理的數據變換部分數據預處理的數據變換部分銷售預測現狀與痛點銷售預測現狀與痛點CONTENTS0102 銷售預測四大步驟銷售預測四大步驟03 銷售預測基本方法銷售預測基本方法04 銷售預測效果評估方法與指標銷售預測效果評估方法與指標05 某電商網站銷售預測案例分享某電商網站銷售預測案例分享主觀預測專家法時間序列指數平滑法自回歸移動模型銷售預測的基本方法
7、銷售預測的基本方法機器學習線性回歸決策樹隨機森林xgboost神經網絡支持向量回歸時間銷量銷量時間根據過去經驗經驗專家法專家法專家預測法: 由專家根據他們的經驗和判斷能力對待定產品的未來銷售進行判斷和預測,通常有三種不同的形式:(1)個別專家意見匯集法(2)專家小組法(3)德爾菲法優點: 簡單、快速缺點: 準確率低、受人的主觀影響大指數平滑遵循“重近輕遠”原則,對全部歷史數據采用逐步衰減的不等加權辦法進行數據處理的一種預測方法。基本公式:+1 = + (1 )1其中,是時間的時間值;是平滑常數,其取值范圍為0, 1。優點:簡單、適合趨勢預測、模糊預測缺點: 準確率不高、需要趨勢性較好的數據指數
8、平滑法指數平滑法ARIMA模型是指將非平穩時間序列轉化為平穩時間序列,然后將結果變量做自回歸(AR)和自平移(MA)。自回歸移動模型(自回歸移動模型(ARIMA)訓練集測試集機器學習算法模型參數模型評估特征篩選預測Y值真實Y值YX樣本數據銷售量影響銷售量的因素機器學習的實現流程機器學習的實現流程使用機器學習的有監督學習對進行銷量變化進行建模,依據建模結果來預測未來銷量值。其實現流程如下:(X,Y)(4) 模型選擇,如隨機森林、LASSO等模型輸出x3x4x2x4x1x6x5x3x1x6x5特征篩選特征篩選特征篩選是一類預測變量變換的方法,通過這種方式,能夠用更具有信息量的變量來構建模型,排除無
9、信息量的變量的噪聲干擾,提高模型穩健性。常用的特征篩選方法:(1) 相關性等統計 閾值過濾(2) 信息增益、信息增益率、基尼系數等 閾值過濾(3) 向前、向后和逐步選擇法,如AIC/BIC準則 最小值原理簡介:原理簡介:通過結果變量與預測變量直接建立線性關系數值型回歸優點:優點:模型可解釋性強線性回歸模型:廣義線性模型線性回歸模型:廣義線性模型線性模型隨機分布指數分布、泊松分布等線性回歸 = 0 + 1 1 + 2 2 + + Y為銷量值,X為預測變量,N為預測變量個數,為參數激活函數激活函數:sigmod, log函數等缺點:缺點: 只適用于線性規律邏輯回歸邏輯回歸原理簡介:原理簡介:通過訓
10、練數據,形成if-then規則集合由根節點到葉節點的每一條路徑構成規則對結果變量有主要解釋作用的特征會先分裂形成規則回歸樹用平方誤差最小化準則,節結點為單元內數值的平均值優點:優點: 可擬合非線性規律,計算復雜度較低缺點:缺點:容易出現過擬合決策樹(回歸樹)決策樹(回歸樹)妹紙評分:0,10五官端正五官端正是否身材身材好是否有錢是否有錢是9否53不好7隨機森林隨機森林原理簡介:原理簡介: 是包含多個回歸樹的組合器 輸出的數值是由個別樹輸出的數值的平均而定優點:優點: 準確度高 訓練速度快 容易做出并行算法 可處理大量變量并評估變量重要性缺點:缺點: 在噪聲較大的數據上會有過擬合問題xgboos
11、txgboost + 2 xgboost目標函數去掉常數項:() =112+ ( )找到那顆樹 ,使得目標函數達到最優即可。原理簡介:原理簡介: 是基于傳統的GBDT上做了一些優化的開源工具包,目前有python,R,Java版。優點:優點: 高速準確 可移植,可以自己定義假設函數 可容錯神經網絡神經網絡 = f(X)(非線性映射)原理簡介:原理簡介: 是利用一系列非線性回歸,將預測變量映射到結果變量的一種方法。優點:優點: 準確度高 訓練速度快 并行處理能力強缺點:缺點: 需要大量的參數 不能觀察學習的過程,對結果難以解釋支持向量回歸(支持向量回歸(SVR)原理簡介:原理簡介: 是通過尋求結
12、構化風險最小來提高學習泛化能力,實現經驗風險和置信范圍最小化,從而達到獲得良好統計規律的目的優點:優點: 可以解決小樣本情況下的機器學習問題 可以解決高維、非線性問題缺點:缺點: 對非線性問題沒有通用解決方案,對核函數的選擇非常敏感SVR最本質與SVM類似,都有一個margin,只不過SVM的margin是把兩種類型分開,而SVR的margin是指里面的數據不會對回歸有任何幫助。銷售預測現狀與痛點銷售預測現狀與痛點CONTENTS0102 銷售預測四大步驟銷售預測四大步驟03 銷售預測基本方法銷售預測基本方法04 銷售預測效果評估方法與指標銷售預測效果評估方法與指標05 某電商網站銷售預測案例
13、分享某電商網站銷售預測案例分享模型評估方法:模型評估方法: k 折交叉驗證法折交叉驗證法K折交叉驗證法折交叉驗證法 在k-折交叉驗證中,初試數據被劃分成k個互不相交的子集或“折”,每個折的大小大致相等。訓練和測試k次。在第i次迭代中,第i折用作測試集,其余的子集都用于訓練分類法。 準確率估計是k次迭代正確分類數除以初始數據中的樣本總數。數據S1S2Sk測試集訓練集導出回歸法評估精度模型評估方法:模型評估方法: k 折交叉驗證法折交叉驗證法K折交叉驗證法折交叉驗證法 在k-折交叉驗證中,初試數據被劃分成k個互不相交的子集或“折”,每個折的大小大致相等。訓練和測試k次。在第i次迭代中,第i折用作測
14、試集,其余的子集都用于訓練分類法。 準確率估計是k次迭代正確分類數除以初始數據中的樣本總數。數據S1S2Sk測試集訓練集導出回歸法評估精度模型評估方法:模型評估方法: k 折交叉驗證法折交叉驗證法K折交叉驗證法折交叉驗證法 在k-折交叉驗證中,初試數據被劃分成k個互不相交的子集或“折”,每個折的大小大致相等。訓練和測試k次。在第i次迭代中,第i折用作測試集,其余的子集都用于訓練分類法。 準確率估計是k次迭代正確分類數除以初始數據中的樣本總數。數據S1S2Sk測試集訓練集導出回歸法評估精度=1()=1() = 2 其中,為第i個樣本的真實值,為第i個樣本的預測值,n為樣本量。 有時也用 =2來評
15、估回歸模型的準確率,與RMSE效果相同。模型評估指標:模型評估指標: RMSE(均方根誤差)(均方根誤差)RMSE 與分類模型不同,回歸模型是對連續的因變量進行預測,因此判斷回歸模型的準確率需要考慮的是預測值與真實值之間差異的大小。模型評估指標:模型評估指標: AIC & BICAIC準則是評估統計模型的復雜度和衡量統計模型擬合優度的一種標準: = 2ln + 2 其中L是在相應模型下的最大似然估計值,p是模型的變量個數。 增加變量的數目提高了擬合的優良性,但可能造成過度擬合的情況。AIC鼓勵數據擬合的優良性但是盡量避免出現過度擬合(overfitting)的情況。 AIC值越小,模型
16、越好。AIC準則是尋找可以最好地解釋數據但包含最少自由參數的模型。 BIC準則是依貝葉斯理論提出的一種模型選擇準則。 = 2ln + ln() 其中L是在相應模型下的最大似然估計值,n是樣本量,p是模型的變量個數。 BIC值越小,模型越好。 AIC準則傾向于過擬合,BIC準則傾向于欠擬合,BIC選出的模型相對于AIC的更為精簡。銷售預測現狀與痛點銷售預測現狀與痛點CONTENTS0102 銷售預測四大步驟銷售預測四大步驟03 銷售預測基本方法銷售預測基本方法04 銷售預測效果評估方法與指標銷售預測效果評估方法與指標05 某電商網站銷售預測案例分享某電商網站銷售預測案例分享銷售預測的企業案例分析
17、銷售預測的企業案例分析項目背景某電商平臺主營海外代購業務,由于海外代購物流時間長、發貨時間慢等因素導致 該電商平臺存在大量庫存積壓情況,想通過銷售預測模型改善安排進貨、提高發貨速度以及優化庫存。預測某類銷量排行Top20某單品未來7天的銷量情況預測目標1.收集數據:18個月數據,樣本513,指標722.數據探索:與銷量的變量分析3.數據預處理:缺失值、Box-Cox變換、stepBIC等收集數據時間序列方法機器學習算法應用模型評估指標可視化展示評價指標收集數據:采集影響商品銷量指標維度6維度72指標商品銷量指標體系季節特征(季節特征(1個)個)營銷推廣(營銷推廣(14個)個)商品優惠 商品搶購
18、商品促銷 首頁廣告商品分銷商品換貨商品退款商品退貨商品復購用戶評價商品稅率商品庫存商品銷量商品物流商品產地商品供貨節假日消費等級零售價格交易價格交易稅率用戶行為(用戶行為(21個)個)瀏覽行為 購物車行為咨詢行為 下單行為收藏行為 支付行為321 商品信息(商品信息(10個)個)4價格變化(價格變化(13個)個) 56商品品牌商品質量(商品質量(13個)個)數據探索:節假日與銷量關系節假日變量對銷量的影響明顯節假日變量對銷量的影響明顯數據探索:預測變量之間的多重共線性結論:訂單數、訂單金額和訂單用戶數之間相關性較高!需要過濾多重共線性!結論:訂單數、訂單金額和訂單用戶數之間相關性較高!需要過濾
19、多重共線性!模型效果:真實值與預測值對比圖xgboost和隨機森林的預測效果較佳,線性回歸和和隨機森林的預測效果較佳,線性回歸和ARIMA效果較差效果較差應用模型:應用模型:xgboost紅色點線紅色點線:某商品的真實銷量綠色點線綠色點線: 某商品的預測銷量RMSE(均方根誤差):3.68837算法名稱RMSE性能ARIMA5.32速度較慢,2.5min線性回歸4.28速度快,1min決策樹5.02速度快,1min隨機森林2.85速度快,1minxgboost3.68速度適中,1.5min神經網絡4.99速度快,1min支持向量回歸3.27速度快,1min模型評估:模型評估:RMSE隨機森林:隨機森林:采取的是重抽樣,具有自動選擇重要特征的功能,無需做特征篩選,在一定程度上避免了過擬合 xgboost: kaggle比賽上表現卓越的算法之一,從本質上分析是一個集成的決策樹,但是可以讓弱回歸樹集成成強回歸樹因此,它們可以在本案例中能夠取得的好預測效果而其他算法:而其他算法: 處于數據的局限性或模型的參數未達到最優,會存在一定的過擬合,導致預測效果相對較差算法名稱預處理
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 長沙商貿旅游職業技術學院《思辨與創新》2023-2024學年第一學期期末試卷
- 平頂山學院《英語時文閱讀》2023-2024學年第二學期期末試卷
- 長春理工大學《工業制板實訓》2023-2024學年第二學期期末試卷
- 克拉瑪依職業技術學院《軌道車輛制造修理工藝》2023-2024學年第二學期期末試卷
- 四川師范大學《工程測試技術與信號處理》2023-2024學年第二學期期末試卷
- 西安科技大學《電工電子實訓》2023-2024學年第二學期期末試卷
- 遼寧工業大學《密碼學》2023-2024學年第二學期期末試卷
- 土木勞務分包合同協議
- 商超茶葉采購合同協議
- 商用卡車配件采購合同協議
- 【吉利汽車控股集團成本控制問題及對策11000字(論文)】
- 2022新蘇教版小學科學五年級下冊10《晝夜對植物的影響》課件
- 關于遼寧省電力有限公司收取多回路
- 四川施工組織設計(方案)報審表(共3頁)
- 退休證翻譯模板word
- SimTrade外貿實習平臺快速入門
- 民間非營利組織會計制度.ppt
- 女裝類直播電商腳本及直播話術(明細表)
- 鍍鋅鋼管質量檢驗報告
- 熱管換熱器設計說明書
- 水電站防地震災害應急預案范本
評論
0/150
提交評論