《Python數據分析與挖掘實戰》金融服務機構資金流量預測_第1頁
《Python數據分析與挖掘實戰》金融服務機構資金流量預測_第2頁
《Python數據分析與挖掘實戰》金融服務機構資金流量預測_第3頁
《Python數據分析與挖掘實戰》金融服務機構資金流量預測_第4頁
《Python數據分析與挖掘實戰》金融服務機構資金流量預測_第5頁
已閱讀5頁,還剩13頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

金融服務機構資金流量預測1數據預處理目錄背景與目標2分析與建模3模型評價4企業的資金流量預測的相關背景如下。企業資金流量的預測主要可以從資金流入和資金流出這兩方面進行。企業可以通過一定期間內資金的流入人和流出來推斷出當前企業內部的資金量。企業對于資金流量的預測根據時間長短不同可以分為短期、中期和長期。企業在既保證資金流動性風險最小,又滿足日常業務運轉的情況下,精準地預測資金的流入流出情況變得尤為重要。背景企業所用的數據集的說明如下。數據包含2013年7月1日至2014年8月31日的申購和贖回信息、以及所有的子類目信息。數據經過脫敏處理,脫敏之后的數據,基本保持了原數據分布。數據主要包括用戶操作時間和操作記錄,其中操作記錄包括申購和贖回兩個部分。用戶申購贖回數據如表所示。數據說明屬性含義示例user_id用戶id1234report_date日期20140407tBalance今日余額109004yBalance昨日余額97389用戶申購贖回數據如表所示。數據說明屬性含義示例total_purchase_amt今日總購買量=直接購買+收益21876direct_purchase_amt今日直接購買量21863purchase_bal_amt今日支付寶余額購買量0purchase_bank_amt今日銀行卡購買量21863total_redeem_amt今日總贖回量=消費+轉出10261consume_amt今日消費總量0transfer_amt今日轉出總量10261用戶申購贖回數據如表所示。數據說明屬性含義示例tftobal_amt今日轉出到支付寶余額總量0tftocard_amt今日轉出到銀行卡總量10261share_amt今日收益13category1今日類目1消費總額0category2今日類目2消費總額0category3今日類目3消費總額0Category4今日類目4消費總額0根據資金流入流出數量的預測需求,實現的目標如下。首先對原始數據進行屬性構造,通過繪制時序圖和自相關圖查看數據平穩性。對數據進行篩選,截取平穩部分的數據,通過繪制時序圖和自相關圖查看數據平穩性。根據數據規律進行周期性差分,通過繪制時序圖和自相關圖查看數據平穩性。對數據進行平穩性檢驗和白噪聲檢驗。然后確定模型的階數。再根據確定的階數構建ARIMA模型。然后對ARIMA模型進行白噪聲檢驗。最終對預測值與真實值進行對比,對模型進行評價。目標基于企業希望精確預測資金流入流出數量的需求,本案例的目標如下。首先預測螞蟻金服次月每天的申購與贖回總額。并與真實值進行對比,評價模型的合理性。接著鑒于申購和贖回的預測方式類似,本案例僅展示預測申購總額的過程。最后展示預測申購總額的過程,總體流程如圖所示。目標1數據預處理目錄背景與目標2分析與建模3模型評價4

屬性構造通過案例的目標是預測資金申購量,前期的資金申購量受新用戶人數影響,處于增長狀態,后期的數據由于用戶數量穩定,表現得更加平穩,有規律。然后基于探索結果,決定選取2014年3月至7月的數據作為模型訓練數據,選取2014年8月的數據作為模型測試數據。最后截取數據及繪制時序圖與自相關圖,繪制截取后的訓練數據時序圖和截取數據的自相關圖。截取平穩部分數據首先確定原始數據序列中沒有隨機趨勢或確定趨勢,需要對數據進行平穩性檢驗,否則將會產生“偽回歸”的現象,對2014年3月至7月的資金申購數據進行單位根檢驗(ADF),如下表所示。然后驗證序列中有用的信息是否已被提取完畢,需要對序列進行白噪聲檢驗。通過2014年3月至7月的資金申購數據的白噪聲檢驗的結果如下表所示。平穩性檢驗和白噪聲檢驗差分階數檢驗類型P值結論1ADF檢驗0.001?698原始序列經過1階差分后歸于平穩檢驗類型P值結論檢驗類型白噪聲檢驗2.630?665?58e-07原始序列為非白噪聲序列白噪聲檢驗1數據預處理目錄背景與目標2分析與建模3模型評價4時間序列模型的定階步驟如下。首先建立ARIMA模型之前,需要確定模型的階數,即p、q的值。使用的定階方式有AIC準則定階與BIC準則定階。通過平穩性檢驗和白噪聲檢驗的數據建立ARIMA模型。最后確定模型的階數,在時間序列模型定階段將采用BIC準則進行定階。時間序列模型的定階驗證模型的有效性,對已經構建的ARIMA模型進行殘差檢驗,最后時間序列模型殘差自相關圖如圖所示。模型檢驗1數據預處理目錄背景與目標2分析與建模3模型評價4

模型評價本案例借由螞蟻金服資金流入預測的案例,介紹了時間序列分析法中ARIMA模型在實際案例中的應用過程。首先查看原始數據觀察數據的趨勢規律,根據數據

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論