基于大數據分析的實時風控體系解決方案(風控大數據)課件_第1頁
基于大數據分析的實時風控體系解決方案(風控大數據)課件_第2頁
基于大數據分析的實時風控體系解決方案(風控大數據)課件_第3頁
基于大數據分析的實時風控體系解決方案(風控大數據)課件_第4頁
基于大數據分析的實時風控體系解決方案(風控大數據)課件_第5頁
已閱讀5頁,還剩36頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于大數據的風控系統解決方案ontents1234我們的挑戰Aegis系統架構核心模塊介紹風控模型和策略我們的挑戰1Part業務類型和數據量增長需要更加自動化和智能化用好設備和行為數據跨海外網絡的數據延遲面臨的業務風險信用風險惡意逾期、騙貸、虛假身份、中介代辦、跨平臺借貸賬戶風險惡意注冊、賬戶盜用、拖庫撞庫、暴力破解、賬戶攻擊 交易風險盜卡盜刷、刷單、套現、虛假交易、洗錢風險我們的挑戰1Part風控面臨的挑戰風控挑戰市場變化快業務種類多響應速度快市場終端平臺多系統環境復雜網絡環境復雜環境風險防控戰線長防控節點多模型頻繁調整規則復雜防控風險特征多變欺詐手段多變技術手段多樣性風險我們的挑戰1Par

2、t大數據驅動風控體系模型四大模型系統風控大腦數據用戶信息、行為數據、事件數據安全客戶端安全鏈路安全服務端安全Aegis運行框架2Part風控系統架構風險決策平臺規則決策模型決策實時決策引擎實時計算指標中心流計算圖計算機器學習訓練準實時策略訓練場監控平臺數據統計分析平臺數據報告平臺風險數據洞察風險運營平臺安全設備指紋設備識別設備證書虛擬機識別代理檢測運營審核平臺案件處理平臺統一搜索平臺準實時訓練數據大盤運營安全檢測風控大數據平臺數據倉庫平臺ETL平臺批處理計算平臺機器學習平臺數據爬蟲BI平臺Aegis運行框架2Part2PartAegis運行框架四大模型-司南“司南”風險控制模型體系,囊括了申請

3、評分模型、欺詐評分模型、套現識別模型、交易監測模型、催收評分模型等十幾個模型,每一個模型都還將持續進行優化和迭代,幫助識別和管理金融業務的風險; 申請評分模型套現識別模型欺詐評分模型風險控制模型虛擬交易識別模型催收評分模型風險控制模型體系風險行為識別用戶行為風控決策首頁瀏覽商品評論搜索比對購物車登錄下單支付首頁搜索購物車登錄下單支付修改密碼實時收集點擊流實時計算風控指標實時風控模型決策異常行為日處理點擊流50TB數千個指標毫秒計算幾百個模型毫秒級決策手機號正常行為四大模型-火藥“火藥”量化運營模型體系,從價格敏感度、用戶活躍度、消費購買力到信貸需求潛力等多個方面,構成了最具爆發力的運營推廣、收

4、益定價等核心競爭力; 敏感度模型價格模型活躍度模型購買力模型風險定價地址模型地址模型用戶收貨地址企業政府銀行企業排名企業資產企業市值員工收入水平別墅高檔社區普通小區房價區間租金區間規模區間全國住宅地址價值庫全國企事業單位地址價值庫用戶地址風險定價系數四大模型-活字“活字”用戶洞察模型體系,通過這套體系可以實現識別、發掘、認識用戶,從個人資產評估、身份特征畫像、履約歷史的評估、用戶行為偏好甚至用戶關系網絡的構建,支撐起對用戶的畫像和社交關系構建,幫助提升精準識別、社群管理等用戶運營效率。 行為偏好履約歷史評估關系網絡社交關系身份特征畫像資產評估用戶身份特征畫像朋友家人親戚攝影愛好者有車一族單身白

5、領日常購買商品日常瀏覽記錄收貨地址收貨人信息購買商品評論四大模型-造紙“造紙”大數據征信模型體系,XX也透露了其打造信用評分產品“白熱度”,依托大數據征信,目前已經完成了超過一億的用戶評分,未來白熱度將從身份特征畫像、個人用戶評估、履約歷史評價、關系網絡評估、網絡行為偏好及信用風險預測六個維度刻畫用戶,為用戶進行風險評估時提供 更多有價值的參考,也增強了風險管理模式的有效性和可控性。 白熱度履約歷史評價關系網絡網絡行為偏好信用風險預測身份特征畫像個人用戶評估2PartAegis系統架構圖業務數據倉庫風控引擎審核中心案件中心外部客戶數據合作伙伴數據社交數據外部賬戶數據數據貼源層實時數據流ETL基

6、礎數據采集外部數據采集數據采集層數據計算層實時數據計算平臺離線數據集市元數據中心數據健康度管理數據使用層規則引擎 決策模型 變量工場運營平臺數據產品數據質量/數據監控/數據建模/數據優化/數據調度服務能力千臺集群P級存儲上萬變量99.9%穩定性Aegis2Part數據采集框架Aegis 筆支付請求的背后黑白名單數據預處理 / 變量衍生 1000-2000個執行規則 400條+執行模型 5-10個結果計算及后處理實時異步 Aegis性能和穩定性日億級交易處理能力支付風控平均處理時長小于150ms,99.9%線600ms支持DR災備,數據分級存儲,724H監控&預警通用性強:支持支付風控、業務風控

7、、外部合作伙伴風控支持Aegis核心服務和模塊3Part規則引擎 模型執行器 變量服務設備指紋實時流量用戶畫像行為分析$Aegis規則引擎Rule Engine規則分布式并行執行支持按業務分組支持動態調整分組和 擴容基于Java,高吞吐量、 低延遲使用gRPC互聯Aegis模型執行引擎特性:使用Java完全自主實現的dot模型執行器,執行耗時只有Python版本的10%擁有完善的模型運行監控和熔斷機制PythonJPMML自主研發特點標準、開源, 兼容性好標準、開源, 兼容性好。使用Java解析并執行.dot模型文件, 支持隨即森林和邏輯回歸算法,算 法可擴展性能10-100ms,因需要獨立部

8、署,有網絡 開銷性能和Python執行.dot接 近,只是可以嵌入式運 行,所以穩定性比Python高0-10ms,嵌入式執行,性能高,穩定性高Aegis審核自動提示Aegis實時流量服務Counter日查詢量超100億次支持分鐘、小時、日、月等 多級精度,支持動態配置支持3個月以上的超大時間 窗口流量數據實時推送,1秒級 延遲適用于限額限次、Velocity 變量和Ratio變量的實時計算Aegis設備指紋Aegis實時用戶行為分析Aegis交易關聯排查訂單/交 易賬號設備卡人數據用于規則、模型、 和人工案件排查基于HBase自主實現的Graph存儲,50億+交易 數據,1秒級返回關聯 結果

9、Graph基于交易、人、設備、卡、賬號等多個維度的 大數據關聯分析,確定 關聯交易。Aegis交易關聯排查模型規則風控模型和策略4PartOR模型規則化規則模型化Big Data姓名 國籍酒店機票設備 指紋郵箱 異常批量 注冊設備 指紋聲紋識 別Machine LearningDeep Learning風控模型和策略4PartXma n賬戶位置電話電子郵箱IP支付賬戶卡信息衍生方法刻畫pattern基礎衍生高金額、快速起飛/入住等沖突變量信息不一致,例如發卡國和Ip國Recency賬戶年齡,最近一次交易velocity(單、雙主體)頻繁交易換卡等過濾條件velocity頻繁高危行為ratio高

10、危行為占比,短期交易集中個體異常個體行為發生變化/異常群體異常行為相對于同地域人群異常躲閃行為行為有躲避風控規則的嫌疑跳躍行為小額試卡的行為risktable歷史案件信息的利用多維度關聯刻畫用戶行 為設備指紋風控模型和策略海量交易數據信號衍生下單和起飛時間之間的天數手機和ID與ADcity是否沖突保費,訂單金額單人游常旅客卡訂單金額往返航班家庭游航班類型國內國外游好友游持卡人非出行人是否同省情侶游20.1%3%2.2%11.2%5.0%56.9%國內因公單人游家庭游風控模型和策略特征工程文本處理文本分詞去字尾詞性標注過濾N元組語義 分析NL P / 文本分析技術詞匯庫開發詞/詞組庫,并關聯到

11、相關主題和目標考慮同義/下位詞使用:對特定目標識別問題焦 點為模型特征工程做預備實體識別識別特殊實體類別,如人 名,地點,時間,問題類別, 關鍵名詞使用:識別特定種類實體對特定實體對相關詞組分組基于文本模型統計分析對特定目標字詞的相關性根據標簽的可用性應用業 界最新的無監督或有監督 算法使用: 模型特征庫萃取語音識別聲波數據預處理音頻采樣分解頻帶傅立葉變換創建識別碼RNN識別音頻片段字符文本數據對深度學習發音預測矯正:風控模型和策略文本信號挖掘建 模 數 據數據去重train data提取特征值測 試 數 據數據去重提取特征值變量注釋變量名26個字母+10個數字+特殊字符頻率 freq_域名欺

12、詐率名字模式欺詐率正常名字模式生成可能概率 名字復雜度名字長度生成概率(數字轉移數字概率不為 1)domain_degree name_degree name_probability num_change lengthprob_prefix_num_no_1生成概率(數字轉移數字概率為1)prob_prefix_num_1生成概率(只有字母)prob_prefix_alp原 始 數 據原 始 數 據風控模型和策略字母生成概率數據管理和集成信號偵測& 預測分析應用變量衍生和特征 工程深度學習及機器 學習算法處理非 結構化數據項目狀態傳統數據庫+NoSQL保證ETL速度使用攜程獨創Ageis系統高

13、效獲取和存儲建模所 需數據多重數據倉庫集 成密切監測模型運 行情況支持快速開發定 制特定算法線上自適應調整 模型參數快速部署支持數 億交易量的業務自動生成各產線 模型報警實時/離線模型表 現業務監控報表實時查看模型變 量和模型評分分 布項目狀態項目狀態項目狀態項目狀態初始中間完工評估基本原理風控模型和策略模型工廠數據源獲取平臺加工生產系統數據倉庫ETL其它數據源模型部署模型監控模型調整衍生變量抽樣建模數據奇異值分析分箱變形轉換稀疏格式轉換模型訓練模型評估模 型 開 發數據準備數 據 集 成模型優化風控模型和策略模型生命周期欺詐特征Velocity E.g. 2 連續交 易發生在很多時間內Dis

14、tance to home E.g 持卡人地理位置和常 用地址距離很大CompromiseDistributedHomeTransTransaction time E.g. 發生在臨晨的交易欺 詐率高Etc模型 & 評分利用傳統模型方法如邏輯回歸,神經網絡,矩陣 因子分解,K最近鄰法等 Matrix Factorization Random Forest KNNHigh RiskLow Risk風控模型和策略基于統計分析&機器學習的欺詐策略欺詐交易識別分二步: 1. 欺詐特征生成;2. 機器學習模式識別風險 識別卡交 易位 置關 系自學習規則部署將貝葉斯模型部署攜程云平臺,根 據欺詐形勢自動更

15、新相關特征變量, 第一時間對欺詐進行攔截。根據采集的用戶擊鍵時間間隔序列 通過序列統計方式分析此擊鍵行為 是否來自此賬戶真實用戶。按照AHP層次分析法依據專家經驗 對不同策略分群,從而優化規則執 行路徑,提供運行效率。用戶行為分析重點案件防御應用專家經驗重點案件得到有效控制機票酒 店酒 店火車票機票針對高發案件,通過多層次關聯分 析,提煉特征,預防案件變種,使火車票火 車 票機 票風控模型和策略AI反欺詐策略-內卡規則智能策略的自我學習以及 效果迭代,策略的異 常自我熔斷,能夠智 能地進行自我管理聚類將規則進行策略集聚合, 有效地降低了系統耗時以 及規則管理成本總體策略耗時200ms穩定實時的監控和報警系統, 確保策略系統的健

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論