




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、攜程風(fēng)控實時大數(shù)據(jù)處理平臺攜程風(fēng)控1風(fēng)控需要哪些數(shù)據(jù)2風(fēng)控處理數(shù)據(jù)中的挑戰(zhàn)3聊聊風(fēng)控的3個核心服務(wù)攜程風(fēng)控只要和旅游相關(guān)的,攜程都做。機(jī)票酒店旅游火車票汽車票門票用車團(tuán)購郵輪禮品卡攜程風(fēng)控風(fēng)險類型支付風(fēng)險外卡風(fēng)險內(nèi)卡風(fēng)險賬戶風(fēng)險賬戶盜用業(yè)務(wù)風(fēng)險負(fù)利潤刷單資源占用惡意騙賠信息安全物理安全網(wǎng)絡(luò)安全數(shù)據(jù)安全攜程風(fēng)控訂 單 數(shù) 據(jù)數(shù) 據(jù) 預(yù) 處 理-變 量 及 衍 生 變 量黑 白 名 單 校 驗策略校驗嘗 試 行 為個 體 異 常群 體 異 常額 度 限 制流量計算信息匹配規(guī)則集規(guī)則校驗系統(tǒng)攜程風(fēng)控我們的挑戰(zhàn):規(guī)則復(fù)雜:規(guī)則執(zhí)行需要依賴非常多的外部數(shù)據(jù)、以及大量的實時統(tǒng)計數(shù)據(jù);數(shù)據(jù)復(fù)雜/分散:接入全
2、站各個業(yè)務(wù)線的訂單數(shù)據(jù)、支付數(shù)據(jù)、狀態(tài)變更事件、登錄/ 注冊事件、操作日志、營銷活動、用戶行為數(shù)據(jù)等,且數(shù)據(jù)量大;數(shù)據(jù)之間需要共享;以實時風(fēng)控為主,有極高的響應(yīng)要求;數(shù)據(jù)流訂單數(shù)據(jù)支付數(shù)據(jù)用戶日志狀態(tài)數(shù)據(jù)風(fēng)控接入層數(shù)據(jù)預(yù)處理&變量計算返回風(fēng)控結(jié)果推送至Kafka執(zhí)行實時規(guī)則和模型執(zhí)行觀察規(guī)則執(zhí)行復(fù)雜模型推送至工作流推送至Kafka風(fēng)險事件存儲分發(fā)至Hive實時流量統(tǒng)計風(fēng)險畫像計算Session分析設(shè)備ID計算設(shè)備指紋數(shù)據(jù)采集離線分析推送至Redis和HBase集群1.5億/日30億/日UBT數(shù)據(jù)接入Risk Graph分析其他數(shù)據(jù)監(jiān)控和TraceLog實時流量統(tǒng)計一些例子:一個uid,24小時
3、(精確到分鐘級)內(nèi)的訂單數(shù)量(根據(jù)訂單號去重、包含 當(dāng)筆交易)同一個設(shè)備7天內(nèi)、登錄的UID數(shù)量酒店產(chǎn)線,90天內(nèi),同一ip,訂單數(shù)量 同一UID,10分鐘內(nèi)密碼錯誤次數(shù)實時流量統(tǒng)計特性:統(tǒng)計維度靈活、復(fù)雜; 支持不同精度;數(shù)據(jù)量大、訪問量大;滑動窗口跨度大; 有去重的需求;規(guī)則靈活多變、參數(shù)/閥值調(diào)整頻率高; 需要快速響應(yīng)需求的變化;規(guī)模:目前,我們的流量服務(wù)日查詢量300億次以上實時流量統(tǒng)計我們是怎么做的:使用Redis存儲流量數(shù)據(jù)多實例、分布式部署,提升吞吏量充分利用Redis的原子操作,提升性能實時流量統(tǒng)計丼例:同一uid一天內(nèi)(近1440分鐘)的訂單量(按orderId去重)實現(xiàn):R
4、edis里保存分鐘精度、小時精度的統(tǒng)計值、以及統(tǒng)計值對應(yīng)的orderId的集合(Set) 查詢流量時先把近一天(近1440分鐘)折算出最少窗口數(shù)例如:2016-06-25 18:07 - 2016-06-26 18:06合并后:2016-06-25 18:07 - 2016-03-25 18:59 :53分鐘2016-06-25 17:00 - 2016-03-26 17:00 :23小時2016-06-26 18:00 - 2016-03-26 18:06 :7分鐘最后對上面的83個KEY做sunion(并集)操作用戶行為分析UBT數(shù)據(jù)(20億+/日)Chloro服務(wù)輸出:Session數(shù)據(jù)(行為軌跡)、客戶端數(shù)據(jù)實時風(fēng)控人工審核每秒6萬條UBT數(shù)據(jù)秒級輸出結(jié)果,保證可用于實時風(fēng)控實現(xiàn)了跨設(shè)備、跨域名的Session計算自主研發(fā)的DAG系統(tǒng)用戶行為分析用戶行為分析關(guān)聯(lián)查詢訂單AcardNodeviceIdipmobile訂單B訂單C訂單DcardNodeviceIdipmobile關(guān)聯(lián)查詢技術(shù)的演變:2013年前,基于數(shù)據(jù)庫查詢,千萬級嘗試過Neo4J等多個開源Graph方案目前,需要回溯近1年的50億訂單數(shù)據(jù)基于HBase實現(xiàn)的Gr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO 4075:2025 EN Polysulfone (PSU) - Effect of time and temperature on expected strength
- 花畫藝術(shù)在寵物用品設(shè)計的趣味性考核試卷
- 理論與實踐相結(jié)合的公路工程復(fù)習(xí)策略試題及答案
- 數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)試題及答案
- 礦物加工廠質(zhì)量管理與質(zhì)量控制考核試卷
- 金屬工藝品的工藝研究與技術(shù)開發(fā)挑戰(zhàn)應(yīng)對策略考核試卷
- 納米材料檢測技術(shù)考核試卷
- 嵌入式產(chǎn)品開發(fā)過程中的法律問題試題及答案
- 行政組織理論中的領(lǐng)導(dǎo)者角色與權(quán)責(zé)文化試題及答案
- 金冶煉廠的碳排放減少與碳足跡管理考核試卷
- 《中國老年高血壓管理指南(2023版)》解讀
- 七年級下冊《山地回憶》課件
- 浦東文員面試題及答案
- 腰椎病的康復(fù)護(hù)理
- 2024-2025學(xué)年度第二學(xué)期人教版八年級下冊物理暑假作業(yè)含答案第一天
- 2024年中國甘脲行業(yè)調(diào)查報告
- 浙江省2025年中考第二次模擬考試英語試題(含答案無聽力原文及音頻)
- 初創(chuàng)公司薪酬方案
- 2025年大學(xué)期末民法試題及答案
- 《輔助生殖技術(shù)探究》課件
- 中醫(yī)兒科學(xué)研究進(jìn)展知到課后答案智慧樹章節(jié)測試答案2025年春浙江中醫(yī)藥大學(xué)
評論
0/150
提交評論