Sark大數據的實現及行業應用案例_第1頁
Sark大數據的實現及行業應用案例_第2頁
Sark大數據的實現及行業應用案例_第3頁
Sark大數據的實現及行業應用案例_第4頁
Sark大數據的實現及行業應用案例_第5頁
已閱讀5頁,還剩27頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

目錄聯合實驗室大數據分析平臺產品技術架構典型行業應用案例中國科大-象形科技大數據商業智能聯合實驗室,由科大多位博導、教授領銜,集中了30位博士、碩士,20位大數據研發人員的聯合研發隊伍,在多個大數據技術領域進行技術研究和成果轉化。聯合實驗室介紹技術基礎研究方向研究方向關鍵任務制高點大數據可視化挖掘1)新型內存迭代數據挖掘算法2)數據挖掘可視化開發平臺3)房地產、金融、電信等機器學習模型研究1)基于內存計算的機器學習算法2)行業大數據深度機器學習模型3)大數據可視化挖掘大數據內存計算1)基于內存的迭代算法研究2)內存大數據高速統計分析技術1)基于大數據內存的計算技術2)國內產品領先大數據語義分析1)大數據自然語言識別2)非結構化數據的知識發現、集成技術大數據平臺的可視化集成目前是空白領域大數據云計算技術1)大數據云計算平臺技術2)商業智能云平臺技術1)云BI技術及大數據平臺的核心技術研究2)大數據云BI在國內應用是未來趨勢,有望建成國內第一家云BI平臺實驗室介紹-技術基礎研究方向產學研合作項目合作成果大數據環境下的無重疊視域跟蹤技術研究項目1)智慧城市合作2)9項大數據視頻專利3)多項國家自然科學基金4)大數據視頻分析平臺審計行業大數據知識推理系統

(國家863項目)課題《大數據環境下基于案例的知識推理平臺》申請國家863計劃審計數據中心平臺,全國推廣中。房地產大數據分析建立房產數據開發服務平臺,提供公眾服務。房地產價值評估。建立房產評估模型,房地產指數等模型。制造業大數據信息挖掘云圖制造業生產設備生命周期大數據分析。制造業信息云圖。碳交易平臺大數據碳金融算法與模型建立。碳交易與分析平臺。實驗室介紹-研究成果開創了基于人類視覺智能的動態目標捕捉、跟蹤和行為分析的研究,在國內外雜志、會議發表了多篇高水平論文。獲得視頻識別,知識學習與推理相關發明專利2項,申請發明專利7項。大數據環境下的無重疊視域跟蹤大數據技術,解決視頻領域的知識識別,知識發現,知識集成與跟蹤,推理等關鍵技術問題。多項國家自然科學基金大數據技術來實現國家經濟免疫系統數據接口大數據知識推理系統疑點數據審計數據中心審計跨12個行業,跨地區數據源傳統審計大數據審計無法跨地區、跨行業審計跨行業、跨區域審計事后審計、周期性審計連續審計復雜性隱蔽問題難以發現智能化,具有預測功能依據小樣本經驗地毯式排查大數據分析,建立抵御和預防手段審計行業大數據知識推理系統房地產大數據利用大數據建模技術,實現房地產價格指數、房地產評估模型碳交易利用大數據建模技術,建立全省碳排放計量監測體系的數據體系、技術體系、模型體系和評估體系,形成滿足碳排放計量關系方程和參數目錄聯合實驗室大數據分析平臺產品技術架構典型行業應用案例數據挖掘越來越多的應用到了各個領域中,主要包括與客戶關系管理相關的模型、與風險控制相關的模型、與生產銷售預測相關的模型等數據挖掘應用領域產品名產品ETHINK可視化挖掘掘概要通過在瀏覽覽器內,鼠鼠標拖拽形形式實現加加載數據、、轉換、建建模、評估估、圖形以以及結果輸輸出特點通過視覺工工作方式輕輕松獲得此此界面可以以保障操作作的靈活性性在最短的時時間內形成成最多樣的的模型大數數據挖掘,,速度快關系型數據據庫數據挖掘模模型算法庫庫/語義分析Hbase/Hive/Hdfs可視化數據據挖掘平臺多維自助分分析調度管理SQL接口JDBC/ODBC內存計算服服務Scala/Java/PythonOLAPServer手機平板電腦批處理實時流處理理交互式查詢詢統計分析平平臺ETHINK產品架構特點一豐富建模方方法特點可拖拽式建建模JDBCWebServicesRestfulapi可擴展性強強自定義模型型,擴充組組件特點傳統的關系系型數據(mysql、Oracle等)列式數據庫庫(Hbase)非結構化數數據(Hdfs、文件系統統)大數據(Hbase、Hive)特點二大數據處理理特點開放型平臺臺BS結構,一站站式建模、、評估、部部署基于Spark平臺內存計算運算速度快快特點GBPB特點三大數據處理理能力特點基于Spark平臺內存計算執行數據挖挖掘時,方方法論非常常重要.因為準確的的方法論能能夠提高作作業速度,能系統地減減少各種進進展狀況,,所以選擇擇正確的方方法論是很很重要的.CRISP-DM方法論是全全球認可的的數據挖掘掘的標準執執行方法論論.功能模塊金融電信行業1.信用卡用戶流失預測2.基于客戶分群的精準智能營銷3.基于公司價值評價的證券策略投資電力行業1.電力負荷預測2.自適應防竊漏電實時診斷互聯網行業1.電子商務網站用戶行為分析2.基于用戶行為分析的定向廣告投放3.企業信息系統用戶服務感知評估

制造業行業1.制造設備生命周祺管理2.制造業投入產出預測公共服務業

1.空氣質量預測2.卷煙消費者購買行為分析3.納稅人偷稅漏稅評估場景應用((實驗室模模擬實驗課課題)目錄聯合實驗室大數據分析平臺產品技術架構典型行業應用案例交互式查詢實時在線處理實時流處理

批處理基于spark內存的計算算模型,同同時支持批批處理、交交互式處理理、流處理理。技術架構解解決方案-要解決的問問題技術架構解解決方案-分布式內存存計算批處理應用用(分鐘級別別~小時級別))OLTP/在線事務處處理應用(毫秒~秒級別)OLAP/在線交互式式分析應用用(秒級別))實時流處理理(持續不斷斷)技術架構解解決方案-交互式查詢詢通常的時間間跨度在數數十秒到數數分鐘之間間按數據維度度進行統計計、聚合根據歷史數數據進行擬擬合和預測測計算數據之之間的相關關性和模式式等適合提供高高速在線分分析服典型應用場場景政府各部門門數據證券交易銀行保險企業ERP/CRM等適用于數據據量在GB到TB的高速數據據分析技術架構解解決方案-實時在線處處理通常的時間間跨度在數數百毫秒到到數秒之間間數據來源多多、高并發發、數據處處理量達分析結果快快速響應典型應用場場景社交網絡分分析、關聯聯關系分析析用戶分類、、用戶行為為預測高并發查詢詢按主鍵毫秒秒級檢索按多維度秒秒級檢索按照關鍵字字秒級檢索索事件驅動計計算模型,,系統處于于持續不斷斷計算之中中,事件響響應延遲在在毫秒~秒級。流式計算系系統處理應應用的處理理邏輯是由由源源不斷斷的數據流流驅動。典型應用場場景有金融在線線欺詐預警警廣告CTR推薦系統技術架構解解決方案-實時流處理理技術架構解解決方案-批處理及離離線挖掘時間跨度在在數十分鐘鐘到數小時時之間。離線挖掘主主要用于,,多維統計計預測,準準實時分析析以及對客客戶進行聚聚類、分類類等數據挖挖掘應用。。典型應用場場景電子商務推推薦引擎流失客戶預預測挽留日志清洗、、ETL用戶行為分分析目錄聯合實驗室大數據分析平臺產品技術架構典型行業應用案例項目需求將總行下發發的數據及及核心業務務數據,經經過數據整整理、加載載到省級數數據中心,,并進行各各項業務快快速應用開開發數據源某省公積金金中心,近近五年的操操作、交易易記錄,共共10億條左右。。系統環境4臺X86架構的PC服務器,共共128G內存單臺服務器器,8核CPU,32G內存解決方案Hbase導入海量數數據,并支支撐大數據據查詢可視化設計計、可視化化報表實現現了數據的的實時分析析行業應用案案例-金融行業應用案案例-金融系統由對公公客戶綜合合積分子系系統、展業業通客戶綜綜合收益分分析子系統統、授信客客戶資金結結算子系統統、對公柜柜面交易流流水分析子子系統等組組成行業應用案案例-金融項目需求整合第三方方支付數據據資源,分分析挖掘客客戶交易、、反饋信息息、交易行行等數據,,實現精準準營銷,最最大限度地地提升產品品價值數據源某第三方支支付平臺交交易、反饋饋數據,月月交易記錄錄量1億條。系統環境6臺X86架構的PC服務器,共共96G內存單臺服務器器,8核CPU,16G內存解決方案Hbase導入海量數數據,并支支撐大數據據查詢Hive對歷史交易易數據進行行分析可視化設計計、可視化化報表實現現數據的實實時分析基于于ETHINK可視視化化挖挖掘掘平平臺臺,,完完成成精精準準營營銷銷建建模模持卡卡客客戶戶多多維維分分析析::持卡卡客客戶戶人人口口統統計計特特征征分分析析持卡卡客客戶戶交交易易行行為為模模式式分分析析持卡卡客客戶戶應應用用場場景景分分析析特約約商商戶戶多多維維分分析析::商戶戶基基本本信信息息分分析析/商戶戶業業務務收收益益分分析析商戶戶價價值值貢貢獻獻度度評評估估//商商戶戶收收單單風風險險分分析析持卡卡客客戶戶和和特特約約商商戶戶雙雙向向分分析析特定定特特征征客客戶戶特特定定時時間間消消費費商商戶戶分分布布分分析析特定定時時間間在在特特定定商商戶戶消消費費的的客客戶戶特特征征分分析析行業業應應用用案案例例-金融融項目目需需求求煙草草工工業業企企業業目目前前積積累累了了大大量量的的數數據據信信息息,,管管理理方方式式由由粗粗放放式式管管理理轉轉為為精精細細化化管管理理,,產產生生了了利利用用大大數數據據技技術術收收集集、、管管理理和和展展示示分分析析結結構構化化和和非非結結構構化化的的數數據據和和信信息息的的訴訴求求,,于于是是如如何何利利用用這這些些數數據據創創造造更更大大的的價價值值、、為為領領導導決決策策和和企企業業精精益益管管理理提提供供有有力力支支撐撐成成為為重重要要的的課課題題。數據據存存儲儲近1年數數據據,,每每秒秒鐘鐘10000個數數據據采采集集點點系統統環環境境硬件件環環境境::數數據據庫庫服服務務器器1臺+4臺分分布布式式pcserver單臺臺4核,,16G內存存解決決方方案案流處處理理模模塊塊處處理理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論