經營分析系統隱私數據保護項目_第1頁
經營分析系統隱私數據保護項目_第2頁
經營分析系統隱私數據保護項目_第3頁
經營分析系統隱私數據保護項目_第4頁
經營分析系統隱私數據保護項目_第5頁
已閱讀5頁,還剩14頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

中國移動業務服務創新 獎勵申報書 項目名稱: 經營分析系統 隱私數據保護項目 申報單位: 黑龍 江公司 /集團公司業務支撐系統部 中國移動通信集團公司 2011 年 11 月 7 日 一、項目基本情況 項目 名稱 中文 經營分析系統 隱私數據保護項目 英文 Protection of Business Analysis Support System Private Data 主要完成單位 中國移動通信集團黑龍江有限公司業務支撐中心 中國移動通信集團業務支撐管理部 主 題 詞 隱私數據 去隱私化 、 映射 數據封裝 、置換 任務來源 A.中國移動通信集團公司計劃 項目起止時間 起始: 2010 年 10 月 1 日 完成: 2011 年 5 月 31 日 二、項目簡介 (不超過 800 個漢字 ) 隨著電信運營商的客戶隱私信息泄露而引起不良社會影響的事件的頻繁發生,如何進行客戶隱私數據的保護越來越重要,經分系統不但從上游數據源系統中獲取了明細的客戶基本信息,還將它們進行深入分析和挖掘,得到了更為豐富的客戶行為特征信息 ,這些與客戶相關的行為特征包含了大量的客戶隱私 數據和敏感數據,一旦出現泄漏的情況,對我們移動公司的影響非常大 ,我省經分系統已經對部分客戶隱私數據進行了簡單保護,但存在以下幾方面的問題: 1、客戶隱私數據的查全率有待提高; 2、未形成客戶隱私數據的完整保護體系; 3、部分數據的保護存在不可逆行為; 針對經營分析系統數據存在的問題,本項目的研究思路是按照隱私數據的識別、處理、還原這個閉環流程來展開 ,并建立 數據加密策略和版本管理模塊,主要包括以下內容: 1、建立隱私數據識別模塊:根據隱私數據的表現形式,將隱私數據分為顯式標識符、準標識符和敏感屬性三類; 建立隱私數據知識庫,采用人工和自動識別的模式對隱私數據進行管理; 2、建立去隱私數據管理模塊:去隱私化處理模塊是客戶隱私數據保護模塊的核心,負責封裝和管理去隱私化處理的方法。提供給獲取層的數據轉換過程( ETL 的轉換階段)調用,對原始數據進行去隱私化處理。加密后入庫。保證去隱私化處理的準確性和高效性。 3、建立隱私數據還原模塊:將“還原處理模塊”與數據封裝層進行整合,隱私數據在經過數據封裝層時,對其進行還原,明文展示于前臺。調用還原隱私引擎,將數據以明文方式由封裝層傳給內部應用、外部系統等模塊。因此此處加擾加 密算法都是可逆的 。 4、建立策略 /版本管理模塊 策略 /版本管理子模塊主要是為去隱私處理模塊和隱私還原處理模塊提供處理策略配置和版本管理,處理過程中所用到的位置變換算法、映射轉換關系、密鑰都在本模塊統一管理和保存 項目自上線以來,雖然增加了大量的數據處理運算,但是由于采用了高效的 算法和基于內存的 ETL 數據處理,未對系統的處理性能造成影響;且利用數據隱私數據保護項目,提升了數據的安全級別,防患于未然,大大提升了經分數據的安全管控力度。 項目直接產出專利一項,還有一項正在申請。 三、項目詳細內容 1、 立項背景(不超過 800 個漢字) 作為全國 31 個省級經分系統之一,黑龍江經營分析系統自系統建設至今,主數據倉庫中已經納入 120TB 的海量信息數據。其中絕大部分的數據中存在客戶隱私信息。隱私數據主要是來自上游 BOSS、CRM、客服系統、網管 等系統,主要包括客戶的基本資料、以及包括用戶服務號碼、對端通話號碼及位置信息的用戶使用清單;同時經營分析系統通過各種數據統計分析技術,對海量數據進行數據挖掘和知識發現,也衍生出一些客戶的隱私數據。例如:客戶職業、數據業務愛好的信息。 目前,黑龍江分公司經分系統對 部分隱私數據進行了保密處理 。主 數據倉庫的詳單數據主要是通過使用權限進行控制。個人用戶來說,只能通過視圖方式訪問詳單信息,視圖中對號碼的后四位是進行加密處理。現有的隱私保護方案起到了一定的保護作用, 但 存在 以下幾方面的問題: 1、數據保護安全級別不高,并且存在數據不可逆的問題。 2、 大部分隱私數據以明文存放, 4A 平臺可以控制用戶訪問,但不能控制有權限用戶惡意訪問。 經分數據存在以下幾個方面的特點: 1、 所有的數據處理都不需要識別具體的客戶,超過 80%的分析應用集中在大趨勢和群體客戶行為,只有 20%的分析應用需要對應具體的客戶來采取營銷或服務 行動。所以可以在經分后臺“去隱私化”,對 20%的應用通過具體模塊來還原隱私信息。 2、 客戶的隱私數據分類特征明顯,可以針對不同級別的隱私數據采取不同的加密策略 通過對隱私數據泄露途徑進行分析, 數據泄露主要途徑是后臺操作人員非法提取數據 ,因此,可以通過 “去隱私”技術手段,在數據底層構建一條防線,使得非法入侵者即使獲取了權限也無法理解數據 詳細技術內容(不超過 1000 個漢字) 經營分析系統客戶隱私數據保護按照隱私數據的識別、處理、還原這個閉環流程來展開。客戶隱私 數據保護各模塊屬于數據及運維管理域,隱私數據保護處理模塊細分為多個子處理模塊,包括:隱私策略管理、去隱私化管理模塊、還原管理模塊等。 客戶隱私數據保護技術體系最核心的、最關鍵的處理都集中在去隱私化中。在獲取層的轉換模塊中,數據轉換處理( ETL 模塊中的 T模塊)需要進行改造增加去隱私化處理引擎,引擎需要調用客戶隱私數據保護模塊所封裝的算法和規則。在數據層的數據封裝模塊中,同樣需要進行改造,支持對去隱私化的數據進行還原處理。隱私數據保護管理相關的模塊在經營分析系統中的布位置如下圖: 圖 1. 客戶隱私數據保護體統架構圖 如上圖結構所示:采用“客戶隱私數據保護模塊”對經分系統的敏感數據去隱私化,隱私數據還原,隱私策略等進行統一管控。 1、 隱私數據從 CRM、 BOSS 等外圍系統經過 ETL 工具加載進數據倉庫 DW 時,啟動 ETL“去隱私化處理引擎”,調用去隱私方法,對需要去隱私化的數據進行加擾或者加密處理,然后入庫。 2、 應用訪問層、外網系統需要獲取數據倉庫里的隱私數據時,通過“還原引擎”模塊啟動“隱私還原管理”將加密數據或者加擾數據進行還原之后返給請求方。 3、 “隱私策略管理”模塊,對數據加密的策略進行管理,通過對密鑰版本的控制從而變更隱私 數據的加密策略,提升數據安全性。 客戶隱私保護模塊技術體系具備如下能力: 1、 無損處理:去隱私化處理是無損的、可逆的,也就是說能還原隱私信息原文;無損的隱私保護技術使用加密保護技術以及基于可逆置換的加擾技術。 2、 降低對現有系統影響:經營分析系統是穩定運行的系統,隱私數據保護模塊建設保證對原有應用程序無影響;例如:為了避免影響數據庫設計,采用“格式保留加密”的算法,保持密文和原文保持同樣的屬性和字段長度;為了不影響現有系統的數據處理和訪問中的關聯 (Join)操作,轉換保持一對一的轉換關系。 3、 算法簡單、 處理高效:經營分析系統中的數據規模非常龐大, 系統資源更多的需要提供給 ETL 統計分析等資源消耗大的數據操作,去隱私化處理技術做到了簡單、高效,不占用系統太多資源。如:去隱私化處理放在 ETL 過程中不影響數據倉庫處理性能;大規模數據處理采用了效率較高的可逆置換技術。 4、 實現版本管理:即使是再嚴密的管控和再強大的處理技術,在使用時間越長其泄密的風險也會越高。為此,客戶隱私數據保護處理采用的策略、密鑰等信息都有版本管理,實現了版本的定期更新。 2、 主要技術創新點(不超過 800 個漢字) 1、 通過加密算法和映射轉換的方式實現“格式保留加密”,支持 SQL關聯操作快速處理; 本項目的難點是解決效率的問題,通過一種格式保留的 加密算法, 支持通過 SQL 進行快速處理,去隱私化處理后的字段還可以作為 SQL 的關聯條件繼續生效,不影響現有的程序邏輯,且去隱私化處理后的數據能夠還原 。 2、 通過數據封裝技術實現隱私數據的還原操作,并記錄明細訪問信息; 利用數據封裝技術 調用去隱私化服務進行隱私數據還原,增強項目的標準化程度和可移植性。 3、 通過版本管理的策略進一步增強加密和映射兩種去隱私化方法的保密性; 策略 /版本管理子模塊主要是為去隱私處理模塊和隱私還原處理模塊提供處理策略配置和版本管理,處理過程中所用到的映射轉換關系、密鑰都在本模塊統一管理和保存。策略 /版本管理模塊與其他模塊之間的關系如下圖 客戶隱私元數據元數據管理隱私保護策略 管理策略版本管理模塊映射轉換規則管理密鑰管理去隱私化管理模塊還原管理模塊獲取客戶隱私元數據用于配置處理策略獲取策略、映射關系、密鑰根據實際數據更新映射規則獲取策略、映射關系、密鑰 4、 通過基于內存的 ETL 數據處理技術,提升數據處理效率。 利用基于內存數據庫技術,采用多進程對隱私數據的加密和還原進行操作,大大提升了系統的處理效率。 應用情況(不超過 800 個漢字) 本項目上線以來,對經營分析系統數據倉庫中 xxx 張表中 xxx 個涉及敏感數據的字段進行了加密處理,并不斷進行經驗積累,形成了隱私數 據加密規則庫,為企業數據安全保障工作積累了豐富的經驗。在系統運行中,持續對加密算法進行優化,目前隱私化和隱私數據還原已基本不影響經分系統數據處理效率。將原有的只能單純依靠管理手段及事后審計方式,轉變為以技術手段為基礎配合管理手段,徹底阻斷敏感信息泄露途徑,將數據安全工作落到了實處。 對公司來講,這些需要加以保護的信息,尤其是客戶敏感信息,其價值不可估量。一旦泄露將會造成災難性后果,其經濟損失遠大于前期防護的投入。通過本系統進行未雨綢繆的防護,其經濟效益只能通過所阻攔的時間性質來衡量,所帶來的回報必將是長久的 。另一方面,我省使用自行研發的隱私數據保護方法代替專業數據保護軟件,至少節省 60 萬投資。如果推廣到全國,也將節約大量成本投入。 從客戶的角度,如果發生了嚴重的從客戶的角度,如果發生了嚴重的客戶信息泄露事件,公司整體聲譽必將受到嚴重創傷,客戶的內心會對中國移動產生一種不信任感,嚴重影響我公司品牌價值。而修復這種不信任感將會更加的費事費力,所耗費的將不僅僅是資金。唯一的辦法就是做好預防工作,防止發生泄漏,最大程度地做好可能泄露途徑的管控工作,嚴格管控好隱私數據泄露的途徑。本項目最大的社會效益就是使公司保持良好的 社會聲譽,不斷提升品牌價值。 。 經濟效益(單位:人民幣萬元) 項目總投資額 10 回收期(年) 1 欄目 年份 新增利潤 新增稅收 創收外匯(美元) 節支總額 2011 50 各欄目的計算依據: 項目節約軟件購置費 : 60 萬元 投資 10 萬 元 合計創收 50 萬元 生產、應用單位 財務專用章和財務負責人簽字 李蘭英 年 月 日 6、社會效益 如果發生了嚴重的客戶信息泄露事件,公司社會聲譽必將受到嚴重創傷,客戶的內心會對中國移動產生一種不信任感,嚴重影響我公司品牌價值。而修復這種不信任感將會更加的費事費力,所耗費的將不僅僅是資金。唯一的辦法就是做好預防工作,防止發生泄漏,最大程度地做好可能泄露途徑的管控工作,徹底堵死隱私數據可能泄露的漏洞。 本項目最大的社會效益就是使公司保持良好的社會聲譽,不斷提升品牌價值。 四、本項目曾獲獎勵情況 獲獎時間 獎 項 名 稱 獎勵等級 授獎部門(單位) 2011 業務服務創新獎 二等獎 黑龍江移動 本表所填獎勵是指: 1.國家設立的科技獎勵; 2.各省、自治區、直轄市公司設立的獎勵 3.各省、自治區、直轄市政府設立的獎勵; 4.經科技部批準的社會力量設立的獎勵。 五、申請、獲得專利情況表 國 別 申 請 號 專 利 號 項 目 名 稱 ZC1107001 一種 基于可逆置換技術的去隱私化處理方法 六、 主要完成人情況表 七、主要完成單位情況 單位名稱 中國移動通信集團黑龍江有限公司 第 二 完成單位 中國移動通信集團業務支撐系統部 聯系人 傳真 聯系電話 電子信箱 主要貢獻 黑龍江公司主要負責負責工作: 1、項目的發起,需求驅動, 核心功能設計,主要實現方式的確認工作。 2、負責 隱私數據識別、去隱私化算法選擇、算法性能測試、隱私數據還原算法選擇和性能測試。 3、負責隱私策略管理模塊設計。 4、負責 ETL 算法優化 5、負責系統測試和上線工作。 集團公司業務支撐系統部負責工作: 提供技術支持和建設方案指導 單位公章: 2011 年 11 月 7 日 八、申報單位意見 申報單位 中國移動通信集團黑龍江有限公司 通信地址 郵編 150090 聯系人 基本信息 姓名 電話 部門 手機 職務 傳真 電郵 同意申報 ! 申報單位公章 2011 年 11 月

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論