




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、大數據環境下隱私保護與風險管控技術目錄1背景與挑戰2現狀與熱點3成果簡介Contents目錄1背景與挑戰2現狀與熱點3成果簡介Contents大數據環境下隱私保護與風險管控技術數據規模、數據復雜性快速膨脹,如何在大數據時代保障信息安全是現實而迫切的需求各類網絡信息系統產生的數據規模越來越大,大量高價值信息隱藏在其中提高數據共享能力,并以此為基礎提升數據的發掘利用水平是不可逆轉的發展趨勢數據高度共享、數據有效發掘利用,與數據有效控制、用戶隱私保護等安全需求之間存在明顯沖突大數據訪問模式與安全挑戰在大數據離線發布模式下,數據愈來愈開放,如何實現個人隱私保護在大數據在線查詢模式下,數據愈來愈集中,如
2、何實現大數據使用及服務的有效管控造成用戶隱私信息泛濫的原因很多,涉及用戶、黑客與犯罪分子、服務提供商等多方面因素用戶過度披露個人隱私信息,不利于個人實現網絡空間中的身份匿名 黑客與犯罪分子知識挖掘與分析能力不斷提升,因此,對用戶行為與屬性進行預測的準確率也在不斷提高服務提供商未能安全、有效管理用戶隱私信息,導致用戶信息被盜取、倒賣或流失上述問題的根治離不開配套法規、政策的支持與嚴格的管理手段,但更需要有可信賴的技術手段支持當前,隱私保護主要面臨三個方面的技術挑戰挑戰1用戶身份匿名保護難挑戰2敏感信息保護難挑戰3隱私信息安全管控難挑戰1:用戶身份匿名保護難問題:用戶身份重識別攻擊以及行為模式挖掘
3、技術的發展,導致用戶身份匿名保護更加困難大數據場景下,用戶數據來源與形式多樣化,攻擊者可通過鏈接多個數據源發起身份重識別攻擊,識別用戶真實身份由于用戶日?;顒泳哂休^強規律性,攻擊者可通過用戶軌跡、行為分析等逆向分析出匿名用戶真實身份隨著概率圖模型及深度學習模型的廣泛應用,攻擊者不僅可以挖掘用戶外在特征模式,還可以發現其更穩定的潛在模式,從而提升匿名用戶的識別準確率挑戰2:敏感信息保護難問題:基于數據挖掘與深度學習等人工智能方法,用戶敏感信息易被推測可以通過共同好友、弱連接等發現用戶之間隱藏的社交聯系,發現用戶社交關系隱私可以通過用以往軌跡分析預測目的地,用戶隱藏的敏感位置;也可以根據其社交關系
4、推測其可能出現的位置,透露用戶位置隱私可以通過社交網絡中的群組發現識別出用戶的宗教、疾病等敏感屬性,發現用戶屬性隱私挑戰3:隱私信息安全管控難問題:用戶隱私信息被采集后,數據控制權轉移到網絡服務商,而其缺乏足夠技術手段保證隱私數據的安全存儲、受控使用與傳播,導致用戶隱私數據被非授權使用、傳播或濫用密文云存儲可解決機密性問題,但帶來性能損失與可用性降低問題;其實際部署應用離不開高效的密文檢索與密文計算技術目前廠商普遍缺乏實現基于目的的訪問控制能力,盲目開放數據共享服務容易導致用戶隱私數據被濫用;需要基于風險的訪問控制技術,實現自底向上的策略挖掘與實施目錄1背景與挑戰2現狀與熱點3成果簡介Cont
5、ents大數據環境下隱私保護與風險管控技術1 身份匿名保護與去匿名化技術2 敏感信息隱私挖掘與防護技術3 密文檢索與密文計算技術4 基于風險分析的訪問控制技術四個方面1身份匿名保護與去匿名化技術大數據場景下,用戶數據來源與形式多樣化。攻擊者可通過綜合多個數據源,鏈接相同或近似用戶,提升識別匿名用戶的可能性基于不同數據源的位置共現評估函數定義用戶軌跡相似度,可高度準確地查找合并多個基于位置服務(LBS)APP中的匿名用戶基于推特文本信息與用戶軌跡信息,實現相似用戶分組與組內軌跡建模,發現高相似用戶基于社交網絡中的節點屬性和圖結構定義用戶相似度,可發現多個社交網絡中的相似用戶由于用戶日?;顒泳哂休^
6、強規律性,攻擊者對用戶移動軌跡建模分析,識別匿名用戶,或實現用戶位置隱私的推斷與預測基于馬爾科夫鏈(MC)模型的分析方法:位置停留點之間的轉移時序特征基于隱馬爾可夫(HMM)模型的分析方法:影響用戶位置的隱含態轉移特征基于混合高斯模型(GMM)的分析方法:圍繞若干中心位置的概率分布特征基于LDA主題模型的分析方法:學習每個用戶的位置主題向量不僅能挖掘用戶外在特征模式,還能發現其更穩定的潛在行為模式此外,經過深度神經網絡(DNN)訓練,軌跡的深度學習表示可實現匿名軌跡重識別,進一步實現用戶位置隱私的推斷與預測基于循環神經網絡(RNN)、長短期記憶(LSTM:long-short term mem
7、ory)等模型可以學習出位置停留點之間的轉移時序特征,能夠從社交網絡的匿名軌跡中提取出用戶標識基于變分自編碼器模型的軌跡深度學習,可以學習出影響用戶位置分布的隱含態隨著攻擊者能力迅速增長,K-匿名技術體系局限性日益凸顯,基于差分隱私的方法受到更多關注,差分隱私保護提供一種不限定攻擊者能力,且能嚴格證明其安全性的隱私保護框架在這種模式中,用戶數據被采集后集中進行隨機化處理,即使攻擊者已掌握除了攻擊目標之外的其他所有記錄信息,仍無法獲得該攻擊目標的確切信息初期僅應用于(數據庫)線性查詢與數據發布場景,后逐漸擴展服務于TOP-K頻繁模式挖掘、決策樹、聚類、支持向量機等機器學習算法,以及用戶位置與軌跡
8、數據發布等多樣化應用場景集中式差分隱私保護本地差分隱私保護用戶數據在本地隨機化處理后再被采集,擁有任意背景知識的攻擊者無法根據擾動后的單個用戶數據,推測用戶的原始數據,典型的協議包括Rappor協議、SH協議、Piecewise協議等,分別用于頻率統計與均值計算2014年,谷歌在Chrome中采用本地差分隱私算法(Rappor協議)收集用戶行為數據,包括用戶任務管理器中的進程和瀏覽過的網站等本地差分隱私保護(續)2016年,蘋果宣布開始在iOS數據收集行為中對行為統計數據應用差分隱私算法,統計數據包括QuickType鍵盤常用詞和emoji表情頻繁程度等。盡管統計結果引入誤差,但當數據量足夠大
9、時,仍然能在完成數據分析的同時保障用戶隱私安全2017年,蘋果基于差分隱私技術收集手機上的健康數據(如運動,步數等)現狀小結去匿名化不斷涌現新技術新方法,基于K-匿名技術體系的隱私保護方法局限性日益凸顯,基于差分隱私的保護方法受到更多關注本地差分隱私保護方法可實現數據的安全采集,但算法可用性仍有很大提升空間身份匿名保護與去匿名化技術研究熱點基于多源異構數據集的匿名保護技術面向位置軌跡分析的匿名保護技術本地差分隱私保護技術身份匿名保護與去匿名化技術2敏感信息隱私挖掘與防護技術社交網絡服務商致力于分析用戶的偏好、向用戶推薦朋友,保持社交群體的活躍和黏性。而攻擊者可采用類似技術,根據攻擊目標現有的社
10、交關系和其他屬性特征,對用戶的敏感社交關系、敏感屬性、位置與軌跡進行分析與預測社交關系隱私屬性隱私位置隱私在社交網絡隱私保護中,單純刪除敏感邊、敏感屬性、敏感位置并不能防止其被探知。采用與解決數據稀疏問題類似的技術,攻擊者可以由其他用戶公開發布信息推測出缺失的敏感信息即使敏感關系被保護,攻擊者也可通過共同朋友數目、弱連接數目、社交子群劃分來判斷用戶之間的社交距離,推測兩者間存在社交關聯的概率針對Facebook的用戶數據分析顯示,具有相同屬性的用戶更容易成為朋友,用戶部分屬性與其社交結構具有較高的相關性。攻擊者可以通過用戶的可見屬性、社交關系及其所屬群組等信息來推測用戶未標注的敏感屬性差分隱私
11、提供可量化評估的隱私保護,并通過組合機制與高級組合機制可實現多個步驟的靈活組合。因此,由多項差分隱私保護算法構成的復雜機制,仍能提供差分隱私保護,但其隱私預算消耗將快速上升基于位置直方圖、軌跡直方圖的差分隱私保護機制基于前綴樹、層次樹等樹重構的軌跡差分隱私保護機制基于位置聚類的軌跡差分隱私保護機制以基于差分隱私的用戶位置與軌跡發布方法為例,不同機制中,總隱私預算隨著軌跡長度線性增長越來越多的數據作為訓練集用于機器學習或深度學習模型中的參數訓練,對外提供機器學習即服務(MLaaS服務),該過程容易引發用戶隱私泄露成員推理攻擊:給定數據記錄和模型的黑盒訪問權限,推測出某條用戶記錄是否在模型的訓練數
12、據集之中屬性推理攻擊:獲取訓練數據集本身的統計屬性信息面臨的主要攻擊是模型逆向攻擊,這種攻擊從黑盒學習模型中逆向提取出訓練數據集信息,包括成員推理攻擊和屬性推理攻擊面向機器學習的隱私保護方法支持差分隱私的機器學習算法:典型代表為支持差分隱私的隨機梯度下降(Differential Private SVD)算法。該算法滿足(,)-DP,且實驗結果表明,深度神經網絡的隱私保護可以在軟件復雜度、訓練效率和模型質量的適度成本下實現同態加密機器學習機制:典型代表為CryptoDL。在深度學習中,同態加密算法用于保護預測輸入和結果,以及訓練神經網絡模型參數,實現了卷積神經網絡上手寫字體分類現狀小結差分隱私
13、提供可量化評估的隱私保護,但在復雜系統中隱私預算消耗過快用戶數據應用于機器學習參數訓練時,易遭受模型逆向攻擊,需要面向機器學習的隱私保護方法敏感信息隱私挖掘與防護技術研究熱點基于差分隱私模型的敏感信息隱私保護方法人工智能方法在敏感信息隱私挖掘與保護中的應用敏感信息隱私挖掘與防護技術3密文檢索與密文計算技術密文檢索密文檢索可實現用戶在無需解密數據而直接對密文數據實施檢索訪問的能力,包括關鍵字檢索與區間檢索單關鍵字海量數據(109-1010量級)密文檢索方案將倒排鏈表分割并進行內存磁盤優化,實現了秒級的查詢響應多關鍵字密文檢索在108量級的密文數據庫上對多關鍵字查詢的響應速度達到了秒級關鍵字檢索區
14、間檢索單維區間檢索基于等值檢索的密文單維區間檢索方案:利用TDAG(Tree-like Directed Acyclic Graph)樹將數值轉換為關鍵字,從而以引入冗余數據為代價,提高方案的安全性基于自適應索引和矩陣加密方案:支持數據動態更新的密文單維區間檢索,可根據檢索條件動態地索引數據,但同時數據的隱私泄露也會逐漸嚴重多維區間檢索高安全性的密文多維區間檢索方案:基于R樹構造索引,并將R樹節點轉換為向量形式,通過謂詞加密安全地判斷搜索區間與節點是否相交,且不泄露額外信息,但是方案的檢索效率較低對多維區間檢索擴展方案:檢索條件可為任意幾何圖形,基于R樹構造索引,基于半空間的思想構造陷門,并使
15、用矩陣加密保護索引和陷門安全的布爾空間關鍵詞檢索方案:基于EBFR (Encrypted Bloom Filter R-tree)樹構造索引,使用矩陣加密保證數據安全性密文計算同態加密使用同態加密可以直接在加密的索引上進行修改操作,可實現快速安全的加密數據更新;基于同態加密還可實現服務器端搜索排序函數加密屬性基加密(ABE)實現密文訪問控制;基于隱藏向量加密(HVE)可以計算數據權值等;基于同態加密和函數加密技術,能夠在106量級的數據庫上進行密文數據的均值和方差等計算,時間代價為10秒級,并能夠遠程驗證結果的正確性,已經初步具有實用價值現狀小結密文檢索技術效率較高但安全性論證不夠充分密文計算
16、技術理論上取得一定突破但實用性不強密文檢索與密文計算技術研究熱點高效安全的密文檢索方法實用安全的密文計算方法密文檢索與密文計算技術4基于風險分析的訪問控制技術經典的訪問控制模型屬于“自頂向下”的訪問控制模式,而大數據場景下訪問需求無法明確預知訪問控制策略依賴于環境上下文大量實際數據訪問控制策略制訂需要專業領域知識,無法為其預先生成容易導致授權不足或過度授權需要“自底向上”的訪問控制模式,通過學習生成最佳訪問控制策略,實現自適應訪問控制基于風險的訪問控制對訪問行為進行實時風險評估,并通過訪問過程中動態地權衡風險與收益實現訪問控制,具有較強的自適應性基于風險的訪問控制基于風險閾值的訪問控制:根據資
17、源內容和訪問用戶的屬性對資源進行風險估計,設定風險閾值,將用戶訪問行為帶來的風險總和限定在閾值內,實現基于風險的訪問權限自動調整隱私感知的風險自適應訪問控制:采用概率主題模型對用戶的正常與異常訪問行為進行建模,更準確地度量異常訪問所帶來的風險角色可被看作是大量用戶共享的一些權限組合。在用戶和權限規模較大時,可以采用“自底向上”方法來發現角色,進行角色挖掘當系統的用戶基數越大、權限越多時,權限分配的潛在模式就越明顯,采用“自底向上”方法進行角色挖掘的效果就越好傳統角色挖掘是針對已有的“用戶-權限”授權信息進行權限的聚類,將聚類結果作為角色,其合理性取決于已有授權信息的正確性近年來,許多研究工作采
18、用了更豐富的數據集進行角色挖掘,主要包括:生成式角色挖掘非負矩陣分解方法生成式角色挖掘從權限使用情況的歷史數據來獲得用戶的權限使用模式,進而產生角色,不局限于已有權限分配的準確性基于權限使用日志,將角色挖掘問題映射為文本分析問題。采用主題模型LDA(Latent Dirichlet Allocation)和ATM(Author-Topic Model)進行生成式角色挖掘,生成角色能夠更加準確地反映權限的真實使用情況非負矩陣分解方法基于物理域、網絡域和信息域的多域信息構建實體-關系網絡,并將角色挖掘問題映射為網絡中的社群發現問題。采用非負矩陣分解方法進行角色挖掘,能夠發現權限之間存在的依賴關系,避免已有授權信息中存在的錯誤現狀小結經典的訪問控制模型已不適應大數據環境下的訪問控制需求,需要“自底向上”的訪問控制模型,相關研究比較初步基于風險分析的訪問控制技術研究熱點基于風險分析的訪問控制機制基于機器學習的策略
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025如何設計合同終止的條款
- 2025室內裝修施工勞務分包合同樣本
- 2025食品原料采購合同書
- 2025蘇州商品房買賣合同范本【打印】
- 2025工程設計合同模板
- 2025供暖系統管道改造合同
- 2025購銷合同(電子產品)范文
- 2025建筑項目工程總承包合同模板
- 2025合作協議與合同條款
- 2025租房消防安全責任合同書
- 02S515排水檢查井-標準圖集
- (2024年高考真題)2024年普通高等學校招生全國統一考試數學試卷-新課標Ⅰ卷(含部分解析)
- 信托業務數字化轉型-洞察分析
- 紅領巾小5年規劃
- 機械工程師中級考試題庫單選題100道及答案解析
- 《Python語言程序設計》課件-第六章(中英文課件)
- 關于對全市醫療質量和醫療安全檢查情況的通報
- 《住院患者身體約束的護理》團體標準解讀課件
- 2024年土地流轉的合同模板
- 靜脈留置針常見并發癥
- 機器人自主導航與地圖構建考核試卷
評論
0/150
提交評論