基于半監督學習的釣魚網站檢測研究_第1頁
基于半監督學習的釣魚網站檢測研究_第2頁
基于半監督學習的釣魚網站檢測研究_第3頁
基于半監督學習的釣魚網站檢測研究_第4頁
基于半監督學習的釣魚網站檢測研究_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于半監督學習的釣魚網站檢測研究中期考核目錄四、后續工作三、研究進度二、研究內容及方法一、研究背景和目的一、研究背景和目的“電子銀行/移動支付系統安全態勢監控示范工程”子課題(國家信息安全專項發改辦高技[2013]1965號文件)Text1……反釣魚網站檢測研究網頁掛馬檢測研究電子銀行/移動支付業務系統外網安全監測二、研究內容及方法針對釣魚網站檢測樣本標記

困難的問題進行研究。提出一種釣魚網站檢測算法,通過特征篩選,以及半監督學習算法得到最適合的釣魚網站檢測模型。特征篩選從URL、HTML

DOM元素以及ThirdPartySearchInformation(TPSI)三個方面進行網站特征提取,比較全面的刻畫了釣魚網站的特征;將半監督協同訓練算法(Tri-training)運用于釣魚網站檢測中,極大的減少了釣魚網站標記樣本的數量,實現了減少人工標記成本的目的。學習算法1二、研究內容及方法基于多融合的釣魚網站檢測模型

系統框架Sa1:對釣魚網頁樣本數據集進行預處理篩選;Sa2:提取URL特征向量

、HTMLDOM特征向量

以及TPSI特征向量

;Sa3:構造三類弱分類器

,并利用tri-training半監督協同訓練算法對三類分類器進行分類強化訓練;Sa4:得到釣魚網頁檢測分類器模塊。訓練模塊Sb1:系統將用戶訪問的網頁URL信息發給Form表單檢測模塊;Sb2:系統在黑名單庫中對傳遞的URL進行匹配;Sb3:對URL特征向量

、頁面信息特征向量

以及搜索信息特征向量

三組特征向量結合搜索引擎進行提取;Sb4:通過釣魚網頁分類器對待檢測的網頁進行投票判斷;Sb5:根據傳遞的判斷結果。檢測模塊URLFeaturesHTMLContentFeaturesTPSIFeatures基于多融合的釣魚網站檢測模型

二、研究內容及方法21features二、研究內容及方法數據集:1)數據集來源釣魚網站樣本主要來源于PhishTank反釣魚網站社區,篩選選取了最新的6400條可用的釣魚網站數據進行研究。另一部分合法網站樣本主要來源于Alexa和Yahoo!中排名靠前的主流合法網頁。基于多融合的釣魚網站檢測模型

二、研究內容及方法2)標記樣本和未標記樣本比例劃分SVM分類性能情況8%的標記樣本數據作為標記樣本集合L85%的樣本作為未標記樣本集合U7%的樣本作為測試集合T基于多融合的釣魚網站檢測模型

二、研究內容及方法3)基礎分類器的選擇不同比例標記樣本性能分別對SVM,J48和NaiveBayes三種監督學習的分類器進行了訓練,得到不同標記樣本的性能圖如右圖所示。基于多融合的釣魚網站檢測模型

二、研究內容及方法對比實驗TSVMPD檢測算法:受標記樣本數量的影響較小;TPR和Precision較高;可以保障用戶的正常使用。基于多融合的釣魚網站檢測模型

二、研究內容及方法針對釣魚網站檢特征隨時間段

變化特征貢獻變化及降維問題。擬提出一種釣魚網站檢測特征處理方案。(調研中)2三、研究進度開題情況中期完成情況1、針對釣魚網站特征,收集能反映釣魚網站的數據集;1、根據已有文獻,從URL、頁面信息和搜索信息三個方面爬取釣魚網站相關數據(100%)2、提出一種釣魚網站檢測方法2、根據已有的釣魚網站檢測模型,基于多融合的釣魚網站檢測方法(100%)3、提出一種特征處理算法3、提出多融合釣魚網站特征處理算法:完成情況:1)數據集的預處理(100%)2)數據的訓練和算法驗證階段(待完成)專利:[1]一種多特征融合的釣魚網頁檢測方法.(已投)[2]徐光俠,宋洋洋,劉宴兵,喬忠華,黃海輝,周密,楊奇毅.體域網中緊急數據優先傳輸調度方法.

專利號:201310230559.9(狀態已授權,交費過程中)論文:[1]GuangxiaXu.YangyangSong.APhishingDetectionAlgorithmBasedonMulti-featureFusion.

theCommunicationsandInformationSecuritySymposium.(已投)項目:[1]電子銀行/移動支付系統安全監控示范工程子課題(發改辦高技[2015]289號)[2]基于智慧城市建設中社區安全的多元數據采集分析研究與應用(cstc2016shmszx40001)…三、研究進度學位論文寫作計劃摘要Abstract目錄第一章緒論1.1研究背景及意義1.2國內外研究現狀1.3論文研究內容1.4論文結構安排第二章釣魚網站檢測技術概述2.1網絡釣魚攻擊技術2.2釣魚網站檢測2.3釣魚網站屬性提取方法2.4本章小結第三章基于多融合的釣魚網站特征構建方法3.1引言3.2基于多融合的釣魚網站特征構建模型及定義3.3算法原理及過程3.4實驗環境及過程3.5實驗結果分析3.6本章小結第四章基于多融合的釣魚網站檢測方法4.1引言4.2基于多融合的釣魚網站檢測模型及定義4.3算法原理及過程4.4實驗環境與過程4.5實驗結果分析4.6本章小結第五章結束語5.1主要工作與創新點5.2后續研究工作參考文獻致謝

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論