人工智能在電信實名認證中的關鍵技術及應用_第1頁
人工智能在電信實名認證中的關鍵技術及應用_第2頁
人工智能在電信實名認證中的關鍵技術及應用_第3頁
人工智能在電信實名認證中的關鍵技術及應用_第4頁
人工智能在電信實名認證中的關鍵技術及應用_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

人工智能在電信實名認證中的關鍵技術及應用姚慧;馬思研【摘要】應國務院及工業和信息化部的實名制要求,結合運營商業務轉型的需要,提出了一種基于人工智能技術的在線身份認證解決方案.首先介紹了基于深度學習技術的實名認證系統架構,分別對系統的4個模塊和系統整體特點進行詳細闡述.其次論述了應用在實名認證系統中的人證比對與識別、證件OCR、靜默活體和視頻認證等關鍵技術,介紹了身份認證解決方案的應用現狀,此外分別從安全性的角度介紹了實名認證業務場景中抵御攻擊的手段,從性能的角度分析了本方案在實際應用中取得的良好效果.最后,分析了人工智能技術在運營商業務領域中應用問題,并探討了未來基于實名認證的產品研發方向.期刊名稱】《電信科學》年(卷),期】2019(035)005【總頁數】8頁(P51-58)【關鍵詞】實名認證;深度學習;身份認證【作者】姚慧;馬思研【作者單位】中移在線服務有限公司,河南鄭州450001;中移在線服務有限公司,河南鄭州450001【正文語種】中文【中圖分類】TP393移動互聯網技術的發展促進了現代服務業的蓬勃發展,利用網絡提供遠程服務成為電信、銀行、證券、基金、保險等金融行業的發展趨勢。作為業務辦理和風險控制的關鍵環節,驗證客戶身份是業務提供方發展線上業務需要解決的首要問題。傳統業態的客戶認證多通過網點面簽的方式實現,存在運營成本高、覆蓋面不足、體驗不佳、耗費成本巨大等問題。在互聯網新業態下,很多公司對高效、準確地實現遠程客戶身份認證具有迫切需求。目前對客戶認證的需求主要分布在金融、電信政府等行業,這些行業各自獨立,重復投入,集約化程度不高,信息沒有共享,設計系統、全面、方便信息共享的遠程客戶認證系統存在巨大市場需求。2012年全國人民代表大會常務委員會出臺了《關于加強網絡信息保護的決定》,規定了一些重要的制度安排,要采取措施保護網絡信息。工業和信息化部(簡稱工信部)也隨即出臺了《電信和互聯網用戶個人信息保護規定》,就進一步強化安全防護措施、健全管理制度、落實安全責任,做了一些具體的規定,即《電話用戶真實身份信息登記規定》,拉開了電信運營商實名制工作序幕。規定要求用戶在辦理電話入網手續的時候,需要向電信企業出示有效證件、提供真實的身份信息,配合做好相關信息登記工作。人工智能、大數據與云計算、芯片等面向未來的核心技術,正在加速各行業發展與技術變革,高效的人工智能正在逐步取代傳統的服務方式[1],本文介紹了一種基于深度學習的圖像視覺技術的整套實名制身份認證解決方案,闡述了實名認證系統架構和關鍵的深度學習技術,重點介紹了人工智能技術在電信多產品形態中實名認證環節的應用情況。基于深度學習技術的實名認證系統,是在原有的實名認證系統中增加核心域的功能模塊,系統架構示意圖如圖1所示。系統主要分為4個模塊:客戶端、接入域、能力域和存儲域。整體采用前后臺分離模式,后臺采用云化部署方案,保證客戶端快速通過網絡接入系統,后端管理系統可通過網絡隨時隨地登錄管理。同時,所有內部接口及外部接口均統一設計風格,便于第三方對接開發。此外,整個系統系統采用模塊化設計,可以根據需求選擇不同模塊進行自由組合,數據在平臺中打通統一管理。客戶端:主要面向用戶,整合算法引擎輸出結果和業務校驗結果,向用戶反饋業務審核消息;提供對外接口,支持與第三方系統進行基礎數據的互通。存儲域:用于存儲各類解析后的解碼視頻文件、音頻文件、人像、業務流水信息及日志信息。數據存儲部分:針對業務中沉淀的海量圖片,采取分布式存儲方案,分別存放于多臺物理主機硬盤中,在存入圖片的同時將圖片的相關基本信息存放于MySQL、Oracle等關系型數據庫中,以便實名認證業務進行調用,同時為確保相關數據信息安全,圖片數據和圖片信息在存儲時都進行了脫敏加密,存儲模塊示意圖如圖2所示。接入域:用于實現請求源調度和搭建外網通信協議。能力域:用于提供數據處理、解析服務和日志管理能力。服務解析能力包括人臉識別、OCR、靜默活體、視頻解析和語音識別;數據處理能力包括各種數據的存儲管理、資源調度、對外數據訪問服務、數據檢索服務及大數據分析服務。實名認證系統及能力建設,采取前后臺分離模式,統一承擔全網實名制人工智能技術的實施和部署,并擴展前后臺分離模式應用領域,致力于建立“前端屬地化、后端集中化”的低成本高效運營體系,將實現姓名、身份證號聯網校驗能力,并逐步發展迭代增加人像聯網校驗功能,形成全套的信息采集及聯網查驗解決方案,提高了實名認證的精確度。實名認證系統具備以下特點。(1)前后臺分離模式基于前后分離模式的認證技術,采用“互聯網+”模式,前端僅對客戶信息進行采集,并將所有采集到的密文信息傳到后臺服務器進行全網集中解密識別和認證,其中,客戶信息獲取方式包括NFC方式讀取有效證件信息、身份證件拍照上傳、手動錄入、客戶現場抓拍照,通過上述渠道采集后的信息進行加密傳輸,回傳至實名認證后臺進行信息解密和人證一致性校驗。前后臺分離模式示意圖如圖3所示。(2)多元校驗方式,嚴控信息安全信息安全主要包括:信息的安全傳遞和信息的安全存儲。本文介紹的系統通過運用IMEI、IMSI、隨機碼校驗、錯誤操作次數控制、清除緩存及離線數據、信息傳輸加密等多種手段保障信息安全。信息的安全存儲:該系統涉及用戶信息等高敏感數據,因此采用了高可靠性的數據庫管理系統與物理存儲功能,對客戶資料等敏感信息采用“軟+硬”雙重方式的加密存儲,數據庫采用嚴格的權限管理,具備備份與恢復功能;此外增加數字簽名措施,采取控制臺安全、機器物理隔離、保護安裝介質等多重手段,保證數據存放的可靠性、完整性、保密性。信息的安全傳遞:在系統內部進行處理時,數據嚴格執行不允許出系統的系統安全限制要求,涉及外部系統的訪問,必須采取安全性更高的HTTPS加密方式,信息傳輸采用“軟+硬”的雙重加密方式,雙方根據唯一密鑰進行傳輸數據的加解密,密鑰獲取采用系統接口級方式,確保雙方數據傳輸的安全性、不可獲取性。實名認證系統中廣泛使用了深度學習技術:利用先驗知識搭建神經網絡模型,不斷地從線上獲取各業務場景中的數據,自動學習并獲取數據的特征表達。經過有限次的迭代后,模型可以根據提供的數據進行決策(分類或回歸),算法模型訓練流程如圖4所示。首先通過對學習任務和具體業務場景的分析選取適合的網絡結構搭建深度網絡模型或直接選取開源的預訓練模型,即初始模型架構。對歷史數據(包括圖片、視頻和音頻)進行數據清洗以及必要的預處理,獲取可以用于訓練和測試的樣本數據。隨后經過有限次的模型迭代(即模型的訓練)和遷移學習后,獲取具有較好效果的第一代模型。將第一代模型存儲在AI算法模型倉庫中,進入線上環節。服務上線后,系統將自動獲取、存儲線上采集到的實際場景數據并將其發布為標注平臺的任務,采用人工或半自動的標注方式進行數據標注,因此系統將不斷地獲取新的訓練數據,從而不斷優化本文的模型倉庫中存儲的模型。通過版本管理功能對模型版本進行管理,評估并選取更優的模型替換線上模型。通過這一閉環訓練平臺,可以自動地進行模型的迭代和優化,不斷地提高系統的識別準確率。本文的實名認證系統中涉及的深度學習技術主要為人證比對與識別、身份證OCR、身份證件信息讀取與認證、視頻活體檢測和語音識別等。人臉識別是基于人的臉部特征信息進行用戶身份認證的一種生物識別技術[2]。人證比對與識別是特定于身份證人臉圖像與現場照進行比對識別的人臉識別任務。整個流程一般包含圖像采集、人臉檢測、人臉圖像預處理、人臉特征提取和人臉識別5部分。(1)圖像采集通過攝像機或手機攝像頭等前端設備獲取包含人臉的視頻或圖像。(2) 人臉檢測人臉檢測即從圖像中檢測得到人臉位置的技術。傳統的人臉檢測方法使用人工設計的特征如直方圖特征、顏色特征、模板特征、結構特征及Haar特征等,訓練得到一個多尺度分類器,對人臉區域和背景區域進行分類,進而定位出人臉區域;深度學習方法則使用深度神經網絡從數據中學習適合人臉檢測使用的深度特征。通過學習得到的特征往往比傳統人工設計的特征要更優,基于深度學習的人臉檢測方法在精度方面要優于傳統方法。(3) 人臉圖像預處理在得到人臉檢測框位置之后,人臉圖像需要經過對齊操作,將人臉大小歸一化到統一尺度,并消除人臉姿態對于后續人臉識別的影響。通常的做法是定位出人臉面部若干個關鍵點,并根據這些關鍵點進行尺度歸一和人臉姿態矯正,最終得到一張便于做人臉識別的人臉圖像。(4)人臉特征提取目前主流的人臉特征提取方法是采用深度學習算法搭建深度網絡模型,使用海量數據訓練,獲取最能表征人臉身份信息的特征的提取方式。根據損失函數,可以分為基于度量學習的方法和基于分類的方法。基于度量學習的方法核心出發點是讓同一個人的人臉圖像經過特征變換以后盡量靠近,不同人的人臉圖像盡量拉遠,典型的方法包括ContrastiveLoss[3]和TripletLoss[4]。基于分類的方法即使用SoftmaxLoss對訓練集中所有人進行分類學習。為了使類內收縮更緊,類間拉到更開,在傳統SoftmaxLoss基礎上引入Margin變量,通過引入該變量提升人臉識別特征的判別能力,典型的方法包括Large-MarginSoftmaxLoss[5]、SphereFace[6]、CosFace[7]和ArcFace[8]。此外,隨著人臉數據的不斷增加,如何基于上千萬人的人臉圖像進行高效大規模訓練成為學術界和工業界研究的熱點問題。(5)人臉識別人臉識別是指通過計算前端設備獲取的人臉圖像的特征與數據庫中存儲的人臉特征的相似度來判斷是否為同一人的過程。在實名認證系統中,主要為兩個應用方向:一是確認,即前端設備采集到的人臉圖像特征與數據庫中存儲的人臉特征進行一對一的比對,通過設定的閾值來判斷是否為同一人;另一類是辨認,是前端獲取的人臉圖像的特征與數據庫中多個人臉特征的一對多的比對過程。1:1的人臉識別技術可以用于登錄驗證、身份識別等應用場景。通過人臉識別技術可以幫助用戶快速判定兩張照片是否為同一個人、判定視頻中的人臉是否為目標人臉并支持實時識別認證,還可以實現身份和人臉綁定等功能°1:N人臉識別技術可以將目標人臉圖片與人臉庫自動識別,返回識別信息來判斷目標人臉身份。OCR(opticalcharacterrecognition,光學字符識別)是指將圖片中的文字內容轉換為可編輯文本的過程[9]。一般來說,實名認證系統中證件OCR技術主要包括3個步驟:證件檢測、文本檢測和文字識別。(1) 證件檢測:在圖片中定位證件的角點信息或邊緣信息。通過證件檢測可以去除證件區域外的干擾信息,提高特定場景下OCR準確率。(2) 文字檢測:首先使用透視變換等圖像處理手段將上一步中得到的證件區域矯正為矩形區域,然后在該區域內定位出需要識別的文本所在區域。傳統的文字檢測算法包括MSER[10]、SWT[11]、Multi-Oriented[12]等,隨著深度學習算法的不斷發展,各種基于深度學習的文字檢測算法也層出不窮,如PhotoOCR[13]、YOLO[14]、EAST[15]等。在實名認證系統中,采用EAST算法準確定位需要識別的關鍵字段,同時屏蔽無關信息字段,提高了整套OCR算法的識別準確率。(3) 文字識別:將檢測到的文本區域切片識別成文本。早期的文字識別算法需要對文本行進行字符切割,然后對單個的字符進行分類,從而達到文本行識別的目的本文采用CNN[16]、RNN[16]以及CTCLOSS[16]結合的方法,根據文字上下文直接識別整行文字,識別流程更加簡化,效率更高,并具有更高的識別準確率。靜默活體檢測技術是針對配合式的活體檢測技術提出的一種活體檢測技術。配合式的活體檢測技術通常需要用戶根據設備的提示做出指定動作來幫助算法確認用戶是否為真人,但是這種檢測技術存在用戶體驗較差和有攻破風險等弊端[17-18]。通過大量的數據分析,可以知道真人拍攝樣本和非真人直接拍攝的樣本(播放設備翻拍、照片或面具等)存在著特征區別,如邊框、反光、摩爾紋、分辨率和對比度等。基于這樣的原理,本文采用深度學習算法,設計了一個深度卷積網絡來學習區分這些正負樣本,實現了僅需一張靜態照片即可判別是否為真人的靜默活體檢測技術。用戶僅需在前端圖像采集設備前停留較短的時間,算法通過分析視頻流中的一幀或多幀圖像即可判斷是否為真人用戶辦理業務,通過融合多幀檢測的結果,可以進一步提升靜默活體檢測的精度,配合人臉識別技術,保證業務辦理的高度安全。公安部認證身份信息能力,主要指通過對公民身份證號碼及姓名的真實性、一致性進行驗證,返回驗證通過與否的結果。其中獲取公民身份信息的方式有如下兩種。(1)通過OCR識別獲取用戶身份信息,實時公安部數據庫聯網比對,驗證身份信息真偽。(2)通過在NFC手機上安裝App,實現NFC讀取身份證芯片信息,并與后端認證系統連接進行后端解碼,同公安部數據庫進行聯網比對,查驗證件信息真實性,核驗證件真實性。自動語音識別(automaticspeechrecognition,ASR)技術是將用戶錄制朗讀隨機碼視頻中的語音轉為文字,并進行隨機碼一致性比對。此技術基于電信行業數千萬小時的標注語音數據,應用業界先進的端到端的深度學習模型進行訓練,得到更加貼近實際業務場景的核心引擎,全面滿足電話錄音質檢、視頻認證等多種場景下的語音轉文字需求。目前基于深度學習的語音識別模型主要包括兩種:一種是將深度學習模型替換GMM部分,得到DNN-HMM模型;另外一種是端到端的深度學習模型。其中基于端到端的模型主要包括基于CTC解碼模型、基于Attention解碼模型以及混合CTC與Attention共同解碼模型[19],可以支持多語言體系和多方言的訓練,例如26個英文字符,數字、中文等語言,此外在實時預測部分耗時更短,更有利于業務應用。云存儲[20]是在云計算的概念上延伸和發展出來的一個新概念,是指通過集群應用、網格技術或分布式文件系統等功能,應用存儲虛擬化技術將網絡中大量各種不同類型的存儲設備通過應用軟件集合起來協同工作,共同對外提供數據存儲和業務訪問功能的一個系統,也可將云存儲理解為配置了大容量存儲設備的一個云計算系統。在全網推廣的過程中,基于人工智能技術的實名認證系統不僅要關注技術在復雜場景下的準確率,更要關注人工智能技術與運營商業務的緊耦合性。鑒于目前人工智能技術還有待進一步優化,在應用場景中仍有誤識別情況存在,造成用戶體驗較差針對該問題,本文介紹了兩種解決方法,提升認證的安全性和準確性。(1)核心能力的保障與提升后臺人工審核環節作為實名認證重要組成部分,在審核高風險業務、及時發現作假手段上作用顯著。面向后臺審核人員打造界面優化、操作便捷的專業化審核系統至關重要。通過引入搶單模式,將工單數據導入內存,快速推向審核人員,極大縮短前端信息采集到后臺審核時間,后臺工單審核效率明顯提升。審核界面引入快捷鍵操作,工單審核完成后進行快速頁面切換,審核照片支持縮放和旋轉,便捷支持后臺工單審核。人工審核服務功能的加入,可以在系統識別校驗基礎上,增加后臺渠道集中化稽核,由人工進行二次確認,提升審核結果的準確率。(2)適應多場景的全流程實名認證解決方案身份信息認證環節,線下創新性開發NFC+App實名認證方式,通過二代證讀卡器解耦,將SAM核心解碼模塊部署在云端統一解碼;同時開發App,引入NFC的技術,通過手機或者讀頭的NFC功能讀取身份證芯片信息(密文),將密文發向云端進行解碼,解碼信息通過App在前端手機顯示,實現低成本、便捷支撐實體渠道實名認證。線上通過接入公安部身份信息查驗中心,打造支持高并發、低時延實時驗證能力。人證一致性驗證環節,通過自主研發國內領先人臉比對與識別技術和活體檢測技術,在保證身份信息真實基礎上,通過活體檢測保證驗證人為現場操作,通過實時抓取人臉照片與公安部照片進行人臉比對,保證認證一致性。線上利用人像比對技術,提供電渠售卡的認證服務;利用網頁和H5的形式在不改變省端流程的情況下靈活嵌入,通過OCR、公安聯網查驗及人像比對+人工審核的方式,實現線上售卡的自助激活工作,為客戶提供了便捷的認證方式。以上實名認證能力支持通過App、H5、Web等多模式進行接入,同時支持線上線下身份信息認證、人臉比對與識別、身份信息證件OCR、活體檢測等多模塊靈活配置適應實際業務場景。本文介紹了基于人工智能技術的在線身份認證場景下的解決方案,首先描述了實名認證系統架構以及系統子模塊功能,重點講解了應用到該系統中的人臉比對與識別證件OCR、靜默活體檢測以及語音識別技術的主流實現方法。其次,從業務的安全性和性能角度考慮,本文介紹了系統在實際業務場景中的應用現狀和產品形態。從實踐情況來看,該系統不僅節約了時間和人力成本,簡化了認證流程,提高了身份認證的精確度,也有利于未來提高移動支付等功能的安全性,增強接入其他互聯網應用的便利性,并能夠有效打擊通信詐騙犯罪,為移動用戶提供一個安全的移動互聯網使用環境。姚慧(1991-),女,中移在線服務有限公司工程師,主要從事圖像處理相關算法引擎的研究與開發工作,主要研究方向包括人臉識別、物體檢測與識別、圖像檢索和通用OCR等。馬思研(1989-),女,中移在線服務有限公司工程師,主要從事圖像領域內深度學習算法的研究與開發工作,主要研究方向包括人臉識別、OCR等。【相關文獻】王志宏,楊震?人工智能技術的哲學集系統性思考[J].電信科學,2018,34(4):12-21.WANGZH,YANGZ.Philosophyandsystematicthinkingofartificialintelligencetechnology[J].TelecommunicationsScience,2018,34(4):12-21.山世光?人臉識別中若干關鍵問題的研究[D].北京:中國科學院計算技術研究所,2004.SHANSG.Studyonsomekeyissuesinfacerecognition[D].Beijing:InstituteofComputingTechnology,ChineseAcademyofSciences,2004.MANGZB,LIUP,CAIJ,etal.Identity-awareconvolutionalneuralnetworksforfacialexpressionrecognition[J].JournalofSystemsEngineeringandElectronics,2017,28(4):784-792.HERMANSA,BEYERL,LEIBEB.Indefenseofthetripletlossforpersonre-identification[J].arXiv:1703.07737,2017.LIUWY,WENYD,YUZD,etal.Large-marginsoftmaxlossforconvolutionneuralnetwork[J].arXiv:1612.02295,2016.LIUWY,WENYD,YUZD,etal.SphereFace:deephypersphereembeddingforfacerecognition[J].arXiv:1704.08063,2017.WANGH,WANGYT,ZHOUZ,etal.CosFace:largemargincosinelossfordeepfacerecognition[J].arXiv:1801.09414,2018.DENGJK,GUOJ,XUENN,etal.ArcFace:additiveangularmarginlossfordeepfacerecognition[J].arXiv:1801.07698,2018.汪一文.深度卷積神經網絡在OCR問題中的應用研究[D].成都:電子科技大學,2018.WANGYW.TheresearchandapplicationofdeepconvolutionneuralnetworkinOCRproblem[D].Chengdu:UniversityofElectronicScienceandTechnologyofChina,2018.NEUMANNL,MATASJ.Amethodfortextlocalizationandrecognitioninreal-worldimages[C]//AsianConferenceonComputerVision(ACCV2010),Nov8-12,2010,Queenstown,NewZealand.Heidelberg:Springer,2010:70-783.EPSHTEINB,OFEKE,WEXLERY.Detectingtextinnaturalsceneswithstrokewidthtransform[C]//IEEEConferenceonComputerVisionandPatternRecognition(CVPR2010),June13-18,2010,SanFrancisco,USA.Piscataway:IEEEPress,2010:2963-2970.YAOC,BAIX,LIUWY.Detectiontextsofarbitraryorientationsinnaturalimages[C]//IEEEConferenceonComputerVisionandPatternRecognition(CVPR2012),June16-21,2012,Providence,USA.Piscataway:IEEEPress,2012:1083-1090.BISSACCOA,CUMMINSM,NETZERY,etal.PhotoOCR:readingtextinuncontrolledconditions[C]//IEEEInternationalConferenceonComputerVision,Dec1-8,2013,Sydney,Australia.Piscataway:IEEEPress,2013:785-792.REDMONJ

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論