安防大數據技術難點分析與解決方案_第1頁
安防大數據技術難點分析與解決方案_第2頁
安防大數據技術難點分析與解決方案_第3頁
安防大數據技術難點分析與解決方案_第4頁
安防大數據技術難點分析與解決方案_第5頁
已閱讀5頁,還剩4頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優質文檔-傾情為你奉上安防大數據技術難點分析與解決方案2015-04-09 11:53:32 來源:CPS中安網 作者:鄧長春 責任編輯: sillyna 摘要:在安防領域,大數據具有廣闊的應用場景,帶來深度的價值。經過初步摸索,安防大數據也面臨一些技術難點。對于這些問題,我們分析安防行業特有的場景特點,探討一些貼切的解決方案,使得大數據技術更好地為安防業服務。    【CPS 】伴隨著大數據技術在IT領域的持續發展與成熟,大數據逐步滲透到各行各業。在領域,大數據具有廣闊的應用場景,帶來深度的價值。經

2、過初步摸索,安防大數據也面臨一些技術難點。對于這些問題,我們分析特有的場景特點,探討一些貼切的解決方案,使得大數據技術更好地為安防業服務。大數據當前在各行業的應用大數據技術發端于IT領域,當前在互聯網、電子商務中應用得最為成熟。Google公司根據用戶海量的搜索日志,成功預測病情在北美的蔓延情況;通過分析處理大量的語料庫,為用戶提供精準的在線翻譯。亞馬遜根據用戶過往的購買行為,分析出特定用戶群的購買“口味”,從而在自己的網站中提供精準的廣告推薦。而國內的淘寶網,通過分析網民瀏覽商品的日志,給買家提供到特定商品的關聯匹配。在其他行業,大數據的使用也屢見不鮮:在衛生行業,基于全民的電子檔案與電子病

3、歷庫正在構建。通過全民電子病歷庫,我們能分析全民的健康狀況,監控相關疾病的蔓延走勢,為做好衛生防范措施提供參考。在電力行業,通過分析大區域的用電記錄,能夠優化電力企業管理模式,提升企業經營水平,為基建決策提供有力參考,提高智能控制水平,加強電力的協同管理。同樣對于整個國家,通過分析用電情況,在宏觀掌握國家的經濟狀況,為制定經濟政策提供參考。在物流行業,通過分析大量以往的配送記錄,在宏觀上掌握大類物品的流向,提前把物品運送到特定區域,提高送貨效率。在國外,一家大型的超市,通過分析交通與商品大體流向,能在精確的時間范圍內,把特定類商品送到特定的門店,減少庫存時間,提高周轉率,創造企業利潤。同樣,在

4、安防領域,大數據也得到廣泛使用。大數據助力安防行業經過一段時間的摸索,大數據助力安防行業的發展取得相當的成效,部分企業如海康威視等已經有了較多的成熟項目案例。在智慧交通方面,海康威視借助大數據技術,交通管理系統能夠在惡劣的網絡環境,對城區交通要道進行拍攝與錄制,同時把圖片與視頻數據輸往后端的大數據處理平臺。通過后端大數據處理,識別繁忙的路段,提前做好交通分流措施。借助車牌識別技術,綜合各卡口的過車記錄,能夠分析特定車輛的運行軌跡。同樣,通過對大量行車違法記錄的模式識別,能在特定路段對具有違規傾向的車輛進行報警,比如在高架橋,高速公路上。通過對城市周邊主要卡口大量的行車記錄分析,能識別出異常的進

5、出城的記錄,做好防范措施。在公安執法方面,海康威視通過人臉識別技術,提高對犯罪嫌疑人追查的效率。通過對大量異常行為的模式特征提取,能提前判別違法行為,比如在火車站,通過對扒手外觀打扮,行為舉止,作案時的動作特征分析,能夠提前把嫌疑信息告知車站治安人員,提高執法的效率。在平安城市、,方方面面,安防大數據也引領很多新奇的應用。安防大數據當前面臨的技術難點然而,伴隨著大數據在安防領域越來越深入的應用,也突現出一些技術難點。在IT領域,大數據技術發展較為成熟,針對不同的應用場景有較為豐富的技術選型以及技術路線,其中很多技術可以移植應用到安防領域中。但IT與安防畢竟是兩個不同的領域,兩者之間存在很多不一

6、樣的地方。最大的不同,就是數據本身的不同,主要體現在一下方面:數據類型不同。在IT領域,大數據處理的對象往往是網頁索引、用戶行為、日志記錄等字符型數據,這些是結構化、方便計算識別處理的數據。而在安防領域,數據往往以圖片、音頻、視頻等非結構化的數據,往往計算機不能直接識別,這些數據只有在人面前才顯得有意義。數據量在數量級上的不同。在互聯網領域,單條日志記錄一般在一百字節之內,到了1PB的日志記錄,已經是一個足夠大的量。但在安防領域,一張普通的縮略圖就幾百KB,如果考慮高清攝像,高清視頻,這個數量要更大。一個普通的中等城市,在主要交通卡口拍攝的圖片,一年下來就能積壓幾個PB的數據,如果考慮視頻,這

7、個數據量更大。對數據的實時性要求不同。在互聯網行業,以日志型數據分析為主的典型應用中,對實時性要求沒那么高,比如淘寶的推薦系統,是否分析最近一個小時用戶的瀏覽記錄對于推薦效果關系不大。而在安防領域,前端攝像頭錄制的都是實時流,這是一個不間斷的數據流,最近錄制的數據超過一定時間沒有得到有效保存,將會永遠被丟失。針對安防領域與IT領域在數據本身上的異同,把適合IT領域常規的大數據技術搬到安防領域就會碰到一些技術難點,表現如下:存儲成本問題。在IT領域,海量的數據往往保存在分布式存儲系統中,為了提高數據的可靠性,一份數據往往復制成幾份相同的副本,分別保存在不同的節點中,當其中一些副本丟失時,可以從其

8、他節點讀出數據。比如在Hadoop中,一份數據往往在集群中保存了相同的3份。如果有1PB的原始數據,則至少要占用3PB的磁盤空間。而在安防領域,幾個交通卡口的視頻,在一個較短的時間內,如果不覆蓋之前的數據,就能輕易積壓幾個PB。由于圖像、音頻、視頻數據本身的量太大,生搬傳統的多副本策略成本過高,我們需要設計出一些更高效同時不損失可用性的方案。小文件存儲問題。這個問題是大數據技術面臨的一個共性問題,但在安防領域可能又突現得較為嚴重。在互聯網,小文本、圖片、音樂都是小文件,當層積較多時,都面臨如何存取這些海量小文件的問題。而在安防行業,小文件主要以圖片為主,比如一個城市的主要交通卡口在一年內,就能

9、產生百億張圖片。對于這些海量的小文件的存儲,涉及到大量元數據的管理,保證存取的性能是問題的關鍵。當然,問題并不可怕,通過分析研究安防應用場景,我們摸索出一些貼合安防大數據的解決方案。解決問題的方向引入擦除碼(ErasureCode)技術,節省存儲空間。擦除碼是一個在通信理論中的術語,其基本思想就是:一條原始信息由K個符號構成,在信息發送前,通過某種具有冗余功能的數學映射,生成由(K+M)個符號組成的編碼后的信息,然后把編碼后的信息通過信道發送給接受方,由于信道的不可靠特性,在信息傳輸的過程中可能會丟失幾個符號,接受方在接受到信息后,只要丟失的符號不超過M個,則接受方在剩余的符號中通過逆向的數學

10、變換,能還原出由K個符號組成的原始信息。圖-1:信息在信道中的傳輸過程如上圖所示:原始信息由A、B、C三個符號組成,現在通過編碼函數f對其進行編碼,生成編碼后的信息為a、b、c、d、e,編碼后的信息在信道上進行傳輸,在傳輸的過程中由于某種原因符號a與b丟失了,接受方只接受到了三個符號c、d、e,接受方通過解碼函數-f(實際上就是編碼函數的逆函數)進行解碼,能夠計算出原始的信息A、B、C。由上可看出,信道雖然不可靠,但在信道上丟失的兩個符號并不影響我們整個信息的傳輸,我們唯一要做的工作就是在發送信息前與接收信息后做一定的編碼與解碼工作。受上面思想的啟迪,在分布式存儲系統中,一個大文件分成若干塊,

11、這些不同的塊分發到不同的節點中,現在假設一個文件由K個數據塊組成,我們通過編碼后變成(K+M)個編碼塊,再把這(K+M)個編碼塊分發到不同的節點中。現在由于集群中幾個節點失敗,丟失了幾個塊,只要丟失的塊數不超過M,我們依然能從其他節點中讀入K個編碼塊,通過解碼運算,得出我們之前的K個數據塊,也就還原出那個完整的文件。而在分布式系統中,超過M個數據節點同時失效的可能性很小,由此可以看出,雖然存在節點失敗的情況,但依然不影響我們數據存儲的可靠性。這里引入額外的存儲空間為(M/K)倍,而傳統的N副本策略,引入的額外存儲空間為(N-1)倍,通過調節M與K的關系,我們能把存儲空間降到1.3倍,這與傳統H

12、adoop占用存儲空3倍相比,具有巨大的節省價值。在工程實踐中,我們通過數據分條帶,優化編碼分組策略,進行高效快速的編解碼計算,既保證數據存取的性能,又節省了大量的磁盤空間。如圖-2,數據橫向分條帶,同一個條帶內,左邊為原始數據(K=4),右邊為編碼后的數據(M=2),存儲時,把同一個條帶內的所有數據分發到分布式系統上的不同節點。當處于同一個條帶內的數據丟失塊數不超過2時,依然能從剩下的數據塊中通過解碼計算出原始的數據。圖-2:數據分條帶,進行編碼存儲建立索引,小文件合并成大文件集中存儲。對于大量的數據,單機無法存儲,借助分布式存儲技術,將數據分散存儲到不同的節點上。但主流的HDFS分布式存儲

13、系統適合存儲少量的大文件,就是文件個數較少,但單個文件的很大。如果大量的小文件樸素的存放在HDFS中,由于要管理的元數據巨大,嚴重印象集群的可擴展性,以及文件本身的存儲性能。解決問題的思路是,把大量的小文件合成一個大文件,同時對這些小文件建立索引,索引信息集中管理。當要讀取文件時,先查找索引信息,根據查找出的索引信息再定位到那個大文件具體位置,讀出小文件。圖-3小文件合成大文件,并且建立索引如圖-3,上面為把若干小文件合成一個大的文件,下面為針對這些小文件建立的索引,所有的索引又合成一個索引文件。在工程實踐中,我們又對索引文件的結構進行了優化,引入了哈希索引結構,由于哈希定位過程相當過,所以提升了小文件的讀取性能。同時,由于索引文件很小,我們除把索引文件持久化到底層文件系統,還同時把索引信息讀入內存,這樣極大提升了文件存取效率。結語隨著大數據技術的逐步發展與深入應用,它會給我們帶來越來越多的潛在價值。當安防行業進入就計算化時代后,各種前端設備采集大量的圖片、音頻、視頻,這個數據在一個較小的區域一個較短的時間內,就能積攢海量的數據,要掌握并且成功挖掘出這些數據的價值,更好的為安防服務,急需我們掌握大數據技術。目前,安防行業僅有海康威視等極個別企業掌

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論