



版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數據與檔案管理上海大學圖書情報檔案系2013年12月1.大數據概述除了上帝
任何人都必須用數據來說話1.1大數據的定義大數據是指其大小超出了典型數據庫軟件的采集、存儲、管理和分析等能力的數據集。
——麥肯錫研究院(MGI)大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。——高德納(GartnerGroup)大數據指的是如此大而復雜以致現有的數據管理工具或傳統數據處理手段無法處理的數據集。——維基百科(Wikipedia)康奈爾大學計算機科學家JonKleinberg稱,“大數據這個術語本身很模糊,但在某些方面卻又非常具體,大數據是可能改造一切的一種過程的標簽”。對于處在探索期的大數據研究來說,與其準確地予以限定性分析,倒不如更多地將精力放在對其特征、內涵的探尋和運用的研究之中。從研究者角度而言,與其尋找一個公認的定義,倒不如去分析這樣的問題:當大數據來臨時,就某一具體的業務(如數字檔案館、電子文件等)而言,我們是否可以富有想象力地回答,大數據究竟會對某一特定領域帶來何種影響,以及人們面對這些影響所獲得的機遇是什么?這才是我們跨學科研究的旨義所在,而這無疑具有更加重要的意義。1.2大數據的特征(4V)大量(Volume)數據中的數據不再以幾個GB或幾個TB來衡量,而是以PB(1千個T)、EB(1百萬個T)或ZB(10億個T)為計量單位。IDC2011年6月報告顯示,全球數據量在2011年已達到1.8ZB,“如果把所有這些數據都刻錄存入普通DVD光盤里,光盤的高度將等同于從地球到月球一個半來回,也就是720000英里。相當于每位美國人每分鐘寫3條Twitter,而且還要不停地寫2.6976萬年”。速度(Velocity)大數據往往以高速實時數據流的形式動態產生,具有很強的時效性。2010年,據英國研究咨詢公司Coda預測,移動網絡數據流量在未來五年有望增長40倍,用戶上傳的內容將爆發式增長。對大數據的處理速度要非常快。傳統數據倉庫系統、BI應用都是批處理方式,但對于大數據應用,必須進行實時數據流處理。比如對于災難的預測,需要很快地對發生的程度、影響的區域范圍等進行量化。多樣(Variety)一是數據來源多,隨著科技的發展,大數據數據來源和承載方式多種多樣,如微博、社交網站、傳感器等,數據處于分散狀態。二是數據類型多,包括結構化數據(如企業、行業內數據)、半結構化數據(物聯網數據)、非結構化數據(互聯網數據),并且據Gartner預計,2012年“半結構和非結構化的數據,諸如文檔、表格、網頁、音頻、圖像和視頻等將占全球網絡數據量的85%左右”。價值(Value)由于大量有用與可能沒用的數據并存,因此大數據可謂是“遍地都是金子,又遍地都是沙子”。一方面,大數據的價值密度較低,以視頻監控為例,在連續不斷的監控流中,可能僅有一兩秒的影像是有用的數據。另一方面,雖然單條數據并無多大價值,但龐大的數據量則是一座“富礦”,將已有的結構化與非結構化數據進行融合、分析后,將會從中挖掘出極高的價值。特別是競爭激烈的商業領域,數據正成為企業的新型資產,企業都在追求數據價值的最大化。1.3大數據的認識誤區大數據之大并不僅僅指容量在大數據的認識上,很多人存在這么一個誤區:只有幾百TB乃至PB的數據才能稱之為大數據。事實上,“大數據并非總是說有數百個TB才算得上,根據實際使用情況,有時候數百個GB的數據也可稱為大數據,這主要看它的第三個維度,也就是速度或時間維度”。事實上,解決一個問題的數據規模有一個閾值。“數據少于這個閾值,問題解決不了;達到這個閾值,就可以解決以前解決不了的大問題;而數據規模超過這個閾值,對解決問題也沒有更多的幫助”。今天的大數據將不再是明天的大數據當前,大數據的定義是相對于目前的技術和資源而言的,隨著時間的推移,處理數據的工具和技術、原始存儲空間和處理能力的提升,大數據的界定也必然會發生變化。今天的大數據明天可能不再被認為是大數據,就像10年前的大數據在如今看來什么都不是一樣,大數據會繼續演進下去。如今,在數據容量、速度、多樣性、復雜度等方面被認為是不可能的或無法想象的事情、幾年過后情況會完全不同,這是一個多年不變的定律,在大數據時代也同樣適用。大數據的價值在于分析與應用很多人認為,正是由于大數據的大容量、高速和多樣性,才使得他們比其他數據更具有優勢且更重要。然而,“大”和“數據”都不是大數據中最重要的。事實上,擁有任何一個數據集,無論它們多大或者多小,其自身都不會帶來任何價值。被收集來的數據如果從不使用,不會比存放在閣樓或地下室的垃圾更有價值。大數據的價值體現在如何分析它們,并采取怎樣的措施來提升本身的業務水平。換言之,數據即服務。大數據是一種服務變革本質而言,大數據是信息爆炸時代對數據核心價值的再挖掘,其中綜合運用到去冗降噪技術、語義引擎、可視化分析等,因此被很多專業人士認為是繼云計算、物聯網之后IT行業的又一次顛覆性變革。事實上,大數據“不僅僅是技術變革,更實質上的是計算機服務時代的來臨,對數據的抽絲剝繭、總結結論更體現了計算機行業正從技術供應型轉為服務供應。1.4大數據與云計算、數據挖掘的區別首先,本質上,云計算改變了IT,而大數據則改變了業務。云計算的目的是通過互聯網更好地調用、擴展和管理計算及存儲資源和能力,因而從根本上改變了單位的IT架構。大數據使得企業從“業務驅動”轉變為“數據驅動”,從而改變了企業的業務架構。其次,云計算與大數據的目標受眾不同。云計算的主要推動力量是存儲及計算設備的生產廠商和擁有計算及存儲資源的企業,因此云計算是賣給CIO的技術和產品,是一個進階的IT解決方案。大數據的直接受益者不是IT部門,而是業務部門,產業發展的主要推動力量是從事數據存儲于處理的軟件廠商和擁有大量數據的企業,因此是賣給CEO、業務層的產品。換言之,云計算與大數據實際上是工具和用途的關系。云計算為大數據提供強大的存儲和計算能力,更加迅速地處理大數據的豐富信息,并更方面的提供服務;來自大數據的業務需求,能為云計算的落地找到更多更好的實際應用。如果說云計算為數據資產提供了保管、訪問的場所和渠道,那么如何盤活數據資產,使其為國家治理、企業決策乃至個人生活服務,則是大數據的核心議題。總之,大數據處理會利用到云計算領域的很多技術,但大數據并非完全依賴于云計算;反過來,云計算之上也并非只有大數據這一種應用,“云計算和大數據共同引領以數據為原料,計算為能源的又一次生產力的大解放,甚至可以與以蒸汽機的使用和電氣的使用為代表的第一次工業革命和第二次工業革命相媲美”。首先在數據量上,傳統的數據挖掘通常是存儲在數據庫或者文件中的數據,數據量相對較小,一般為TB級以下,大數據技術能實現對PB量級數據的處理,因此,大數據時代將實現從樣本數據到全體數據處理的轉變。其次,在數據特性上,傳統的數據挖掘一般只能對結構化信息進行處理,處理的信息大多是非實時信息,大數據技術能夠實現對結構化、半結構化特別是非結構化信息的處理,處理的信息大多是實時信息。最后,兩者的分析手段與方法也有差別,傳統數據挖掘的主要算法以統計學為基礎,分類和預測是兩種常見的數據分析形式,主要包括探索性數據分析(ExploratoryDataAnalysis,EDA)和驗證性數據分析(ConfirmatoryDataAnalysis,CDA),而大數據挖掘不僅僅需要統計學方法,還大量使用了機器學習、人工智能、知識圖譜等算法。大數據與數據挖掘大數據時代的來臨,標志著傳統數據挖掘方法已經不再適應日新月異的數據環境,在數據采集、數據存儲、數據分析以及可視化等諸多方面捉襟見肘。當然,大數據這一概念之所以能夠引發共識成為當前熱點,最為重要的是,各個行業領域具有了對大數據分析和利用的巨大現實需求和具體應用需求。顯然,這些都不是傳統數據挖掘所能解決的,而這也正是是眾多IT企業將大數據定義為現有處理工具或手段無法處理的數據集的原因所在。1.5大數據應用大數據在商業中的應用大數據就像貨幣或黃金一樣,是一種新型的經濟資產。——2012.1達沃斯世界經濟論壇《大數據,大影響》大數據在社會管理中的應用“Google登革熱趨勢”,利用搜索數據近乎實時地估計登革熱在全球的傳播情況。(藍色——該系統估計數據;橙色——巴西官方統計數據)美國流感傳染率的官方數據與基于Twitter的數據比較1.6大數據發展(宏觀)在大數據發展上,美國是第一個吃“螃蟹”的國家。美國的大數據計劃萌芽于“數據開放運動”,2009年5月21日,Data.Gov上線發布,在其目標和使命陳述中指出,Data.Gov的主要目標是“開放聯邦政府的數據,通過鼓勵新的創意,讓數據走出政府、得到更多的創新型運用。Data.Gov致力于政府透明,全力把政府推向一個前所未有的開放高度。它帶來的開放將鞏固我們國家的民主,提高政府的效率和效能”。美國2012年3月29日,奧巴馬政府發布《大數據研究和發展計劃》,旨在提高從海量、復雜的數據中獲取真知灼見的能力,加速在科學與工程領域創新步伐,增強國家安全,轉變教育和學習模式。根據這個計劃,美國政府將開發及加強大數據系統,使之能夠進行數據采集、保留、存儲、管理、分析,以及分發大數據分析的結論。對此,奧巴馬政府組建了“大數據高級指導小組”,以協調政府在大數據領域的兩億多美元投資。此舉標志著,美國把應對大數據技術革命帶來的機遇和挑戰,上升到國家戰略層面,形成了全體動員格局。2010年1月,英國政府的數據開放網站正式出臺:Data.Gov.uk。除去地理信息之外,該網站公布了3000多項民生數據。而這個時候,美國的D雖然已經運營了半年多,卻還僅僅只有1000多項民生數據。2010年5月,戴維.卡梅倫出任首相后,提出了“數據權”(RighttoData)的概念,指出“數據權”是信息時代每一個公民都擁有的一項基本權利,并承諾要在全社會普及“數據權”。2012年11月,英國政府發布新的政府數字化戰略,旨在使政府服務實現“默認數字化”,承諾2015年前開放有關交通運輸、天氣和健康方面的核心公共數據庫,并投資1000萬英鎊建立世界上首個“開放數據研究所”(OpenDataInstitute)。英國2013年6月,日本公布了新的IT戰略——創建最尖端IT國家宣言,全面闡述了2013-2020年期間以發展開放公共數據和大數據為核心的日本新IT國家戰略。值得注意的是,在日本的大數據產業發展中,很多專業人士提出“在進一步充分利用匿名化技術,制定合理、活用的大數據規則”的前提下,要修改并進一步完善個人信息保護法規。2013年8月,澳大利亞政府信息管理辦公室(AGIMO)發布了《公共服務大數據戰略》,該戰略以六條“大數據原則”(數據屬國有資產;從設計著手保護隱私;數據完整性與程序透明度;技巧、資源共享;與業界和學界合作;強化開放數據)為支撐,旨在推動公共行業利用大數據分析進行服務改革,制定更好的公共政策,保護公民隱私,使澳大利亞在該領域躋身全球領先水平。日本、澳大利亞我國的大數據戰略(國家層面)2013.2,國務院《關于推進物聯網有序健康發展的指導意見》發布,提出要“加快傳感器網絡、智能終端、大數據處理、智能分析、服務集成等關鍵技術研發創新”。2012.3.29(與美國大數據計劃同日),我國科技部發布“‘十二五’國家科技計劃信息技術領域2013年度備選項目征集指南”,將大數據研究列在首位。2011.11,工業和信息化部發布的《物聯網“十二五”發展規劃》發展規劃中,把信息處理技術作為4項關鍵技術創新工程之一被提出,其中包括了海量數據存儲、數據挖掘、圖像視頻智能分析,這都是大數據的重要組成部分。此外,2013年兩會期間,有人大代表建議把大數據上升為國家戰略。2012.11,廣東省頒布了《廣東省實施大數據戰略工作方案》,率先啟動了大數據戰略,擬在財政、環保、招投標等領域率先開展數據公開試點,逐步推進,通過互聯網等形式發布并公開數據。2013.7月,上海市政府有關部門發布了《推進大數據研究與發展三年行動計劃(2013一2015年)》,將重點選取金融證券、互聯網、數字生活、公共設施、制造和電力等具有迫切需求的行業,開展大數據行業應用研發,探索“數據、平臺、應用、終端”四位一體的新型商業模式,促進產業發展。2013.8月,重慶市政府印發《重慶市大數據行動計劃》,明確提出將搶抓全球大數據戰略資源,將大數據產業培育成全市重要的戰略性新興產業。我國的大數據戰略(地方層面)我們的確正在起航,在龐大的新數據來源的支持下,量化的前進步伐將會踏遍學術、商業和政府領域,沒有一個領域可以不被觸及。——哈佛大學量化社會科學研究所主任GaryKing大數據正構成我們明天的新大陸,從2012年開始,我們將從大陸時代,移民進入大數據時代。——中國社科院信息化研究中心秘書長、《互聯網周刊》主編姜奇平一個檔案工作者應是首先想到未來的人。——國際檔案理事會主席馬丁.博倫斯2.大數據時代的檔案館對于數據的理解,首先源于數據一種資源。大數據時代,數據的資源特性更加明顯,成為一種“戰略性原料”,奧巴馬則將數據定義為“未來的石油”,是與陸權、海權、空權同等重要的“國家核心資產”。從資源語境去理解大數據時代的檔案館,具有兩層含義:2.1資源維度(1)檔案館數據資源總量龐大且增長迅速。
2008年我國各級國家檔案館共保存檔案1.93億卷,較上年增加1769萬卷,增幅達10%,而到2011年各級國家檔案館館藏已達3.3億卷,到2020年,各級國家檔案館館藏將達到6億多卷。2012年底,北京市和各區縣檔案館共完成紙質檔案數字化8759.5頁,接收電子檔案48TB,市檔案館已完成紙質檔案數字化4397萬頁,占館藏的63%。上海17區縣檔案館檔案數字化共超過3.6億頁,占館藏50%以上,部分區縣達90%以上。2009年底,ERA接收的電子文件實際總量已達到77TB,此后平均每季度至少采集10TB的電子文件,2011年3月達到了108.2TB,2011年底達到124TB。2.1.1檔案館具有“大數據”的特征
(2)檔案館數據資源種類繁雜,結構多樣在檔案館的數據資源中,既有數字化的紙質檔案、接收進館的電子文件、音視頻數據庫等,也有用戶利用信息、服務數據等數據資源,這些數據資源分布在不同的系統中,格式、特征等形式多樣,組織方式各異,而各館之間更是差異明顯,從而形成了大量的異構數據。
(3)檔案館數據資源價值豐裕度、凝聚度很高
作為國家和社會精心保存的歷史記錄,毫無疑問,檔案這種數據資源具有很高的價值。與絕大部分數據資源“價值總量高、價值密度低”的特性相比,“檔案是一種最真實、最可靠、最具權威性與憑證性的原生信息資源”,可以說是整個社會數據資源中最為精華的部分。毫無疑問,檔案館是社會信息家族的“大戶”,也具備大數據的特征。然而,大數據時代背景下,社會需要一個什么樣的檔案館,是無所作為從而在大數據時代進一步邊緣化,抑或借助大數據重新回到“上帝”身邊?檔案館又需要怎樣的“大數據”,是固守以前檔案資源建設的老路,還是樹立大數據觀從而更好地契合時代脈搏?這需要檔案館重新審視自己的目標定位。2.1.2大數據視閾的數字記憶資源庫顯然,作為社會記憶的建構者與保存者,大數據時代,數字記憶的保存應是檔案館的社會自覺與文化擔當,構建一個“基于互聯網的,以檔案數字資源為主體,以文本、圖片、音頻、視頻等為形式,為中華民族集體記憶的建構和傳承提供文獻支撐的‘中國記憶’數字資源庫”
將成為我們新的目標與使命。一方面,各級國家檔案館是集中統一保管黨和國家檔案的科學文化事業機構,是永久保管檔案的基地,是社會各界利用檔案史料的中心。因此,作為一種機構性存在與制度性安排,國家檔案館的公益性、服務性、公平性、永久性等特征,使得檔案館成為人們心目中最系統、最可信賴的數據資源庫。另一方面,檔案館在數據處理上具有豐富的經驗。考察數據生命周期,涉及到數據生成、采集、傳輸、處理、分析、應用等階段,而這也恰恰是檔案館熟悉的業務范疇,因此檔案館可以通過模擬或借鑒傳統檔案處理的整套業務規范或流程來指導海量數據集的處理,檔案館“對知識規范性控制的思想和技術方法恰巧在大數據領域有了用武之地”。大數據時代,檔案館應從狹義檔案資源觀向“大檔案觀”轉變,盡可能地收集全面數據、完整數據和綜合數據,更多地關注一些底層化、碎片化、復雜化的信息,從而構建一幅反映國家和社會變遷的實時全景圖。在進一步推進紙質檔案數字化、加快電子文件接收進館的基礎上,檔案館要有意識地收集一些諸如電子郵件、網頁、社交媒體等價值重大、形式多樣的數據資源,從而實現檔案資源全媒體保存,真正建立覆蓋人民群眾的、滿足長遠需要的檔案資源體系。數據一直存在,那么如今又何以稱為大數據呢?這主要是因為數據集如此龐大、復雜以致現有的數據管理工具或傳統數據處理手段無法處理。因此,從技術角度講,大數據的產生是這個時代的產物。事實上,白宮大數據白皮書《FactSheet:BigDataAcrosstheFederalGovernment》中對NARA的規劃也主要是從技術層面進行:為十億電子記錄(CI-BER)的網絡基礎設施是一個聯合機構主辦的測試平臺,這個多機構主辦的網絡基礎設施,對國家檔案館87萬多樣化的數字記錄的文件和信息的收集,可稱為計算研究所的文藝復興。這個試驗臺將評估技術和方法,超大規模數據收集,以支持可持續的訪問。2.2技術維度從技術維度而言,大數據技術將從三個方面實現檔案資源與用戶需求的雙向理想控制。大數據時代的到來,表征著信息資源的有效開發利用,從“谷歌流感趨勢”到阿里巴巴的“信用貸款”,無一不是基于大數據的海量資源挖掘與開發。可以說,面對海量數據,誰能更好地分析挖掘,誰就能真正搶占大數據時代的先機。對于檔案館而言,數據分析成為檔案館知識服務體系創新及完善的重要支撐。大數據時代,信息服務競爭加劇及用戶需求提升推動著檔案館從常規分析向廣度、深度分析轉變,利用語義分析、人工智能、機器學習、知識圖譜等大數據技術從海量資源中分析潛在的價值決定著大數據時代檔案館的發展水平及方向,這也意味著檔案館的傳統業務將向數據分析、數據挖掘方向轉移,對海量資源的分析與處理將成為檔案館的主要業務。2.2.1檔案資源挖掘人類行為93%是可以預測的——復雜網絡權威阿拉巴西大數據應用是以用戶數據為起點的,那些能幫助你更確切地知道用戶是誰的數據對大數據應用來說是最重要的。——阿里巴巴大數據委員會會長車品覺2.2.2用戶數據挖掘當前,社會對檔案館知識服務、智慧服務的要求更為苛刻,相關服務需求已經開始顯現或訴諸于用戶日常行為中,檔案館能否精準感知將影響到服務價值實現和用戶認同提升。根據用戶服務數據和網絡數據,對檔案館用戶身份記錄、借閱記錄等結構化數據及存儲行為、搜索方式、行為軌跡乃至SNS上的言行記錄等半結構化、非結構化數據進行深入分析,將有效發現用戶隱性訴求,改善和提高服務方案,從而更好地提升檔案館的服務。事實上,檔案部門已有初步嘗試,NARA通過分析用戶對館藏目錄的點擊率,選取點擊率高的檔案進行數字化,進而開展深層次的信息服務,取得了很好的效果。無論是檔案資源還是用戶數據,往往以孤立的數據和分散的鏈接這種形式存在,“數據的共性、網絡的整體特征隱藏在數據網絡中,大數據往往以復雜關聯的數據網絡這樣一種獨特的形式存在,因此要理解大數據就要對大數據后面的網絡進行深入分析”
。例如啤酒和尿布,兩個原本互不沾邊的事物,通過數據分析進行的重組則產生了意想不到的效果。對于檔案館而言,對關系尤其是檔案之間、用戶之間及檔案與用戶之間關系的精確洞察將使得關聯服務、精準服務、跟蹤服務成為可能,從而實現用戶需求與檔案價值的雙向理想控制。在關系洞察的基礎上,對檔案館自身管理、機構發展、社會服務等方面的趨勢預測成為可能,從而更好地實現優化與監管。2.2.3關系洞察及趨勢預測革命的意義在于,它能改變人們的思維方式,成為變革世界的源泉,而這也正如圖靈獎得主JimGray在《第四范式——數據密集型科學發現》所言,大數據不僅僅是數據量的劇增,也不僅僅是信息技術的飛躍,而可能是人類對客觀世界認知飛躍的前奏。作為一場“引爆信息社會的哥白尼式革命”,大數據時代的到來,將從多個方面變革傳統的檔案館思維模式,為檔案館管理、服務及業務理念帶來顛覆性的變化。2.3思維維度大數據時代是弘揚理性精神的時代,決策行為將日益基于數據分析,而不是像過去更多地依賴于經驗甚至直覺。耶魯大學法學教授丹尼爾.埃斯蒂認為,“基于數據驅動的決策方法,政府將更加有效率、更加開放、更加負責,引導政府前進的將是基于實證的事實,而不是意識形態,也不是利益集團在政府決策過程中施加的影響”。為了提升檔案管理的科學水平,檔案館必須實現從經驗驅動到循數管理的轉變,讓“數據說出未來”。例如,在我國的數字檔案館建設中,數字化的比例及規模成為重要的衡量標準。然而,是否有必要全文數字化?數字化內容及形式的選擇?這些都值得我們認真商榷,反觀NARA,根據用戶點擊率來決定數字化內容,無疑可以給我們很大的啟發。2.3.1管理思維:從經驗驅動到循數管理長期以來,我國檔案館采取的是“供給導向”的發展模式,往往從自身業務供給的角度出發,有什么樣的內容就提供什么樣的服務,用戶常常面臨著“提供的服務不需要,需要的服務找不到”的尷尬。隨著大數據在其他領域應用優勢的不斷凸顯,用戶對檔案館精品化、多元化、個性化的服務需求越來越強烈,如果繼續采取無所作為、固守原狀的鴕鳥政策,那么檔案館將會失去未來的發展機會,甚至會失去存在的意義。檔案館服務理念要實現從供給導向到需求導向的轉變,確立用戶在其服務體系中的主體地位,以用戶為中心,以需求為導向,利用大數據對用戶行為中的信息進行挖掘,尋找其隱性需求,實現資源密集型向服務主導型的轉變。2.3.2服務思維:從供給導向到需求導向在以往的檔案館業務工作中,一般的服務思維都是出現問題—邏輯分析—找出因果關系—提出解決方案,從而實現問題求解,可稱之為逆向思維模式。大數據時代最大的轉變是,放棄對因果關系的渴求,取而代之關注相互關系,只要知道“是什么”,而不需要知道“為什么”,也就是從追尋“因果律”走向審視“相關性”。這一轉變將使我們以一種嶄新的視角去理解檔案館的業務工作,即收集數據—量化分析—找出相互關系—提出優化方案,使用戶問題解決方案從成功躍至卓越,可稱之為正向思維模式。這種相互關系的運用,一方面使得數據內在關聯得到深入挖掘,促進資源的集成創新,從而實現檔案數據資源的增值開發,另一方面使得檔案館“捕捉現在,預測未來”成為可能,通過開展跟蹤服務、知識關聯服務從而提升個性化服務的水平。2.3.3業務思維:從因果關系到相互關系只有無限探索和拓展,觸碰整個檔案行業的局限,……我們才能逃脫死水一潭的狀態,這種狀態盡管平靜、舒適,但卻暮氣沉沉,行將落伍。我們需要想方設法把自我滿足的封閉的檔案界轉變成與當代社會同步、對社會有益、并具有活力的檔案界,否則的話,我們就會在數字時代變成毫無用處的化石。——T.庫克歷史不會重演,卻自有其韻律,如果洞悉其中的規律,那么檔案館的未來,或許就掌握在大數據的手中。[1]邁爾-舍恩伯格,庫克耶著,周濤譯.大數據時代——生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013[2]BillFranks著,黃海譯.駕馭大數據.北京:人民郵電出版社,2013.[3]涂子沛.大數據:正在到來的數據革命,以及它如何改變政府、商業與我們的生活[M].桂林:廣西師范大學出版社,2012[4]Bigdata:The
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025中外設備租賃合同(FOB條款)
- 2025標準手寫私人租房合同模板示例
- 綜合實踐類題目企業面試題
- 生態環境保護生態學專業試題及答案
- 2025年西藏貨運從業資格考試試題及答案大全
- 場地租用計劃書
- 內審財務合同樣本
- 2025年稅務師考試針對性的知識點試題及答案
- 公司激勵股合同樣本
- 農莊木頭購買合同樣本
- 4.1 時代的主題 課件-2024-2025學年高中政治統編版選擇性必修一當代國際政治與經濟
- 2024年中國高低壓電器開關柜市場調查研究報告
- 班級管理-形考任務2-國開-參考資料
- 黑龍江省哈爾濱市香坊區風華中學2024-2025學年九年級(五四學制)上學期10月月考語文試題
- 代理商和廠家拿貨合同范本
- 2024年公開招聘工作人員報名表
- 隱私保護與數據安全合規性測試考核試卷
- 2024年云南省昆明市盤龍區小升初英語試卷
- 大型群眾性活動安全許可申請表
- 聯合國可持續發展目標(SDGs)戰略白皮書
- 內蒙古呼和浩特市第十六中學2024-2025學年高二語文上學期期中試題無答案
評論
0/150
提交評論