“大數據”與生活的聯系_第1頁
“大數據”與生活的聯系_第2頁
“大數據”與生活的聯系_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

“大數據”與生活的聯系“大數據”與生活的聯系

人類世界,有許多個“時代”。如原始社會時代、奴隸主時代、封建帝國時代、資本主義、社會主義時代。信息時代是我們目前所處的時代。在這個時代,信息(也是數據)極大膨脹和爆炸,因此誕生了“大數據時代”。在這個時代,數據的處理、加工、生產、流通、管理成為了數據人必不行少的一部分。是生活,也是工作,更是消遣。數據是人的一部分,人也是數據的一部分。可以說,人類在這個“數據大時代”,任何行為、任何事物、任何人類信息都被數據化、電子化了。云計算、云存儲是應對數據大膨脹而提出的數據存儲、管理、計算所提出的優化的解決方案。而物聯網則是將人類行為、物品德為信息收集起來,存放在網絡中的一種終端解決方案。不管是哪一個解決方案,都是將人類世界信息化、數據化、電子化進行究竟的解決方案。

我們生活在一個布滿“數據”的時代,這里的“數據”,并不僅僅指數字,理論上講,一切可以以文件形式儲存于計算機硬盤的東西,包括數字、文字、圖像、聲音、視頻等,均可稱為“數據”。我們打電話,使用微博、、博客等社交工具,都是在不斷增加著社會總體數據量。

據權威猜測,將來每隔18個月,整個世界的數據總量就會翻倍。IBM的討論稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。

數據,除了它第一次被使用時供應的價值以外,那些積累下來的數據海洋并不是無用的廢物,它還有著無窮無盡的“剩余價值”,關于這一點,人們已經有了越來越多的熟悉。事實上,大數據已經開頭并將連續影響我們的生活,下面我們不妨試舉幾例。

精準廣告投放已很普遍

許多女性可能有這樣的經受,使用某掃瞄器在淘寶、京東等購物網站上購買過一本關于懷孕的書籍后,在之后十個月左右的時間里,你的掃瞄器兩側的廣告欄里不斷消失懷孕所需要的東西,如養分食品、對胎兒無影響的孕婦用藥、胎心監測儀、體溫計、血壓計等產品廣告,登錄原來的購物網站,也會在首頁向你推舉這類產品。而且,在十個月之后,你會發覺,以上這些廣告開頭變成嬰兒用品了。

你以前可能對掃瞄器廣告特別厭煩,但對這類廣告,你卻欣然接受,由于它推舉的產品正是你所需要的。這實際上就是大數據應用的一個簡潔案例。你的掃瞄經受已經被掃瞄器和電商所記錄,通過對用戶掃瞄記錄進行大數據分析,就可以推想出你目前是一種什么狀態,今后又將經受哪些狀態,于是,專為你定制的廣告就在你需要的時候消失在你的眼前。

大數據最本質的應用就在于猜測,即從海量數據中分析出肯定的特征,進而猜測將來可能會發生什么。實際上,上述例子僅僅是大數據應用的最初級階段。由于它所涉及的數據的范圍并不廣泛,其分析原理也特別簡潔。而如前言所述,大數據有數據量大、數據多樣性等特征,實際

是將各個維度的數據進行綜合分析進而進行肯定的猜測。當不同的數據流被整合到大型數據庫中后,猜測的廣度和精度都會大規模的提高。例如,當一個數據庫從不同的數據來源獲得了你使用手機的時間和地點、信用卡購物、銀行卡電子收費系統、使用等談天工具的對象、你的好友關系圖、你在新浪微博、騰訊微博的收聽及被收聽關系圖譜、你交納的水、電、燃氣費等各方面的數據,數據分析師就能通過匹配獲得你生活的不同側面。通過大數據,數據分析可以發覺各種各樣的關聯。通過分析,可以發覺你多方面的需求,并不僅僅是諸如懷孕書籍和尿不濕之間的簡潔關聯了。在數據足夠“大”的狀況下,你生活中幾乎全部的需求都可能會被猜測出來。例如,從數據分析出你可能會約會,于是會向你推舉衣服;從數據推想出你會出去旅游,于是向你推舉相關裝備及旅行方式等。

醫療衛生體系會更加精密

通過分析大量用戶的搜尋記錄,比如“咳嗽”、“發燒”等特定詞條,谷歌公司能精確?????猜測美國冬季流感傳播趨勢。和官方機構相比,谷歌能提前一兩周猜測流感爆發,猜測結果與官方數據的相關性高達97%。2024年,在甲型H1N1流感爆發的幾周前,谷歌的工程師們公開發表了一篇論文,不僅猜測流感即將爆發,并且其猜測還精確到美國特定的地區和州。這讓人們感到非常震動。精確?????猜測流感疫情,說起來并不簡單,谷歌始終致力于對用戶檢索數據的分析。用戶求醫問藥等搜尋數據可謂海量,把這些數據再拿來與美國疾控中心往年記錄的實際流感病例信息相比對,就關心谷歌作出了精確?????猜測。

在日本也有相像的應用,日本國內有一個網站,你只要打開這個網站用自己的社交網站賬號登錄,就可以在短時間內通過數萬條社交網站記錄找出可能感冒的人,并通過過去的感冒狀況和今日的感冒狀況進行分析,另外該程序還會結合氣溫柔濕度的變化來猜測將來感冒的流行狀況,并制作一個“易感冒日歷”。目前,此類服務正在日本間續綻開。

對個體而言,大數據可以為個人供應共性化的醫療服務。過去我們去看病,醫生只能對我們的當下身體狀況做出推斷,而在大數據的關心下,將來的診療可以對一個患者的累計歷史數據進行分析,并結合遺傳變異、對特定疾病的易感性和對特別藥物的反應等關系,實現共性化的醫療。還可以在患者發生疾病癥狀前,供應早期的檢測和診斷。早期發覺和治療可以顯著降低肺癌給衛生系統造成的負擔,由于早期的手術費用是后期治療費用的一半。

共性化訓練可能真正實現

在傳統訓練模式下,分數就是一切,一個班上幾十個人,使用同樣的教材,同一個老師上課,課后布置同樣的作業。然而,同學是千差萬別的,在這個模式下,不行能真正做到“因材施教”。

舉例來說,一個同學考試得了88分,這個分數僅僅是一個數字,它能代表什么呢?88分背后是家庭背景、努力程度、學習態度、智力水公平,把它們和88分聯系在一起,這就成了“數據”。大數據因其數據來源的廣度,有力量去關注每一個個體同學的微觀表現——他在什么時候

開頭看書,在什么樣的講課方式下效果最好,在什么時候學習什么科目效果最好,在不同類型的題目上停留多久等等。這些數據對其他個體都沒有意義,是高度共性化表現特征的體現。同時,這些數據的產生完全是過程性的:課堂的過程,作業的過程,師生或同學的互動過程……而最有價值的是,這些數據完全是在同學不自知的狀況下被觀看、收集的,只需要肯定的觀測技術與設備的幫助,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論