大數據專業英語教程 課件 Unit 5 B Big Data Analytics Tools and Their Key Features_第1頁
大數據專業英語教程 課件 Unit 5 B Big Data Analytics Tools and Their Key Features_第2頁
大數據專業英語教程 課件 Unit 5 B Big Data Analytics Tools and Their Key Features_第3頁
大數據專業英語教程 課件 Unit 5 B Big Data Analytics Tools and Their Key Features_第4頁
大數據專業英語教程 課件 Unit 5 B Big Data Analytics Tools and Their Key Features_第5頁
已閱讀5頁,還剩14頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

BigDataAnalyticsToolsandTheirKeyFeatures

Unit

5TextBContents

NewWords

Abbreviations

Phrases參考譯文NewWordsNewWordsNewWordsPhrasesAbbreviationsListeningtoTextA大數據分析工具及其主要功能隨著大數據量的增加和云計算的巨大增長,尖端的大數據分析工具已成為實現有意義的數據分析的關鍵。在本文中,我們將討論頂級的大數據分析工具及其主要功能。1.ApacheStormApacheStorm是一個開源的免費大數據計算系統。它也是具有實時框架的Apache產品,用于支持任何編程語言的數據流處理。它提供一個具有實時計算功能的分布式實時、容錯處理系統。Storm調度程序通過參考拓撲配置來管理具有多個節點的工作負載,并且可以與Hadoop分布式文件系統(HDFS)很好地配合使用。功能:?以每個節點每秒處理一百萬條100字節消息為基準。?Storm確保數據單元至少被處理一次。?具有出色的水平可擴展性。?具有內置的容錯功能。?崩潰時自動重新啟動。?它是用clojure語言編寫的。?它與有向無環圖(DAG)拓撲一起使用。?輸出文件為JSON格式。?它具有多個用例——實時分析、日志處理、ETL、連續計算、分布式RPC、機器學習。參考譯文2.TalendTalend是一個大數據工具,可簡化和自動化執行大數據集成。它的圖形向導可生成本機代碼。它還允許進行大數據集成、主數據管理并檢查數據質量。功能:?簡化大數據的ETL和ELT。?實現Spark的速度和規模。?加快你的實時性。?處理多個數據源。?提供大量連接器,這又使你可以根據需要自定義解決方案。?Talend大數據平臺通過生成本機代碼簡化了MapReduce和Spark的使用。?通過機器學習和自然語言處理提高數據質量。?其敏捷DevOps可加速大數據項目。?簡化所有DevOps流程。參考譯文參考譯文3.ApacheCouchDBApacheCouchDB是一個開放源代碼、跨平臺、面向文檔的NoSQL數據庫,旨在易于使用并擁有可擴展的體系結構。它是用面向并發的語言Erlang編寫的。CouchDB將數據存儲在JSON文檔中,可以通過網絡進行訪問或使用JavaScript查詢。它提供帶有容錯存儲的分布式擴展性能。功能:?CouchDB是一個單節點數據庫,其工作方式與任何其他數據庫一樣。?它允許在任意數量的服務器上運行單個邏輯數據庫服務器。?它使用了無處不在的HTTP協議和JSON數據格式。?文檔插入、更新、檢索和刪除非常容易。?可以在不同語言之間轉移JSON格式。4.ApacheSparkApacheSpark也是一個非常流行的開源大數據分析工具。Spark擁有80多個運行器,可輕松構建并行應用程序。它被廣泛用于組織中以處理大型數據集。功能:?它有助于在Hadoop集群中運行應用程序,把內存速度提高多達100倍、磁盤速度提高10倍。?提供快速處理。?它支持復雜的分析。?它可以與Hadoop和現有Hadoop數據集成。?它提供Java、Scala或Python的內置API。?Spark提供了內存中數據處理功能,該速度比MapReduce利用的磁盤處理要快得多。?此外,Spark可在云和本地與HDFS、OpenStack和ApacheCassandra配合使用,為企業的大數據操作增加了另一層多功能性。

參考譯文5.SpliceMachineSpliceMachine是一個大數據分析工具。其架構可跨AWS、Azure和Google等公共云進行移植。功能:?它可以動態地從幾個節點擴展到數千個節點,以支持各種規模的應用程序。?SpliceMachine優化器自動評估分布式HBase區域的每個查詢。?減少管理、更快地部署并降低風險。?它能應對快速的流數據、開發、測試和部署機器學習模型。6.PlotlyPlotly是一種分析工具,可讓用戶創建圖表和儀表板以進行在線共享。功能:?它可以輕松地將任何數據變成醒目的且信息豐富的圖形。?它為被審核行業提供有關數據來源的詳細信息。?它通過免費的社區計劃提供不受限制的公共文件托管。參考譯文7.AzureHDInsightAzureHDInsight是云中的Spark和Hadoop服務。它提供標準和高級兩類大數據云產品。它為組織提供了企業規模的集群來運行其大數據工作負載。功能:?它通過行業領先的SLA提供可靠的分析。?提供企業級安全性和監管。?它保護數據資產,并將本地安全性和治理控制擴展到云。?對于開發人員和科學家來說,這是一個高生產率的平臺。?它與領先的生產力應用程序集成在一起。?無需購買新硬件或支付其他前期費用即可在云中部署Hadoop。參考譯文參考譯文8.SkytreeSkytree是一個大數據分析工具,可讓數據科學家更快地構建更準確的模型。它提供了易于使用的準確的預測性機器學習模型。功能:?它具有高度可擴展的算法。?它是數據科學家的人工智能。?它使數據科學家能夠可視化地呈現并了解機器學習決策背后的邏輯。?通過Skytree輕松使用GUI或用Java自動編程。?具有模型可解釋性。?它旨在通過數據準備功能解決魯棒預測問題。?它是程序化的并允許GUI訪問。9.LumifyLumify被認為是可視化平臺、大數據融合和分析工具。它通過一系列分析選項幫助用戶發現連接并探索其數據中的關系。功能:?它提供具有各種自動布局的2D和3D圖形可視化。?它提供了圖實體之間的鏈接分析、與地圖系統的集成、地理空間分析、多媒體分析以及對一組項目或工作空間的實時協作。?它具有針對文本內容、圖像和視頻的特定處理和界面元素。?其空間功能使你可以將工作組織到一組項目或工作區中。?它基于成熟的、可擴展的大數據技術。?它支持基于云的環境。它可以與Amazon的AWS完美配合。

參考譯文10.HadoopHadoop在大數據處理領域的久居榜首。它以其大規模數據處理能力而聞名。由于開源的大數據框架可以在本地或云中運行,因此對硬件的要求較低。功能:?使用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論