大數據

大數據

By  Santiago Ron

[Big Data 大數據 中國和香港]

 

 

僅僅依靠傳統軟件是無法處理大數據的,大數據的挑戰包括 收集,存儲,搜索,共享,傳遞,分析和可視化。

大數據的例子包括 全球金融數據,互聯網文本,大型電子商貿, RFID,網絡日誌,醫療記錄,攝影檔案,視頻檔案,傳感器網絡,社交網絡,社會數據,互聯網搜索索引,公共數據,呼叫詳細記錄,天文學,大氣科學,基因學,生物化學,生物和其他復雜的跨學科的科學研究。

   

大數據需要特殊的技術,在可容忍的時間內有效地處理海量數據。大數據涉及的技術包括 自然語言處理,模式識別,機器學習,大數據儲存和大數據挖掘,行為的預測,需求預測,顧客喜好,個體在群體中的行為,購買歷史記錄的分析,瀏覽行為和產品查看分等等,這些技術都是 Hadoop  的關鍵優勢。

Hadoop 關鍵的的優勢: 分佈式文件系統 (Hadoop Distributed Files System HDFS),分佈式大數據庫 (HBase), 完整的大數據工具集 (Complete Set of Big Data Tools),  使用產業標準硬件 (Use Industrial Standard Hardware)

   
  • 能夠存儲任何類型和任何規模的大數據,不會因為數據太大無法儲存而丟失數據
  • 極具成本效益地處理大數據
  • 安心使用 Use with confidence 
  • 大規模證 Proven at scale
   

Hadoop 家族成員

  • Hadop
    • Hadoop Common: 常用工具集
    • Hadoop Distributed File System (HDFS): 一個分佈式文件系統
    • Hadoop MapReduce: 大型並行處理系統 
    • Hadoop YARN: 作業調度和集群資源管理的框架
  • HBase 大數據庫
  • Hive 數據倉庫
  • Pig 數據挖掘工具集
  • Zookeeper 計算機集群同步服務器
  • Mahout 機器學習工具集
  • ......

如果您有任何疑問請隨時 與我們聯繫.

PostgreSQL, Open Source, database, Oracle, SQLServer, MYSQL