HBase 執行摘要 Executive Summary

HBase 執行摘要 Executive Summary

By  digitalART2

Hadoop 是 大數據的業界標準 de facto standardHBase 是Hadoop 的大數據庫。

   
   

Hadoop 和 HBase 幾個關鍵的優勢

Hadoop 是大數據存儲和分析的主流平台,許多成功的公司使用 Hadoop 做強有力的大數據分析。 Hadoop 提供了兩個重要的服務:極具成本效益地存儲任何類型和任何規模的大數據,和提供強有力的大數據分析。

   

關鍵的優勢: 分佈式文件系統 (Hadoop Distributed Files System HDFS),分佈式大數據庫 (HBase), 完整的大數據工具集 (Complete Set of Big Data Tools),  使用產業標準硬件 (Use Industrial Standard Hardware)

   

• 能夠存儲任何類型和任何規模的大數據,不會因為數據太大無法儲存而丟失數據

Hadoop 能夠以數據的原生格式存儲,不強制轉型,不會發生因為數據太大無法儲存而丟失數據的情況,Hadoop 確保下游的大數據分析無數據損耗 !

   

• 極具成本效益地處理大數據 

Hadoop 使用產業標準硬件,每TB的存儲和運算成本遠遠低於其他系統。HBase 有效地利用磁盤空間,支持可插拔壓縮算法。遞增新的硬件 / 添加或移除存儲容量 到HBase 集群 亦簡單容易。

   

•  安心使用 Use with confidence 

Hadoop和HBase的用戶群體是全球性的和多樣化的,包括金融服務,電信,零售,社交網絡,媒體,醫療保健和其他行業,有關詳細信息,請閱讀  Who uses HBase and Hadoop 。

   

• 大規模證 Proven at scale

今天您可能沒有以 PB (petabytes) 計的數據,不過,像Facebook,雅虎以及世界上其他大量公司的成功實證,證明 HBase和Hadoop 能夠出色地管理大量數據。大規模實證證明 HBase 和 Hadoop 真正具有支持業務增長的能力。

   
   

HBase的主要特點: 

HBase 是 “分佈式的和嚴格一致的大數據庫存儲系統,優良的量寫和隨機讀取性能,支持可插拔的壓縮算法,有效地利用磁盤空間,數據欄 可以 因應大數據的性質自主定義,沒有死鎖“ - 拉爾斯·喬治

  • 全 Hadoop 集成:完全支持 HDFS 和 MapReduce
  • Highly fault tolerance 高容錯!
  • Built-in scalability 內置擴展 !
  • Built-in load-balancing  內置負載均衡 !
  • Strongly consistent 數據更新嚴格一致 !
  • Automatic versioning 自動版本!
  • Automatic RegionServer failover 自動 RegionServer 故障轉移
  • Flexible secondary index solutions 靈活的二級索引解決方案
  • Automatic sharding 自動分片:自動分割大表格和重新分配
  • Supports massively parallelized processing 支持大規模並行處理

HBase 其中一個最重要的特點是 "數據更新嚴格一致 Strong Consistency",HBase  使用 多版本multiversioning,避免編輯並發引起的數據衝突,提供最佳的量寫和出色的隨機讀取性能(關於 "數據更新嚴格一致"  的資料,請閱讀   "All Things Distributed"  - 亞馬遜首席技術官 沃納·沃格爾先生 - Amazon.com)。

   
   

HBase和Hadoop 的應用  Use cases of HBase and Hadoop

簡單的數字摘要 - 平均值,最小值,最大值,總和 - 足夠處理20世紀80和90年代的業務問題。不過,當前的大數據年代,大量複雜的數據需要新的技術,涉及的算法包括自然語言處理,模式識別,機器學習,大數據儲存和大數據挖掘,行為的預測,需求預測,顧客喜好,個體在群體中的行為,購買歷史記錄的分析,瀏覽行為和產品查看分等等,這些技術 都是 Hadoop  的關鍵優勢。

   

HBase 和Hadoop 的應用 如下 (但不限於) :

  • Recommendation Engine 推薦引擎 - 點擊流分析,日誌分析
  • Customer Churn Analysis - 客戶流分析 - 如何贏得更多的客戶,並避免真的失去客戶?
  • AD Targeting - 廣告定位,營銷自動化,商業智能
  • Point-of-sales Transaction Analysis - 銷售點交易分析
  • Analyzing Network Data to Predict - 網絡數據分析預測
  • Threat Analysis - 威脅分析 - 企業如何才能檢測威脅和欺詐活動
  • Trade Surveillance - 貿易管制 - 如何管制流氓交易 ?
  • Search Quality - 搜索質量
  • Data Sandbox - 數據實驗室
  • GIS - 3D 地圖,空間應用
  • Real-time Customer Segmentation 實時客戶細分 - 市場分析           ...... more
   

如果您有任何疑問請隨時 與我們聯繫 !

PostgreSQL, Open Source, database, Oracle, SQLServer, MYSQL