程序员人生 网站导航

缓慢但胜在稳健,HBase大势已成

栏目:互联网时间:2014-09-29 08:00:01

【编者按】对比传统RDBMS领域,NoSQL界的厮杀显然更加激烈。而在这场没有硝烟的战场中,MongoDB和Cassandra无疑是风头最劲的两个产品。但是如果你着眼HBase,各大热门技术(比如Spark、Hadoop)及知名厂商(比如微软、Splice Machine)的支持无疑描绘出一个更美好的未来,下面我们一起看Gigaom Andrew带来的分析。

以下为译文:

在NoSQL数据库领域,统治产品无疑当属MongDB和DataStax Enterprise(一个领先的Apache Cassandra发行版)。然而本周的两条新闻头条却开始关注一个尽管很顽强,但知名度低的选手――Apache HBase,这个几乎包含在任何主流Hadoop发行版的NoSQL数据库。

Mongo的挑战

聚焦上一周,有两个事件值得关注――7岁的MongoDB任命了第三任CEO,以及主打HBase的初创公司Splice Machine新一轮融资超过300万美元。对比MongoDB和HBase,无论是独自还是联合发展,后者都没有任何超越前者的迹象。最终,即将离职的MongoDB CEO Max Schireson将其离职原因归结于需要频繁奔波于公司在Palo Alto和New York的两个总部,以及其他的一些工作需求。

MongoDB似乎诠释了快速发展的苦恼,不仅仅表现在经营管理层,也表现在技术发展层面上――从许多开发者和圈内朋友那得知,MongoDB在大规模下表现非常差,不管是集群大小还是数据摄入体积。

分歧中的发展

但不得不说,HBase的势头正在上扬,并且不存在MongoDB发展中所遇见的问题。虽然HBase没有像MongoDB及Cassandra背后那些龙头企业撑腰,但其发展已经很好了:

  • HBase如今作为Hadoop的一部分存在,使用HDFS作为表格表示它可以从其他Hadoop负载中导入和导出数据,也可以单独工作。
  • Apache Hive可以用于HBase数据查询,为NoSQL数据库提供SQL接口。
  • MapR一直致力于提升HBase在操作应用程序方面的应用,为此该公司开发了自定义的HDFS读写版本,其发布的基于C++、兼容HBase数据库的M7 Hadoop专为可操作性工作负载设计。
  • Continuuity的产品Reactor为Hadoop与HBase整合使用设计。
  • Apache Knox、Hortonworks XA Secure和Zettaset Orchestrator都为HBase数据提供了安全服务。
  • 微软现在提供基于云的集群服务,特别为基于Hadoop的Azure HDInsight云服务预览版本提供了HBase配置。这一基于HBase的实施应用于Azure Blob存储中。
  • 上面提到过,Splice Machine已经成功为HBase发行版融资,有趣的是它还是一个关系型数据库。这在一定程度上说明了,基于HBase多功能性的横向扩展数据库基础设施并不限制必须使用NoSQL应用程序。

展望HBase未来

从Splice Machine和微软的产品来看,HBase是一个兼容了其他数据技术的NoSQL数据库。同时,人们对“Data Lake”架构日益增长的兴趣也增加了HBase成功的几率。对于HBase的持续发展,让我们拭目以待。

原文链接:Is HBase’s slow and steady approach winning the NoSQL race?(编译/仲浩  审校/魏伟)

------分隔线----------------------------
------分隔线----------------------------

最新技术推荐