Hortonworks + Hive为Hadoop的未来铺好了路?
进入一个大视野和有活力的开元社区,你将获得一些很独特的东西。在此我们要讲一下Stinger的启动过程,由Hadoop发行商Hortonworks的工程师和其他140多个开发者以纯开源规模共同打造了Apache Hive上交互式SQL查询能力。
在4月它的启动已经完成,由来自44个公司的开发者提供了390,000行代码,主要为业务分析师和数据工作者提供在快速变化和拍字节规模的大数据集上强大的SQL查询引擎。
它能做其他类似大数据解决方案不做的事情,给用户提供一个单一的简单的工具来做交互式或批处理
一个比两个好
Hortonworks产品营销总监Jim Walker说,“最终用户想要一个SQL引擎,是一个而不是两个。”其他Hadoop供应商利用可能造成事情复杂化的次要技术。
毫无疑问,当Cloudera,MapR和Pivotal都有不同的的方案解决问题时,他们对此有不同看法。
但是,鉴于Stinger和Hive的大量贡献者不仅仅来自软件公司,也有其他如Spotify, Linkedin, Facebook和eBay的各种公司,Walker的说法无疑引起了共鸣。
Stinger.next的介绍
Hortonworks联合创始人、Apache贡献者Alan Gates和Hortonworks 高级产品经理Raj Bains在博客中提供了Stinger.next的详尽细节。但是,对概述感兴趣的人来说,Stinger.next希望利用对Stinger最初目标的动量和热情为Apache Hive带来更多的动力和容量。
Stinger.next将突破Hive性能的限制,通过建立亚秒查询的能力,更加完整的SQL语义集合和拍字节规模的事务能力来达到。
它在速度、规模和SQL上有3个基础的目标。详细来说:
速度:亚秒级查询允许用户为有更高响应时间要求的交互式仪表盘和探索性分析来部署Hive。
规模:Hadoop唯一的SQL接口用于从T字节到P字节规模的查询。
SQL:为Hive开启事务和SQL:2011分析。
3个里程碑,3个时间线
Walker说,利用在最初Stinger项目成功的实时功能模型,Stinger.next将在未来18个月内迅速交付。事务处理功能将在2014年底发布,亚秒级查询在2015年上半年发布,在接下来几个月内就会有预览版本。
Hive开发社区沸腾了
当最初的Stinger项目在去年4月交付,Walker说,它的社区有一个简单的问题:下一步做什么?可想而知,这就是Stinger.next名字的由来。但是更重要的是,来自像Spotify公司的工程师表示有兴趣继续在社区工作,推动项目的发展并为把握发展方向出一份力。
更大的社区会怎么想?
然而不同的Hadoop供应商在快速度和大规模的大数据查询上走出不同的路,Stinger.next做出了自己最大的努力。它保持真正属于Apache Hadoop及其生态系统,并承诺真正开放源码。
但这并不是全部的好处。它聚集各个社区带来最好的东西,建立用户需要和想要的技术和工具。虽然很多其他的竞争者也可能有同样的目标,但项目开发人员的数量一般来说都是最少的。
Hortonworks总是将赌注押在开源社区会压倒任何单一供应商和小团队开发者的想法。对于大多数和Hortonworks合作的技术供应商(Microsoft, Tableau, Teradata, and SAP等),他们可能有所成就。
转自
Are Hortonworks + Hive Community Paving Hadoop's Future?