分享:Qubole:托管在AWS平台上的Hive服务

wangyp1230 2014-05-27 02:57:41
加精
初创公司Qubole由Facebook前工程师Ashish Thusoo和Joydeep Sen Sarma联合创立,他们俩在2007年同时进入Facebook,也是Facebook团队中开发Hadoop查询语言Hive的两位关键人物,期间Thusoo还是Apache软件基金会兼任Hive项目的主管。

Qubole的创业团队阵容豪华,他们都有很强的数据分析背景,除了两位创始人之外,Oracle Exalytics平台和并行数据库技术的架构师Shrikanth Shankar也是该团队的成员。近日,Qubole宣布获得了700万美元的A轮融资,该轮融资由Charles River Ventures和Lightspeed Ventures引导,不过该轮融资包含了2011年的种子投资。 众所周知,Hive是基于Hadoop的一个数据仓库工具,可以将SQL语句转换为MapReduce任务进行运行。而Qubole服务托管在亚马逊AWS云计算平台之上,用户可以在其上运行各种Hadoop Jobs,包括Hive、MapReduce以及Pig。

该公司在2012年6月份推出了Qubole服务,并在12月份面向大众开放。Thusoo告诉GigaOM的记者Derrick Harris,Qubole从开始就处理PB级的用户数据。到目前为止,该平台的大客户涉及了广告技术、电子商务和应用程序开发等领域。还有一些很常见用户案例就是创建新的数据管道(细节见博客),在非结构化的数据推送到关系型数据库像MySQL、Vertica或者Infobright之前,会先使用Hadoop来处理这些数据。

然而,Thusoo补充道,Qubole也能够连接若干种其他的数据库存储,比如MongoDB。与此同时,Qubole也可以连接其他服务的API来导入用户的数据,像Omniture,Google analytics等服务。 Qubole服务托管在AWS平台,这样用户在分析存储在亚马逊S3云中的数据集时,就无需了解Hadoop系统管理,Qubole提供的Hadoop服务能够根据用户的工作负载动态调整服务器资源配置,实现随需计算,对于用户来说,这大大简化了大数据应用的复杂性,而且成本更低。

Qubole目前面临的问题
Qubole目前面临最大的问题,就是市场上有太多的竞争产品,在《 在Hadoop上运行SQL:程序员需知晓的13种数据工具》一文,笔者就列举了13种基于Hadoop的SQL查询工具。虽然在过去几年里,Hive一直是Hadoop生态系统中的重要组成部分,但是基于MapReduce的查询速度一直让人“不敢恭维”,很多数据库初创公司在意识到这一点之后,纷纷推出了基于Hadoop的SQL分析工具。

虽然Thusoo也意识到该领域激烈的竞争,但是他依然认为Qubole处在一个有利的位置。Thusoo表示,目前公司正在寻找新的数据分析项目像Impala和Shark等,并把它们整合到Qubole平台,而同样是Hadoop的初创公司Hortonworks领导的Stinger项目,就大大提升了Hive自身的速度。(详见《 Stinger Initiative:让Hive提速100倍》一文的报道)

不过需要强调一点,Qubole虽然也已经优化了自家的平台,不过比单独运行在Amazon Elastic MapReduce的速度仅仅只快了5倍,未来还有很长的一段路要走。(文/王鹏,审校/王旭东)
...全文
869 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
estmin251 2014-06-04
  • 打赏
  • 举报
回复
云计算 这词现在流行.
laoer_2002 2014-06-03
  • 打赏
  • 举报
回复
u011120098 2014-05-31
  • 打赏
  • 举报
回复
长姿势了。。。。
zss1593866 2014-05-28
  • 打赏
  • 举报
回复
资料不错 是我需要的 顶一下
FeelTouch Labs 2014-05-27
  • 打赏
  • 举报
回复
持续关注云计算领域

409

社区成员

发帖
与我相关
我的任务
社区描述
AWS
社区管理员
  • AWS
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧