hadoop hbase查询问题

xxx_8801 2012-02-24 02:26:40
功能:
hadoop计算完的数据 插入hbase里面, 然后web页面查询显示出来,
由于hbase没有分组,排序等功能,所以在web页面跟hbase之间 用thrift写了一个中间程序,处理分组,排序什么的, 然后吧最终数据返回给web页面`
问题:
当web页面发情查询请求时,thrift程序就会查询hbase 然后分组排序,但是数据量太大,几百万数据排序,分组,太久
还有当hadoop正在计算的时候,hbase查询很慢(查不动),要停掉hadoop程序后还能勉强查出数据来.
请问针对这种请客谁有好的解决方法?
...全文
538 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
Jaya1989 2013-02-04
  • 打赏
  • 举报
回复
拿HBase当关系型数据库用,死路一条。 非要这么做,可以考虑建索引表,根据需要设计rowkey
zhy247 2013-02-04
  • 打赏
  • 举报
回复
impala
gloliver 2012-11-06
  • 打赏
  • 举报
回复
使用HBASE的协处理功能。
  • 打赏
  • 举报
回复
如果是mapreduce计算完的结果应该就是分过组,排了序的吧。可以根据需求再把结果改造下,压入到hbase中。 对数据过滤还是在hbase的查询代码中处理吧.. 需求表达明白就容易判断出选型,技术等,容易解决问题。

20,808

社区成员

发帖
与我相关
我的任务
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
  • 分布式计算/Hadoop社区
  • 涤生大数据
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧