社区
Hadoop生态社区
帖子详情
HBASE如何在TB级别上的数据做实时join操作
sanguomi
2014-03-15 09:09:16
原始数据
表A ID url
表B ID key
这两张表的数据都会上T
想要的做的是表B的key在表A中出现过的记录
现在表结构不太好定义, 另外想要做的是实时查询
...全文
740
5
打赏
收藏
HBASE如何在TB级别上的数据做实时join操作
原始数据 表A ID url 表B ID key 这两张表的数据都会上T 想要的做的是表B的key在表A中出现过的记录 现在表结构不太好定义, 另外想要做的是实时查询
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
herofour444
2014-05-26
打赏
举报
回复
今天上午听说有人把索引键在mongodb上
vah101
2014-05-20
打赏
举报
回复
hive 整合 hbase phoenix
herofour444
2014-05-20
打赏
举报
回复
关注。 。。。
撸大湿
2014-03-18
打赏
举报
回复
先搞倒排索引
Hbase
二级索引与
JOIN
- **
实时
传输平台**:用于
TB
级
数据
的
实时
写入,支持发布和订阅模式。 - **淘宝指数**:采用倒排索引技术提高属性查询效率,优化客户端
JOIN
操作
。 - **交易历史记录查询系统**:针对百亿行
级别
的
数据
表进行高效查询,...
HBASE
在
tb
的使用
- **
数据
规模**:每天
TB
级别
的
数据
写入。 - **存储模型**:从传统的内存+硬盘模式转向
HBase
。 - **应用场景**:支持发布和订阅等
实时
数据
流场景。 2. **淘宝指数** - **查询方式**:使用倒排索引进行属性查询。 ...
基于
hbase
的企业级大
数据
平台
- **提前
JOIN
**:通过这种方式,实际上是在
数据
存储阶段就已经完成了
JOIN
操作
,大大提升了查询效率。 - **灵活扩展**:当需要增加新的
数据
类型时,只需在现有行中添加新列即可,简化了
数据
结构的维护工作。 #### ...
林昊
HBase
简介与实践分享 .pptx
- **与Hadoop的集成**:
HBase
与Hadoop生态系统紧密结合,可以在Hadoop上分析
HBase
中的
数据
或将分析结果直接写入
HBase
。 #### 在线应用案例 - **Facebook**:消息系统和
实时
大
数据
分析。 - **Trend Micro**、**Adobe...
Hadoop生态社区
20,848
社区成员
4,696
社区内容
发帖
与我相关
我的任务
Hadoop生态社区
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
复制链接
扫一扫
分享
社区描述
Hadoop生态大数据交流社区,致力于有Hadoop,hive,Spark,Hbase,Flink,ClickHouse,Kafka,数据仓库,大数据集群运维技术分享和交流等。致力于收集优质的博客
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章