社区
数据仓库
帖子详情
百度开源数据库tera问题
Vist_1
2018-06-21 07:18:05
求百度开源数据库tera中的compact流程,或者哪位大神有tera_understanding.md这个文档,在github上找不到
...全文
112
回复
打赏
收藏
百度开源数据库tera问题
求百度开源数据库tera中的compact流程,或者哪位大神有tera_understanding.md这个文档,在github上找不到
复制链接
扫一扫
分享
举报
写回复
配置赞助广告
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
相关推荐
cpp-一个
开源
的BigtableC实现
百度
万亿量级分布式
数据库
Tera
一个
开源
的Bigtable C 实现:
百度
万亿量级分布式
数据库
Tera
深入理解
tera
——
百度
开源
万亿级
数据库
最近偶然发现
百度
的同学 00k ,发布了
百度
万亿级
数据库
tera
。从介绍可以看出该系统已成为
百度
spider 3.0和网页
数据库
的核心模块,管理节点过万,数据存储量级达到pb级。虽然该系统
开源
较晚,但相比于同类
开源
产品,如hbase等,性能、可靠性和稳定性应该有非常大的提升。从公布资料看,t...
【
百度
】近期
开源
的大数据处理平台“全家桶”
近期
百度
将支撑核心搜索引擎的基础架构平台逐渐
开源
,包括: 1.
百度
文件系统BFS(https://github.com/baidu/bfs) 一个支持跨集群、跨地域部署的实时分布式文件系统。 2. 分布式
数据库
Tera
(https://github.com/baidu/
tera
) 存储万亿量级超链、网页的结构化
数据库
。 3. 集群操作系统Galaxy(https://github.co...
百度
万亿量级
数据库
Tera
架构应用、设计与实践全攻略
百度
万亿量级
数据库
Tera
架构应用、设计与实践全攻略 信息技术发展突飞猛进,网络数据呈现爆炸之势,搜索引擎的实时性面临巨大挑战。
百度
搜索引擎每天处理着数万亿次的链接分析和数百亿次的互联网资源采集。作为
百度
搜索引擎的核心
数据库
Tera
,是如何支撑万亿量级的实时数据处理呢? 在5月20日
百度
开发者中心主办、极客邦科技承办的71期
百度
技术沙龙上,
百度
网页搜索基础架构技术经理齐
百度
开源
的万亿量级
数据库
Tera
发布0.5.2版本
Tera
简介 Github主页
Tera
是一个高性能、可伸缩的结构化数据存储系统,被设计用来管理搜索引擎万亿量级的超链与网页信息。为实现数据的实时分析与高效访问,我们使用按行键、列名和时间戳全局排序的三维数据模型组织数据,使用多级Cache系统,充分利用新一代服务器硬件大内存、SSD盘和万兆网卡的性能优势,做到模型灵活的同时,实现了高吞吐与水平扩展。 0.5.2 Release No...
发帖
数据仓库
数据仓库
其他数据库开发 数据仓库
复制链接
扫一扫
7379
社区成员
6743
社区内容
其他数据库开发 数据仓库
社区管理员
加入社区
获取链接或二维码
帖子事件
创建了帖子
2018-06-21 07:18
社区公告
暂无公告