Hummer TimeSeries DB 技术特色简介
容量和性能相关特性:
• 支持海量数据存储(分布式下可轻松应对百亿至万亿记录)
• 支持高速数据写入(单节点可达10M条记录/秒,集群性能线性提升)
• 支持高速检索(单节点每秒可扫描20M条记录/秒,集群性能线性提升)
架构相关特性:
•存储层使用 Share Nothing 架构 ,确保系统的高可扩展性。
•查询层使用 MPP 架构,确保系统的并行数据检索和计算性能。
数据访问接口相关特性:
• 支持唯一KEY,或重复KEY
• 给定谷时间区段快速删除
• 支持 CURD (即支持增删改查)
• 支持SQL(包含关联操作,即JOIN)
• JDBC/ODBC
• 支持数据强一致性
• 支持时间乱序写入
数据表类型相关特性:
• 支持时序表
• 支持对象表
数据存储相关特性:
• 多元时序,支持多种数据类型(int,long,double,string,float,decimal等)
• 支持定长/不定长/可空字段
• 支持多种排序格式PKT/KT/TK(具体见《Hummer时序数据模型》博文)
• 支持压缩存储
• 支持初级MVCC,即通过版本控制,保证查询开始后的数据集时不受当前写入数据影响。
Hadoop 相关特性:
与Hadoop 接口兼容,可支持:
• MR接口
• Pig接口
• Hive接口
操作性相关特性:
• 多租户设计: 可作为数据平台供多租户同时使用
• 高可扩展性: hummer 系统即可单机部署,也可部署到百台规模的PC 服务器集群中。 因此可轻松应对百亿、千亿条规模的时序记录表。
• 高可用性 :99.999%。
• 高可靠性 :可靠性为99.99999999996%。
其他相关特性:
• 恒时检索特性 :恒时体现数据检索速度不随数据总量而变,只与“命中(touched data)”的数据量相关。
• 节约空间 : Hummer系统存储时序数据相比传统数据库更节约空间。其主要原因如下
数据压缩存储 :蜂鸟支持面向行和列的压缩,数据压缩比可达到3 – 20 (具体压缩比和数据内容密切相关)
无需额外索引 :蜂鸟避免了像传统数据库那样,在时间列和事件id上建立b树索引,而是将“时间”和“事件ID/Key”撮合为组合KEY,借助LSM树维护有序记录,这种“前缀”索引结构以来不但便于时序处理,而且无需额外索引文件,节约了大量存储空间。相对于多数传统数据库,Hummer时序数据库至少能节约3-4倍以上的存储空间