虎啸龙吟之国产数据库风云榜-2022年01月

小小小小柚子 秀才 2022-01-24 11:19:55
加精

 

    自古华山一条路,奇险天下第一山。

    太阳初升,只见墨老大(墨天轮)一身白衣,潇洒飘逸,萧疏轩举,湛然若神,忽见身体瞬间横移,不见腿下脚下有任何动作,身体却出现在几十丈之外,使用的正是移形换位之法。

    当前已立于华山百尺峡脚下,墨老大(墨天轮)双足下泛起微弱光芒,正是以高深内力汇于脚下,忽闻一声轻喝,确又如平地炸雷,墨老大起身向上飞起,在那悬崖绝壁处,运指为剑,白色幻影飘忽不定,忽左忽右,刹那间火光四溅,可见轻功和大力金刚指已达大成,转眼已稳稳落地,清风吹过,只听从山壁处传来咔咔声,碎石从山体脱落,现出矫若游龙般几个大字:“虎啸龙吟天地动,国产DB排行来。”。

    终于2022年虎年1月份国产数据库武林大会拉开帷幕。

    一战封神:

    话说数据库界的八大门派【武当派(关系型数据库)、峨眉派(文档性数据库)、崆峒派(键值数据库)、昆仑派(宽列存储数据库)、点苍派(图形数据库、华山派(分布式数据库)、青城派(云原生)、嵩山少林派(时序数据库)】,每月都会参加武林大会。

    墨老大(墨天轮)随手拿起百斤铁弓,弓拉满月,铁箭尾端挂一卷轴,刹那间,铁箭如流星般射入绝壁山巅,箭身完全没入山体,箭尾卷轴自然垂下,原来是2022年1月份的武林大会(国产数据库)排行榜。

    众人纷纷抬头查看排行榜,榜单前17名居然和上个月保持不变,其中前五名如下:

    第一名:华山派的令狐冲(TiDB数据库)

    第二名:武当派的冲虚道长(OpenGauss数据库)

    第三名:武当派张三丰(达梦数据库)

    第四名:华山派剑宗封不平(OceanBase数据库)

    第五名:青城派余沧海(GaussDB数据库)

      华山派(分布式数据库)的令狐冲(TiDB数据库),更是连续两年排名第一,但是评分较比上个月下降7.67分,而第二名到第五名,评分较上个月都有大幅度提升。

    虽然第二名较第一名还差70多分,但是上升趋势惊人,第二名武当派的冲虚道长(OpenGauss数据库)较比上个月上涨了49.55分,与第一名华山派(分布式数据库)令狐冲(TiDB数据库)分数逐渐在拉近。

     

    华山论剑:

    八大门派【武当派(关系型数据库)、峨眉派(文档性数据库)、崆峒派(键值数据库)、昆仑派(宽列存储数据库)、点苍派(图形数据库、华山派(分布式数据库)、青城派(云原生)、嵩山少林派(时序数据库)】每派武功招式各不相同,现将每派高手进行分别排名。

    武当(关系型)

    武当派(国产关系型数据库)有118人,人数最多。

    武力值前2名分别是冲虚道长(OpenGauss)、张三丰(达梦)。

    冲虚道长(OpenGauss数据库)武当剑法更胜从前,2021年12月28日,以“汇聚数据库创新力量 逐梦数字时代星辰大海”为主题的openGauss summit 2021在北京线上线下同步举办。大会现场,openGauss开源社区理事会和技术委员会升级,openGauss社区分委会正式成立,中国电信发布行业首个云原生关系型数据库TeleDB for openGauss,中国联通启动基于openGauss的数据库自主创新(CUDB)。

     

    关系型数据库,是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,

    以便于用户理解,关系型数据库这一系列的行和列被称为表,一组表组成了数据库。

    关系模型可以简单理解为二维表格模型,而一个关系型数据库就是由二维表及其之间的关系组成的一个数据组织。

    关系型数据库管理系统 RDBMS在E.F.Codd博士发表的论文《大规模共享数据银行的关系型模型》(Communications of the ACM杂志1970年6月刊)基础上设计出来的。

    它通过数据、关系和对数据的约束三者组成的数据模型来存放和管理数据。

    峨眉派(文档型数据库)

    记得当年郭襄心中仍挂念杨过,直到40岁那年才突然大悟,并削发为尼开创峨眉一派,后将掌门的位置传给了灭绝师太,又辗转多个年代,人员凋零,只有国外的MongoDB、CouchDB等,国内目前无一人继承峨眉派功夫(文档型数据库)。

    文档型数据库是NoSQL中非常重要的一个分支,它主要用来存储、索引并管理面向文档的数据或者类似的半结构化数据。

    顾名思义,文档型数据库(面向文档数据库)的关键核心概念即文档(Document),它是数据库中最小的单位。

    每一种文档型数据库的部署都有所不同,通常来说,它们假定文档以某种标准化格式封装并加密数据,并用多种格式进行解码,包括XML、YAML、JSON和BSON,当然也包括二进制格式如PDF、微软Office文档等。

    MongoDB是一种面向集合,模式无关的文档型数据库。

    其中数据以“集合”的方式进行分组,每个集合都有单独的名称并可以包含无限数量的文档。这里的集合同关系型数据库中的表(table)类似,唯一的区别就是它并没有任何明确的schema。CouchDB文档型数据库,可以通过JSON格式的REST接口进行访问,使用JavaScript作为查询语言。一个CouchDB文档就是一个对象,由不同字段组成。字段值可以是字符串、数字、日期,甚至可以是有序列表和关联映射。

     

    崆峒派(键值型)

    崆峒派下设飞龙门、追魂门、夺命门、醉门、神拳门五大门。

    目前国内只有三家,排名分别是飞龙门关能(TcplusDB)、醉门宗维侠(Tendis)、神拳门唐文亮(Haisql_memcache)。

    飞龙门关能(TcplusDB)一只判官笔灵巧阴柔,令人不敢轻视,TcaplusDB是腾讯出品的分布式NoSQL数据库,存储和调度的代码完全自研。具备缓存+落地融合架构、PB级存储、毫秒级时延、无损水平扩展和复杂数据结构等特性。同时具备丰富的生态、便捷的迁移、极低的运维成本和五个九高可用等特点。客户覆盖游戏、互联网、政务、金融、制造和物联网等领域。

    醉门宗维侠(Tendis)醉拳功夫也是炉火纯青,型醉意不醉,云数据库 Tendis 是腾讯云自研、100%兼容 Redis 协议的数据库产品,作为一个高可用、高性能的分布式 KV 存储数据库,从访问时延、持久化需求、整体成本等不同维度的考量,完美的平衡了性能和成本之间的冲突,降低业务运营成本,提升研发效率。云数据库 Tendis 支持主从热备,提供自动容灾切换、数据备份、故障迁移、实例监控、在线扩容、数据回档等全套的数据库服务。2020年12月,腾讯宣布开源 Tendis 。

    键值数据库是一种非关系数据库,它使用简单的键值方法来存储数据。

    键值数据库将数据存储为键值对集合,其中键作为唯一标识符。

    键和值都可以是从简单对象到复杂复合对象的任何内容。

    昆仑派(宽列存储)

    目前有两家宽列存储数据库,排名分别是乾坤一剑震山子(GeminiDB)、昆仑三圣何太冲(iBASE)。

    云数据库GeminiDB是一款基于华为自主研发的计算存储分离架构的分布式多模NoSQL数据库服务。在华为云高性能、高可用、高安全、可弹性伸缩的基础上,提供了一键部署、备份、监控等服务能力。兼容 Cassandra 等主流 NoSQL 接口,具有高性价比,适用于IoT、气象、互联网、游戏等领域。

    宽列存储数据库 (Wide-Column Database),也称作可扩展记录存储 (Extensible record Stores) 是一种兼具了广泛的可使用性、可拓展性、高性能和高可用性的分布式 NoSQL 数据库。

    最早由 Google 在其发表的《Bigtable: A Distributed Storage System for Structured Data》论文中提出,HBase, Cassandra 均为被广泛使用的宽列式存储。

    宽列存储数据库也长被称为 宽列存储。在记录中存储数据,能够容纳非常多的动态列。

    由于列名和记录键都不是固定的,而且一个记录可以有数十亿列,所以宽列存储可以被看作是二维键值存储。

    点苍派(图形)

    目前有23家,前2名分别是:点苍一笔林伧夫(TGDB)、君子悠然君无幽(Alibaba GDB)。

    腾讯云数图TGDB是腾讯云推出的一款原生的分布式并行图数据库,这款数据库能够实现万亿级关联关系数据实时查询,高效治理异构数据,支持实时图计算,助力企业打通数据孤岛。

    对比传统的关系型数据库,TGDB以原生方式实现属性图,高效存储关联数据,支持千亿级节点大图的高效查询和关联分析,通过支持PageRank、社群发现、相似度计算、模糊子图匹配等社群发现算法实现高性能图计算,在处理关联关系上性能提升了千倍以上。

    图数据库是以点、边为基础存储单元,以高效存储、查询图数据为设计原理的数据管理系统。

    图概念对于图数据库的理解至关重要。图是一组点和边的集合,“点”表示实体,“边”表示实体间的关系。

    在图数据库中,数据间的关系和数据本身同样重要 [4]  ,它们被作为数据的一部分存储起来。

    这样的架构使图数据库能够快速响应复杂关联查询,因为实体间的关系已经提前存储到了数据库中。

    图数据库可以直观地可视化关系,是存储、查询、分析高度互联数据的最优办法。

    与关系型数据库的对比

    在关系型数据库设计的时候需要进行严格的数据规范化,将数据分成不同的表并删除其中的重复数据,这种规范化保证了数据的强一致性并支持ACID事务。

    然而,这也对关系查询带来的限制。

    快速的实现逐行访问是关系型数据库的设计原理之一,当数据的数据之间形成复杂的关联时,跨表的关联查询增加,就会出现问题。

    虽然可以通过将存在不同表中的不同属性进行关联从而实行复杂查询,但是开销是非常大的。

    与关系型数据库相比,图数据库把关系也映射到数据结构中,对于关联度高的数据集查询更快,尤其适合那些面向对象的应用程序。

    同时图数据库可以更自然的扩展到大数据应用场景,因为图数据库Schema更加灵活,所以更加适合管理临时或不断变化的数据。

    华山派(分布式)

    目前有23家,前2名分别是:令狐冲(TiDB)和封不平(OceanBase)。

    近日,赛迪顾问正式发布《2021 中国分布式数据库最具成长价值企业研究报告》,报告从技术创新力和市场影响力两个维度对中国分布式数据库创新企业进行评估,平凯星辰在技术创新力的维度排名第一。

    分布式数据库系统 (DDBS)包含分布式数据库管理系统(DDBMS)和分布式数据库(DDB)。

    在分布式数据库系统中,一个应用程序可以对数据库进行透明操作,数据库中的数据分别在不同的局部数据库中存储、由不同的 DBMS进行管理、在不同的机器上运行、由不同的操作系统支持、被不同的通信网络连接在一起。

    一个分布式数据库在逻辑上是一个统一的整体,在物理上则是分别存储在不同的物理节点上。一个应用程序通过网络的连接可以访问分布在不同地理位置的数据库。它的分布性表现在数据库中的数据不是存储在同一场地。更确切地讲,不存储在同一计算机的存储设备上。

    这就是与集中式数据库的区别。从用户的角度看,一个分布式数据库系统在逻辑上和集中式数据库系统一样,用户可以在任何一个场地执行全局应用。分布式数据库系统是在集中式数据库系统的基础上发展起来的,是计算机技术和网络技术结合的产物。

    青城派(云原生)

    当前有5家,前2名分别是:余沧海(GaussDB)、极乐真人李静虚(TDSQL)。

    TDSQL是腾讯云企业级分布式数据库,旗下涵盖金融级分布式、云原生、分析型等多引擎融合的完整数据库产品体系,提供业界领先的金融级高可用、计算存储分离、数据仓库、企业级安全等能力,同时具备智能运维平台、Serverless版本等完善的产品服务体系 。

    云原生数据库,是一种通过云平台进行构建、部署和分发的服务。

    这种云原生属性是它相比于其他类型数据库最大的特点。

    作为一种云平台,云原生数据库以PaaS(平台即服务,Platform-as-a-Service)的形式进行分发,也经常被称作DBaaS(数据库即服务,DataBase-as-a-Service)。

    用户可以将该平台用于多种目的,例如存储,管理和提取数据。

    云原生数据库通常通过在云基础设施之上安装数据库软件来实现,这种方式使得云原生数据库具备了传统数据库所不具备的直接访问性和运行时可伸缩性。

    随着云原生数据和海量计算的重要性不断提高,人们空前重视通过部署这种服务为企业提供增强的可靠性和可伸缩性。

    云原生是一种新型技术体系,是云计算未来的发展方向。

    云原生数据库在海外被称为「Cloud-Native Database Systems」,前面译成中文就是「云原生」,理解云原生先要理解两个关键词——云和原生。

    在传统数据库的系统架构下,必须是紧耦合的设计方式,才能最大效能地发挥系统的优势。

    云就是使用虚拟化的技术将资源池化。

    这就是云原生核心逻辑,将不同类型资源解耦,并进行池化。

    比如在云原生的计算存储分离架构下,业务节点可以根据需要自由地对计算、存储进行快速的扩缩容等操作。

    嵩山少林派(时序)

    当前有23家,前2名分别是:少林方丈方证大师(TDengine) 、方生大师(DolphinDB)。方丈方证大师(TDengine)易筋经力压群雄,是真正的武林泰斗,TDengine是涛思数据专为物联网、车联网、工业互联网、IT运维等设计和优化的大数据平台。除核心的快10倍以上的时序数据库功能外,还提供缓存、数据订阅、流式计算等功能,最大程度减少研发和运维的复杂度,且核心代码,包括集群功能全部开源。

    时序数据库全称为时间序列数据库。

    时间序列数据库指主要用于处理带时间标签(按照时间的顺序变化,即时间序列化)的数据,带时间标签的数据也称为时间序列数据。时间序列数据主要由电力行业、化工行业、气象行业、地理信息等各类型实时监测、检查与分析设备所采集、产生的数据,

    这些工业数据的典型特点是:

    产生频率快(每一个监测点一秒钟内可产生多条数据)、严重依赖于采集时间(每一条数据均要求对应唯一的时间)、测点多信息量大(常规的实时监测系统均有成千上万的监测点,监测点每秒钟都产生数据,每天产生几十GB的数据量)。

    基于时间序列数据的特点,关系型数据库无法满足对时间序列数据的有效存储与处理,因此迫切需要一种专门针对时间序列数据来做优化的数据库系统,即时间序列数据库。对于时序大数据的存储和处理往往采用关系型数据库的方式进行处理,但由于关系型数据库天生的劣势导致其无法进行高效的存储和数据的查询。时序大数据解决方案通过使用特殊的存储方式,使得时序大数据可以高效存储和快速处理海量时序大数据,是解决海量数据处理的一项重要技术。该技术采用特殊数据存储方式,极大提高了时间相关数据的处理能力,相对于关系型数据库它的存储空间减半,查询速度极大的提高。时间序列函数优越的查询性能远超过关系型数据库。

    恭贺新春:

      华山论剑已接近尾声,众派掌门按照八卦阵方位站立与华山山顶,分别站在震卦、巽卦、离卦、坤卦、兑卦、乾卦、坎卦、艮卦位置,气沉丹田,双掌朝上,同时向天空连挥数掌,八股有型的空气波出现在头顶数丈高空,几个大字在天空缓缓出现:

    瑞雪翩翩丰收景,虎蹄朵朵报春花。

    提前祝大家,新年快乐!

    备注

    文中引入了各种比喻,门派、武侠人物等请勿对号入座。

     

    ...全文
    875 回复 打赏 收藏 转发到动态 举报
    写回复
    用AI写文章
    回复
    切换为时间正序
    请发表友善的回复…
    发表回复

    66,683

    社区成员

    发帖
    与我相关
    我的任务
    社区描述
    汇集数据库的爱好者和关注者,大家共同学习、探索、分享数据库前沿知识和技术,像松鼠一样剥开科学的坚果;交流Gauss及其他数据库的使用心得和经验,互助解决问题,共建数据库技术交流圈。
    数据库数据仓库 企业社区 北京·海淀区
    社区管理员
    • Gauss松鼠会
    加入社区
    • 近7日
    • 近30日
    • 至今
    社区公告

    欢迎大家同时关注Gauss松鼠会专家酷哥。

    https://www.zhihu.com/people/ku-ge-78-98

    试试用AI创作助手写篇文章吧