【DDBMS】分布式数据管理——分布式查询优化的探索

krazy_ 2022-05-04 16:53:38

我们是来自各地的大学生，一起参加openharmony的啃论文计划

作者：朱美颖中原工学院

DDBMS

关于分布式数据库系统

分布式数据库出现的原因

1.它可以解决组织位置散落较多但是相互之间有数据往来的问题。

2.当组织需要不定时扩充时，由于集中系统的容量有限，但如果使用分布式系统的话，扩充时就不会有超容的情况，而且代价相对来说较小。

3.如果数据集中在一个地方，那可靠性会变低，当这个点挂掉了之后就没有办法只能挂掉整个应用，但如果采用分布式系统则不会出现这种问题，一个点挂掉后可换为另一个点，实现快速解决故障，也可根据权重设置，在实际情况下实现负载均衡。

了解分布式数据库系统

分布式数据库系统是物理上分散但逻辑上集中的数据库系统。

物理上的分散指的是分布式数据库的数据分散在指定网络的各个位置上，这个位置称为站点，站点拥有处理数据的能力。

逻辑上的集中指的是，站点分配的数据对于用户来说是透明的，对于用户来说，数据库系统是集中的，使用统一的数据库管理系统，通过网络对数据站点进行操作。

分布式数据库系统技术是数据库系统和计算机网络技术的结合。

分布式数据库系统将传统的每个应用只定义并且维护自己数据的形式改变成数据的集中管理，使数据拥有数据独立性。

体现如下：

数据从存储到个人设备中通过每个程序的数据描述从数据库从分别提取，改变为一个设备集合了所有程序的数据描述，根据所需从分布式数据库中提取相应的全部数据到个人设备，再分发给每个程序。

数据库系统动机之一是为了集中存取数据，而计算机网络技术则提倡的是一种对集中的工作模式。此种矛盾引出分布式数据库技术最重要的目标是集成而不是集中。

探索方向

探索过程

由于以上所说，我们知道用户操作分布式数据库系统是像操作集中数据库系统一样的，但是它们的物理存储是分散的，所以操作的细节实现将会不同。

关于数据操作，我们第一时间会想到查询，那就从查询操作来分析。

分布式数据库的查询处理与集中型数据库不同的是，分布式数据库不仅需要考虑CPU代价和I/O代价之外，还需要考虑站点的数据在网络中传输的代价。

探索意义

分布式数据库查询的效率会影响整个分布式数据库管理系统的性能（查询优化后响应时间会变快，许多操作都是以数据查询为基础，在查询效率改变的情况下继而影响一系列的操作），如果优化得当，数据的可用性（提取数据所费代价降低，数据使用效率变高）和可扩展性包括管理系统的效率和可靠性都会提高。

探索难题

由于数据的分布性，一次查询的数据可能分布于好几个站点之中，每次查询的情况可能会根据实际场景的改变进行改变，因此查询的可能性是多种多样的，开销和执行速度也不一样，优化需要考虑的方面是非常之多的，因此就更为复杂。

研究现状

现已有许多经典的算法，例如：使用连接操作对查询进行优化；利用关系代数的等价原则对查询进行优化；利用代价模型查询图和贪心思想相结合实现优化；以多表连接查询的特征为基础,对粒子进行树形编码以实现全局的优化策略。

同时在近几年也有改进的优化算法，例如：基于蚁群算法的查询优化、基于鱼群算法的查询优化、基于并行遗传-蚁群算法的查询优化等等。

关于查询的大致过程

层次结构

统共有四层

第一层查询分解：将全局的查询问题转化成一个统一的查询关系表达式，即从现实问题到计算机语言的转换。（例如SQL语句）

第二层数据本地化：将全局表达式分解为在相应片段上的表达式。

第三层全局优化：利用代价函数（CPU代价+I/O代价+通信代价）计算片段的代价，根据计算算出最佳的查询操作次序。若是在广域网中，通信代价是将会很大，称为取决性因素。

第四层局部优化：查询请求根据上一层分配到局部处理站点后，相当于一个集中数据库的环境，此时可以用集中性数据库的方法来进行查询优化。

过程简述

参考层次结构描述为：把全局查询分为若干个子查询对应相应的局部数据库，如果查询语言不一样那就根据查询下发位置的数据库语言更改查询语言，在局部数据库进行查询操作之后返回查询所得的数据，将各个查询所得的数据进行合并得到一个全局的查询结果统一返回。

应用场景实例

功能分析

图书馆借阅管理系统

功能

（1）查询图书

（2）查询图书的借阅信息

（3）浏览图书

学生信息管理系统

功能

（1）查询学生信息

（2）查询学生借阅情况

（3）浏览学生信息

图书馆在线借阅系统

功能

（1）显示登录学生的借阅情况

（2）显示所有库存图书

（3）在线查询库存图书

（4）在线借阅

（5）在线预约

数据设计

图书借阅管理数据库：student_login(Number,Name,PassWord),

books(BookID,BookName,State),

borrow(Number,BookName,BorrowData).

学生信息数据库：student(Number,Name,Details)

因为本例采用的是分布式数据库，图书借阅管理数据库和学生信息数据库不存储在一个地点，他们之间通过过网络进行连接，利用分布式系统的特点两个数据库存在着互相访问的可能性。

半连接算法

本例使用半联接算法可实现。

基本原理：数据在数据库网络中的传输一般都是整个关系的传输，但在这个传输过程中，并非整个关系的所有数据都是有用的。半联接算法就是传输时舍弃无用的数据/不参与联接的数据。

举例说明：

比较总结

跟半连接算法不同的是，直接连接在传输的过程中不会舍弃无用的片段，因此在传输过程中数据过于繁多，传输效率会下降。

半连接在传输代价上比直接连接小，但局部处理时延比直接连接大，而图书馆管理系统显然是以传输代价为主要代价，所以图书管理系统可采用半连接算法比较合适。

参考文献

陆海晶. 分布式数据库系统查询优化算法的研究[D]. 辽宁工程技术大学, 2007

王慧玉.基于分布式数据库系统查询优化的研究与应用[D].大连海事大学，2005

M. Tamer ·zsu Patrick Valduriez .分布式数据库系统原理[M]

...全文

2179 回复打赏收藏转发到动态举报

写回复

用AI写文章

切换为时间正序

请发表友善的回复…

发表回复

当近些年来分布式数据库开始发展，查询操作的必要性从集中式数据库操作延续到分布式数据库操作中。而在物理分布较为复杂的分布式数据库中，数据的查询处理和优化就显得更为重要。而分布式数据的查询处理和优化也一直是近些年来国内外学者一直在研究实验的。本文主要讲述了关于分布式数据查询处理和优化的基本分类和它们的概念，以及对基于基础分类算法进行举例了一些近几年有发展和改进的算法，穿插着一些分布式数据库的知识。...

从分布式架构到智能数据管理，数据库技术的不断创新推动着信息技术的飞速发展。面对海量数据和日益复杂的应用需求，数据库领域将继续在高可用性、高性能和智能化方面进行深耕。未来，随着技术的不断发展，数据库将不仅仅是存储和查询的工具，更将成为支持智能决策和业务创新的核心引擎。

本文全面探讨了分布式数据库管理系统（DDBMS）的概念、优势、组件、应用场景及未来发展趋势。从移动商务智能与大数据分析的兴起出发，分析了集中式数据库的局限性，并系统阐述了DDBMS的特点与实现方式。文章还对比了同质与异质DDBMS，结合谷歌、亚马逊和金融行业的实际应用，展示了其在大规模数据处理中的强大能力。未来，DDBMS将与云计算、人工智能深度融合，提升数据处理的智能化和安全性，为企业数字化转型提供强大支持。

1997年，Apache发布了ZooKeeper项目，基于Google的Chubby论文，解决分布式协调服务问题。ZooKeeper是一种开源的分布式协调服务，它是一个高效且可靠的分布式数据管理框架。其目标就是构建一个简单而健壮的分布式数据管理系统。ZooKeeper通过一组简单的原语（primitives）提供全面的分布式同步功能。这些原语可以用于实现诸如配置中心、集群管理、Locks等功能。其中“配置中心”提供了动态的配置信息共享和更新，集群管理则用于监控和管理集群中各个节点的运行状态；

内容概要：本文聚焦于“通过ADMM进行TV-L1去噪”的研究，系统阐述了基于交替方向乘子法（ADMM）实现总变差（Total Variation, TV）正则化与L1范数稀疏约束相结合的图像去噪模型。文中详细解析了TV-L1模型的数学构建及其在抑制椒盐噪声、保持图像边缘结构方面的优越性，重点介绍了ADMM算法如何将复杂的凸优化问题分解为多个可高效求解的子问题，提升收敛效率与数值稳定性。配套提供的Matlab代码实现了完整的去噪流程，便于读者复现算法并开展实验验证。此外，文档还整合了电力系统、信号处理、路径规划、机器学习等多个领域的科研资源，凸显其作为综合性学术资料包的价值。; 适合人群：具备良好数学基础与Matlab编程能力，从事图像处理、信号去噪、优化算法或相关领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标：① 深入理解并复现基于ADMM的TV-L1图像去噪算法；② 掌握总变差正则化与L1范数在稀疏噪声去除中的理论与应用；③ 利用所提供的Matlab代码进行算法调试、性能评估与二次开发；④ 借助附带的多领域科研案例拓展研究思路，推动跨学科技术创新。; 阅读建议：建议读者结合理论推导与Matlab代码实践，逐步跟踪ADMM的迭代过程，观察其收敛行为与去噪效果，同时可参考文档末尾提供的丰富科研资源链接，拓展技术视野与研究深度。

啃论文俱乐部

178

社区成员

社区内容

发帖

与我相关

我的任务

其他企业社区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

我们的愿景是实现技术自由的梦想！
我们的使命是探索技术发展之道，为计算机行业、为开源社区及其生态贡献力量。
我们的目标是成为计算机科学领域的技术专家、行业大咖。

欢迎志同道合的朋友加入！

试试用AI创作助手写篇文章吧

+ 用AI写文章