数据仓库基本三问

akinggom 2003-07-06 11:16:21
什么是数据仓库?
数据仓库的优势在哪里?
数据仓库存储的逻辑又是怎么样的?
...全文
43 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
akinggom 2003-07-09
  • 打赏
  • 举报
回复
我用informix提供的数据仓库建模软件进行建立模型,当我有点不明白的地方就是
星型数据模式 和 雪花型数据模式在大量的数据处理上,谁比较有优势呢?谁做过这方面的测试呢?!
aking630 2003-07-07
  • 打赏
  • 举报
回复
数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程。

数据仓库是用于数据汇总,分析的。

数据仓库存储是基于多维数据存储方式的。
WebDB 2003-07-07
  • 打赏
  • 举报
回复
建议你找数据仓库的教材看看,里面会有详细地说明和解释。下面针对你的问题简单写写,希望对你有帮助。

1、什么是数据仓库

W. H. Inmon给的定义:“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”。这个简短而又全面的定义指出数据仓库的主要特征:面向主题的、集成的、时变的、非易失的。

面向主题的:数据仓库围绕一些主题:如顾客、供应商、产品和销售组织。数据仓库关注决策者的数据建模与分析,而不是集中于组织机构的日常操作和事务处理。因此,数据仓库排除对于决策无用的数据,提供特定主题的简明视图。

集成的:通常,构造数据仓库是将多个异种数据源,如关系数据库、一般文件和联机事务处理记录集成在一起。使用数据清理和数据集成技术,确保命名约定、编码结构、属性度量等的一致性。

时变的:数据存储从历史的角度(例如过去5—10年)提供信息。数据仓库中的关键结构,隐式或显式地包含时间元素。

非易失的:数据仓库总是物理地分离存放数据;这些数据源于操作环境下的应用数据。这种分离的数据仓库通常只需要两种数据访问:数据的初始化装入和数据访问,不需要事务处理、恢复和并发控制机制。

概言之,数据仓库是一种语义上一致的数据存储,它充当决策支持数据模型的物理实现,并存放企业战略决策所需信息。数据仓库也常常被看作一种体系结构,通过将异种数据源中的数据集成在一起而构造,支持结构化的和专门的查询、分析报告和决策制定。

二、数据仓库相对于事务处理数据库系统(OLTP)的优势

1、数据仓库应用的目标是决策支持,是面向包括经理、主管和分析人员,进行数据分析。而OLTP主要目标是将人工的操作转换为计算机操作,用于办事员、客户和信息技术专业人员的事务和查询处理,如数据的录入、修改、删除、检索等等。

2、数据仓库系统存储和管理大量历史数据,提供汇总和聚集机制,并在不同的粒度级别上存储和管理信息。这些特点使得数据容易用于决策。而OLTP系统管理当前数据。这种数据太琐碎,如果进行汇总或分析,需要在琐碎的数据上进行大量的运算,效率很低,而且数据只有当前信息系统的数据,不能从整体宏观把握,难以用于决策。

因此为了提高事务处理系统和数据仓库系统的性能,在事务处理系统的基础上建立独立的数据仓库系统。

三、数据仓库的存储

数据仓库中数据是按照主题进行组织的。在事务处理系统中,数据是按照业务部门的逻辑组织的,而不涉及其他组织或部门的数据。面向主题的数据组织方式,就是在较高层次上对分析对象的数据的一个完整、一致的描述,能完整、统一地刻画各个分析对象所涉及的企业的各项数据,以及数据之间的联系。

在事务处理系统中,为了保证事务处理的效率和防止更新异常,往往对关系模式进行规范化,并且减少数据存储的冗余。而数据仓库中由于没有更新操作(修改、删除),因此在设计和存储时为了提高效率应用了不同的粒度划分和数据分割原则,允许有数据冗余。

事务处理系统中,往往是按照E-R模型进行数据库设计。而数据仓库系统中则是按照星型模型或雪花模型来设计。

askwho 2003-07-07
  • 打赏
  • 举报
回复
其实数据仓库也是数据库的一种,数据也是以表格的形式存储,只不过有那么一点点不同,而这种不同一定要等到自己亲自使用的时候才可以理解的。

7,392

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 数据仓库
社区管理员
  • 数据仓库
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧