社区
数据仓库
帖子详情
数据仓库基本三问
akinggom
2003-07-06 11:16:21
什么是数据仓库?
数据仓库的优势在哪里?
数据仓库存储的逻辑又是怎么样的?
...全文
43
4
打赏
收藏
数据仓库基本三问
什么是数据仓库? 数据仓库的优势在哪里? 数据仓库存储的逻辑又是怎么样的?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
akinggom
2003-07-09
打赏
举报
回复
我用informix提供的数据仓库建模软件进行建立模型,当我有点不明白的地方就是
星型数据模式 和 雪花型数据模式在大量的数据处理上,谁比较有优势呢?谁做过这方面的测试呢?!
aking630
2003-07-07
打赏
举报
回复
数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程。
数据仓库是用于数据汇总,分析的。
数据仓库存储是基于多维数据存储方式的。
WebDB
2003-07-07
打赏
举报
回复
建议你找数据仓库的教材看看,里面会有详细地说明和解释。下面针对你的问题简单写写,希望对你有帮助。
1、什么是数据仓库
W. H. Inmon给的定义:“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”。这个简短而又全面的定义指出数据仓库的主要特征:面向主题的、集成的、时变的、非易失的。
面向主题的:数据仓库围绕一些主题:如顾客、供应商、产品和销售组织。数据仓库关注决策者的数据建模与分析,而不是集中于组织机构的日常操作和事务处理。因此,数据仓库排除对于决策无用的数据,提供特定主题的简明视图。
集成的:通常,构造数据仓库是将多个异种数据源,如关系数据库、一般文件和联机事务处理记录集成在一起。使用数据清理和数据集成技术,确保命名约定、编码结构、属性度量等的一致性。
时变的:数据存储从历史的角度(例如过去5—10年)提供信息。数据仓库中的关键结构,隐式或显式地包含时间元素。
非易失的:数据仓库总是物理地分离存放数据;这些数据源于操作环境下的应用数据。这种分离的数据仓库通常只需要两种数据访问:数据的初始化装入和数据访问,不需要事务处理、恢复和并发控制机制。
概言之,数据仓库是一种语义上一致的数据存储,它充当决策支持数据模型的物理实现,并存放企业战略决策所需信息。数据仓库也常常被看作一种体系结构,通过将异种数据源中的数据集成在一起而构造,支持结构化的和专门的查询、分析报告和决策制定。
二、数据仓库相对于事务处理数据库系统(OLTP)的优势
1、数据仓库应用的目标是决策支持,是面向包括经理、主管和分析人员,进行数据分析。而OLTP主要目标是将人工的操作转换为计算机操作,用于办事员、客户和信息技术专业人员的事务和查询处理,如数据的录入、修改、删除、检索等等。
2、数据仓库系统存储和管理大量历史数据,提供汇总和聚集机制,并在不同的粒度级别上存储和管理信息。这些特点使得数据容易用于决策。而OLTP系统管理当前数据。这种数据太琐碎,如果进行汇总或分析,需要在琐碎的数据上进行大量的运算,效率很低,而且数据只有当前信息系统的数据,不能从整体宏观把握,难以用于决策。
因此为了提高事务处理系统和数据仓库系统的性能,在事务处理系统的基础上建立独立的数据仓库系统。
三、数据仓库的存储
数据仓库中数据是按照主题进行组织的。在事务处理系统中,数据是按照业务部门的逻辑组织的,而不涉及其他组织或部门的数据。面向主题的数据组织方式,就是在较高层次上对分析对象的数据的一个完整、一致的描述,能完整、统一地刻画各个分析对象所涉及的企业的各项数据,以及数据之间的联系。
在事务处理系统中,为了保证事务处理的效率和防止更新异常,往往对关系模式进行规范化,并且减少数据存储的冗余。而数据仓库中由于没有更新操作(修改、删除),因此在设计和存储时为了提高效率应用了不同的粒度划分和数据分割原则,允许有数据冗余。
事务处理系统中,往往是按照E-R模型进行数据库设计。而数据仓库系统中则是按照星型模型或雪花模型来设计。
askwho
2003-07-07
打赏
举报
回复
其实数据仓库也是数据库的一种,数据也是以表格的形式存储,只不过有那么一点点不同,而这种不同一定要等到自己亲自使用的时候才可以理解的。
数据仓库
和数据挖掘基础知识点
第一章
数据仓库
和数据挖掘概述 一、概念题 1、
数据仓库
的定义是什么? 答:
数据仓库
是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中央决策制定过程。 2、
数据仓库
的特点是什么? 答:
数据仓库
的特点是: (1)
数据仓库
是面向主题的; (2)数据...
耗时n年,38页《
数据仓库
知识体系.pdf》(数据岗位必备)
拥有本篇文章,意味着你拥有一本完善的书籍,本篇文章整理了
数据仓库
领域,几乎所有的知识点。
万字详解
数据仓库
、数据湖、数据中台和湖仓一体
本文目录: 一、前言二、概念解析
数据仓库
数据湖 数据中台 三、具体区别
数据仓库
VS 数据湖
数据仓库
VS 数据中台 总结 四、湖仓一体 目前数据存储方案 Data Lakehouse(湖仓一体) 一、前言 数字化转型浪潮卷起各种新老概念满天飞,数据湖、
数据仓库
、数据中台轮番在朋友圈刷屏,有人说“数据中台算个啥,数据湖才是趋势”,有人说“再见了数据湖、
数据仓库
,数据中台已成气候”…… 企业还没推开数字化大门,先被各
【
数据仓库
】
数据仓库
层次化设计
数据仓库
(Data Warehouse),是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。DW保持着所有的从ODS到来的数据,并长期保存,而且这些数据不会被修改。DW中的数据实际存储在分布式文件系统中(如HDFS)。如果想要删除数据,一般会在分布式文件系统中进行操作。而由于效率问题,
数据仓库
一般只读取数据,不直接对数据进行修改。(1)面向主题(Subject Oriented)操作型数据库的数据组织面向事务处理任务。
Hadoop之
数据仓库
概述
????大家好久不见了,最近实习比较忙,但也在实习过程中发现了自己的不足,今天我们就来讲一讲
数据仓库
的建设(大厂数据开发实习)有很完整的数仓体系,所以这方面的知识是需要进行系统学习的。有必要说明,本文是在流行的大数据分布式存储和计算平台Hadoop上设计实现
数据仓库
。 1.
数据仓库
1.1
数据仓库
的历史
数据仓库
的概念可以追溯到20世纪80年代,当时IBM的研究人员开发出了“商业
数据仓库
”。本质上,
数据仓库
试图提供一种从操作型系统到决策支持环境的数据流架构模型。
数据仓库
概念的提出,是为了解决和这个数据流
数据仓库
7,392
社区成员
6,741
社区内容
发帖
与我相关
我的任务
数据仓库
其他数据库开发 数据仓库
复制链接
扫一扫
分享
社区描述
其他数据库开发 数据仓库
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章