讨论:如果要建立数据仓库,来管理单位不同时期建立的不同的数据库,应该做哪些基本的准备工作?或掌握哪些基础知识?

angel_lee 2002-12-08 10:49:46
讨论:如果要建立数据仓库,
来管理单位不同时期、不同管理系统建立的不同的数据库,
应该做哪些基本的准备工作?或掌握哪些基础知识?

单位为电业系统,所以数据量比较大,以前做的系统也比较多,但系统间都是独立的,没什么联系。希望通过接口能访问不同的库中数据,并使系统间可以联系起来。

帮朋友(美女)问的,希望大家多帮助!:)

...全文
58 18 打赏 收藏 转发到动态 举报
写回复
用AI写文章
18 条回复
切换为时间正序
请发表友善的回复…
发表回复
ykn 2002-12-14
  • 打赏
  • 举报
回复
以上说得都很好
angel_lee 2002-12-12
  • 打赏
  • 举报
回复
thanks very much , continue:)
seth99 2002-12-12
  • 打赏
  • 举报
回复
1.定义你的主题,比如说你希望解决什么问题,需要什么样的数据来支持
2.了解你所需要的数据来自于什么地方,更新频率如何
3.定义规范的数据存储,比如说日期如何描述等,这个很重要,特别在从多个系统抽取数据时,每个系统类型描述不一样的时候
4.定义数据抽取方式,频率
5.建好仓库模型,数据分析

有些步骤需要重复多次,一点小经验 :-)
angel_lee 2002-12-11
  • 打赏
  • 举报
回复
to Lostinet(迷失网络)(大家注意∶他不是人)(ΔΔΔΔΔ)

你应该改名为: Lostinet, 他不是人
最好不要在我的技术讨论中说脏话
Lostinet 2002-12-11
  • 打赏
  • 举报
回复
倒,帮人泡女啊???
xystarch 2002-12-11
  • 打赏
  • 举报
回复
William H. Inmon
Ralph Kimball
呵呵,一个数据仓库之父和一个跟他对着干的牛人.
我最近做一个有关SCM的,想和DataWarehouse结合起来
to forjie()
你说得好像不大合理,数据仓库是否是垃圾中转站跟数据挖掘没有必然的联系,数据仓库关键在于仓库模型的建立,将现实中的关系转换为数据仓库的维度,层次,以及粒度的划分."切忌大而全"这一结论从何而来?
数据挖掘需要一个分析性质良好的数据源.建立一个好的数据仓库是数据挖掘的基础.是前者决定后者,而非反之.
lin9703 2002-12-10
  • 打赏
  • 举报
回复
我建议你应该把每个单位的信息,建立一个数据库,分历史数据表,与,业务表,应该每个月做一次数据转历史 ,然后把每个单位需要公开的部分,做成WEBSERVICES,这样每个单位对应一个WEBSERVIEC,所有的WEBSERVIECS便整合成了,一个可以查询的综合解决,老兄祝你成功!
yohomonkey 2002-12-10
  • 打赏
  • 举报
回复
这个还没有接触过噢!
也听听课好了!
有美女,听课不累啊!呵呵呵
luckysusan 2002-12-10
  • 打赏
  • 举报
回复

我来听讲座的!不介意吧! :)
saucer 2002-12-10
  • 打赏
  • 举报
回复
ask your friend try to find and read the following book(s)

(this one has a Chinese translation)
Building the Data Warehouse (3rd Edition)
by William H. Inmon, W. H. Inmon

The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition)
by Ralph Kimball, Margy Ross
forjie 2002-12-10
  • 打赏
  • 举报
回复
数据仓库是面向主题的,切忌大而全。
应当了解有关数据挖掘方面的知识,否则 数据仓库=垃圾中转站
angel_lee 2002-12-09
  • 打赏
  • 举报
回复
third,答一个问题有两个美女在心里感谢你,多划算呀:)
angel_lee 2002-12-09
  • 打赏
  • 举报
回复
first,分不够可以再加呀,只要答的好;

second,问问题的美女是没有分的?

third,答一个问题有两个美女在里感谢你,多划算呀:)
superkiller 2002-12-09
  • 打赏
  • 举报
回复
数据装载,查询优化是少不了要的

问这么高难度的问题
都只给100分,美女都这样吝啬?
superkiller 2002-12-09
  • 打赏
  • 举报
回复
处理的是历史数据
可以建立一个完整的(这句话不知该怎么说)的数据库
把老数据导入(建成以后可以定期)
对新建的数据库操作
saucer 2002-12-08
  • 打赏
  • 举报
回复
to set up an effective data warehouse, you need to transform the old databases into a unified database through ETL (Extract / Transform / Load) process
xystarch 2002-12-08
  • 打赏
  • 举报
回复
需要掌握的知识很多,数据仓库建模需要用到的神经网络或者决策树这类优化技巧肯定要知道一些.要对系统分析很熟.

前端工具需要准备一些,比如BO,Brio,Congos...什么的,用来分析建立的数据仓库,以及执行ETL过程.

www.dwway.com
Dugu_Niu 2002-12-08
  • 打赏
  • 举报
回复
请详细的列出原来是那几种数据库?要在什么平台下实现整合?
然后才能做出相应的回答。
理论上是可以实现的,应该不会太难
MySQL 教程MySQL 是流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。在本教程中,会让大家快速掌握 MySQL 的基本知识,并轻松使用 MySQL 数据库。什么是数据库数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。每个数据库都有一个或多个不同的 API 用于创建,访问,管理,搜索和复制所保存的数据。我们也可以将数据存储在文件中,但是在文件中读写数据速度相对较慢。所以,现在我们使用关系型数据库管理系统(RDBMS)来存储和管理大数据量。所谓的关系型数据库,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。RDBMS 即关系数据库管理系统(Relational Database Management System)的特点:1.数据以表格的形式出现2.每行为各种记录名称3.每列为记录名称所对应的数据域4.许多的行和列组成一张表单5.若干的表单组成databaseRDBMS 术语 在我们开始学习MySQL 数据库前,让我们先了解下RDBMS的一些术语:数据库数据库是一些关联表的集合。数据表: 表是数据的矩阵。在一个数据库中的表看起来像一个简单的电子表格。列: 一列(数据元素) 包含了相同类型的数据, 例如邮政编码的数据。行:一行(=元组,或记录)是一组相关的数据,例如一条用户订阅的数据。冗余:存储两倍数据,冗余降低了性能,但提高了数据的安全性。主键:主键是唯一的。一个数据表中只能包含一个主键。你可以使用主键来查询数据。外键:外键用于关联两个表。复合键:复合键(组合键)将多个列作为一个索引键,一般用于复合索引。索引:使用索引可快速访问数据库表中的特定信息。索引是对数据库表中一列或多列的值进行排序的一种结构。类似于书籍的目录。参照完整性: 参照的完整性要求关系中不允许引用不存在的实体。与实体完整性是关系模型必须满足的完整性约束条件,目的是保证数据的一致性。MySQL 为关系型数据库(Relational Database Management System), 这种所谓的关系型可以理解为表格的概念, 一个关系型数据库由一个或数个表格组成, 如图所示的一个表格: 表头(header): 每一列的名称;列(col): 具有相同数据类型的数据的集合;行(row): 每一行用来描述某条记录的具体信息;值(value): 行的具体信息, 每个值必须与该列的数据类型相同;键(key): 键的值在当前列中具有唯一性。MySQL数据库MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQL 是开源的,目前隶属于 Oracle 旗下产品。MySQL 支持大型的数据库。可以处理拥有上千万条记录的大型数据库。MySQL 使用标准的 SQL 数据语言形式。MySQL 可以运行于多个系统上,并且支持多种语言。这些编程语言包括 C、C++、Python、Java、Perl、PHP、Eiffel、Ruby 和 Tcl 等。MySQL 对PHP有很好的支持,PHP 是目前流行的 Web 开发语言。MySQL 支持大型数据库,支持 5000 万条记录的数据仓库,32 位系统表文件最大可支持 4GB,64 位系统支持最大的表文件为8TB。MySQL 是可以定制的,采用了 GPL 协议,你可以修改源码来开发自己的 MySQL 系统。Redis 教程REmote DIctionary Server(Redis) 是一个由 Salvatore Sanfilippo 写的 key-value 存储系统,是跨平台的非关系型数据库。Redis 是一个开源的使用 ANSI C 语言编写、遵守 BSD 协议、支持网络、可基于内存、分布式、可选持久性的键值对(Key-Value)存储数据库,并提供多种语言的 API。Redis 通常被称为数据结构服务器,因为值(value)可以是字符串(String)、哈希(Hash)、列表(list)、集合(sets)和有序集合(sorted sets)等类型。

62,046

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧