单位要建设数据仓库,给点硬件建议

shawls 2007-12-20 02:44:37


现在我们的生产库大致如此:
两个小机做rac。数据是4t,三年增长后达到6t左右,最多7t
数据存储是从97年开始的全部基本数据和01年以来的全部基本+变动数据

硬件是16路的p5机器,1:3配内存,san存储
应用也是小机做,两台,用户是3000,并发用户是1000


准备明年年底前做搭建数据仓库,我对这个不太了解
我想请教一下,这样的生产系统做数据仓库硬件配置上和生产库需要有什么不同


...全文
261 点赞 收藏 6
写回复
6 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
rouqu 2007-12-25
关注
回复
shawls 2007-12-24

留个联系方式罗,晚上详细说:
shawls@163.com
msn:shawls@msn.com基本不上
还是发163的邮件比较号
回复
shawls 2007-12-24


是明年下半年启动,年底招标,有差不多半年时间来分析,评估
回复
zhongxh 2007-12-23
那么比较合适的就是看3-5年内在线数据保存的需求了。 单就报表而言,如果历史报表采用指标库的方式保存下来,可以将每年的指标数据保存到数据仓库中。 数据挖掘,从您目前这个局面来看,时机不知道是否算成熟?

用户量不小,查询场景不知道是什么样子? 如果只是简单查询,用户量就不是什么重要指标了。

我认为当前项目的关键在于要搞清楚我们打算进什么数据,怎么进,怎么样确保将来业务需求变化时,历史数据能够重新进入数据仓库。

我不理解的是,为何年底招标,明年下半年才启动? 为何不能把事情搞清楚后再招标,然后直接启动?这样可以减小投资风险。


回复
shawls 2007-12-23


整个工程的建设启动在明年下半年
我现在主要是想要自己有个底,以后好操作,招标也是年底前完成

1、历史数据:

现在主要问题是生产库中的数据不够完整,我们的数据是从世纪初期的客户资料等为基础的,但是那些东西基本没有进入数据库,数据库中大多是80年代开始数据清理开始羁留,90年代中期信息化以来,进入数据库的,所以,历史数据这个概念,应该说,就是90年代入库的全部资料。这些资料可能从上世纪初期提取,也可能是入库时提取的。(目前4t数据已经基本包含全部历史数据了)

至于历史数据的保存,我们希望是一个永久的保存,时间阶段应该在60年~120年左右,不少于60y,不高于120y

2、历史数据的访问频度:

应该说是1年内最频繁,10年次之,然后30年是一个阶段,

3、目前主要是做数据报表(也就是处理10年内数据),下阶段做挖掘和即夕查询(主要为其他平行部门做支持)

4、使用数据仓库,人数实际上应该在1000~6000左右(目前估算)
最近1~2年是在2000以内,随后我们会全面开放,届时会到达6000,不过不会超过1w
回复
zhongxh 2007-12-22

需要看你这个数据仓库建设的目标来决定。

1、需要保存多少历史数据?

2、不同时期的历史数据访问的频度如何?

3、是以Ad-Hoc查询为主,还是做报表,或者做挖掘?

4、使用数据仓库的人有多少?都是什么类别?

看起来你们也是一个很重要的单位,建议采取公开招标,来获取更多的信息,先让自己对将来的目标非常清楚,然后再来选择投资。


回复
相关推荐
发帖
数据仓库
创建于2007-09-28

7363

社区成员

其他数据库开发 数据仓库
申请成为版主
帖子事件
创建了帖子
2007-12-20 02:44
社区公告
暂无公告