我对数据仓库的感觉

华芸智森 2008-09-08 09:48:40
我不知道该让这篇文章叫什么名。。。感觉写得有点乱。就暂叫:我对数据仓库的感觉 吧。
也许写得有不对的地方,请多包函。


对于数据仓库,我很早就看了一些相关的书,但由于客户一直没有相关的需求,所以仅仅知道MS有这么一个东西,但具体的东西是什么样的,我并不知道。

后来,看了杨大川的一个关于MSOLAP2000的录像,感到MSAS的功能非常的强大。看他演示了经典的数据挖掘--决策树,我心里就想,原来,数据的真正的意义在这里,后来他再

用普科(ProClarity)来演示分解树的时候,我觉得MSAS真是帅呆了。心里感觉,BI无所不能。未来,尤其是商业市场的未来,高端部分非数据仓库莫属。

就这样,一个演示的录像,让我走上了数据仓库之路。人的改变就是这样的偶然。

就这样,我决心要在这条路上走,无论多困难,我都要走。

买了十几本关于OLAP,NDX 的书,放在电脑包里,空闲时看看,上班坐公交车的路上看看,下班的路上看看。回家空闲时也看看。我并没有急于去掌握这门技术,我觉得,只要点

点滴滴,细水长流。我相信,再大的桶,也会有滴满的一天。

当我觉得书看得差不多了,于是,自己假想了一个简单的商业方案。用这个假想的方案去做一次实实际际的操作。呵呵,很顺利,这个假想的方案并不困难。很顺利地完了了。

水,终于滴到能看到的那一天了。当时我在某学会上班,里面,最充足的资源就是各种的统计数据,我选了一个最完整,最连续 的一个库---某某库。作为我第一个MSAS项目。
确定该项目为三个页面:第一个是普通的浏览,第二个页面是分解树,第三个页面是KPI。
功能或需求定位了,动手吧。。。。
重新做一个适适合数据仓库的库---就是反规格化的库。重新建立相关的可索引的视图,将原来的数据倒进去。建立仓库,写一个针对MSAS的类,写一个WEB的分解树的控件,
写了一个WEB展示的控件。最后,一个多月后,这个仓库出来了。我觉得很顺利。其间最大的收获是什么?写了关于MSAS的类,和OLAP的网络控件,让我知道MSAS返回的CELLSET是

什么东西,也让我的MDX更熟练了。 :)

早两三周前,我辞去了某学会的职务,变成了无业者。呵呵,我并没有急着找工作,觉得自己应该考虑一下自己的未来,我的未来在哪里?哪里是出路?
现在,已很少灵光一闪的思维了,该闪的事,几年前就闪过了。。。我觉得应该好好地沉淀一下,整理一下。在众多的技术面前,哪里有出路?我决定---还是BI。

不错,还是它,没人有什么东西比它对我更有吸引力的了,也没有什么比它更让我着迷的了。
但我知道,我只是刚开始,路,还是很的。

思考一下中国目前的BI现状,是什么现状?
企业对BI渴望,但对BI的价值评估严重不足,企业,一个用**3000,管*婆,管理的小工厂,用**CRM管理的客户,用某某*蝶,**MRP,**erp管理的大型企业。他到底需要BI的什么

?BI的哪部分?我看过一些企业的BI,充其量,就是一个报表。难道,在中国的企业,BI=报表 ?这就是需求?

/***********
插一个是外话:
如果BI仅仅等于多维的报表,我上几个月曾在CSDN里与人讨论过一个问题:用SQL模拟MDX的多维报表。后来,我下定决心,开发一个这样的WEB网格工具。一周的时间,我做出来的

。就是用SQLSERVER模拟的MDX WEB报表展示。仅仅从外表看,你还真分不出这是数据库。
其实,我开发这个报表的目的也是生产的需要,因为客户就是要这个报表就够了。多了反而部署困难。而开发的直接灵感或者说思路,则是原原版版的仓库的思路.
***********/

我突然想到,能不能将仓库与一些其它的工具配合起来,也许,BI会显得更完整。也会更容易.
我想到了MATLAB这个数学工具,MATLAB里有经典的工具箱,很多经典的算法,一些在其它编程语言很难做到的地方,它能轻易地做到,比如说,矩阵的运算,各种积分,多重积分

,各种微分,各种插值,各种的仿真工程,各种的规划求解。更重要的,它的数据可视化,绝对是无敌的数据可视化,杀伤力太大了。而它比其它任何一门计算机语言更容易懂。

我心里的未来之路就是:数据仓库与MATALB的结合。
...全文
430 26 打赏 收藏 转发到动态 举报
写回复
用AI写文章
26 条回复
切换为时间正序
请发表友善的回复…
发表回复
山东蓝鸟贵薪 2011-12-29
  • 打赏
  • 举报
回复
顶顶,学习一下
wangdehao 2008-09-23
  • 打赏
  • 举报
回复
“BI不仅仅是技术”
厚土载物 2008-09-23
  • 打赏
  • 举报
回复
[Quote=引用 13 楼 babyt 的回复:]
引用楼主 MSTOP 的帖子:
不幸的是,国内的大多企业都是如此.
若干家移动分公司,网通分公司,若干家银行&若干家保险公司
举凡国内企业,大多数所谓的BI就是个报表系统,需求就是老系统生成的若干Excel.
对于项目的要求,除了时髦的web展现,终极要求还是生成跟原来一样的Excel~~
系统架构初期的漂亮数据模型,cube,到后来基本上不用了,拿着报表回溯数据源和算法,从业务系统抽数据,清洗,汇总..
出来就完事
啥datastage,teredata啊,都糟蹋了..


[/Quote]

强烈支持
flingstar 2008-09-21
  • 打赏
  • 举报
回复
很赞同楼主在19楼的分析和见解!
的确,在中国,每件事似乎都有它的潜规则,所以我也比较赞同“BI不仅仅是技术”这一观点!
去各地做项目实施,免不了要喝酒,可本人却偏偏极为反感这种任何事都用酒来解决的社交方式和风气,那些做销售的同事们,就更不用多说了,想拿单子?可能看中的不是你的技术,而是你的酒量!!也许,这就是楼主所谓的“攻人”策略吧!!
中国人,钻研的不是如何把技术做深,而是如何把客户喝倒,喝满意~~
可怜的国度~~
JavaPeak 2008-09-20
  • 打赏
  • 举报
回复
怎么最近一段时间,越来越多地听到数据仓库这个名词,和数据库有区别吗?
华芸智森 2008-09-18
  • 打赏
  • 举报
回复

谢谢各们关注.本人对BI 的认识的确比较粗浅.

当然,这是我接触BI的感觉,但也是仅仅是针对MDX和报表.对于数据挖掘.一来,仅仅看了些书,二来还真没有实际地弄过.呵呵..

我觉得挖掘,应与业务和技术纽合一样.挖掘本身是有目的,有方向的动作.在一堆数据中寻找出某些规律,刍势,或验证决策的某种预测,
而挖掘这个动作的结果,却又是不可预测,是未知的.但是,谁也保证不了这个结果是正确的?

挖掘无非就是想企业效益最大化.但是,决策者的经历告诉他自己:就算是再完整再好的模型得到的结果在商业行为中可能都是没用的,
找对人 说对话 办对事 送对钱,投对方之所好,而各取所需.效益来得更直接,更快.挖掘的结果只是一个参考.甚至认为连参考的价值都没有.
因为,他认为技术上根本就没办法把"人性"这个最重要,最关键的因素考虑进去.他认为抛开了最重要的因素去考虑问题,很片面,更甚者认为是错误的.

一句话就是:决策者认为 "攻人" 比 "攻技术" 重要得多.既然是没有需求,何来驱动?所以,导至了国内BI这一块,大多数情况下,就只能做做报表了.

这个,可能更符合国内的现状.

所以呢,在中国,BI,不仅仅是技术问题. :)

我所言仅为片面意见,有错漏之处,望各位指之..
zhouxm2003 2008-09-18
  • 打赏
  • 举报
回复
数据仓库是一个过程,而不是一个产品或简单的一个项目.
十豆三 2008-09-18
  • 打赏
  • 举报
回复
分析的有道理。

好多版块活跃不起来,就是类似这个原因。
flingstar 2008-09-17
  • 打赏
  • 举报
回复
看完之后,感觉楼主对数据仓库的理解和看法还是有些片面,可能楼主是从事或曾经从事过诸如ssas,mdx web和matlab相关的工作或涉及过相关的项目吧!
matlab是一个很强的数据工具,在BI里,如果能应用到数据分析上去,可能会更好地发挥它的作用,但纵观整体BI行业,真正能把数据分析和数据挖掘做到极至的,在国内还几乎没有!
楼主研究的是数据仓库的方向之一,所以才有了此番见解。就像楼主说的,这可能仅仅是他“对数据仓库的感觉”吧!其实基于数据仓库基础之上的,还有很多可以研究!
我个人是做BI项目的,对这一方面,也有着自己的一些见解!对于现阶段国内的BI,我真的有一丝担忧,就像13楼的兄弟所言,那些大企业(移动、联通、电信、银行、邮政等,当然也有比这些更大的,只是我没发现)对BI的概念说来说去其核心就是报表,在分析和挖掘这个层面上,鲜有真正的成功实施案例!
啤酒和尿布的故事已经被说烂了,但那只是国外BI领先行业们的经典之作。而在现阶段的中国,我们谁又能真正做出一个像这样能推断出“啤酒和尿布摆在一起可以提高销售量”这样的预测呢(当然还是有,只是都比较浅,不够经典)!
这是一种可悲,但不知道这应该是那些正在使用BI的企业们的悲哀(对BI的理解和认同太片面,太匮乏),还是BI人的悲哀(没有做出真正像样的能让客户真正满意的BI解决方案来)。
希望所有BI人,都能积极努力推进BI事业在中国的发展~~
flingstar 2008-09-17
  • 打赏
  • 举报
回复
楼主的观点有独到之处,13楼的兄弟的论点我也非常赞同,我有强烈的同感!
flingstar 2008-09-17
  • 打赏
  • 举报
回复
[Quote=引用 13 楼 babyt 的回复:]
引用楼主 MSTOP 的帖子:

...

思考一下中国目前的BI现状,是什么现状?
企业对BI渴望,但对BI的价值评估严重不足,企业,一个用**3000,管*婆,管理的小工厂,用**CRM管理的客户,用某某*蝶,**MRP,**erp管理的大型企业。他到底需要BI的什么

?BI的哪部分?我看过一些企业的BI,充其量,就是一个报表。难道,在中国的企业,BI=报表 ?这就是需求?

...


不幸的是,国内的大多企业都是如此.
若干家移动…
[/Quote]
强烈支持!!!
skyzsf 2008-09-16
  • 打赏
  • 举报
回复
哈,看了你的东西使我对数据仓库的兴趣更浓了,我是初次接触数据仓库,要做毕业论文了,我打算弄点新的东西,就找到了数据仓库,希望在以后的学习中能得到前辈多点的指导,先谢谢了!
jinjazz 2008-09-11
  • 打赏
  • 举报
回复
路过,支持楼主
十豆三 2008-09-09
  • 打赏
  • 举报
回复
谢谢分享。
阿泰 2008-09-09
  • 打赏
  • 举报
回复
[Quote=引用楼主 MSTOP 的帖子:]

...

思考一下中国目前的BI现状,是什么现状?
企业对BI渴望,但对BI的价值评估严重不足,企业,一个用**3000,管*婆,管理的小工厂,用**CRM管理的客户,用某某*蝶,**MRP,**erp管理的大型企业。他到底需要BI的什么

?BI的哪部分?我看过一些企业的BI,充其量,就是一个报表。难道,在中国的企业,BI=报表 ?这就是需求?

...
[/Quote]

不幸的是,国内的大多企业都是如此.
若干家移动分公司,网通分公司,若干家银行&若干家保险公司
举凡国内企业,大多数所谓的BI就是个报表系统,需求就是老系统生成的若干Excel.
对于项目的要求,除了时髦的web展现,终极要求还是生成跟原来一样的Excel~~
系统架构初期的漂亮数据模型,cube,到后来基本上不用了,拿着报表回溯数据源和算法,从业务系统抽数据,清洗,汇总..
出来就完事
啥datastage,teredata啊,都糟蹋了..




-狙击手- 2008-09-09
  • 打赏
  • 举报
回复
谢谢分享
wwwwb 2008-09-09
  • 打赏
  • 举报
回复
学习,应该是应用SQL语句比较多吧?
昵称被占用了 2008-09-09
  • 打赏
  • 举报
回复
.
WWWWA 2008-09-09
  • 打赏
  • 举报
回复
感觉在数据库层面是一样的,用SQL语句处理、生成相关数据,表达方式是具体的吧?
华芸智森 2008-09-09
  • 打赏
  • 举报
回复
立方是根据业务(事务)来建立的,这与数据库有差别吧。一旦建立好了以后。这个立方是总经理的,他了解的是宏观信息,那个立方是针对业务员或业务经理的,他既要了解他本身的宏观信息,有可能又要下卷到某个业务的细节。从这点上,我觉得仓库是针对性。而数据库则把大大小小的信息放到几个表里。根据不同的要求用SELECT来处理。
加载更多回复(6)

7,388

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 数据仓库
社区管理员
  • 数据仓库
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧