【有偿求助】【用数据仓库做统计】求大牛帮忙

晓轩 2010-09-13 11:52:24
业务需求:
各位大牛好,我在做一个媒体分析的小软件。主要是对各个电视台播放的电视剧进行信息汇总统计。用.net 程序把每年的160个TXT文件内的数据(每个TXT大概20W条)导入到数据库的主表里,然后用程序对导入的数据进行查询生成明细报告和统计报告。主表的结构如下
CREATE TABLE [dbo].[收视](
[收视地区] [char](30) COLLATE Chinese_PRC_CI_AS NOT NULL,
[时段] [char](10) COLLATE Chinese_PRC_CI_AS NOT NULL,
[剧目] [nvarchar](50) COLLATE Chinese_PRC_CI_AS NOT NULL,
[集数] [nvarchar](50) COLLATE Chinese_PRC_CI_AS NOT NULL,
[剧场冠名] [nvarchar](50) COLLATE Chinese_PRC_CI_AS NOT NULL,
[播出频道] [nvarchar](50) COLLATE Chinese_PRC_CI_AS NOT NULL,
[日期] [datetime] NOT NULL,
[周日] [nvarchar](50) COLLATE Chinese_PRC_CI_AS NOT NULL,
[开始时间] [nvarchar](50) COLLATE Chinese_PRC_CI_AS NOT NULL,
[时长] [nvarchar](50) COLLATE Chinese_PRC_CI_AS NOT NULL,
[结束时间] [nvarchar](50) COLLATE Chinese_PRC_CI_AS NOT NULL,
[收视率%四岁以上所有人] [float] NOT NULL,
[收视率%男] [float] NOT NULL,
[收视率%女] [float] NOT NULL,
[收视率%4-12岁少儿期] [float] NOT NULL,
[收视率%13-18岁青少年期] [float] NOT NULL,
[收视率%19-30岁青年期] [float] NOT NULL,
[收视率%31-45岁中年期] [float] NOT NULL,
[收视率%46-60岁中老年期] [float] NOT NULL,
[收视率%60岁以上老年期] [float] NOT NULL,
[收视人口(000)四岁以上所有人] [int] NOT NULL,
[收视人口(000)男] [int] NOT NULL,
[收视人口(000)女] [int] NOT NULL,
[收视人口(000)4-12岁少儿期] [int] NOT NULL,
[收视人口(000)13-18岁青少年期] [int] NOT NULL,
[收视人口(000)19-30岁青年期] [int] NOT NULL,
[收视人口(000)31-45岁中年期] [int] NOT NULL,
[收视人口(000)46-60岁中老年期] [int] NOT NULL,
[收视人口(000)60岁以上老年期] [int] NOT NULL
) ON [s]([日期])

这个表是主表,每年数据量在5000千万左右。现在有4年的数据要进行导入。已经按照日期列进行每月分区。
因为所有列数据不唯一所以没有办法创建唯一索引。
需要对收视人口和收视率进行统计。
其他几个小表数据量都很小,涉及到简单的联合查询。
主要功能就是查询生成明细报告、统计报告。
要求:
对源数据库进行设计、对数据仓库按业务需求进行设计。

有感兴趣的朋友欢迎加我QQ或MSN详聊
qq:355572711
msn:xiaoxuan158@163.com


就是根据业务需求设计个数据库架构,有没有懂BI的想接啊,就是利用数据仓库做统计,其他的都用不到的。
目前面临的问题就是数据上亿以后统计报告就慢的根本跑不出来。所以希望用BI来完成,如果不用BI也能完成上亿数据的快速统计也是可以的。这个软件主要是为了方便公司内部人员工作写的一个简单的数据操作软件而已。请各位大牛帮帮忙吧!!!!!!!!!!!!!!!!!!!
...全文
279 18 打赏 收藏 转发到动态 举报
写回复
用AI写文章
18 条回复
切换为时间正序
请发表友善的回复…
发表回复
liaosunny 2010-10-14
  • 打赏
  • 举报
回复
密切关注
p6U8UU 2010-10-08
  • 打赏
  • 举报
回复
创建cube,用mdx来做,不过图形化的展现可以用RS
晓轩 2010-09-17
  • 打赏
  • 举报
回复
楼上的高人有时间帮忙搞搞这个BI么?
whb147 2010-09-16
  • 打赏
  • 举报
回复
这是个报告,而不是一个事实表
需要拆分的
根据txt的内容再分别填充
Zh.晨光 2010-09-15
  • 打赏
  • 举报
回复
听着很牛,干着很累。加油喽
飘零一叶 2010-09-15
  • 打赏
  • 举报
回复
不懂。。。继续学习
hovy_yang 2010-09-15
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 ws_hgo 的回复:]
SQL code
体力活
有请楼下..
[/Quote]
晓轩 2010-09-15
  • 打赏
  • 举报
回复
我也顶,每天一顶。还没有进展中.........................................
hao1hao2hao3 2010-09-14
  • 打赏
  • 举报
回复


数据仓库暂时没有接触过,帮顶,蹭分!

Me_online 2010-09-14
  • 打赏
  • 举报
回复
LZ 设计的表最完美地体现了数据仓库的本质,但是很遗憾在目前的现实中(记录上亿) 和资源下是可能实现您的要求的。要想真正地快,建Cube 是必须的了。
晓轩 2010-09-13
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 guguda2008 的回复:]
这个建个数据仓库用SSIS把TXT导进去就好,如果格式统一的话应该只是体力活,就是设计要好好计划一下
[/Quote]
恩,但是我不懂BI所以无从下手,希望楼上两位高手能不能抽点时间帮我弄弄,有偿的。

现在查询时间还可以忍受,就是做数据统计的时候非常慢,严重的时候系统都要挂了!!
ws_hgo 2010-09-13
  • 打赏
  • 举报
回复
体力活
有请楼下..
guguda2008 2010-09-13
  • 打赏
  • 举报
回复
这个建个数据仓库用SSIS把TXT导进去就好,如果格式统一的话应该只是体力活,就是设计要好好计划一下
billpu 2010-09-13
  • 打赏
  • 举报
回复
帮顶 仓储设计
whb147 2010-09-13
  • 打赏
  • 举报
回复
数据仓库的事实表不是这么玩的

需要维度支持
feixianxxx 2010-09-13
  • 打赏
  • 举报
回复
不懂个帮顶个
Rotel-刘志东 2010-09-13
  • 打赏
  • 举报
回复
数据仓储问题。
jinsenhome 2010-09-13
  • 打赏
  • 举报
回复
学习。。。。。。。。。

590

社区成员

发帖
与我相关
我的任务
社区描述
提出问题
其他 技术论坛(原bbs)
社区管理员
  • community_281
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧