Data warehouse 设计问题
正在学习数据仓库,概念有些模糊,数据仓库是面向主题的,报表算是一个“主题”吗?或则在以下情况中1为一个主题,2为一个主题?
有一个报表:
查询条件:城市/年龄/性别
假设有一家公司生产了一个产品,需要统计
1. 哪些销售商从公司批发了该产品 (根据搜索条件: 城市)
2. 每个销售点又有多少人买了该产品 (根据搜索条件: 城市/年龄/性别)
- a. 买产品的人的学历(例如,大专 多少人, 本科 多少人, 本科以上多少人)
- b. 性别和年龄(例如:男: 10-20岁多少人, 21-40岁多少人, 女:10-20岁多少人, 21-40岁多少人)
求教: 如何设计这个数据仓库?我有以下想法,但感觉设计的很有问题, 请各位给出方案学习一下.
维度表:
Dim日期
-ID
-年
-月
-日
Dim城市
-ID
-描述
Dim销售商
-城市Key
-描述
Dim学历
-ID
-描述
dim性别
-ID
-描述
dim年龄区间
-ID
-描述
事实表:
fact销售记录
-日期ID
-销售商Key
-销售记录Count
(是否应该把下列fact表整合到一个总的fact表? 但用一个fact表数据量是否会太大?)
fact客户学历
-年龄区间key
-性别key
-销售商Key
-日期Key
-学历Key
-客户学历Count
fact客户性别
-年龄区间key
-学历Key
-销售商Key
-日期Key
-性别key
-客户性别Count
fact客户年龄
-学历Key
-销售商Key
-日期Key
-性别key
-年龄区间key
-客户年龄Count