社区
数据仓库
帖子详情
令人混淆的定义!
tongbyjr
2002-10-16 04:11:56
刚看Analysis Services不久,一碰到这些定义就蒙了。
多维数据集?
维度?
星形架构?
雪花架构?
多维数据集度量值?
维度的级别?
父子维度?
谁来讲讲,我出重金!
...全文
44
8
打赏
收藏
令人混淆的定义!
刚看Analysis Services不久,一碰到这些定义就蒙了。 多维数据集? 维度? 星形架构? 雪花架构? 多维数据集度量值? 维度的级别? 父子维度? 谁来讲讲,我出重金!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
CSDNM
2002-10-18
打赏
举报
回复
Analysis Services的联机帮助里这些内容应该讲的比较详细的,以下是多维数据集的概述,大家看看有多少内容,有几个图表这里不能贴上,图表是很能帮助理解的,还是看帮助吧!!!
多维数据集简介
多维数据集是联机分析处理 (OLAP) 中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术。多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。
多维数据集提供一种便于使用的查询数据的机制,不但快捷,而且响应时间一致。最终用户使用客户端应用程序连接到分析服务器,并查询该服务器上的多维数据集。在大多数客户端应用程序中,最终用户通过使用用户界面控件对多维数据集进行查询,所使用的控件决定查询内容。这使得最终用户不必编写基于语言的查询。称为聚合的预先计算好的汇总数据提供快捷且响应时间一致的查询机制。多维数据集的聚合在最终用户访问之前即已创建。查询结果可从下列源或其组合中检索:聚合、数据仓库中多维数据集的源数据、分析服务器上该数据的复本以及客户端高速缓存。分析服务器可支持许多不同的多维数据集,如销售多维数据集、清单多维数据集以及客户多维数据集等。
每个多维数据集都有一个架构,架构是数据仓库中已联接的各表的集合,多维数据集从数据仓库提取其源数据。架构中的核心表是事实数据表,事实数据表是多维数据集度量值的源。其它的表有维度表,维度表为多维数据集维度的源。有关架构的更多信息,请参见多维数据集结构。
多维数据集由其所包含的度量值和维度定义。例如,一个用于销售分析的多维数据集内包括度量值 Item_Sale_Price 和 Item_Cost 以及维度 Store_Location、Product_Line 和 Fiscal_Year。该多维数据集使最终用户得以按 Store_Location、Product_Line 和 Fiscal_Year 将 Item_Sale_Price 和 Item_Cost 分成各种类别。
每个多维数据集的维度均可以包含级别层次结构,以指定最终用户可用的类别细目。例如,Store_Location 维度包含的级别层次结构为:Continent、Country、Region、State_Province、City、Store_Number。维度中的每个级别均比其父代的粒度更为精细。例如,洲 (continent) 包含国家 (country),州 (state) 或省 (province) 包含城市 (city)。同理,Fiscal_Year 维度的层次结构中可包含级别 Year、Quarter、Month 和 Day。
维度级别是功能强大的数据建模工具,因为它们使最终用户得以在高级别上提问,然后展开维度层次结构以显示更详细的信息。例如,最终用户开始时可以要求查看过去三个财政年度 (fiscal year) 产品的 Item_Cost 值,然后可能注意到 1998 的 Item_Cost 值比其它年份高,于是将 Fiscal_Year 维度展开到 Month 级别,发现一月 (January) 和八月 (August) 的 Item_Cost 值特别高。随后,最终用户可能浏览 Store_Location 维度中的级别,以查看是否是某个特定地区造成 Item_Cost 值明显偏高,或展开 Product_Line 维度以查看是否是某特定的产品组或产品的 Item_Cost 值偏高。这种称为深化的浏览类型在客户端应用程序中非常普遍。
有关维度、级别和度量值的更多信息,请参见维度、级别和度量值。
例如,考察下面的 Imports 多维数据集,其中包含"包"和"上一次"两个度量值和"路线"、"源"和"时间"三个维度。
多维数据集周围更小的字母数字值是维度的成员。示例成员有"陆地"、"非洲"和"第一季度"。
多维数据集内的值为度量值。示例度量值为"包:190"和"上一次:Feb-17-99"。这些值存在于多维数据集内的所有单元中,但只对前台中的单元进行显示。(在真正的多维数据集内,多维数据集单元内不会显示"包"和"上一次"这两个词,这里将其显示出来是为了与度量值区分。在真正的多维数据集内,各度量值在称为"度量值"维度的特殊维度中彼此分隔。)
"包"度量值代表进口包的数量,通过 Sum 函数聚合;"上一次"度量值代表收到的日期,通过 Max 函数聚合;"路线" 维度代表进口货物到达目的地的方式;"源"维度代表进口货物的原产地;"时间"维度代表一年的四个季度及上半年及下半年。
多维数据集的最终用户可以确定每个维度上各个成员的度量值。之所以有此可能是因为度量值是由成员聚合的。例如,上图中所示的度量值按下面的方式在"时间"维度内聚合。
除可以在一个维度内聚合之外,度量值还可以聚合来自不同维度的成员的各种组合,从而使最终用户得以同时按多个维度中的成员对度量值进行评估。例如,如果最终用户想分析各个季度通过航空运输从东半球和西半球进口的货物,最终用户可以在该多维数据集上发出相应的查询以检索下列数据集。
包 上一次
全部源 东半球 西半球 全部源 东半球 西半球
全部时间 25110 6547 18563 99/12/29 99/12/22 99/12/29
上半年 11173 2977 8196 99/06/28 99/06/20 99/06/28
第一季度 5108 1452 3656 99/03/30 99/03/19 99/03/30
第二季度 6065 1525 4540 99/06/28 99/06/20 99/06/28
下半年 13937 3570 10367 99/12/29 99/12/22 99/12/29
第三季度 6119 1444 4675 99/09/30 99/09/18 99/09/30
第四季度 7818 2126 5692 99/12/29 99/12/22 99/12/29
一个多维数据集最多可包含 128 个维度(每个维度中可包含数百万成员)和 1,024 个度量值。具有适当数目的维度和度量值的多维数据集通常能够满足最终用户的要求。
Microsoft® SQL Server™ 2000 Analysis Services 中有几种不同的多维数据集。尽管常规多维数据集拥有本主题及其子主题中所介绍的多维数据集特性,但其它种类的多维数据集并不具备所有这些特性。有关多维数据集种类的更多信息,请参见多维数据集种类。
在对象层次结构中,多维数据集直接从属于数据库。数据库是相关的多维数据集及其所共享的对象的容器。在创建多维数据集之前必须首先创建数据库。有关更多信息,请参见数据库。
在对象层次结构中,下列对象直接从属于多维数据集:
数据源
一个多维数据集有一个数据源。该数据源既可以从数据库内的数据源中选择,也可以在创建多维数据集时创建。多维数据集维度的数据源必须与多维数据集的数据源相同,但其分区可以有不同的数据源。
度量值
多维数据集的度量值不与其它多维数据集共享。在创建多维数据集时创建度量值。一个多维数据集最多可包含 1,024 个度量值。
维度
多维数据集的维度既可以与数据库中的其它多维数据集共享,也可以为该多维数据集所专用。共享维度可在创建多维数据集之前或创建期间创建,专用维度则在创建多维数据集时创建。虽然术语"立方体"使人想起三个维度,但一个多维数据集最多可包含 128 个维度。
分区
在创建多维数据集时,将自动为该多维数据集创建一个分区。如果安装了 SQL Server 2000 企业版 Analysis Services,则在创建多维数据集后,可在该多维数据集内创建附加分区。
多维数据集角色
每个多维数据集必须至少有一个多维数据集角色,以便向最终用户提供访问权限。多维数据集角色出自数据库角色,数据库角色可在创建多维数据集之前或之后创建。多维数据集角色在创建多维数据集之后创建。
命令
命令是可选的。可在创建多维数据集之后创建命令。
在创建多维数据集之后,接下来要创建的对象通常是分区或聚合。有关更多信息,请参见分区和聚合。
创建多维数据集包括以下三步:
定义
多维数据集的定义基于最终用户的分析要求。若要定义一个多维数据集,请选择一个事实数据表并标识事实数据表中的度量值。然后选择或创建维度,每个维度包含来自其它表中的一列或多列。多维数据集向导提供一种定义多维数据集的简便方法。而多维数据集编辑器则为定义及修改多维数据集结构提供更大的灵活性。有关更多信息,请参见生成多维数据集。
聚合设计
在定义新多维数据集后,请使用存储设计向导设计其聚合。设计聚合即是指定汇总策略。有关更多信息,请参见设计存储选项和聚合。
处理
在设计新多维数据集的聚合后,用"完全处理"选项对该多维数据集进行处理。这一操作将创建聚合。有关用"完全处理"选项处理多维数据集的更多信息,请参见处理多维数据集。
在创建多维数据集之后,使用多维数据集编辑器对其进行维护。
如果在处理多维数据集之后对其进行了更改或多维数据集的源数据发生了更改,则通常需要对该多维数据集再次进行处理。不同处理选项适用于不同情况。有关多维数据集可用的处理选项的更多信息,请参见处理多维数据集。
有关多维数据集安全性选项的信息,请参见多维数据集安全性。
如果编程时所使用的是决策支持对象 (DSO),则与该多维数据集相关联的类的类型是 clsCube。有关更多信息,请参见 clsCube。
KINGKANG
2002-10-18
打赏
举报
回复
关注一下!
sunwk
2002-10-18
打赏
举报
回复
多看看资料吧,这么大的题目哪能几句讲清楚,去这儿看看吧
www.dwway.com
zhihaiw
2002-10-17
打赏
举报
回复
多维数据集?就是建一个数据立方体,把该汇总的数据汇总用空间换时间吗?维度?就是按分类吗?星形架构?雪花架构?就是建数据模型的结果?多维数据集度量值?你要用户分析的数据如多少钱呀增长的用户数呀?父子维度?是指一个表里存有纬度的各级别信息通过父子纬度产生纬度结构?
tanjun_007
2002-10-17
打赏
举报
回复
限于篇幅,很难一下都讲清,
建议先看〈数据仓库〉Inmon著,王志海译,
Analysis Services只是一个数据仓库的一个构建工具,
signboy
2002-10-17
打赏
举报
回复
看看英文的资料,可能会清楚一点
tongbyjr
2002-10-17
打赏
举报
回复
怎么联系阿?
ddvboy
2002-10-17
打赏
举报
回复
和我联系
一文带你了解
混淆
矩阵!
来源 |数据科学CLUB封图 | CSDN 下载自视觉中国
混淆
矩阵是一个表,经常用来描述分类模型(或“分类器”)在已知真实值的一组测试数据上的性能。
混淆
矩阵本身比较容易理解,但是相关术...
JS逆向---
令人
抓狂的JavaScript
混淆
技术
JavaScript 压缩、
混淆
和加密技术JavaScript 代码运行于客户端,也就是它必须要在用户浏览器端加载并运行。JavaScript 代码是公开透明的,也就是说浏览器可以直接获取到正在运行的 JavaScript 的源码。声明本文章中...
Android
混淆
你了解多少?
在 Android 日常开发过程中,
混淆
是我们开发 App 的一项必不可少的技能。只要是我们亲身经历过 App 打包上线的过程,或多或少都需要了解一些代码
混淆
的基本操作。那么,
混淆
到底是什么?它的好处有哪些?具体效果...
三位深度学习之父共获2019年图灵奖,学术人生
令人
赞叹!!!
也许更
令人
惊讶的是,深度学习在自然语言理解的各项任务中产生了非常可喜的成果,特别是主题分类、情感分析、自动问答和语言翻译。我们认为在不久的将来,深度学习将会取得更多的成功,因为它需要很少的手工工程,...
第27讲:
令人
抓狂的 JavaScript
混淆
技术
接下来我们引入了 javascript-obfuscator 库,然后
定义
了一个方法,传入 code 和 options,来获取
混淆
后的代码,最后控制台输出
混淆
后的代码。 代码逻辑比较简单,我们来执行一下代码: node main.js 输出结果如下:...
数据仓库
7,394
社区成员
6,741
社区内容
发帖
与我相关
我的任务
数据仓库
其他数据库开发 数据仓库
复制链接
扫一扫
分享
社区描述
其他数据库开发 数据仓库
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章