什么是数据立方体?

数据立方体使数据能够在多个维度上建模和查看。它由维度和事实表示。换句话说,维度是组织需要保存记录的视图或实体。

例如,AllElectronics 可以创建一个销售数据仓库来维护商店与销售相关的维度时间、商品、分店和位置的记录。这些维度使商店能够跟踪诸如商品的每月销售额以及销售商品的分支机构和位置之类的内容。

每个维度都可以有一个与之相关的表。它被称为维度表,它进一步表示维度。例如,项目的维度表可以包括属性项目名称、品牌和类型。维度表可以由用户或专业人员确定,也可以根据数据分布自动创建和调整。

多维数据模型通常围绕中心设计组织,例如销售。这种设计是由一个事实表定义的。事实是数学度量。销售数据仓库的事实示例包含已售出的美元(以美元为单位的销售额)、已售出的单位(已售出的单位数)和预算金额。事实表包括事实或度量的名称以及每个关联维度表的键。

数据立方体是从数据库中的属性子集生成的。选择特定属性作为度量属性,即其值感兴趣的属性。选择其他属性作为维度或功能属性。度量属性按维度聚合。

例如,XYZ 可以创建一个销售数据仓库来维护商店的销售时间、项目、分店和位置维度的记录。这些维度使商店能够跟踪诸如商品的每月销售额以及出售商品的分支机构和位置之类的内容。

每个维度都可以有一个可以识别的表。它被称为维度表,用于定义维度。例如,项目的维度表可以包括属性 item_name、brand 和 type。

数据立方体技术是具有多种应用的有趣方法。在某些情况下,数据立方体可能很稀疏,因为并非每个维度的每个单元格都可以在数据库中具有相应的信息。如果查询包含的常量级别甚至低于数据多维数据集中支持的级别,则不清楚如何最好地利用保存在数据多维数据集中的预计算结果。