在线分析挖掘的结构是什么?

OLAM 服务器在数据立方体中进行分析挖掘,类似于 OLAP 服务器进行在线分析处理。OLAM和OLAP一体化机制,OLAM和OLAP服务器均通过图形用户界面API接受用户在线查询(或命令),并通过cube API对数据分析中的数据cube进行操作。

元数据目录可用于指示数据立方体的访问。可以通过 MDDB API 访问和集成多个数据库以及通过可以提供 OLE DB 或 ODBC 连接的数据库 API 过滤数据仓库来创建数据立方体。

因为一个OLAM服务器可以实现概念描述、关联、分类、预测、聚类、时序分析等多种数据挖掘任务。它一般包括多个集成的数据挖掘模块,比OLAP服务器更复杂。

一个OLAM引擎可以执行多种数据挖掘任务,例如概念描述、关联、分类、预测、聚类和时间序列分析。因此,它通常由多个集成的数据挖掘模块组成,使其比 OLAP 引擎更复杂。OLAP 和 OLAM 所需的数据立方体之间没有根本区别,尽管 OLAM 分析可能需要更强大的数据立方体构建和访问工具。

当 OLAM 涉及更多具有更细粒度的维度或涉及数据立方体上的多特征聚合的发现驱动探索时,就会出现这种情况,因此需要的不仅仅是 OLAP 分析。此外,当探索性数据挖掘识别出有趣的点时,OLAM 引擎可能需要从数据立方体钻取到相应的关系数据库,以对数据的特定部分进行详细分析。

当 OLAM 涉及更多具有更细粒度的维度或涉及数据立方体上的多特征聚合的发现驱动探索时,就会出现这种情况,因此需要的不仅仅是 OLAP 分析。此外,当探索性数据挖掘识别出有趣的点时,OLAM 引擎可能需要从数据立方体钻取到相应的关系数据库,以对数据的特定部分进行详细分析。

此外,数据挖掘过程可能会揭示构建的多维数据集的维度或度量不适合数据分析。在这里,精细的数据立方体设计可以提高数据仓库建设的质量。

有效的数据挖掘需要探索性数据分析。用户通常希望遍历数据库,选择相关数据的部分,以不同的粒度对其进行分析,并以不同的形式呈现知识/结果。

在线分析挖掘为不同数据子集和不同抽象级别的数据挖掘提供了便利。它可以通过对数据立方体和中间数据挖掘结果进行钻取、旋转、过滤、切割和切片来实现这一点。这与数据/知识可视化工具一起,可以大大提高探索性数据挖掘的能力和适应性。