什么是数据挖掘系统与数据库系统的集成?

数据挖掘系统与数据库或数据仓库系统集成,以便它可以有效地完成其任务。数据挖掘系统在需要它与其他数据系统(如数据库系统)通信的环境中运行。有可能的集成方案可以集成这些系统,如下所示 -

无耦合- 无耦合定义数据挖掘系统不会使用数据库或数据仓库系统的任何功能。它可以从特定来源(包括文件系统)检索数据,使用一些数据挖掘算法处理数据,从而将挖掘结果保存在不同的文件中。

这样的系统虽然简单,但由于各种限制而恶化。首先,数据库系统在存储、组织、访问和处理数据方面提供了很大的灵活性和适应性。在不使用数据库/数据仓库系统的情况下,数据挖掘系统可以分配大量时间来查找、收集、清理和更改数据。

松耦合- 在这个数据挖掘系统中使用数据库或数据仓库系统的一些服务。数据是从这些系统处理的数据存储库中获取的。使用数据挖掘方法对数据进行处理,然后将处理后的数据保存在文件中或数据库或数据仓库中的指定区域中。松耦合比没有耦合要好,因为它可以通过使用查询处理或各种系统设施来获取存储在数据库中的某些数据区域。

Semitight Coupling - 在这种情况下,数据库/数据仓库系统可以支持一些基本数据挖掘原语的充分执行。这些原语可以包含排序、索引、聚合、直方图分析、多路连接和一些重要统计度量的预计算,包括总和、计数、最大值、最小值、标准偏差等。

紧耦合- 紧耦合定义了数据挖掘系统顺利集成到数据库/数据仓库系统中。数据挖掘子系统被认为是信息系统的一个功能元素。

数据挖掘查询和功能是在数据库/数据仓库系统的挖掘查询分析、数据结构、索引方案、查询处理方法等基础上开发和建立的。它是非常可取的,因为它支持数据挖掘功能的有效实现、高系统性能和集成的数据处理环境。