数据挖掘的组成部分有哪些?

数据挖掘是对大量信息进行选择、探索和建模的过程,以找到最初未知的规律或关系,从而为数据库所有者获得清晰和有益的结果。

数据挖掘是一个跨学科领域,是一组学科的集合,例如数据库系统、统计学、机器学习、可视化和数据科学。它基于所使用的数据挖掘方法,可以使用其他学科的方法,包括神经网络、模糊和粗糙集理论、知识表示、归纳逻辑编程或高性能计算。

它基于要挖掘的数据类型或给定的数据挖掘应用程序,数据挖掘系统还可以集成空间数据分析、数据检索、模式识别、图像分析、信号处理、计算机图形学、网络技术、经济学、商业、生物信息学或心理学。

可以设计一种数据挖掘查询语言来结合这些原语,使用户能够灵活地与数据挖掘系统连接。数据挖掘查询语言支持可以构建用户友好图形界面的权限。这促进了数据挖掘系统与其他数据系统的通信以及与完整数据处理环境的集成。

设计一种包容性的数据挖掘语言具有挑战性,因为数据挖掘保护了从数据表征到演化分析的广泛功能。每个任务都有几个要求。设计有效的数据挖掘查询语言需要广泛了解不同类型数据挖掘任务的功能、限制和底层结构。

数据挖掘功能用于定义必须在数据挖掘任务中发现的模式类型。一般来说,数据挖掘任务可以分为描述性和预测性两种类型。描述性挖掘任务定义数据库中数据的共同特征,而预测性挖掘任务对当前信息进行推理以进行预测。

数据挖掘的主要组成部分如下 -

  • Databases - 这是一个或一组数据库、数据仓库、电子表格和另一种可以实施数据清理和集成技术的数据存储库。

  • 数据仓库服务器- 此组件根据用户从数据仓库的请求获取相关记录。

  • 知识库- 这是一个用于发现有趣模式的知识领域。

  • 数据挖掘引擎- 它使用一个功能模块,用于执行包括分类、关联、聚类分析等在内的任务。

  • 模式评估模块- 该组件使用与数据挖掘结构通信的兴趣度量来将搜索定位到有趣的模式。

  • 用户界面- 此界面使用户能够通过描述数据挖掘功能或通过图形用户界面进行查询来与系统交互。