有多种用于管理数据仓库质量的工具如下 -
给出了质量的定义和量化,作为绩效超过预期的分数。它用于将质量定义为从产品交付给社会的损失。社会的完全损失可以看作是生产者损失和用户损失的总和。
众所周知,产品或服务的质量与生产成本之间存在权衡,组织应该在这两个参数之间找到平衡。如果失去平衡,那么组织无论如何都会失败。
在数据质量领域已经完成了多项研究。研究人员和从业人员都面临着提高决策支持系统质量的问题,通常是通过改善他们的信息质量。它可以展示这方面的相关工作,或多或少地影响了我们对数据仓库质量的方法。
该框架包括改编自 ISO 9000 标准的七个要素,例如行政责任、服务和保证成本、研发、生产、分销、人事管理和法律服务。该框架回顾了数据质量文献的重要组成部分,但只有数据质量的研发形式似乎与数据仓库质量设计的原因一致。
该领域主要包括三个问题:数据产品的数据质量方法的分析与设计、结合数据质量方法的数据制造系统(DMS)的设计以及数据质量度量的定义。
数据质量系统围绕实现数据质量管理的组织结构、职责、流程和资源。数据质量控制是一组操作方法和活动,用于获得数据产品所需的质量。数据质量保证包含所有准备好的和有序的服务,这些服务对于支持数据产品将满足一组给定的质量规范的足够信心是必不可少的。
保存在仓库中的数据的质量本身并不是一个过程。它受仓库环境中发生的所有过程的影响。有几个数据质量因素如下 -
该完整性因素定义了源和仓库推出了有趣的真实世界的数据的百分比。
的可信性因子定义了所支持的数据的源的可信度。
的精度因子定义了出现在源的数据输入过程的准确性。
的一致性因子定义有关的逻辑规则和约束的数据的逻辑一致性。
该数据可解释性因子涉及数据定义(遗留系统和外部记录即数据设计,关系数据库,主键和外键,别名,默认值,域表定义,编码值的说明中,等等)