数据质量评价模型:规则驱动的七指标体系

需积分: 0 3 下载量 146 浏览量 更新于2024-08-03 收藏 332KB PDF 举报
本文探讨了一种基于规则的数据质量评价模型,它是在对国际和国内现有数据质量定义及评价研究进行深入分析后提出的创新解决方案。作者发现,尽管已有大量研究,但数据质量的定义并未达成共识,评价指标缺乏全面性,评价体系不够系统化。针对这些问题,研究者提出了一个以七项核心指标为基础的数据质量全面定义,这七项指标包括准确性、完整性、一致性、时效性、可理解性、可用性和安全性。在此基础上,他们定义了十五类数据质量约束规则,明确了这些指标之间的相互关系。 模型的核心是通过五元组(实体、属性、值、时间戳和约束)来形式化描述数据质量评价指标算法,以完整性为例,详细阐述了如何运用这个算法进行评估以及其实现步骤。为了确保指标描述和存储的精确性,论文构建了一个元数据支撑的元模型体系。这一系列工作旨在提升数据质量评估的标准化和有效性。 研究的应用已经初步在大型企业的数据中心数据质量检测与评价中展开,实践结果表明,这种方法能够有效地提升数据质量,并且获得了良好的效果。该论文不仅关注理论层面的探讨,还强调了实际应用中的可行性,具有很高的实用价值。它被归类在计算机科学和技术领域(TP31),并被学术期刊收录,期刊编号为1673-629X,2013年第3期,文章编号为0081-04,同时提供了DOI供读者追踪引用。