排序两两比较模型：Why-not问题的高效解释与数据清洗策略

26 浏览量更新于2024-06-28 收藏 2.7MB PDF 举报

本文主要探讨了在数据库查询过程中遇到的"两两比较模型的Why-not问题"，这个问题指的是用户在查询结果中未能找到预期答案时产生的疑问，即"为什么预期的元组没有出现在结果中"。传统的处理方式是通过列举所有可能的元组值来解释这种缺失，但这种方法存在的问题是解释数量庞大，超出用户的理解和探索能力。为了改进这一问题，研究人员提出了一个新颖的方法。首先，他们重新定义Why-not问题的解释形式，尽量避免使用变量，以提高用户可理解性。这是因为当属性简化后仅表示为变量时，用户可能难以理解其实际含义。这一步骤有助于增强解释的直观性。接着，文章关注到了数据的稀疏性问题。为了解决直接在原始数据上学习导致的解释质量不高和不确定性，作者提出了一种基于{0,1}表示的元组对的统计模型。这种方法利用元组间的相等和不相等关系，构建了一个统计框架，能够有效地处理数据稀疏性。在这个框架下，多种统计模型，如统计分布、分类和回归模型，可以用来推断元组之间关系的概率。最后，通过对这些推断概率的评估，文章实现了对Why-not问题解释的排序。这样做的目的是提供给用户更加合理、易于理解的解释，优先呈现那些可能性较高的原因，从而提高用户体验和解释的有效性。实验结果显示，利用统计、分类和回归方法来计算元组间关系的概率分布，对于解释Why-not问题具有显著的优势，能够为用户提供质量更高的解释结果。因此，这种方法对于提升数据清洗过程中的数据质量问题，以及帮助用户理解和接受查询结果的不足，具有重要的实践价值。关键词涉及到了数据质量、数据清洗、条件函数依赖、缺失结果解释以及解释排序等领域，显示了研究的针对性和实用性。该论文发表在《软件学报》上，为数据管理领域的理论研究和实际应用提供了新的视角和解决方案。

罗伯特之技术屋

粉丝: 4558

排序两两比较模型：Why-not问题的高效解释与数据清洗策略

两种模型的比较.pdf

不同计算模型方法比较.pdf

数据结构--排序--思维导图.pdf

两两认识leetcode-get-a-job-you-bum:采访......采访永远不会改变

Java中数组实例---冒泡排序.pdf

第6课 统计数字——归并排序（count）-2020.04.11.pdf

2021年五一赛B题-消防救援问题-01.pdf

论文研究-基于Delphi排序改进的AHP-Fuzzy人机布局虚拟评价.pdf

考研备考资料真题-昆明理工大学826物流工程学2013--2019年考研真题.pdf

数据收集与处理 2022-11-2 232719 4.pdf

最新资源

第6课统计数字——归并排序（count）-2020.04.11.pdf