混合属性约简:一种基于模糊知识粒度的算法

需积分: 9 2 下载量 101 浏览量 更新于2024-09-08 收藏 568KB PDF 举报
"该论文研究了基于模糊知识粒度的混合属性约简算法,旨在解决在含有连续属性和模糊属性的决策系统中的信息丢失和处理难题。通过定义模糊粒度,提供新的属性约简条件和核属性计算方法,提出一种启发式算法,避免连续属性离散化,减少计算复杂性,统一处理离散和混合属性的约简问题。" 在粗糙集理论中,属性约简是核心问题,尤其是在处理实际世界的数据时,这些数据通常包含不完整、模糊和不精确的信息。传统的粗糙集理论在处理连续属性时,会因为属性值的离散化而损失信息,且无法处理模糊属性,即无法判断相似或等价的属性值。此外,由于噪声、不精确性和人为因素,属性特征可能具有模糊性,这使得约简过程更加复杂。 论文中提到的相关工作显示,学者们已经对属性约简进行了大量研究,包括模糊决策属性的约简方法、基于模糊粗糙集依赖度的属性约简以及基于属性重要性的信息论方法。然而,这些方法存在一定的局限性,如未考虑混合属性系统、算法收敛性问题、属性重要性定义的物理意义不明确等。 作者曹月芹提出了一种创新的解决方案,即基于模糊知识粒度的混合属性约简算法。首先,他们利用论域上的模糊等价关系来定义模糊粒度,这允许在保持信息完整性的前提下对模糊数据进行粒度划分。接着,他们给出了新的属性约简条件,这些条件能够适应混合决策系统,其中包含了离散和连续属性。通过这种方法,可以计算出核属性,即那些对决策系统至关重要的属性。 提出的启发式算法避免了对连续属性的离散化步骤,降低了计算复杂性,使得连续和离散属性的约简得以统一处理。这一改进不仅减少了信息损失,还提升了算法的效率。论文通过实例证明了该算法的有效性,证实了其在处理混合属性系统时的优越性。 这篇论文对粗糙集理论的属性约简问题进行了深入探讨,尤其是在处理模糊和连续属性时的挑战。模糊知识粒度的概念为混合属性的约简提供了一个新的视角,对于提高决策系统的效率和准确性具有重要意义。这项工作为后续研究在处理复杂、模糊和不精确数据的属性约简问题上提供了有价值的参考。