Rough集理论与粒计算在航空票务推荐系统的应用

版权申诉

22 浏览量更新于2024-07-02 收藏 7.62MB PDF 举报

"该文档探讨了Rough集理论与粒计算在航空票务推荐系统中的应用，旨在解决传统推荐算法在处理海量信息时存在的效率低、推荐效果不佳的问题。研究中，作者采用了基于Rough集的粒度模型，对航空票务数据进行离散化、属性约简和值约简，提出新的离散化方法和属性重要度的约简策略，以发现隐藏的知识并构建决策规则。针对票务数据的增量特征，利用可辨识矩阵和多粒度原则进行分类分析，提取决策规则集。最后，设计出对应的票务推荐算法，为航空票务推荐系统提供了一种高效的数据处理方法和优化方案。" 文章深入研究了推荐系统在电子商务，尤其是航空票务领域的应用。推荐系统通常由推荐算法的设计和基于算法的推荐两部分组成，但其性能受限于特定领域的特性和数据集。在当前的电子商务环境下，信息量急剧增长，传统推荐算法面临挑战，如推荐效果不理想、处理速度慢。航空票务市场有其独特性，如机票的时效性和即时需求，以及购票过程中的匿名性，这使得传统推荐技术难以奏效。为解决这些问题，论文提出将Rough集理论与粒计算相结合，通过粒度模型对航空票务数据进行精细化处理。Rough集理论是一种处理不确定性和不完整信息的数学工具，而粒计算则允许在不同层次上分析数据，从而揭示更深层次的模式。通过离散化和属性约简，可以减少数据复杂性，提高处理效率。提出的基于断点重要度的离散化方法和属性重要度的约简方法有助于发现数据中的关键特征。对于动态变化的票务数据，论文采用可辨识矩阵和多粒度原则，能够适应数据的增量变化，持续更新决策规则集。这种方法能够更准确地捕捉到用户行为和市场趋势，从而提升推荐的精确度和实时性。这篇研究通过创新的数据处理和推荐算法，为航空票务推荐系统提供了新的解决方案，有助于提高推荐的准确性和效率，同时也为其他类似领域的推荐系统优化提供了参考。

引言

1. 增量数据的动态处理

基于 Rough 集的增量数据的动态处理主要包括增量数据的分类研究和增量

数据处理的算法研究。如增量式数据的最小属性约简算法

[23]

、核属性算法

[24]

等。

刘宗田等人在研究增量数据的属性值约简和原有决策系统中属性的相容关

系的基础上，利用可辨识矩阵，提出了一种基于属性最小约简的增量式数据处理

算法

[23]

；王国胤在研究最不完备信息系统的 Rough 集扩充问题，主要在针对不

完备系统中的不可分辨关系进行了深入的研究，在分析 Rough 集可辨识矩阵的

基础上，提出了一种基于 Skowron 矩阵(SKOWRON 教授

提出的一种基于 ROUGH

集理论的可辨识矩阵[24])的改进的分明矩阵，给出了一种基于限制容差关系的动

态增量信息的扩充方法

[5]

；这几种算法都是在分析可辨识矩阵的前提下提出的，

这些算法的不需要重新计算原有决策表的决策规则集，只需计算新增数据对原有

决策表造成的决策影响，新增决策规则扩充原有的决策规则集，有效提高了增量

数据的处理效率，Zhao,Zheng 等人在研究 Rough 集在处理增量式数据的规则获

取的问题，根据采用决策树的可动态增量性能，提出一种新的则集获取算法

[25][26]

，这些算法为增量数据的规则获取提供了一种新的有效的工具和思路。

2. 海量数据的分布式处理

数据库技术的快速发展和目前海量数据的不断产生，普通的计算机甚至性能

一般的服务器都无法满足目前海量数据的处理要求，对海量数据的高性能处理成

为一种新的需求。随着 Rough 集理论的日渐成熟，学者和数据人员将目光关注

到了这一方面，随着越来越多的学者们的研究，已经形成了一些基于 Rough 集

的海量数据处理方法。

2007 年以来，王国胤，胡峰等人研究了分布式属性的约简模型，提出了一

种基于决策值重要度得方法

[27]

，该方法将不同决策值重要度的数据分配到不同

的分布式站点上，并在此基础上对不同站点数据进行并行处理，并将此方法推广

到了增量式数据的基于分布式方法的属性约简；肖大伟，王国胤等人在此基础上，

Andrzej Skowron is Full Professor in the Faculty of Mathematics, Computer Science and Mechanics at

Warsaw University. He is the head of the Logic Section in the Institute of Mathematics. He is a vice-chairman of

the Scientific Council at Institute of Computer Science of the Polish Academy of Sciences and a member of

Computer Science Committee of the Polish Academy of Sciences. From 1988 to 1990, he was the Deputy Dean of

the Faculty of Mathematics, Computer Science and Mechanics at Warsaw University. From 1994 to 1999, he was

also the Head of the Senate in the Polish–Japanese Institute of Information Technology.

万方数据

引言

研究了对海量数据的预处理工作，提出了一种并行的海量数据离散化算法和快速

并行的属性约简算法

[28]

；覃政仁，王国胤等人在研究 Rough 集的特点，提出了

将海量数据分割成若干独立的小数据集的最佳分割方法，提出了一种基于 Rough

集的海量数据最佳独立小数据集的分割算法

[29]

；胡峰在他的博士论文中，研究

了混合数据的决策分类问题，提出了一个基于并行分治法的 Rough 集高效数据

挖掘方法

[30]

，这是一种串行处理方式，该方法提高了普通 PC 机处理数据的能力，

为大数据的处理提供了一种新的应用思路。

3. 高维数据的数据分割和数据压缩

多属性数据因其高维的特点，造成规则提取复杂，决策表生成难度大以及属

性分割离散化难等问题，并且目前的计算机内存无法满足这部分数据的处理要

求。因此对高维数据的分割和压缩成为了当今海量数据挖掘的新的需求，在此基

础上，Rough 集模型提供了一种数据压缩的属性约简方法，是研究 Rough 集理论

处理高维数据的热点之一。

1996 年 Nguyen 在他的论文“Some Efficient Algorithms for Rough Set Methods”

[31]

中研究了传统的遗传算法在决策表分解中的应用，提出了一种寻找决策表代

表性规则的决策表分解方法，该方法提出将高维数据按其各自的属性特征划分为

若干包含少量属性的简单的块，再将这些简单的块当做一个粒子，分别对每个粒

子进行问题求解。苗夺谦，杜伟林等人在研究概念格的基础上，充分考虑属性之

间的相关性，提出一种基于属性相关度的粒度划分方式

[32]

；李征，王维工等人

研究了模糊概念为词基础的粒度计算理论，认为信息粒化的基础应当是以模糊概

念为词基础的计算，提出了一种基于语词计算为基础模型的信息处理方法

[33]

，

从而可以达到对高维数据的属性约简的目的；胡峰，王国胤等人通过研究在属性

空间的框架下对决策表论域的分解问题，提出了一种基于分治法的高效属性约简

的串行算法

[26][27][29]

，有效的提高了高维数据的属性压缩效率。

二、推荐算法理论的应用研究现状

推荐算法的理论研究是一个交错庞大的学科，涉及很多领域相关方面的工

作，例如知识发现、规则提取、推理系统、知识预测甚至包括管理工程等学科

[34][35]

。随着互联网和电子商务的快速发展所带来的经济效益的推动，推荐系统

万方数据

引言

逐渐成为一个跨学科的独立的研究领域。推荐算法作为一个推荐系统的核心，直

接关系到整个推荐系统的优劣程度，推荐算法的优劣程度能直接影响到整个推荐

系统的推荐性能。

目前主流的推荐算法主要包括

[35]

：以商品内容为基准的基于内容的推荐算

法

[36]

；以用户行为为基准的基于用户的协同过滤推荐算法

[37][38]

；以知识发现为

基准的基于知识发现的推荐算法；以关联规则为出发点的基于关联规则的推荐算

法

[39][40]

；还有一种推荐算法是根据以上这些推荐算法的优缺点，根据推荐商品

的属性和用户的行为等因素的组合式推荐算法

[41]

。

1. 基于内容的推荐算法

基于内容的推荐算法主要是通过计算用户历史数据信息库与商品文本信息

之间的相似度而进行推荐的一种文本挖掘推荐算法

[42]

。算法思想清晰，理论简

单，可以通过构造决策树、神经网络等方法来实现对用户行为的建模。

基于内容的推荐算法将商品看成是由若干特征属性构成的集合体，通过不断

分析用户对其中属性的评价来获取用户的行为偏好，继而分析用户的行为偏好与

商品文本信息之间的匹配程度。忽视了用户对商品的整体评价和用户本身的特

征，因而这种算法无法获取用户数据库之外的其他用户的行为偏好，造成了算法

的局限性。

2. 协同过滤推荐算法

协同过滤算法主要是通过对数据库中未评分的属性进行评分，预测用户的行

为喜好，是一种预测性的个性化推荐算法，是目前各大电子商务平台使用比较广

泛的推荐算法。协同过滤算法的基本思想就是假设行为偏好相似的个体之间的行

为喜好也是相似的，算法的本质就是寻找用户历史数据中特征相似的个体。协同

过滤算法主要可以概括为 3 步。

(1) 对历史数据进行评价，通过对历史个体数据进行评价，可以筛选出具有

相似特征的个体，从而将整体数据划分为若干属性相似的群体；

(2) 寻找相似近邻个体，根据步骤一划分的相似群体，从中寻找距离最近的

相似个体；

(3) 推荐，根据最近邻居集合，对未知项进行评分预测，对评分高的若干项

进行推荐。

万方数据

剩余73页未读，继续阅读

programxh

粉丝: 17
资源: 1万+

Rough集理论与粒计算在航空票务推荐系统的应用

云计算-粒计算及其在图像分类中的应用研究.pdf

Rough集理论与知识获取.doc

rough集理论与知识获取王国胤pdf版本

matlab neighborhood rough set

粗糙集 python

mgrs 多粒度 粗糙集

rough sets of reduction knowledge

最新资源

mgrs 多粒度粗糙集