收稿日期:20190816;修回日期:20191011 基金项目:吉林省科技发展计划技术攻关项目(20190302118GX)
作者简介:邱宁佳(1984),男,河南南阳人,讲师,博士,主要研究方向为数据挖掘、大数据分析等;王宪勇(1995),男,内蒙古呼伦贝尔人,硕
士研究生,主要研究方向为数据挖掘;王鹏(1973),男(通信作者),内蒙古包头人,教授,博士,主要研究方向为大数据、数据挖掘(269212811@qq.
com);杨华民(1963),男,吉林长春人,教授,博士,主要研究方向为数据库与数据挖掘、计算机仿真与虚拟现实、人工智能.
融合 MHS与 AIMRT的谱聚类优化推荐算法
邱宁佳,王宪勇,王 鹏
,杨华民
(长春理工大学 计算机科学技术学院,长春 130022)
摘 要:传统协同过滤推荐算法存在时序性过低以及用户过多时数据稀疏相似用户计算复杂度高等问题。为此,
提出融合最小哈希签名(MHS)与时序模型预测(AIMRT)的谱聚类优化推荐算法。首先使用 MHS与 Levenshtein
距离测度对用户—项目评分矩阵提取相似用户;然后利用时序模型进行权重拟合的 AIMRT预测算法预测评分补
全相似用户稀疏矩阵;最后结合谱聚类进行相似用户优化,找到最优相似用户集合完成最终推荐。通过实验分析
验证表明,所提推荐算法能够在计算复杂度、评分预测精度、数据缺失填补等方面提高整体推荐性能。
关键词:推荐算法;最小哈希签名;时序模型;权重拟合;谱聚类
中图分类号:TP391 文献标志码:A 文章编号:10013695(2020)11018329205
doi:10.19734/j.issn.10013695.2019.08.0280
Spectralclusteringoptimizationrecommendation
algorithmcombiningMHSandAIMRT
QiuNingjia,WangXianyong,WangPeng
,YangHuamin
(CollegeofComputerScience&Technology,ChangchunUniversityofScience&Technology,Changchun130022,China)
Abstract:Thetraditionalcollaborativefilteringrecommendationalgorithmhastheproblemsoflowtimingandhighcomputa
tionalcomplexityofsimilaruserswithsparsedatawhentherearetoomanyusers.Accordingtotheaboveproblem
,thispaper
proposedaspectralclusteringoptimizationrecommendationalgorithm combiningtheminimum hashsignatureandtemporal
modelprediction.Firstly
,itusedtheMHSandLevenshteindistancemeasuretoextractsimilarusersfromuseritemscoringma
trix.ThenitusedAIMRTpredictionalgorithmwithweightfittingtocompletesparsematrixofsimilarusers.Finally,itcarried
outsimilaruseroptimizationbycombiningspectralclusteringtofindtheoptimalsetofsimilarusersandcompletedthefinal
recommendation.Experimentalanalysisandverificationshowthattheproposedrecommendationalgorithm canimprovethe
overallrecommendationperformanceintermsofcomputationalcomplexity
,scoringpredictionaccuracy,datamissingfillingand
otheraspects.
Keywords:recommendationalgorithm;minimumhashsignature;timingmodel;weightfitting;spectralclustering
0 引言
研究推荐算法时不但要结合历史数据,还要了解用户的实
时兴趣变化,针对实时兴趣喜好进行推荐是许多研究学者正在
深入研究的主要方向。姚彬修等人
[1]
运用信息融合引入丰富
度和时间权重,优化稀疏矩阵缓解数据稀疏性,提高推荐的准
确率。李杰等人
[2]
引入时间系数和热门系数,提出新的兴趣
相似度计算方法,提高个性化推荐效果。Chen
[3]
提出信任传
播机制和时间序列融合的 TTSMF模型,学习用户和项目的潜
在特征,提高算法精度。李敬兆等人
[4]
提出一种时间认知的
推荐算法,加入时间向量因子激励早期记录,更有效地分类相
似用户。蔡海尼等人
[5]
提出一种基于时序模型和矩阵分解进
行特征提取与挖掘特征趋势的推荐算法,提高预测准确率与推
荐效率。孙光明等人
[6]
提出自适应兴趣动态变化度量函数,
自适应分配资源使用率以及动态调整度量函数,提高算法性
能。陈海龙等人
[7]
提出融合用户兴趣变化和类别关联度的混
合推荐算法,将时间的兴趣度权重函数引入项目相似度计算从
而提高计算的精确度。由于项目评分矩阵数据缺失导致预测
精准度下降,以致数据稀疏性问题一直是影响推荐质量的重要
原因之一
[8]
,所以项目评分稀疏矩阵的填补对于预测的准确
率十分重要。郭云飞等人
[9]
提出一种线性回归分析模型,利
用矩阵分解降低矩阵稀释度。王永康等人
[10]
提出融合时间隐
语义填充和子群划分的推荐算法 KTLFM,对稀疏矩阵进行填
充,以缓解数据稀疏性问题。Zhu等人
[11]
从多角度提取特征
信息,然后将信息转换为加权的主题项评分,并将其注入到推
荐模型中,较好填补了数据稀疏问题。张清等人
[12]
提出改进
的
Tanimoto相似性系数预填充算法,对未评分项进行预测评
分和填充,降低矩阵稀疏度。殷方勇等人
[13]
基于 LMaFit算法
改进矩阵填充的单向性与融合相似度计算,提高了算法的精准
推荐效果。肖明波等人
[14]
提出分步预测算法,不断训练数据
补全缺失数据对子矩阵进行补全操作,获得相似邻居进行最终
的推荐。龚敏等人
[15]
提出基于用户聚类与 SlopeOne填充的
协同过滤推荐算法,有效地通过预测评分填充矩阵缓解稀疏性
问题,提高推荐精度。Li等人
[16]
提出了一种基于改进谱聚类
和转移学习(RAISCTL)的推荐算法,利用特征值差和正交特征
向量改进了光谱聚类,提高推荐系统的预测精度和泛化能力。
郑修猛等人
[17]
提出基于并行谱聚类的协同推荐算法,改进并
行谱聚类方法以降低时间复杂度,提高了算法的精度和效率。
通过以上研究发现,进行推荐时应考虑用户的实时兴趣变
化以及缓解数据稀疏性。为此本文使用优化的谱聚类推荐算法
第 37卷第 11期
2020年 11月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol37No11
Nov.2020