收稿日期:20190314;修回日期:20190517 基金项目:国家自然科学基金资助项目(71572013,71872013)
作者简介:徐元萍(1994),女,河南周口人,硕士,主要研究方向为推荐系统、数据挖掘;陈翔(1976),男(通信作者),江西赣州人,教授,主要
研究方向为计算机软件及计算机应用(chenxiang@bit.edu.cn).
推荐系统中的新颖性问题研究
徐元萍,陈 翔
(北京理工大学 管理与经济学院,北京 100081)
摘 要:准确性推荐中存在商品类型单一、流行商品多、缺乏新意的问题,因而新颖性推荐得到重视,但已有研
究在设计算法时未考虑项的特征,无法针对不同用户帮其区分和挑选具备较高新颖度的项。为提高推荐系统的
性能,对基于随机游走的方法进行改进,提出融合新颖性特征的推荐算法。从兴趣扩展和预测角度分析项的特
征,给出完善的新颖度定义,并结合用户需求构建新的转移概率,产生个性化的推荐列表,提高了列表内容的新
意。实验结果表明,提出的算法较现有算法对准确率影响较小,同时在新颖性指标上有明显提升,并得出通过融
合新颖性特征能够在兼顾准确性的情况下有效改善推荐内容的结论。
关键词:推荐算法;准确性;新颖性;随机游走
中图分类号:TP181 文献标志码:A 文章编号:10013695(2020)08014231005
doi:10.19734/j.issn.10013695.2019.03.0046
Researchonnoveltyproblemsinrecommendationsystems
XuYuanping,ChenXiang
(SchoolofManagement&Economics,BeijingInstituteofTechnology,Beijing100081,China)
Abstract:Focusingonproblemsoftheaccuracyrecommendationsystem thattherecommendedcommoditytypeisrelatively
single,andcommoditiesaremostlypopulargoodsandlackoffreshness,thenoveltyrecommendationisgraduallygaining
attention.However
,currentresearchesdon’tcombineitemfeatureswhendesigningalgorithms,whichmakethemunabletodistin
guishandselectitemswithhighernoveltyfordifferentusers.Inordertoimprovetheperformanceoftherecommendationsystem,
thispaperimprovedthemethodbasedonrandomwalkanddesignedanewrecommendationalgorithmbyfusingnoveltyfeatures.
Thisalgorithmfurtheranalyzedfeaturesofitemsandgavetheformaldefinitionofthenoveltyfromperspectivesofuserinterest
expansionandprediction.Thispaperanalyzeduserdemands
,constructednew transitionprobability,generatedpersonalized
recommendationlistsandimprovedthenoveltyofthelists.Theexperimentalresultsshowthattheproposedalgorithmhasless
influenceontheaccuracythanexistingmethodsandhassignificantimprovementonnoveltyindexes.Itconcludesthatbyfusing
novelfeatures,thissystemcanimprovetherecommendationcontentseffectivelywhiletakingintoaccounttheaccuracy.
Keywords:recommendationalgorithm;accuracy;novelty;randomwalk
推荐系统能够根据用户的历史行为向用户推荐感兴趣的
物品,在缓解信息过载、减少用户搜索时间、提高个性化体验方
面发挥着重要作用。目前,常用的推荐算法主要包括协同过
滤、基于物品特征的推荐和基于网络结构的随机游走推荐
[1]
。
其中,随机游走方法具备较强的扩展性,能够有效缓解数据稀
疏性问题,显著提高推荐效果。然而现有算法大多在推荐时仅
注重与用户历史消费记录或行为的相似性,造成推荐结果的冗
余和严重的同质化问题,使用户难以接触到新鲜、多样的内容,
降低了用户满意度
[2]
。针对准确性推荐的不足,Herlocker等
人
[3]
提出新颖性推荐的概念,即向目标用户推荐其有潜在兴
趣但不知道的商品。推荐系统的质量和实用性在很大程度上
取决于结果的新颖程度。新颖的推荐列表能够扩大用户兴趣
范围,促进用户产生惊喜感,提升用户体验。现有的新颖性推
荐算法主要基于用户和项的交互信息,将推荐问题转换为网络
图,通过补充特定的属性信息或利用参数结合复杂动力学方法
一定程度上提高了推荐列表的新颖性;但现有算法没有严格区
分同一项目对不同用户的新颖度,未引入明确的新颖性项目特
征进行综合建模导致无法帮助用户匹配具备较高新颖度的项,
难以满足人们对个性化推荐的需要,新颖性推荐问题亟需解决。
用户兴趣的不同导致产生的历史选择不同,对同一项目的
了解程度和感受往往存在差异。因此,随着用户个性化需求与
日俱增,推荐系统需要区分不同用户对同一项目的了解程度,
得到差异化的项目新颖度。为了结合用户自身兴趣发现新颖
项目,开阔用户视野,需要进一步扩大用户兴趣边界,融入和发
现新的项目类型以提高用户感兴趣的可能性。在提供个性化
服务时,考虑用户兴趣的变化能够增加推荐结果的竞争力
[4]
。
因此,有必要更深入地挖掘用户新的兴趣用于提高推荐结果的
新意。本文从兴趣扩展和预测角度提出融合新颖性特征的随
机游走算法,结合用户历史选择进一步补充项目特征和度量,
在兼顾准确性的基础上针对不同用户产生个性化的新颖结果。
1 相关工作
目前,基于网络结构的随机游走算法广泛应用在推荐系统
中,提高了推荐精度。文献[5]应用随机游走方法在用户、项
目、标签构成的三元交互图上探索用户和项目之间的关系,得
到的实验结果表明提出的方法有效提高了准确度;文献[6]通
过整合潜在主题模型和重启动随机游走方法发现用户的隐含
偏好和项目潜在的特征信息,有效缓解了数据稀疏性问题。但
以上方法仅注重与用户历史偏好接近的推荐,往往限制了用户
的选择,缩小用户视野,造成用户对推荐结果表示不满。
针对准确性推荐存在的问题,近年来新颖性推荐逐渐得到
关注。为明确相关定义,一些研究尝试运用已有的冷启动方法
第 37卷第 8期
2020年 8月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol37No8
Aug.2020