收稿日期:20180508;修回日期:20180625 基金项目:国家自然科学基金资助项目;中国博士后科学基金资助项目
作者简介:李红梅(1990),女,博士研究生,主要研究方向为个性化推荐;刁兴春(1964),男,研究员,博导,主要研究方向为数据工程;曹建军
(1975),男(通信作者),副研究员,硕导,主要研究方向为数据智能分析与应用、数据质量控制与数据治理(jianjuncao@yeah.net);张磊(1989),
男,硕士研究生,主要研究方向为数据工程;冯钦(1993),男,硕士研究生,主要研究方向为数据工程.
基于潜在标签挖掘和细粒度偏好的个性化标签推荐
李红梅
1
,刁兴春
1
,曹建军
2
,张 磊
1
,冯 钦
1
(1.陆军工程大学,南京 210007;2.国防科技大学 第六十三研究所,南京 210007)
摘 要:为进一步提高个性化标签推荐性能,针对标签数据的稀疏性以及传统方法忽略隐藏在用户和项目上下
文中潜在标签的缺陷,提出一种基于潜在标签挖掘和细粒度偏好的个性化标签推荐方法。首先,提出利用用户
和项目的上下文信息从大量未观测标签中挖掘用户可能感兴趣的少量潜在标签,将标签重新划分为正类标签、
潜在标签和负类标签三类,进而构建〈用户,项目〉对标签的细粒度偏好关系,在缓解标签稀疏性的同时,提高对
标签偏好关系的表达能力;然后,基于贝叶斯个性化排序优化框架对细粒度偏好关系进行建模,并结合成对交互
张量分解对偏好值进行预测,构建细粒度的个性化标签推荐模型并提出优化算法。对比实验表明,提出的方法
在保证较快收敛速度的前提下,有效地提高了个性化标签的推荐准确性。
关键词:个性化标签推荐;潜在标签挖掘;贝叶斯个性化排序;成对交互张量分解
中图分类号:TP3016 文献标志码:A 文章编号:10013695(2020)01007003406
doi:10.19734/j.issn.10013695.2018.05.0498
Personalizedtagrecommendationbasedonpotentialtag
miningandfinegrainedpreference
LiHongmei
1
,DiaoXingchun
1
,CaoJianjun
2
,ZhangLei
1
,FengQin
1
(1.ArmyEngineeringUniversity,Nanjing210007,China;2.the63rdResearchInstitute,NationalUniversityofDefenseTechnology,Nanjing
210007,China)
Abstract:Tofurtherimprovetheperformanceofpersonalizedtagrecommendation,thispaperarguedthattraditionalmethods
ignorethepotentialandinformativetagshiddeninthecontextofusersanditems.Aimedatthis,thispaperproposedanovel
personalizedtagrecommendationmethodBPRPITFPbasedonpotentialtagminingandfinegrainedpreference.Firstly,
BPRPITFPleveragedthecontextinformationofbothusersandgottominepotentialandusefultags,andgotthreekindsof
tags:positivetags,potentialtags,andnegativetags.Basedontheabove,ittranslatedthetraditionalpairwisepreferenceinto
finegrainedpreferencerelationshipamonguseritempostandtags.Thiskindoftreatmenthelpedalleviatethesparseproblem
oftaggingdata.Second
,combinedwithpairwiseinteractiontensorfactorizationmethodtopredictpreferencevalue,BPR
PITFPmodeledthepreferencerelationshipbasedontheoptimizationcriteriaofBayesianpersonalizedranking,anddeveloped
apersonalizedtagrecommendationmodelfollowedbyoptimizationalgorithm.Thecomparisonresultsshowthatthisproposed
methodcouldimprovetagrecommendationperformanceinthepremiseofguaranteeconvergencespeed.
Keywords:personalizedtagrecommendation;potentialtagmining;Bayesianpersonalizedranking;pairwiseinteractionten
sorfactorization
0 引言
作为 Web2.0的重要特征,社会标签允许用户自由创建标
签对资源(如网页、音乐、电影、图片等,统称项目)进行标注。
标签既描述了项目的显式语义特征,又反映了用户的显式偏好
内容,使得用户能够更加便捷地检索、组织、分享信息等,在一
定程度上缓解了“信息过载”的问题。标签系统非常希望用户
能够为资源打上高质量的标签,促进对资源的分享与利用。很
多网站如 Last.fm、MovieLens、Delicious、CiteULike、豆瓣网等都
设计了标签推荐模块给用户推荐标签,这样用户在浏览资源
时,标签推荐系统提供一些用户可能感兴趣的个性化标签,以
便其能够更好地标注和管理这些资源。但由于有许多用户懒
于为信息资源添加标签,所以需要个性化标签推荐系统自动为
其推荐与信息资源相关的标签。
典型的个性化标签推荐方法主要包括基于协同过滤的标
签推荐算法、基于图模型的标签推荐算法
[1~3]
、基于张量分解
的标签推荐
[4~7]
、基于内容的标签推荐算法
[8~10]
和混合的标
签推荐算法
[11]
等,这些方法各有优缺点,适用于不同的应用场
景。另外,也有一些文献提出利用额外的上下文信息(如时
间
[12,13]
、社交关系
[14]
等)来辅助提高个性化标签推荐的能力。
由于标签推荐系统中的数据通常较为稀疏,严重影响着推荐算
法的性能,而张量分解方法能有效地处理稀疏数据,具有准确
的预测性、良好的扩展性等优点,所以本文主要关注基于张量
分解的标签推荐算法。
用于标签推荐的典型的张量分解方法包括高阶奇异值分
解(higherordersingularvaluedecomposition,HOSVD)
[15]
、排序
张量分解(rankingtensorfactorization,RTF)
[4]
,这些方法都是
基于经典的
Tucker分解模型(Tuckerdecomposition,TD),但其
计算复杂度比较高
[5]
。为进一步降低计算复杂度,文献[5]提
出一种基于成对交互张量分解(pairwiseinteractiontensorfac
第 37卷第 1期
2020年 1月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol.37No.1
Jan.2020