收稿日期:20160505;修回日期:20160614 基金项目:国家自然科学基金资助项目(61272509,61402331,61402332)
作者简介:熊聪聪(1961),女,四川成都人,教授,博士,主要研究方向为计算机网络与嵌入式、并行计算(2692908037@qq.com);邓滢(1989),
女,助教,硕士,主要研究方向为智能信息处理、推荐系统;史艳翠(1982),女(通信作者),讲师,博士,主要研究方向为推荐系统、用户需求获取;陶
鑫(1992),男,硕士研究生,主要研究方向为智能信息处理;陈亚瑞(1982),女,副教授,博士,主要研究方向为机器学习.
基于协同过滤的美食推荐算法
熊聪聪,邓 滢,史艳翠
,陶 鑫,陈亚瑞
(天津科技大学 计算机科学与信息工程学院,天津 300222)
摘 要:为了解决传统的基于用户的协同过滤算法中的数据稀疏性问题,提高推荐的准确率,对推荐算法进行
了改进并将改进后的算法应用在美食推荐领域。利用均值中心化方法对实验数据进行处理,减少因个人评分习
惯差异造成的推荐误差。通过使用改进的空值填补法降低评分矩阵的稀疏性,在计算相似度时引入了遗忘函数
和用户间的信任度,进一步提高了推荐系统的准确性。实验表明,提出的改进算法比传统算法有更高的准确率,
并得出了在推荐过程中考虑用户和项目外的其他因素以及针对不同的数据信息采用不同的算法,都有利于提高
推荐准确率的重要结论。
关键词:推荐系统;美食推荐;协同过滤;遗忘函数;信任
中图分类号:TP301.6 文献标志码:A 文章编号:10013695(2017)07198504
doi:10.3969/j.issn.10013695.2017.07.014
Foodrecommendationalgorithmbasedoncollaborativefiltering
XiongCongcong,DengYing,ShiYancui
,TaoXin,ChenYarui
(CollegeofComputerScience&InformationEngineering,TianjinUniversityofScience&Technology,Tianjin300222,China)
Abstract:Inviewoftheproblemofdatasparsenessinthetraditionaluserbasedcollaborativefilteringalgorithm,toimprove
therecommendedaccuracy,thispaperputforwardanimprovedalgorithmandusedthisalgorithmtothefieldoffoodrecom
mendation.Firstly,inordertoreducetherecommendederrorcausedbydifferentpersonalratinghabits,thispaperusedthe
meancentralizedmethodtodisposethescoredata.Secondly,itusedtheimprovednullvaluesfillmethodtoreducethesparse
oftherankmatrix.Finally,whencalculatingthesimilaritybetweenusers,thispaperconsideredthefactorsoftheforgotten
functionandtrustrelationshipbetweenusers,inordertoimprovetheaccuracyofrecommendationsystem.Theexperiment
showsthattheproposedalgorithmcangethigheraccuracythanthetraditionalalgorithm,anditisconcludedthatintheprocess
ofrecommended,consideringaboutotherfactorsexpectusersanditemsaswellasusingdifferentalgorithmsfordifferentdata
informationarebeneficialtoimprovetheaccuracyofrecommendation.
Keywords:recommendationsystem;foodrecommendation;collaborativefiltering;forgottenfunction;trust
随着计算机技术和互联网技术的快速发展,信息的传播方
式越来越丰富,传播速度也在不断增快,这些都导致信息过载
问题愈发严重。近些年,推荐系统作为一种重要的信息过滤技
术和手段,吸引了大量的学者开展研究。目前,推荐系统已经
被广泛应用在各种大型多媒体和电子商务网站上,如亚马逊、
谷歌新闻和淘宝等。推荐系统主要包括基于内容的推荐、协同
过滤推荐和混合过滤三种算法
[1]
。其中协同过滤推荐算法出
现最早、应用最广泛,主要通过分析相似用户评分过的物品预
测目标用户可能感兴趣的物品
[2]
。
美食,作为日常生活中必不可少的一部分,其种类和样式
随着经济的发展在不断地增加和丰富,但同时也导致了用户在
选择美食时需要花费更多的时间和精力。现有的美食推荐虽
然能在一定程度上缓解上述问题,但在实际推荐过程中由于从
网上直接获取的信息比较稀疏,并且用户和餐厅都有很多不同
于其他领域的特征信息
[3]
,所以直接将传统的协同过滤算法
应用在美食的推荐上,会导致推荐的准确率降低。
针对上述问题,本文在传统协同过滤算法研究的基础上,
根据美食推荐中涉及的用户和餐厅特征信息,通过对数据的预
处理及相似度计算方法的改进,提出了一种基于协同过滤的美
食推荐算法。
1 相关工作
协同过滤算法主要根据用户或项目的相似性情况产生推
荐结果。其算法主要分为基于用户 (userbased)和 基于项 目
(itembased)的协同过滤推荐算法两类。基于用户的协同过滤
算法根据相似用户的喜好产生对目标用户的推荐
[4]
;基于项
目的协同过滤推荐算法则根据用户对相似项目的评分数据预
测目标项目的评分。并且,协同过滤推荐系统存在数据稀疏
性、冷启动等问题。本文结合基于用户和基于项目的两种协同
过滤算法,并针对数据稀疏性问题对算法进行改进,最终将改
进的算法应用在美食推荐领域。
随着餐饮行业的快速发展,如何通过网络及时准确地为用
户提供合适的餐厅已经成为目前研究的重点。文献[5]将用
户的实时地理位置作为一个参数引入到推荐系统中,并提出了
一种基于位置服务的个性化美食搜索算法。文献[6]在推荐
第 34卷第 7期
2017年 7月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol34No7
Jul.2017