改进协同过滤的时权算法：提高预测精度与效率

需积分: 30 49 浏览量更新于2024-08-06 1 收藏 1.97MB PDF 举报

本文主要探讨了一种针对传统协同过滤算法在数据稀疏性、可扩展性和用户兴趣度偏差等问题的改进方法。在当前的互联网推荐系统中，协同过滤是一种广泛应用的个性化推荐策略，但由于其依赖于用户的历史行为数据，当数据变得稀疏时，算法的预测性能往往会受到影响。为此，研究者提出了一种结合时间权重的Mini batch K-Means算法来优化协同过滤。改进的协同过滤算法首先通过Pearson相关系数来增强MiBatch K-Means聚类过程，这种方法可以更有效地处理稀疏评分矩阵，通过对用户的评分行为进行聚类，计算出用户对不同项目的兴趣程度，并填充到原本数据稀疏的区域。这样，算法能够更好地理解和捕捉用户的动态兴趣变化。进一步地，为了考虑用户兴趣随时间的演变，引入了牛顿冷却时间权重，这是一种模拟热力学现象的数学模型，用于计算用户对不同项目的相似度。这个权重机制帮助算法适应用户兴趣的时效性，使得近期的行为对推荐结果的影响更大，从而提高预测精度。在填充后的评分矩阵基础上，算法采用相似度加权计算，给出每个项目最终的评分。实验结果显示，这种改进的时间权重推荐算法相比于传统的协同过滤算法，显著降低了平均绝对误差，提升了准确率、召回率和F值，显示出更高的评分预测精确度和准确度。该研究对于提升推荐系统的性能具有重要意义，特别是在大数据环境下，通过结合时间因素和优化的聚类方法，能够在一定程度上解决数据稀疏性问题，为用户提供更精准、更具实时性的个性化推荐体验。此外，研究也为其他领域，如电子商务、社交网络和在线广告等领域中的推荐系统提供了新的改进思路。

第 !" 卷#第 $ 期 #

!"#$!"# %"$$ #

计算机工程

&"'()*+,-./0.++,0./

%&%& 年 $ 月

12,34 %&%&

!人工智能与模式识别!

文章编号" !"""#$%&' #&"&"$"$#""T$#"S ( ( ( 文献标志码 " )(((中图分类号" *+!'

基金项目"四川省科技厅科技支撑计划!%&'(CL&"'" '四川省教育厅 % &', 自然科学重点科研项目!', L=&$&)%',L=&$&, " #

作者简介"徐慧君 !'**! $ " %男%硕士研究生%主研方向为推荐算法&数据挖掘'王 # 忠%副教授&博士'马丽萍&饶 # 华 & 何承恩%硕士研

究生#

收稿日期"%&'*5&$5'! # # 修回日期 "%&'* 5&( 5&) # # -#./01",$*&&&!%* + OO$3" '

改进 U0>0:/B;=E#U6/>@时间权重推荐算法

徐慧君!王#忠! 马丽萍! 饶#华! 何承恩

! 四川大学电气工程学院%成都 "'&&"( "

摘# 要" 传统的协同过滤算法存在数据稀疏&可扩展性弱和用户兴趣度偏移等问题%算法运行效率和预测精度偏

低# 针对上述问题%提出一种改进的 10.0:2*34 W51+2.J时间权重推荐算法# 采用 T+2,J". 相关系数改进 10.0

:2*34 W51+2.J聚类%利用改进的聚类算法对稀疏评分矩阵进行聚类%计算用户兴趣评分并完成对稀疏矩阵的填

充# 考虑用户兴趣随时间变化的影响%引入牛顿冷却时间权重计算相似度%并基于已填充评分矩阵进行相似度加

权计算%得到项目最终评分# 实验结果表明%与传统协同过滤算法相比%该算法的平均绝对误差下降了$' $&,! %准

确率&召回率&F' 值均有较大提升%具有较高的评分预测精确度和准确度#

关键词" 协同过滤'预测填充'T+2,J". 相关系数'10.0:2*34 W51+2.J聚类'牛顿冷却定律

开放科学# 资源服务$ 标志码# ?@A<$ "

中文引用格式"徐慧君%王忠%马丽萍%等$改进 10.0:2*34 W51+2.J时间权重推荐算法( B)$计算机工程%%&%&%!"!$"*

)$5),%," $

英文引用格式" RD F)09).% U=%> L4"./% 1= V0(0./% +* 2#$A'(,"I+K 10.0:2*34 W51+2.J *0'+58+0/4*+K

,+3"''+.K2*0". 2#/",0*4'( B) $&"'()*+,-./0.++,0./%%&%&%!" !$" *)$ 5), %,"$

I.A4856GU0>0:/B;=E#U6/>@*0.6#F60K=B6G?6;8..6>G/B08>)1K840B=.

RD F)09).%U=%> L4"./%1= V0(0./%S=? F)2%F-&4+.// +.

! &"##+/+"6-#+3*,032#-./0.++,0. /% @034)2. D.0I+,J0*7%&4+./K) "'&&"( %&40.2"

+ )D@B4/;B, M4+*,2K0*0".2#3"##2H",2*0I+60#*+,0./ 2#/",0*4' 42J*4+(,"H#+'J"6J(2,J+K2*2%8+2; J32#2H0#0*7 2.K K+I02*+K

)J+,0.*+,+J*%32)J0./ #"8+66030+.37 0. 2#/",0*4' "(+,2*0". 2.K #"8233),237 0. (,+K03*0".$M" 2KK,+JJ*4+J+(,"H#+'J%*40J

(2(+,(,"("J+J2. 0'(,"I+K 10.0:2*34 W51+2.J*0'+58+0/4*+K ,+3"''+.K2*0". 2#/",0*4'$M4+T+2,J". 3",,+#2*0".

3"+66030+.*0J)J+K *" 0'(,"I+*4+10.0:2*34 W51+2.J3#)J*+,0./%2.K *4+0'(,"I+K 3#)J*+,0./ 2#/",0*4' 0J2((#0+K *"

3#)J*+,*4+J(2,J+J3",0./ '2*,0P% 32#3)#2*+)J+,0.*+,+J*J3",+2.K 3"'(#+*+*4+60##0./ "6J(2,J+'2*,0P$>0I0./ *4+

0.6#)+.3+"6) J+,0.*+,+J*I2,70./ 80*4 *0'+%*40J(2(+,0.*,"K)3+J*4+%+8*"./ J#28"63""#0./ *0'+8+0/4**" 0'(,"I+*4+

J0'0#2,0*7$M4+60##+K J3",0./ '2*,0P 0J)J+K *" (+,6",' 8+0/4*+K 32#3)#2*0". ". *4+J0'0#2,0*7 2.K ". *40JH2J0J%*4+60.2#

J3",+0J"H*20.+K$-P(+,0'+.*2#,+J)#*JJ4"8 *42*3"'(2,+K 80*4 *4+*,2K0*0".2#3"##2H",2*0I+60#*+,0./ 2#/",0*4'%*4+'+2.

2HJ"#)*++,,","6*4+(,"("J+K 2#/",0*4' 0J,+K)3+K H7 $' $&,! %2.K *4+(,+30J0".%,+32##2.K F' I2#)+2,+0'(,"I+K 2#"*%

84034 J4"8J0*J40/4 J3",0./ (,+K03*0". 233),237$

+ E67 F84G@, 3"##2H",2*0I+60#*+,0./' (,+K03*0I+60##0./' T+2,J". 3",,+#2*0". 3"+66030+.*' 10.0:2*34 W51+2.J3#)J*+,0./'

%+8*"./ J#28 "63""#0./

CHI*'& $'*"), Q9$0JJ.$'&&& 5$!%, $&&(!%%$

"(概述

互联网高速发展带来的信息过载问题推动了人

们对推荐系统的研究%而决定推荐系统是否成功的

关键是推荐算法

(')

# 目前推荐算法应用最广泛的是

协同过滤算法%该算法只需用户历史评分数据%就可

以向用户推荐

(%)

# 协同过滤算法主要有基于近邻的

过滤算法和基于模型的过滤算法

($)

基于近邻的协同过滤算法由于推荐时需要查找

与目标用户的最相似用户

(!)

%在大型推荐系统中%用

计算机工程

www.ecice06.com

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38725625

粉丝: 3
资源: 919

改进协同过滤的时权算法：提高预测精度与效率

改进的协同过滤算法在电影推荐系统中的应用.pdf

几种协同过滤算法的改进

基于协同过滤的推荐算法研究.caj

基于物品的协同过滤算法和基于用户的协同过滤算法有哪些区别

基于协同过滤算法的电影推荐系统csdn

基于用户的协同过滤算法

请介绍基于领域的协同过滤算法

基于用户的协同过滤算法是怎么样的

根据心情推算协同过滤算法

改进的鲸鱼算法w权重

最新资源