收稿日期
: 2011-09-19;
修回日期
: 2011-11-20。
基金项目
:
国家自然科学基金资助项目
( 61070061) 。
作者简介
:
张新猛
( 1974 - ) ,
男
,
山东东明人
,
讲师
,
硕士
,
主要研究方向
:
数据挖掘
;
蒋盛益
( 1963 - ) ,
男
,
湖南隆回人
,
教授
,
博士
,CCF
会
员
,
主要研究方向
:
数据挖掘
、
网络安全
。
文章编号
: 1001 - 9081( 2012) 03 - 0654 - 04 doi: 10. 3724 /SP. J. 1087. 2012. 00654
基于加权二部图的个性化推荐算法
张新猛
*
,
蒋盛益
(
广东外语外贸大学 思科信息学院
,
广州
510006)
( *
通信作者电子邮箱
javad0902@ 163. com)
摘 要
:
针对网络推断
( NBI)
算法的二部图实现算法忽略二部图权重而导致实际评分值高的项目没有得到优先
推荐这一问题
,
提出加权网络推断
( WNBI)
算法的加权二部图实现算法
。
该算法以项目的评分作为二部图中用户与
项目的边权
,
按照用户 项目间边权占该节点权重和的比例分配资源
,
从而实现评分值高的项目得到优先推荐
。
通过
在数据集
MovieLens
上的实验表明
,
相比
NBI
算法
,WNBI
算法命中高评分值项目数目增多
,
同时在推荐列表长度小于
20
的情况下
,
命中项目的数量和命中高评分项目数量均有明显增加
。
关键词
:
二部图
;
加权二部图
;
个性化推荐
中图分类号
: TP181; TP301. 6
文献标志码
: A
Personalized recommendation algorithm based on weighted bipartite network
ZHANG Xin-meng
*
, JIANG Sheng-yi
( Cisco School of Informatics, G uangdong University of Foreign Studies, Guangzhou Guangdong 510006,C hina)
Abstract: In Network-Based Inference ( NBI) algorithm, the weight of edge between user and item is ignored; therefore,
the items with high rating have not got the priority to be recommended. In order to solve the problem, a Weigted Network-
Based Inference ( WNBI) algorithm was proposed. The edge between user and item was weighted with item's rating by proposed
algorithm, the resources were allocated according to the ratio of the edge's weight to total edges' weight of the node, so that
high rating items could be recommended with priority. The experimental results on data set MovieLens demonstrate that the
number of hit high rating items by WNBI increases obviously in contrast with NBI, especially when the length of
recommendation list is shorter than 20, the numbers of hit items and hit high rating items both increase.
Key words: bipartite network; weighted bipartite network; personalized recommendation
0
引言
个性化推荐研究于
20
世纪
90
年代被作为一个独立的概
念提出来
,
其目的是根据用户的喜好为用户推荐感兴趣的商
品或信息
,
推荐算法的关键是如何提高推荐精度和效率
,
对此
研究者提出了多种改进策略和算法
。
目前
,
个性化推荐方法
主要有基于规则的推荐
、
协同过滤推荐
、
基于内容的推荐
、
混
合推荐系统以及基于网络的推荐等
。
基于内容推荐算法
[1 - 2]
根据用户喜爱的项目信息
,
找出
相似度最高的项目推荐给用户
。
基于内容的推荐系统分别对
用户和项目建立配置文件
,
分析已经购买
(
或浏览
)
过的项
目
,
建立或更新用户的配置文件系统
,
比较用户与项目配置文
件的相似度
,
并直接向用户推荐与其配置文件最相似的项目
。
基于内容推荐只考虑用户的兴趣偏好
,
推荐结果直观容易理
解
,
但是对于机器难以理解的数据格式
,
如音乐
、
图像等往往
无法处理
,
不能为用户发现新的兴趣点
。
协同过滤
( Collaborative Filtering,CF)
推荐
[3 - 4]
针对基于
内容推荐的不足
,
利用用户已有的信息计算用户之间的相似
性
,
通过邻居用户对项目的评价来预测目标用户对项目的偏
好程度
。CF
算法不受数据格式影响
,
能够推荐如图片
、
音乐
等难以处理的复杂数据
,
能挖掘用户新的兴趣点
,
但也同时存
在多个问题
,
最典型是冷问题和稀疏问题
。
基于内容推荐与协同过滤推荐均有各自的局限性
,
在实
际应用中
,
通常将多种推荐方法组合起来
,
最常见的是将基于
内容过滤推荐和协同过滤推荐进行组合
,
混合推荐在实际应
用中比单独某一种推荐方式具有更高的准确率
[5]
,
但混合推
荐必然增加时间和空间的开销
。
基于关联规则推荐
[6 - 7]
关注用户行为的关联模式
,
通过
用户行为建立项目之间的关联关系
,
通过这种关联关系向用
户推荐其他项目
。
该方法不需要领域知识能够发现新兴趣
点
,
但规则抽取困难
,
时间复杂度高
,
个性化程度较低
。
基于网络结构的推荐算法
[8]
不考虑用户和项目的内容
特征
,
而仅仅把它们看成抽象的节点
,
所有算法利用的信息都
藏在用户和项目的选择关系之中
,Wand
等
[9]
利用社会网络
分析方法推荐在线拍卖系统中可信赖的拍卖者
。
Zhou
等
[10]
提出网络推断
( Network-Based Inference,NBI)
算法
,
利用二部图进行资源分配
,
取得了比
CF
算法更好的效
果
。
本文引入二部图边权提出加权网络推断
( Weigted
Network-Based Inference,WNBI)
算法
,
以项目的评分值作为
二部图的边权
,
按边权比例计算资源分配矩阵
,
在没有增加时
间和空间开销的情况下
,
提高了推荐精度
。
1
二部图与推荐算法
近年来
,
复杂网络得到广泛关注
[11]
,
越来越多关于网络
的研究成果被发掘并应用
,
为人们深刻认识现实中的复杂系
统并对之进行控制或应用提供了有效帮助
。
二部图是一种特
Journal of Computer Applications
计算机应用
,2012,32( 3) : 654 - 657,678
ISSN 1001-9081
CODEN JYIIDU
2012-03-01
http: / /www. joca. cn