没有合适的资源?快使用搜索试试~ 我知道了~
首页Hadoop支持的Item-Based并行协同过滤:提升推荐效率与扩展性
本文档深入探讨了"Item-Based并行协同过滤推荐算法的设计与实现",发表于2014年的南京师范大学自然科学版期刊上。作者燕存和吉根林针对日益增长的用户数量和商品条目,以及推荐系统对实时性和可扩展性需求的提升,提出了一个创新的解决方案。传统的单机集中式协同过滤方法已经无法满足这些需求,因此他们设计了一种利用Hadoop的MapReduce与Hadoop分布式文件系统(HDFS)架构的并行版本。 该算法的核心在于将协同过滤的过程分解为Map和Reduce两个阶段。Map阶段负责分布式数据的处理,通过将大量的用户行为数据分割到不同的Map任务中进行计算,提高了相似度计算的并行性。而Reduce阶段则负责汇总和整合各个Map的结果,生成最终的推荐列表。这种并行处理策略显著地减少了推荐时间,提升了推荐的实时性,并显示出良好的扩展性,使得推荐系统能够应对大规模数据集的挑战。 通过实验验证,这个Item-Based并行协同过滤算法在实际应用中表现出优秀的性能,尤其是在推荐速度和系统的可扩展性方面。它不仅解决了传统协同过滤在面对大数据时的瓶颈,也为推荐系统的设计者提供了一个新的工具,以适应不断增长的用户和商品需求,满足现代推荐系统对高效率和可扩展性的需求。 本文的研究对于理解分布式计算如何优化推荐系统,以及如何通过Hadoop等大数据处理框架来提升推荐算法的性能具有重要意义。它为后续的推荐系统研究提供了参考,特别是在处理海量数据时寻求更高效算法的探索方向。对于从事IT技术尤其是推荐系统开发的人员来说,这篇文章是深入了解和应用分布式计算技术的一个重要资源。
资源详情
资源推荐
第 3 7 卷第1 期 南京师大学报(自然科学版) V A 37 No. 1
2014 年 3 月 JO URN A L OF N AN JIN G N O R M AL U N IV E R S IT Y (N atura l Science Ed ition ) M ar,2014
Item-Based并行协同过滤推荐算法的设计与实现
燕 存 ,吉根林
( 南京师范大学计算机科学与技术学院,江苏南京210023)
[摘要] 基于协同过滤的推荐已成为推荐系统中广泛采用的推荐技术.由于应用中用户数目和商品条目的日
益增长,在计算相似度和计算预测时,单机集中式计算已不能满足推荐系统实时性和可扩展性的要求.针对这一
问题,设计并实现了 Item-Based并行协同过滤推荐算法. 该算法米用H adoop的 M apReduce与 H D F S 架构,可分
为 M ap与 Reduce两个过程. 通过在M ap 和 R educe节点上的并行处理可提高算法的执行效率. 实验结果表明,该
算法可明显减少推荐时间,提高推荐实时性,获得良好的可扩展性.
[关键词] 推荐系统,协同过滤,Hadoop,MapReduce
[ 中图分类号]TP311 [ 文献标志码]A [ 文章编号] 1001-4616(2014)01-0071-05
Design and Implementation of Item-Based Parallel Collaborative
Filtering Algorithm
Yan C un,Ji Genlin
( School of Computer Science and Technology,Nanjing Normal University,Nanjing 210023,China)
Abstract: Collaboration filterin g has been w idely used in recommender system. How ever,with the increase of user
numbers and item num bers,thecom puting a b ility of single computer can not satisfy the requirem ent of real-time
performance and the requirem ent of scalability when computing the sim ilarity and prediction. To address the issue,this
paper presents an Item-Based parallel collaborative filte rin g recommendation algorithm. Adopting the framework of
MapReduce and HDFS in Hadoop,the parallel algorithm is divided into two procedures,which are Map and Reduce.
Through the computation in parallel in respective Map and Reduce n o d e ,the algorithm performance is improved. The
experim ental results show that the proposed algorithm can decrease the recommend time and has a good real-time
performance and scalability.
Key words :recommendaton system ’ collaborative filte rin ig ,Hadoop,MapReduce
随着计算机网络的迅猛发展,电子商务规模不断扩大,数据库中用户数量和商品数量急剧增长.用户想
要在海量的数据中发现自己所需要的信息变得异常困难.推荐系统:1 ]成为解决这一问题最好的解决方案,它
根据用户的兴趣推荐满足用户需求的对象,减少查找时间,实现个性化推荐服务.目前几乎所有电子商务网
站都已应用了推荐模块,如占有市场份额最多的阿里巴巴,以及全球最大的网上书店Amazon, com-1等.在各
种推荐算法>5]中,基于协同过滤的推荐无疑是最成功的个性化推荐技术:2].基于协同过滤的推荐技术已被
应用到很多领域,主要分为基于用户的(User-Based)推荐和基于项目的(Item-Based) 推荐>].User-Based协同
过滤推荐基于用户的历史购买记录,找出购买记录最相近的用户作为相似用户,再从购买记录中找出目标用
户未购买的商品进行推荐.在大型电子商务网站中,商品的数量相比于与日倶增的用户数量是相对稳定的,
Item-based协同过滤将计算用户之间的相似度转化为计算项目间的相似度,项目间相似度可离线计算,这将
有效地减少在线计算量,可在一定程度上解决实时推荐的问题:7 ].
为了改善推荐算法的实时性,文献[8]在 Hadoop^平台上实现User-Based并行协同过滤推荐算法.文
献[10 ]在 Hadoop平台上实现Item-Based并行协同过滤推荐算法,该算法中,计算用户购买相同项目对是
收稿日期=2013-03-31.
基金项目:江苏省自然科学基金重点项目(BK2011005).
通讯联系人:吉根林,博士,教授,博士生导师,研究方向'数据挖掘技术及应用. E-mail' glji@ njnu. edu. cn
一
71 —
下载后可阅读完整内容,剩余4页未读,立即下载
weixin_38683930
- 粉丝: 2
- 资源: 879
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 最优条件下三次B样条小波边缘检测算子研究
- 深入解析:wav文件格式结构
- JIRA系统配置指南:代理与SSL设置
- 入门必备:电阻电容识别全解析
- U盘制作启动盘:详细教程解决无光驱装系统难题
- Eclipse快捷键大全:提升开发效率的必备秘籍
- C++ Primer Plus中文版:深入学习C++编程必备
- Eclipse常用快捷键汇总与操作指南
- JavaScript作用域解析与面向对象基础
- 软通动力Java笔试题解析
- 自定义标签配置与使用指南
- Android Intent深度解析:组件通信与广播机制
- 增强MyEclipse代码提示功能设置教程
- x86下VMware环境中Openwrt编译与LuCI集成指南
- S3C2440A嵌入式终端电源管理系统设计探讨
- Intel DTCP-IP技术在数字家庭中的内容保护
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功