>>
第
55
卷 第
2
期
2011
年
1
月
基于人工神经网络的个性化检索模型
徐恺英
1
王 硕
1,2
张 射
3
常 改
1
1
吉林大学管理学院 长春
130022
2
吉林工程技术师范学院职业教育学院 长春
130052
3
海军大连舰艇学院 大连
116018
〔
摘要
〕
针对网络信息检索需求的日益提高
,
利用人工神经网络算法构建一种个性化智能检索模型
,
使搜索引擎
能为用户提供个性化检索服务
,
并通过仿真实验验证该模型的可行性和有效性
。
实验结果表明
,
该模型可有效提
高搜索的准确率
。
〔
关键词
〕
个性化检索 人工神经网络 用户特征
〔
分类号
〕G354. 2 TP391. 3
ANN-based Personalized Retrieval Method
Xu Kaiying
1
Wang Shuo
1,2
Zhang She
3
Chang Gai
1
1
Management School of Jilin University,Changchun 130022
2
Vocational Education School of Jilin Teachers’Institute of Engineering & Technology,Changchun 130052
3
Dalian College of Naval Ships,Dalian 116018
〔Abstract〕In this paper ,a new method of personalized retrieval based on algorithm of ANN( Artificial Neural Network) is established
to meet the growing demand for search. The method which can make search engines more intelligent and more personalized tries to pro-
vide the best search results. And the applicability and efficiency of the model are tested in some level. The result showes that it can im-
prove search results effectively.
〔Keywords〕personalized retrieval artificial neural network user feature
收稿日期
: 2010 - 08 - 06
修回日期
: 2010 - 09 - 29
本文起止页码
: 59 - 63,102
本文责任编辑
:
王传清
1
引 言
随着网络信息的日益膨胀
,
在检索过程中
,
如何探
测现代用户需求
,
提供最能满足用户意图的个性化检
索结果成为当前信息检索技术中急需解决的课题
。
目前对人工智能与人工神经网络
( Artificial Neural
Network,
简称
ANN)
的研究已较为广泛
,
但将人工智
能中的神经网络算法应用于个性化搜索引擎的相关研
究还十分有限
,
在国内外关于个性化检索的研究中
,
应
用
BP
神经网络算法进行检索结果个性化处理的研究
较少
,
分析原因主要是由于人工神经网络对计算的硬
件要求极高
,
运算速度较慢
,
实现困难
。
近年来
,
随着
云计算技术的发展和神经网络专业硬件设备的开发
,
使利用神经网络算法提供个性化智能检索成为具有实
践性和创新性的研究方向
。
本文以
BP
神经网络算法
( Back-Propagation Neural Network)
为基础构建个性化
检索模型
,
在应用过程中实现动态学习和动态跟踪
,
且
泛化
(
或推广
)
能力强
,
为用户提供更符合其目标的检
索结果
。
2
个性化检索模型
当前使用的搜索引擎基本是采用一定的算法
(
例
如
: Google
使用的
PageRank
算法
[1]
) ,
确定被检索页面
的排序权值
,
以相对固定的顺序将检索结果呈现给检
索用户
,
缺乏个性化和针对性
。
而个性化检索是指搜索引擎主动或被动地搜集用
户的特征
、
偏好
、
兴趣等属性信息
,
并以此建立用户模
型
,
在检索过程中将用户检索词匹配和用户模型匹配
结合起来
,
反馈用户所需特定信息的过程
[2]
。
个性化
可以分为显式的个性化和隐式的个性化
,
前者是指在
用户参与下的个性化检索
,
在检索时用户可进行检索
分类选择
,
这种形式已经在商业系统如
Yahoo! 、Seruku
Toolbar、Furl
中使用了数年
[3]
,
后者是指通过分析用户
的兴趣
、
特征等相关的个性化信息
,
无需或尽量减少用
95