1.2 研究意义
如今,高校图书馆的图书储量非常丰富,但是,读者想要准确快速找到符
合自己个性化需要的图书资源却比较困难。一方面,信息资源过于庞大,检索信
息需要花费很大的时间和精力,另一方面,用户的个性化需求也不尽相同,难以
满足所有用户的实际需求。如何利用现代信息技术满足读者在学习生活中的个性
化需求是当前高校图书馆一个亟待解决的问题。通过对海量的信息进行数据挖掘,
同时基于挖掘出的知识开展个性化的图书推荐是当前高校转变服务方式,提高服
务质量的有效手段之一。
目前,主流的非结构化文本数据推荐服务分为基于内容的推荐,基于关
联规则的推荐和基于协同过滤的推荐等三类。其中,基于内容的推荐,是在没有
足够的数据下,可以向具有不同兴趣偏好的用户推荐非流行的项目。LIBRA 是
很早的基于内容的图书推荐系统,由每位用户提供的训练例子,使用贝叶斯学习
算法,从 Web 提取图书的标题等信息,推荐图书。其特点是,算法简单,查准
率和查全率较高。但是内容提取的能力有限,面对高校的数量庞大,内容复杂的
信息资源难以准确全面进行内容挖掘。而基于关联规则的推荐是根据用户浏览或
者购买的日志生成规则,通过生成的规则来推算用户可能还会对哪些商品感兴趣,
最早的基于关联规则的推荐系统有 IBM 的 Websphere,ILOG 和 BroadVision 等
等。在图书推荐领域,引用关联规则是为了发现借阅记录中不同图书之间的关联
规则,当多本书存在一定的置信度,支持度,则存在一定的关联[3]。其特点是,
算法复杂,查准率较高,但同时它无法发现读者的新的或者隐含的阅读兴趣,容
易生成无效的规则。基于协同过滤的推荐思想是认为用户的兴趣偏好是可以通过
具有类似行为或偏好的用户群进行分析和预测得出的,利用最近邻预测技术,预
测当前用户可能感兴趣的项目。它适用于在有足够的用户数据的时候,可以向具
有相同兴趣偏好的用户推送受欢迎的推荐,但是数据往往是稀疏的[5]。
在高校的特定的信息环境中,馆藏资源数量庞大,类型各异且学科覆盖
广泛,大量的跨学科,跨专业乃至新型学科和边缘学科图书的存在,造成基于内
容的图书推荐系统所构建的模型很难全面准确表征图书资源的内容,因此推荐质
量比较低,难以满足高校师生对推荐资源的个性化的需求。高校图书馆读者较高
的借阅频次,相似的知识结构以及共同的知识背景,使得高校图书馆存在着大量
相似度较高的借阅记录,基于规则的推荐难以提供产生合适的关联性规则,最终
难以推荐符合读者个性化需求的图书资源。
基于以上的研究,为了达到更好的推荐效果,可以将读者进行分类,构
建出读者的学习风格模型,根据读者表现出的具体的学习风格,推荐符合其学习
特征的图书,并依据该模型采用改进的协同过滤算法开展个性化的图书推荐,以