顾客驱动的图书馆购书和淘汰混合推荐系统

64 浏览量更新于2024-01-27 收藏 1.49MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报一个读者驱动的图书馆购书和淘汰的混合推荐系统Maryem Rhanouia，b，Ban，Mounia Mikrama，c，Ban，Siham Yousfia，d，Ban，Ayoub Kasmia，Naoufel Zoubeidiaa摩洛哥拉巴特信息科学学院LYRICA实验室子午线小组b摩洛哥拉巴特穆罕默德五世大学拉巴特信息技术中心、ENSIAS、ADMIR实验室IMS团队c摩洛哥拉巴特穆罕默德五世大学理学院LRITdSIP研究团队，拉巴特IT中心，EMI，摩洛哥拉巴特穆罕默德五世大学阿提奇莱因福奥文章历史记录：收到2020年2020年10月2日修订2020年10月20日接受2020年10月29日网上发售关键词：推荐系统图书馆管理采访机器学习A B S T R A C T如今，信息源的爆炸已经塑造了图书馆用户如何访问信息，并提供他们的喜好反馈。因此，面对数字图书馆的爆炸式增长和蓬勃发展，现代图书馆必须迎接挑战，满足用户的需求，考虑他们的意见和偏好，以便为他们提供足够的资源，并从此消除那些不满意的资源。几乎所有的图书馆推荐系统的目标都是为用户提供他们感兴趣的项目。然而，尽管这一革命性的技术确实令人感兴趣，但面向工作人员将其改编和应用于馆藏发展过程仍处于萌芽阶段。本文提出了一种顾客驱动的混合图书馆推荐系统，该系统利用机器学习技术，通过提取和分析用户推荐系统的应用和验证，在一个真正的国家图书馆的情况下，使用亚马逊©2020作者由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍公共图书馆的创建主要是为了收集、保存和传播文献遗产和社区知识。然后，它应通过提供高质量的馆藏，保证向用户提供相关文件收藏是图书馆的核心（Ferguson，2007）。馆藏发展是指为满足用户的需求和兴趣而开发或建设图书馆馆藏的深思熟虑的过程馆藏发展政策（Johnson，2018）是一个战略和决策过程（Kao等人，2003）和规划工具。它主要侧重于确定和提出相关的解决方案，以选择（收购）和取消选择（除草）的问题，*通讯作者。电子邮件地址：mrhanoui@esi.ac.ma（ M.Rhanoui）， mmikram@esi.ac.ma（M.Mikram），syousfi@esi.ac.ma（S. Yousfi）。沙特国王大学负责同行审查制作和主办：Elsevier图书馆馆藏是馆藏发展过程的基础，是其成功的决定性因素。采集（或选择）是一项决策和数据驱动的任务，也是馆藏发展的中心过程它是选择内容的行为，无论是物理还是数字格式，以添加到集合（弗格森，2007）。它是图书馆发展过程中最重要的业务活动之一，因为它代表了图书馆创建的主要动力，以最好地满足用户的需求因此，图书馆将其预算的很大一部分用于采购，以完成其收藏。清除也是一项非常关键和复杂的任务，它包括决定是否从集合中取消选择文档。换句话说，除草是在Dilevko和Gottlieb（2003年）进行的一项调查中，83.9%的受访者（图书馆员）表示然而，这些过程的管理不善可能导致几个故障。事实上，只要新的收购和剔除建议的选择不是基于明确定义的标准和用户生成的数据，大多数用户可能对可用的信息持有量不满意因此，他们中的很大一部分此外，随着可用文档的数量不断增加，用户被淹没在大量的https://doi.org/10.1016/j.jksuci.2020.10.0171319-1578/©2020作者。由爱思唯尔公司出版代表沙特国王大学这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comM. Rhanoui，M.Mikram，S.Yousfi等人沙特国王大学学报2810不相关的和冗余的资源，使他或她无法检测到满足他或她的信息需求的相关作品所有这些都会导致混乱和缺乏空间的问题，导致花费在搜索正确信息上的时间损失。此外，图书馆的预算和公共资金可能会被浪费在购买不相关的文件，不会被查阅，或错误地删除有趣的文件。因此，这些收购和淘汰决策需要一种智能的数据驱动方法，该方法考虑到用户偏好，并利用新技术和丰富的数据。为了跟上这种技术的蓬勃发展，并继续吸引喜欢新数字平台的用户，公共图书馆需要跟进并变得更加以用户为中心和用户驱动（Maness，0000），以实现图书馆与用户之间的双边和双向关系（Curran等人，2006年），特别是让他们参与并考虑他们在有关馆藏发展政策的决策过程中的偏好。这种决策方法随着人工智能和机器学习的出现而出现，引发了其他应用，如推荐系统。这项工作的动机是上述限制，这些限制在空间、时间和相关性方面对图书馆产生了以下负面影响：空间：缺少清除操作会导致货架超载。这首先会影响货架之间的视野，（满架有被错误分类的风险，这不鼓励咨询）。第二，它对新收购产生影响。此外，工作人员发现很难确定采购选择的正确方法。时间：用户在寻找合适的书时会在书架前浪费时间。此外，工作人员正在浪费时间，试图寻找信誉良好的书籍，可以购买，但最终不满足用户的需要。相关性：图书馆的原则是提供相关的目录，以保证满足公众的信息需求。没有除草导致保持作品（在恶劣的条件下，过时的，没有价值.. . ），一般不能满足用户的需求当图书馆购买了那些不会被查阅的物品时，它也会赔钱为了克服这些局限性，图书馆对实现推荐系统有很大的兴趣。本文的主要贡献是：设计了一种基于用户评论和信任度的推荐系统模型;一个混合的、无冗余的、基于用户的推荐系统，用于图书馆在本文中，我们提出了一个推荐系统的图书馆本文的其余部分组织如下：在第二节中，我们介绍了背景知识，并调查了图书馆的采购和除草推荐系统的研究工作，第4节概述了我们提出的方法，并使用第5节中的公共图书馆案例进行了验证。最后，第六章对全文进行了总结。2. 背景和相关工作在数据革命的新时代，图书馆员必须与时俱进，适应新的技术挑战图书馆研究的最新趋势（Reinhalter和Wittmann，2014）。事实上，图书馆员和信息专业人员一直表现出组织数据和寻找高质量和可靠数据的专业知识，以确保可访问性（Affelt，2017）。作为一个自然和必要的进步，图书馆员需要将数据科学技术集成为机器学习，并利用新的数据源。在本节中，我们介绍了推荐系统的概念和与图书馆基于意见的推荐系统相关的工作。2.1. 推荐系统推荐系统（或“引擎”）目前几乎无处不在的互联网上。在大多数新闻网站上，人们可以看到一个横幅，表明“喜欢这篇文章的人也喜欢那篇目标是自定义网站上的推荐系统的定义随着该领域的发展而不断最经典的定义是Resnick和Varian（1997），他们认为推荐系统是一种能够研究用户对给定对象的偏好的系统推荐系统允许给定的用户拥有适合他的简档的服务或资源：因此他可以提供个性化的推荐或引导他选择对他有用并且最能满足他的需求的产品（或服务）。根据Burke，推荐技术被分为五个主要类别（Burke，2002）：内容过滤、协同过滤、人口统计过滤、基于效用的过滤和基于知识的过滤。Adomavicius和Tuzhilin（2005）将这些技术分为三个主要类别：内容过滤，协同过滤和组合它们的混合方法。内容过滤（Mooney等人，2000; Pazzani和Billsus，2007; Lops等人，2011）是基于功能的“内容”，项目，以便根据用户选择或欣赏的项目建立用户简档。它向用户推荐与他或她已经查看过的项目相似的项目或欣赏。协同过滤（Linden等人，2003; Hu等人，2008; He等人， 2017年）是基于用户之间的意见共享。它向用户推荐那些与他们共享相同偏好的其他用户所欣赏的项目人口统计过滤（ Wang 等人， 2012; Zhao 等人， 2014 年 ;Al-Shamri，2016年）根据演示图形分类和用户配置文件提供建议。基于效用的过滤（Huang，2011; Zheng，2019; Zihayat等人，2019）基于用户的每个项目的效用的计算为用户提供推荐。这个类别的主要基于知识的过滤（Towle等人，2000年; Martínez等人，2008年; C.C. Aggarwal等人， 2016年）建议项目基于用户的偏好明确询问在大多数情况下，以对话的方式。混合方法（Balabanovic和Shoham，1997; Burke，2007; Strub等人，2016年）。这种方法是内容过滤和协同过滤的结合。它包括利用用户偏好数据从用户/项目矩阵提供的协同过滤和上下文数据从基于内容的过滤。在本文中，我们提出了一种基于用户意见和情感的混合推荐系统。●●●●●●●●M. Rhanoui，M.Mikram，S.Yousfi等人沙特国王大学学报28112.2. 相关作品2.2.1. 馆藏发展办法馆藏发展是在一段馆藏发展包括制定选择标准、规划资源共享、更换丢失和损坏的物品，以及例行的选择和取消选择决定馆藏开发是一个由六个主要要素组成的过程：社区分析、选择政策、选择、获取、取消选择和评估（Saponaro和Evans，2019）。顾客驱动的采购（PDA）（贾和Xiaojing，2011Coghill，2019）或需求驱动的采购（DDA）是一种将用户参与纳入学术图书馆馆藏建设过程的新方法（Goedeken和Lawson，2015）。2.2.2. 图书馆管理和馆藏发展推荐系统2.2.2.1. 面向用户的图书馆推荐系统。在文献中，已经提出了用于数字图书馆的几种推荐系统（ Huang 等人， 2002; Liao 等人， 2009;Wakeling，2012）在大数据环境中（Yousfi等人，2019; Simovic，2018），特别是学术研究（Porcel等人，2009;Serrano-Guerrero等人，2011; Kun，（11）（2012）; Jomsri，2014）。最近，用户偏好已经成为推荐系统中的主要问题，通过提供个性化推荐（ Subramanyaswamy 和 Logesh ， 2017; Lee 和 Brusilovsky ，2017; Zhou和Han，2019），特别是通过依赖用户评论（Chen等人，2015年; Guo等人，2016年），通过积极学习为了明确地获取这些评论（Rubens等人，2015; Bu和Small，0000）。这些偏好可以从用户的文本评论的情感分析中提取（Ma等人，2017年; Zheng等人，2017;Musto等人，2017年; Lu等人， 2018年）。Huang等人（2002）提出了基于图的推荐系统，用于在数字图书馆中结合协作过滤和基于内容的过滤。Liao等人（2009）提出了一种基于个人本体的中文数字图书馆推荐系统这种方法是基于一种混合算法系统的概念，它结合了协同过滤和基于内容的过滤来推荐图书馆馆藏。基于内容的部分使用本体来获取用户的兴趣知识，而在协同过滤过程中计算两个本体之间的距离来确定用户之间的相似度。Porcelet al.（2009）提出了一个混合系统，它结合了基于内容的推荐和协作推荐。Tejeda-Lorente等人（2014）提出了一种基于质量的推荐系统，该系统考虑项目的质量以估计其相关性。Serrano-Guerrero等人（2011）提出了一种高校数字图书馆的模糊语言推荐模型。该模型使用Google Wave方法，为不同的用户和资源提供共享空间Jomsri（2014）提出了一个图书馆图书推荐-基于用户特征分析和关联规则的数据挖掘系统Morawski等人（2017）提出了一个混合推荐系统，为农村图书馆结合基于内容和协同过滤。作者引入了模糊品味向量的概念来处理由于这种库的较小尺寸和其典型的稀疏数据集而引起的“冷启动”问题2.2.2.2. 以员工为导向之图书馆发展政策推荐系统。下面介绍的工作是推荐系统向特定用户推荐特定产品。采购和剔除推荐是图书馆推荐系统的一个特殊情况，需要特殊的设计和适应。在这方面，我们发现很少有工作涉及采购建议，具体如下：Yang and Hung（2012）提出了一个图书馆图书采购作者使用了一个简单的指标，不包括用户的反馈和意见。此外，推荐人制度只涉及采购过程，不包括剔除书籍。 Wu等人（2017）提出了一种基于网络排名机制的图书馆图书采访推荐系统。然而，对于Yang和Hung（2012），它依赖于来自用户注册表的简单度量来做出图书采购的决策，并且不处理剔除。为了帮助制定政策Cabrerizo et al.（2015），Cabrerizo et al.（2017）提出了一个图书馆服务质量评估模型，通过扩展标准LibQUAL+模型来处理用户这些工作是图书馆馆藏发展决策支持的一个简单组成部分，并纳入了用户的然而，它们处理并保持仅限于一个标准（副本数量，明确的用户感知等），并且不能被视为推荐系统。更罕见的是，不存在的是关于Weeding推荐系统的作品。3. 研究目标先进的技术极大地改变了信息寻求，并有必要对图书馆馆藏的传统概念进行审查（李，2000）。事实上，这种技术革命和由此产生的丰富数据是收购（Dresselhaus，2016）和除草领域的挑战和机遇。馆藏发展是图书馆和信息中心最重要和最基本的方面（Jan和Ganiae，2019）。图书馆藏书的效率因此，这一关键任务需要决策支持，以协助管理人员并建议他们做出正确的决策。因此，提出一个推荐系统的明显相关性与其他标准推荐系统相比，该推荐系统向特定用户推荐一个或多个项目，其主要复杂性和特殊性在于它是针对图书馆工作人员而不是个人用户的。实际上，输入数据是图书馆内外部用户的意见和偏好，在此基础上提出建议的收购和除草（图）。①的人。文献综述表明，很少有工作提出这样的系统。绝大多数图书馆推荐系统的目标是使用各种机器和深度学习技术向用户推荐书籍。此外，考虑到用户的文本评论在推荐过程中的重要性（Terzi等人，2011年; Lu等人，2018年），必须将它们整合到模型中，以考虑用户的偏好和意见。4. 建议的方法：用于获取和剔除我们提出了一个混合推荐系统的决策帮助收购和除草的一般收藏。该系统是基于用户的意见，为馆藏发展决策者提供参考.M. Rhanoui，M.Mikram，S.Yousfi等人沙特国王大学学报2812Fig. 1. 新的推荐过程。4.1. 要求系统满足以下要求：面向用户：建议的推荐系统是敏感的用户它考虑了用户的明确评级（例如，从0到5的分数）以及文本评论形式的隐含评级（例如，这本书是非常informative），这是转化为一个数字得分。针对决策者：与针对用户的标准推荐系统不同，建议的系统旨在帮助员工进行收购和淘汰操作。它补充了图书馆实施的馆藏发展做法。非冗余：建议的系统自动管理元素的冗余，无论是在采购剔除提案或图书馆目录实际上，相似性分析使得可以避免推荐获取非常相似的两个不同项目，或者剔除唯一的并且其库不具有相似项目的项目。混合动力：该系统结合了考虑用户偏好的协作方法和分析项目之间的相似性的基于内容的方法。因此，拟议的推荐系统有一个不同的目标（旨在为工作人员推荐项目获取或杂草）比标准的推荐系统（旨在为用户推荐可能感兴趣的作品），他们一起构成了一个全球系统的基石，他们预计将共存，而不是取代对方的利益和满意度的用户。M. Rhanoui，M.Mikram，S.Yousfi等人沙特国王大学学报28134.2. 总体概述整个过程可以总结为4个基本步骤（图）。（2）：从内部和外部平台（在我们的例子中是图书馆和亚马逊的目录）提取和存储数据–NA Dataset: A dataset of items not available at the librarywith their ratings and–A Dataset: A dataset of existing items at the library withtheir ratings and构建用户项矩阵–Calculation of user–Calculation of the overall购置建议的计算–Study<$内部冗余以避免推荐2个类似项目<$Extra-re-d用于避免将某个项目与库相似地重新命名–Proposal of acquisition of best rated–Cluster–Proposal4.3. 数据提取和处理该过程从数据提取和处理开始（图1）。 3）。4.3.1. 数据源建议的推荐系统集成了2个不同的数据集：外部数据源：这是一个在线目录，包含尽可能详尽的书籍及其评价列表。我们选择了亚马逊，因为它是世界上最大的图书销售。因此，它有一个大型的图书数据库和一些关于它们的评论和评级。图三.数据提取和处理。内部数据源：这是图书馆的内部目录，它提供了关于他们现有作品的信息，以及可能的使用情况。4.3.2. 数据提取和处理数据提取：数据提取处理两种数据，内部数据源（IDS）提供现有的项外部数据源（EDS）提供了一个广泛的列表，列出了图书馆中现有的和不存在的项目。抽取步骤包括从Amazon收集图书Meta数据和评级。这一步会产生一个数据库，其中包含：用户的ID、书名、评分，最后是评论数据处理和交叉：一旦我们从亚马逊提取了数据集和评论，我们就可以继续这个数据库与图书馆目录的交叉，创建2个集合：图二.整个过程。●●●●●●●M. Rhanoui，M.Mikram，S.Yousfi等人沙特国王大学学报2814●\●-IJImpexJXEDS和IDS的交集（EDS IDS）：此集合允许列出图书馆中也存在的Amazon作品，目标是完成图书馆项目列表，其中包含Amazon上的评价和用户通知。此集合将用于消除操作。EDS和IDS的差异集（EDS IDS）：此集合允许列出库中不存在的Amazon项目最新的将用于采购操作，以推荐新的（不存在的）项目进行采购。4.4. 评级矩阵计算4.5.2. 隐式用户评分：已发表评论的情感分析下一步是通过情感分析技术分析发布的文本评论。它是确定一系列单词背后的情感基调的过程（AL-Sharuee等人，2018年）。在这个阶段，我们将每个意见与其适当的语气（积极，中立或消极）联系起来。我们使用CNN 和双向 LSTM 模型的组合来进行 Rhanoui et al.（2019）中提出的文档分类。该模型受益于CNN这一步的结果是计算rimp，获取过程的输入是包含图书馆中不可用项目及其评级和评论的差异数据集。此集合包含大量项目和用户。剔除过程的输入是外部数据源（其是Amazon库）和内部数据源（其是库目录）的交集。因此，这一套包含了图书馆和亚马逊共同的作品，交叉帮助完成了图书馆的目录与评级和用户的意见，这旨在提出除草的建议。最差的作品4.5. 评级计算这一步的目的是建立一个矩阵的评级计算为每个项目，其最终评级后，几个计算。如前所述，从亚马逊提取的数据为我们提供了关于作品的数值评估的元数据，以及用户表达的文本意见。我们将使用这些信息来计算每个项目的最终评级此外，所有用户的意见并不具有相同的价值，事实上，我们认为经验丰富的用户的意见比新手的意见更重要。因此，考虑到这方面，我们根据用户的可靠性或信任度为用户的意见赋予权重。因此，对于一个更相关的结果，我们计算我们所谓的因此，为了计算用户-项目评级矩阵，其中n是矩阵中的用户的数量，m是项目的数量，并且rij：用户i对项目j的评级。该评级包括两个部分：通过以下公式合并显式和隐式评级：在Eq. 1.一、4.5.3. 用户信任在传统的推荐系统中，假设所有用户是独立的，他们的意见的价值是相等的，这并没有反映用户的多样性。这导致了信任感知推荐系统的出现（ Massa 和 Avesani ， 2007; Rafailsani 和 Crestani ， 2017;Hassan，2019），在推荐系统的研究中向前迈出了重要的一步（Ma等人， 2011年）。在文献中存在对信任以及如何测量信任的各种定义，这些定义朝着同一原则收敛，“信任被定义为一个人对他人提供有价值评级的能力的信念”（Guoetal.， 2014年）。因此，在我们的工作人员为导向的推荐系统的背景下，信任是一个用户的意见，根据他的能力和行为在给定的上下文中的信心措施。推荐系统中的信任度量以不同的方式和类别出现（Massa和Avesani，2009;Victor等人， 2011年）。在这一步中，我们分配一个分数，我们将其表示为每个用户的信任分数。这将被用来衡量他们的整体评级。该分数将根据几个因素计算，例如用户发布的评级数量，用户专业，用户研究水平等。对这些标准的考虑取决于用户的类型（图书馆内部或外部）及其现有信息。在我们的案例中，我们考虑了亚马逊用户的评分数量以及图书馆用户的评分数量和领域专业知识。这种计算的目的是给老鼠更多的价值rij<$a×r exb ×rimpð1Þ经验丰富的用户和领域提供的意见和建议伊季哪里● Rij：是用户i对项目j给出的在0和5之间的显式评级。● 里伊季是以情绪分析技术从文本评论中提取的数字评级。● a是用户明确评级的权重● b是用户文本评论的权重。a和b分别表示在总评分中给予显性和隐性和部分的权重和重要性。如果同时提供文本和明确的评级，则a和b具有专家例如，一位法律专家对一本法律书的看法将比其他领域的专家的看法更有分量4.5.3.1. 信任感知评级的计算。现在，我们将用户的可靠性集成到评级计算中，并创建一个包含所有项目和最终评级的表，该表将考虑用户给出的所有评级。用于确定项目的此“可信评级”的公式由活跃用户j评定的是：Trij<$rij×Sj2其中r表示用户对项目的评级，S表示信任当量为¼0： 5。当没有提供文本审查时，b 1/40和a 1/41。IJ用户j的得分。i j j4.5.1. 明确的用户评级下一步是构建一个用户-项目评级矩阵，将每个项目与用户分配的评级联系起来。明确的评级是用亚马逊元数据提取的。如果图书馆有一个评价系统，对图书馆用户的评价也是对这些评价的补充项目的最终评分是用户对该项目评分的平均值：ðTrijÞRi¼nð3Þ出书。符号n表示对项目i的所有评级用户的总数。M. Rhanoui，M.Mikram，S.Yousfi等人沙特国王大学学报2815输出是如下表（表1），每个项目现在对应于如上所述计算的全局评级。图4总结了用户评级计算。之后，我们根据用户的意见推荐组件计算每个项目的平均得分，然后根据“得分”进行增长排序，最后显示评分最高或最低的然而，仅仅用评级来定义最好或最差的评级书是不够的。事实上，在10条评论中评分为5的项目将被认为4.5.4. 加权评分为了克服这个问题，有必要设计一个加权评级，考虑到平均评级和收集的笔记数量然后，我们提出以下方法来计算最终加权分数：WR ¼。 v：R。 M ：C4这项相似性研究的目的是改进推荐列表，只提出与纪录片背景相比具有足够原创性的项目。一旦识别出相似之处，就可以消除多余的建议。使用Pearson相关性进行内部和外部相似性分析。4.6.2. 清除列表处理关于剔除，相似性分析的目的是避免排除唯一项。因此，我们将库中的项目分组为高度相似项目的集群。因此，每个聚类都包含一个高度相似的项目列表。从这一点上，并使用上面计算的评级矩阵，我们考虑消除的冗余和低评级的作品（图。 6）。除草推荐组件是一组算法，我们提出了计算加权得分，TF-IDF向量和项目之间的相似性。5. 为例哪里武姆武姆国家图书馆作为一个大型文献中心，在为用户提供广泛的图书资源方面发挥着重要作用。为了满足这些用户的需要，● v：项目的评分数● m：表中需要显示的最小评级数● R：每个项目的平均评分。● C：所有项目的所有R评分的平均评分对于m，没有好的值。我们认为它是一个初步的过滤器，作为一个阈值，忽略了少于一定数量的意见的项目。对于收购建议，我们使用第90百分位数作为阈值。换句话说，对于要推荐的项目，它必须比列表中至少90%的项目具有更多的注意力对于剔除推荐，我们保持相同的m概念。但这一次，我们首先降低百分位数，以增加最值得注意的项目的数量因此，我们的目标是重新组合评分最差的项目，这些项目的评论数量小于m。4.6. 建议现在，我们有了一个有序的列表，其中包含不存在的项目，这些项目已经被用户全民投票，用于购买推荐，以及评级不高的项目，用于剔除推荐。下一步是确保此列表不包含高度相似的项，以避免冗余。相似性分析对于采集和剔除处理是不同的。我们在下面详细介绍每一个：4.6.1. 采集表处理4.6.1.1. 相似性处理。下一步，在采集过程中，执行两种类型的滤波（图1）。（ 5）：内部相似性：这是推荐列表本身的项目之间的相似性。额外相似度：这是推荐列表中不存在的项目与库中项目表1项目信任评级。项目1R1项目2R2项目3R3.. .. . .项目nR n图书馆必须通过文献采访和文献清理工作来维持文献经费的稳定建议的混合推荐系统的目的是为图书馆管理人员陪同，并协助他们更好地管理这些微妙的和重要的操作。因此，它提供了一个顾客驱动的决策支持系统的收购和除草。在这个案例研究中，我们应用并验证了推荐系统，以一个真正的国家图书馆。5.1. 数据集描述从亚马逊提取的数据集包含278，858个用户，对271，379本书进行了1，149，780次评分，并由三个表组成。下面是书籍摘录（表2），用户（表3），书籍评级（表4）数据集和提取的音调（表5）。5.2. 用户评论用户评论被提取，然后情感分析模型被应用于确定音调。5.3. 评级计算我们数据集中的几本书被多次评级，这将使我们能够给出重要的推荐。我们首先根据受欢迎程度建立一个项目列表。然后，加权评级计算与WR（加权评级）方程。四是前面提到我们已经有了R和v的值，所以可以直接从这些数据中计算C。一本书的平均评分在5分制下约为3.5分。● C = 3.504● M= 8.4随后，我们继续根据评论数量过滤项目5.4. 购置建议5.4.1. 相似处理最著名的书是●●M. Rhanoui，M.Mikram，S.Yousfi等人沙特国王大学学报2816见图4。UserRating.图五. 购置建议。我们使用皮尔逊相关性（Benesty等人，2009）来测量作品的符号与此之间的相关性，以确定与给定作品相似的作品。我们首先计算每本书的平均评分，然后显示前100名。5.4.2. 采购清单建设考虑到已经指定的用户的可靠性，对评分进行加权，最高评分的项目不超过6.6级，评分约180次。这100个项目的清单构成了建议进行采购的潜在项目。5.5. 除草建议5.5.1. 相似处理对于相似性处理，我们通过计算项目之间的相似性来构建相似项目的聚类，在标题上。为此，我们计算每个项目的TF-IDF向量。这将生成一个矩阵，其中每列表示标题词汇表中的一个单词（至少出现在一个文档中的所有单词），每行表示一件物品5.5.2. 除草清单建设通过相似性分析，相似的项目被分组到聚类中，然后按得分（加权得分）排序。最后，建议删除评级较低的下面是一个相似书籍的聚类示例（表6），按分数降序排列。这一组涉及民法主题的书籍。这些书的书名是从法文翻译过来的，以便更好地理解。如上所述，该列表中具有最低分数的项目被提议作为用于剔除的候选项。M. Rhanoui，M.Mikram，S.Yousfi等人沙特国王大学学报2817见图6。除草建议。表2表中摘录：书籍。表3摘自表格：用户。书名书-年出版商User-ID位置年龄作者1美国纽约NULL古典神话马克·P2002牛津2美国加利福尼亚州斯托克顿18O.大学出版社3俄罗斯，莫斯科，育空地区NULL莫福德4波尔图，v.n.盖亚，葡萄牙17克拉拉·卡兰理查德布鲁斯2001哈珀火烈鸟加拿大5.. .farnborough，hants，英国. ......你好。NULL. . .诺曼底的决定赖特·卡洛d’Este1991HarperPerennial278858爱尔兰都柏林NULL乌鲁木齐木乃伊E.J. W.理发1999W. W. 诺顿和公司表4《灶神之妻》The Kitchen God普特南酒吧集团表中摘录：图书评级。ISBN图书评级假设？：世界罗伯特2000Berkley6. 结论在这篇文章中，我们提出了一个决策支持系统，提供建议和建议的项目获得和杂草通过混合推荐系统。为了验证我们的方法，我们使用机器学习技术在一个国家图书馆的真实案例中实现了它。我们已经进行了几次测试，表明我们的系统功能正常。276736325722428182767376005709676276744038550120X7我们的方法是独特的，因为很少有工作提出了一个推荐系统的收购和除草。几乎没有这种类型的工作，因为我们的方法的特点是，军事历史学家想象什么考利出版276725034545104X0可能是组27672615506122452767274465208020276729052165615X32767295217950286M. Rhanoui，M.Mikram，S.Yousfi等人沙特国王大学学报2818表5提取用户评论。userId审查音调Y. Hu，Y.科伦角Volinsky，Collaborative filtering for implicit feedback datasets，in：2008 Eighth IEEE International Conference on Data Mining，Ireland，2008，pp.263- 272..他，X.， Liao，L.，张洪，涅湖，加-地 Hu，X.， Chua，T.-美国， 2017. 神经协作1五星，非常有趣，似乎会产生一些有趣的体验2很好，发人深省。想法刺激。一个容易阅读和一定要删除一个从例行和暴露的头脑到新的方向。是的--这本书是一种启示，也是一种思想的兴奋剂我强烈推荐它3太自命不凡了，积极向上的正负过滤，在：第26届万维网国际会议论文集，WWW '17，国际万维网会议指导委员会，瑞士日内瓦共和国和州，pp。173-182..王玉，Chan，S.C.-F.、Ngai，G.，2012年。人口统计学推荐系统对旅游景点的适用性97比101Zhao，X.W.，Guo，Y.，中国科学院，他，Y.，江，H.，吴，Y.，Li，X.，2014年。我们知道你想买什么：一个基于人口统计的微博产品推荐系统。第20届ACMSIGKDD知识发现和数据挖掘国际会议论文集。 1935-1944年。4一颗星，表6消除簇的示例1民法：法律、财产、人。.2民法：导言3民法：义务4民法导论：基础它处理用户的需求，然后建议图书馆工作人员的作品，以消除货架。对于未来的工作，为了克服图书馆内部缺乏用户偏好和评论的问题，我们计划在推荐系统中包括主动学习（ Settles ， 2009 ）（Rubens等人，2015年），以便它有助于积极参与用户并获取他们的评论。竞争利益作者声明，他们没有已知的竞争性财务利益或个人关系，可能会影响本文报告的工作。引用弗格森，S.J.，2007. 21世纪的图书馆：制定信息服务的方向。爱思唯尔约翰逊，P.，2018年馆藏发展与管理基础Am.Lib. Assoc.Kao，S.- C.的方法，张，H.-C.的方法，林角，英-地H、2003年。借由流通资料库探勘为高校图书馆采购预算分配之决策支援。信息流程管理。39（1），133-147。埃文斯，通用电气，1995.发展图书馆和信息中心馆藏。图书馆学系列丛书。 Eric.Dilevko，J.，戈特利布湖2003.杂草实现：公共图书馆使命的基本组成部分？Lib. 收集。，获取，Tech. Serv. 27（1），73-96。J.M. Maness，Library 2.0 Theory：Web 2.0 and its implications for libraries，Webology 3（2）。柯伦，K.，Murray，M.，Norrby，D.S.，克里斯蒂安，M.，2006.通过图书馆2.0让用户参与进来。新版本INF. 网络1 - 2（1 -2），47-59。再吸入器，L.，Wittmann，R.J.，2014.图书馆：大数据的新兴城市。Serials Lib. 67（4），363-372。Affelt，A.，2017.大数据，图书馆员和信息专业人员的大机会，翡翠出版有限公司，CH。第32页。761-790。Resnick，P.，瓦里安人力资源部1997.推荐系统。Commun. ACM 40（3），56-58. 伯克河，2002.混合推荐系统：综述与实验。用户模型用户自适应互动. 12（4），331-370。Adomavicius，G.，Tuzhilin，A.，2005.走向下一代推荐系统：最先进的和可能的扩展的调查。IEEE Trans. Knowl. Data Eng.17（6），734-749.穆尼，R.J.，罗伊湖，2000.基于内容的图书推荐使用学习文本分类，在：第五届ACM数字图书馆会议论文集，DL195-204..Pazzani，M.J.，Billsus，D.，2007.基于内容的推荐系统。施普林格柏林海德堡，柏林，海德堡，pp. 325- 341Lops，P.，De Gemmis，M.，Semeraro，G.，2011年。基于内容的推荐系统：最新技术和趋势。在：推荐系统手册。施普林格，pp. 73比105林登，G.，史密斯，B.，York，J.，2003.亚马逊com推荐：项目到项目的协同过滤。IEEEInternet Comput. (1)，76-80Al-Shamri，M.Y.H.，2016年。人口统计推荐系统的用户分析方法系统. 知道了。-基于系统100，175-187。黄，S.- L.，2011.电子商务中基于效用的推荐系统设计：偏好获取方法的评价。电子学。商业水库Appl. 10（4），398-407.郑宇，2019.基于效用的多准则推荐系统。在：第34届ACM/SIGAPP应用计算研讨会论文集，pp。 2529- 2531Zihayat，M.，Ayanso，A.，赵，X.，Davoudi，H.，An，A.，2019.基于实用程序的新闻推荐系统。德西斯支持系统117，14-27。Towle，B.，奎因，C.，2000.使用显式用户模型的基于知识的推荐系统，在：AAAI基于知识的电子市场研讨会论文集，pp. 74比77..马丁内斯湖Barranco，M.J.，Pérez，L.G.，Espinilla，M.，2008.一个具有多粒度语言信息的基于知识的推荐系统。国际计算机内特尔System. 1（3），225-236.Aggarwal，C.C.，2016.基于知识的推荐系统，在：推荐系统，Springer，pp. 167-197..Balabanovic'，M.，肖汉姆是的，一九九七年。Fab：基于内容，协同推荐。Commun. ACM 40（3），66-72.伯克河，2007.混合网络推荐系统。施普林格柏林海德堡，柏林，海德堡，pp. 377-408.斯特鲁布，F.，戈德尔河，玛丽，J，2016.基于自动编码器的混合推荐系统，在：诉讼的的月1讲习班对深Learning for Recommender Systems，DLRS 2016，ACM，New York，NY，USA，pp. 11-16..Reitz，J.M.，2004.图书情报学辞典。Lib.无限制。Saponaro，M.Z.，埃文斯，通用电气，2019.收藏管理基础知识，ABC-CLIO，2019..贾，Z. Xiaojing，H.，2011.读者驱动采访：图书馆采访新实践及相关问题。 J. Lib. Sci.China 2，36-39.Coghill，J.，2019.顾客驱动的采购（PD

下载后可阅读完整内容，剩余1页未读，立即下载