没有合适的资源?快使用搜索试试~ 我知道了~
Amine Sennouni信息文献服务目录推荐系统的内容、修改和原型制作引用此版本:阿明·森努尼 Données et industries des contenus,modélisation et prototypage d'un système derecommandation pour le catalogue d'un service d'information documentaire. 信 息 与 通 信 科 学 。HESAM大学,2021年。法语NNT:2021HESAC 034。电话:03793337HAL Id:tel-03793337https://theses.hal.science/tel-037933372022年10月1日提交HAL是一个多学科的开放获取档案馆,用于存放和传播科学研究文件,无论它们是否已这些文件可能来自法国或国外的教学和研究机构,或来自公共或私人研究中心。L’archive ouverte pluridisciplinaire联合国信息文件服务目录建议的内容、模式和原型的接受者和接受者艾高·阿贝·格雷瓜尔法国巴黎数字信息和通信处理中心THAPOSE提交人:Amine SENNOUNI日期:2021年 7月1日pour obtenir le grade de:Docteurd'HESAM Université国立工艺美术学院学科:人文科学和新人文科学专业:信息和通信科学Thurse dirigée par:Mme CHARTRON Ghislaineet co-encadrée par:M. BACHR Ahmed Abdelilah陪审团Ghislaine CHARTRON女士,CNAM巴黎大学校长M. Ahmed Abdelilah BACHR,ESI拉巴特大学校长Brigitte SIMONNOT女士,大学校长,洛林大学报告员M. Imad SALEH,巴黎第八大学教授特别报告员M. Mostafa BELLAFKIH,大学校长,INPT拉巴特公司简介E2誓章Amine SENNOUNI女士,我的助手/助手,向您介绍,目前的工作是我的主要工作,实际上是由Ghislaine CHARTRON女士(指导)和M. Ahmed Abdelilah BACHR(共同主任),在尊重原则方面d'honnêteté,d'intégrité et de responsabilité inhérents à la mission de recherche.根据《国家职业道德规范研究宪章》,研究工作和对这一问题的研究具有现实意义。这份工作在法国或在一个被检查的组织中的同一个或类似的版本中并不重要。Fait à Paris,le 19/07/2021Signature誓章本人,签名人,Amine SENNOUNI,特此声明,本手稿中的工作是我自己的工作,在GhislaineCHARTRON夫人(论文主任)和Ahmed Abdelilah BACHR先生(共同论文主任)的科学指导下,根据研究任务固有的诚实,正直和责任研究工作和本手稿的撰写符合法国研究诚信宪章。这部作品以前没有在法国或国外以相同或类似的版本提交给任何其他审查机构。Place Paris,date 19/07/2021签名3德迪卡塞斯我这样说是出于尊敬、感激和了解:-我的父母,赛伊达和艾哈迈德·拉希德,为我们的牺牲,爱情和友谊;-我的兄弟,雅辛,为了他的支持和鼓励;-迈赫迪叔叔,我在法国的时候,就把所有的计划都告诉了我-Toute ma chère famille pour son affection et son soutien;-我们是最好的朋友,为的是帮助、帮助、帮助和支持;-我的支持者们,他们帮助我规范这一问题,让我们有自己的方向和思路。所有这些人都为实现这一目标做出了贡献。谢谢你的无限。4雷默西芒他特别感谢我的工作,感谢我身边的人,不管是在我身边还是在我身边,我都显得很孤独我非常感谢Ghislaine CHARTRON女士,她是国家艺术和工业学院(CNAM)的教授,是文献科学和技术研究所(INTD)的主任,也是博士学位的主任,她的职责是提供实用的、必要的、有用的咨询和良好的指导。我非常感谢M. Ahmed Abdelilah BACHR,我 也很 感 激 。Brigitte SIMONNOT ,Pr.Imad SALEH et Pr.Mostafa BELLAFKIH pourdisponibilité et de恩芬我向M表达我的谢意。Salaheddine BAHJI,directeur de l'ESI,pour son soutien etaccompagnement et M. El Hassan LEMALLEM,前ESI主任兼高级专员先生的顾问,计划允许我进行这项研究。Mes remerciements vont également à5简历Les systèmes de recommandations font partie des modèles d'apartissage automatique quitransforment la recherche de l'information.这一概念在文献服务中属于新概念,但在文献C’est 我们的工作有三个目标: 综合管理信息系统在推荐系统中的应用 修改IMIST的建议制度 Mettre en Üuvre et évaluer le prototype de moteur de recommandation adapté à为了使我们的工作更有背景,我们开始全面考虑数据在文化产业过程和服务优化中的重要性,特别是在文件服务方面。在我们所处的地形上,我们可以在进行功能和技术方面的改进之前,利用IMIST的基础设施来建立一个推荐系统Notre contribution est ensuite la buildingLe prototype du système de recommandation proposé,distingue该系统集成了一种将用户隐 含 的 知 识 转 换 为 剥 削 者 明 确 的 知识 的 转 换 。 L’implémentation du système a étéeffectuée dans un environnement Spark dédié à l’apprentissage6carrés alternés(ALS)de factorisation matricielle,appartenant aux methodes de filtragecollaboratif à base de modèle.Mots-clés:推荐系统、自动出版物、隐含出版物、协作过滤、7英语简历推荐系统是机器学习的一个重要研究领域,它的出现给信息检索带来了革命性的变化。这一概念在纪录片结构中仍然是新的,很少有作品涉及这一点。我们的论文的背景是摩洛哥科学和技术信息研究所(IMIST),作为一个目标,设计和实现一个推荐系统的日志数据的基础上,根据协同过滤方法。三个次级目标被用来指导我们的工作:诊断现有情况,并确定在使用推荐系统方面对综合信息系统的需要; IMIST推荐系统的建模 实现并评估推荐系统原型。为了实现这些目标,我们首先开始确定IMIST的需要一个推荐系统,然后我们设计并实现了一个原型的基础上,用户的隐式数据提供建议。该原型区分了匿名用户和订阅用户,匿名用户根据所咨询的通知从推荐中受益,而订阅用户系统根据其配置文件为其提供个性化推荐。应当指出,为了加以利用,必须将用户的隐性数据转换为分数形式的显性数据。该系统的实现是在Spark环境下完成的,使用Scala语言和ALS Train Implicit模型的矩阵因式分解。关键词:推荐系统,机器学习,隐式数据,协同过滤,文献服务,图书目录,OPAC,内容产业,数据估值,摩洛哥。8材料桌Dédicaces 3回顾4简历5英语简历7第12条一览表14图15附件清单. 17导言. 18I. Problématique de recherche:objectifs et questionsde recherche 19II. Les methodes,cadre conceptuel et constraintesde recherche 25III. La structure dela thèse 26第一部分:文化产业中的数据:分析比较要点29第一章:文化产业中的转型30一.导言. 301. Industries culturelles etnouveaux enjeux 302. Numérique,données et économie dela culture 34Chapitre 2:La typologie de la Data dans les différentssecretariat culturels 41一、导言. 411. Les données structurées etnon structurées 412. Data et lesmedias 433. 专业实践的革新:新闻数据454. Data pour les medias:opportunitéet défi 475. Data dans le secteur de..........................................................................................................................6. 音乐部门的数据567. Data dans le secteur duE-Learning8. Synthèse sur............................................................................................................................................9. 文化产业中的数据利用之友................................................................................................................结论66第二部分:数据和SID 67第1章:小岛屿发展中国家的受益者的权利和协会服务的多样化689一、导言. 681. SID 68中的用户类型2. L’exemple d’Online Computer Library Center OCLC) : évolution des services de3. 链接开放数据(LOD)项目的地点......................................................................................................4. De meilleures possibilitésde recherche 785. Les cataloguesdocumentaires addresses 806. 电离层突扰监测仪活动数据的可视化:关于SID86患者交叉的结论第二章SID 88中一、导言. 881. 大数据:维度与基础设施882. 我们可以在SID中讨论大数据吗?...................................................................................................913. SID 94中数据挖掘的发展4. L’impact du big data sur l’évolution des compétences des professionnels结论. 99第三部分:建议和申诉制度101第1章:推荐制度的现代化,导言102Chapitre 2:Les approchesde recommandation 105导言. 1051. L’approche objet ou basée sur le contenu (2. L’approche de la recommandation sociale ou de filtrage collaboratif (3. L’approche de la recommandation hybride4. Autres approchesde recommandation 109结论110Chapitre 3:Les algorithmesde recommandation 111导言. 1111. L’apprentissage2. Les algorithmes de recommandation à basede contenu 1133. L’algorithme de filtrage collaboratif à base4. L’algorithme de filtrage collaboratif à base5.第五章Le type de données utilisées dans les systèmesde recommandation................................. 1196. L’exemple de Spotify et7. Les modèles de dépément des profils des utilisa-cans dans un système de recommandation1278. L’évaluation des systèmes109. Les systèmes de recommandationen e-commerce 13410. 工业生产和SID 139推荐系统结论149第四部分:案例研究:IMIST 150目录SR的概念和修改........................................................................Chapitre 1:Présentation de......................................................................................................................导言. 1511. Présentation du contexte et ducorpus...................................................................................................2. 摩洛哥科学技术信息研究所现行文献系统............................................................................................................................................................. 1543. Le système intégré de gestion de bibliothèque au seinde l'IMIST 156结论158Chapitre 2:La donnée et..........................................................................................................................导言. 1601. 对现有药品的利用:关于IMIST 160药品使用情况的一般调查........................................................2. Vers une personnalisation des catalogues en utilisantles données 1633. Les besoins formules 1644. L’objectif de la5. 信息服务推荐系统的改进documentaire:constatset orientations 165结论168Chapitre 3:Conceptionet modélisation第三章:概念与造型169导言. 1691. Le corpus de2. La classification superviséedu corpus 1733. La“non relevance”des résultats sur le catalogueen ligne 1754. Versun modèle de système de recommandation appliqué aux servicesdocumentaires(SID)1765. L’architecture fonctionnelle du6. L’extraction de fichiers7. La transformation des données implicites en donnéesexplicites(transition)1858. Le chargement dedonnées 1869. Le nettoyage dedonnées(traitement)18710. La definition des plages denotes(traitement)18811. Le stockage sous leformat final 1911112. Le scénariode recommandation 19213. Les objectifs du modèle derecommandation proposé 19514. La description des academic intervenant dans le modèle proposé196结论197第4章:原型的设计 systèmede recommandation........................................................................... 199导言. 1991. L’architecture technique2. Un aperçusur Spark 2033. 204号建议系统原型的位置4. Le cas de..................................................................................................................................................5. Le cas de..................................................................................................................................................结论217第5章:SR提案219导言. 2191. L’évaluation hors ligne : le calcul des fonctions d’erreur2. 222方案执行时间计算3. L’évaluation en4. L’évaluation explicite des utilisateurs par结论228Limites du modèle etprototype proposés 229一般结论和展望231Publications relatives àla thèse 235附件. 249附件1:关于数据在提供给研究者的文件中的使用情况的调查表l’IMIST附件2----小型调查表recommandation 25412表格和缩写乐西格勒欧拉布雷什勒迪普门特Ajax异步JavaScript和XMLALS交替最小二乘API应用编程接口CDDDewey分类法CNIL国家自由委员会信息与desCSV逗号分隔值DC都柏林核心ETL提取变换加载FOAF朋友的朋友GAFAM谷歌、苹果、Facebook、亚马逊和微软IMIST摩洛哥技术学院l’InformationetINRA国家农业研究ISBN国际标准书号K-NNK-最近邻LOD链接开放数据Mae平均绝对误差Marc机读编目MSE均方误差NMAE归一化平均绝对误差OCLCOnline Computer Library CenterOPAC在线公共访问目录RDD弹性分布式数据集RDF资源描述框架RGPD《保护儿童总规则》13RMSE均方根误差RTB实时竞价Sid文件信息服务sigB图书馆综合管理系统SKOS简单知识组织系统Sr推荐制度TDM文本和数据挖掘UMAE用户平均绝对误差VIAF虚拟国际权威文件14一览表表1:文化产业中的消费者的比较.............................................................................................表2:在文化产业中最佳利用数据的方法.................................................................................................................................................. 66表3:信息文件服务利用的数据类型.................................................................................................................................................. 69表4:Les fonctions remplies par un cataloguedocumentaire augmenté 82表5:基于内容的建议的优点和缺点106表6:基于协作过滤的建议的优点和...............缺点108表7:计算物体之间相似性的方法(物品/物品)115表8:使用中的相似性计算方法117表9:建议系统中使用的données类型120Tableau 10:Spotify和Netflix推荐系统服务示例。122表11:Spotify上的术语列表,通过语言的自动训练.....................................................................................................................124表12:某些数字书目推荐系统的比较147表13:某些数字书目推荐系统与设想原型的比较167表14:执行关于SIGB PMB 170 OPAC使用情况的统计数据...........................................表15:杜威172分类法的分类表16:按照CDD 175类对IMIST的OPAC的使用情况进行重新划分................................表17:表18:Spark et Mahout的图书馆比较表19:剥削者虚构的形式187表20:La definition des notations correspondant aux paramètres des données logrecueillis188表21:Extrait du fictionalobtenu après la conversion des données en notations explicites................................................................................................................................................ 189Tableau 22:La presentation dufiction final 192表23:Les données relatives aux profils servant au testdu prototype 206表24:估值功能的价值221表25:执行Spark建议脚本期间的测试值................................................................................................................................................ 223表26:比较.............................................................................................................................15数字表图1:图2:2003-2013年欧洲证券和非证券收入35图3:文化产品在欧洲公民活动中的地位36图4:Le bigdata culturel 38Figure 5:Le modèle de Data journalisme àtrois compétences图6:数据新闻的新业务模式图7:图8:图9:La recherche de relationship entre deux personnes sur le portail finlandais Kulttuurisampo.................................................................................................................................................. 78图10:马克斯·恩斯特.................................................................................................................................................. 79图11:Le lien vers le texte intégral..........................................................................................图12:.................................................................................................................................................. 84图13:La visualisation des données sur la plateforme «Prévu »图14:项目计数器93的Figure 15:la présentation des recommandations sur laplatform Netflix 125图16:La représentation sous forme de acumme...................................................................图17:Le modèle de données de la phase de collectede données 129图18:Le modèle de traitement et de représentationdes profils 130图19:电子商务建议程序136图20:ACM数字图书馆的推荐140图21:.....................................................................................................................................图22:Figure 23:............................................................................................................................图24:Le service de recommandation bX implémenté sur une recherche desarticlesscientifiques.................................................................................................................图25:图26:由IMIST提供的产品和服务图27:IMIST研究信息的过程155图28:La page de recherche sur le catalogue en ligne du SIGB PMB,les résultatssontorganiséspar page158图29:SIGB PMB 171 OPAC访问名称相关16图30:Un extrait du fictiondérivé des données log implicites relatives aux préfétédes500utilisaactions de图31:Le nombre d'utilisaintéressés selon les classes CDD surl'OPAC IMIST 174图32:Une vue globale du modèle derecommandation proposé 178图33:基于ALS 182的图34:Le processsus de recommandation à travers lemodèle proposé 184图35:Le processsus de transformation de données implicites en scores 186图36:La structure des fichiers de test CSV(documentset évaluations)190图37:Le scénario de recommandation proposé àtravers图38:使用统一建模语言(UML)的用例列表197图39:La machine virtuelle créée sous le logiciel « Oracle VMVirtualBox » 200图40:................................................................................................................................................ 201Figure 41:Les fichiers图42:图43:图44:Le fonctionnement du système de recommandation envisagé:cas...........................图45:图46:Le chargement des données par lelangage Scala 208图47:La création du modèle par lelangage Scala 209图48:Figure 49:Les recommandations généréesdepuis Spark 211图50:Le lNavisphere de la requête par unutilisateur authentifié 212图51:La présentation des recommandations à unutilisateur authentifié 213图52:推荐系统的功能:匿名使用情况................................................................................................................................................ 214Figure 53:Les résultats de recherche pour le cas d'un utilisateur anonyme sur « Big data»215Figure 54:Chargement des données par Scala pour calculerla similarité216图55:相似度计算脚本216图56:La présentation des recommandations pour unutilisateur anonyme 217图57:L'algorithme图58:系统评估方法的价值222图59:图60:Les feedbacks des utilisaapar rapport à la relevance desrecommandations 22717附件清单L'annexe滴度页面附件1关于数据在向研究者提供的文件中的使用情况的调查表250附件二关于建议解决方案原型使用情况的满意度调查表25418导言Notre thèse s'inscrit dans le cadre de la personnalisation de l'exérience utilisateur dans lesservices des structures documentaires.实际上,文件信息服务处(SID)的文件研究为使用者提供了一个很好的选择,考虑到可供使用的重要在分类系统的位置上放置SID,由多个细分单元组成,这些细分单元可以用于使用。此外,这些收藏品是不断发展的,在新资源的收集公共访问目录(OPAC)允许使用有效的研究,并保留部分关键词或所需的文件副本在报复中,这些目录的公众在ligne要求大量的时间为我们认为,SID的编目非常精确,并提出了基于使用者与编目互动历史的建议,例如在刺激销售的意图中,为了保证客户对类似产品和服务的经验,我们首先要建立网站交易的推荐系统该系统在20多年前就已开始运作,尤其是在电子商务领域。摩洛哥科学与技术信息研究所(IMIST)是一个专门从事科学与技术信息环境管理的机构 ,其 职能 是 促进 科学 与 技术 信息的发展Pour y parvenir, la personnalisation descatalogues en ligne par le biais19在1990年,国际和多学科工作组DELOS/NSF1在一个委员会中对数字图书馆的技术开发进行了研究,特别是对个性化系
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- BGP协议首选值(PrefVal)属性与模拟组网实验
- C#实现VS***单元测试coverage文件转xml工具
- NX二次开发:UF_DRF_ask_weld_symbol函数详解与应用
- 从机FIFO的Verilog代码实现分析
- C语言制作键盘反应力训练游戏源代码
- 简约风格毕业论文答辩演示模板
- Qt6 QML教程:动态创建与销毁对象的示例源码解析
- NX二次开发函数介绍:UF_DRF_count_text_substring
- 获取inspect.exe:Windows桌面元素查看与自动化工具
- C语言开发的大丰收游戏源代码及论文完整展示
- 掌握NX二次开发:UF_DRF_create_3pt_cline_fbolt函数应用指南
- MobaXterm:超越Xshell的远程连接利器
- 创新手绘粉笔效果在毕业答辩中的应用
- 学生管理系统源码压缩包下载
- 深入解析NX二次开发函数UF-DRF-create-3pt-cline-fcir
- LabVIEW用户登录管理程序:注册、密码、登录与安全
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功