没有合适的资源?快使用搜索试试~ 我知道了~
数字图书馆中的多媒体文件获取与利用
数字图书馆英俊利引用此版本:英俊利在数字图书馆中使用复杂的多媒体文档其他[cs.OH]。巴黎南大学-巴黎Xi,2013年。英语NNT:2013PA 112123。电话:00871651HAL Id:tel-00871651https://theses.hal.science/tel-008716512013年10月10日提交HAL是一个多学科的开放获取档案馆,用于存放和传播科学研究文件,无论它们是否已这些文件可能来自法国或国外的教学和研究机构,或来自公共或私人研究中心。L’archive ouverte pluridisciplinaire0多媒体文件的获取和利用Complexes dans une bibliothèque numérique巴黎大学ÉCOLE DOCTORALE:Informatique de Paris-Sud信息研究学院信息学科THESHANSE DE LA THESHANSEsoutenue le 09/07/2013par英俊Directeur de thèse:陪审团组成:Nicolas SPYRATOS法国巴黎南大学校长陪审团主席:菲利普·里戈CNAM,法国报告员:审查员:Dominique LAURENTPeter STANCHEVChantal REYNAUDFrancois GOASDOUE法国塞尔吉-蓬塔大学教授法国凯特林大学教授法国巴黎南大学教授法国巴黎南大学MdC Habilite11. Introduction et état de l'artIl existe de nombreuses definitions de la bibliothèque numérique. Chaque definition offre uneperspective différente sur le concept.除此之外,我们还考虑了一个数字图书馆,就像一个信息系统,该系统开发了数字资源的储存,并提供了获取和操作资源的服务[1][2]。Resskitigame numérique d'objets multitimédias simples ( textes numériques , images , vidéos etautres)à des objets composites de toutes sortes.Les services de base attendus d'une bibliothèque numérique devraient permettre aux utilisaqutuerd'effectiver les tâches suivantes:在标识符的分配意义上的利益来源标识符;accéderà une resource;décrireune resource d'intérêt selon un vocabulaire;creerune resource numérique dumbered en ré-utilisant les resources existantes;découvrirdes ressources d'intérêt en fonesty de leurs métadonnées.在考虑和考虑建立一个负责提供服务的数字图书馆系统时,必须使用一种捐赠模式和一种所需语言。在这方面,我们的出发点是我们在欧洲三大项目框架内进行研究的出发点2002-2004年:SeLeNe:Self Réseaux d 'Antitissage en ligne(电子邮件:IST-2001-39045)(http://www.dcs.bbk.ac.uk/selene/)。2004-2007 年 : FP 6 DELOS 数 字 图 书 馆 卓 越 网 络 ( 网 址 : G 038 -507618 )(http://www.delos.info/partners.html)2010-2012年项目资产:为欧洲数字图书馆研究先进服务和改进技术解决方案(CIP-ICTPSP-2009-3,第250527号补助协议)(http://www.assets4europeana.eu/)Les aspects théoriques du modèle et le langage de requêtes ont été présentées dans [3][4].L'objectif de cette thèse est double:1/考虑到理论模式的可行性,并将模式和所需语言的形式合理化。告诉我校长的目标。2为研究一项重要的共同体服务、使人们了解如何再利用的理论模式作出贡献。2这种理论模式在网络上得到了启发,网络构成了一个普遍接受的数字图书馆概念和服务的坚实基础。此外,资源概念被引入到Web环境中,并构成Web架构的角度支柱[5],这是一个资源的标识和表示概念。事实上,今天,Web prend负责资源标识(通过URI)、访问(通过服务器Web)、创建(通过HTML格式的文档)和查询(通过搜索引擎)。然而,所有的URL est utilisée comme un identifiant,l'accès et l'identification sont brouilléespar le Web,comme l'URL fournit à la fois de la référence à la resource et un chemin d'accès.此外,重要的是,Web实际架构中缺少一个数字书目基础概念,这是一个资源描述概念。Web语义1包括用于解释性描述的语言,以及对这些描述进行询问的机制,但这些语言和询问机制在Web的上下文中并没有什么重要的作用,因为在Web的体系结构中,它们并不依赖于资源和描述。Notre modèle tente de remédier à ces inconvenients par:(a) faire une distinction claire entre l'identification d'une resource et l'accès;(b) fournir un moyen de descriptions de modélisation des resources indépendantes;(c) 有关说明文件(d) Fournir un langage de requête pour la découverte de resources en fonesty de leursdescriptions.在我们的模式中,我们利用关系来解释一个书目中的基本数据,并根据某些公理来支持一个首要秩序的理论,以获得数据中隐含的信息。逻辑的选择是由一般性原则决定的,它包含了所有技术约束的自由。为了通过我们的研究和实践应用的适应性来证明RDF模型的可行性,我们提供了一个完整的RDF模型翻译[6]和SPARQL语言[7]。RDF的选择取决于它在数字图书馆和网络系统中是否具有通用的语言代表性。在这种情况下,就像我们所看到的那样,这一原则的目的是为了理解和理解一种模式,这种模式是我们所理解的1SemanticWeb - W3C。www.w3.org/standards/semanticweb/3去 研 究 。 Un système de bibliothèque numérique RDF et SPARQL-fondé a été décampé enutilisant les technologies Java,une API Java pour RDF appelé Jena2 et le cadre de Google WebToolkit3. L'architecture du système est constitué de:Une couche de stockagequi comprend un stockage pour stoker les resources numériques àl'intérieur de la bibliothèque numérique,une table de référence pour stoker et gérer desassociations entre des identificateurs et des resources numériques,et une base de meta-données pour stoker les metadonnées et le contenu des resources numériques. Dans latoucheneuvre effective,les faits trip RDF formats sont stockés dans un magasin RDF.一个包含应用程序逻辑的逻辑的逻辑座位。Il se compose de quadrant modules debase comme suit:三重操作模块、请求赋值模块、翻译模块、持久性管理模块。Une couche de servicequi commande la communication entre la logique de client,et lalogique de serveur,par l'exposition d'un ensemble de services(exploitation)pour lescomposants côté client.同样,操纵服务包括创造、编辑、日常工作和压制新闻,也包括要求服务的基础方法,以便对要求进行评估。Une utilisateurqui permet à l'utilisateur de la bibliothèque numérique:recherche et/ouparcourir les collections de resources; voir les enregistrations de metétadonnées quidécrivent une resource; créer,lire,mettre à jour et suprprimer des metétadonnées desresources , ainsi que des requêtes conjonctives express dans notre langage de requêtepour découvrir des informations à partir de la bibliothèque numérique.在此基础上,系统将进行本地化、测试和调试,并部署在Google App Engine(GAE)4上。在未来,他可能会倾向于建立一个对部分书目进行数字管理的系统。2. Un modèle de données pour lesbibliothèquesnumériques因此,我们认为,一个数字图书馆就像一个由两个要素组成的信息系统:(a)数字图书馆杂志(多个一般性复合物)的数字资源集合,以及(b)数字图书馆中储存的数字资源的知识,2阿帕奇耶拿。jena.apache.org/3Google Web Toolkit(GWT)。developers.google.com/web-toolkit/4Google App Engine. developers.google.com/appengine/4探索数字图书馆的资源,但与数字图书馆的功能有关。这两个学生可能会缺席数字图书馆。同样,可以考虑建立一个数字图书馆,包括所有数字资源,而不需要登记任何关于资源的知识。一本个人照片集,包含一张没有注释的数字照片,是一本电子书的副本--即使是一本书,也可以选择使用者与她一起使用,它由图像组成。此外,还可以考虑一个数字图书馆,它包含了对没有任何资源的库存资源的了解。值得注意的是,欧洲第五大数字图书馆,即欧洲数字图书馆,它(在实际形式上)登记了多种出版物。在这一点上,我们认为有一个关于森林、数字资源和关于非库存资源的知识的图书馆。在了解了资源之后,我们需要更多的钱来参考。这些方法是鉴定,我们呼吁鉴定数字资源,就像在一个数字图书馆中检索其他资源一样。“Un identifiant incarne l'informationnécessaire pour buffer ce qui est identifié à partir de toutes les autres choses dans son champ d'identification”[8].但要注意的是,一个身份不能在同一时间内重复两种不同的资源。Ceci met en place unefonterior à partir d'identifiants aux resources visées.我们把这个基金会称为数字图书馆参考基金会。此外,所有参考文献协会都存在于数字图书馆中。Nous nous référons à l'ensembledes associations de référence stockées que le tableau de référence de la bibliothèque numérique.参考文献表是由一个数字书目组成的两个主要书目。其他作曲家是作曲家的基础。数字图书馆的方法基础包括两种类型的资源利用者可以利用的知识:方法和资源内容。Les metadonnées d'une resource consiste en une ou plusieurs descriptions de la resource.Le contenu d'une resource consiste en une or plusieurs autres resources whi composent laresource.www.europeana.eu5在完成这些任务后,数字图书馆将构成、储存和提供关于申请冠军资源的某些名称的信息。我们对这些信息的来源并不感兴趣,评论它是被捕获的,或者评论它到达了一个数字图书馆。我们不需要对它的信息进行修改,也不需要对它的形式进行描述。另外,我们对资源的描述并不完全是关联的,而是一种独特的机制,用于对资源的标识进行关联描述。在我们的模型中,我们描述了两种关系的模型:描述Cl(d,s,c),它解释了c类在描述d上的出现,描述Pr(d,s,p,i),它解释了p,i的一对属性值(p,i)的出现,或描述Pr(d,s,p,i),它解释了c类在描述d上的出现,或描述Pr(d,s,p,i),它解释了c类在描述d上的出现。因此,资源与描述的关联是通过描述(d,i)的关系来实现的,描述(d,i)的关系解释了通过i来识别资源的描述的事实。我们说,在一个利用其他关系的方案中,我们的认识是平等的。在信息学中,“contenu”这个词的含义有很多不同。在此工作中,根据一个资源的内容,我们将构成一个应用点的其他资源的集合,其中资源称为一个资源部分。另一方面,一本书的开头部分(你就像一个整体的资源)可以被认为是这本书的一部分。同样,在绘画展览会中的画面也可以被认为是展览会的一部分。所有的资源都不能用于聚会。我们认为,阶级、财产、方案和描述不可能包含政党,也不存在其他来源的政党。我们将所有其他类型的资源称为可组合资源。请注意,这些物质资源也是可组合的(通过识别)。在我们的模型中,该内容由关系(i,j)的部分表示,该关系(i,j)解释了我识别一个可组合的资源的事实,该可组合的资源是由j识别的。3. 丰德科技在我们的工作中,我们利用标准和技术来实现应用的可持续性:AJAX是Web 2.0中的一项技术。La technologie Java Servlet,la solution Java pour fournir des services basés sur le Web,qui est utilisé pour le dépement de notre application.6RDF,SPARQL et jour SPARQL qui definissent le modèle de données,un langage derequête et de son extension pour le Web sémantique,respectivement.Triplestore,une base de données spécialement conçu pour le stockage et la récupération deResource Description Framework metétadonnées(RDF).Jena,un framework Java pour créer des applications Web sémantique.Google Web Toolkit,qui a été utilisé pour implémenter le côté client du système.4. Mise en Üuvre du modèle basé sur RDF et SPARQL现在,我们采用了一种逻辑方法来改进一种数字图书馆。这一选择在没有考虑技术限制的情况下,通过对书目数字基础概念的解释而获得了自由。然而,我们工作的目的是促进数字图书馆技术的发展。因此,我们认为这款车型可能会出现在我们的作品中。我们建议建立一个数字图书馆,由两部分组成,参考表和方法基础。关于参考表的位置问题,我们认为,在剥削制度下,特别是在小说制度下,这种进入是普遍的保证。因此,我们不必考虑如何维护参考表和腰部。相反,我们把注意力集中在基础结构上,考虑两个不同的场景。第一阶段的内容包括读者关系基础和读者登记系统的读者中间书目的计算。Interrogation peut être implémentée en associant notre langage de requête SQL pour,etd'exécuter les requêtes résultant sur la base de données relationnelle.这是一个简单的概念(就像方法的基础是关系的基础)。第二个场景包括RDF图表形式的数据库的所有工作,并利用RDF推理机计算数字书目 的 完 成 情 况 。 Interrogation peut être implémentée en associant notre langaged'interrogation SPARQL pour.这是一个非常独特的概念,因为它是我们的RDF模型的关系和公理的核心。该方案利用了关系良好的技术,并包括SQL优化它保证了进化和鲁棒性。乐7第二章详细说明RDF是数字图书馆和网络图书馆普遍接受的一种语言。虽然RDF没有再次证明关系技术的成熟,但RDF图形管理的方法在10月份得到了加强和发展,并证明了技术成熟的一个新水平6。Cesoutils comprennent des systèmes de la persistance de grands graphes RDF dans le stockagesecondaire(dite magasins triples),mostly d'inférence RDF et les mostly de treitement desrequêtes optimisées pour SPARQL7.这两部电影的选择取决于具体的背景。正如我们所观察到的那样,关系模式的翻译很简单,但在RDF模式方面的翻译却非常出色。然而,在这方面,我们选择第二个方案的理由是确保RDF应用程序之间的互操作性的能力以及对celui-ci资源网络自动处理的能力。5. La pouchen euvre effective du modèle为了考察理论模型的可行性,我们提出并研究了一个原型,这个原型是理论模型和语言需求的一种形式。Notre prototype illustre le modèle théorique basé sur les aspects suivants:Il prend en charge différents types d'identificateurs du modèle在描述资源模式时,应注意模式间的整体关系Il prend en charge différents types de variables du langage de requête他负责请求语言中简单的连接请求在实践方面,我们的原型支持基于RDF和SPARQL的模型的扩展:它代表了两种形式的模式识别:基于特定模式的URI的原始形式和公式Il traduisant représentés par les relations dans le modèle en triplets RDF pour les stockerdans le magasin RDF,ainsi que,récupérer ces données à partir du magasin RDF pourles afficher on la lecture/l'écriture des interfaces6例如,见:www.w3.org/2001/sw/wiki/Tools7例esw.w3.org/SparqlImplementations8Il prend en charge la transduction des requêtes conjonctives simples du langage derequête en SPARQL et les exécuter sur le store RDF.在法律中,返回的结果是我们的原型的共同鉴定结果。然而,我们的原型只是要求结合,但它的接口不允许有效地利用原子的要求。我们的原型的参照物的表,它把系统的标识符和资源联系起来,这是静态的。此外,尽管使用URI作为模式的标识符可以使书目数字化“一致”,但我们的原型并不是基于公理规则来确保书目数字化的完整性。Notre système peut être utilisé par les fournisseurs de contenus de gérer la connaissance desresources whi sont soit soit stockés dans la bibliothèque numérique,or résident à l'extérieur dela bibliothèque numérique,il peut également être utilisé par l'utilisé final par l'utilisateur parl'utilisé for l'interrogation de la connaissance de la bibliothèque numérique.构建一个应用程序Web,该系统采用Google Web Toolkit(GWT)的核心,该核心可以促进应用程序Web的开发,实现服务器端逻辑操作,也可以实现客户端操作。客户端逻辑在导航Web中的作用是执行本地用户的协调,而服务器逻辑在应用程序中的作用是服务器Web。该系统具有本地化、测试和调试功能,并使用了Google App Engine(GAE)。该系统提供了所有的功能,这些功能在工作开始时需要,并在这一过程中详细说明。在未来,该系统可能会发展成为一个整体的书目管理系统。6. 对通过再利用实现可持续发展的贡献通过再利用产生内容是一个创造、储存和再利用复合文件的过程。如果需要的话,这些文件可以在纸张格式中得到认可。但是,这项工作可能包括建立一个文件管理系统,以便我们的数字图书馆。因此,我们的研究不正确地指出了一种在虚拟文件管理干部中使用的管理方式[9][10]。在外部,算法和逻辑的外部性也需要进行研究和学习,以支持欧洲的物质化。9这一节介绍了我们对回收者产生内容的贡献。这是我们为完成这一点所要求的模式和语言而进行的理论上的有效工作。Son incorporation in le système miss en place is laissée auxtravaux futurs.Un utilisateur crée un nouveau document à partir de zéro ou en modifiant et en réutilisant lesdocuments existants; dans le premier cas,le document est appelé atomique alors que dans lesecond composite.在我们的理解中,我们认为一份文件是一个树状结构,在一份复合文件中,一份原子文件是一份复合文件,一份原子文件(这是一份内部或外部的文件)对内容进行描述。Un document composite is un document virtuel en ce qu 'il décrit simplement lecontenu des documents du composant et la façon dont ils sont structurés de manière à compenserle document composite.在此背景下,我们讨论了界面的概念和实现,以及算法和逻辑的渗透,以便利用一个数字图书馆:1/ Choisir un ensemble de n documents numériques à partir de la bibliothèque et/ou à sonbureau,par twople,dd2,descr2>,因此, iest l'identifiant du document,et descri est la description du document(c'est dire unensemble de termes d'une taxonomie).2/ Structure des documents dans une hierarchie avec le document dd,descr> composite en tantque root3/ En deduire la description documents composed descr de l'descriptions descr1,descr2,..,组成文件说明4/ Générer la table des matières et l'index du document composite5/ Stocker le document dd,descr> composite dans la bibliothèque numérique6/ Matérialiser le document composite à volonté (par planet produire une“version papier”decelui-ci)请注意,在两个不同的时间点上的两种材料化可能会产生不同的纸质版本,因此,可能会根据时间的不同对文件的组成进行更改。我们了解用于生成材料表和虚拟复合文档索引的算法。Nos algorithmes décrivent commenton peut dériver une“version10papier”d'un document composite virtual , un process que nous appelons“matérialisation”dudocument composite virtual.7. 结论和未来工作Inspiré par l'architecture du Web , notre équipe de recherche a mis au point un modèle dedonnées pour les bibliothèques numériques basées sur trois concepts fondamentaux :identifiant,resources et description. Identificateurs dessignent acquisition les resources et lesdescripent les propriétés des resources.我们的模式基础的三个概念与Web架构的基本概念相似,它们分别是:URI、资源和表示。Le modèle généralise l'architecture du Web dans trois directions différentes:(a) 所有身份者的身份不是事先确定的,(b) l'ensemble des identificateurs change dynamiquement au cours du temps,et(c) 一个描述不能包括一个资源的代表,但要包括其他所有权。此外,在模型中,描述不确定资源的独立性,而在Web中则严格依赖于资源和表示。虽然在Web架构中没有使用一个资源的表示和另一个资源的表示,但这种功能在Web中并不明显。在模型中,这些关系被用来解释数字图书馆中的基本库存情况,模型被正式化为第一秩序的理论。理论的公理包含了现代概念的形式,同时也包含了一个隐含在一个数字图书馆中的认识的定义。该理论是在一项关于知识的登记方案中的一项工作,该方案包括一个数字图书馆,允许完成隐含知识的数字图书馆。Pour démontrer la relevance du modèle pour des applications pratiques , nous offrons unetransduction complète du modèle de RDF et le langage de requêtes SPARQL pour.此外,我们还介绍了RDFDL的词汇表,它是RDFS词汇表的一部分,其中包含了一些新的符号,这些符号是在RDF中建立一个数字图书馆所必需的。为了考察理论模型的可行性,我们提出并研究了一个原型,这个原型是理论模型和语言需求的一种形式。Construit comme une application web,le système adopte GWT,le cadre deGoogle Web Toolkit qui facilite le11décampement d' applications Web comme des applications de bureau,d'effectuer des opérationsde logique métier côté serveur,ainsi que sur le côté client.客户端逻辑在导航Web中的作用是执行本地用户的协调,而服务器逻辑在应用程序中的作用是服务器Web。Notre application est utilisée essentiellement pour faciliter la création,la récupération,dépourà jour et de suppression des prédicats par les fournisseurs de contenu et de fournir aux utilisa-finaux des services de base pour l'évaluation des requêtes conjonctives. Sa fonctionnalitéprincipale comprend les opérations suivantes:-Créer/supprimer/modifier/visualiser des prédicats-Métadonnées de requête dans la base de Métadonnées-Créer/supprimer/modifier/gérer les utilisação在完成这些工作之后,系统将在Google App Engine(GAE)上进行本地化、测试和调试。在未来,他可能会倾向于建立一个对部分书目进行数字管理的系统。在我们的实施过程中,我们使用URI作为标识符,而我们不存在一致性问题。总之,如果我们想利用一般的数字对象,就像识别一样,我们就需要考虑验证数字书目一致性的算法。我们应用的另一个方面需要其他工作,但还不够详尽。一个书目的数字是完整的,它以三个基本要求为基础:它包括所有通过使用而明确提供的知识,它包括所有模型的公理,它不包括满足两个前提条件的知识的其他知识。为了确保一个数字图书馆的完整性,我们必须在数字图书馆中放置一个影响因素,它负责所有模式的公理,并将其应用于新知识基础的一般系统中,这些公理和知识存在于数字图书馆中。12雷费什[1]L.坎坎达湾Castelli,N. Ferro,Y.约安诺沃湾科特里卡角Meghini,P. Pagano,S.罗斯,D. Soergel,M. Agosti,M. Dobreva,V. Katifori,H.舒尔特DELOS数字图书馆参考模型-数字图书馆的基础。Delos数字图书馆卓越网络,2007年。[2]L.坎坎达湾Castelli,Y.约安诺沃湾Koutrika,P. Pagano,S.罗斯,H.- J. Schek,H.Schuldt,和C.灭霸建立数字图书馆的基础:Delos宣言。D-Lib Magazine,Vol. 13No. 3/4,March/April 2007.[3]Carlo Meghini,Nicolas Spyratos,Tsuyoshi Sugibuchi,and Jitao Yang.数字图书馆的一个模型及其到RDF的转换。已提交出版。[4]Carlo Meghini,Nicolas Spyratos,and Jitao Yang.数字图书馆的数据模型。《国际数字图书馆杂志》,第11卷第1期,第41 -56页,2010年3月。[5]伊恩·雅各布斯和诺曼·沃尔什万维网架构,第一卷。W3C推荐,WWW联盟,2004年12月。 http://www.w3.org/TR/webarch/。[6]格雷厄姆·克莱恩和杰里米·卡罗尔。资源描述框架(RDF):概念和抽象语法。W3C推荐标准,WWW联盟,2004年2月。http://www.w3.org/TR/rdf-concepts/上下载。[7]埃里克·普鲁德霍姆和安迪·西伯恩。用于RDF的SPARQL查询语言W3C推荐标准,2008年1月。http://www.w3.org/TR/rdf-sparql-query/上下载。[8]RFC3986-统一资源标识符(URI):通用URI。http://tools.ietf.org/html/rfc3986/。[9]Rigaux,P.,斯皮拉托斯,N.:分布式仓库中文档检索的元数据推断。In:Maher,M.J.(ed.)亚洲2004年。LNCS,vol. 3321,pp. 418-436[10] Tsuyoshi Sugibuchi,Ly Anh Tuan,Nicolas Spyratos:
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- GO婚礼设计创业计划:技术驱动的婚庆服务
- 微信行业发展现状及未来发展趋势分析
- 信息技术在教育中的融合与应用策略
- 微信小程序设计规范:友好、清晰的用户体验指南
- 联鼎医疗:三级甲等医院全面容灾备份方案设计
- 构建数据指标体系:电商、社区、金融APP案例分析
- 信息技术:六年级学生制作多媒体配乐古诗教程
- 六年级学生PowerPoint音乐动画实战:制作配乐古诗演示
- 信息技术教学设计:特点与策略
- Word中制作课程表:信息技术教学设计
- Word教学:制作课程表,掌握表格基础知识
- 信息技术教研活动年度总结与成果
- 香格里拉旅游网设计解读:机遇与挑战并存
- 助理电子商务师模拟试题:设计与技术详解
- 计算机网络技术专业教学资源库建设与深圳IT产业结合
- 微信小程序开发:网络与媒体API详解
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功