Graphing-ChartEx: 极致视觉化中世纪宪章信息提取
需积分: 5 194 浏览量
更新于2024-11-20
收藏 995KB ZIP 举报
资源摘要信息:"Graphing-ChartEx:绘制中世纪宪章"
Graphing-ChartEx 是一个由挑战赛资助的国际项目,其核心目的是通过自然语言处理(NLP)和数据挖掘(DM)技术,从数字化的中世纪宪章中提取实体和关系信息。项目集合了来自不同领域的专家,包括历史学家、自然语言处理和数据挖掘的研究人员,以及人机交互(HCI)专家,共同探索如何更有效地利用信息技术解读历史文献。
项目的实施地点分布在英国约克、多伦多、华盛顿和哥伦比亚等地,涉及的专业团队包括英国布莱顿的自然语言处理、莱顿的数据挖掘和约克的人机交互研究小组。项目的资金支持为期18个月,期间这些专家团队将合作开发新技术,以便更精确地识别和提取宪章文本中的关键信息。
中世纪宪章作为重要的历史文献,记录了当时的法律、土地所有权、税收、社会结构等多方面的信息。数字化这些宪章对于保存历史资料和辅助历史研究具有重要意义。为了构建NLP组件的训练语料库,历史学家创新性地标记了来自多种来源的中世纪宪章的主体。通过这种方式,数据挖掘组件得以在语料库中发现不同实体间的相似度。
在项目成果方面,Graphing-ChartEx 包含了一系列实验和软件工具,旨在将中世纪宪章的数据转换为Linked Open Data范式内的RDF三元组。Linked Open Data( LOD )是一种开放的数据发布范式,它鼓励将不同数据集链接起来,形成一个庞大的全球性知识图谱。而RDF(Resource Description Framework)三元组是构成LOD的基本数据结构,它由主体、谓词和客体组成,用于描述资源之间的关系。
项目中提到的软件工具"chartexOldSite",是一个实验平台,它基于brat数据输出进行了一系列的实验,旨在通过转换数据格式,将宪章数据整合到一个可公开访问的三重存储中。虽然这些文件不适用于生产环境,但对于理解如何实现数据的转换和开放共享提供了有价值的记录和经验。
此外,项目还涉及到一系列关键技术,包括Python编程语言,它在数据处理和机器学习领域应用广泛;自然语言处理(NLP),它涉及计算机理解和分析人类语言;数据挖掘(DM),它关注从大量数据中提取有用信息;RDF数据可视化,它通过图形化界面展示数据关系,以便人们更直观地理解数据;brat注释工具,它是一种用于文本标注的网络应用,常用于NLP领域的数据标注工作;以及AllegroGraph,这是一种高性能、可扩展的图数据库,常用于存储和查询大量复杂的数据。
总之,Graphing-ChartEx 项目不仅具有重要的历史意义,还在信息技术领域,特别是在NLP和数据挖掘领域有着创新的应用,为未来的数字人文学科研究和信息开放共享提供了新的工具和思路。
2021-05-31 上传
123 浏览量
2021-07-06 上传
107 浏览量
2021-04-02 上传
147 浏览量
157 浏览量
105 浏览量
142 浏览量
哈奇明
- 粉丝: 36
- 资源: 4771
最新资源
- 基于 S7-300,400 CPU 集成 PN 接口 Modbus TCP 通讯快速入门(更新版本V2.6).zip
- MongoDBNotes:此存储库包含Web开发人员和数据库爱好者以及我的MongoDB NoSQL数据库初学者的注释。 此仓库涉及MongoDB大学M001课程
- OpenPMS-开源
- 杰奇1.7解密.zip_adclick.php_奇杰_杰奇_杰奇1.7解密_杰奇解密
- 单片机收银机C52(加减乘除,小数点运算,撤销,报警功能)
- 求职者
- my-portfolio:我的投资组合
- MyMaps-开源
- corenlp-java-server:斯坦福CoreNLP解析器的简单Java REST API包装器
- UU Point(优优知识库) v1.0.3
- speaking-grandma-prework
- pg_auto_failover:Postgres扩展和服务,用于自动故障转移和高可用性
- GPUCloth:使用CUDA对Blender 2.93.x进行布料模拟
- layaair2-SG:layabox2.0.2 的完整游戏项目,可以用来学习!主要是场景中的GPU内存管理,DEMO
- Md5Checker v3.3 官方中文版
- cjosn解析函数库.7z