UMLS Explorer：探索UMLS Metathesaurus与语义网络

需积分: 25 15 浏览量更新于2024-12-28 收藏 24.43MB ZIP 举报

资源摘要信息: "UMLS-explorer" 1. UMLS概述： UMLS（统一医学语言系统，Unified Medical Language System）是由美国国家医学图书馆（National Library of Medicine, NLM）开发的一个综合性的生物医学和健康信息资源管理工具。它旨在促进不同生物医学术语之间的互操作性，帮助不同系统间的数据整合和信息检索。 2. UMLS Metathesaurus: UMLS Metathesaurus是UMLS的核心组件之一，它包含了大量的医学术语和概念，并且关联了来自不同术语系统的信息。Metathesaurus中的条目按照概念、字符串、源、以及语义类型进行组织。它包含了超过100种不同来源的术语系统数据，允许用户进行跨术语集的搜索和比较。 3. Computable Hierarchy MRHIER.RRF： MRHIER.RRF是UMLS Metathesaurus中的一种文件格式，其中包含了可计算的层次结构信息。它通常用于表述概念间的父子关系，可以帮助理解概念之间的继承和分类关系。文件中的每一个条目代表一个概念，通过特定的层次关系进行组织。 4. UMLS语义网络： UMLS语义网络是Metathesaurus的另一个组成部分，它定义了医学概念之间的语义关系，如“属于”（isa）、“功能”（function）等。语义网络对Metathesaurus进行了语义增强，让计算机能够理解不同概念之间的关系。 5. 交互式可视化脚本：在UMLS-explorer目录中，包含了一个交互式的可视化脚本，用于播放UMLS语义网络数据。这意味着用户可以通过图形化的方式观察和分析概念之间的关系，例如通过网络图来表示概念之间的连接和层次结构。 6. 数据预处理： transitive_closure.py：此脚本用于创建UMLS源词汇（如ICD10）的传递闭包。在图论中，传递闭包是一个基础概念，它扩展了有向图，使得每对顶点间都存在直接或间接的路径。在UMLS的上下文中，它可能用于发现和表示概念之间通过多级关系能到达的其他概念，这对于构建更加完备的医学概念网络是很有用的。 corpus_token.py：该脚本负责标记化语料库，并应用词干提取和词形还原等自然语言处理技术。标记化是将文本分割成单独的词汇单元（tokens）的过程，而词干提取和词形还原旨在将词汇还原到其基本形态，从而在处理文本和搜索时减少词汇的多样性，提高匹配效率。 7. Python编程语言的应用：描述中提到的脚本，如transitive_closure.py和corpus_token.py，显然是用Python编写的。Python由于其易读性和强大的库支持，在数据科学和生物信息学中变得越来越流行。其简洁的语法和大量的科学计算库（例如NumPy、SciPy、Pandas、Matplotlib等）使得Python成为处理复杂数据集和实现算法的理想选择。 8. HTML标签的使用：标签"HTML"可能是指UMLS-explorer项目中某些文档或者展示界面是使用HTML来构建的。HTML（超文本标记语言）是创建网页的基础技术，它定义了网页内容的结构和布局。通过HTML，可以创建包含文本、图片、链接和其他元素的网页，使得数据的展示更加友好和直观。 9. 压缩包子文件的文件名称列表： "UMLS-explorer-master"表明这是一个文件压缩包的名称，通常用作代码仓库的主分支名称，在Git版本控制系统中较为常见。从这个名称可以推测，文件中的内容可能是某个软件项目的源代码，其中可能包括UMLS资源的处理脚本、可视化工具以及其他必要的文档和资源。总结而言，本文件提供的信息涵盖了UMLS资源管理器的多个方面，包括UMLS Metathesaurus的层次结构数据、语义网络的交互式可视化、数据预处理脚本、以及软件开发过程中的代码组织和版本控制等。了解这些知识点对于生物信息学、医学信息学以及相关数据科学领域的研究人员和技术人员是非常重要的。

收起资源包目录

UMLS Explorer：探索UMLS Metathesaurus与语义网络（61个子文件）

CUI_to_STYs.pickle 68.99MB

semanticTypes.pickle 14KB

SAB_tree_status.txt 373KB

process_pmc.py 4KB

target.png 29KB

MRHIER_filler.py 814B

README.md 7KB

requirements.txt 283B

pico_crf_tagger.py 6KB

pico.json 2KB

SAB_info.txt 1KB

train_elmo.sh 277B

embed.py 1KB

dataset_reader.py 7KB

requirements.txt 32B

requirements.txt 24B

SAB_tree_status_verbose.txt 6.59MB

hierarchy_check_verification.ipynb 93KB

semnet_color_trees.html 3.16MB

corpus_cleaning.py 3KB

pickles.ipynb 368KB

MRHIER.ipynb 46KB

__init__.py 0B

inspect_encoder.py 4KB

elmo_htlm_reparam_hypeL1_0.5.png 47KB

loss.py 664B

STY_to_TUI.pickle 15KB

README.md 453B

__init__.py 80B

text_source.txt 747B

hyperbolic.py 3KB

elmo_hype.jsonnet 5KB

mrhier_ncbi_visualization.py 2KB

rel_freq_SRSTRE2.pickle 5KB

metamap_or_not.ipynb 351KB

elmo_htlm_reparam_mse_0.5.png 70KB

SemNetGraph_plotly2d.py 6KB

.gitignore 2KB

STY_to_CUIs.pickle 41.55MB

__init__.py 0B

setup_env.sh 152B

elmo_htlm_lstm_mse_0.5.png 25KB

wang.pdf 1.02MB

schulz.pdf 288KB

transitive_closure.py 1KB

hierarchy_check.py 2KB

ebmnlp.py 3KB

README.md 1KB

__init__.py 0B

README.md 708B

model.py 4KB

SAB_intersection.ipynb 97KB

icd10.sh 521B

process_medline.py 2KB

create_experiment.py 5KB

encoder.py 1KB

khattak.pdf 2.33MB

tree_color.pickle 17KB

train_task.sh 1010B

SemNetGraph_for_HIER.py 3KB

hyperbolic_states_processing.py 5KB

共 61 条

起飞页

粉丝: 34
资源: 4543

UMLS Explorer：探索UMLS Metathesaurus与语义网络

UMLS参考手册

uts-client:UTS API 2.0 的测试客户端（UMLS 术语服务）

ctAutocompletion:基于UMLS本体的自动完成和同义词建议

node-umls-treeify：构建基于UMLS的同义词树库

node-umls-treeify:基于统一医学语言系统 (UMLS) 元叙词的同义词树

UMLSParser:用于解析UMLS源文件的Python模块-python source file

node-MetaMap:为 UMLS 提供对 MetaMap Web API 的访问的包

基于学习注意力的知识图关系预测嵌入数据集，包含FB15k-237，kinship，NELL-995，umls，WN18RR

node-chvocab:通过消费者健康词汇表 (CHV) 将文本映射到 UMLS

umlsoapnode:通过 NodeJS 的 UMLS SOAP 访问

最新资源