Python实现中文医疗命名实体识别源码完整下载

版权申诉

5星 · 超过95%的资源 194 浏览量更新于2024-10-27 3 收藏 3.39MB ZIP 举报

该系统的开发是基于RoBERTa-WWM预训练模型、BiLSTM（双向长短时记忆网络）、CRF（条件随机场）以及汉字图像处理技术，并采用了动态融合机制。该项目使用了爱爱医等医学网站的病例文本作为训练数据集，构建了一个能够处理中文医学命名实体识别的深度学习模型。系统特点和技术细节如下： 1. RoBERTa-WWM预训练模型：RoBERTa（A Robustly Optimized BERT Pretraining Approach）是一种基于BERT（Bidirectional Encoder Representations from Transformers）的预训练语言表示模型，其在多个NLP任务上取得了突破性的成果。WWM（Whole Word Masking）是一种在预训练时对整个词进行遮蔽的技术，有助于模型更好地理解中文的词语边界。WWM版本的RoBERTa进一步优化了中文的处理性能。 2. BiLSTM结构：双向长短时记忆网络（BiLSTM）是一种能够捕捉文本序列前后文信息的循环神经网络（RNN）变体。BiLSTM不仅可以处理文本序列的依赖关系，还可以通过其双向结构同时利用过去和未来的信息，对于序列标注任务来说，这是一个非常有用的特性。 3. CRF层：条件随机场（CRF）是一种常用于序列标注的判别式模型。CRF能够考虑到输出标签序列的整体概率，而不是像隐马尔可夫模型（HMM）那样仅考虑单个标签。它在处理标签依赖关系和序列最优路径问题时表现更为出色。 4. 汉字图像特征：将汉字图像特征集成到文本模型中，可以提供额外的信息，有助于改善模型对医学术语的识别能力，尤其是在处理具有特殊符号或复杂形态的汉字时。 5. 动态融合机制：动态融合是一种整合多种特征和模型输出的方法。在该医学命名实体识别系统中，动态融合机制可以综合不同模型或特征层的信息，从而得到更加准确的实体识别结果。 6. 训练语料：系统利用爱爱医等医学网站的病例文本作为训练数据，这些数据提供了丰富的医学实体样本，有助于训练出更加精准的中文医学命名实体识别模型。 7. 应用场景：该系统可以应用于医疗文档自动化处理、电子病历信息抽取、医学知识库构建、辅助诊断等众多医疗健康领域。 8. 开源资源：该资源包提供了完整的源码下载，包括模型训练、数据预处理、模型评估和实体抽取等模块，便于用户直接下载并使用。这为教学、研究和实际应用提供了极大的便利。标签说明了该资源适用于Python编程语言的学习者，特别是在中文自然语言处理（NLP）、医学信息处理以及命名实体识别（NER）领域。同时，这也是一个适合期末大作业或课程设计的项目，可以作为学习和实践深度学习技术、自然语言处理和机器学习的实例。" 文件名称列表表明，该资源包的主文件或主要模块可能被命名为"main"或"master"，这暗示了项目的入口文件或主要功能模块可能被设计成名为"main.py"或"master.py"的Python脚本。用户可以通过查看和运行这些脚本来理解和使用该系统的功能。

资源目录

收起资源包目录

Python实现中文医疗命名实体识别源码完整下载（86个子文件）

common_utils.py 2KB

疾病诊断.tsv 910KB

run_server.py 3KB

statistics_extraction_visualization.py 8KB

image_word_vec_encoder.cpython-39.pyc 3KB

char_word_vec_encoder.py 3KB

stroke_word_vec_encoder.py 1KB

char_word_vec_model.cpython-39.pyc 2KB

ISSUE_TEMPLATE.zh-CN.md 79B

collate_function.cpython-39.pyc 3KB

subtask1_training_part1.txt 1.02MB

dataset.cpython-39.pyc 6KB

readme.md 66B

.keep 0B

train_plain.txt 123KB

handy_functions.py 358B

convert_aiaiyi.py 3KB

症状体征.tsv 25KB

train_word2vec.py 469B

wubi_word_vec_encoder.py 1KB

subtask1_training_part2.txt 1.38MB

ner_server.py 1KB

实体表.txt 195B

knowlege_injection_encoder.cpython-39.pyc 4KB

临床检查.tsv 50KB

ner_model.py 13KB

word_vec_encoder_set.py 2KB

handian_data.py 3KB

.keep 0B

glyph_word_vec_encoder.cpython-39.pyc 3KB

ner_model.cpython-39.pyc 8KB

predictor.cpython-39.pyc 6KB

ner.cpython-39.pyc 3KB

entity_replenish.cpython-39.pyc 2KB

prerocessor.cpython-39.pyc 5KB

preprocessor.cpython-39.pyc 12KB

dataset.py 6KB

trainer.cpython-39.pyc 14KB

缺失实体映射表.txt 143B

predict.py 4KB

test_plain.txt 3.77MB

mini_sequence_conv_encoder.cpython-39.pyc 3KB

glyphsimple_word_vec_encoder.py 3KB

ner_case.cpython-310.pyc 6KB

mini_sequence_conv_encoder.py 4KB

preprocessor.py 19KB

collate_function.py 4KB

zhengma_word_vec_encoder.py 1KB

ner_case.cpython-39.pyc 6KB

entity_replenish.py 3KB

医疗器械.tsv 25KB

glyph_word_vec_encoder.py 4KB

word_vec_encoder_base.py 3KB

解剖部位.tsv 76KB

手术操作.tsv 300KB

common_utils.cpython-39.pyc 2KB

ner_model.cpython-310.pyc 9KB

手册.docx 44KB

test_plain.txt 51KB

server_config.json 3KB

run_experiments.py 6KB

readme.md 121B

corpus_reader.cpython-39.pyc 4KB

dataset_old.cpython-39.pyc 4KB

train_plain.txt 8.47MB

char_word_vec_tokenizer.cpython-39.pyc 1KB

hot_config.json 43B

context_free_word_vec_encoder.cpython-39.pyc 1KB

collate_function.cpython-39.pyc 3KB

.gitignore 2KB

pinyin_word_vec_encoder.py 1KB

药物名称.tsv 7KB

trainer.py 28KB

context_free_stroke_word_vec_encoder.cpython-39.pyc 2KB

predictor.py 9KB

PULL_REQUEST_TEMPLATE.zh-CN.md 1KB

ner_case.py 9KB

handian_data.cpython-39.pyc 2KB

subtask1_test_set_with_answer.json 750KB

handy_functions.cpython-39.pyc 714B

requirements.txt 355B

.keep 0B

dataset.cpython-39.pyc 6KB

knowlege_injection_encoder.py 5KB

char_word_vec_encoder.cpython-39.pyc 4KB

共 86 条

猰貐的新时代

粉丝: 1w+

Python实现中文医疗命名实体识别源码完整下载

基于python实现中文事件触发词抽取-命名实体识别项目源码.zip

NLP实验python源码_实现命名实体识别+关系抽取+事件抽取+语义匹配.zip

基于python实现中文医学文本实体关系抽取源码+数据集+运行说明.zip

python字轮式自来水水表识别的项目源码.zip

电子商城源码.zip python+django

推荐30个以上比较好的中文命名实体识别github源码

python机器学习基础源码.zip

php二开的三种语言自动抢单系统源码.zip

推荐30个以上比较好的命名实体识别模型github源码？

基于python+opencv人脸识别的员工考勤系统源码(毕业设计).zip

最新资源