中文电子病例命名实体识别：Python+BERT与Neo4j的毕业设计

版权申诉

14 浏览量更新于2024-12-13 收藏 6.08MB ZIP 举报

资源摘要信息:"基于Python BERT和知识图谱(Neo4j)的中文电子病例医学命名实体识别" 本项目是一项高分毕业设计，使用Python编程语言，并结合了BERT模型和Neo4j知识图谱技术，旨在实现中文电子病例中的医学命名实体识别。实体识别是自然语言处理（NLP）中的一个重要应用领域，尤其在医疗行业有着广泛的应用价值。具体而言，本项目的目标是开发出一个能够准确识别电子病例文档中的医学术语、病症、药名等关键信息的系统。知识点涵盖如下： 1. Python编程语言：作为目前最流行的编程语言之一，Python以其简洁的语法和强大的库支持而广受欢迎。在这个项目中，Python被用来编写源码，完成与BERT模型和Neo4j知识图谱的交互。 2. sklearn库：scikit-learn是一个开源的机器学习库，提供了大量简单有效的工具用于数据挖掘和数据分析。在本项目中，sklearn可能被用于数据预处理、特征提取或模型评估等环节。 3. BERT模型：BERT（Bidirectional Encoder Representations from Transformers）是一种基于Transformer的预训练语言表示模型。它的双向训练方式使得模型能够更好地理解语言的上下文关系，从而在各种NLP任务中表现出色。本项目中，BERT模型被用于提取和理解电子病例中的文本特征。 4. 知识图谱：知识图谱是一种表示实体间关系的数据结构，常用于构建和维护知识库。在这个项目中，Neo4j作为一个图数据库，被用来构建医学知识图谱，并与BERT模型结合，以实现更精准的医学实体识别。 5. 中文电子病例处理：中文电子病例通常包含大量专业医学术语和病历描述，处理这些数据需要专业的医学知识和自然语言处理技术。本项目针对这一特定应用场景，提供了相应的解决方案。 6. 机器学习与深度学习：BERT的训练和应用涉及到深度学习技术，而命名实体识别本身就是一个典型的机器学习任务。本项目展示了如何结合最新的深度学习技术与传统的机器学习方法来解决实际问题。 7. 毕业设计与项目实践：该项目是为计算机相关专业的学生设计的，旨在作为毕业设计、课程设计或作业的一部分。它不仅可以直接用于学术目的，还可以作为进一步研究和开发的基础。 8. 系统开发与测试：项目代码经过在macOS和Windows多个版本上的测试运行，说明开发团队对软件开发流程有充分的考虑，包括代码编写、功能测试和系统集成。资源中还包含了一系列的文件，其中包括源码文件、文档说明和全部数据资料。源码文件“KBERT-editedbywxx-master”可能包含了BERT模型的具体应用和修改代码，而“171265889347208773632.zip”文件则可能包含了项目的所有相关数据和文档。用户可以下载这些资源进行学习、研究或者在现有项目基础上进一步开发新的功能。由于本项目已经获得了导师的认可并取得了高分，因此它不仅是一个学习资源，也是一个质量保证的参考项目，特别适合那些希望深入了解医疗领域NLP应用的学生和专业人员。

收起资源包目录

毕业设计基于Python BERT和知识图谱(Neo4j)的中文电子病例医学命名实体识别源码+详细文档+全部数据资料（高分项目（99个子文件）

config.py 596B

run_kbert_ner_ccks2019.py 63KB

BILSTM_CRF_demo.py 10KB

train.tsv 2.45MB

dev.tsv 238KB

rnn_encoder.py 3KB

run_ner_ensemble_predict.sh 873B

HowNet.spo 1.31MB

run_bertlesssingle_ner_predict.sh 515B

model.py 1KB

test.tsv 361KB

transformdata.py 3KB

run_single_ner_predict.sh 527B

config.py 897B

seed.py 412B

cls_target.py 1KB

Medical-clean.spo 452KB

mixed_encoder.py 4KB

constants.py 278B

transformer.py 1KB

__init__.py 59B

multi_headed_attn.py 2KB

train.tsv 1.68MB

bilm_target.py 3KB

cnn_encoder.py 3KB

run_cls_predict_bywxx.py 16KB

attn_encoder.py 1KB

avg_subencoder.py 425B

act_fun.py 122B

run_kbert_ner_ensemble.py 67KB

train_dev.tsv 2.87MB

notebypaulwen.md 1KB

knowgraph.py 16KB

__init__.py 0B

run_kbert_cls.py 24KB

Medical-plus_with_check_entity.spo 837KB

s2s_target.py 2KB

__init__.py 0B

layer_norm.py 491B

README.md 6KB

train_ner_demo.sh 485B

__init__.py 0B

bert_target.py 3KB

test.tsv 916KB

dev.tsv 435KB

.gitignore 14B

bert_encoder.py 2KB

Medical.spo 461KB

__init__.py 0B

train.tsv 2.28MB

vocab.py 5KB

requirements.txt 114B

dev.tsv 613KB

rnn_subencoder.py 992B

train.tsv 2.88MB

run_cls_predict.sh 472B

.gitignore 6B

__init__.py 0B

171265889347208773632.zip 416B

run_kbertless_ner_predict.py 39KB

birnn_encoder.py 2KB

run_bertless_ner_ccks2019.py 51KB

Medical-plus.spo 714KB

google_vocab.txt 107KB

embeddings.py 2KB

data.py 44KB

run_kbert_ner_predict.py 52KB

gpt_encoder.py 1KB

test_test.tsv 3KB

google_config.json 114B

nsp_target.py 1KB

cnn_subencoder.py 914B

position_ffn.py 532B

train_ori.txt 2.39MB

run_kbert_ner.py 17KB

train_ner_ccks_bertbase.sh 595B

dev.tsv 365KB

dev.tsv 613KB

trainer.py 20KB

model_saver.py 284B

misc.py 279B

train_ner_ccks_bertless_model.sh 590B

mlm_target.py 2KB

test.tsv 195KB

tokenizer.py 11KB

.gitignore 1KB

test.tsv 914KB

optimizers.py 6KB

test_ori.txt 750KB

__init__.py 0B

.gitignore 40B

train.tsv 2.28MB

medicalrepeatentities.txt 13KB

bert_model.py 1KB

model_builder.py 2KB

lm_target.py 2KB

__init__.py 0B

subword.py 655B

README.md 62B

共 99 条

不走小道

粉丝: 3365
资源: 5054

中文电子病例命名实体识别：Python+BERT与Neo4j的毕业设计

BERT与知识图谱结合的中文医病命名实体识别源码

高分BERT中文命名实体识别Python项目源码

BERT中文命名实体识别项目源码与文档资料包

基于BERT和知识图谱的中文电子病例医学命名实体识别项目源码.zip

基于BERT和知识图谱的中文电子病例医学命名实体识别.zip

基于Python+Flask+bert4keras的命名实体识别系统源码+部署文档+全部数据资料 高分项目.zip

Python优秀项目 基于Flask+bert4keras的命名实体识别系统源码+部署文档+全部数据资料.zip

Python毕业设计 基于Flask+机器学习与BERT的在线招聘欺诈检测平台源码+详细部署文档+全部数据资料（高分项目）

python实现基于bert-mrc的中文命名实体识别源码+全部数据.zip

基于Bert+BiLSTM+CRF的命名实体识别python源码+文档说明(高分课程设计)

最新资源

基于Python+Flask+bert4keras的命名实体识别系统源码+部署文档+全部数据资料高分项目.zip

Python优秀项目基于Flask+bert4keras的命名实体识别系统源码+部署文档+全部数据资料.zip

Python毕业设计基于Flask+机器学习与BERT的在线招聘欺诈检测平台源码+详细部署文档+全部数据资料（高分项目）