资源摘要信息:"本资源包含了一个基于Python、BERT和词典开发的医药知识图谱自动问答系统。该系统主要由三部分构成:医药知识图谱的构建、自动问答后端的搭建以及前端交互的实现。 一、构建医药知识图谱: 项目采用了爬虫技术,从网络上爬取并整理了症状描述文本和症状库,构建了症状名与疾病之间的关系。通过AC算法,从症状描述文本中识别并提取了与症状库对应的4377个症状。基于这些数据,系统重构了99492个疾病名-症状-症状名的三元组。此外,系统还对提及症状推理疾病的提问方式进行了优化,通过疾病交集的方式支持多症状提问。 二、搭建自动问答后端: 针对口语化症状描述无法精确匹配的问题,引入了BERT+CRF模型进行命名实体识别,使用BIO+C标注方法。通过随机从领域词典中抽取数据集,并用训练好的模型进行实体识别。利用SBERT模型,对识别出的提及词和词典中的词进行相似度计算,得到top20的候选实体,并结合重叠字的长度进行实体链接。 意图识别方面,项目沿用了基于规则的模板方法,但提出了进一步通过深度学习模型改进的计划。目前,项目尚未实现疾病的患病率属性构建,但提出了通过患病概率排序候选疾病的可能性。 三、增加前端交互: 系统使用echarts的力引导图增加前端交互和知识图谱展示。通过这种方式,用户可以通过友好的界面与知识图谱和问答系统进行交互。 系统安装与运行说明: 用户首先需要启动neo4j数据库,然后执行项目的主程序。源码已经过测试,确保功能正常。资源内还包含了一份详细文档说明以及要求的库依赖文件,方便用户快速上手。 本项目适合作为计算机相关专业的学习材料,既适合在校学生和老师,也适合企业员工和初学者。源码经过测试验证,可以作为毕设、课设、作业等用途。此外,源码也支持开发者在此基础上进行功能拓展和定制。 文件列表说明: - 文档说明.md:提供了详细的项目文档,说明了如何安装和运行系统,以及项目的技术细节和使用方法。 - requirement.txt:包含了项目运行所需的Python依赖库列表。 - med_kg:包含了医药知识图谱和问答系统的源代码和相关数据文件。 - kg:包含构建知识图谱的相关文件和脚本。 - img:包含了系统运行界面和结果的图片展示文件。 标签说明: - python:项目采用Python作为主要开发语言。 - bert:项目利用了BERT模型进行命名实体识别和意图识别。 - 医药知识图谱:项目的核心是构建和应用医药领域的知识图谱。 - 毕业设计:项目是作者的毕业设计作品。 - 问答系统:项目的核心功能是提供自动化的问答服务。 以上信息为对资源内容的详尽解读,旨在为计算机相关领域的学习者、研究者和从业者提供有价值的参考。"
- 1
- 2
- 3
- 4
- 粉丝: 4037
- 资源: 1245
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- zlib-1.2.12压缩包解析与技术要点
- 微信小程序滑动选项卡源码模版发布
- Unity虚拟人物唇同步插件Oculus Lipsync介绍
- Nginx 1.18.0版本WinSW自动安装与管理指南
- Java Swing和JDBC实现的ATM系统源码解析
- 掌握Spark Streaming与Maven集成的分布式大数据处理
- 深入学习推荐系统:教程、案例与项目实践
- Web开发者必备的取色工具软件介绍
- C语言实现李春葆数据结构实验程序
- 超市管理系统开发:asp+SQL Server 2005实战
- Redis伪集群搭建教程与实践
- 掌握网络活动细节:Wireshark v3.6.3网络嗅探工具详解
- 全面掌握美赛:建模、分析与编程实现教程
- Java图书馆系统完整项目源码及SQL文件解析
- PCtoLCD2002软件:高效图片和字符取模转换
- Java开发的体育赛事在线购票系统源码分析