CTD-BLSTM模型在医疗知识搜索中的实体识别提升

需积分: 8 18 下载量 45 浏览量 更新于2024-08-07 收藏 2.82MB PDF 举报
"这篇硕士论文主要探讨了在医疗知识搜索领域的知识图谱构建技术,特别是针对中文医疗文本的实体识别。研究中提出了两种基于长短时记忆(LSTM)网络的模型,即D-BLSTM(预训练词向量和微调词向量扩展的LSTM)和CTD-BLSTM(结合Co-training半监督方法的D-BLSTM),用于改善序列标注问题,特别是在医疗领域数据稀疏的情况下提升识别效率。 在模型性能比较中,论文列举了不同模型的识别性能,包括基于词性特征和上下文窗口特征的BLSTM、D-BLSTM以及CTD-BLSTM模型。结果显示,随着训练数据量的增加,模型的准确率、召回率和F-值普遍提高。特别地,CTD-BLSTM模型在5000条和25000条标注数据上的表现优于其他模型,证明了其在处理医疗领域文本时的有效性和优越性。 论文进一步通过Python实现CTD-BLSTM算法,并进行了对比实验,验证了该模型在识别性能和适应性上的优势。最终,基于构建的中文医疗领域知识图谱,使用Java开发了一个医疗知识搜索系统。该系统能理解用户输入的自然语言,进行句法分析和语义依存分析,以更直观、精准的方式提供用户所需的医疗知识。 关键词涉及人工智能、智能医疗和知识图谱,强调了这些技术在医疗知识搜索中的应用和重要性。"