基于BERT特征的双向LSTM神经网络在中文电子病历输入推荐中的应用研究

需积分: 3 0 下载量 44 浏览量 更新于2024-08-04 收藏 3.07MB PDF 举报
"基于BERT特征的双向LSTM神经网络在中文电子病历输入推荐中的应用.pdf" 本文主要介绍了基于BERT特征的双向LSTM神经网络在中文电子病历输入推荐中的应用。该研究旨在解决当前电子病历录入中的便捷性与规范性的双重需求,通过利用神经网络算法挖掘病历文本的语言习惯和承接关系,以便嵌入病历录入系统,提高医生输入的效率和质量。 **知识点1:BERT特征** BERT(Bidirectional Encoder Representations from Transformers)是一种基于transformer模型的语言模型,可以学习到文本的语义信息。BERT特征可以作为输入特征,用于训练 LANGUAGE MODEL,以提高模型的性能。在本研究中,作者使用了BERT预训练模型特征,基于BiLSTM网络算法,学习专科专病的语义信息。 **知识点2:双向LSTM神经网络** 双向LSTM(Bidirectional Long Short-Term Memory)是一种基于递归神经网络(RNN)的深度学习算法,可以学习到序列数据的长期依赖关系。双向LSTM神经网络可以同时学习到正向和反向的语言习惯和承接关系,提高语言模型的性能。在本研究中,作者使用了双向LSTM神经网络,基于BERT特征,学习专科专病的语义信息。 **知识点3:电子病历录入推荐** 电子病历录入推荐是指使用机器学习算法对电子病历文本进行分析和预测,以提高医生输入的效率和质量。该技术可以帮助医生快速输入电子病历,提高医疗服务的质量和效率。在本研究中,作者使用了基于BERT特征的双向LSTM神经网络,建立了电子病历录入推荐模型,预测下一句文本,结果表明使用BERT预训练模型特征的BiLSTM模型Fl-score达到75.23%。 **知识点4:文本表示** 文本表示是指将文本数据转换为机器可以理解的形式,以便进行机器学习和深度学习。常见的文本表示方法包括独热编码、词向量、BERT特征等。在本研究中,作者比较了基于BERT特征、独热编码、词向量三种文本表示方法,结果表明BERT特征优于独热编码和Word2Vec词向量。 **知识点5:医疗信息处理** 医疗信息处理是指对医疗数据进行收集、存储、处理和分析,以提高医疗服务的质量和效率。在本研究中,作者使用了基于BERT特征的双向LSTM神经网络,处理电子病历文本数据,提高医生输入的效率和质量。 本研究主要介绍了基于BERT特征的双向LSTM神经网络在中文电子病历输入推荐中的应用,旨在解决当前电子病历录入中的便捷性与规范性的双重需求,提高医生输入的效率和质量。