中医古文诊断的词性标注与特征重组提升方法
37 浏览量
更新于2024-08-26
收藏 1.33MB PDF 举报
该研究论文探讨了中医诊断古文处理中的关键问题,即如何有效应对其中大量存在的单音词,因为通用切词技术往往将这些词分割成孤立的部分,无法形成完整的诊断词汇。针对这一挑战,研究人员王国龙、杜建强、郝竹林、程春雷和蔡良俊等人合作,提出了一种创新的方法。
首先,他们设计了一个基于键值对模型的中医诊断词性标记集,这是为了更准确地识别和处理古文中独特的词性结构。词性标注在这个过程中扮演了关键角色,因为它能确定每个词在句子中的语法功能,如名词、动词、形容词等。他们采用了隐马尔可夫模型(HMM),这是一种统计学习方法,用于预测序列数据中的下一个状态,这里是词性。通过HMM,他们能够捕捉到词与词之间的潜在依赖关系,从而提高词性标注的准确性。
接着,研究人员结合词法分析,运用移进归约算法进行特征重组。这种算法通过对词性标注后的词汇进行重新组合,生成了完整的、有意义的诊断词汇,这对于中医人员进行疾病诊断和分析具有实际价值。重组后的词汇不仅结构清晰,而且便于构建向量空间模型,这在信息检索和文本挖掘中是重要的特征表示方式。
该研究的实验结果显示,他们改进的HMM在词性标注的精确度上有所提升,特别是在训练集和测试集上的表现分别提高了2.58%和1.02%,这表明他们的方法在实际应用中具有良好的泛化能力。此外,论文还提及了研究的基金支持,包括国家973重点基础研究发展计划基金、国家自然科学基金以及江西中医药大学的研究生创新项目,这显示出研究的学术背景和资金保障。
这篇论文通过引入键值对模型、隐马尔可夫模型和特征重组技术,解决了中医诊断古文处理中的词性标注难题,并展示了其在中医诊断实践中的潜在应用价值。这对于中医文献的自动处理、知识提取以及临床决策支持系统的发展都具有重要意义。
2021-09-16 上传
2021-10-10 上传
2021-08-19 上传
239 浏览量
146 浏览量
183 浏览量
145 浏览量
115 浏览量
293 浏览量

weixin_38571992
- 粉丝: 1
最新资源
- WebDrive v16.00.4368: 简易易用的Windows风格FTP工具
- FirexKit:Python的FireX库组件
- Labview登录界面设计与主界面跳转实现指南
- ASP.NET JS引用管理器:解决重复问题
- HTML5 canvas绘图技术源代码下载
- 昆仑通态嵌入版ASD操舵仪软件应用解析
- JavaScript实现最小公倍数和最大公约数算法
- C++中实现XML操作类的方法与应用
- 设计编程工具集:材料重量快速计算指南
- Fancybox:Jquery图片轮播幻灯弹窗插件推荐
- Splunk Fitbit:全方位分析您的活动与睡眠数据
- Emoji表情编码资源及数据库查询实现
- JavaScript实现图片编辑:截取、旋转、缩放功能详解
- QNMS系统架构与应用实践
- 微软高薪面试题解析:通向世界500强的挑战
- 绿色全屏大气园林设计企业整站源码与多技术项目资源