中医古文诊断的词性标注与特征重组提升方法
35 浏览量
更新于2024-08-26
收藏 1.33MB PDF 举报
该研究论文探讨了中医诊断古文处理中的关键问题,即如何有效应对其中大量存在的单音词,因为通用切词技术往往将这些词分割成孤立的部分,无法形成完整的诊断词汇。针对这一挑战,研究人员王国龙、杜建强、郝竹林、程春雷和蔡良俊等人合作,提出了一种创新的方法。
首先,他们设计了一个基于键值对模型的中医诊断词性标记集,这是为了更准确地识别和处理古文中独特的词性结构。词性标注在这个过程中扮演了关键角色,因为它能确定每个词在句子中的语法功能,如名词、动词、形容词等。他们采用了隐马尔可夫模型(HMM),这是一种统计学习方法,用于预测序列数据中的下一个状态,这里是词性。通过HMM,他们能够捕捉到词与词之间的潜在依赖关系,从而提高词性标注的准确性。
接着,研究人员结合词法分析,运用移进归约算法进行特征重组。这种算法通过对词性标注后的词汇进行重新组合,生成了完整的、有意义的诊断词汇,这对于中医人员进行疾病诊断和分析具有实际价值。重组后的词汇不仅结构清晰,而且便于构建向量空间模型,这在信息检索和文本挖掘中是重要的特征表示方式。
该研究的实验结果显示,他们改进的HMM在词性标注的精确度上有所提升,特别是在训练集和测试集上的表现分别提高了2.58%和1.02%,这表明他们的方法在实际应用中具有良好的泛化能力。此外,论文还提及了研究的基金支持,包括国家973重点基础研究发展计划基金、国家自然科学基金以及江西中医药大学的研究生创新项目,这显示出研究的学术背景和资金保障。
这篇论文通过引入键值对模型、隐马尔可夫模型和特征重组技术,解决了中医诊断古文处理中的词性标注难题,并展示了其在中医诊断实践中的潜在应用价值。这对于中医文献的自动处理、知识提取以及临床决策支持系统的发展都具有重要意义。
2021-09-16 上传
2021-10-10 上传
2021-10-31 上传
2021-09-16 上传
2021-10-01 上传
2022-05-14 上传
2021-10-10 上传
2021-08-19 上传
weixin_38571992
- 粉丝: 1
- 资源: 939
最新资源
- IEEE 14总线系统Simulink模型开发指南与案例研究
- STLinkV2.J16.S4固件更新与应用指南
- Java并发处理的实用示例分析
- Linux下简化部署与日志查看的Shell脚本工具
- Maven增量编译技术详解及应用示例
- MyEclipse 2021.5.24a最新版本发布
- Indore探索前端代码库使用指南与开发环境搭建
- 电子技术基础数字部分PPT课件第六版康华光
- MySQL 8.0.25版本可视化安装包详细介绍
- 易语言实现主流搜索引擎快速集成
- 使用asyncio-sse包装器实现服务器事件推送简易指南
- Java高级开发工程师面试要点总结
- R语言项目ClearningData-Proj1的数据处理
- VFP成本费用计算系统源码及论文全面解析
- Qt5与C++打造书籍管理系统教程
- React 应用入门:开发、测试及生产部署教程