DIECTA:基于CTA矩阵的医疗记录疾病信息精确提取

需积分: 9 0 下载量 30 浏览量 更新于2024-08-09 1 收藏 176KB PDF 举报
"这篇研究论文探讨了如何利用Chief-Tweak-Abridge Matrix(CTA矩阵)以及Midst Measure技术从医疗记录中高效地提取疾病信息。在医疗保健领域,数据包含数值、医学定义和非数值信息,而传统的基于术语的提取方法常常受到多义词和同义词困扰,导致提取结果不精确。因此,该研究提出了一种新的方法——DIECTA(基于疾病接近度、疾病矩阵、中间度量的分类器方法),旨在提高信息提取的准确性。 CTA矩阵中的Chief Matrix关注主要病症,Tweak Matrix则分析不同疾病之间的相互影响,而Abridge Matrix有助于消除冗余信息,使得疾病提取更为精炼。Midst Measure作为决策工具,用于确定提取疾病信息的最适中方案。通过这些矩阵的结合运用,DIECTA方法在处理大量医疗保健数据集时表现出了高精度。平均精度达到了0.9532%,表明该方法能有效地识别出相关疾病实例。平均召回率为0.554%,F-measure的平均值为0.576%,这进一步证实了DIECTA在提取高精度实例方面的有效性。 研究中采用了机器学习算法进行结果评估,如规则分类器(RC)和覆盖率测量,以确保提取信息的全面性和可靠性。论文指出,随着记录中相关实例的增加,DIECTA方法的性能也有所提升。这项工作不仅为医疗信息提取提供了新思路,也为后续的医疗数据分析和决策支持系统的设计提供了理论基础。" 这篇论文发表在《澳大利亚基础与应用科学杂志》(Australian Journal of Basic and Applied Sciences)上,由L. Sathish Kumar和A. Padmapriya共同撰写,他们分别是阿尔加帕大学计算机科学与工程系的博士研究生和副教授。研究工作受到了Creative Commons Attribution International License (CC BY)的许可,允许他人在遵守署名条件下自由使用、分享和改编作品。