CCKS2019医疗实体识别与属性抽取任务详解
需积分: 0 155 浏览量
更新于2024-08-04
收藏 891KB DOCX 举报
"CCKS2019任务1是一个关于医疗命名实体识别和属性抽取的挑战,旨在从中文电子病历中抽取出与医学临床相关的实体,包括疾病、检查、检验、手术、药物和解剖部位等。该任务分为两个子任务:1) 医疗命名实体识别,2) 医疗实体及属性抽取(跨院迁移)。参赛者可以选择单独参加任一子任务或同时参加两个。任务以预定义类别为指导,提供了经过修订的数据集,由医渡云公司提供并标注。评价标准基于精确率、召回率和F1-Measure。"
在这个任务中,【医疗命名实体识别】是一个关键知识点,它要求系统能够从电子病历的文本中准确地识别出特定类型的实体,例如疾病诊断、检查、检验、手术、药物和解剖部位。这需要模型理解医学术语和上下文,因为这些实体常常具有高度的专业性和复杂性。为了实现这一目标,可能需要利用自然语言处理(NLP)技术,如词性标注、依存关系分析和命名实体识别算法。
【迁移学习】是另一个重要的标签,表明参赛者需要在目标场景(此处是医疗实体及属性抽取)中应用已有的知识,即使在目标场景的标注数据有限的情况下。这通常涉及到使用预训练模型,例如在大规模数据集上训练的语言模型,然后在特定领域的小型数据集上进行微调,以适应医疗领域的专业词汇和表达。
【数据集】的描述强调了数据的来源和质量,医渡云公司的专业医学团队进行了人工标注,确保了数据的准确性。这对于训练和评估模型至关重要,因为高质量的标注数据是机器学习任务成功的基础。数据集的详细描述和标注规范会随着数据的发布一同提供,这对于参赛者理解和处理数据至关重要。
【评价指标】包括精确率、召回率和F1-Measure,这些都是衡量信息抽取任务性能的标准方法。精确率衡量识别出的实体中有多少是正确的,召回率表示所有真实实体中有多少被正确识别,而F1-Measure综合了精确率和召回率,是评估整体性能的关键指标。在医疗领域,高精度尤为重要,因为错误的识别可能导致严重的医疗决策失误。
219 浏览量
2421 浏览量
2022-08-08 上传
2022-08-08 上传
2022-08-08 上传
2021-02-17 上传
2008-09-07 上传
165 浏览量
chenbtravel
- 粉丝: 28
- 资源: 296
最新资源
- CStrAinBP:2 个单元格串的重叠元素。 比 INTERSECT/ISMEMBER/SETDIFF 快 10-20 倍。-matlab开发
- SecKill-System:一个秒杀抢购项目:分别提供MySQL乐观锁,Redis分布锁和ZooKeeper分布锁共3种方案
- rt-thread-code-stm32f103-yf-ufun.rar,yf-ufun STM32F103 是优凡
- Gra_w_zgadywanie_liczb_2
- shuaishuai-book
- KaanBOT:KaanBOT是一款适度有趣的不和谐机器人
- ARFlower:AR花
- 建筑公司项目部施工管理制度汇编(流程图、岗位职责)
- 实现reload按钮效果源码下载
- PDFBookmark-1.0.2-final.zip
- 行间拖拽插件
- SFACC:阿西西圣法兰西斯天主教会加拉迪玛瓦网站
- CAD图块素材之电视背景墙、玄观、书柜详图
- API:GitHub上Viva Wallet开源项目的索引
- chokidar-cli:快速的跨平台cli实用程序,可监视文件系统的更改
- book_project