简单且强大的不规则文本识别基线:Show, Attend and Read

需积分: 0 0 下载量 182 浏览量 更新于2024-07-01 收藏 1.68MB PDF 举报
"王鹏等人提出了一种名为'Show, Attend and Read'的简单而强大的不规则文本识别基线方法,该方法在2019年AAAI预会议演讲中介绍。文章主要关注的是不规则文本识别任务,这是文本识别领域的一个挑战,包括在自然场景中读取常规和不规则文本。" 在图像识别和处理领域,文本识别是至关重要的一环,特别是对于不规则文本的识别。不规则文本通常出现在复杂背景或自然场景中,例如历史建筑的标志、街头广告等。传统的光学字符识别(OCR)技术在处理简单背景中的规律文本时表现良好,但在面对弯曲、扭曲的不规则文本时效果欠佳。 “Show, Attend and Read”方法借鉴了机器翻译和图像 captioning 的思想,采用编码器-解码器架构。其中,编码器通常由卷积神经网络(CNN)构成,用于提取图像特征;解码器则通常由循环神经网络(RNN)组成,用于生成文本序列。在这一过程中,注意力机制(Attention Mechanism)扮演了关键角色,它能帮助模型在解码阶段动态聚焦于图像的特定区域,从而更准确地识别不规则形状的字符。 传统的方法,如基于校正的技术,虽然可以解决轻微的文本扭曲,但难以应对严重扭曲或曲线。而基于注意力的方法需要字符级别的标注,这些标注数据收集起来困难且耗时。多方向编码方法虽然引入了更复杂的框架设计,但可能增加了实现的复杂性。 王鹏等人的工作提供了一个新的视角,他们构建的模型相对简单,但仍能有效地处理不规则文本识别问题。通过展示、关注并阅读图像中的关键信息,模型能够适应各种文本形状和排列,无需过于复杂的设计或额外的标注数据。这使得该方法在实践中具有很大的应用潜力,特别是在自动化文本检测和理解的场景下,比如智能交通、历史资料数字化等领域。 "Show, Attend and Read" 提出了一种新的、简洁的基线方法,对于不规则文本识别领域是一个重要的贡献,它简化了模型结构,提高了对非结构化文本的识别能力,降低了对标注数据的依赖,有助于推动文本识别技术的进步。

select distinct a.EMPI_ID, a.PATIENT_NO, a.MR_NO, a.PAT_NAME, a.PAT_SEX, a.PAT_AGE, a.PAT_PHONE_NO, b.DIAG_RESULT, a.ADMIT_DATE, a.DISCHARGE_DEPT_NAME, a.ATTEND_DR from BASIC_INFORMATION a join PA_DIAG b on a.MZZY_SERIES_NO=b.MZZY_SERIES_NO join EXAM_DESC_RESULT_CODE c on a.MZZY_SERIES_NO=c.MZZY_SERIES_NO join DRUG_INFO d on a.MZZY_SERIES_NO=d.MZZY_SERIES_NO join EMR_CONTENT e on a.MZZY_SERIES_NO=e.MZZY_SERIES_NO JOIN TEST_INFO A17 ON a.MZZY_SERIES_NO = A17.MZZY_SERIES_NO where a.PAT_AGE>='18' and (to_char(a.ADMIT_DATE,'YYYY-MM-DD') >= '2021-01-01') AND (b.DIAG_RESULT LIKE '%鼻咽癌%' or b.DIAG_RESULT LIKE '%鼻咽恶性肿瘤%' or b.DIAG_CODE LIKE '%C11/900%') and d.DRUG_NAME not in (select DRUG_NAME FROM DRUG_INFO WHERE DRUG_NAME like '卡培他滨') and b.DIAG_RESULT NOT IN (SELECT DIAG_RESULT FROM PA_DIAG WHERE DIAG_RESULT LIKE '%HIV阳性%') and b.DIAG_RESULT NOT IN (SELECT DIAG_RESULT FROM PA_DIAG WHERE DIAG_RESULT LIKE '%充血性心力衰竭%') AND to_char(( A17.TEST_DETAIL_ITEM_NAME = '中性粒细胞' AND A17.TEST_RESULT >= 1.5 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '血小板' AND A17.TEST_RESULT >= 100 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '血红蛋白' AND A17.TEST_RESULT >= 9 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '丙氨酸氨基转移酶' AND A17.TEST_RESULT <= 2.5 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '天门冬氨酸氨基转移酶' AND A17.TEST_RESULT <= 2.5 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '肌酐清除率' AND A17.TEST_RESULT > 51 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '肌酐' AND A17.TEST_RESULT <=1.5 ) OR ( A17.TEST_DETAIL_ITEM_NAME = '凝血酶原时间' AND A17.TEST_RESULT <= 1.5 ))语句哪里有问题

2023-06-07 上传