layoutlmv2
时间: 2023-07-28 11:09:25 浏览: 166
中文识别超轻量推理模型
LayoutLMv2是一种模型,它在预训练阶段将文本和图像向量相结合,利用Transformer学习文本和视觉信息的交互信息。与LayoutLM不同的是,LayoutLMv2在预训练阶段就将图像向量与文本结合,同时使用了Masked visual-Language Model、文本图像对齐和文本图像匹配策略,以及空间感知自注意力机制。LayoutLMv2的目标是用于文档理解任务,包括结构化文本理解和布局分析。\[2\]
#### 引用[.reference_title]
- *1* [Layout系列模型(LayoutLM,LayoutLMv2,LayoutXLM)](https://blog.csdn.net/sinat_34072381/article/details/124851506)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
- *2* *3* [文档图像分类、信息提取、信息结构化之 LayoutLM、LayoutLMv2、LayoutXLM —— 论文阅读笔记](https://blog.csdn.net/m0_38007695/article/details/115803829)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文