LayoutLMv3
时间: 2024-05-16 19:19:12 浏览: 136
LayoutManager
LayoutLMv3是微软在2022年提出的一种新型多模态预训练模型。它是在LayoutLMv1和LayoutLMv2的基础上进一步演进的结果。LayoutLMv3通过将现有多模态任务分成四个类型,并且更趋向于第四个类型,即结合文本、图像和布局信息来进行多模态任务的处理。LayoutLMv3的具体实现可以参考微软在GitHub上发布的代码。它的提出使得多模态模型在文档、表单等领域的识别任务上更加成熟和高效。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [多模态预训练模型指北——LayoutLM](https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/126925543)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文