Yann LeCun新突破：提升图像语义表示的自监督学习方法

版权申诉

77 浏览量更新于2024-08-04 收藏 2.95MB PDF 举报

“Yann LeCun的新论文展示了在图像语义表示上的显著进步，超过先前的MAE（Masked Autoencoder）方法。论文提出了一种名为‘Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture’的新型自监督学习框架，旨在提升无监督学习的语义级别，同时减少对特定图像增强的依赖。” 在计算机视觉领域，自监督学习已经成为预训练模型的重要策略，尤其是在无标注数据丰富的环境中。传统的自监督方法主要分为基于不变性的方法和生成方法。基于不变性的方法，如SimCLR和MOCO，通过不同的数据增强技术生成图像的多个视图，然后让模型学习这些视图之间的相似性。这种方法能够学到高语义级别的表示，但也可能导致特定任务的偏差，限制了泛化能力。另一方面，生成方法，特别是mask denoising，如MAE，通过随机遮盖图像的一部分并要求模型预测被遮盖的内容，以学习图像的表示。这种方式学习到的表示通常处于较低的语义层次，因此在复杂的语义任务上可能表现不佳，需要进一步的微调。 Yann LeCun的新工作旨在解决这些问题，提出了一种联合嵌入预测架构。这种架构结合了生成与不变性学习的特性，能够在不依赖特定图像增强的情况下提升语义表示的水平。论文中介绍的模型设计可能允许模型更有效地捕获图像中的高级语义信息，同时减少对下游任务的偏置。通过使用这种新架构，模型不仅能够处理图像数据，还可能更容易地扩展到多模态学习，如音频或文本。这符合认知学习理论，即生物系统通过内部模型适应感官输入的变化来学习表示。新方法可能不需要复杂的适应机制，就能在未见过的任务上表现出色，比如图像分类和实例分割。这篇论文对于自监督学习领域的贡献在于提出了一种新的自适应表示学习方法，它有望改进现有的无监督预训练技术，提高模型的泛化能力和多模态应用的能力。这一进展对于推动计算机视觉和人工智能技术的发展具有重要意义。

2023/6/28 16:38

Yann LeCun 新作！大幅超越 MAE，图像语义表示卷出新高度

https://mp.weixin.qq.com/s/X72rZayd-guXWjhxzFSwTg

3/12

I-JEPA是一种预测目标块表示的方法。在I-JEPA中，目标对应于图像块的表示。

它首先从图像中随机采样一个上下文块x，并去除与目标块重叠的部分，然后将x通过上下文编

码器fθ获得对应的patch-level表示sx，最后通过预测器gφ，将sx作为输入，以及每个patch的

mask token，输出M个目标块表示sˆy(1), ..., sˆy(M)，并计算预测值与目标值之间的L2距离，

剩余11页未读，继续阅读

地理探险家

粉丝: 1255
资源: 5609

Yann LeCun新突破：提升图像语义表示的自监督学习方法

Yann LeCun 新作！大幅超越 MAE，图像语义表示卷出新高度.rar

NatureDeepReview(Yann LeCun+Yoshua Bengio+Geoffrey Hinton).pdf

Yann lecun（杨立昆）2014.7.9在北大关于deep learning的讲座 ppt

Yann LeCun (paper_set)

《Deep Learning》Yann LeCun, YoshuaBengio, Geoffery Hinton

悟道3.0全面开源！LeCun VS Max 智源大会最新演讲.pdf

大牛Yann LeCun关于深度学习的综述报告（2013）

图灵奖大佬 Lecun 发表对比学习新作，比 SimCLR 更好用！ .pdf

Deep learning Yann LeCun, Yoshua Bengio & Geoffrey Hinton 三位大牛综述

Lecun1998.pdf

最新资源