元学习：无记忆高效学习法

计算机视觉

需积分: 9 118 浏览量更新于2024-07-09 收藏 1.25MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"Meta-Learning without Memorization - 计算机视觉Github开源论文" 这篇论文"Meta-Learning without Memorization"是计算机视觉领域的研究，由Mingzhang Yin等人在ICLR 2020会议上发表。它探讨了深度学习方法在处理少量数据时学习新概念的难题，并提出了一种元学习的新方法，旨在避免模型过度记忆，从而实现更有效的任务学习。元学习（Meta-Learning）是一种机器学习策略，其目标是通过先前任务的数据来提升新任务的学习效率。传统元学习算法常常假设每个任务之间是相互独立的，即一个模型不能同时解决所有任务。例如，在少样本图像分类问题中，通常会采用每个任务随机分配图像类别到N-way分类标签的方法。这种做法是为了防止模型依赖于任务训练数据，而是通过学习任务之间的通用性。然而，如果这种任务隔离不被严格遵守，模型可能会“作弊”，学习一个单一的模型，这个模型可以零样本完成所有元训练任务，而不是适应新的任务。这种行为虽然在元训练阶段表现良好，但在面对未见过的任务时，适应性较差，无法真正实现高效学习。论文"Meta-Learning without Memorization"针对这一问题提出了新的解决方案。它探索如何设计一种机制，使得模型能够在不记住每个单独任务的情况下，依然能够利用过去的经验进行快速学习。这种方法可能涉及到对模型架构、优化过程或损失函数的创新调整，以鼓励模型学习任务间的通用特征，而不是特定任务的细节。论文可能详细讨论了以下几点： 1. 如何构建不依赖任务特定知识的模型表示，这可能涉及到对模型的权重初始化、结构设计或者学习规则的改进。 2. 如何在元训练过程中防止模型过度拟合，以保持其泛化能力，这可能涉及正则化技术或特定的训练策略。 3. 实验部分可能展示了提出的元学习方法在几个计算机视觉任务上的效果，比如图像分类、物体检测等，与现有方法的对比表明其优势。 4. 可能还包含了对算法复杂度、计算效率以及实际应用潜力的分析。这篇论文对于理解如何使深度学习模型在小样本情况下具备更好的学习能力和泛化性能具有重要意义，对于计算机视觉和元学习领域的研究者来说是一份有价值的参考资源。

资源详情

资源推荐

Published as a conference paper at ICLR 2020

to maximize I(ˆy

∗

; D|z

∗

, θ) to prevent memorization. We can bound this mutual information by

I(ˆy

∗

; D|z

∗

, θ)

≥I(x

∗

; ˆy

∗

|θ, z

∗

) = I(x

∗

; ˆy

∗

|θ) − I(x

∗

; z

∗

|θ) + I(x

∗

; z

∗

|ˆy

∗

, θ)

≥I(x

∗

; ˆy

∗

|θ) − I(x

∗

; z

∗

|θ)

=I(x

∗

; ˆy

∗

|θ) − E

p(x

∗

)q(z

∗

,θ)



log

q(z

∗

, θ)

q(z

∗

|θ)



≥I(x

∗

; ˆy

∗

|θ) − E



log

q(z

∗

, θ)

r(z

∗

)



= I(x

∗

; ˆy

∗

|θ) − E [D

(q(z

∗

, θ)||r(z

∗

))] (2)

where r(z

∗

) is a variational approximation to the marginal, the ﬁrst inequality follows from the

statistical dependencies in our model (see Figure 4 and Appendix A.2 for the proof). By simultane-

ously minimizing E [D

(q(z

∗

, θ)||r(z

∗

))] and maximizing the mutual information I(x

∗

; ˆy

∗

|θ),

we can implicitly encourage the model to use the task training data D.

For non-mutually-exclusive problems, the true label y

∗

is dependent on x

∗

. If the model has the

memorization problem and I(x

∗

; ˆy

∗

|θ) = 0, then q(ˆy

∗

, θ, D) = q(ˆy

∗

, θ) = q(ˆy

∗

|θ), which

means the model predictions do not depend on x

∗

or D. Hence, in practical problems, the predictions

generated from the model will have low accuracy.

This suggests minimizing the training loss in Eq. (1) can increase I(ˆy

∗

; D|x

∗

, θ) or I(x

∗

; ˆy

∗

|θ).

Replacing the maximization of I(x

∗

; ˆy

∗

|θ) in Eq. (2) with minimizing the training loss results in the

following regularized training objective

q( θ|M)q(φ|D

,θ)

−

∗

)∈D

∗

log q(ˆy

∗

= y

∗

, φ, θ) + βD

(q(z

∗

, θ)||r(z

∗

))

(3)

where log q(ˆy

∗

, φ, θ) is estimated by log q(ˆy

∗

, φ, θ) with z

∗

∼ q(z

∗

, θ), β modulates the

regularizer and r(z

∗

) can be set as N(z

∗

; 0, I). We refer to this regularizer as meta-regularization

(MR) on the activations.

As we demonstrate in Section 6, we ﬁnd that this regularizer performs well, but in some cases can

fail to prevent the memorization problem. Our hypothesis is that in these cases, the network can

sidestep the information constraint by storing the prediction of y

∗

in a part of z

∗

, which incurs a

small penalty in Eq. (3) and small lower bound in Eq. (2).

4.2 META REGULARIZATION ON WEIGHTS

Alternatively, we can penalize the task information stored in the meta-parameters θ. Here, we pro-

vide an informal argument and provide the complete argument in Appendix A.3. Analogous to

the supervised setting (Achille & Soatto, 2018), given meta-training dataset M, we consider θ

as random variable where the randomness can be introduced by training stochasticity. We model

the stochasticity over θ with a Gaussian distribution N(θ; θ

, θ

) with learned mean and vari-

ance parameters per dimension (Blundell et al., 2015; Achille & Soatto, 2018). By penalizing

I(y

∗

1:N

, D

1:N

; θ|x

∗

1:N

), we can limit the information about the training tasks stored in the meta-

parameters θ and thus require the network to use the task training data to make accurate predictions.

We can tractably upper bound it by

I(y

∗

1:N

, D

1:N

; θ|x

∗

1:N

) = E

log

q(θ|M)

q(θ|x

∗

1:N

)

≤ E [D

(q(θ|M)kr(θ))] , (4)

where r(θ) is a variational approximation to the marginal, which we set to N(θ; 0, I). In practice,

we apply meta-regularization to the meta-parameters θ that are not used to adapt to the task training

data and denote the other parameters as

θ. In this way, we control the complexity of the network that

can predict the test labels without using task training data, but we do not limit the complexity of the

network that processes the task training data. Our ﬁnal meta-regularized objective can be written as

q(θ;θ

,θ

)q(φ|D

θ)

−

∗

)∈D

∗

log q(ˆy

∗

= y

∗

, φ, θ,

θ) + βD

(q(θ; θ

, θ

)||r(θ))

(5)

剩余20页未读，继续阅读

某校英文报开辟了一个专栏：Experience。本期话题是如何解决学习中遇到的困难。请你以“My Approsch to Difficulties in Learning”为题，用英语写一篇短文。谈谈自己的一些做法。要求：1.词数120左右;2.短文中不能出现本人的相关信息。

For example, working on practice problems or doing sample questions can help in math or science classes, while using flashcards or repetition can help with memorization. Finally, it's important to ...

1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。

这是一个基于Spring Boot和Redis的后台管理框架，提供了一个基本的架构和代码生成器，有助于快速开发后台应用。它提供了简洁的配置和页面代码生成器，非常适合学习和参考。虽然这是一个相对老旧的版本，但它仍然具有一定的实用价值，尤其是对于那些正在寻找基于Spring Boot和Redis的后台管理框架的人来说。此外，该项目还提供了一个优化版本，采用了SpringBoot2和mybatis-plus技术，具有更强大的功能和更好的性能。总之，这是一个很好的学习项目，能够帮助开发者了解后台管理的最佳实践和最新技术趋势。 1、资源项目源码均已通过严格测试验证，保证能够正常运行； 2、项目问题、技术讨论，可以给博主私信或留言，博主看到后会第一时间与您进行沟通； 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用，尤其对于人工智能、计算机科学与技术等相关专业，更为适合； 4、下载使用后，可先查看README.md文件（如有），本项目仅用作交流学习参考，请切勿用于商业用途。

【精品毕设推荐】-基于微信小程序的电影院订票选座小程序设计与实现.zip

【项目简介】可辅助在本地配置运行电影院订票选座小程序借助微信开发者工具开发用户前端，使用SSM框架和Java语言开发管理员后台，使用Mysql创建数据表保存本系统产生的数据。系统可以提供信息显示和相应服务，其管理员管理影院信息，电影信息，电影资讯信息，管理不同状态的订单。用户查看，收藏，评论影院和电影，可以对喜欢的电影进行选座并支付，在线进行账户充值。总之，电影院订票选座小程序可以更加方便用户在线预订座位并进行电影票的线上支付，也方便了管理员在后台对影院信息，电影以及订单信息进行统一管理。关键词：电影院订票选座小程序；微信开发者工具；SSM框架

【项目简介】可辅助在本地配置运行本电影院订票选座系统采用WXML 、WXS、JS小程序编写语言、微信开发者工具进行微信端开发，使用MYSQL数据库进行系统数据的储存，以微信为入口的，具有快捷、轻便的特点，不占内存，不用下载、安装，而且访问速度很快。系统界面良好，操作简单方便，通过系统概述、系统分析、系统设计、数据库设计、系统测试这几个部分，详细的说明了系统的开发过程，最后并对整个开发过程进行了总结，实现了电影院订票选座的重要功能。本基于微信小程序的电影院订票选座系统运行效果稳定，操作方便、快捷，界面友好，是一个功能全面、实用性好、安全性高，并具有良好的可扩展性、可维护性的电影院订票选座平台。关键词：电影院订票选座；微信小程序；MYSQL数据库；微信开发者工具

粉丝: 0
资源: 40

元学习：无记忆高效学习法

Wide &Deep learning for Recommender Systems

鸡蛋掉落leetcode-Coding-Data-Structures-Algorithms:编码数据结构算法

英国小学打算采用中国式数学教育，然后写你的回应不少于200字，在其中你应该。 •总结摘录的主要信息，然后 •评论中国式教育是否利大于弊。 你应该用节选中的信息来支持自己。要使用英语，成段回复。

最新的域泛化论文，给我推荐几个

advanced algebra is so difficult

运行时间限制为1000ms，你的代码超时

电子词典 代码进一步完善 增加“翻译句子”的功能.zip

MultiSnapRecyclerView：让Android RecyclerView的滚动停靠更灵活（0积分下载）

在线电影娱乐网站系统设计.rar

手机通讯集信息,文件,语音呼叫于一体(小鸟版).zip

基础后台管理框架（基于SpringBoot和Redis）.zip

【精品毕设推荐】-基于微信小程序的电影院订票选座小程序设计与实现.zip

Zblog 的CDNfly-CloudFlare全能CDN自动刷新缓存插件-自动清理-适配优化2.1.0版本

java+毕业设计+扫雷（程序）.zip

【精品毕设推荐】-基于微信小程序的电影院订票选座系统设计与实现.zip

基于springboot的会员制医疗预约服务管理信息系统设计与实现.docx

ActivityGroup + GridView + ViewFlipper 实现选项卡.zip

read-minisnap

Android项目之——漂亮的平台书架.zip

最新资源

英国小学打算采用中国式数学教育，然后写你的回应不少于200字，在其中你应该。 •总结摘录的主要信息，然后 •评论中国式教育是否利大于弊。你应该用节选中的信息来支持自己。要使用英语，成段回复。

电子词典代码进一步完善增加“翻译句子”的功能.zip