解决机器学习模型欠规范问题的策略

161 浏览量更新于2024-06-19 收藏 2.19MB PDF 举报

"本文主要探讨了机器学习模型的欠规范问题及其解决方法。欠规范是指在数据集中，尽管模型在精度上表现良好，但可能存在多个模型在不同属性上，如分布外（OOD）性能上存在显著差异。这使得仅依靠预测准确性评估模型的可靠性变得困难。作者提出了一种形式化欠规范的概念，并设计了一种策略来识别和部分解决这个问题。通过独立训练多个模型并利用约束优化，他们能够揭示标准经验风险最小化（ERM）忽视的预测特征，然后将这些特征整合到一个具有优秀OOD性能的全局模型中。此外，他们强调了模型需要与数据流形对齐，以确保发现有意义的特征。这种方法在多个计算机视觉数据集上进行了验证，并表明没有额外假设，仅凭域内性能无法评估OOD模型的选择。欠规范问题在图像识别等任务中尤为突出，因为某些任务需要额外的领域知识才能正确泛化，而这些知识可能无法仅从数据中学习到。" 在机器学习中，欠规范问题是一个核心挑战，它指出即使模型在训练数据上的表现很好，也可能无法捕捉到所有理想属性，尤其是与领域专家对任务理解的匹配程度。欠规范问题的存在可能导致模型在未见过的数据上表现不佳，比如分布外泛化。为了解决这个问题，研究者提出了一个方法，通过独立训练多个模型并施加独立性约束，促进模型学习不同的预测特征。这种方法有助于发现那些在标准训练过程中被忽视的特征，这些特征可以提高模型的泛化能力，特别是在OOD情况下的性能。论文中提到的计算机视觉领域的例子，强调了在图像识别任务中，模型需要学习到区分对象和背景的特征，而这些特征可能不会在训练数据中自然出现。因此，引入额外的归纳偏差或领域知识对于构建鲁棒的模型至关重要。通过这种方法，研究者能够在多个数据集上展示出改善模型性能的潜力，同时也提醒了我们在评估模型时不应只依赖于域内性能，而应考虑更广泛的评估指标，特别是对于分布外泛化的评估。欠规范问题提醒我们，机器学习模型的优化不应仅仅局限于训练数据上的预测准确度，还需要关注模型在新环境和未知条件下的表现。通过深入理解和解决欠规范问题，我们可以构建出更加可靠和泛化的机器学习模型。

+v：mala2255获取更多论

文

我

P T

mask

两个可能的决策边界（红色/蓝色），一

个训练点的输入梯度，

以及它们在流形

输入空间

数据流形

□

●

□

●

›

□

两个班的

培训点。

›

测试点，

OOD

，未指定。

图

：所提出的方法在输入空间中的效果。数据，如自然图像被假定为躺在一个低维流形。训练集覆

盖这个流形的一个子集（灰色椭圆）。

OOD

测试数据（

›

）不在此子集范围内。在这个例子中，我们

的方法发现了两个模型（红色和蓝色决策边界），它们的输入梯度是正交的（在一个训练点上显示，

颜色与边界匹配）。即使第三个模型（绿色向量）可以满足正交约束，其输入梯度也会指向流形之

外。这将违反

流形上

的约束，该约束要求梯度与它们在流形上的投影紧密

域内性能（图6c），因为它只消除了模型

整体学习目标结合了预测性、独立性和流形上损失：

t r

，

...

{

indep

，

{

流形

（三）

4.3

微调

在用（3）训练了一组模型之后，我们建议放松独立性和流形上约束（λ

indep

，λ

manifold

），

然后微调模型。这简化了优化，并且通常允许模型达到更高的预测精度。具体地说，我们

对数据应用二进制掩码，这样每个模型只在与自身最相关的元素上进行微调：

掩模

，

. 在开始微调之前计算掩码，以突出显示与每个模型最相关的数据。每个元素

（即像素或通道）仅针对具有最大对应梯度幅度的模型进行去掩蔽：

我

1 m

，

？q

t r

（五）

我们根据每个模型自己的数据屏蔽版本进行微调

]

这确保了尽管禁用正则化器

（

indep

<$0

，

manifold

<$0

），模型仍然是不同的有关总结，请参见算法

4.4

将多个模型浓缩为一个

最后，在训练/微调一组模型后，我们建议将其中最好的模型组合成一个使用所有最相关特

征的全局模型。

我们从头开始训练这个全局模型，没有正则化器，如上所述，使用来自

多

个选定模型的掩码与逻辑OR相结合。在我们的实验中，我们将两种模型结合起来，

在我们的实现中，掩码元素不被替换为零，而是用当前小批量中其他实例的随机值进行赋值

]

我们在屏蔽数据上从头开始微调和重新训练模型之间获得了非常相似的结果

我们的模型组合并不等同于一个整体：我们训练一个全局模型来使用/忽略特定的、选定的特征。相

比之下，传统的集成在预测空间中组合模型，依赖于它们的不相关误差来降低预测方差。参见附录

，我们的方法与预测空间中的解纠缠的类比。

‚

剩余27页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

解决机器学习模型欠规范问题的策略

机器学习——数据不均衡及解决方案

软件工程中的机器学习与模型优化.pptx

数据驱动模型和机器学习模型

在深度学习模型中如何插入机器学习模型

机器学习中欠拟合与解决措施？

机器学习模型python

springboot加载机器学习模型

机器学习java模型

机器学习模型人工智能

机理模型和机器学习模型如何结合

最新资源