分类问题提升：CAN后处理技术详解

版权申诉

135 浏览量更新于2024-08-04 收藏 1.91MB PDF 举报

"该资源是一篇关于分类问题后处理技巧的文章，主要介绍了一种名为CAN (Classification with Alternating Normalization) 的技术，该技术能够提升多分类问题的效果，且几乎不增加额外的预测成本。作者苏剑林通过生活中的朴素思想例子解释了CAN的核心理念，即利用先验分布校正低置信度的预测结果，使其更接近先验分布。文章还提及了不确定性度量的重要性，如熵，但在某些情况下熵可能不完全符合直觉。" 在机器学习和人工智能领域，分类问题是常见的任务之一，其目标是根据输入数据将样本分配到预定义的类别中。分类模型通常会返回每个类别的概率，而非确定性的类别标签。在某些情况下，模型可能会对某些样本的预测结果给出较低的置信度，这可能导致预测性能的下降。 CAN 方法提供了一种解决这个问题的策略。它基于一个假设，即在缺乏信息或者模型对预测结果不确定时，可以利用先验知识或已有的预测结果进行调整。例如，在二分类问题中，如果模型对前一个样本预测为高概率的某一类别，那么在遇到一个预测结果接近50%的样本时，CAN 可能会选择与前者不同的类别，以保持总体类别分布的均衡。这种做法在某些场景下非常有效，如上述的选择题例子，它体现了CAN的思想。论文 "When in Doubt: Improving Classification Performance with Alternating Normalization" 对此进行了深入探讨，尽管原始论文可能没有充分解释其背后的直观概念。熵作为一个衡量不确定性的指标，通常用于表示信息的混乱程度或模型预测的分散程度。然而，熵可能不总是最佳的选择，因为它可能不完全符合人类对于不确定性的直观理解。为了更好地应用CAN，我们需要一个有效的不确定性度量。在实践中，除了熵，还可以考虑其他度量，如最大似然估计、预测间隔、边际概率等。这些度量可以帮助识别模型预测中的不确定性，并指导CAN如何进行调整，使得最终的预测结果更加稳定和可靠。 CAN 是一种巧妙的分类问题后处理技术，它利用朴素的先验知识来优化模型的输出，尤其在多分类问题中能显著提高效果。尽管这种方法看似简单，但其背后的理念和应用价值不容忽视。通过理解和应用CAN，开发者可以在不显著增加计算复杂度的情况下，提升模型的预测性能，从而在实际项目中获得更好的结果。

分

类

问题

后

处

理

技

巧

CAN

，

近

乎

零

成

本

获

取

效

果

提

升

⽂

苏

剑

林

编

智

商

掉

了

⼀

地

单

位

追

⼀

科

技

思

想

朴

素

却

不

平

凡

的

分

类

问题

后

处

理

技

巧

，

浅

显易

懂

的

讲解

，

拿

来

吧

你

！

顾

名

思

义

，

本

⽂

将

会介

绍

⼀

种

⽤

于

分

类

问题

的

后

处

理

技

巧

——CAN

（

Classification with

Alternating Normalization

）

。

经

过

笔

者

的

实

测

，

CAN

确

实

多

数

情

况

下

能

提

升

多

分

类

问题

的

效

果

，

⽽

且

⼏

乎

没

有

增

加

预

测

成

本

，

因

为

它

仅仅

是

对

预

测

结

果

的

简

单

重

新

归

⼀

化

操

作

。

有

趣

的

是

，

其

实

CAN

的

思

想

是

⾮

常

朴

素

的

，

朴

素

到

每

个

⼈

在

⽣

活

中

都

应

该

⽤

过

同

样

的

思

想

。

然

⽽

，

CAN

的

论

⽂

却

没

有

很

好

地

说

清

楚

这

个

思

想

，

只

是

纯粹

形式

化

地

介

绍

和

实

验

这

个

⽅

法

。

本

⽂

的

分

享中

，

将

会

尽

量

将

算

法

思

想

介

绍

清

楚

。

论

⽂

标

题

：

When in Doubt: Improving Classification Performance with Alternating

Normalization

论

⽂

链

接

：

https://arxiv.org/abs/2109.13449

苏

剑

林

2021-10-26

12:05

原

创

夕

⼩

瑶

的

卖

萌

屋

下载后可阅读完整内容，剩余7页未读，立即下载

普通网友

粉丝: 1277
资源:
5623

分类问题提升：CAN后处理技术详解

Spire.Pdf v*.**.**.***0 用例演示：如何去除水印且支持超10页

Aspose.Pdf.dll v17.7.0.0 发布，C# .NET WPF 无限制使用

Spire.Pdf：C# .NET平台免费无水印PDF打印解决方案

C++游戏编程入门.pdf

pdf.js使用文件流预览pdf

VB.NET编程技巧与实例集粹PDF,200个经典实例,非常好的教程.

foxit pdf editor注册码.txt

官方最新itextpdf-5.5.8.jar+中文支持包itext-asian.jar

获取Qt 5.12.12完整源码，体验快速下载

CANFD技术详解：提升数据速率与传输效率

最新资源

Spire.Pdf v*...***0 用例演示：如何去除水印且支持超10页