OECC方法：实现深度学习中的置信度控制和分布外检测

需积分: 50 112 浏览量更新于2024-11-24 收藏 96.97MB ZIP 举报

资源摘要信息:"OOD-detection-using-OECC:具有置信度控制的异常值分布，用于分布外检测" 在深度学习领域，OOD（Out-of-Distribution）检测是一个重要课题，它涉及到模型如何区分训练数据分布（In-Distribution，简称ID）与未知的或者与训练数据分布显著不同的数据（Out-of-Distribution，简称OOD）。正确地进行OOD检测在诸多实际应用中至关重要，比如异常检测、安全性监控和模型泛化能力评估。 1. 具有置信度控制的异常值暴露（OECC）技术是什么？ OECC是一种基于深度神经网络（DNN）的技术，其目标是提高模型对于ID数据的判别能力，并通过一种特殊的方法使得模型对于OOD数据有较高的不确定性，即低置信度预测。OECC通过修改softmax层的输出来实现这一点，使得模型在面对OOD样本时输出接近均匀分布的概率分布，从而达到一个“置信度控制”的效果。这种方法不需要OOD样本参与模型的训练过程，因此对于新的、未见过的数据分布具有很好的泛化能力。 2. OECC的关键组成部分及其实现机制： OECC的核心在于使用一种特殊的损失函数来训练DNN，这个损失函数通常包括两部分：一部分是针对ID样本的标准交叉熵损失，另一部分是针对预测置信度的正则化项，后者在模型预测OOD样本时发挥作用。在训练过程中，模型会被鼓励在面对ID样本时输出高置信度的预测，而在面对OOD样本时输出接近均匀分布的低置信度预测。 3. OECC的应用与实验结果：在图像和文本分类任务中，OECC已经被证实是一种有效的OOD检测方法。实验结果显示，在这些任务中使用OECC可以取得比现有技术（SOTA，State-of-the-Art）更好的检测效果。此外，研究表明，将OECC与现有的后训练方法（如熵正则化、能量得分等）结合使用，可以在OOD检测任务中进一步提高性能，达到当前的最佳结果。 4. 相关标签的含义： - Deep Learning：指深度学习，是机器学习的一个子领域，使用深度神经网络模拟人脑的结构和功能。 - PyTorch：是一种开源机器学习库，广泛应用于深度学习领域，以其易用性和灵活性受到研究者和开发者的青睐。 - Calibration：指概率校准，是一种提高模型预测置信度准确性的技术，可以提高模型对自身预测的准确性评估。 - Anomaly Detection：异常检测，是一种识别数据集中不正常、不期望或不寻常模式的技术。 - Novelty Detection：新颖性检测，特别关注于识别新颖的、未曾见过的数据模式。 - In-Distribution：指数据分布内，通常指模型训练时使用的数据分布。 - Out-of-Distribution Detection：分布外检测，涉及检测模型是否在面对新的或者与训练数据分布不同的数据时作出识别。 - Confidence Control：置信度控制，指通过某种方法控制或调节模型的预测置信度。 - Outlier Exposure：异常值暴露，是一种训练策略，通过让模型暴露于一些异常样本，以提高模型对OOD数据的识别能力。 - Jupyter Notebook：是一种开源的Web应用，可以创建和共享包含代码、方程、可视化和文本的文档。 5. OOD-detection-using-OECC存储库的文件名称列表：通过提供的文件名称列表（OOD-detection-using-OECC-master），我们可以推断该存储库可能包含了实现OECC技术的完整代码、文档说明、配置文件以及可能包含的实验数据和结果。这些文件为研究者和实践者提供了一个可以直接利用的平台，以进一步探索、验证和改进OECC方法。通过上述内容，我们可以对OOD检测技术以及OECC方法有了一定的了解。OECC的出现提供了一种无需OOD样本来提高模型对未知数据判别能力的新思路，这在强化模型泛化能力以及保证人工智能系统的鲁棒性方面具有重要意义。

收起资源包目录

OOD-detection-using-OECC:具有置信度控制的异常值分布，用于分布外检测（115个子文件）

model.dict 2.56MB

cifar_resnet.py 4KB

20ng-train.txt 13.92MB

display_results.py 6KB

fine_tune_OECC.ipynb 21KB

Zero_Shot_ResNet_Cifar100.ipynb 29KB

svhn_wrn_baseline_training_results.csv 1KB

wrn.py 4KB

densenet.py 7KB

dummy 1B

README.md 3KB

Zero_Shot_cifar10_densenet_OECC_tune_training_results.csv 530B

svhn_wrn_OECC_tune_training_results.csv 209B

lib_generation.py 18KB

svhn_ResNet34_Mahal_OECC_tune_training_results.csv 209B

dummy 1B

display_results.py 6KB

README.md 1KB

cifar10_wrn_baseline_epoch_99.pt 8.62MB

tinyimages_80mn_loader.py 2KB

Mahalanobis_OECC_tune_svhn.ipynb 12KB

lsun_loader.py 4KB

densenet_cifar10.pth 3.14MB

resnet.py 8KB

Zero_Shot_svhn_densenet_OECC_tune_training_results.csv 209B

Zero_Shot_DenseNet_Cifar100.ipynb 37KB

README.md 5KB

cifar100_wrn_baseline_epoch_99.pt 8.66MB

model.dict 2.32MB

Test_eval_OOD_20ng.ipynb 19KB

reformat_wikitext.py 1KB

cifar100_ResNet34_Mahal_OECC_tune_training_results.csv 709B

validation_dataset.py 3KB

zero_shot_calculate_log.py 7KB

cifar_resnet.py 4KB

dummy 1B

calculate_log.py 4KB

Zero_Shot_cifar100_densenet_OECC_tune_epoch_9.pth 3.25MB

tiny_resnet.py 4KB

wrn.py 4KB

README.md 2KB

resnet.py 8KB

Zero_Shot_cifar10_densenet_OECC_tune_epoch_14.pth 3.13MB

Test_eval_OOD_sst.ipynb 21KB

baseline_cifar10_places365_distribution.png 18KB

model_finetune.dict 2.55MB

densenet_cifar100.pth 3.25MB

validate_cifar.ipynb 17KB

densenet_svhn.pth 3.09MB

Zero_Shot_ResNet_Cifar10.ipynb 30KB

Test_eval_OOD_trec.ipynb 20KB

20ng-test.txt 9.02MB

baseline_cifar.ipynb 11KB

cifar100_wrn_OECC_tune_training_results.csv 1KB

svhn_loader.py 5KB

dummy 1B

lib_regression.py 3KB

Zero_Shot_DenseNet_SVHN.ipynb 32KB

yelp.csv 6.87MB

Zero_Shot_DenseNet_Cifar10.ipynb 50KB

tinyimages_80mn_loader.py 2KB

svhn_wrn_baseline_epoch_19.pt 10.51MB

cifar10_wrn_baseline_training_results.csv 3KB

Validation_eval_OOD_trec.ipynb 12KB

svhn_wrn_OECC_tune_epoch_4.pt 10.51MB

Mahalanobis_OECC_tune_cifar.ipynb 13KB

cifar10_wrn_OECC_tune_epoch_14.pt 8.62MB

tiny_resnet.py 4KB

OOD_Generate_Mahalanobis.ipynb 7KB

OECC_cifar10_places365_distribution.png 17KB

README.md 2KB

test_cifar.ipynb 20KB

model_finetune.dict 2.32MB

model_finetune.dict 2.56MB

dummy 1B

README.md 987B

download_wikitext.py 4KB

calibration_tools.py 4KB

validation_dataset.py 3KB

lsun_loader.py 4KB

cifar100_wrn_baseline_training_results.csv 3KB

model.dict 2.55MB

Validation_eval_OOD_20ng.ipynb 12KB

Validation_eval_OOD_sst.ipynb 14KB

OECC_tune_SVHN.ipynb 12KB

baseline_SVHN.ipynb 10KB

Zero_Shot_cifar100_densenet_OECC_tune_training_results.csv 379B

OOD_Regression_Mahalanobis.ipynb 5KB

calibration_tools.py 4KB

Zero_Shot_svhn_densenet_OECC_tune_epoch_4.pth 3.13MB

cifar100_wrn_OECC_tune_epoch_29.pt 8.67MB

svhn_loader.py 5KB

test_SVHN.ipynb 17KB

OECC_tune_cifar.ipynb 13KB

Zero_Shot_ResNet_SVHN.ipynb 30KB

data_loader.py 5KB

baseline_train.ipynb 15KB

cifar10_wrn_OECC_tune_training_results.csv 531B

cifar10_ResNet34_Mahal_OECC_tune_training_results.csv 1014B

共 115 条

张岱珅

粉丝: 51
资源: 4689

OECC方法：实现深度学习中的置信度控制和分布外检测

常见30种数学建模模型

outlier-exposure:具有异常值暴露的深度异常检测（ICLR 2019）

OOD检测：使用MNIST和SVHN的基本分发示例

FSSD_OoD_Detection:用于分布不足检测的特征空间奇异性。 （SafeAI 2021）

Object-Oriented-Design-in-PHP:PHP 中的面向对象设计作者：Matthew Machuga

job-interview-solid-principles-test:测试对基本原理和模式的理解的编程工作面试问题

ood-container:SJTU HPC的OOD容器收集

OOD-Assignment-12-MVC-Pattern

OOD-Java

lurc-ood-desktop：LURC的OOD门户上的CentOS桌面的奇异性定义文件和Dockerfiles

最新资源

FSSD_OoD_Detection:用于分布不足检测的特征空间奇异性。（SafeAI 2021）