神经网络训练中的数据归一化策略与误区解析

需积分: 50 47 浏览量更新于2024-09-13 收藏 48KB DOC 举报

归一化处理是一种数据预处理技术，主要用于调整输入数据的范围，使其落在一个固定的区间内，从而提高机器学习模型的稳定性和训练效率。在神经网络中，归一化的作用尤为关键，它能够防止某些特征对模型的影响过大，使得所有输入具有相似的重要性。常见的归一化方法包括： 1. **最小-最大归一化**（min-max scaling）：例如MATLAB中的premnmx函数，它将数据缩放到[-1, 1]的范围内。这种方法简单直观，但可能导致某些极端值被过度压缩。 2. **标准化**（Standardization）：如prestd或poststd函数，通过计算每个特征的均值和标准差，使得数据转换为均值为0，标准差为1的标准正态分布。这种方法在激活函数如logsig和tansig，其内部范围通常要求在[-1, 1]或[0, 1]的情况下尤为适用。 3. **Z-score标准化**（也称标准化归一化）：类似于标准化，但不强制将数据集的均值设为0，而是根据整个数据集的平均值和标准差进行调整。这种方法在处理连续且分布不均匀的数据时效果良好。 4. **范围归一化**：比如[0.1, 0.9]范围内的归一化，这种自定义范围的归一化适用于特定的应用场景，可能与模型的特性或算法要求相匹配。 5. **去中心化**（de-meaning）：仅去除数据的均值，不改变数据的尺度，这对于使用purelin函数的神经网络可能更为合适，因为该函数本身不依赖于输入值的大小。值得注意的是，尽管归一化通常会带来更好的模型性能，但也并非总是必需的。有时，不进行归一化，特别是当数据已经在某个范围内时，可能会取得很好的效果，比如在负荷预测这类任务中。关键在于理解数据的特点和模型的需求，选择合适的归一化策略。对于样本数据和测试数据的处理，通常建议分开进行归一化，因为训练集的统计信息不应影响到测试集的评估。在考虑神经网络训练时，需要考虑到数据的极值，尤其是对于激活函数有特定要求的情况，确保归一化的范围符合这些函数的内在机制。归一化处理是数据分析和机器学习中的重要环节，它可以帮助我们优化模型性能，减少模型对异常值的敏感性，同时加速模型的收敛。然而，选择哪种归一化方法取决于具体问题和应用环境，需要根据实际情况灵活运用。

数据归一化处理

1.我有一个问题不太明白，神经网络在训练时，先对数据进行归一化处理，按照常理训练完之后应该对数据再进行反

归一化啊，可是再很多资料上根本就看不出有反归一化这个步骤，而且很多时候训练效果不是很好。请问，哪个大侠

能帮帮我啊

2.看一下 MATLAB 里的 premnmx 函数和 postmnmx 函数.它们一个是归一一个是反归一

3.并不是归一化的数据训练效果就好

4.我也遇到过类似的问题,有篇论文就是用 postmnmx 函数.效果不好可能是样本数据不太准.

5.可以采用标准化 PRESTD，效果很好。

6.样本数据和测试数据是否放在一起归一化？

7.应该将样本数据和测试数据放在一起归一化，不然如果测试数据中有的值比样本数据最大值还大，岂不是超过 1 了？

 神经网络训练的时候，应该考虑极值情况，即归一化的时候要考虑你所需要识别参数的极值，以极值作分母，这样

可能效果更好一点。

8.激发函数如果选用的是倒 s 型函数，应不存在归一化的问题吧

9.我想问大家一下:在神经网络中,只有一个函数即:purelin 这个函数对训练的输出数据不用归一化,而象 logsig 和

tansig 函数都要归一化(如果数据范围不在[-1,1]或[0,1]之间).那既然用 purelin 函数可以不用归一化,为何又是还用归

一化呢?

用神经网络里的 PRESTD, PREPCA, POSTMNMX, TRAMNMX 等函数归一化和直接用 purelin 这个函数有什么区别

啊? 我作负荷预测时,象不用归一化的效果很好呀!

10.purelin 没有作归一化啊,你用 logsig 和 tansig 作为神经元激励函数,输出范围自然限制在[-1,1]或[0,1]之间了

11.

我所知道的关于归一化：

归一化化定义：我是这样认为的，归一化化就是要把你需要处理的数据经过处理后（通过某种算法）限制在你需要的

一定范围内。首先归一化是为了后面数据处理的方便，其次是保正程序运行时收敛加快。

在 matlab 里面，用于归一化的方法共有三中，

（1）premnmx、postmnmx、tramnmx（2）prestd、poststd、trastd（3）是用 matlab 语言自己编程。

premnmx 指的是归一到[－1 1],prestd 归一到单位方差和零均值。（3）关于自己编程一般是归一到[0.1 0.9] 。具

体用法见下面实例。

为什么要用归一化？

为什么要用归一化呢？首先先说一个概念，叫做奇异样本数据，所谓奇异样本数据数据指的是相对于

其他输入样本特别大或特别小的样本矢量。

下面举例：

m=[0.11 0.15 0.32 0.45 30;

0.13 0.24 0.27 0.25 45];

其中的第五列数据相对于其他 4 列数据就可以成为奇异样本数据（下面所说的网络均值 bp）。奇异样本数据存在所引

起的网络训练时间增加，并可能引起网络无法收敛，所以对于训练样本存在奇异样本数据的数据集在训练之前，最好

先进形归一化，若不存在奇异样本数据，则不需要事先归一化。

具体举例：

close all

clear

echo on

clc

%BP 建模

%原始数据归一化

m_data=[1047.92 1047.83 0.39 0.39 1.0 3500 5075;

下载后可阅读完整内容，剩余7页未读，立即下载

dqzhanghh

粉丝: 0

神经网络训练中的数据归一化策略与误区解析

C++实现数据归一化处理方法详解

MATLAB实现数据归一化处理技巧

轴承振动信号归一化处理的程序编写方法

123.rar_matlab 归一化_naturalizationon_归一化_归一化处理_数据 归一化

guiyihua.rar_c++ 数据归一化_guiyihua_归一化_归一化处理_数据 归一 处理

归一化,归一化处理,matlab

CSN.rar_CSN_归一化_归一化处理_数据归一化_面化算法

反归一化处理 python 反归一化处理

标准化处理和归一化处理

使用 MinMaxScaler 对数据进行归一化处理，是对date做归一化处理吗？还是对谁做处理？

最新资源

123.rar_matlab 归一化_naturalizationon_归一化_归一化处理_数据归一化

guiyihua.rar_c++ 数据归一化_guiyihua_归一化_归一化处理_数据归一处理