神经网络损失函数正则化神经网络损失函数正则化代码
时间: 2024-11-04 18:01:37 浏览: 35
python构建深度神经网络(续).pdf
神经网络中的损失函数是用来衡量模型预测结果与真实值之间的差异程度,而正则化是一种防止过拟合的技术,通过在原始损失函数基础上添加额外的惩罚项。常用的正则化技术有L1正则化和L2正则化。
L1正则化(也叫Lasso回归)会使得权重向量中的一些元素变为0,有助于特征选择。其公式通常在损失函数上加上权重绝对值之和的系数乘积,即\( \lambda \sum|w_i| \)。
L2正则化(也叫Ridge回归)则会让权重尽可能小但非零,避免大权重导致过拟合。它的公式是\( \frac{1}{2} \lambda \sum w_i^2 \)。
在Python的深度学习库如TensorFlow或PyTorch中,添加正则化的例子通常是这样的:
```python
import tensorflow as tf
from tensorflow.keras import regularizers
# 创建一个简单的线性模型
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Dense(64, activation='relu', kernel_regularizer=regularizers.l2(0.01)))
# 定义损失函数(这里假设是均方误差)
loss_fn = tf.keras.losses.MeanSquaredError()
# 使用优化器,并包含正则化
optimizer = tf.keras.optimizers.Adam(learning_rate=0.001)
# 定义训练步骤
def train_step(inputs, targets):
with tf.GradientTape() as tape:
predictions = model(inputs)
loss = loss_fn(targets, predictions)
# 正则化损失
regularization_loss = regularizers.regularization_loss(model.losses)
total_loss = loss + regularization_loss
gradients = tape.gradient(total_loss, model.trainable_variables)
optimizer.apply_gradients(zip(gradients, model.trainable_variables))
```
在这个例子中,`kernel_regularizer=regularizers.l2(0.01)`是在创建Dense层时就应用了L2正则化。
阅读全文