TensorFlow过拟合实战：数据集与解决策略

30 浏览量更新于2024-08-31 收藏 691KB PDF 举报

本文将详细介绍如何在TensorFlow中处理过拟合问题，通过一个实战案例来深入理解。首先，我们从构建数据集开始，利用scikit-learn库中的make_moons函数生成了一个二维数据集，样本特性向量长度为2，标签0和1分别代表两个类别。为了观察过拟合，我们选择了1000个样本，并在数据中加入了高斯噪声，以模拟现实世界中可能存在的不确定性。在数据预处理阶段，通过train_test_split函数将数据划分为训练集和测试集，以评估模型在未知数据上的表现。这样做的目的是确保模型不会仅仅记住训练数据的细节，而是学习到数据的通用规律。接下来，我们将使用TensorFlow的Keras API构建一个简单的神经网络模型。在这个例子中，可能会使用Sequential模型结构，其中包含全连接层（fully connected layers）和可能的正则化技术，如L1或L2正则化，以及Dropout层，以防止模型过度复杂化，从而减少过拟合的风险。 L1和L2正则化是通过在损失函数中添加权重项来实现的，它们会使模型倾向于选择较小的权重值，防止参数过大导致的过拟合。Dropout则是通过在训练过程中随机关闭一部分神经元，迫使模型学习到多个独立的表示，从而提高泛化能力。在模型训练过程中，我们将密切关注验证集的表现，因为过拟合通常在训练集上表现良好，但在验证集上性能下降。如果发现验证集误差持续增加，模型很可能出现了过拟合。这时，可以尝试调整模型复杂度、增加数据量、使用更复杂的正则化策略或者早停（early stopping）等方法来缓解过拟合。在文章的最后部分，会展示如何使用可视化工具（如matplotlib和seaborn）分析训练过程中的损失曲线和精度变化，以直观地理解模型的学习过程和过拟合现象。此外，还会提供如何调整超参数以及如何在实际项目中应用这些知识的指导。这篇文章将深入探讨如何在TensorFlow中通过实例来识别和解决过拟合问题，通过实践操作和理论结合，帮助读者提升模型的泛化能力并优化模型性能。

详解详解tensorflow之过拟合问题实战之过拟合问题实战

过拟合问题实战过拟合问题实战

1.构建数据集构建数据集

我们使用的数据集样本特性向量长度为 2，标签为 0 或 1，分别代表了 2 种类别。借助于 scikit-learn 库中提供的

make_moons 工具我们可以生成任意多数据的训练集。

import matplotlib.pyplot as plt

# 导入数据集生成工具

import numpy as np

import seaborn as sns

from sklearn.datasets import make_moons

from sklearn.model_selection import train_test_split

from tensorflow.keras import layers, Sequential, regularizers

from mpl_toolkits.mplot3d import Axes3D

为了演示过拟合现象，我们只采样了 1000 个样本数据，同时添加标准差为 0.25 的高斯噪声数据：

def load_dataset():

# 采样点数

N_SAMPLES = 1000

# 测试数量比率

TEST_SIZE = None

# 从 moon 分布中随机采样 1000 个点，并切分为训练集-测试集

X, y = make_moons(n_samples=N_SAMPLES, noise=0.25, random_state=100)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=TEST_SIZE, random_state=42)

return X, y, X_train, X_test, y_train, y_test

make_plot 函数可以方便地根据样本的坐标 X 和样本的标签 y 绘制出数据的分布图：

def make_plot(X, y, plot_name, file_name, XX=None, YY=None, preds=None, dark=False, output_dir=OUTPUT_DIR):

# 绘制数据集的分布， X 为 2D 坐标， y 为数据点的标签

if dark:

plt.style.use('dark_background')

else:

sns.set_style("whitegrid")

axes = plt.gca()

axes.set_xlim([-2, 3])

axes.set_ylim([-1.5, 2])

axes.set(xlabel="$x_1$", ylabel="$x_2$")

plt.title(plot_name, fontsize=20, fontproperties='SimHei')

plt.subplots_adjust(left=0.20)

plt.subplots_adjust(right=0.80)

if XX is not None and YY is not None and preds is not None:

plt.contourf(XX, YY, preds.reshape(XX.shape), 25, alpha=0.08, cmap=plt.cm.Spectral)

plt.contour(XX, YY, preds.reshape(XX.shape), levels=[.5], cmap="Greys", vmin=0, vmax=.6)

# 绘制散点图，根据标签区分颜色m=markers

markers = ['o' if i == 1 else 's' for i in y.ravel()] mscatter(X[:, 0], X[:, 1], c=y.ravel(), s=20, cmap=plt.cm.Spectral, edgecolors='none', m=markers, ax=axes)

# 保存矢量图

plt.savefig(output_dir + '/' + file_name)

plt.close()

def mscatter(x, y, ax=None, m=None, **kw):

import matplotlib.markers as mmarkers

if not ax: ax = plt.gca()

sc = ax.scatter(x, y, **kw)

if (m is not None) and (len(m) == len(x)):

paths = [] for marker in m:

if isinstance(marker, mmarkers.MarkerStyle):

marker_obj = marker

else:

marker_obj = mmarkers.MarkerStyle(marker)

path = marker_obj.get_path().transformed(

marker_obj.get_transform())

paths.append(path)

sc.set_paths(paths)

return sc

X, y, X_train, X_test, y_train, y_test = load_dataset()

make_plot(X,y,"haha",'月牙形状二分类数据集分布.svg')

下载后可阅读完整内容，剩余8页未读，立即下载

weixin_38737565

粉丝: 7
资源: 901

TensorFlow过拟合实战：数据集与解决策略

机器学习-03. 梯度下降和过拟合和归一化（上）

【防止过拟合】：TensorFlow正则化技术的实战指南

详解Pytorch 使用Pytorch拟合多项式(多项式回归)

Tensorflow 实战Google深度学习

TensorFlow可视化神器：TensorBoard实战与功能详解

TensorFlow实战：卷积神经网络详解与实现教程

Tensorflow实战：卷积神经网络CIFAR-10训练详解

Tensorflow 2.1 Inception网络：Cifar10实战与87.88%测试精度详解

卷积神经网络详解：层级结构与实战应用

TensorFlow模型压缩与优化技术详解

最新资源