深度学习入门:回归问题与波士顿房价数据

34 下载量 50 浏览量 更新于2024-08-30 2 收藏 240KB PDF 举报
深度学习从零开始 —— 神经网络(六),回归问题,波士顿房间数据 深度学习中,回归问题是指预测输入数据对应的一个连续值,而不是离散的标签。例如根据气象数据预测气温等等。在本节中,我们将使用波士顿房价数据集来演示回归问题。 波士顿房价数据集是根据13种不同数值,例如周边学校个数、犯罪率等等,来预测房价的数据集。该数据集有404个训练样本和102个测试样本,每个样本包含13个特征,目标是每个样本对应的房价,单位是千美元。 在加载数据时,我们使用Keras的boston_housing模块来加载数据集,并将其分为训练数据和测试数据。训练数据有404个样本,测试数据有102个样本,每个样本都包含13个特征。 数据预处理是深度学习中非常重要的一步。由于取值范围差异很大的数据输入到神经网络可能会导致网络学习困难,因此我们需要对数据进行标准化。标准化的方法是将每个特征减去平均值,再除以标准差,这样得到的特征平均值为0,标准差为1。 在构建网络时,我们定义了一个构建模型的方法,使用Keras的Sequential API来构建神经网络。该网络包含三个dense层,第一个dense层的输入维度是13,激活函数是ReLU,第二个dense层的激活函数也是ReLU,第三个dense层的激活函数是线性的。我们使用mean squared error作为损失函数,并使用adam优化器来优化网络参数。 在本节中,我们学习了回归问题的定义和波士顿房价数据集的使用,并了解了数据预处理的重要性和构建神经网络的方法。这些知识点对于深度学习的学习和应用都是非常重要的。 知识点: 1. 回归问题的定义:预测输入数据对应的一个连续值,而不是离散的标签。 2. 波士顿房价数据集:根据13种不同数值来预测房价的数据集。 3. 数据预处理:将取值范围差异很大的数据进行标准化,减去平均值,再除以标准差。 4. 构建神经网络:使用Keras的Sequential API来构建神经网络,定义了三个dense层。 5. 损失函数:使用mean squared error作为损失函数。 6. 优化器:使用adam优化器来优化网络参数。 本节中我们学习了深度学习中的回归问题和波士顿房价数据集的使用,并了解了数据预处理和构建神经网络的方法,这些知识点对于深度学习的学习和应用都是非常重要的。