使用tensorflow实现一个3层的BP神经网络
时间: 2024-02-03 13:13:26 浏览: 24
好的,以下是使用 TensorFlow 实现一个3层的 BP 神经网络的示例代码:
```python
import tensorflow as tf
# 定义超参数
learning_rate = 0.1
num_epochs = 100
batch_size = 128
display_step = 10
# 定义神经网络的参数
n_hidden_1 = 256 # 第一隐藏层的神经元个数
n_hidden_2 = 128 # 第二隐藏层的神经元个数
n_input = 784 # MNIST 数据集输入层的神经元个数(28*28)
n_classes = 10 # MNIST 数据集输出层的神经元个数(0-9)
# 定义输入占位符
X = tf.placeholder(tf.float32, [None, n_input])
Y = tf.placeholder(tf.float32, [None, n_classes])
# 定义权重和偏置变量
weights = {
'h1': tf.Variable(tf.random_normal([n_input, n_hidden_1])),
'h2': tf.Variable(tf.random_normal([n_hidden_1, n_hidden_2])),
'out': tf.Variable(tf.random_normal([n_hidden_2, n_classes]))
}
biases = {
'b1': tf.Variable(tf.random_normal([n_hidden_1])),
'b2': tf.Variable(tf.random_normal([n_hidden_2])),
'out': tf.Variable(tf.random_normal([n_classes]))
}
# 定义前向传播函数
def neural_net(x):
layer_1 = tf.add(tf.matmul(x, weights['h1']), biases['b1'])
layer_2 = tf.add(tf.matmul(layer_1, weights['h2']), biases['b2'])
out_layer = tf.matmul(layer_2, weights['out']) + biases['out']
return out_layer
# 构建模型
logits = neural_net(X)
prediction = tf.nn.softmax(logits)
# 定义损失函数和优化器
loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=logits, labels=Y))
optimizer = tf.train.GradientDescentOptimizer(learning_rate)
train_op = optimizer.minimize(loss_op)
# 定义评估模型的指标
correct_pred = tf.equal(tf.argmax(prediction, 1), tf.argmax(Y, 1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))
# 初始化变量
init = tf.global_variables_initializer()
# 加载 MNIST 数据集
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)
# 开始训练模型
with tf.Session() as sess:
sess.run(init)
for epoch in range(num_epochs):
avg_cost = 0.
total_batch = int(mnist.train.num_examples/batch_size)
# 遍历所有批次进行训练
for i in range(total_batch):
batch_x, batch_y = mnist.train.next_batch(batch_size)
# 运行优化器和损失函数
_, c = sess.run([train_op, loss_op], feed_dict={X: batch_x, Y: batch_y})
# 计算平均损失
avg_cost += c / total_batch
# 每迭代 display_step 次输出一次训练结果
if epoch % display_step == 0:
print("Epoch:", '%04d' % (epoch+1), "cost={:.9f}".format(avg_cost))
print("Optimization Finished!")
# 计算测试集上的准确率
print("Accuracy:", accuracy.eval({X: mnist.test.images, Y: mnist.test.labels}))
```
以上代码中,我们使用 TensorFlow 构建了一个包含两个隐藏层和一个输出层的神经网络。我们使用 MNIST 数据集进行训练和测试。在训练过程中,我们使用交叉熵作为损失函数,使用梯度下降算法进行优化。在每个 epoch 结束后,我们计算平均损失并输出。在训练结束后,我们计算测试集上的准确率来评估模型的性能。