import pickle def sigmoid(x): return 1 / (1 + np.exp(-x)) def get_data(): (x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, flatten=True, one_hot_label=False) return x_test, t_test def init_network(): with open("sample_weight.pkl", 'rb') as f: network = pickle.load(f) return network def predict(network, x): W1, W2, W3 = network['W1'], network['W2'], network['W3'] b1, b2, b3 = network['b1'], network['b2'], network['b3'] a1 = np.dot(x, W1) + b1 z1 = sigmoid(a1) a2 = np.dot(z1, W2) + b2 z2 = sigmoid(a2) a3 = np.dot(z2, W3) + b3 y = softmax(a3) return y x, t = get_data() network = init_network() accuracy_cnt = 0 for i in range(len(x)): y = predict(network, x[i]) p = np.argmax(y) # 获取概率最高的元素的索引 if p == t[i]: accuracy_cnt += 1 print("Accuracy:" + str(float(accuracy_cnt) / len(x)))
时间: 2024-01-04 09:03:44 浏览: 124
这段代码看起来已经是一个完整的手写数字识别的示例了。但是由于缺少一些必要的导入语句和函数实现,例如`load_mnist`和`softmax`函数,我无法直接运行它来进行验证。
不过,我可以给你一些建议来优化这段代码:
1. 导入缺失的模块:在代码的开头添加以下导入语句:
```python
import numpy as np
from mnist import load_mnist
```
其中,`numpy`模块用于数值计算,`mnist`模块用于加载MNIST数据集。
2. 实现`softmax`函数:在代码中添加一个`softmax`函数的实现。可以使用`numpy`库来简化计算过程。例如:
```python
def softmax(x):
exp_x = np.exp(x - np.max(x, axis=1, keepdims=True))
return exp_x / np.sum(exp_x, axis=1, keepdims=True)
```
这个函数将输入向量进行指数运算,并进行归一化,使得输出为概率分布。
3. 避免循环调用`predict`函数:当前的代码中使用了循环来逐个预测每个样本的结果。这种方式效率较低。可以使用向量化操作来同时对多个样本进行预测,提高计算速度。例如,可以将整个测试集的输入数据 `x` 作为一个矩阵传递给 `predict` 函数,并通过一次矩阵运算得到预测结果。
下面是修改后的代码示例:
```python
import numpy as np
from mnist import load_mnist
import pickle
def sigmoid(x):
return 1 / (1 + np.exp(-x))
def softmax(x):
exp_x = np.exp(x - np.max(x, axis=1, keepdims=True))
return exp_x / np.sum(exp_x, axis=1, keepdims=True)
def get_data():
(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, flatten=True, one_hot_label=False)
return x_test, t_test
def init_network():
with open("sample_weight.pkl", 'rb') as f:
network = pickle.load(f)
return network
def predict(network, x):
W1, W2, W3 = network['W1'], network['W2'], network['W3']
b1, b2, b3 = network['b1'], network['b2'], network['b3']
a1 = np.dot(x, W1) + b1
z1 = sigmoid(a1)
a2 = np.dot(z1, W2) + b2
z2 = sigmoid(a2)
a3 = np.dot(z2, W3) + b3
y = softmax(a3)
return y
x, t = get_data()
network = init_network()
accuracy_cnt = 0
y = predict(network, x)
p = np.argmax(y, axis=1)
accuracy_cnt = np.sum(p == t)
print("Accuracy:" + str(float(accuracy_cnt) / len(x)))
```
这样修改后的代码通过向量化操作,能够更高效地进行预测,并计算准确率。希望这些建议能对你有所帮助!
阅读全文