利用pytorch库,使用iris.csv数据构建神经网络预测花的种类:将所有数据随机分为训练集和测试集,分别计算测试集上总的准确率和不同类的准确率。
时间: 2024-02-01 18:14:09 浏览: 81
好的,这里给出一个利用PyTorch库构建神经网络预测鸢尾花种类的代码示例。
首先,我们需要导入必要的库:
```python
import torch
import torch.nn as nn
import torch.optim as optim
import pandas as pd
from sklearn.model_selection import train_test_split
```
然后,读取iris.csv数据,并将其分成训练集和测试集:
```python
# 读取iris.csv数据
data = pd.read_csv('iris.csv')
# 将数据分成特征和标签
features = data.iloc[:, :-1].values
labels = data.iloc[:, -1].values
# 将标签转换为整数
label_to_int = {'Iris-setosa': 0, 'Iris-versicolor': 1, 'Iris-virginica': 2}
labels = [label_to_int[label] for label in labels]
# 将数据分成训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(features, labels, test_size=0.2, random_state=42)
```
接下来,我们需要定义神经网络模型:
```python
class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.fc1 = nn.Linear(4, 16)
self.fc2 = nn.Linear(16, 3)
def forward(self, x):
x = torch.relu(self.fc1(x))
x = self.fc2(x)
return x
```
这是一个简单的两层全连接神经网络,输入层有4个神经元,输出层有3个神经元,中间层有16个神经元。我们使用ReLU作为激活函数。
然后,我们需要定义损失函数和优化器:
```python
net = Net()
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(net.parameters(), lr=0.01)
```
我们使用交叉熵损失作为损失函数,Adam优化器作为优化器。
接下来,我们可以开始训练模型了:
```python
for epoch in range(100):
running_loss = 0.0
for i in range(len(X_train)):
# 将数据转换为PyTorch张量
inputs = torch.tensor(X_train[i], dtype=torch.float32)
label = torch.tensor(y_train[i], dtype=torch.long)
# 将梯度清零
optimizer.zero_grad()
# 前向传播
outputs = net(inputs)
# 计算损失
loss = criterion(outputs.unsqueeze(0), label.unsqueeze(0))
# 反向传播和优化
loss.backward()
optimizer.step()
running_loss += loss.item()
print('[Epoch %d] loss: %.3f' % (epoch + 1, running_loss / len(X_train)))
```
在每个epoch中,我们遍历训练集中的所有样本,将输入数据和标签转换为PyTorch张量,进行前向传播和反向传播,并更新网络参数。我们还计算了每个epoch的平均损失。
最后,我们可以使用测试集来评估模型表现:
```python
# 在测试集上进行预测
y_pred = []
with torch.no_grad():
for i in range(len(X_test)):
inputs = torch.tensor(X_test[i], dtype=torch.float32)
outputs = net(inputs)
y_pred.append(torch.argmax(outputs).item())
# 计算总的准确率和不同类的准确率
total_acc = sum([1 if y_pred[i] == y_test[i] else 0 for i in range(len(y_test))]) / len(y_test)
class_acc = {}
for label in set(y_test):
class_acc[label] = sum([1 if y_pred[i] == label and y_test[i] == label else 0 for i in range(len(y_test))]) / y_test.count(label)
print('总的准确率:%.3f' % total_acc)
print('不同类的准确率:', class_acc)
```
我们使用torch.no_grad()上下文管理器来禁用梯度计算,以加快预测速度。然后,我们计算了总的准确率和不同类的准确率。
完整的代码如下:
阅读全文