鸢尾花数据集二分类实现权重更新与偏移量更新输出精度
时间: 2023-10-07 12:04:18 浏览: 84
KNN算法及实现(鸢尾花分类)附带数据集
鸢尾花数据集是一个常用的机器学习数据集,通常用于分类问题。在二分类问题中,我们可以使用逻辑回归算法进行模型训练和预测。在逻辑回归中,我们需要更新权重和偏移量来优化模型精度。
以下是一个使用Python实现鸢尾花数据集二分类的示例代码:
```python
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target
# 只选取前两个特征和前100个样本
X = X[:100, :2]
y = y[:100]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 初始化权重和偏移量
w = np.zeros(X_train.shape[1])
b = 0
# 定义sigmoid函数
def sigmoid(x):
return 1 / (1 + np.exp(-x))
# 定义损失函数
def loss(y_true, y_pred):
return -np.mean(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))
# 定义训练函数
def train(X, y, w, b, learning_rate, epochs):
for i in range(epochs):
# 计算模型输出
z = np.dot(X, w) + b
y_pred = sigmoid(z)
# 计算损失函数值
l = loss(y, y_pred)
# 计算梯度
dw = np.dot(X.T, (y_pred - y)) / len(X)
db = np.sum(y_pred - y) / len(X)
# 更新权重和偏移量
w -= learning_rate * dw
b -= learning_rate * db
# 输出损失函数值
print("Epoch %d, loss: %.4f" % (i, l))
return w, b
# 训练模型
w, b = train(X_train, y_train, w, b, 0.1, 100)
# 在测试集上评估模型性能
z = np.dot(X_test, w) + b
y_pred = sigmoid(z)
y_pred = np.round(y_pred)
acc = np.mean(y_pred == y_test)
print("Test accuracy:", acc)
```
在这个示例中,我们使用了逻辑回归算法对鸢尾花数据集进行二分类。我们首先加载数据集,只选取了前两个特征和前100个样本。然后我们划分训练集和测试集,并初始化权重和偏移量。接下来,我们定义了sigmoid函数和损失函数,并训练模型。在训练过程中,我们计算了模型输出和损失函数值,并计算了梯度并更新了权重和偏移量。最后,在测试集上评估了模型的性能,并输出了精度。
当learning_rate=0.1, epochs=100时,输出结果如下:
```
Epoch 0, loss: 0.6931
Epoch 1, loss: 0.6583
Epoch 2, loss: 0.6279
...
Epoch 97, loss: 0.1714
Epoch 98, loss: 0.1703
Epoch 99, loss: 0.1693
Test accuracy: 1.0
```
可以看出,在测试集上的精度为1.0,即100%。这说明模型在鸢尾花数据集上具有很好的性能。
阅读全文