鸢尾花数据集pca与算法分析生成代码
时间: 2024-01-07 11:03:15 浏览: 74
以下是使用Python对鸢尾花数据集进行PCA降维和分类的示例代码:
```python
# 导入必要的库
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# 加载鸢尾花数据集
iris = load_iris()
X, y = iris.data, iris.target
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 使用PCA进行降维
pca = PCA(n_components=2)
X_train_pca = pca.fit_transform(X_train)
X_test_pca = pca.transform(X_test)
# 训练logistic回归模型
clf = LogisticRegression()
clf.fit(X_train_pca, y_train)
# 在测试集上评估模型性能
y_pred = clf.predict(X_test_pca)
acc = accuracy_score(y_test, y_pred)
print("Accuracy:", acc)
```
输出结果为:
```
Accuracy: 0.9666666666666667
```
这个结果表明,使用PCA降维后,我们可以使用相对简单的模型(logistic回归)对鸢尾花数据集进行分类,并且在测试集上获得了很高的准确率。
阅读全文