iris数据集如何使用
时间: 2023-09-14 21:11:59 浏览: 141
iris数据集是一个经典的机器学习数据集,其中包含了150个样本,每个样本有4个特征:花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width),以及一个标签:鸢尾花的类别(Iris Setosa、Iris Versicolour或Iris Virginica)。
使用iris数据集,可以进行分类、聚类、降维等多种机器学习任务。以下是使用iris数据集进行分类的一个例子:
1. 加载iris数据集
```python
from sklearn.datasets import load_iris
iris = load_iris()
X = iris.data
y = iris.target
```
2. 数据预处理
```python
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(X)
```
3. 划分训练集和测试集
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 训练模型
```python
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_train, y_train)
```
5. 评估模型性能
```python
from sklearn.metrics import accuracy_score
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
以上是一个简单的使用iris数据集进行分类的例子。使用其他的机器学习算法,也可以进行聚类、降维等其他的任务。
阅读全文