SKLearn库实现数据集分类(数据集使用datasets类中任一数据集)
时间: 2024-09-18 22:02:04 浏览: 75
车标分类数据集(car logo datasets)
5星 · 资源好评率100%
SKlearn是一个流行的Python机器学习库,它提供了一系列用于数据预处理、特征选择、模型训练和评估的工具。对于数据集分类,你可以使用其中的监督学习算法,例如决策树(DecisionTreeClassifier)、随机森林(RandomForestClassifier)或者支持向量机(SVC)等。
以下是一个基本的例子,假设我们要用Iris数据集(iris dataset)来进行分类,这个数据集包含了三种花卉的不同测量值,我们使用KNN(K-Nearest Neighbors)作为分类器:
```python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import classification_report
# 加载Iris数据集
iris = datasets.load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建KNN分类器
knn = KNeighborsClassifier(n_neighbors=3)
# 训练模型
knn.fit(X_train, y_train)
# 预测测试集
predictions = knn.predict(X_test)
# 输出分类报告
print(classification_report(y_test, predictions))
阅读全文