csv数据集,十个变量,三个分类的的分类预测代码
时间: 2024-03-20 11:40:54 浏览: 57
好的,以下是一个基于决策树算法的分类预测代码示例:
```python
# 导入必要的库
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 读取csv数据集
data = pd.read_csv('data.csv')
# 将分类变量转换为数字编码
data['class'] = data['class'].astype('category').cat.codes
# 分割数据集为训练集和测试集
X = data.drop('class', axis=1)
y = data['class']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建决策树模型
model = DecisionTreeClassifier()
# 拟合模型并进行预测
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
# 计算预测准确率
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)
```
以上代码假设数据集的文件名为"data.csv",其中第一列为分类变量"class",其余为10个特征变量。分类变量已经被转换为数字编码,具体实现可根据实际情况进行调整。在这个示例中,我们将数据集划分为训练集和测试集,并使用决策树算法进行分类预测,最后计算预测准确率。
阅读全文