写一段代码在完成决策树模型准确率预测后,怎么输入几个普通值和特征编码值来预测结果
时间: 2024-02-22 12:54:55 浏览: 56
下面是一个使用Python实现在完成决策树模型准确率预测后,输入几个普通值和特征编码值来预测结果的示例代码:
```python
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder
from sklearn.tree import DecisionTreeClassifier
# 加载数据集
data = pd.read_csv('data.csv')
# 对特征进行编码
cat_columns = ['color', 'size'] # 需要编码的特征列
data_encoded = pd.get_dummies(data, columns=cat_columns)
# 拆分数据集
X = data_encoded.drop('label', axis=1)
y = data_encoded['label']
# 训练模型
clf = DecisionTreeClassifier()
clf.fit(X, y)
# 预测准确率
accuracy = clf.score(X, y)
print('Accuracy:', accuracy)
# 输入普通值和编码值进行预测
X_test = pd.DataFrame({'color': ['blue'], 'size': ['M'], 'price': [10]}) # 测试数据
for col in cat_columns:
le = LabelEncoder()
le.fit(X[col])
X_test[col] = le.transform(X_test[col])
y_pred = clf.predict(X_test)
print('Predicted label:', y_pred)
```
在上面的代码中,我们首先使用pandas库的get_dummies函数对特征进行独热编码,然后使用LabelEncoder对测试数据进行编码。接着,我们使用sklearn库的DecisionTreeClassifier进行模型训练和预测准确率计算。最后,我们输入普通值和编码值进行预测,并输出预测结果。
阅读全文