利用现有的数据集进行决策树模型训练,数据集不限,训练完成后,输入新的测试集数据,输入相应的预测值代码咋写
时间: 2024-10-10 16:05:34 浏览: 30
在Python中,可以使用scikit-learn库来构建决策树模型并进行预测。这里是一个简单的例子,假设我们有一个分类任务的数据集(如鸢尾花数据集Iris),以下是步骤:
```python
# 导入所需的库
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# 加载数据集(这里以鸢尾花数据为例)
iris = load_iris()
X = iris.data
y = iris.target
# 数据预处理,通常我们会拆分数据为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建决策树模型
clf = DecisionTreeClassifier()
# 使用训练数据拟合模型
clf.fit(X_train, y_train)
# 预测新数据
def predict_new_data(test_data):
predictions = clf.predict(test_data)
return predictions
# 新的测试集数据
new_test_data = ... # 这里填写你的新测试集数据
# 对新数据进行预测
predictions = predict_new_data(new_test_data)
# 计算预测准确率
accuracy = accuracy_score(y_test, predictions)
print(f"预测准确率为: {accuracy * 100}%")
阅读全文