复杂的决策树商品数据挖掘实例代码
时间: 2024-07-07 18:01:15 浏览: 149
决策树是一种常用的机器学习算法,尤其适用于分类和回归问题。在商品数据挖掘中,我们可能想要预测用户是否会购买某个产品,或者基于用户的行为特征推荐相关商品。以下是一个使用Python的scikit-learn库构建简单决策树的示例代码,以鸢尾花数据集为例:
```python
# 导入所需库
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
import pandas as pd
# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target
# 将数据划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建决策树分类器
clf = DecisionTreeClassifier()
# 训练模型
clf.fit(X_train, y_train)
# 预测测试集
predictions = clf.predict(X_test)
# 评估模型性能
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_test, predictions)
print(f"Accuracy: {accuracy}")
# 可视化决策树(对于大型数据集可能不现实)
# from sklearn.tree import export_graphviz
# export_graphviz(clf, out_file='iris_tree.dot', feature_names=iris.feature_names, class_names=iris.target_names)
# 代码中的复杂决策树通常会包含更多的参数调整,如树的深度、切割标准等,具体实例可能会根据实际数据集和业务需求进行定制。
阅读全文