雇员数据库的简单数据挖掘ID3决策树分类预测python代码
时间: 2023-08-15 20:03:50 浏览: 158
以下是使用Python实现基于ID3决策树算法进行分类预测的示例代码:
```python
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 加载数据
data = pd.read_csv("employees.csv")
# 数据预处理
X = data.drop(['left'], axis=1)
y = data['left']
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 构建决策树模型
dtc = DecisionTreeClassifier()
dtc.fit(X_train, y_train)
# 预测
y_pred = dtc.predict(X_test)
# 计算准确率
acc = accuracy_score(y_test, y_pred)
print("Accuracy:", acc)
```
其中,`employees.csv`是包含所有雇员信息的CSV文件,`left`是标记是否离职的列。我们首先使用`pandas`库加载数据,并进行数据预处理,然后使用`train_test_split`函数将数据划分为训练集和测试集。接着,我们使用`DecisionTreeClassifier`类构建决策树模型,并使用`fit`方法对模型进行训练。最后,我们使用`predict`方法对测试集进行预测,并使用`accuracy_score`函数计算模型的准确率。
需要注意的是,上述代码只是一个简单示例,实际应用中需要根据具体的业务场景进行调整和优化。
阅读全文