对放贷数据集进行 CART 分类树的完整代码
时间: 2023-11-26 19:21:25 浏览: 108
分类树与CART树python实现(含数据集)
好的,以下是使用 CART 分类树对放贷数据集进行分类的完整代码:
```python
# 导入所需的库
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# 加载数据集
data = pd.read_csv("loan.csv")
# 将目标变量Loan_Status的值转换为0和1
data['Loan_Status'].replace('N', 0,inplace=True)
data['Loan_Status'].replace('Y', 1,inplace=True)
# 将分类变量转换为数值变量
data = pd.get_dummies(data, columns=['Gender', 'Married', 'Dependents', 'Education', 'Self_Employed', 'Property_Area'])
# 将数据集拆分为训练集和测试集
X = data.drop(columns=['Loan_ID', 'Loan_Status'])
y = data['Loan_Status']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建分类树模型
model = DecisionTreeClassifier()
# 训练模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算准确性
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
这段代码将加载"loan.csv"数据集,并使用Pandas将目标变量转换为0和1。然后,它将分类变量转换为数值变量,并将数据集拆分为训练集和测试集。接下来,它创建一个分类树模型,并使用训练数据拟合模型。最后,它使用测试集进行预测,并计算模型的准确性。
阅读全文