预测银行客户借贷情况的Python代码实现
时间: 2023-06-16 12:06:22 浏览: 153
以下是一个简单的 Python 代码示例,用于预测银行客户借贷情况。这个示例使用了逻辑回归模型。
```
# 导入所需的库
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 读取数据集
data = pd.read_csv("bank_loan_data.csv")
# 将分类变量进行独热编码
data = pd.get_dummies(data, columns=["gender", "education", "marital_status", "occupation"])
# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(data.drop(["loan_status"], axis=1), data["loan_status"], test_size=0.2, random_state=42)
# 创建逻辑回归模型
model = LogisticRegression()
# 训练模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
这个示例假设数据集被保存为一个名为 `bank_loan_data.csv` 的 CSV 文件。在这个数据集中,`loan_status` 是目标变量,需要被预测。其他变量可以用来训练模型。首先,我们读取数据集并进行独热编码。然后,我们将数据集划分为训练集和测试集。接下来,我们创建一个逻辑回归模型,并将其拟合到训练集上。最后,我们使用测试集来测试模型的准确率。
阅读全文