Bank Marketing数据集用于客户行为预测,用sklearn自带的函数实现逻辑回归,建立回归模型
时间: 2024-12-15 08:15:04 浏览: 14
机器学习数据,解析解,逻辑回归.rar
Bank Marketing 数据集是一个常见的金融领域数据集,常用于机器学习中的分类任务,特别是二分类问题,比如预测客户是否会办理某项银行产品。在使用sklearn库进行分析时,逻辑回归是一种常用的算法,因为它能够处理数值型和类别型特征,并且解释性强。
首先,你需要做的是导入必要的库并加载数据集:
```python
import pandas as pd
from sklearn.datasets import load_breast_cancer # 这里是错误的,应该是load_bankMarketing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
# 加载数据
data = load_bankMarketing()
X = data.data
y = data.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
然后对数据进行预处理,通常包括特征缩放(如标准化):
```python
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)
```
接着,你可以创建并训练逻辑回归模型:
```python
model = LogisticRegression()
model.fit(X_train_scaled, y_train)
```
最后,评估模型性能:
```python
y_pred = model.predict(X_test_scaled)
accuracy = model.score(X_test_scaled, y_test)
print("Accuracy:", accuracy)
```
阅读全文