二项逻辑斯蒂回归python实现
时间: 2024-12-02 11:27:57 浏览: 4
二项逻辑斯蒂回归(Binary Logistic Regression)是一种广泛应用于预测二分类问题的概率模型。在Python中,我们可以使用scikit-learn库来实现。以下是基本步骤:
1. 导入所需库:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import LabelEncoder
```
2. 加载数据并准备:
```python
# 假设df是你的数据集
X = df.drop('target_column', axis=1) # 提取特征列
y = df['target_column'] # 提取目标列
# 对分类变量进行编码
le = LabelEncoder()
y = le.fit_transform(y)
```
3. 划分训练集和测试集:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 创建并训练模型:
```python
model = LogisticRegression(multi_class='auto') # 自动选择最适合的算法(对于二分类,自动选择二元逻辑回归)
model.fit(X_train, y_train)
```
5. 预测及评估性能:
```python
predictions = model.predict(X_test)
accuracy = model.score(X_test, y_test)
```
你可以通过`predict_proba()`方法获取每个样本属于正类别的概率。
阅读全文