写出机器学习实战之逻辑斯蒂回归模型: 使用的数据集:train_binary.csv 选取 2/3 数据作为训练集, 1/3 数据作为测试集的代码
时间: 2024-02-16 20:02:59 浏览: 92
机器学习——逻辑回归数据集
好的,以下是使用逻辑斯蒂回归模型进行二分类的机器学习实战,使用的数据集是`train_binary.csv`,并选取2/3数据作为训练集,1/3数据作为测试集的代码。
```python
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 读取数据集
data = pd.read_csv('train_binary.csv')
# 提取特征和标签
X = data.drop(['label'], axis=1)
y = data['label']
# 切分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)
# 定义逻辑斯蒂回归模型,并拟合训练集
model = LogisticRegression()
model.fit(X_train, y_train)
# 在测试集上进行预测,并计算准确率
y_pred = model.predict(X_test)
acc = accuracy_score(y_test, y_pred)
print('Accuracy:', acc)
```
代码说明:
1. 首先使用`pandas`库读取数据集`train_binary.csv`。
2. 然后,将数据集中的特征和标签分别提取出来,其中特征是除了`label`列以外的所有列,标签就是`label`列。
3. 接着,使用`train_test_split`函数将数据集划分为训练集和测试集,其中测试集的大小为整个数据集的1/3。
4. 然后,定义逻辑斯蒂回归模型,并使用训练集对模型进行拟合。
5. 最后,在测试集上进行预测,并计算准确率。
阅读全文