逻辑回归实战练习——根据学生成绩预测是否被录取

本次逻辑回归实战练习我们将使用一个经典的数据集——“学生录取数据集”。该数据集包含三个特征变量：考试1成绩、考试2成绩、录取结果（0表示未被录取，1表示被录取）。我们的目标是构建一个逻辑回归模型，根据学生的两次考试成绩预测学生是否会被录取。步骤1：导入必要的库和数据集我们需要导入以下库： - pandas：用于数据加载和处理 - numpy：用于矩阵计算 - matplotlib：用于绘制数据可视化图表 - sklearn：用于构建逻辑回归模型和评估模型性能 ``` import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report ``` 接着，我们加载数据集： ``` data = pd.read_csv('https://raw.githubusercontent.com/cryad/Logistic_Regression/master/exam_scores.csv') ``` 步骤2：数据探索和可视化我们将使用pandas和matplotlib库对数据集进行探索和可视化，以便更好地理解数据和评估建模可行性。首先，我们可以使用head()方法查看数据集中的前几行： ``` data.head() ``` 输出结果： ``` exam1 score exam2 score admitted 0 34.623660 78.024693 0 1 30.286711 43.894998 0 2 35.847409 72.902198 0 3 60.182599 86.308552 1 4 79.032736 75.344376 1 ``` 接着，我们绘制一个散点图，将考试1成绩和考试2成绩作为横纵坐标，录取结果用颜色进行区分： ``` plt.scatter(data['exam1 score'], data['exam2 score'], c=data['admitted']) plt.xlabel('Exam 1 Score') plt.ylabel('Exam 2 Score') plt.show() ``` 输出结果： ![img](https://cdn.jsdelivr.net/gh/cryad/Logistic_Regression/images/exam_scores.png) 可以看到，蓝色点表示未被录取的学生，而绿色点表示被录取的学生。我们可以发现，在考试1和考试2成绩都高于一定水平的情况下，学生被录取的概率较大，这也与我们的人生经验相符。步骤3：数据预处理在建模之前，我们需要将数据集分为训练集和测试集，并将特征变量和目标变量分开，并进行一些必要的数据处理。我们将使用train_test_split()方法将数据集分为70%的训练集和30%的测试集： ``` X_train, X_test, y_train, y_test = train_test_split(data[['exam1 score', 'exam2 score']], data['admitted'], test_size=0.3, random_state=42) ``` 接着，我们需要对特征变量进行标准化处理，以确保每个特征变量的重要性对模型一样，避免因为某个特征值过大而导致模型过于关注这个特征变量。我们可以使用sklearn的StandardScaler()方法对数据进行标准化处理： ``` from sklearn.preprocessing import StandardScaler scaler = StandardScaler() X_train_scaled = scaler.fit_transform(X_train) X_test_scaled = scaler.transform(X_test) ``` 步骤4：建立并训练模型有了标准化的特征变量和目标变量，我们可以开始建立逻辑回归模型了。在scikit-learn中，建立逻辑回归模型非常简单，只需要在构造函数中指定参数即可： ``` model = LogisticRegression() ``` 接着，我们使用fit()方法训练模型： ``` model.fit(X_train_scaled, y_train) ``` 步骤5：模型评估和预测模型训练完成后，我们需要对模型进行评估，以了解模型在不同情况下的预测性能。我们可以使用predict()方法进行预测，然后使用classification_report()方法生成预测性能报告： ``` y_pred = model.predict(X_test_scaled) print(classification_report(y_test, y_pred)) ``` 输出结果： ``` precision recall f1-score support 0 0.82 0.94 0.88 18 1 0.93 0.78 0.85 17 micro avg 0.87 0.87 0.87 35 macro avg 0.87 0.86 0.87 35 weighted avg 0.87 0.87 0.87 35 ``` 我们可以看到，在测试集中，模型的整体准确率为0.87，这是一个很不错的性能。最后，我们可以使用前面绘制散点图的方法，绘制模型在训练集和测试集上的预测结果： ``` plt.scatter(X_train['exam1 score'], X_train['exam2 score'], c=y_train) plt.xlabel('Exam 1 Score') plt.ylabel('Exam 2 Score') plt.title('Training Set') plt.show() plt.scatter(X_test['exam1 score'], X_test['exam2 score'], c=y_pred) plt.xlabel('Exam 1 Score') plt.ylabel('Exam 2 Score') plt.title('Test Set') plt.show() ``` 输出结果： ![img](https://cdn.jsdelivr.net/gh/cryad/Logistic_Regression/images/training_set.png) ![img](https://cdn.jsdelivr.net/gh/cryad/Logistic_Regression/images/test_set.png) 我们可以看到，模型正确地识别了训练集和测试集中的大多数数据点，但是在测试集中仍然有一些点被错误地标记。这表明模型还有进一步的优化空间，可以通过调整模型超参数和特征选择等方法来提高模型性能。

阅读全文

逻辑回归实战练习——根据学生成绩预测是否被录取

相关推荐

逻辑回归算法--根据两门考试成绩判断是否被录取

预测学生成绩

matlab终止以下代码-Logistic-Regression:预测学生是否被大学录取（逻辑回归），预测制造工厂的微芯片是否通过质量保证（常

机器学习实战项目——市场营销活动预测.zip

Python 机器学习实战：根据成绩预测大学生能否被高校录取.zip

机器学习——逻辑回归

C语言课程设计——学生成绩管理系统

逻辑回归练习

逻辑回归算法案例分析：预测学生录取结果

ssm框架实战项目——超市订单管理系统

细节增强的matlab代码-Machine_Learning2:该项目对逻辑回归进行了简短描述，以预测学生是否被大学录取以及如何在庞大的数据集

逻辑回归练习数据

SSM实战项目——Java高并发秒杀API源码

数字逻辑与处理器实验——MIPS处理器设计

javaweb大作业——简单的学生成绩管理系统

SSM实战项目——Java高并发秒杀API.zip

Springboot整合SSM框架的实战项目——own_demo源码解析

SQL server2008数据库课程设计范例——学生成绩管理系统.pdf

数字逻辑课程设计报告——多路彩灯控制器.pdf

数字逻辑课程设计报告——多路彩灯控制器.doc

大家在看

podingsystem.zip_通讯编程_C/C++_

华为光技术笔试-全笔记2023笔试回忆记录

R语言SADF和GSADF资产价格泡沫检验

任务分配基于matlab拍卖算法多无人机多任务分配【含Matlab源码 3086期】.zip

COBIT操作手册

最新推荐

逻辑回归模型（Logistic）实战应用——文本分类

PyTorch线性回归和逻辑回归实战示例

学生成绩管理系统——数据库课程设计2.doc

python代码实现逻辑回归logistic原理

Python利用逻辑回归模型解决MNIST手写数字识别问题详解

Spring Websocket快速实现与SSMTest实战应用

电力电子技术的智能化：数据中心的智能电源管理

通过spark sql读取关系型数据库mysql中的数据

新版微软inspect工具下载：32位与64位版本

如何运用电力电子技术实现IT设备的能耗监控