首页python实现线性回归分析

python实现线性回归分析

时间: 2024-09-29 15:15:44 浏览: 36

Python实现线性回归分析通常通过统计库如NumPy和机器学习库如scikit-learn来完成。线性回归是一种基本的预测模型，它假设目标变量与一个或多个自变量之间存在线性关系。以下是简单的步骤： 1. 导入库：首先导入所需的模块，如`numpy`, `pandas`, 和 `sklearn.linear_model`。 ```python import numpy as np import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression ``` 2. 加载数据：如果数据存储在CSV文件中，可以使用pandas加载数据。 ```python data = pd.read_csv('your_data.csv') X = data[['feature1', 'feature2']] # 输入特征 y = data['target'] # 目标变量 ``` 3. 划分训练集和测试集：为了评估模型的性能，我们需要将数据分为训练集和测试集。 ```python X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) ``` 4. 创建并训练模型：使用`LinearRegression()`创建线性回归实例，并用训练数据拟合它。 ```python model = LinearRegression() model.fit(X_train, y_train) ``` 5. 预测和评估：使用训练好的模型对测试集进行预测，并计算一些评估指标（如R²分数）。 ```python y_pred = model.predict(X_test) score = model.score(X_test, y_test) ``` 6. 可视化结果（选做）：你可以绘制散点图和线性回归线来直观理解模型性能。 ```python import matplotlib.pyplot as plt plt.scatter(X_test, y_test, color='blue') plt.plot(X_test, y_pred, color='red', linewidth=2) plt.show() ```

阅读全文