python实现线性回归分析
时间: 2024-09-29 15:15:44 浏览: 36
Python实现线性回归分析通常通过统计库如NumPy和机器学习库如scikit-learn来完成。线性回归是一种基本的预测模型,它假设目标变量与一个或多个自变量之间存在线性关系。以下是简单的步骤:
1. 导入库:首先导入所需的模块,如`numpy`, `pandas`, 和 `sklearn.linear_model`。
```python
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
```
2. 加载数据:如果数据存储在CSV文件中,可以使用pandas加载数据。
```python
data = pd.read_csv('your_data.csv')
X = data[['feature1', 'feature2']] # 输入特征
y = data['target'] # 目标变量
```
3. 划分训练集和测试集:为了评估模型的性能,我们需要将数据分为训练集和测试集。
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 创建并训练模型:使用`LinearRegression()`创建线性回归实例,并用训练数据拟合它。
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
5. 预测和评估:使用训练好的模型对测试集进行预测,并计算一些评估指标(如R²分数)。
```python
y_pred = model.predict(X_test)
score = model.score(X_test, y_test)
```
6. 可视化结果(选做):你可以绘制散点图和线性回归线来直观理解模型性能。
```python
import matplotlib.pyplot as plt
plt.scatter(X_test, y_test, color='blue')
plt.plot(X_test, y_pred, color='red', linewidth=2)
plt.show()
```
阅读全文