如何用Python求解线性回归?
时间: 2024-08-02 10:00:47 浏览: 35
在Python中,我们可以使用scikit-learn库来方便地实现线性回归。下面是一个简单的步骤:
1. **导入所需库**:
```python
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
import pandas as pd
```
2. **加载数据集**:
假设你的数据存储在一个CSV文件里,可以使用pandas库读取它:
```python
df = pd.read_csv('data.csv')
X = df.drop('target_column', axis=1) # 特征变量
y = df['target_column'] # 目标变量
```
3. **分割数据集**:
分成训练集和测试集,通常采用80%的数据用于训练,20%用于测试:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. **创建并训练模型**:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
5. **预测和评估**:
对测试集进行预测,并计算一些评估指标如均方误差(MSE)或R²分数:
```python
y_pred = model.predict(X_test)
print('Mean Absolute Error:', metrics.mean_absolute_error(y_test, y_pred))
print('R^2 Score:', metrics.r2_score(y_test, y_pred))
```
6. **保存或使用模型**:
如果需要,你可以将模型保存到文件或直接使用它对新的数据进行预测。
阅读全文