python的多元线性回归分析
时间: 2024-11-29 10:08:15 浏览: 2
Python中的多元线性回归分析是一种统计方法,用于研究两个或更多自变量如何影响一个因变量。它基于线性模型,假设自变量之间的关系是线性的,并且通过求解最小二乘法来确定各个自变量系数的最佳估计值。Python库如`sklearn`(scikit-learn)提供了方便的功能来进行多元线性回归,例如`LinearRegression`类。
以下是使用`sklearn`进行多元线性回归的基本步骤:
1. 导入库并加载数据集:
```python
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import pandas as pd
# 加载数据
data = pd.read_csv('your_data.csv')
```
2. 准备数据:
```python
X = data[['feature1', 'feature2', ...]] # 自变量(特征)
y = data['target'] # 因变量
```
3. 划分训练集和测试集:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 创建并训练模型:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
5. 预测和评估结果:
```python
predictions = model.predict(X_test)
score = model.score(X_test, y_test)
```
阅读全文