python代码完成多元回归分析
时间: 2024-10-29 15:10:36 浏览: 6
在Python中,我们可以使用科学计算库如NumPy、Pandas以及统计建模库如Scikit-Learn来进行多元回归分析。这里是一个基本的例子,展示如何使用线性回归模型(LinearRegression)处理多元线性回归问题:
```python
# 导入所需的库
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
# 假设我们有如下数据(这里仅做演示,实际数据需要从CSV等文件读取)
data = {
'feature1': [1, 2, 3, 4, 5],
'feature2': [2, 4, 6, 8, 10],
'target': [3, 7, 11, 15, 19]
}
df = pd.DataFrame(data)
# 数据预处理
X = df[['feature1', 'feature2']] # 输入特征
y = df['target'] # 目标变量
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建并训练模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测
y_pred = model.predict(X_test)
# 计算性能指标
print('系数:', model.coef_)
print('截距:', model.intercept_)
print('R^2分数:', metrics.r2_score(y_test, y_pred))
```
在这个例子中,我们首先导入数据,然后将其划分为特征(X)和目标变量(y)。接着使用train_test_split函数划分数据集,训练模型并进行预测。最后,我们会得到每个特征的权重(系数)、模型的截距以及模型对数据拟合程度的一个度量(R^2分数)。
阅读全文