怎样用python做回归分析
时间: 2023-07-20 21:36:40 浏览: 45
要使用Python进行回归分析,需要使用一些常用的库和模块,如NumPy,Pandas,Matplotlib和Scikit-learn等。
以下是一个简单的回归分析的Python代码示例,使用线性回归模型:
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# 读取数据
data = pd.read_csv('data.csv')
# 划分自变量和因变量
X = data.iloc[:, :-1].values
y = data.iloc[:, 1].values
# 划分训练集和测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建线性回归模型
regressor = LinearRegression()
# 训练模型
regressor.fit(X_train, y_train)
# 预测测试集结果
y_pred = regressor.predict(X_test)
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
# 打印结果
print("均方误差:", mse)
# 可视化结果
plt.scatter(X_train, y_train, color='red')
plt.plot(X_train, regressor.predict(X_train), color='blue')
plt.title('Salary vs Experience (Training set)')
plt.xlabel('Years of Experience')
plt.ylabel('Salary')
plt.show()
```
这段代码做的是一个简单的线性回归分析,读取一个名为 `data.csv` 的数据文件,将数据分为自变量和因变量,划分训练集和测试集,创建线性回归模型,训练模型,预测测试集结果,计算均方误差,并将结果可视化。当然,具体的回归分析方法和代码实现会根据不同的数据和需求有所不同。