python回归分析代码
时间: 2023-10-12 09:42:30 浏览: 34
以下是一个简单的线性回归模型的 Python 代码示例:
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# 读取数据
data = pd.read_csv('data.csv')
# 将数据分为自变量和因变量
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# 划分训练集和测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 训练模型
regressor = LinearRegression()
regressor.fit(X_train, y_train)
# 预测
y_pred = regressor.predict(X_test)
# 可视化结果
plt.scatter(X_train, y_train, color='red')
plt.plot(X_train, regressor.predict(X_train), color='blue')
plt.title('Salary vs Experience (Training set)')
plt.xlabel('Years of Experience')
plt.ylabel('Salary')
plt.show()
# 模型评估
rmse = np.sqrt(mean_squared_error(y_test, y_pred))
r2 = regressor.score(X_test, y_test)
print("RMSE:" , rmse)
print("R2 Score:" , r2)
```
这段代码使用了 Pandas 库读取了名为 'data.csv' 的数据文件,并将其分成自变量 X 和因变量 y。然后,使用 Scikit-learn 库的 train_test_split 函数将数据分为训练集和测试集。接下来,使用 LinearRegression 函数训练模型并使用 predict 函数进行预测。最后,使用 matplotlib 库可视化结果,并使用 mean_squared_error 和 score 函数评估模型的性能。