python编程线性回归代码示例编程线性回归代码示例
用python进行线性回归分析非常方便,有现成的库可以使用比如:numpy.linalog.lstsq例子、scipy.stats.linregress例子、
pandas.ols例子等。
不过本文使用sklearn库的linear_model.LinearRegression,支持任意维度,非常好用。
一、二维直线的例子一、二维直线的例子
预备知识:线性方程y=a∗x+b。y=a∗x+b表示平面一直线
下面的例子中,我们根据房屋面积、房屋价格的历史数据,建立线性回归模型。
然后,根据给出的房屋面积,来预测房屋价格。这里是数据来源
import pandas as pd
from io import StringIO
from sklearn import linear_model
import matplotlib.pyplot as plt
# 房屋面积与价格历史数据(csv文件)
csv_data = 'square_feet,price150,6450200,7450250,8450300,9450350,11450400,15450600,18450'
# 读入dataframe
df = pd.read_csv(StringIO(csv_data))
print(df)
# 建立线性回归模型
regr = linear_model.LinearRegression()
# 拟合
regr.fit(df['square_feet'].reshape(-1, 1), df['price']) # 注意此处.reshape(-1, 1),因为X是一维的!
# 不难得到直线的斜率、截距
a, b = regr.coef_, regr.intercept_
# 给出待预测面积
area = 238.5
# 方式1:根据直线方程计算的价格
print(a * area + b)
# 方式2:根据predict方法预测的价格
print(regr.predict(area))
# 画图
# 1.真实的点
plt.scatter(df['square_feet'], df['price'], color='blue')
# 2.拟合的直线
plt.plot(df['square_feet'], regr.predict(df['square_feet'].reshape(-1,1)), color='red', linewidth=4)
plt.show()
评论0