#split into train and validation train1 = new_data[:2187] valid1 = new_data[2187:] x_train1 = train1.drop('close', axis=1) y_train1 = train1['close'] x_valid1 = valid1.drop('close', axis=1) y_valid1 = valid1['close'] #implement linear regression from sklearn.linear_model import LinearRegression model = LinearRegression() model.fit(x_train1,y_train1)w = model.coef_ b = model.intercept_ #得到bias值 print(len(w)) # 输出参数数目 print([round(i,2) for i in w]) #输出w列表,保留5位小数 print(b) #输出bias#make predictions and find the rmse preds = model.predict(x_valid1) rms=np.sqrt(np.mean(np.power((np.array(y_valid1)-np.array(preds)),2))) rms 解释每行代码
时间: 2024-01-26 17:02:09 浏览: 365
Appendix1B_K_cross_validation.rar_K._cross validation
- `train1 = new_data[:2187]`: 从 `new_data` 中选取前2187行数据作为训练数据,存储到 `train1` 中。
- `valid1 = new_data[2187:]`: 从 `new_data` 中选取第2187行及以后的数据作为验证数据,存储到 `valid1` 中。
- `x_train1 = train1.drop('close', axis=1)`: 从 `train1` 中删除 `close` 列,得到训练数据的特征矩阵 `x_train1`。
- `y_train1 = train1['close']`: 将 `train1` 中的 `close` 列提取出来,得到训练数据的目标向量 `y_train1`。
- `x_valid1 = valid1.drop('close', axis=1)`: 从 `valid1` 中删除 `close` 列,得到验证数据的特征矩阵 `x_valid1`。
- `y_valid1 = valid1['close']`: 将 `valid1` 中的 `close` 列提取出来,得到验证数据的目标向量 `y_valid1`。
- `from sklearn.linear_model import LinearRegression`: 从 `sklearn.linear_model` 模块中导入 `LinearRegression` 类。
- `model = LinearRegression()`: 创建一个 `LinearRegression` 类的对象 `model`。
- `model.fit(x_train1,y_train1)`: 使用训练数据 `x_train1` 和 `y_train1` 来拟合线性回归模型。
- `w = model.coef_`: 获取线性回归模型的系数向量 `w`。
- `b = model.intercept_`: 获取线性回归模型的截距 `b`。
- `print(len(w))`: 输出系数向量的长度,即特征数目。
- `print([round(i,2) for i in w])`: 输出系数向量的每个元素,保留2位小数。
- `print(b)`: 输出截距 `b`。
- `preds = model.predict(x_valid1)`: 使用训练好的线性回归模型对验证数据 `x_valid1` 进行预测,得到预测结果向量 `preds`。
- `rms=np.sqrt(np.mean(np.power((np.array(y_valid1)-np.array(preds)),2)))`: 计算预测结果向量 `preds` 与验证数据目标向量 `y_valid1` 的均方根误差 `rms`。
- `rms`: 输出均方根误差 `rms`。
阅读全文