随机向量 x服从 p元正态分布 ,回归系数b , 考虑如下的线性回归模型 y=bx+e , 其中随机误差项e 与x 相互独立,且e服从卡方(5),.从上述模型中产生独立同分布观测样本 . 在绝对值损失函数下建立中位数回归模型 (Median) (i) 建立中位数回归的线性优化模型python代码以及运行结果(不用scipy包和pulp包)
时间: 2024-01-24 16:17:51 浏览: 85
中位数回归的线性优化模型可以表示为:
$$
\min_{b} \sum_{i=1}^{n} |y_i - b^T x_i|
$$
其中,$n$为样本数量,$y_i$为第$i$个样本的标签值,$x_i$为第$i$个样本的特征向量,$b$为回归系数。
该模型可以转化为如下的线性规划问题:
$$
\min_{b, u} \sum_{i=1}^{n} u_i \\
s.t. \quad y_i - b^T x_i \leq u_i, \quad i=1,\dots,n \\
b_j \geq 0, \quad j=1,\dots,p \\
u_i \geq 0, \quad i=1,\dots,n \\
$$
其中,$u_i$为辅助变量,$p$为特征数量。
用Python实现中位数回归的线性优化模型的代码如下:
相关问题
随机向量 x服从 p元正态分布 ,回归系数b , 考虑如下的线性回归模型 y=bx+e , 其中随机误差项e 与x 相互独立,且e服从卡方(5),.从上述模型中产生独立同分布观测样本 . 在绝对值损失函数下建立中位数回归模型 (Median) (i) 建立中位数回归的线性优化模型
中位数回归(Median Regression)是一种基于绝对值损失函数的回归方法,其目标是寻找一个回归系数,使得模型预测值和实际观测值的绝对误差的中位数最小。
设样本数据为$(x_1,y_1),(x_2,y_2),\cdots,(x_n,y_n)$,中位数回归的线性优化模型为:
$$\min_{b} \sum_{i=1}^{n} |y_i - bx_i|$$
该模型等价于以下两个线性规划问题:
$$\begin{cases} \min_{b,\epsilon} \sum_{i=1}^{n} \epsilon_i \\ s.t. & y_i - bx_i \leq \epsilon_i \\ & bx_i - y_i \leq \epsilon_i \end{cases}$$
$$\begin{cases} \min_{b,\epsilon} \sum_{i=1}^{n} \epsilon_i \\ s.t. & y_i - bx_i \leq \epsilon_i \\ & -(bx_i - y_i) \leq \epsilon_i \end{cases}$$
其中,$\epsilon_i$为绝对误差。
以上两个线性规划问题的解都可以使用线性规划算法求解。
阅读全文