随机向量 x服从 p元正态分布 ,回归系数b , 考虑如下的线性回归模型 y=bx+e , 其中随机误差项e 与x 相互独立,且e服从卡方(5),.从上述模型中产生独立同分布观测样本 . 在绝对值损失函数下建立中位数回归模型 (Median) (i) 建立中位数回归的线性优化模型方程
时间: 2024-01-24 15:17:48 浏览: 22
中位数回归是一种非参数的回归方法,它的目标是找到一个中位数估计量,即使得损失函数的中位数最小化。在绝对值损失函数下,中位数估计量是中位数。
设样本量为n,观测样本为(x1,y1), (x2,y2), ..., (xn,yn),其中xi为p维随机向量,yi为标量。
中位数回归的线性优化模型方程为:
min ∑i=1^n |yi - b'xi|
其中b为回归系数,|·|表示绝对值。
这个模型可以用线性规划求解。具体来说,可以把绝对值拆成正负两部分,得到以下的线性规划模型:
min t
s.t. yi - b'xi ≤ t, i=1,...,n
yi - b'xi ≥ -t, i=1,...,n
其中t是辅助变量,用来表示中位数。这个模型的目标函数是最小化t,约束条件是保证每个样本的残差都不超过t。求解这个线性规划,即可得到中位数回归的系数估计。
相关问题
随机向量 x服从 p元正态分布 ,回归系数b , 考虑如下的线性回归模型 y=bx+e , 其中随机误差项e 与x 相互独立,且e服从卡方(5),.从上述模型中产生独立同分布观测样本 . 在绝对值损失函数下建立中位数回归模型 (Median) (i) 建立中位数回归的线性优化模型
中位数回归(Median Regression)是一种基于绝对值损失函数的回归方法,其目标是寻找一个回归系数,使得模型预测值和实际观测值的绝对误差的中位数最小。
设样本数据为$(x_1,y_1),(x_2,y_2),\cdots,(x_n,y_n)$,中位数回归的线性优化模型为:
$$\min_{b} \sum_{i=1}^{n} |y_i - bx_i|$$
该模型等价于以下两个线性规划问题:
$$\begin{cases} \min_{b,\epsilon} \sum_{i=1}^{n} \epsilon_i \\ s.t. & y_i - bx_i \leq \epsilon_i \\ & bx_i - y_i \leq \epsilon_i \end{cases}$$
$$\begin{cases} \min_{b,\epsilon} \sum_{i=1}^{n} \epsilon_i \\ s.t. & y_i - bx_i \leq \epsilon_i \\ & -(bx_i - y_i) \leq \epsilon_i \end{cases}$$
其中,$\epsilon_i$为绝对误差。
以上两个线性规划问题的解都可以使用线性规划算法求解。