考虑训练集 D = {(x1, y1), · · · , (xm, ym)}, ym ∈ {−1, +1}, 参照《机器学习》第八章图 8.3 的变量定义，请证明数据分布$D_t$的调整过程满足: \begin{align*} \mathcal{D}_{t+1}(\x) = \frac{e^{-y_i \sum_{s=1}^t \alpha_s h_s(\x)}}{m \prod_{s=1}^t Z_s}, \quad \forall t \in [T]. \end{align*}

我们需要证明对于所有的 $t \in [T]$ 和 $\x \in \mathcal{X}$，都有: $$\mathcal{D}_{t+1}(\x) = \frac{e^{-y_i \sum_{s=1}^t \alpha_s h_s(\x)}}{m \prod_{s=1}^t Z_s}$$ 我们首先回顾 AdaBoost 算法中 $\mathcal{D}_t$ 的更新过程，即： $$\mathcal{D}_t(i) = \frac{\mathcal{D}_{t-1}(i) e^{-\alpha_t y_i h_t(\x_i)}}{Z_t}$$ 其中 $Z_t$ 是规范化因子，满足 $\sum_{i=1}^m \mathcal{D}_t(i) = 1$。我们将上式中的 $i$ 换成 $\x$，并将 $\mathcal{D}_t(i)$ 换成 $\mathcal{D}_t(\x)$，则有： $$\mathcal{D}_t(\x) = \frac{\sum_{i=1}^m \mathcal{D}_{t-1}(\x_i) e^{-\alpha_t y_i h_t(\x_i)} \mathbb{I}(\x=\x_i)}{Z_t}$$ 其中 $\mathbb{I}(\cdot)$ 是指示函数，当 $\x=\x_i$ 时为 $1$，否则为 $0$。我们将 $\mathcal{D}_{t-1}$ 带入上式，有： $$\mathcal{D}_t(\x) = \frac{\sum_{i=1}^m \frac{e^{-y_i \sum_{s=1}^{t-1} \alpha_s h_s(\x_i)}}{m \prod_{s=1}^{t-1} Z_s} e^{-\alpha_t y_i h_t(\x_i)} \mathbb{I}(\x=\x_i)}{Z_t}$$ 将 $Z_t$ 展开，有： $$\begin{aligned} \mathcal{D}_t(\x) &= \frac{1}{m \prod_{s=1}^{t-1} Z_s} \sum_{i=1}^m e^{-y_i \sum_{s=1}^{t-1} \alpha_s h_s(\x_i)} e^{-\alpha_t y_i h_t(\x_i)} \mathbb{I}(\x=\x_i) \\ &= \frac{1}{m \prod_{s=1}^{t-1} Z_s} \sum_{i=1}^m e^{-y_i \sum_{s=1}^t \alpha_s h_s(\x_i)} \mathbb{I}(\x=\x_i) \\ &= \frac{1}{m \prod_{s=1}^{t} Z_s} \sum_{i=1}^m e^{-y_i \sum_{s=1}^t \alpha_s h_s(\x_i)} \mathbb{I}(\x=\x_i) \\ &= \frac{e^{-y_i \sum_{s=1}^t \alpha_s h_s(\x)}}{m \prod_{s=1}^t Z_s} \end{aligned}$$ 其中第二个等号是因为 $\mathbb{I}(\x=\x_i)$ 只在 $\x=\x_i$ 时为 $1$，其他时候都为 $0$，所以可以将 $t$ 个指标的指数相加合并为一个指标的指数。第三个等号是因为 $Z_t = \sum_{i=1}^m e^{-y_i \sum_{s=1}^t \alpha_s h_s(\x_i)}$。因此，我们证明了数据分布 $\mathcal{D}_t$ 的调整过程满足： $$\mathcal{D}_{t+1}(\x) = \frac{e^{-y_i \sum_{s=1}^t \alpha_s h_s(\x)}}{m \prod_{s=1}^t Z_s}$$

阅读全文

相关推荐

C++已知圆弧两点坐标和半径计算圆心坐标(VS+Qt工程)

2020_2021学年高中数学第1讲坐标系第1课时平面直角坐标系课后提能训练含解析新人教A版选修4_4202103221152

圆锥曲线大题归类.doc

已知数据集，{(x1,y1）（x2,y2）...(xm ,ym)} 其中y∈{0,1}采用 logistic 回归模型进行建模，并对数据进行建模。 1.构建 logistic 回归模型 2.构建误差函数 3.梯度下降算法求解模型参数

输入格式 实验输入数据格式 m(整数，实验数据总数) x1(实数>0) x2(实数>0) ... xm(实数>0) 输出格式 实验输出数据格式 y1(实数，x1的对数函数值) y2(实数，x2的对数函数值) ... ym(实数，xm的对数函数值)

已知3点坐标P1(X1,Y1),P2(X2,Y2),P3(X3,Y3)，画过P1,P2,P3这三点的圆弧，要求按照P1->P2-P3的顺序

已知圆弧的起点坐标(x1,y1)，终点坐标(x2,y2)，圆心坐标(x3,x4)，求圆弧中心(x0,y0)

设 X0=0, 而 Xj+1(j0)是从[Xj, 1]均匀随机抽取的值, 令 Yk=2k (1-Xk)。证明：序列 Y0,Y1,…是一个鞅。

cole_02_0507.pdf

工程硕士开题报告：无线传感器网络路由技术及能量优化LEACH协议研究

【东海期货-2025研报】东海贵金属周度策略：金价高位回落，阶段性回调趋势初现.pdf

图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程，简化了深度学习项目的数据准备工作)

diminico_02_0709.pdf

大家在看

生产线上快速检测塑料物品的表面缺陷.rar

MASWaves-version1-07-2017_面波频散_地震面波分析与反演_面波_面波反演_MASWaves_源码

Linux常用命令全集（CHM格式）

基于DCT和Arnold的视频数字水印（含Matlab源码）

NEW.rar_fatherxbi_fpga_verilog 大作业_verilog大作业_投币式手机充电仪

最新推荐

cole_02_0507.pdf

工程硕士开题报告：无线传感器网络路由技术及能量优化LEACH协议研究

【东海期货-2025研报】东海贵金属周度策略：金价高位回落，阶段性回调趋势初现.pdf

图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程，简化了深度学习项目的数据准备工作)

FileAutoSyncBackup：自动同步与增量备份软件介绍

C语言内存管理：动态分配策略深入解析，内存不再迷途

严格来说一维不是rnn

基于MFC和OpenCV的USB相机操作示例

C语言基础精讲：掌握指针，编程新手的指路明灯

python怎么能用GPU

输入格式实验输入数据格式 m(整数，实验数据总数) x1(实数>0) x2(实数>0) ... xm(实数>0) 输出格式实验输出数据格式 y1(实数，x1的对数函数值) y2(实数，x2的对数函数值) ... ym(实数，xm的对数函数值)