xgboost数学推导

XGBoost，全名为eXtreme Gradient Boosting，是一种基于决策树的集成学习算法。它结合了Gradient Boosting算法和决策树算法的优点，在许多机器学习竞赛中取得了显著的成绩。下面是XGBoost的数学推导： XGBoost的目标函数为： $$ Obj = \sum_{i=1}^{n}l(y_i, \hat{y_i}) + \sum_{k=1}^{K}\Omega(f_k) $$ 其中，$n$为样本数，$y_i$为第$i$个样本的真实值，$\hat{y_i}$为第$i$个样本的预测值，$l(y_i, \hat{y_i})$为损失函数，$K$为树的数量，$\Omega(f_k)$为正则化项。正则化项的目的是防止过拟合，它包括树的叶子节点数量和叶子节点分数的二阶范数。 XGBoost使用Gradient Boosting算法进行训练，Gradient Boosting算法的核心思想是迭代地训练一组弱学习器，将它们组合成一个强学习器。每一次迭代都会添加一个新的树模型，它的预测值是前面树模型的预测值和当前树模型的预测值的加权和。因此，我们需要定义一个损失函数$L$，它是所有树模型预测值和真实值之间的差距的加权和，即： $$ L = \sum_{i=1}^{n}l(y_i, \hat{y_i}) + \sum_{k=1}^{K}\Omega(f_k) $$ 其中，$\hat{y_i}$为所有树模型预测值的加权和。为了最小化损失函数$L$，我们需要对每个树模型的预测值进行求解。我们可以使用梯度下降算法来优化损失函数，其中梯度是损失函数关于当前模型的导数。对于第$k$个树模型，我们需要求解其预测值$f_k(x_i)$，它可以表示为： $$ f_k(x_i)=f_{k-1}(x_i)+h_k(x_i) $$ 其中，$f_{k-1}(x_i)$为前$k-1$个树模型的预测值，$h_k(x_i)$为第$k$个树模型的预测值。我们可以使用泰勒展开式来近似$h_k(x_i)$： $$ h_k(x_i) = \sum_{j=1}^{J}w_{j,k} I(x_i\in R_{j,k}) $$ 其中，$w_{j,k}$为第$j$个叶子节点的分数，$R_{j,k}$为第$j$个叶子节点的区域。我们需要对每个叶子节点的分数进行求解，可以使用最小二乘法来求解。对于第$j$个叶子节点，我们需要求解其分数$w_{j,k}$，它可以表示为： $$ w_{j,k}=-\frac{\sum_{x_i\in R_{j,k}}g_i}{\sum_{x_i\in R_{j,k}}h_i+\lambda} $$ 其中，$g_i$为损失函数关于预测值的一阶导数，$h_i$为损失函数关于预测值的二阶导数，$\lambda$为正则化参数。最后，我们可以使用梯度下降算法来更新每个树模型的预测值。对于第$k$个树模型，我们需要将其预测值$f_k$更新为： $$ f_k(x_i)=f_{k-1}(x_i)+\eta\sum_{j=1}^{J}w_{j,k} I(x_i\in R_{j,k}) $$ 其中，$\eta$为学习率，它控制每个树模型的贡献大小。

阅读全文

相关推荐

gbdt到xgboost的一些理论推导.rar

xgboost导读和实战 + Tree Boosting With XGBoost + 陈天奇 ppt

研究动机1

Xgboost数学公式推导

xgboost原理公式推导

XGBoost分类模型推导

Astar的数学推导

yolov5数学推导

transformer模型的数学推导

pca的数学推导过程

yolov5数学推导部分

永磁同步电机数学推导

cnn基本原理和数学推导

批梯度下降的数学推导

切比雪夫Ⅱ型滤波器数学推导

卷积神经网络的数学推导 pdf

xgboost算法理论模型公式推导

二叉树模型期权定价数学推导

YOLOv5工作流程数学推导

sirs模型的数学推导公式

大家在看

麒麟V10桌面SP1网卡驱动

TPS54160实现24V转正负15V双输出电源AD设计全方案

大众 BAP 协议简介

RGB to YCrCb

深圳大学《数据结构》1-4章练习题

最新推荐

python列表推导式操作解析

神经网络参数更新公式推导（一）.docx

彭曼公式推导（完整过程）

前端基础教程：HTML、CSS、JavaScript动态注册登录相册

Avizo 9.0.0 入门教程：新手快速掌握的10个秘诀

用c语言比较多个句子大小并排序

2021年HTML项目开发实践

【计算机组成原理深度解析】：华科经典课程的实战指南，助你迅速掌握设计精髓

java正则表达式解析字符串，根据and或者or分隔字符串，and和or忽略大小写，解析结果直接得到分隔的结果列表

LiberationSans字体：开源字体库的详细介绍