adam优化器yuanli

### Adam优化器工作原理 Adam（Adaptive Moment Estimation）是一种广泛使用的优化算法，在机器学习和深度学习领域特别受欢迎。该方法结合了AdaGrad和RMSProp两种算法的优势，不仅能够处理稀疏梯度还能减少振荡并加速收敛过程[^2]。 #### 参数更新机制在每次迭代过程中，Adam会基于一阶矩估计（即梯度的指数加权平均）m_t以及二阶矩估计（即梯度平方的指数加权平均）v_t来进行参数θ的更新： \[ m_{t}=\beta_1*m_{t-1}+(1-\beta_1)*g_t \] \[ v_{t}=\beta_2*v_{t-1}+(1-\beta_2)*(g_t)^2 \] 其中\( g_t \)表示时间步 t 处的成本函数关于参数 θ 的梯度；\(\beta_1\) 和 \(\beta_2\) 是控制历史信息衰减速度的一组超参，默认设置通常分别为0.9和0.999[^4]。为了修正初期偏差问题，引入了偏置校正因子: \[ \hat{m}_t=m_t/(1-\beta^{t}_{1}) \] \[ \hat{v}_t=v_t/(1-\beta^{t}_{2}) \] 最终参数更新规则如下所示： \[ \theta_{t+1}=\theta_t-(\alpha*\sqrt{(1-\beta^{t}_{2})}/(1-\beta^{t}_{1})) * (\hat{m}_t/(\sqrt{\hat{v}_t+\epsilon})) \] 这里 α 表示学习速率，ε是一个非常小数用来防止除零错误，一般取值为 \(1e^{-8}\)[^1]。 ```python import numpy as np class AdamOptimizer: def __init__(self, params, lr=0.001, beta1=0.9, beta2=0.999, epsilon=1e-8): self.params = params self.lr = lr self.beta1 = beta1 self.beta2 = beta2 self.epsilon = epsilon self.m = [np.zeros_like(param) for param in params] self.v = [np.zeros_like(param) for param in params] self.t = 0 def step(self, grads): self.t += 1 for i, (param, grad) in enumerate(zip(self.params, grads)): self.m[i] = self.beta1 * self.m[i] + (1 - self.beta1) * grad self.v[i] = self.beta2 * self.v[i] + (1 - self.beta2) * (grad ** 2) m_hat = self.m[i] / (1 - self.beta1 ** self.t) v_hat = self.v[i] / (1 - self.beta2 ** self.t) param -= self.lr * m_hat / (np.sqrt(v_hat) + self.epsilon) ```

阅读全文

相关推荐

ad9850yuanli

yuanli97.github.io:文件夹

yuanli.rar_windowsyuanli_回调函数_消息队列

七号信令yuanli

PCB&YUANLI&WORD

OPTO 22固态继电器说明书.rar

市场动向-预计2029年全球超级电容器活性炭市场规模将达到13.9亿美元.docx

深入解析yuanli97.github.io文件夹结构与HTML

隔离电路yuanli

yolov5yuanli

redis数据持久化yuanli

数据库yuanli及应用试题

加权平均法图像融合yuanli

d-s融合算法yuanli

zip4j.jar包下载,版本为 2.11.5

基于node.js完成登录

aapt_v0.2-eng.ibotpeaches.20151011.225425_win.tar.cab

(2368806)CCNA中文版PPT

三相电流型PWM整流matlab仿真，采用电压外环和电流内环的双闭环控制策略，附赠自己整理的说明文档和几篇参考文献

HTML页面中实现飘雪花效果的圣诞树展示

大家在看

B-6 用户手册.doc

线性代数导论第5版课后答案

深究标准IO的缓存

运动插件一套.zip

polsarpro官方教程、操作说明 PolSARpro v5.0 Software Training Course

最新推荐

HashMap原理的深入理解

电子测量中的指针式表头的工作原理

zip4j.jar包下载,版本为 2.11.5

基于node.js完成登录

aapt_v0.2-eng.ibotpeaches.20151011.225425_win.tar.cab

WildFly 8.x中Apache Camel结合REST和Swagger的演示

管理建模和仿真的文件

【声子晶体模拟全能指南】：20年经验技术大佬带你从入门到精通

2024-07-27怎么用python转换成农历日期

FDFS客户端Python库1.2.6版本发布