Nesterov加速技巧是什么
时间: 2023-06-14 14:05:02 浏览: 109
加速的方法
Nesterov加速技巧(Nesterov's Accelerated Gradient Descent)是一种用于加速梯度下降算法的优化方法。它是由Yurii Nesterov在1983年提出的。
与标准的梯度下降算法相比,Nesterov加速技巧通过预先计算每个步骤的梯度,来使更新更准确。具体来说,它通过引入一个“动量”(momentum)的概念来实现这一点。动量是一个向量,它代表了之前梯度的加权平均值。在每个时间步骤,我们不仅计算当前的梯度,还要考虑之前的动量向量,以便更好地估计梯度的方向。
Nesterov加速技巧的优点是能够更快地收敛到局部最优解,并且通常比标准的梯度下降算法具有更好的泛化能力。它在很多深度学习任务中被广泛使用,如图像分类、语音识别等。
阅读全文