深度学习优化：SGD实践与L-BFGS策略

batch

需积分: 0 136 浏览量更新于2024-08-04 收藏 35KB DOCX 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源推荐

对优化算法的一些感想

2014-03-19 11:25 1003 人阅读评论(2) 收藏举报

1：今天早上阅读了 on optimization methods for deep learning 这篇 paper，是 andrew

NG 组的博士的一篇 paper，这篇 paper 介绍了 L-BFGS，CG（共轭梯度）和 SGD 算

法。

2：个人感受最深的就是，我对 CG 没用过，用 L-BFGS 最多，SGD 是最想用的，但是往

往找不到好的模型参数。L-BFGS 当样本过多的时候运行非常慢，调一次参数太慢了，

SGD 速度倒是很快，但是往往结果的差异性很大，没法找到那组参数。

3：在文中作者给了很多的 experiment，发现 L-BFGS 和 CG 的效果是最好的，效果好指

的有 2 个方面：达到一样的精度的时候用的时间最少；用的时间一样的多的时候，精度最

高。

并且作者给出了实验中用 L-BFGS 的话，使用 mini-batch，也就是类似 SGD 的训练方

法，这样可以让 L-BFGS 速度也很快，精度也很高，同时这篇 paper 也给的有源代码，我

好好阅读下再来说下怎么做。

4：最近在准备一组数据，看来还是可以用 L-BFGS 了，只需要参考一下训练的一些

strategy 就好了。哈哈。。

对随机梯度下降的一些使用心得

2014-03-27 09:19 3738 人阅读评论(1) 收藏举报

1：对于随机梯度下降 SGD 可能大家都比较了解，也很熟悉，说起来也很简单，在使用中

我们一般用的是带 mini batch 的 SGD。这个也描述起来很简单，但是在使用中还是有一些

trick 才可以的，最近在做一个实验，由于 L-BFGS 的速度太慢所以选择了带 Mini-batch

的 SGD，我来说下我的心得。

下载后可阅读完整内容，剩余4页未读，立即下载

小小二-yan

粉丝: 32
资源: 299

深度学习优化：SGD实践与L-BFGS策略

机器学习心得以手写数字识别举例

实验一-线性回归.docx

吴恩达机器学习课程的资源、作业代码以及学习笔记.zip

批量梯度下降 随机梯度下降

梯度下降和改进的随机梯度下降

批量梯度下降法和随机梯度下降法的区别

梯度下降和随机梯度下降的区别

梯度下降算法和随机梯度下降算法的区别

梯度下降和随机梯度下降原理

小批量随机梯度下降法和其他梯度下降法的区别

MTCNN在做梯度下降时用的是随机梯度下降还是小批量梯度下降

随机梯度下降法、批量梯度下降法、动量梯度下降法

随机梯度下降，批量梯度下降，小批量梯度下降在PCA主成分分析实现中的结果差别

批量梯度下降为什么劣于随机梯度下降

使用小批量随机梯度下降法的好处

机器学习随机梯度下降

梯度下降和随机梯度下降优缺点

随机梯度下降算法原理优点

什么是梯度下降法？什么是随机梯度下降法？

梯度下降、随机梯度下降、小批量梯度下降

最新资源

批量梯度下降随机梯度下降