hype scale model
时间: 2023-08-27 17:20:48 浏览: 58
在田渊栋的讨论中,他提到了强化学习(RL)的发展和挑战。他认为现在的RL方法还没有完全超越传统的强化学习方法,只是在使用函数逼近和神经网络来估计值函数和策略函数的过程中获得了一些进展。然而,仍然存在很多问题有待解决,比如如何在有奖励的情况下实现更好的性能,如何探索环境,如何建立准确的模型等。他相信RL在未来会有更大的发展,但目前只是刚刚开始。中的内容来看,关于"hype scale model"的具体含义无法得知。可能需要更多的上下文信息来理解和回答这个问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* [FAIR田渊栋:从工程师到管理者,是让个人能力scale到团队中](https://blog.csdn.net/cpongo6/article/details/88999947)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"]
- *3* [美国纽约市出租车大数据探索-基于kaggle比赛](https://blog.csdn.net/qq_42871249/article/details/103844811)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]