所以e1和e2去哪里了
时间: 2024-03-04 15:52:37 浏览: 142
ospf外部路由e1和e2路由选择区别详解.pdf
在上述lambda函数中,`e1`和`e2`分别表示当前训练轮数和最大训练轮数,它们是这个函数的两个参数。在实际使用过程中,当调用这个lambda函数时,需要传入这两个参数的具体值,例如`train_fn(10, 100)`表示当前训练轮数为10,最大训练轮数为100。在函数体内部,这两个参数可以用于计算epsilon值,从而影响强化学习策略的行为。在蒙特卡罗方法的离线学习算法中,这两个参数的含义是当前训练轮数和最大训练轮数。
阅读全文