关于激活函数
1.为什么要使用激活函数 因为线性函数能拟合的模型太少,多层线性神经网络的叠加仍为线性,加上非线性可以改善拟合效果。 2.激活函数的要求 非线性,可微(反向传播)。 3.常用的激活函数 Sigmoid 能够把输入的连续实值变换为0和1之间的输出。 缺点:当输入值特别大或特别小时函数的梯度会很小(函数的斜率接近0),这样会降低梯度下降算法的效率,当神经网络层数过多时容易导致梯度消失。 tanh 能够把输入的连续实值变换为-1和1之间的输出。 tanh几乎在所有情况下的表现都比sigmoid好,因为它的输出值介于-1到1,激活函数的平均值更接近于0,这样可以达到类似zero-centered(数