python softmax 导数

Softmax函数是一种基于指数函数归一化的数学函数，它将实数向量映射到概率分布上。给定一个N维的向量$x$，softmax函数的定义如下： $\text{softmax}(x)_i = \frac{e^{x_i}}{\sum_{j=1}^{N}e^{x_j}}$，其中$i\in \{1,2,...,N\}$。在深度学习中，softmax函数常用于将多分类问题中的输出层输出映射为概率分布上，以便用于损失函数的计算、梯度计算等。关于softmax函数的导数，可以使用链式法则求解。首先，我们可以根据softmax函数的定义，表示$\text{softmax}(x)_i$来求其导数： $\text{softmax}(x)_i = \frac{e^{x_i}}{\sum_{j=1}^{N}e^{x_j}}$ $\frac{\partial{\text{softmax}(x)_i}}{\partial x_j} = \frac{\partial}{\partial x_j} \frac{e^{x_i}}{\sum_{k=1}^{N}e^{x_k}}$ 由于$j \neq i$，为了使得分子中不含$x_j$，我们需要对分子和分母分别进行变形： $\frac{e^{x_i}}{\sum_{k=1}^{N}e^{x_k}} = \frac{e^{x_i}}{e^{x_j} \cdot \sum_{k \neq j}e^{x_k} + e^{x_j} \cdot e^{x_j} + e^{x_j} \cdot \sum_{k>j}e^{x_k}} = \frac{e^{x_i-x_j}}{\sum_{k \neq j}e^{x_k-x_j} + 1 + \sum_{k>j}e^{x_k-x_j}}$ 然后，我们重新表示一下$\frac{\partial{\text{softmax}(x)_i}}{\partial x_j}$： $\frac{\partial}{\partial x_j} \frac{e^{x_i}}{\sum_{k=1}^{N}e^{x_k}} = \frac{\partial}{\partial x_j} \frac{e^{x_i-x_j}}{\sum_{k \neq j}e^{x_k-x_j} + 1 + \sum_{k>j}e^{x_k-x_j}}$ $= \frac{-e^{x_i-x_j}}{(\sum_{k \neq j}e^{x_k-x_j} + 1 + \sum_{k>j}e^{x_k-x_j})^2} \cdot (\frac{\partial}{\partial x_j}(\sum_{k \neq j}e^{x_k-x_j}) + \frac{\partial}{\partial x_j}(e^{x_j}) + \frac{\partial}{\partial x_j}(\sum_{k>j}e^{x_k-x_j}))$ $= \frac{-e^{x_i-x_j}}{(\sum_{k \neq j}e^{x_k-x_j} + 1 + \sum_{k>j}e^{x_k-x_j})^2} \cdot (-e^{x_j} + \sum_{k>j}e^{x_k-x_j})$ $= \frac{e^{x_i-x_j}}{\sum_{k=1}^{N}e^{x_k}} \cdot \frac{e^{x_j}}{\sum_{k=1}^{N}e^{x_k}}(\delta_{ij}-\frac{e^{x_i}}{\sum_{k=1}^{N}e^{x_k}})$ 其中，$\delta_{ij}$表示Kronecker delta，当$i=j$时取值为1，否则为0。综上所述，我们可以得到： $\frac{\partial{\text{softmax}(x)_i}}{\partial x_j} = \frac{e^{x_i-x_j}}{\sum_{k=1}^{N}e^{x_k}} \cdot \frac{e^{x_j}}{\sum_{k=1}^{N}e^{x_k}}(\delta_{ij}-\frac{e^{x_i}}{\sum_{k=1}^{N}e^{x_k}})$ 这就是softmax函数的导数公式。

python softmax 导数

相关推荐

Softmax函数原理及Python实现过程解析

python softmax函数

python实现softmax回归

softmax函数的导数

softmax函数的导数用Python表示

用python写出softmax函数的导数

Softmax函数的导数用Python怎么表示

softmax函数的推导

class softmax

pytorch softmax求导

在python怎么用numpy数组设计多层感知机

给我一个神经网络模型的python代码

给我一个python神经网络分类的一个具体例题，并且有详细注释

怎么定义 NeuralNetwork 类

在r软件中,什么函数不能进行前进法后退法

如何将L2正则化放到全连接层

BP——反向传播算法公式推导及代码

最新推荐

Softmax函数原理及Python实现过程解析

c语言开发图书管理系统项目源码+数据+可运行程序

基于transformer的多模态脑肿瘤分割.zip

马尔文高浓度池说明书 High Concentration Cell (ZEN1010)

如何提高APP商业变现能力.docx

RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz

管理建模和仿真的文件

Redis验证与连接：安装成功验证技巧

3、自定义一个函数int compareStr(char *p1, char *p2)，实现两个字符串的比较。相等返回0，大于返回1，小于返回0；编写主函数main()来调用自定义函数完成测试。

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

3、自定义一个函数int compareStr(char p1, char p2)，实现两个字符串的比较。相等返回0，大于返回1，小于返回0；编写主函数main()来调用自定义函数完成测试。