首页交叉熵损失的反向求导

交叉熵损失的反向求导

时间: 2023-11-02 19:53:56 浏览: 120

机器学习 + 交叉熵损失、反向传播、逻辑回归 + 交叉熵损失结合反向传播算法手动实现逻辑回归 + 手动复现提高coding能力

项目交叉熵损失结合反向传播算法手动实现逻辑回归包括三个代码文件：图像数据处理的代码文件、手动复现逻辑回归的代码文件以及可视化学习率、训练集以及测试集准确率、不同迭代次数的可视化图鉴。训练集以及测试集数据公开。整个项目的思维逻辑以思维导图的方式呈现。此外对于项目中的文件都已说明其用途。本项目面向机器学习初学者：帮助大家理解反向传播算法以及交叉熵损失，掌握反向传播算法在具体模型中如何实现，提高模型的复现能力；此外对于模型迭代中的各级参数、Loss、训练集以及测试集的各种评级指标：准确率、灵敏度等等都可以在手动复现中去尝试如何实现。完全掌握机器学习方法只靠理论知识是不够的，需要将理论与实践中的代码结合在一起，打破神经网络的黑箱，实现自我的突破，希望该项目对大家有所帮助！

交叉熵损失函数是常用于分类问题的损失函数之一。对于二分类问题，假设模型输出为 y，真实标签为 t，则交叉熵损失可以表示为：L = -t * log(y) - (1 - t) * log(1 - y)。要求交叉熵损失的反向导数，我们需要先对 y 进行求导。根据链式法则，有： ∂L/∂y = -t/y + (1 - t)/(1 - y) 然后我们可以继续对 y 进行求导。由于 y 是模型的输出，通常使用激活函数进行转换，比如 sigmoid 函数。假设 a 是 sigmoid 函数的输出，则有 y = sigmoid(a)。根据 sigmoid 函数的导数性质，有： ∂y/∂a = y * (1 - y) 接下来，我们可以继续求解 ∂L/∂a： ∂L/∂a = (∂L/∂y) * (∂y/∂a) = (-t/y + (1 - t)/(1 - y)) * (y * (1 - y)) = y - t 所以，交叉熵损失函数对模型输出 a 的导数为 y - t。

阅读全文