矩阵微分常用公式推导
时间: 2023-10-05 10:08:07 浏览: 98
矩阵微分在机器学习、图像处理和最优化等领域的公式推导中经常使用。以下是矩阵微分的常用公式推导:
1. 标量对向量的微分:
若 y 是标量函数,x 是列向量,则有 dy/dx = (∂y/∂x₁, ∂y/∂x₂, ..., ∂y/∂xₙ)。
2. 向量对标量的微分:
若 y 是列向量函数,x 是标量,则有 dy/dx = (∂y₁/∂x, ∂y₂/∂x, ..., ∂yₙ/∂x)ᵀ。
3. 向量对向量的微分(雅可比矩阵):
若 y 是列向量函数,x 是列向量,则有 J = (∂y/∂x) = [∂y₁/∂x₁, ∂y₁/∂x₂, ..., ∂y₁/∂xₙ;
∂y₂/∂x₁, ∂y₂/∂x₂, ..., ∂y₂/∂xₙ;
...
∂yₘ/∂x₁, ∂yₘ/∂x₂, ..., ∂yₘ/∂xₙ]。
4. 矩阵对标量的微分:
若 Y 是矩阵函数,x 是标量,则有 dY/dx = (∂Y/∂x) = [∂y₁/∂x, ∂y₂/∂x, ..., ∂yₘ/∂x],其中 yi 表示 Y 的第 i 行。
5. 标量对矩阵的微分:
若 y 是标量函数,X 是矩阵,则有 dy/dX = (∂y/∂X) = [∂y/∂X₁, ∂y/∂X₂, ..., ∂y/∂Xₙ],其中 ∂y/∂Xᵢ 表示对矩阵 X 的第 i 个元素求偏导数。
6. 矩阵对矩阵的微分:
若 Y 是矩阵函数,X 是矩阵,则有 dY/dX = (∂Y/∂X) = [∂y₁/∂X, ∂y₂/∂X, ..., ∂yₘ/∂X],其中 ∂yᵢ/∂X 表示对矩阵 X 的每个元素求偏导数。
以上是矩阵微分的常用公式推导。请注意,这只是一些基础的公式,实际应用中可能会有更复杂的情况。如果你有更具体的问题或需要更深入的了解,请提出。