编辑
2026-05-22
学习
00

目录

向量函数是什么?
微分代表着什么?
向量函数的全微分用矩阵表示

向量函数的微分 - 小时百科

向量函数是什么?

给定一个函数f(x)=Wx\boldsymbol f(\boldsymbol x) = \boldsymbol W \boldsymbol x 其中输入 xRn\boldsymbol x\in\mathbb R^n、输出 f(x)Rm\boldsymbol f(\boldsymbol x)\in\mathbb R^m、权重矩阵 wRm×n\boldsymbol w\in\mathbb R^{m\times n}。 这个向量函数能将n维的输入向量映射到m维输出向量。

微分代表着什么?

与一维微分函数dy=ydxdy=y'dx一样,代表着x的微小变化会怎么影响到y。 而多维微分函数dz=zx dx+zy dydz = \frac{\partial z}{\partial x}\ dx + \frac{\partial z}{\partial y}\ dy就代表着每个变量x,y的微小变化会怎么影响到z。 与向量函数结合,就是每一个变量xi,yix_i,y_i的微笑变化会怎么影响到ziz_i,每一行都是dz=zx dx+zy dydz = \frac{\partial z}{\partial x}\ dx + \frac{\partial z}{\partial y}\ dy这样的数,共有m行

向量函数的全微分用矩阵表示

给定一个向量函数f(q)=(w11q11+w12q2+...w1nqn,w21q1+w22q2+...w2nqn,...+wmnqn)Tf(q)=(w_{11}q_{11}+w_{12}q_2+...w_{1n}q_n,w_{21}q_1+w_{22}q_2+...w_{2n}q_n,...+w_{mn}q_n)^T 我们要求f对q的全微分函数,fq=J(q)\frac{\partial f}{\partial q} = J(q) (J(q)J(q)就是雅可比矩阵),并且写成矩阵的形式:

J(q)=fq=[f1q1f1q2f1qnf2q1f2q2f2qnfmq1fmq2fmqn]\boldsymbol J(\boldsymbol q) =\frac{\partial \boldsymbol f}{\partial \boldsymbol q} = \begin{bmatrix} \dfrac{\partial f_1}{\partial q_1} & \dfrac{\partial f_1}{\partial q_2} & \dots & \dfrac{\partial f_1}{\partial q_n}\\[6pt] \dfrac{\partial f_2}{\partial q_1} & \dfrac{\partial f_2}{\partial q_2} & \dots & \dfrac{\partial f_2}{\partial q_n}\\[6pt] \vdots & \vdots & \ddots & \vdots\\[6pt] \dfrac{\partial f_m}{\partial q_1} & \dfrac{\partial f_m}{\partial q_2} & \dots & \dfrac{\partial f_m}{\partial q_n} \end{bmatrix}

核心意义:输出微小变化 = 雅可比矩阵 × 输入微小变化;知道输出要变多少,就能反向推输入该变多少。 而这个思想在工程上被广泛的应用,这里举两个应用: [[雅可比矩阵在机器人学中的应用]],给定若干变量,要求机器人末端达到多少的速度,则每个变量的具体速度就能通过雅可比矩阵计算出来! [[雅可比矩阵在神经网络中的应用]],当神经网络要进行反向传播更新权重的时候,就需要根据雅可比矩阵计算通过链式法则计算误差和权重的梯度,进而通过梯度下降法更新权重。LW=LyyW\frac{\partial L}{\partial W} = \frac{\partial L}{\partial y} \frac{\partial y}{\partial W}

本文作者:Deshill

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!