向量函数的微分 - 小时百科
向量函数是什么?
给定一个函数f(x)=Wx
其中输入 x∈Rn、输出 f(x)∈Rm、权重矩阵 w∈Rm×n。
这个向量函数能将n维的输入向量映射到m维输出向量。
微分代表着什么?
与一维微分函数dy=y′dx一样,代表着x的微小变化会怎么影响到y。
而多维微分函数dz=∂x∂z dx+∂y∂z dy就代表着每个变量x,y的微小变化会怎么影响到z。
与向量函数结合,就是每一个变量xi,yi的微笑变化会怎么影响到zi,每一行都是dz=∂x∂z dx+∂y∂z dy这样的数,共有m行
向量函数的全微分用矩阵表示
给定一个向量函数f(q)=(w11q11+w12q2+...w1nqn,w21q1+w22q2+...w2nqn,...+wmnqn)T 我们要求f对q的全微分函数,∂q∂f=J(q) (J(q)就是雅可比矩阵),并且写成矩阵的形式:
J(q)=∂q∂f=⎣⎡∂q1∂f1∂q1∂f2⋮∂q1∂fm∂q2∂f1∂q2∂f2⋮∂q2∂fm……⋱…∂qn∂f1∂qn∂f2⋮∂qn∂fm⎦⎤
核心意义:输出微小变化 = 雅可比矩阵 × 输入微小变化;知道输出要变多少,就能反向推输入该变多少。
而这个思想在工程上被广泛的应用,这里举两个应用:
[[雅可比矩阵在机器人学中的应用]],给定若干变量,要求机器人末端达到多少的速度,则每个变量的具体速度就能通过雅可比矩阵计算出来!
[[雅可比矩阵在神经网络中的应用]],当神经网络要进行反向传播更新权重的时候,就需要根据雅可比矩阵计算通过链式法则计算误差和权重的梯度,进而通过梯度下降法更新权重。∂W∂L=∂y∂L∂W∂y