从热力学到深度学习

现代深度学习

  • 关于信息论和热力学,可参见信息论视角下的热力学
  • 现代深度学习,源于Hinton等人提出的基于热力学的模型
  • 在热力学中,Hamiltonian的常数倍 –> Softmax –> 概率。在深度学习中,神经网络的输出 –> Softmax –> 概率
    • 深度学习用随机梯度下降法来求解最优化问题,所以我们需要计算Softmax的梯度
    • 计算梯度需要利用链式法则,所以我们需要将梯度向量视为Jacobi矩阵
    • 深度学习将向量、矩阵的运算统一为张量的运算,包括广播运算、数量运算等