从热力学到深度学习 现代深度学习 关于信息论和热力学,可参见信息论视角下的热力学 现代深度学习,源于Hinton等人提出的基于热力学的模型 在热力学中,Hamiltonian的常数倍 –> Softmax –> 概率。在深度学习中,神经网络的输出 –> Softmax –> 概率 深度学习用随机梯度下降法来求解最优化问题,所以我们需要计算Softmax的梯度 计算梯度需要利用链式法则,所以我们需要将梯度向量视为Jacobi矩阵 深度学习将向量、矩阵的运算统一为张量的运算,包括广播运算、数量运算等