最优化方法

深度学习和最优化问题

  • 深度学习是一个典型的最优化问题,其目标为最小化损失函数

        \[ loss(model(params), dataset). \]

    通常,模型model、数据集dataset是固定的,参数params是可学习的。学习的过程即寻找最优参数的过程,它可以使用梯度下降法,

        \[ params \leftarrow params - learning\_rate \times \frac{\partial loss}{\partial params}. \]

  • 寻找参数的过程即反向过程,称为训练(Training)

        \[ model,\; dataset \mapsto params. \]

    使用参数的过程即正向过程,称为推理(Inference)

        \[ model,\; params \mapsto output. \]