第439章 深度学习

⚡ 自动翻页 开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽 看到章尾自动进入下一章,追书不用一直点。

  她绕到书桌另一侧,身体微微前倾,看向屏幕上的內容。

  “深度学习……卷积神经网络……”

  她轻声念出那些標题,然后视线停留在“梯度下降”和下面那片空白区域。

  “你想推导什么?”钟虹问。

  马宇腾指著屏幕,將自己的困境说了出来。

  “我想描述一个优化算法,用来更新神经网络的参数,让模型的预测误差最小化。我知道它的核心思想是沿著梯度下降最快的方向去调整参数,但我写不出具体的数学过程。”

  他儘量用通俗的语言解释。

  钟虹安静地听著,没有插话。

  等马宇腾说完,她沉默了几秒,似乎在脑中构建整个数学模型。

  “你的意思是,有一个包含大量参数的复杂函数,也就是误差函数。你想找到一组参数,使这个函数的值最小。”

  钟虹用她自己的语言,重新定义了这个问题。

  “对,就是这个意思。”马宇腾立刻点头。

  “这本质上是一个多元函数求最小值的问题。”钟虹的语气平静而篤定,“用梯度下降法来解决很直观。”

  她伸出纤细的手指,在空中比划著名。

  “假设你的误差函数是j(θ),θ是参数向量。那么在任意一点θ,函数值下降最快的方向就是梯度的反方向,也就是-?j(θ)。”