首页 > 玄幻 > 让你代课,你教学生核聚变? > 第56章 以后AI能不能做成一把大飞剑?

第56章 以后AI能不能做成一把大飞剑?

⚡ 自动翻页 开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽 看到章尾自动进入下一章,追书不用一直点。

  一个大学讲师用仓库废料攒了一只机器狗,然后在三百多人面前把它跑断了腿。

  太穷了。

  但也太牛了。

  林宇把断腿放回桌上,拿起粉笔,在黑板上一边画图一边开始讲解机器狗的ai逻辑。

  他从最核心的部分讲起。

  “你们刚才看到它找到我之后跳了一下。”林宇在黑板上画了一个状態机的示意图,“很多人第一反应是『它有感情了』。错。它没有感情。它有的是一组预训练的行为数据。”

  他在状態机的几个节点旁边標註了標籤:搜索、接近、確认、反馈。

  “我在训练它的时候,给它餵了一批真实的狗狗行为视频数据。

  大概两百多段短视频,全是家养犬看到主人时的反应——跑过去、摇尾巴、原地打转、前腿扑。

  这些行为被拆解成关节角度变化的时间序列,用强化学习的框架让机器狗模仿。”

  他在黑板上写下了强化学习的基本公式:q(s,a) = r + γ·maxq(s,a)。

  “翻译成人话就是:它做了一个动作,如果这个动作让它更接近目標,就给一个正奖励。

  如果偏了,给负奖励。

  反覆训练之后,它自动学会了一条最优路径——先扫全场,锁定目標之后走过去,走到面前之后执行预设的『开心』动作序列。”

  他停了一下。