第56章 以后AI能不能做成一把大飞剑?
⚡ 自动翻页
开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽
看到章尾自动进入下一章,追书不用一直点。
  一个大学讲师用仓库废料攒了一只机器狗,然后在三百多人面前把它跑断了腿。
  太穷了。
  但也太牛了。
  林宇把断腿放回桌上,拿起粉笔,在黑板上一边画图一边开始讲解机器狗的ai逻辑。
  他从最核心的部分讲起。
  “你们刚才看到它找到我之后跳了一下。”林宇在黑板上画了一个状態机的示意图,“很多人第一反应是『它有感情了』。错。它没有感情。它有的是一组预训练的行为数据。”
  他在状態机的几个节点旁边標註了標籤:搜索、接近、確认、反馈。
  “我在训练它的时候,给它餵了一批真实的狗狗行为视频数据。
  大概两百多段短视频,全是家养犬看到主人时的反应——跑过去、摇尾巴、原地打转、前腿扑。
  这些行为被拆解成关节角度变化的时间序列,用强化学习的框架让机器狗模仿。”
  他在黑板上写下了强化学习的基本公式:q(s,a) = r + γ·maxq(s,a)。
  “翻译成人话就是:它做了一个动作,如果这个动作让它更接近目標,就给一个正奖励。
  如果偏了,给负奖励。
  反覆训练之后,它自动学会了一条最优路径——先扫全场,锁定目標之后走过去,走到面前之后执行预设的『开心』动作序列。”
  他停了一下。