第343章 悟道云端服务的企业级合约
  刘总监沉默了几秒。“四到六周的移植周期,我们可以接受。但移植后的稳定性和正確性怎么保证?”
  许承翻到下一页,是一张测试验证流程图。
  “移植完成后,我们会用你们的测试数据集做对比验证。输出结果的误差控制在百万分之一以內,才算通过。验证通过后,移植后的模型会在悟道上跑一个月的並行测试——同时跑旧秩序和悟道,对比每次的输出结果。一个月零误差,才能上线生產。”
  刘总监合上了笔记本。“许总,你们的方案比我预想的成熟。我今天是带著签约授权来的,如果我们能在数据驻留保证和价格锁定条款上达成一致,今天就可以签。”
  谈判进行了两个小时。最后,双方在数据驻留的具体定义、价格锁定的期限和范围、服务等级协议的响应时间、违约赔偿的计算方式等细节上达成了共识。银行方面承诺首年採购五千万元的算力服务,主要用於风控模型的训练和推理。合同期三年,总金额一亿五千万元。
  这是悟道算力平台第一个企业级合约,也是金额最大的一个。
  送走银行的代表后,第二家客户进入了会议室。这是一家华夏头部的新能源汽车製造商,年產量超过一百万辆,正在全力推进自动驾驶技术的研发。他们的代表是一个三十出头的技术负责人,姓马,穿著公司文化衫,牛仔裤,运动鞋,看起来不像来签约的,倒像来参观的。
  “许总,我们的需求很简单——算力,大量的算力。我们的自动驾驶团队每天要处理超过两百万公里的路测数据,用来训练感知、决策、控制三个大模型。目前我们在旧秩序的云上跑了超过一万张gpu卡,每个月的费用超过三千万。这个成本太高了,我们需要降本。”
  许承直接亮出了底牌。
  “悟道算力平台可以给你提供两种方案。方案一,用我们的天权ai加速卡集群,每张卡的算力相当於旧秩序高端卡的一点三倍,价格只有它的百分之六十。同样一万张卡的算力,悟道的成本是旧秩序的百分之四十六。每个月从三千万降到一千四百万,一年省近两亿。”
  “方案二,混合方案。你们的核心模型跑在天权加速卡上,边缘任务跑在国產gpu上。这个方案的性价比更高,但复杂度也更高,需要你们的算法工程师做一些適配工作。”
  马技术负责人听完,没有立刻表態,而是问了一个技术深度的问题。
  “天权ai加速卡的软体栈,支持分布式训练吗?我们的模型参数规模已经超过一千亿,单卡放不下,需要多卡並行。”
  许承调出了悟道算力平台的分布式训练架构图。
  “支持。悟道算力平台內置了分布式训练框架,支持数据並行、模型並行、流水线並行三种模式。一千亿参数的模型,我们用两百五十六张天权加速卡,训练时间可以压缩到两周以內。这个性能,和旧秩序的最优方案持平。”