第108章 晶片

⚡ 自动翻页 开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽 看到章尾自动进入下一章,追书不用一直点。

  沈一鸣入职的第三天,张磊把一份晶片调研报告甩在了左城桌上。

  “城哥,调研报告出来了,情况不太乐观。“张磊拉了把椅子坐下来,“国產ai晶片主要就两家能看,寒武纪和地平线。寒武纪的mlu270算力不错,峰值算力达到128 tops,但功耗偏高,十五瓦往上走。地平线的旭日3功耗控制得好,只有两瓦,但算力只有5 tops,跑不了大模型。“

  左城翻著报告,眉头越皱越紧。

  “进口的呢?“

  “英伟达的jetson nano,算力和功耗都比较均衡,但一颗晶片的採购价是国產的三倍。而且现在贸易摩擦升级,供应链不稳定,万一哪天被卡脖子就麻烦了。“张磊敲了敲桌面,“城哥,我的建议是短期用国產,长期想办法自研。“

  “自研?“左城抬起头,“我们做ai晶片,你有把握?“

  “不是现在做。“张磊说,“方泽和我討论过,ai晶片的核心是架构设计,不是製造。设计我们可以做,流片代工就行。关键是架构,这东西需要算法和硬体深度耦合,我们正好有算法团队和硬体团队。“

  左城沉默了一会儿。自研ai晶片是一条漫长而烧钱的路,但如果不做,402的ai业务就永远受制於晶片供应商。

  “先把短期的方案定下来。“左城说,“边缘ai推理场景用寒武纪的mlu270,功耗虽然高一点但算力够用。联邦学习场景用地平线的旭日3,功耗低適合大规模部署。高端训练场景先用英伟达,同时和寒武纪谈定製方案。“

  “行,我去跟进採购。对了,寒武纪那边说可以提供一批工程样片先让我们测试,不收费。“张磊站起来,又想起什么,“方泽说寒武纪那边有个人想见你。他们正在找垂直场景的合作伙伴做晶片验证,听说我们物联网平台上跑著ai,很感兴趣。“

  “约个时间。“左城说。

  张磊走后,左城打开系统面板,翻到ai枝干的叶片列表。

  模型压缩优化。这枚叶片的能力是將ai模型在保持精度的前提下大幅压缩体积,让大模型可以跑在资源受限的边缘设备上。如果模型压缩做到极致,寒武纪的mlu270就能跑本该需要英伟达高端晶片才能跑的模型,功耗还能降下来。

  左城想到这里,叫来了沈一鸣。

  “一鸣,你之前在论文里提到的自適应压缩率,和系统面板里这枚模型压缩优化的思路能不能结合?“