第10章 超越
⚡ 自动翻页
开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽
看到章尾自动进入下一章,追书不用一直点。
  陈阳摇了摇头,“titan虽然便宜显存大,但是它的显存没有ecc(错误检查和纠正)功能。在家里或者小规模玩玩可以,但我们要建设的是超算中心,跑的是商业模型。一旦发生比特翻转(bit flip),导致训练中断或者参数错误,浪费的时间成本,划不来。”
  “我们要的是稳定。”陈阳语气坚定的说道。
  顾书瑶听完,也不再反驳。
  3月中旬,京城某数据中心
  陈阳带著顾书瑶和运维团队,站在一排刚刚改造完毕的黑色机柜前。
  为了迎接这批伺服器,陈阳额外支付了几十万的改造费。
  因为2013年的主流机房都是为cpu伺服器设计的,根本扛不住gpu的高功耗和高发热。
  为此,机房专门改造了电源线路,还在机柜后方加装了暴力的工业风扇。
  “陈总,这就是你要的效果。”机房负责人指著那一排排亮起的绿灯,
  “100张tesla k20,全部上线。散热和供电都测过了,满载运行没问题。”
  “辛苦了。”陈阳满意地点点头,看向顾书瑶。
  “书瑶,试试?”
  顾书瑶隨即打开隨身携带的笔记本,连入內网。
  屏幕上跳动著一个简洁的控制台界面——这是陈阳基於前面的框架之前花了一个月时间,带著几个人连夜赶出来的简易版超算调度平台。
  虽然简陋,但它能將这100张显卡整合成一个整体。