
5月20日音书,据外媒HPCwire报说念,英伟达(NVIDIA)近期细腻将首款自研Vera CPU 送到了客户手中,Anthropic、OpenAI、xAI 与Oracle Cloud Infrastructure(OCI)已最初收到首批系统,鲜艳着这款为代理AI 假想的科罚器从发布也曾走向了本体部署。英伟达大限制与高性能计较副总裁Ian Buck 亲身委派了培植,突显公司正把AI 基础样式的竞争重点蔓延到GPU除外的CPU 层级。
王者荣耀下注平台(中国)官网
据了解,英伟达的这批Vera CPU 已于5月15日投递三家顶尖客户的AI实验室:Anthropic 位于旧金山SoMa 的办公室、OpenAI 的Mission Bay 总部,以及xAI 在帕罗奥图(Palo Alto)的据点。随后于5 月18 日送到位于圣塔克拉拉(Santa Clara)的Oracle AI Customer Excellence Center。
英伟达暗示,Vera CPU是专为代理式AI 使命负载打造的新式CPU,因为这类模子不仅仅在“回答”,还要进一步推行器具招呼、协作进程、撷取长荆棘文与科罚即时使命,对CPU 的需求远高于传统推理场景。
英伟达此前已于3月的GTC大会上细腻发布了Vera CPU,并将其视为下一个限制可达数十亿好意思元的业务。此次细腻委派,也代表者英伟达Vera CPU运转干预坐褥环境。英伟达指出,世界杯压球官网Vera CPU 接纳88颗英伟达自研Olympus 中枢,具备1.2 TB/s 内存带宽,以及每中枢肠能晋升约50%,假想是在高负载、平行且即时的使命中,晋升举座AI 工场效果与恢复速率。
据先容,Anthropic 由计较负责东说念主James Bradbury 接纳Vera CPU系统,并暗示推论算力是模子成长的报复加快器;OpenAI 则由负责计较基础样式的萨钦·卡蒂(Sachin Katti)接办,英伟达以至在现场盛开机壳展示里面结构。 xAI 方面,马斯克(Elon Musk)亲身听取讲明并经营中枢数、内存成立与散热假想,该公司正评估将Vera CPU用于强化学习与代理式模拟进程。
Oracle Cloud Infrastructure诈骗Karan Batta 暗示,公司决议自本年起部署数十万颗英伟达 Vera CPU,因为代理式AI 需要在大限制下督察握续性能。
英伟达也指出世界杯压球官网,OCI 是首家在超大限制(hyperscale)限制部署Vera CPU的云表就业商,意味着企业客户可望赢得更接近坐褥级的代理式AI 基础样式。