当前位置:首页 > 电脑 > >

XAI建造全球最大AI超级计算机Colossus 通过英伟达的以太网技术加速

XAI建造全球最大AI超级计算机Colossus 通过英伟达的以太网技术加速
2024-10-29 18:00:12 来源:聚焦媒体网

  英伟达宣布,xAI在美国田纳西州孟菲斯市使用NVIDIA Spectrum-X以太网平台,打造搭载10万个NVIDIA Hopper Tensor核心GPU构成的Colossus (以漫威漫画中的「钢人」为称)超级计算机丛集。

  Colossus是全球最大的人工智能超级计算机,用于训练xAI的Grok系列大型语言模型,并且为「X」Premium用户提供聊天机器人功能。 xAI正在将Colossus的规模扩大一倍,总计将搭载20万个NVIDIA Hopper GPU。

  xAI与NVIDIA在短短122天内就建置出相关配套设施与最先进的超级计算机Colossus,此规模系统通常要用到几个月到几年的时间建置。 而从安装第一个机架到开始训练人工智能,前后仅历时19天。

  Colossus超级计算机在训练规模极为庞大的Grok模型时,在所有三层网络结构中,系统都未因流量碰撞而出现应用程序延迟或封包遗失的情况,并且通过Spectrum-X壅塞控制功能,确保高达95%的数据吞吐量。

  相较之下,标准以太网可能会造成上千次的流量碰撞,多半只能提供60%的数据吞吐量。

  NVIDIA网络事业部资深副总裁Gilad Shainer表示:AI正成为关键业务,需要更高的效能、安全性、扩充能力和成本效益。 设计NVIDIA Spectrum-X以太网平台的目的,就是要为xAI这一类创新公司能够更快速处理、分析和执行AI工作负载,以加速开发、部署AI解决方案,并且更快推向市场。

  Elon Musk在X上表示:Colossus是世界上最强大的训练系统。 xAI团队、NVIDIA及我们的众多合作伙伴与供应商表现非常出色。

  xAI的发言人表示:xAI建造出世界上最大、最强大的超级计算机。 NVIDIA的Hopper GPU加上Spectrum-X让我们能够突破大规模训练AI模型的界限,并在以太网标准基础上,建造一个拥有超级加速、并优化的AI工厂。

关键词:英伟达 以太网

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

投诉邮箱:Email:133 46734 45@qq.com

相关新闻