热门资讯> 正文
2026-06-01 20:07
CoreWeave利用其专门构建的软件和工程解决方案,成为第一家推出Vera Rubin的人工智能云提供商,扩展了CoreWeave平台对NVIDIA硬件的支持。这一里程碑式成就包括完成整个机架规模架构的严格系统级验证。
庞大的人工智能正在重塑基础设施需求。随着模型达到一万亿个参数,上下文窗口扩展到数百万个令牌,持续推理会话成为标准,推理性能已成为人工智能公司运营和发展速度的决定性限制。
NVIDIA Vera Rubin NVL 72-每个机架配备72个NVIDIA Rubin图形处理器和36个NVIDIA Vera处理器,通过260 TB/s的NVIDIA NVLink第6代结构连接-与NVIDIA Blackwell 1相比,每瓦的推理能力提高了10倍,每百万个代币的成本降低了10倍。与Vera Rubin合作,CoreWeave将为客户提供更好的结果。
Jane Street定量研究主管Craig Falls表示:“我们的研究依赖于强大且可靠的基础设施,随着我们在NVIDIA Hopper和Blackwell进行扩展,CoreWeave已经实现了这一目标。”“他们能够提供具有完全集群可观察性的高性能集群,以及深入解决棘手问题的支持团队,这使我们有信心与他们在Vera Rubin上合作。我们对机架规模的效率提高可转化为我们的研究人员更快的训练运行和更短的迭代周期感到兴奋。"
由CoreWeave Mission Control™支持的针对机架级人工智能的专门构建基础设施
为了让客户在生产规模上更好地利用Vera Rubin,CoreWeave开发了一套新的有针对性的创新:
软件定义的液体冷却:Valvey是CoreWeave的可编程每机架阀门组件,它将冷却从被动机械系统转变为软件定义的机架级控制表面。Valvey是CoreWeave Mission Control的一部分,可实时监控流量、温度、压力和泄漏检测,从而实现自动隔离、紧急关闭和维护,而不会干扰共享冷却回路上的邻近机架。统一机架控制:Racky是一款新的统一机架控制设备,专门设计用于将电源、冷却和环境传感器聚合到标准化管理表面中,允许每个Vera Rubin机架作为云资源而不是自定义一次性构建进行管理。多轨、多平面网络:CoreWeave在融合以太网RoCE上支持NVIDIA Quantum-X800 InfiniBand和NVIDIA Spectrum-X以太网,具有无阻塞、多轨、多平面RoCE结构,可提供1.6 TB/s的后台带宽。Spectrum-X以太网架构可扩展到两个网络层中数十万个图形处理器的配置。安全、可扩展的人工智能云运营:CoreWeave正在通过NVIDIA BlueField-4 DPU推进安全、多租户人工智能云运营,实现更快的数据访问、更低的延迟和更强的大规模租户隔离。BlueField-4可以卸载并加速基础设施服务,使租户能够在完整的Vera Rubin计算平台上运行工作负载,同时保留控制权和安全性。CoreWeave产品与工程执行副总裁陈戈德堡表示:“代理时代需要一种根本不同的基础设施方法,这种方法与持续推理、不可预测地扩展以及全天候生产运行的工作负载保持同步。”“在实验室中执行的基础设施与在生产中执行的基础设施的区别在于其背后的工程深度。凭借Valvey和Racky等正在申请专利的创新,CoreWeave完成了全栈编排工作,使Vera Rubin能够按照其设计的方式执行其设计方式,不仅在实验室中,而且在生产规模上为世界上要求最高的人工智能团队提供。"
“Vera Rubin是英伟达有史以来构建的最强大的人工智能平台,”英伟达超规模和高性能计算(IPC)副总裁Ian Buck表示。“CoreWeave一直处于大规模部署新一代英伟达架构的前沿,他们对Vera Rubin的全栈、端到端方法(从冷却到编排)是世界上最雄心勃勃的人工智能团队将如何推动下一个人工智能前沿。"
建立在深厚的技术合作伙伴关系的基础上
将Vera Rubin NVL 72等机架级平台投入生产需要整个基础设施堆栈之间的密切协作。CoreWeave的技术合作伙伴生态系统对于Vera Rubin如何快速和规模地接触客户至关重要。戴尔技术公司通过其高性能的WH 9812服务器为该平台提供了架构支柱。该设施还配备了Micron 7600 SSD,通过首批以机架规模部署的液体冷却NVMe存储解决方案之一来提高能源效率。
戴尔科技公司董事长兼首席执行官迈克尔·戴尔表示:“戴尔科技公司和CoreWeave共同致力于提供满足人工智能需求前沿的创新。”“RJ XE 9812正是针对这种密度和精度而设计的。与CoreWeave合作推出首款NVIDIA Vera Rubin NVL 72机架,直接验证了企业级硬件与正确的运营专业知识搭配使用时可以发挥什么作用。"
CoreWeave始终如一地提供行业领先的性能,破纪录的MLPerf基准结果、其作为唯一一个在SemiAnalysilon ButterMAX ™ 1.0和2.0中获得顶级白金级排名的人工智能云的地位,以及在Armed Analyses进行的独立推理基准测试中,Moonshot AI的Kimi K2.6的推理速度和性价比排名第一。