简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

思科加入定制AI芯片战局 G300提供带宽翻倍实现AI纵向与横向扩展

2026-02-11 14:39

在现代人工智能数据中心(如今其实已称得上是数据生态体系,因为在一些极端场景下,人工智能的处理需求早已突破单个数据中心,甚至是一个区域内多个数据中心的承载边界)中,网络存在两大瓶颈。其一为数据中心互联架构,它通过路由器骨干网将多个数据中心整合为一个统一的计算综合体;其二是后端网络,它能在数十个(未来甚至可达数百、数千个)图形处理器(GPU)或异构处理器(XPU)之间构建统一的内存域,这也是实现专家混合模型训练与推理的最优粒度。

当谷歌、微软和Meta相继推出自己的AI数据中心芯片产品撼动英伟达在服务器领域的领导地位之际,曾经的网络第一巨头思科终于在AI数据中心定制芯片方面掷出杀手锏。

思科的定制芯片并不高调,但以稳准狠解决实际痛点著称。去年秋季,思科凭借旗下 “黑金字塔” P200 路由器芯片解决了数据中心互联的难题。该芯片隶属于思科持续升级扩容的 Silicon One 芯片产品线,不仅被思科用于自研的交换机和路由器,也被超大规模数据中心运营商和云服务商集成至其定制化设备中。

G300

本周,在阿姆斯特丹举办的思科技术峰会上,思科推出

专用集成电路(ASIC),大幅提升了交换机侧的带宽性能。这款芯片的总带宽达 102.4 太比特 / 秒,旨在与博通、英伟达展开竞争,助力行业向 1.6 太比特 / 秒端口速率迈进,实现后端网络中 GPU 与 XPU 的高速互联;同时,通过高基数交换机提供 800 吉比特 / 秒的前端网络端口,实现网络扁平化,大幅降低网络建设成本。思科为这款全新的 AI 网络芯片和交换机搭配了 Nexus One 管理平台,该平台可打造统一的网络架构,同时原生集成思博伦(Splunk)分析工具,并实现人工智能作业的可观测性。Silicon One G300 及其所驱动的思科交换机,未来或将与英伟达的迈络思 InfiniBand、Spectrum-X 以太网光子交换系统,以及博通的 XPU、Tomahawk 交换机等产品展开市场竞争。

G300

 目前我们尚未知晓

芯片的研发代号,但可以确定的是,其基础带宽和速率较 2023 年 6 月推出的 G200 交换机专用集成电路实现了翻倍。G200 芯片的推出初衷便是在人工智能和高性能计算集群的横向扩展网络中,与无限带宽(InfiniBand)技术展开竞争。2025 年 5 月起,G200 开始凭借更高的可扩展性和性价比,逐渐在市场站稳脚跟,但毋庸置疑的是,英伟达仍在无限带宽横向扩展网络市场占据大量份额,并凭借用于后端纵向扩展网络、实现 GPU 内存互联的 NVSwitch 互联技术赚得盆满钵满。

G200 及全新推出的 G300 专用集成电路,均为优化精简版以太网技术量身打造,既具备无限带宽技术的核心优势 —— 高带宽、低延迟、自适应路由和拥塞控制,又保留了以太网相较无限带宽的独有长处 —— 高安全性、微分段能力,且拥有多家厂商参与的市场竞争格局。而无限带宽技术的供应商单一,这一点已成为部分企业选择的顾虑。

思科此次发布的产品矩阵涵盖芯片、光模块、系统、软件及运营模式全维度:Silicon One G300 芯片、先进的硬件系统组合、高性能光模块、升级后的软件功能,以及 Nexus One 管理平台。其中 Nexus One 平台支持 AI 作业可观测性、思博伦原生集成、AgenticOps 智能运维能力,还能实现本地与云部署的统一运营;硬件端则搭配 1.6 太比特八通道小型可插拔光模块(OSFP)和 800 吉比特线性可插拔光模块(LPO),落地于思科 N9000 和 8000 系列交换机。

此次与 G300 芯片一同发布的,还有全新的 Nexus 9000 和思科 8000 系列硬件系统、适配的新型可插拔光模块,以及网络操作系统和控制平面的升级版本。这些升级让基于 G300 交换机的大规模纵向扩展网络,或是为人工智能系统供能的高性能前端网络的管理变得更为便捷。

思科目前尚未公布 G300 专用集成电路的详细技术参数,因此我们无法展示该芯片的模块框图及 G300 交换机的电路原理图。但我们从思科 Silicon One 产品线研发负责人、高级副总裁兼思科院士拉凯什乔普拉(Rakesh Chopra)处,获取了该芯片的核心带宽速率数据与关键设计思路。

G300 芯片的核心亮点在于智能聚合网络技术,可打造高效的人工智能基础设施,拥有行业领先的数据包缓冲区、聚合负载均衡代理和先进的遥测引擎,能使网络利用率提升 33%、作业完成时间缩短 28%,这一切均由思科 Silicon One 芯片提供算力支撑。

与 G200 相同,G300 配备 512 个串行解串器(SerDes)电路模块以实现端口功能,所有模块均围绕数据包处理引擎搭建。两款芯片的每个串行解串器都配有独立的以太网媒体访问控制(MAC)地址,实现端口与媒体访问控制地址的一一映射。(多数交换机专用集成电路的每个串行解串器仅配备半数媒体访问控制地址,若通过聚合串行解串器实现指定带宽的端口,该设计足矣;但如果想要打造高基数交换机,配备更多低带宽端口,这种设计便会面临媒体访问控制地址不足的问题。)

和去年秋季发布的 P200 芯片一样,G300 采用 “无盖式” 芯片设计,即移除芯片封装盖,使风冷散热器和液冷散热块可直接贴合芯片安装,大幅提升散热效率。

思科 2022 年 10 月推出的 G100 交换机专用集成电路基于台积电 7 纳米制程打造,2023 年夏季推出的 G200 则采用台积电 5 纳米制程。G300 的静态随机存取存储器(SRAM)缓存缓冲区达 252 兆字节,据我们估算,至少是 G200 缓存缓冲区的两倍,同时仍配备同等数量的高速串行解串器。由此推测,思科为 G300 选用了台积电的混合制程方案。G300 为多芯片设计,我们大胆推测,其数据包处理引擎模块及静态随机存取存储器缓冲区采用 3 纳米制程,而外围的串行解串器芯粒则采用台积电在 5 纳米基础上优化的成熟 4 纳米制程。因为信号电路的制程微缩难度远高于计算电路,且 3 纳米技术的使用成本也高于 4 纳米。

乔普拉表示,G300 的 252 兆字节缓冲区是面向全部 512 个串行解串器的单一、统一共享缓冲区,并非像其他部分设计那样,按串行解串器组进行分段设计。这一设计不仅让缓冲区容量更大,更实现了所有串行解串器的内存共享,大幅提升操作效率,尤其在网络拥塞时,能有效避免以太网数据包丢失,保障数据传输的完整性。

这款大容量缓冲区与片上硬件负载均衡代理相配合,可实时监控交换机内部的数据流,绘制流量分布图,精准识别拥塞和传输故障节点,并据此优化网络中所有 G300 芯片的流量分配。该负载均衡的核心为算法驱动,严格来说并非人工智能技术。此外,与所有 Silicon One 系列芯片一致,G300 全面支持 P4 网络编程语言的可编程性,可根据市场需求快速开发并部署新功能。

G300 搭载的串行解串器由思科自主设计,编码前速率达 224 吉比特 / 秒,编码后为 200 吉比特 / 秒。(我们推测,该串行解串器的原生信号时钟速率为 112 吉比特 / 秒,通过四电平脉冲幅度调制(PAM4)技术实现速率翻倍至 224 吉比特 / 秒,该调制技术可使每个信号承载两位数据。)值得一提的是,这是思科首款 200 吉比特 / 秒速率的串行解串器。

基于 G300 芯片,可灵活打造不同规格的交换机:512 个 200 吉比特 / 秒端口、256 个 400 吉比特 / 秒端口、128 个 800 吉比特 / 秒端口,甚至 64 个速率高达 1.6 太比特 / 秒的端口,后者的性能至今仍堪称惊艳。

此外,G300 可直接驱动单端口 800 吉比特 / 秒的线性可插拔光模块,思科也推出了适配 G300 交换机的线性可插拔光模块产品;同时,思科还自研了 1.6 太比特 / 秒的八通道小型可插拔光模块,供选择 G300 搭建 1.6 太比特 / 秒端口网络的客户使用。这些光模块均基于思科自研芯片打造,非第三方外购产品(英伟达和博通也同样实现了这类组件的自研自产)。有趣的是,思科也为有多样化选择需求、希望通过第二供应商分散供应链风险的客户,推出了基于第三方数字信号处理器(DSP)的可插拔光模块。

采用线性可插拔光模块能实现大幅节能,进而将更多电力分配给计算引擎。乔普拉表示,线性可插拔光模块的功耗可降低约 50%,人工智能集群中的整个交换基础设施功耗可降低约 30%,这一节能效果意义重大。

2026 年下半年,新一代 GPU 和 XPU 即将面世,部分客户为满足其更高的带宽需求,愿意承担额外功耗以部署 1.6 太比特 / 秒端口;而另一部分客户对 800 吉比特 / 秒的带宽已足够使用,因此低功耗的线性可插拔光模块成为其更优选择。

乔普拉称,在标准化带宽条件下,相较于 G200 及市场上的多数竞品,G300 能使网络利用率提升 33%,作业完成时间缩短 28%。

乔普拉自豪地表示:“此次发布的产品中,我们不仅拥有核心硬件技术,光模块的测试和认证体系更是独树一帜。我们的测试架构远比行业内其他厂商全面,原因在于人工智能工作负载具有同步性,光模块的单次故障与前端网络故障不同,它会直接导致人工智能作业重启,工作人员不得不回到检查点重新开始。”

思科将 G300 芯片集成至多款设备中:风冷设备方面,搭载于运行思科自研 NX-OS 操作系统的 Nexus N9364-SG3 交换机,以及运行开源 SONiC 网络操作系统的思科 8133 交换机。这两款风冷交换机均为 3 机架单位(3RU)规格,配备 64 个 1.6 太比特 / 秒的八通道小型可插拔光模块端口,且搭载冗余可插拔电源。

若客户需要更紧凑的设备,同时兼顾液冷和开放式机架部署,思科则推出了两款产品:运行 NX-OS 操作系统的 Nexus N9363-SG2 交换机,以及运行 SONiC 操作系统的思科 8132 交换机。该款设备宽度为 21 英寸,符合开放计算项目(OCP)的 Orv3N 规范,采用 20 机架单位(20U)设计,配备 64 个 1.6 太比特 / 秒八通道小型可插拔光模块端口,搭载冗余集成电源,拥有先进的泄漏检测功能,适配超大规模数据中心、新型云服务商、电信运营商、主权云及企业客户的需求。

这一技术升级带来的核心价值在于:在纵向扩展网络中实现 GPU 间的互联,或在横向扩展网络中实现服务器节点及其 GPU 间的互通,若要达到 102.4 太比特 / 秒的总互联带宽,此前需要 6 台互联的 G200 设备,而现在仅需 1 台 G300 设备即可实现。

对比原有系统与全新系统,G300 方案的效率提升 6 倍,所需设备数量大幅减少,且功耗效率提升 70%。原有系统为 6 台 51.2 太比特 / 秒的风冷 G200 交换机,配备 64 个 800 吉比特 / 秒八通道小型可插拔光模块端口;全新系统则为 1 台 102.4 太比特 / 秒的液冷 G300 交换机,配备 64 个 1.6 太比特 / 秒八通道小型可插拔光模块端口。

这也意味着,即便 G300 的单价是 G200 的三四倍,但其综合性价比仍极具优势。目前我们尚未知晓 G300 的实际定价,但在人工智能时代来临前,行业的常规规律是:新一代专用集成电路的单价约为上一代的 1.5 倍,而单芯片带宽可实现翻倍。

对于推动生成式人工智能革命的企业而言,其算力采购规模均以吉瓦为单位,因此 G300 带来的 70% 的功耗效率提升,具有举足轻重的意义。

思科的 Silicon One 统一架构还在持续快速拓展:2025 年开放计算项目峰会上,思科推出了 N9364 和思科 8223 设备,其中思科 8223 为 51.2 太比特 / 秒的固定架构设备,配备 64 个 800 吉比特 / 秒八通道小型可插拔光模块和四通道双密度可插拔光模块(QSFP-DD)端口,适配超大规模数据中心和新型云服务商的横向扩展需求;2026 年欧洲、中东和非洲区思科技术峰会上,思科又推出 N9836 和思科 88-LC2 设备,前者为 51.2 太比特 / 秒固定架构设备,配备 64 个 800 吉比特 / 秒八通道小型可插拔光模块和四通道双密度可插拔光模块端口,后者为 28.8 太比特 / 秒的模块化线卡,配备 36 个 800 吉比特 / 秒八通道小型可插拔光模块端口,适配超大规模数据中心、新型云服务商、电信运营商、企业客户的需求,可应用于横向扩展、数据中心互联、通用骨干网、核心与对等路由等场景,同时支持 SONiC、NX-OS、应用中心基础设施(ACI)、IOS-XR 等多种操作系统。

除 G300 芯片及其配套的交换机、光模块外,思科本周还丰富了 P200 芯片的产品阵容。去年秋季,思科首次推出搭载 P200 芯片的 51.2 太比特 / 秒路由器,配备 64 个 800 吉比特 / 秒端口,用于数据中心互联链路;如今,思科将 P200 芯片集成至商用级 Nexus 设备,以及 Nexus 系列和白盒模块化交换机的线卡中。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。