🤖 AI总结
主题
慧与科技(HPE)扩展AI网络产品组合,深化Juniper技术集成,提升AI基础设施利用率。
摘要
HPE扩展AI网络产品组合,深化Juniper集成,通过新交换机和自动运维技术提升AI基础设施利用率,减少GPU空转浪费。
关键信息
- 1 HPE推出基于Juniper的新交换产品,提升AI数据中心网络性能。
- 2 网络优化可避免GPU空转,提高昂贵AI基础设施利用率。
- 3 Mist与Marvis平台扩展,实现AI驱动的自动运维与故障修复。
![]()
慧与科技(HPE)近日扩展了其AI网络产品组合,推出基于Juniper的新型交换产品,进一步深化Juniper技术与AI数据中心解决方案的集成,并新增多项自动化能力,旨在提升日益昂贵的AI基础设施的利用率。
上述公告于HPE Discover 2026大会上正式发布,是HPE将Juniper Networks整合进统一AI基础设施体系这一持续努力的延伸,覆盖范围涵盖数据中心网络、运营、安全及企业互联。
网络深度融入AI基础设施体系
此次发布的核心内容是扩展HPE AI数据中心解决方案,将HPE Juniper Networking QFX交换机纳入其中,并通过HPE Networking Data Center Director进行统一管理。这一举措将Juniper的数据中心网络产品组合更深度地嵌入HPE的AI基础设施体系,该体系融合了计算、存储、网络、软件与服务等多个层面。
在HPE Discover大会上,HPE网络业务执行副总裁兼总裁Rami Rahim对媒体表示,网络已成为决定AI基础设施经济效益的关键因素。
“人们已经意识到,一旦网络出现拥塞或可靠性问题,那些耗资数亿乃至数十亿的GPU,其利用率可能只有75%、50%,甚至25%,”Rahim说,”网络已真正成为大规模AI数据中心投资的力量倍增器。”
云服务提供商Vultr的CEO J.J. Kardwell表示,随着AI集群规模不断扩大,网络的重要性日益凸显。”由于这些系统的架构需求,网络的影响力可以说是前所未有,”他在HPE Discover媒体简报会上说道。
Kardwell指出,挑战已不仅仅局限于单台GPU服务器,而是延伸至连接机架、集群和数据中心的整个网络层面。”机柜之间以及集群内部的网络,已成为完成大规模训练和推理工作负载的关键因素。”
网络与AI基础设施的经济逻辑
Dell’Oro Group副总裁Sameh Boujelbene表示,随着运营商致力于将昂贵的计算投入转化为实际生产系统,网络正成为AI基础设施经济性的关键变量。
“AI基础设施已不再只是GPU的竞争,”Boujelbene对Data Center Knowledge表示,”这是一场系统级的竞争,而网络正成为决定谁能将原始算力高效、盈利地转化为可用智能的核心经济杠杆。”
此次发布的新产品覆盖AI训练集群、推理环境、数据中心互联及边缘部署,反映出市场对支撑完整AI生命周期的网络架构需求持续增长。
HPE还推出了两款全新AI网络产品:HPE Juniper Networking QFX5140交换机面向推理集群和边缘AI部署,新款QFX5252交换机托盘则专为AMD Helios机架级AI平台设计。HPE表示,上述产品旨在减少因等待数据而导致GPU空转的网络延迟。
Rahim表示,收购Juniper还使HPE能够同时应对横向扩展(scale-out)和纵向扩展(scale-up)两种AI网络架构。他指出,在Juniper原本已在路由和横向扩展网络领域建立优势的基础上,与HPE计算系统的深度集成加速了纵向扩展技术的研发,例如当前在AMD Helios中部署的相关技术。
Mist与Marvis能力全面延伸
HPE还将Juniper的Mist平台进一步延伸至Aruba现有用户群。
HPE宣布,HPE Networking CX交换机将在Mist平台上获得支持,为用户提供AI驱动的可见性、自动故障排查、服务水平洞察以及Marvis AI操作功能。与此同时,HPE也将Marvis自动驾驶能力引入Aruba Central,包括有线端口故障排查等自动化修复功能。
Mist平台的新增能力还包括:针对光模块及系统故障的预测性分析,以及一个AI推理引擎,该引擎可整合运营遥测数据、支持案例和网络数据,加速根因分析与故障修复。
Rahim表示,在自动驾驶模式的部署中,超过80%的网络故障现已实现自动修复,或能即时向运营人员提供根因信息。
Kardwell指出,AI基础设施日趋复杂,这进一步凸显了自动化运营的价值。”故障和停机带来的代价是无法承受的,自愈能力至关重要,”他说。
安全与运营的深度融合
HPE还拓展了网络与基础设施管理平台之间的集成。HPE Mist Networking数据中心保障功能现已与HPE Compute Ops Management及GreenLake平台实现集成,为运营人员提供网络与计算基础设施的统一视图。
在安全领域,HPE发布了统一的安全访问服务边缘(SASE)平台,通过单一管理控制台整合SD-WAN与安全服务边缘能力。该平台基于HPE Networking EdgeConnect构建,融入了零信任访问控制和AI辅助运营功能,旨在简化安全与网络管理。
对于完成收购以来的进展,Rahim表示,团队整合速度之快令他感到意外。
“我原以为有些事情会非常困难,比如整合团队、让大家有归属感、在产品路线图上做出艰难决策等,但实际上这些都比我预想的要顺利得多,”他说。
Q&A
Q1:HPE推出的QFX5140和QFX5252交换机分别有什么用途?
A:QFX5140交换机主要面向推理集群和边缘AI部署,而QFX5252交换机托盘则专为AMD Helios机架级AI平台设计。两款产品的核心目标都是减少网络延迟,避免GPU因等待数据而出现空转,从而提升整体AI基础设施的利用效率。
Q2:网络对GPU利用率有什么影响?
A:根据HPE网络业务负责人Rami Rahim的说法,一旦网络出现拥塞或可靠性问题,GPU的实际利用率可能从理论峰值骤降至75%、50%甚至25%。这意味着企业花费数亿乃至数十亿美元购置的GPU算力会被大量浪费,因此网络质量直接决定了AI基础设施投资的回报效率。
Q3:HPE的Marvis自动驾驶能力能解决哪些网络运维问题?
A:Marvis自动驾驶能力目前已被引入Aruba Central平台,支持有线端口故障排查等自动化修复功能。据HPE介绍,在已部署自动驾驶模式的环境中,超过80%的网络故障可实现自动修复,或在故障发生时即时向运营人员推送根因分析结果,大幅降低人工介入成本和故障处理时间。