🤖 AI总结
主题
中科曙光发布新一代国产通用高性能计算平台,面向科学与工程计算场景。
摘要
中科曙光发布新一代国产通用计算平台,搭载百核级CPU,性能达国际主流水平,提供多种液冷形态,在气象、工业仿真等领域应用性能大幅提升。
关键信息
- 1 新一代平台搭载国产百核级CPU,性能较上代提升近2倍,达到国际主流水平。
- 2 平台提供风冷、冷板、浸没三种液冷形态,覆盖不同算力场景。
- 3 在气象、工业仿真、生命科学、材料等领域应用性能显著提升。
作者:王聪彬
回看过去几年,好像算力产业的发展几乎只与GPU有关。
但在大量科研机构、实验室中,另一类计算需求始终保持增长。瑞银全球研究团队最新发布的行业报告显示,服务器CPU市场规模预计从2025年的300亿美元激增至2030年的1700亿美元,五年间实现近五倍增长。
在科研机构、实验室以及工程研发场景中,海量数据处理、复杂模型求解和大规模仿真分析正在持续推高对通用计算能力的要求。
AI正在重塑算力产业,但并不意味CPU的重要性正在下降。相反,随着计算任务不断走向高精度、高性能,CPU正在迎来新一轮价值重估。
为什么CPU仍是计算体系核心
随着科学研究和工程创新不断向更高精度、更大规模演进,科学与工程计算对底层计算平台提出了更高的要求。
无论是气候模拟中的海量数据处理,还是先进装备研发中的复杂仿真验证,整个计算过程的效率、精度和稳定性正在成为用户评估计算平台的关键指标。“这也是为什么CPU至今仍是科学与工程计算体系中的核心角色。”中科曙光高端计算总工程师李建军说道。
第一,CPU支持从浮点运算到逻辑判断在内的全类型计算,适配多领域复杂算法,是通用型算力基座;
第二,CPU具有高精度浮点运算单元,可以确保科学与工程计算的精度;
第三,主流科学与工程计算软件与通用CPU深度优化,没有迁移成本。
从应用分布来看,科学与工程计算领域的六大典型行业场景具有旺盛的通用计算需求。包括:地球科学(天气预报、气候模拟)、工业设计制造(仿真,如大飞机、轮船、汽车)、能源勘探(找石油,爆炸分析)、物理化学材料(新材料筛选)、生命科学(蛋白质分析、新药研发)、集成电路(电磁仿真)。
尽管近年来各种加速计算技术不断发展,但在这些场景中,复杂逻辑处理、生态兼容以及全流程任务协同等需求依然长期存在,对通用计算能力提出了持续要求。
此次中科曙光发布的新一代全栈优化型通用高性能计算平台,正是瞄准这一需求。其面向科学与工程计算六大典型行业场景,通过百核级处理器与全栈优化设计,为高性能计算提供新的支撑。
一场围绕系统效率的升级
对于科学与工程计算而言,处理器性能固然重要,但真正决定应用效率的往往是整个系统。
新一代通用计算平台搭载首个国产百核级512线程,10T级通用CPU(128核、单CPU FP64双精度算力10T),HPL双精度浮点相对性能较上代提升近2倍,STREAM访存性能较上代提升近1倍,超越国际同类产品。应用性能平均提升近1倍,均与国际主流高端平台处于同等水平。
![]()
从某种意义上说,新一代通用计算平台优化的是整个计算链路,在完整的基础软件库(HPC-Kit)辅助下,实现算存传三级协同、层层优化,突破架构壁垒,提供极致性能。
计算层采用BurstBuffer技术和SocketDirect技术,提高了文件读写性能和网络通信性能;存储层采用硬件分域并行方案,充分提高了数据流并行度;网络层采用scaleFabric构建,scaleFabric是一种原生无损的RDMA网络,具有400Gb高速带宽和百纳秒级的超低延迟,运维简单,是高性能计算集群的首选组网方案。
同时,结合HPC-Kit基础软件库,在编译优化、数学库优化、MPI通信库增强等多个环节实现系统级协同优化,从而提升整体计算效率。
实测数据显示,相比当代计算平台,新一代计算平台可获得1.85倍的基准性能提升,能够与国际主流水平看齐,是性能最强的国产通用计算平台。
从风冷到冷板再到浸没液冷
为了满足不同用户的差异化需求,新一代计算平台具有风冷、冷板和浸没三种类型的计算节点,可覆盖不同算力规模的计算场景。
风冷形态采用了2U 19”标准尺寸,通用兼容。在保证强劲性能的同时,整机的网络扩展能力和可靠性设计与互联网、运营商需求水平保持一致。
冷板形态采用高密计算柜式设计,是国内首个单机柜P级算力通用计算系统,具有高性能、全液冷、高密度、标准化四大特点:
第一,冷板式高密计算柜有1U单节点和1U双节点两种节点形态,可满足多元计算场景需求;
第二,散热采用全冷板设计,PUE低至1.08,相比同等算力标准形态风冷节点,年化省电60万元以上;同时,得益于全冷板设计,系统噪音低至50分贝,机房也可以获得图书馆级静音体验;
第三,1U单节点支持与机柜解构,可充分保护客户机房基础设施已有投资;整个计算柜支持整体交付,可大大降低交付周期;
第四,从软件到硬件的联动设计,可保证系统稳定可靠运行、运维无忧。
在更大规模的算力场景中,中科曙光还提供浸没液冷方案。相关技术源自曙光超级计算机,具有超高密度、超低PUE的特点,超高可靠性,可基于曙光超大规模浸没液冷技术平台组合构建集约化融合型算力底座。
通用计算平台来到新阶段
新一代通用计算平台完成了两项关键升级:一是核心处理器从依赖国外芯片转向国产化方案,二是将处理器、网络、存储和软件栈进行一体化设计。
前者解决的是算力问题,后者提升的是整体应用效率。这也是曙光此次发布新一代通用计算平台的重要意义所在。
新一代计算平台不仅基准性能优异、硬件形态多元,在应用侧也有着明显的变化。
气象领域的公里级天气模拟中,新一代平台性能是当前平台的1.95倍,与国际主流高端平台处于同等水平。可支撑气象预报分辨率从3km提升至1km,1小时内完成全国范围36h时效公里级预报。
工业仿真领域实测性能是当代平台的1.86倍,达到国际主流水平。大量软件依赖CPU生态,处理器无需迁移即可使用。
生命科学领域支持AVX512指令集、4线程,给高通量计算带来巨大性能收益。800GB/s超高内存吞吐,加速群体遗传分析等密集访存型应用。
材料领域同样受益于AVX512指令集特性,VASP科学计算应用性能跃升2.2倍。生态原生兼容主流材料计算软件,实现应用无缝迁移,加速科研与业务落地。
AI带来了新的算力需求,但科学与工程计算依然在沿着自己的轨迹持续演进。新一代计算平台的发布的意义不仅在于性能提升,更在于国产通用计算平台开始具备与国际主流体系同台竞争的能力。