首页> 新闻>  正文
全球第一的中国存储,还是被低估了
来源:赛迪网     作者:徐培炎 2026-06-26 14:45:24
微信分享二维码

扫码分享到微信

关闭

【赛迪网讯】当全球资本和舆论的聚光灯还打在H100、B200这些GPU芯片上时,德国汉堡传来了一个可能改变AI行业底层认知的消息。

6月24日,ISC 2026大会公布最新IO500榜单,中科曙光ParaStor F9000全闪存储系统,在堪称“存储界奥运会”的生产型榜单上,包揽全节点与10节点双项世界第一。

要想真正看懂这件事,先要理解这个榜单的含金量。IO500是全球高性能计算领域与TOP500齐名的两大权威榜单之一,但二者的评价逻辑截然不同——TOP500衡量的是理论算力峰值,IO500是衡量真实的数据吞吐能力。

而IO500又分为“研究型”和“生产型”两个榜单,后者门槛更为苛刻:它只认证那些已经在真实生产环境中稳定运行超过一年、经受过实际业务负载考验的系统,冗余设计、持续运行能力缺一不可。

你可以这样理解:TOP500是在架设好的加速跑道上完成一段百米冲刺;IO500研究型榜单是一场装备精良、补给充分的越野跑;而IO500生产型榜单,则是“开局一根棍”,为期一年的荒野求生。

这就是中国存储真正意义上的历史性突破。但如果仅仅如此,可能我们还是低估了它的深层价值。它真正触动的,是AI产业一个长期被忽视的结构性问题:我们的算力叙事,被GPU绑架得太久了。

GPU在“空转”,而没有人告诉你

先来看一组数据。

根据公开研究,在大规模分布式训练中,网络通信耗时占整体训练时间的比例已高达30%至50%。存储I/O瓶颈导致的GPU空闲等待,更是成为万卡集群的常态——某云厂商技术负责人曾公开表示,千卡以上集群的GPU平均利用率,能做到50%已属优秀。

这意味着什么?你花数亿美元买来的GPU,将近一半时间在“等数据喂饭”。

一颗H100的购置成本超过3万美元,如果它在训练周期里有一半时间处于闲置状态,那么整个集群的实际有效算力,直接打了对折。这不是芯片性能的问题,这是系统架构的问题。

世界上最贵的不是GPU,是闲着没事干的GPU。

更值得警惕的趋势正在逼近。随着AI应用从训练阶段走向推理部署,尤其是Agent时代的到来,存储的压力曲线将发生根本性变化。

大模型训练是“吃饱了再跑”——数据预处理后批量喂入,存储考验的是高吞吐。而Agent推理是“随时点餐”——每一次用户请求,都可能触发模型访问记忆库、检索知识图谱、调用外部工具链。这意味着存储不再只是吞吐管道,而是推理过程的一部分。

以当前最主流的KV Cache技术为例,为了降低推理时延,模型需要将中间计算结果持久化存储在高速存储层中。在大规模并发推理场景下,KV Cache对存储的并发读取能力、低时延响应提出了远超训练阶段的要求。

换句话说,Agent时代,存储的响应速度,直接等于AI的“反应速度”。推理每快一毫秒,用户的体验就多一分。而这一毫秒,不靠GPU,靠存力。

这就是为什么“生产型”IO500榜单的意义,远不止一个排名——它恰恰衡量的是:在真实、持续、高并发的业务负载下,存储系统到底能不能顶住。

GPU的话语权,是一个被制造出来的叙事

那么问题来了:既然存储瓶颈如此显著,为什么整个行业的注意力,依然死死锁在GPU上?

答案既有技术原因,也有资本原因。

从技术史角度看,GPU率先完成了“出圈”。2012年AlexNet在ImageNet上大放异彩,靠的是两块GTX 580 GPU。此后十年,从ResNet到Transformer,从GPT-1到GPT-4,每一次AI范式的跃迁,几乎都是“更大GPU集群”的胜利。这形成了一种思维惯性——模型能力的边界,就等于GPU算力的边界。

从资本叙事角度看,GPU更是一个完美的投资标的。它是可见的、可触摸的硬件,有明确的迭代路线,有清晰的性能参数,有直接的供需关系。投资者可以精准地计算“多少张卡、多少钱、多强性能”。这种可量化性,让GPU天然适合成为资本故事的主角。

相比之下,存储系统就显得透明——它藏身于数据中心深处,NVMe、RDMA、并行文件系统这些名词,对公众和投资者而言,远不如“TFLOPS”来得性感。

但这种叙事是有代价的。当所有人都在卷GPU,真正制约AI系统效率的短板,反而被忽视了。

华尔街已经开始注意到这种失衡。英伟达的市销率长期维持在极高区间,而存储基础设施厂商的估值长期落后。有分析师指出,市场正在把AI基础设施的全部价值溢价,都给了GPU这一个环节。

当掌声和溢价只给了一个零件,这个行业就需要重新审视自己的价值标尺。

中国存储登顶,戳破了什么?

回到IO500,中科曙光此次登顶,有几个细节值得深挖:

第一,它是100%全国产自研。从底层处理器、NVMe闪存到核心并行文件系统,全链路自主。在高端GPU仍然受限的背景下,存储率先完成了全链条的自主突破。

第二,它是“以生产实效论英雄”。这套系统已经在数万卡集群中稳定运行超过一年,支撑了百余个AI与高性能计算应用,包括414.7亿原子规模的液态水分子动力学模拟这样的世界记录级别的科学计算任务。

第三,它同时拿下生产型榜单全节点和10节点双料冠军。这好比既拿了个人全能金牌,又拿了团体冠军。在此之前,没有任何中国厂商达成过此成就。

这些事实共同指向一个结论:当中国存储站上世界之巅,它宣告的不仅是一次技术突破,更是一种叙事框架的切换。

长期以来,全球AI竞争的叙事中心是“谁有更强的GPU”。但以中科曙光为代表的中国产业界,用一系列实践证明了:决定AI基础设施竞争力的,不是单一硬件的参数,而是计算、存储、网络的协同效率。

这是颇具中国特色的“工程化破局”之路——在芯片供给受限的条件下,不拼单点性能,拼系统整合。用全链路优化,把每一份可用算力都用到极致。

AI基础设施的完整故事,该换主角了

英伟达的市值神话,从来不只靠GPU芯片本身。CUDA生态、NVLink高速互联、InfiniBand网络——这三样东西加在一起,才构成了英伟达真正的护城河。客户买的不是一颗芯片,而是一套“买了就能用,用了就能赢”的系统。

中科曙光正在走的,是同一方向、但更为开放的中国路径。从计算节点到存储系统,从高速互连网络到液冷散热,从科学计算软件到算力服务平台——这是一套面向AI时代的完整基础设施体系。

中科曙光将此概括为七大链路的协同:算、存、网、电、冷、管、软。存储登顶,只是这套系统能力的冰山一角。

接下来的故事,不是用存储取代GPU,而是让存储、计算、网络真正站到同一个话语高度上。算存网协同,才是AI基础设施的完整叙事。

当AI产业从“拼芯片”走向“拼系统”,中国科技公司的工程化整合能力,或许正是这场全球竞赛中的最大变量。(文/徐培炎)

5G-A碰撞具身智能 华为携手跨界伙伴在消防救援领域开启千行百...

数字化转型加速的当下,5G-A、具身智能等创新技术应用已在许多行业验证了巨大的效能增长潜力。当二者结合…

4小时前

数字资产赋能绿电发展|新疆塔城风光储氢资产金融创新交流会成...

6月24日下午,2026全域电动化产业生态大会的重要平行活动——新疆塔城风光储氢资产金融创新交流会于塔城…

2小时前
你可能也喜欢这些文章