扫码分享到微信
"算力要像水电一样即取即用。"这句话在过去两个月里出现在了从国务院常务会议到运营商发布会到微博热搜的每一个场合。
但有一个问题没人回答:电是同质的——三峡发的电和光伏发的电,进电网后都是一样的电子。算力是异构的——英伟达GPU和华为昇腾NPU连计量方式都不一样,同一个模型在不同芯片上跑出来的性能差异可以达到20%到40%。
把异构算力当成同质资源来调度,就像把原油、自来水、牛奶接进同一根管道,还指望用户拧开水龙头就能喝到想要的饮料。
这不是一个工程细节问题。它决定了7万亿算力基建的底层逻辑是否成立。
刚刚发生了什么
5月9日,国务院常务会议将算力网正式纳入国家"六张网"——水网、新型电网、算力网、通信网、地下管网、物流网。算力与水电同级。4月中央政治局会议已有相同表述,"十五五"规划109项重大工程之一。发改委预计2026年"六网"总投资超7万亿元,算力网约占4000到4500亿元,十五五累计4到5万亿。资金来源:特别国债加专项债加社会资本。
5月16日,#算力网要来了#冲上微博热搜,阅读量破3.2亿。
5月17日世界电信日,三大运营商集中推出Token套餐。中国电信的全国性套餐体系最完整——个人版9.9元/月含1000万Token,企业版39.9元到299.9元覆盖1500万到1.5亿Token,捆绑"宽带上行提速包"和"安全防护包"。中国移动走的是平台路线,MoMA平台接入超300款主流大模型,号称单位Token成本压降约30%,开放万亿级Token体验包。中国联通避开价格战,与华为合作推出分布式边云协同推理架构,让"原始数据不出园区",跨200公里拉远推理的算效损失控制在5%以内——瞄准的是金融、医疗等高安全行业。
三家运营商的策略差异背后,是同一个判断:流量红利见顶,Token是新增长曲线。上海电信试点首月用户转化率23%,江苏移动外部Token日销量突破8亿。用户愿意为标准化算力服务付费,这件事已经被验证了。
数据也在催促。2026年3月,全国日均Token调用量超140万亿,较2024年初增长1000倍,比2025年底又涨了40%。工信部2月部署"1+M+N"三级节点体系——1个国家节点已建成,M个区域节点和N个行业节点正在推进。国家平台已接入149家算力提供商,汇集163 EFLOPS,31省算力标识系统贯通。超70条算力大通道已建成,八大枢纽节点智算规模占全国80%以上。广东韶关数据中心集群总投资超600亿元,到广州时延1.3毫秒——对AI训练够了,对实时推理呢?
一切都在指向同一个叙事:算力即将变成水电一样的公共基础设施,便宜、便捷、随处可用。
但这个叙事有一个致命的裂缝。
为什么算力不是电
国家信息中心大数据发展部的专家说得很直接:"电是标准化的同质产品,水电火电进电网后都是相同的电子。但算力是高度异构和非标准化的。"
异构性是第一道墙。英伟达GPU、华为昇腾NPU、寒武纪思元、谷歌TPU——架构不同、指令集不同、软件栈不同。调度系统不仅要考虑任务去哪里执行,还要权衡芯片类型、网络时延、电力成本、碳排放指标。电调调度永远不需要面对这些维度。更麻烦的是,高端算力资源80%以上集中在英伟达生态,其CUDA形成了事实上的"技术方言"——统一度量标准想推广,就像让全国人都说普通话,但最大的几个经济中心只说自己家的方言,沟通成本是内部协同的3到5倍。目前仅30%的GPU算力可以实现跨平台互联,中小服务商更无力承担单套超50万元的高速互联改造费。
"有状态"是第二道墙。电的传输是单向的、无状态的——电子从A到B,故事结束。算力调度是双向的、有状态的——计算任务需要输入数据,完成后还产生新数据,且对网络时延极度敏感,毫秒级抖动都可能导致训练失败。算力调度的实质不是移动物理资源,而是让数据和任务在网络中移动,利用调入方的算力设施进行处理。这比电力调度永远多一个维度:数据搬运的成本和风险。八大枢纽间调度响应虽已缩短至30秒内,但AI实时推理所需的1毫秒级低时延圈仍未全面覆盖。
网络成本是第三道墙。在部分远距离调度场景中,网络成本占总成本比例高达75%。"商品只值10块,运费要50块"。全国算力利用率仅68%,西部绿电富集区域甚至不足50%——不是因为算力不够,是因为调度过去太贵了。贵州一家AI公司想把计算任务调度到新疆,最终因为跨区域调度的网络成本吞噬了所有电费节省而搁浅。
中国移动集团级首席专家张昊算过一笔账:如果为了省1元电费要花2元网费,调度的商业逻辑就不成立。
算力版"国家电网"的蓝图很美,但电网调度的是同质的电子,算力网要调度的是异构的、有状态的、对时延极度敏感的计算任务。工程难度差了一个数量级。
4G流量的前车之鉴
运营商推出9.9元Token套餐时,很多人想到了2014年。那年5月14日,中国移动宣布4G新资费——流量单价最高降幅50%,70元从1GB变成2GB,最低套餐从88元降到58元。全年电信业务量增长16.1%,收入只增长3.6%,出现了12.5个百分点的"剪刀差"。运营商用收入换规模,催生了短视频、移动支付、网约车一整个移动互联网生态。
历史似乎在重演:基础设施降价,使用门槛降低,应用爆发,生态繁荣。
但算力和流量有一个根本区别:边际成本曲线不同。
移动网络的边际成本趋近于零——基站建好了,多传1GB数据的增量成本微乎其微。所以运营商可以放心降价,用量越大,固定成本摊得越薄。
GPU的边际成本永远不可能趋近于零。
沐曦披露的一组数据中心成本分析把这件事说透了:一座1GW数据中心的550亿美元总成本中,GPU采购占45%,供电散热占20%,网络9%,存储7%,电费只占5%。Epoch AI的独立测算同样证实,服务器折旧占数据中心年化成本的60%。人们一直以为"中国电价便宜是AI时代的核心优势",但电费在总成本里的占比低到几乎可以忽略。真正的大头,是你绕不开的那块GPU。你电价打五折,省下来的钱在550亿的总盘子里连个水花都翻不起来。
GPU折旧周期3到4年。不是会计上的保守处理,是技术迭代的现实——英伟达每12到18个月推出新一代,旧卡训练市场直接清零。行业里有个黑色幽默:一批GPU因为无单可接在仓库里原封不动放了三年,另一批装机上架24小时空转。三年后复盘,未拆封的反而比空转的残值更高——因为空转加速了芯片的物理损耗。但即便是未拆封的,三年后也基本卖不出去。黄仁勋自己都说:如今的H100,送都送不出去。
Epoch AI的研究指出,如果将IT设备的折旧年限从5年缩短到3年,数据中心的年化总成本将从85亿美元飙升至120亿美元。这意味着,算力网即便建成,也无法像4G网络那样通过规模效应把单位成本压到无限低。流量的边际成本趋近于零,Token的边际成本始终为正——而且是刚性的。
2014年,运营商用12.5个百分点的剪刀差换来了移动互联网的生态繁荣。算力网也在赌同一个东西,但赌注更重、底牌更薄——因为算力的折旧不会等人。
我们真正在赌什么
如果算力网的工程难度远超电网,经济逻辑也不如4G流量顺畅,为什么国家还在全力推进?
因为算力网真正优化的不是成本,而是主权。
美国对华高端芯片管制持续收紧,H100、H200、GB200完全禁售,国内只能采购H20等阉割版。算力网的深层逻辑,是通过全国一体化调度把分散的国产算力拧成一股绳。
这不是空想。2026年4月,DeepSeek发布V4模型时做了一个让行业震动的选择:没有优先发布CUDA版本,而是全栈迁移至华为昇腾平台。团队重写了超过200个核心算子,完成了从CUDA到华为CANN框架的彻底重构,最终在昇腾950PR芯片上实现推理速度较H20提升35倍(据媒体报道的特定场景对比数据)。众智FlagOS牵头完成了8款以上国产芯片的"Day0全量适配",证明国产算力在推理侧已具备产业级可行性。
华为的"超节点"路线更直接——CloudMatrix 384集成384颗昇腾芯片,通过自研"灵衢"全光互联协议实现跨机柜全芯片对等池化,千卡级训练有效算力据华为公布数据达北美同类系统的2.1倍。单卡落后,集群反超。但集群反超的前提,是有一个能把全国异构算力调度起来的"大脑"——这就是算力网。
国产芯片的市场份额已经在加速。2026年Q1国产AI芯片份额首次突破55%,同比提升21个百分点。政务、金融、能源等关键行业国产采购占比已超70%。算力网的建设,是在为这个趋势铺设调度底座。
运营商9.9元的Token套餐也不是在卖算力,而是在卖入口。中国电信的"天翼Token币"试图构建Token在自有生态内跨应用流转的体系,中国移动发起Token运营生态联盟联合腾讯、阿里、华为制定标准,中国联通的边云协同架构直击数据不出园区的安全痛点。三家都在用Token套餐圈用户、建生态,争夺AI时代"基础设施提供者"的身份。
但这仍然是早期。算力银行、算力超市、算力券——这些创新模式背后,是一个连"度量衡"都还没统一的市场。不同云厂商的GPU即使是同型号,实际性能差异可达20%到40%,计量接口和调度协议互不兼容。就像电力市场早期,每家发电厂都用自己定义的"千瓦时",电压频率也不统一,电网根本无法并网。国家信息中心的专家提出,可以探索对"100万Token"这一业内常用计价单位进行更通俗地表达,类似电力计量中kWh被称为"度"——但命名容易,统一难。智能调度算法经过多轮迭代,资源利用率已从72%提升到91.3%——但这是单平台内的数据,跨平台调度仍然是无解的难题。
算力网要真正建成,必须先发明自己的"千瓦时"。
写在最后
算力网的"国家电网"隐喻,在政策层面是有力的——它把一个复杂的系统工程转化成了公众可以理解的叙事,为7万亿投资提供了合法性。但在工程层面,这个隐喻是危险的——它会让人低估异构调度的难度,高估规模效应的空间,忽视GPU刚性折旧对经济模型的根本性冲击。
算力不是电。电可以混装,算力必须匹配。电的边际成本趋近于零,算力的边际成本始终为正。电网调度的是无状态的电子,算力网调度的是有状态的计算任务。2014年4G流量降价能催生移动互联网生态,是因为流量的边际成本趋近于零;2026年Token套餐要催生AI生态,必须跨过GPU刚性折旧这道坎。
但算力网仍然值得建——不是因为它的隐喻成立,而是因为它的战略目标成立。在一个芯片被管制的世界里,把分散的国产算力通过统一调度拧成一股绳,比单打独斗强得多。DeepSeek V4在昇腾上的35倍推理提升、华为超节点的有效算力优势,都已经证明了"集群反超"不是口号,而是工程现实。9.9元的Token套餐也许赚不了多少钱,但它正在做一件更重要的事:让国内用户第一次用上标准化的AI算力服务。
隐喻会破裂。基础设施会留下。(文/王子祺)
京ICP证000080(一)-16
京公网安备11010802009845号