扫码分享到微信
【赛迪网讯】6月30日消息,美团正式发布新一代基础大模型LongCat-2.0。这是业界首个依靠国产算力完成训练、推理全流程的万亿参数大模型。

美团LongCat-2.0 近日正式上线,图为其官网截图
据悉,LongCat-2.0采用MoE架构,总参数规模1.6万亿,每个Token激活参数约480亿,原生支持1M超长上下文,可一次处理百万字级输入。模型深度适配 Claude Code、OpenClaw、Hermes 等主流 Harness,在Coding任务上有很强的表现。
OpenRouter总调用量跻身全球前三,性能接近Claude Opus 4.6
今年4月底,美团曾发布LongCat-2.0-Preview版本,并以匿名的方式,接入全球最大的大模型 API 路由平台OpenRouter。
OpenRouter数据显示,截至6月底,LongCat-2.0-Preview的总调用量已跻身全球前三。
在Hermes、Claude Code、OpenClaw等Agent场景下,LongCat-2.0-Preview的月调用量分列全球第一、第二和第三位。其在Claude Code的月调用量,仅次于Claude Opus 4.8,是最受全球开发者欢迎的免费模型之一。


OpenRouter数据显示,匿名为Owl Alpha的LongCat-2.0测试版本,在Hermes月调用量位列全球第一、Claude Code的月调用量位列全球第二。
社区反馈显示,在工具调用、复杂指令执行等 Agent 核心能力方面,LongCat-2.0-Preview接近Claude Opus 4.6,落后于最新的Claude Opus 4.8。在国产大模型中,LongCat-2.0-Preview位列顶尖梯队。
相关技术报告显示,LongCat-2.0引入ScMoE跨层快捷连接架构、零计算专家机制、Ngram Embedding增强等多项原创设计。其中,零计算专家机制可实现Token级动态计算预算,让复杂Token激活更多专家,简单Token节省算力,该机制为业界首创。
训练、推理全程依靠国产算力,将于近期开源核心技术
作为首个“全国产”万亿参数大模型,LongCat-2.0全程在国产算力上完成训练,峰值规模超过5万张国产算力卡,是迄今为止国产算力上完成的最大训练任务。
据悉,2023年起,美团就与国产算力厂商共同推进“模芯协同”研发,从早期的小规模验证到超大规模稳定训练,逐步攻克了万卡级容错恢复、NPU确定性计算、算力利用率提升等核心难题,验证了大规模国产训练的可行性。
LongCat-2.0的实践表明,目前国产算力卡虽然落后于全球顶尖水平,但计算正确性和精度已足够满足需求,甚至局部略优,已经可以支撑前沿模型的全流程训练。对于激活存量国产芯片而言,这是一个重要突破。
据悉,由于算力优化、技术突破等综合因素,LongCat-2.0的训练、推理成本消耗,低于全球其他万亿参数级别的大模型。
对此,LongCat官方宣布,将于近期在多平台同步开源Infra 框架、推理引擎、模型参数等核心技术,以回馈全球开发者社区。
京ICP证000080(一)-16
京公网安备11010802009845号