美团发布LongCat-2.0大模型，总参数规模1.6万亿，全程由国产算力训练-赛迪网 - 集科技期刊、产业信息资讯、网络新媒体、视频新媒体于一体的融媒体智能化传播平台

首页> 新闻> 正文

美团发布LongCat-2.0大模型，总参数规模1.6万亿，全程由国产算力训练

来源：赛迪网作者：赛迪网 2026-06-30 16:20:08

【赛迪网讯】6月30日消息，美团正式发布新一代基础大模型LongCat-2.0。这是业界首个依靠国产算力完成训练、推理全流程的万亿参数大模型。

美团LongCat-2.0 近日正式上线，图为其官网截图

据悉，LongCat-2.0采用MoE架构，总参数规模1.6万亿，每个Token激活参数约480亿，原生支持1M超长上下文，可一次处理百万字级输入。模型深度适配 Claude Code、OpenClaw、Hermes 等主流 Harness，在Coding任务上有很强的表现。

OpenRouter总调用量跻身全球前三，性能接近Claude Opus 4.6

今年4月底，美团曾发布LongCat-2.0-Preview版本，并以匿名的方式，接入全球最大的大模型 API 路由平台OpenRouter。

OpenRouter数据显示，截至6月底，LongCat-2.0-Preview的总调用量已跻身全球前三。

在Hermes、Claude Code、OpenClaw等Agent场景下，LongCat-2.0-Preview的月调用量分列全球第一、第二和第三位。其在Claude Code的月调用量，仅次于Claude Opus 4.8，是最受全球开发者欢迎的免费模型之一。

OpenRouter数据显示，匿名为Owl Alpha的LongCat-2.0测试版本，在Hermes月调用量位列全球第一、Claude Code的月调用量位列全球第二。

社区反馈显示，在工具调用、复杂指令执行等 Agent 核心能力方面，LongCat-2.0-Preview接近Claude Opus 4.6，落后于最新的Claude Opus 4.8。在国产大模型中，LongCat-2.0-Preview位列顶尖梯队。

相关技术报告显示，LongCat-2.0引入ScMoE跨层快捷连接架构、零计算专家机制、Ngram Embedding增强等多项原创设计。其中，零计算专家机制可实现Token级动态计算预算，让复杂Token激活更多专家，简单Token节省算力，该机制为业界首创。

训练、推理全程依靠国产算力，将于近期开源核心技术

作为首个“全国产”万亿参数大模型，LongCat-2.0全程在国产算力上完成训练，峰值规模超过5万张国产算力卡，是迄今为止国产算力上完成的最大训练任务。

据悉，2023年起，美团就与国产算力厂商共同推进“模芯协同”研发，从早期的小规模验证到超大规模稳定训练，逐步攻克了万卡级容错恢复、NPU确定性计算、算力利用率提升等核心难题，验证了大规模国产训练的可行性。

LongCat-2.0的实践表明，目前国产算力卡虽然落后于全球顶尖水平，但计算正确性和精度已足够满足需求，甚至局部略优，已经可以支撑前沿模型的全流程训练。对于激活存量国产芯片而言，这是一个重要突破。

据悉，由于算力优化、技术突破等综合因素，LongCat-2.0的训练、推理成本消耗，低于全球其他万亿参数级别的大模型。

对此，LongCat官方宣布，将于近期在多平台同步开源Infra 框架、推理引擎、模型参数等核心技术，以回馈全球开发者社区。

跳出浅层嫁接困局，AI深度融合才是产业高质量发展核心路径

生成式AI技术全面普及以来，“AI+”俨然成为各行各业转型的标配。然而，当前大量AI应用仍停留在表层叠加…

8小时前

2026静安时尚文化周正式在张园启幕。本次时尚文化周旨在通过构建完整的时尚生态闭环，全方位展现静安引领…

6小时前

你可能也喜欢这些文章