国内第五！九天深度思考大模型杀进OpenCompass榜单，央企大模型展示硬核实力-赛迪网 - 集科技期刊、产业信息资讯、网络新媒体、视频新媒体于一体的融媒体智能化传播平台

首页> 互联网> 正文

国内第五！九天深度思考大模型杀进OpenCompass榜单，央企大模型展示硬核实力

来源：数字经济观察作者：数字经济观察 2025-11-26 10:19:41

中移九天公司（九天研究院）自研的JT-Think（九天深度思考大模型），在与GPT-5、Gemini 2.5-Pro、Qwen3、DeepSeek-R1这些国内外巨头旗舰模型的比拼中，拿下国内第5、全球第12的好成绩，把央企AI的硬核实力直接打在了公屏上！

大模型圈的“成绩单”新鲜出炉！

上海人工智能实验室的OpenCompass评测，堪称全球大模型的“实力试金石”——覆盖维度全、流程全公开，能在这里拿高分的模型，绝对是硬茬。在最新榜单上，一匹“央企黑马”强势突围：中移九天公司（九天研究院）自研的JT-Think（九天深度思考大模型），在与GPT-5、Gemini 2.5-Pro、Qwen3、DeepSeek-R1这些国内外巨头旗舰模型的比拼中，拿下国内第5、全球第12的好成绩，把央企AI的硬核实力直接打在了公屏上！

先说说这份榜单有多“卷”：不仅重点考察复杂数学、代码、推理、指令跟随等6项核心基准能力，而且参赛选手更是神仙打架，几乎集齐了全球最能打的大模型，OpenAI、Google领衔的主流模型和阿里、字节、DeepSeek等标杆模型均赫然在列。九天深度思考大模型能在这么多强手中榜上有名，靠的是背后两大技术“杀手锏”：一套独有的数据体系，加上一套创新的训练方法。

懂行的都知道，大模型的实力根本上拼的是“喂”进去的数据质量。九天团队直接造了个“数据宝库”：覆盖113个行业领域，囊括53项核心能力，足足包含百万级的高质量指令数据。数据库通过严苛的四维筛选标准，为模型奠定了卓越的推理与泛化基础。

有了好数据，怎么练出“超能力”？九天深度思考大模型的训练逻辑堪称“因材施教”。九天团队创新提出多阶段强化学习策略，就像给模型请了个“金牌教练”：一开始先练基础题打牢底子，“动态温度调节”机制根据答题正确率，及时调整探索范围；基础扎实了再上中档题，“难度自适应”模块会精准推送刚好能搞定、又有点挑战的任务；最后再练高阶技能，用“上下文扩展”技术解锁长文本处理、多轮对话这些硬核能力。这套组合拳下来，数据没浪费一点，模型能力实现了阶梯式暴涨，在有限资源里模型的最优性能被完全激发。

其实这次上榜，绝非偶然。九天深度思考大模型的“前辈”——九天基础大模型，去年就入选了“央企十大国之重器”，全栈自主可控的基因凝练成扎实深厚的技术功底。这种基因有多重要？对中央企业而言，安全就是生命线，而“自主可控”就是最硬的安全保障。目前，九天深度思考大模型发挥全栈自主可控优势，已经开始为不少央企服务，在石油、医疗、法律、航空等多个领域落地应用，从技术突破到适配场景，再到真正创造价值，这条路径走得越发矫健。

这一刻超带感，HUAWEI Mate 80系列 X HarmonyOS 6让智慧触手可及

HUAWEI Mate 80系列致力于为用户带来更舒适的视觉体验当用户对照片表情不满意时HUAWEI Mate 80系列更将用…

2025-11-26 10:16

Man姐粉集合！《新闻女王2》来了，鸿蒙有礼已经备好了优酷年卡！

抽中就可以去兑换优酷会员月卡已经迫不及待想看Man姐重回SNK News大杀四方了还有机会抽到热门应用月卡免…

2025-11-26 10:22

你可能也喜欢这些文章