扫码分享到微信
中移九天公司(九天研究院)自研的JT-Think(九天深度思考大模型),在与GPT-5、Gemini 2.5-Pro、Qwen3、DeepSeek-R1这些国内外巨头旗舰模型的比拼中,拿下国内第5、全球第12的好成绩,把央企AI的硬核实力直接打在了公屏上!

大模型圈的“成绩单”新鲜出炉!
上海人工智能实验室的OpenCompass评测,堪称全球大模型的“实力试金石”——覆盖维度全、流程全公开,能在这里拿高分的模型,绝对是硬茬。在最新榜单上,一匹“央企黑马”强势突围:中移九天公司(九天研究院)自研的JT-Think(九天深度思考大模型),在与GPT-5、Gemini 2.5-Pro、Qwen3、DeepSeek-R1这些国内外巨头旗舰模型的比拼中,拿下国内第5、全球第12的好成绩,把央企AI的硬核实力直接打在了公屏上!
先说说这份榜单有多“卷”:不仅重点考察复杂数学、代码、推理、指令跟随等6项核心基准能力,而且参赛选手更是神仙打架,几乎集齐了全球最能打的大模型,OpenAI、Google领衔的主流模型和阿里、字节、DeepSeek等标杆模型均赫然在列。九天深度思考大模型能在这么多强手中榜上有名,靠的是背后两大技术“杀手锏”:一套独有的数据体系,加上一套创新的训练方法。

懂行的都知道,大模型的实力根本上拼的是“喂”进去的数据质量。九天团队直接造了个“数据宝库”:覆盖113个行业领域,囊括53项核心能力,足足包含百万级的高质量指令数据。数据库通过严苛的四维筛选标准,为模型奠定了卓越的推理与泛化基础。
有了好数据,怎么练出“超能力”?九天深度思考大模型的训练逻辑堪称“因材施教”。九天团队创新提出多阶段强化学习策略,就像给模型请了个“金牌教练”:一开始先练基础题打牢底子,“动态温度调节”机制根据答题正确率,及时调整探索范围;基础扎实了再上中档题,“难度自适应”模块会精准推送刚好能搞定、又有点挑战的任务;最后再练高阶技能,用“上下文扩展”技术解锁长文本处理、多轮对话这些硬核能力。这套组合拳下来,数据没浪费一点,模型能力实现了阶梯式暴涨,在有限资源里模型的最优性能被完全激发。
其实这次上榜,绝非偶然。九天深度思考大模型的“前辈”——九天基础大模型,去年就入选了“央企十大国之重器”,全栈自主可控的基因凝练成扎实深厚的技术功底。这种基因有多重要?对中央企业而言,安全就是生命线,而“自主可控”就是最硬的安全保障。目前,九天深度思考大模型发挥全栈自主可控优势,已经开始为不少央企服务,在石油、医疗、法律、航空等多个领域落地应用,从技术突破到适配场景,再到真正创造价值,这条路径走得越发矫健。
HUAWEI Mate 80系列致力于为用户带来更舒适的视觉体验当用户对照片表情不满意时HUAWEI Mate 80系列更将用…
2025-11-26 10:16抽中就可以去兑换优酷会员月卡已经迫不及待想看Man姐重回SNK News大杀四方了还有机会抽到热门应用月卡免…
2025-11-26 10:22京ICP证000080(一)-16
京公网安备11010802009845号