国产开源文生图大模型来了!腾讯混元自研,Sora 同款架构
来源:赛迪网    作者:赛迪网2024-05-14 15:43:49

5月14日,腾讯宣布旗下混元文生图大模型全面升级,并对外开源。这也是首个中文原生的类 sora 架构开源模型,填补了国产大模型在文生图先进架构上的空白。

中文原生,Sora 同款先进架构

人工智能是发展新质生产力的重要引擎,而大模型又是人工智能技术的重要发展方向。其中,文生图是大模型应用的重点领域,有着广泛的应用前景。

目前,主流的文生图开源生态基本围绕英文建设,像 Stable Diffusion 等主流开源模型,虽然一定程度支持中文输入,但其核心数据集仍以英文为主,对中国的语言、美食、文化、习俗都理解不够,更容易因翻译而产生语义分歧乃至生成错误建设自主可控且中文原生的大模型以及相应的开源生态迫在眉睫。

腾讯混元文生图大模型,就是腾讯从零开始训练,从模型算法、机器学习框架到人工智能基础设施全链路自研的实用级大模型。

混元文生图以中文原生为基础,支持中英文双语输入及理解,更理解中文语境,对中国的古诗词、俚语、美食、文化、习俗等都有更好的生成效果。

此外,升级后的混元文生图模型采用了基于Transformer的扩散模型架构(简称DiT),具备更强的可扩展性,在参数量越多的情况下,性能越强,有利于提升视觉模型生成效果及效率。这也是此前爆红的文生视频产品Sora 背后的关键技术。

目前,腾讯混元文生图模型参数量达 15 亿。评测数据显示,最新的腾讯混元文生图模型效果相比前代提升超过 20%远超开源的Stable Diffusion模型,在目前已开源文生图模型中,综合性能最佳达到国际领先水平。

面向实用,丰富中文文生图开源生态

腾讯混元文生图能力,已经广泛被用于素材创作、商品合成、游戏出图等多项业务及场景中。今年初,腾讯广告基于腾讯混元大模型,发布了一站式 AI 广告创意平台腾讯广告妙思,可为广告主提供文生图、图生图、商品背景合成等多场景创意工具。多家主流媒体也已经将腾讯混元文生图用于新闻内容的辅助生产。

腾讯文生图负责人芦清林表示:“腾讯混元文生图的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源出来,是希望与行业共享腾讯在文生图领域的实践经验和研究成果,共建中文文生图开源生态,加速大模型行业发展。”

基于腾讯此次开源的文生图模型,开发者企业无需头训练,即可直接用于推理,并可基于混元文生图打造专属的AI绘画应用及服务,能够节约大量人力及算力。透明公开的算法,也让模型的安全性和可靠性得到保障。

同时,基于开放、前沿的混元文生图基础模型,也有利于在以英文为主的文生图开源社区之外,丰富以中文为主的文生图开源生态,形成更多样的原生插件,推动中文文生图技术研发和应用。

在开源上,腾讯一直持开放态度,开源了超过 170 个优质项目,均来源于腾讯真实业务场景,覆盖微信、腾讯云、腾讯游戏、腾讯AI、腾讯安全等核心业务板块,目前已累计获得超 47 万开发者关注及点赞。


数据安全危机席卷全球医卫行业,奇安信发布百家医院免费体检计划

奇安信集团在京召开“百家医院数据安全免费体检计划”发布会。

2024-05-14 14:02

腾讯Q1财报:企业服务收入和毛利同比双增...

加速数字经济和实体经济融合,成为企业打造新质生产力的重要路径。腾讯云正携手众多伙伴,助力各行业数字化、智能化进程。

2024-05-14 17:42
你可能也喜欢这些文章