扫码分享到微信
9月5日,在外滩大会“大模型的创造力边界与应用想象力”论坛上,大模型创业企业西湖心辰正式发布并上线国内首个端到端语音大模型“心辰Lingo”。
“心辰Lingo”实现了端到端语音技术,在处理对话时直接理解语音,捕捉语气、节奏和情绪,并进行语音回复,减少了信息处理过程中的损失,让“机器”更懂人。
(西湖心辰CEO发布国内首个端到端语音大模型心辰Lingo)
全球权威咨询机构IDC分析预测,到2030年,全球智能语音服务市场的价值将达到约731.6亿美元,年复合增长率预计将达27%。
“心辰Lingo能捕捉到语音中的细微变化,不仅能理解你说了什么,还能理解更想表达什么,真正做到了为AI赋予‘高情商’,使其能够精准洞察言外之意。这也是西湖心辰作为持续深耕大模型情商能力又一个重要技术突破。”西湖心辰CEO醒辰表示。
据介绍,心辰Lingo语音大模型的能力在多个领域和中文上进行增强,使得心辰Lingo的中文语音效果,相较GPT4o更为出色。主要有三个技术特征。
一是原生的语音理解。作为端到端模型,心辰Lingo不仅能够识别语音中的文字信息,还能精确捕捉其他重要特征,如情感、语气、音调,甚至环境音,更全面地理解语音内容,从而提供更加自然和生动的交互体验。二是多种语音风格表达。心辰Lingo可以根据上下文和用户指令,自适应调整语音的速度、高低、噪声强度,并能够生成对话、歌唱、相声等多种风格的语音响应,有效提升了模型在不同应用场景下的灵活性和适应性。三是,语音模态超级压缩。心辰Lingo采用具有数百倍压缩率的语音编解码器,能够将语音压缩至极短的长度,在显著降低计算和存储成本的同时帮助模型生成高质量语音内容。
心辰Lingo开放内测预约不到10天,已经有超千家企业用户预约测试,涵盖数十个实际使用场景。
醒辰透露,西湖心辰即将在10月份发布基于心辰Lingo进行领域深度训练的儿童陪伴、心理疏导、 销售服务3大垂类语音模型。
西湖心辰是一家致力于人工智能多模态大模型技术研究及产业化应用的创新企业,背靠中国新型研究性大学“西湖大学”。外滩大会期间,西湖心辰创始人蓝振忠还获得了首届蚂蚁InTech科技奖。目前,西湖心辰已获得汤姆猫、蓝驰创投、凯泰资本、百度风投、西湖科创投,西湖教育基金会可持续发展平台等知名机构数千万美金投资。
京ICP证000080(一)-16
京公网安备11010802009845号