Top
首页 > 正文

百度输入法再秀AI硬核力:语音识别准确率相对提升15%、离在线语音输入无缝切换

在7月3日“Baidu Create2019”百度 AI开发者大会现场,百度首席技术官王海峰在演讲中表示,“百度研发了流式多级的截断注意力模型(SMLTA),使语音识别的准确率大幅提升并保持了非常高的速度,这是首个基于流式注意力的语音识别线上服务,百度输入法语音识别的准确率因此相对提升15%以上”。
发布时间:2019-07-03 14:36        来源:赛迪网        作者:赛迪网

在7月3日“Baidu Create2019”百度 AI开发者大会现场,百度首席技术官王海峰在演讲中表示,“百度研发了流式多级的截断注意力模型(SMLTA),使语音识别的准确率大幅提升并保持了非常高的速度,这是首个基于流式注意力的语音识别线上服务,百度输入法语音识别的准确率因此相对提升15%以上”。 

2019百度AI开发者大会百度CTO王海峰分享SMLTA模型

2019百度AI开发者大会百度CTO王海峰分享SMLTA模型

“你的这个新model效果比baseline好多少,探索技术的depth和scope是我们的责任,我很喜欢barrier这个词,AI的value其实就是breakbarrier”,这是百度语音技术部负责人高亮在现场面对百度输入法念出的一段高难度“Rap”,这样一段复杂的中英文混合“Rap”不仅被百度输入法零误差地识别出来,语音输入得到了准确理解并根据语义进行正确断句,百度输入法的语音识别还保持了非常快的速度,边说边上屏,无需等待整句念完便可呈现识别结果。这不仅是输入法行业的重大变革,也代表着未来的人机交互有更多的可能。

百度语音技术部高亮现场评测百度输入法中英自由说

百度语音技术部高亮现场评测百度输入法中英自由说

       2019年1月百度输入法上线中英文自由说功能,深受用户喜爱。通过语音识别算法SMLTA模型,百度输入法对中文音节和英文音素混合建模,并基于海量纯中文、纯英文和中英文三类数据进行模型训练,再将中文、英文和中英混合三个语言模型并行解码,融合标点和大小写进行处理。也正是基于以上AI技术支持,百度输入法还可以支持方言自由说,方言与方言、方言与普通话混合输入免切换,精确的识别结果让语音输入不再是“普通话考试”。

111 

语音输入日益成为输入法行业新的增长点,百度输入法作为百度AI能力应用落地的重要产品之一,具有天然的语音技术优势。自2019年初,百度输入法公布在线语音识别、离线语音识别、中英自由说、方言自由说四大语音输入功能突破后,技术突破持续深入。目前,离线语音识别准确率已达到在线语音识别效果,效果提升的同时还降低了模型大小,占用更少的内存,离线和在线语音输入之间还可无缝切换。截止目前,百度输入法日均语音请求量峰值已突破6.2亿次,稳坐语音输入法行业头把交椅。

从手写输入到打字输入再到AI输入,百度输入法正在打造融合了语音、AR、视觉、知识图谱、自然语言处理等多项AI技术的“全感官输入”体验,此前百度输入法AI探索版已上线“拍立活”、“秀场”、“凌空手写”等功能,展开了对更多输入场景的探索。百度输入法通过对场景、用户的深度洞察和在技术领域的不断创新,实现在“新交互”“新表达”“新探索”三个方面全面升级,名副其实是行业领先的“AI输入法”。

百度大脑全方位的AI能力正在不断赋能百度输入法,输入法也在变得更聪明、更智能、更懂你的表达,未来的输入法将从手机端延伸到智能家居、车联网等更多场景,让人机交互更加高效自如。通过不断的技术创新和功能升级,百度输入法将为输入法行业提供更多AI创新样本,迎接5G时代的“提速”挑战,引领AI输入法全感官输入时代。

专题访谈

合作站点
stat