Top
首页 > 新闻 > 焦点直击 > 正文

通过图灵测试、会打预订电话 语音助手又现新技能

语音识别的未来市场是不可限量的,场景也将会从家庭逐渐走出门外,扩展到移动办公、出行、教育、医疗等高频使用场景中,在把握用户需求和尊重用户选择、保护隐私上还需不断平衡兼顾,相信通过市场教育、技术沉淀和环境监管之后,语音识别将会更加实现“秒懂人心”。
发布时间:2018-05-15 09:30        来源:赛迪网        作者:

【赛迪网讯】人工智能对人类生活、社会的变革和影响一直是“双刃剑”的话题,一方面不断优化、迭代,无限贴近用户内心需求、读懂人心;另一方面担心计算机解构人类思想甚至战胜人类、失去控制。

其实,这一争端的焦点在于适度与否和场景选择。如果是在非私密场合,人工智能自主学习、完成推荐、提出最优答案还是令人欣喜的。这一点从几天前结束的谷歌I/O开发者大会上的亮相的最新成果就可见一斑。

在谷歌的年度I/O开发者大会上正式公布了全新一代的AI人工智能系统——Duplex。利用语音识别的场景覆盖广泛和便捷性,这套交互系统可以轻松融入日常生活中,小到手机通话,大到生意业务,杂到预定发型沙龙,餐厅酒店预订,谷歌这套Duplex人工智能系统都能够提供分分钟的方便。

谷歌首席执行官Sundar Picha就以“打电话”这一高频使用场景演示了语音识别的智能和交互的自然性。预定理发服务过程中,AI预期的时间中理发店没空,一番复杂的交流后AI改期完成预约。在交互自然性上最为亮眼,理发店店员在查询可预约时间时,Duplex发出了那声惊艳的“嗯哼”,像一个真实在等待的人一样,而店员从头到尾没有发现他们的电话对象是AI。另一场景则在预定就餐中,接听员误解了AI的表达而且还遇到小于5人无法预订的困难,不过Duplex应答得体,完全是真人级别表现。

11

随后,这一突破被认为是加入情感类语句表达后的AI智能,不再是以往冷冰冰的直来直去以及计算机的固定声线,这次则是加入了人类的更多语气词,比如等待时那句“嗯哼”。这也是谷歌人工智能助手此次完善语言库的直接成果。

这两次主动拨打预定电话的展现也在现场同时宣布通过图灵测试,不过这只是意味着AI助手可以拨打预订电话,而至于其他场景的通话和交流还未可知,如果是人类首先发起问句或交流内容,语音助手还需要准确识别以及捕捉语句背后代表的情绪,这一切的技术仍需不断完善,比如此前提出的方言和口音识别准确度问题、背景噪音降噪处理问题以及情绪感知灵敏度等挑战,都将是科技巨头和软硬件平台攻克的下一难关。

在老生常谈的机器战胜人类争议中,谷歌此次同时表明将会加强透明度和监管保证AI助手合理使用,不会越界或滥用:其工程师YanivLeviathan表示,AI不能够使用和人类一样的自然语言与人类进行对话交互,谷歌和相应的技术公司们对科技产品将提供更深的透明度,并在此基础上找到合理的解决方案。

语音识别以便捷性和覆盖广泛的特性早就被认为将是人工智能商业化量产产品的最先试水之地,也被用户和市场百般期待。暂不论元年究竟从何开始,但2017年的融资、收购、 技术突破都将语音识别带入风口前一夜甚至风口之中。2017年语音识别市场规模也被预计将超过百亿,成为和自动驾驶等并行的另一巨大蛋糕。

不仅是国外巨头,国内科技巨头也纷纷招兵买马拼齐版图,比如阿里巴巴日前收购北京先声互联科技有限公司以储备语音识别人才和技术、加速量产产品。此前还推出了噪音环境下准确识别语音的技术,将会广泛用于工业场景。腾讯和京东也在OTT领域联手攻入智能电视,打造语音识别下的边看边买,在大屏电视生态联盟支持下融入更多智能元素,让家庭客厅场景连接生活、娱乐更多场景,足不出户完成一键下单、直接收货。

语音识别的未来市场是不可限量的,场景也将会从家庭逐渐走出门外,扩展到移动办公、出行、教育、医疗等高频使用场景中,在把握用户需求和尊重用户选择、保护隐私上还需不断平衡兼顾,相信通过市场教育、技术沉淀和环境监管之后,语音识别将会更加实现“秒懂人心”。

合作站点
stat