Top
首页 > 信息化 > 前沿技术 > 正文

做好智能生活的咽喉——OKvoice智能语音(2)

发布时间:2015-10-13 16:45        来源:赛迪网        作者:赛迪网

智能语音给人类生活带来很大改变

主持人:现在有人说语音是最简单、直接、零成本的人机交互方式,想请问您这是为什么?OKvoice作为一个语音技术提供者,能给咱们人类生活带来什么样的改变?

雷臻:每个人一出生开始就需要沟通,但通过什么沟通?就是通过语音。所以说语音本质而言,它确确实实是很好的沟通方式,而且是很好的入口,这是第一点。第二点,随着智能语音起来了以后,我们可以想像两个场景,第一个场景是盲人,他看不见文字,但你怎么跟他进行沟通?你可以通过语音跟他说话沟通。但如果给他发了一条短信怎么办?看不到,通过我们的OKvoice语音合成技术,就可以其他人发给他的短信念给他听,他就可以顺利的沟通了。还有一个场景,老人用摇控器进行控制,对他来讲成本太高,他们找半天可能都没有找到最想要的节目,但他如果对电视喊一声《武媚娘》就可以直接看了,这就是讲为什么语音是很好的入口,也能给我们的生活带来很大的改变。

主持人:请您给我们介绍一下OKvoice研发的语音合成技术和语音识别技术现在达到了什么样的效果?咱们客户反馈是如何的?

雷臻:因为OKvoice作为一家新型的智能语音企业,我们现在已经给一些企业提供了服务。包括豆丁网、好学教育,客户用过了都说好了。当然我们不能光嘴上说,我现在可以给你们演示一下OKvoice的效果。我们首先通过手机的浏览器访问www.okvoice.com或者关注微信的两个号,一个是订阅号,一个是服务号。搜索的关键字输入OKvoice即可。进入OKvoice页面之后,点击体验中心再点击语音合成,语音合成有两类声音,男声和女声,我们还支持粤语。我们可以选择一个广东的漂亮的女孩子。

主持人:这是她用粤语讲出的一段话。

雷臻:对,我随便用一段话她可以用粤语声音念出来。有时你回到家,你不想再看文字,你可以听。还有一个在盲人里面会有应用,你给他发短信他看不了,你可以选择语音技术。

主持人:这一块,我们也给予了他非常好的体验。

雷臻:是的。

主持人:您具体讲一下案例。

雷臻:我们现在在语音合成方面,在呼叫中心有用。因为呼叫中心包括你打电话之后,他会把菜单项念给你听。打个比方,我们现在给银行打电话,他会问你个人业务请按1,企业业务请按2。你要查询余额,他会问你,你可以直接说也可以通过按键的形式,这就体现了语音技术的交互。因为你说的时候,他能识别出你需要查余额,他查询之后会念给你听。这就用到了语音合成,语音合成和语音识别都会有体现。

第二,我们和教育视频网有合作。他们会有大量的国外视频过来,他们首先需要翻译成中文,然后通过配音进行录制,有些专业词汇,之前他们在字幕方面花了很多的成本,现在他们把字幕包给我们,我们提供两种解决方案,一种是保证98%正确的字幕,还有70%他们自己做校对,两个小时的视频,我们就只需要20分钟就可以完成。科技视频网站的编辑人员,他们就可以很快的进行修改,对于他们的工作效率还有投入的成本都有很大的提升。

主持人:请您简单介绍一下声文识别,为什么说利用声文识别技术能够进行身份认证更加安全可靠?

雷臻:声文识别和指纹识别和面部识别是相同的,因为每个人的指纹、面部和声音都具有不同特质,我们可以通过这种特质来确定声音的本人是谁。所以说声文识别在安全领域会有应用,因为别人可能窃取你的长相或者窃取指纹,但很难窃取声音。如果他通过电话录音来录的话,我们可以通过几段录音的识别来设置,他很难伪造。而OKvoice声文识别是采用最新的声文提取算法,而且我们整个声音模型训练只需要不到10秒,传统的需要30秒到1分钟,我们声文第一个引擎算法更高效。

专题访谈

中国制造2025之“三大转变”

面对快速变化的国内、国际经济形势,中国制...[详细]

合作站点
stat