Top
首页 > IT产品和服务 > 第一资讯 > 正文

阿里巴巴发布AliGenie2.0系统:从“语音战”升级为“视觉战”

和外界猜测全然不同,在2018年春季发布会上,阿里巴巴人工智能实验室并没有如期待般发布新硬件产品,而是将重心放在了系统升级上。
发布时间:2018-03-22 16:48        来源:赛迪网        作者:赛迪网

【赛迪网讯】和外界猜测全然不同,在2018年春季发布会上,阿里巴巴人工智能实验室并没有如期待般发布新硬件产品,而是将重心放在了系统升级上。

3月22日,阿里巴巴人工智能实验室宣布发布人机交互系统AliGenie2.0版本,在原有“听”和“说”的交互体验基础上,引入视觉能力,能够进行视觉认知、多模态交互、情景感知。在AliGenie2.0的支持下,“天猫精灵”将成为首款能“看见”的智能音箱。

AliGenie2.0图

天猫精灵上市200多天,即实现200万台销量。站在这个节点上,阿里巴巴人工智能实验室意在通过AliGenie 2.0,带领行业向更高维度进行能力升级

天猫精灵销量达200万台:中国人工智能“加速度”

活动现场,阿里巴巴人工智能实验室负责人浅雪宣布,截止到今年3月中旬,天猫精灵累计销量达200万台,持续领跑中国智能音箱市场。

销量200万配图

据悉,去年双11,天猫精灵创下了单日100万的销量,也成为唯一一款销量超过100万的中文智能音箱产品。从去年双11至今,天猫精灵在没有大规模市场活动的情况下,累计销量突破了200万,这是由市场需求、产品口碑带动的成绩。

在全球市场,最畅销的智能音箱亚马逊ECHO达到这一数字,用了一年多的时间,而天猫精灵只用了200多天时间。

“去年天猫精灵双11百万销量证明了中国智能音箱不是伪命题。200万台销量,证明了中国智能音箱市场比美国更大、发展速度更快。这就是中国人工智能的加速度。”阿里巴巴人工智能实验室负责人浅雪表示。

发布AliGenie2.0,支持视觉认知、多模态交互

200万销量背后,AliGenie 1.0“听”和“说”全新的交互体验获得了市场认可。AliGenie2.0引入视觉能力,将为天猫精灵带来新的能力升级。

据介绍,AliGenie 2.0的视觉能力包括图像识别、人脸识别、物体检测。AliGenie2.0还引入多模态交互能力,通过对语音、图像、触摸等多种交互形态的融合,让机器和人的交流,更像是人与人之间的交流。同时,AliGenie2.0还具备情景感知能力,基于你所在的上下文、对话场景自主学习,深刻理解情景需求。未来,AliGenie将不仅能识别“命令”,还能理解你的“情感”,并且进行情感反馈。

在阿里巴巴人工智能实验室看来,智能音箱终极形态是家庭机器人,从“听”“说”,到“视觉交互”,再到“行动力”,阿里巴巴希望通过引入视觉能力加速这种进化。

“行业真正需要的不是销售数字,而是持续创新的力量。因此我们选择发布这样一套系统,希望带领行业向更高维度进行能力升级。”阿里巴巴人工智能实验室负责人浅雪表示。

精灵火眼:天猫精灵将能“看见”

AliGenie2.0首先将视觉能力落地在天猫精灵X1。然而,天猫精灵并没有推出一款“带屏幕的音箱”,而是推出了“精灵火眼”功能:通过现场发布的XHolder外设,及天猫精灵手机APP“精灵火眼”功能,所有天猫精灵X1用户都能连接自己的手机,为天猫精灵加一块屏幕。天猫精灵还能调用手机摄像头,具备视觉认知能力。

“我们希望通过精灵火眼,以普惠的方式让大家在不增加硬件成本的前提下,体验到视觉的魅力”,阿里巴巴人工智能实验室负责人浅雪表示。

天猫精灵关爱老年人健康

“精灵火眼”初期上线了读书、识别药盒等功能,未来将具备万物识别、人脸识别等功能。面向儿童使用场景,“精灵火眼”与国内顶尖的出版社合作,精选了适合3岁到8岁儿童的117套图书,如《小猪佩奇》等热门IP。

面向老年人使用场景,“精灵火眼”推出识别药盒的功能,能识别4万种药盒,只要扫一扫药盒,就能用语音播报药名、功效、过期日等信息。

在活动现场,阿里巴巴人工智能实验室还牵手马云公益基金会,共同推出“天猫精灵儿童公益计划”,将天猫精灵送下乡,陪伴每一位儿童成长。

发布多款硬件,布局家庭智联网

阿里巴巴人工智能实验室还发布了天猫精灵曲奇版、智能投影天猫魔屏S1和天猫路由器。

作为阿里巴巴智联网战略的一部分,阿里巴巴人工智能实验室未来将语音交互、视觉交互、机器行动力等结合在一起,推动家庭智联网的落地。

在阿里巴巴人工智能实验室看来,天猫精灵的本质是一个家庭智能终端,具备认知能力、理解力,执行力,而且在不断进化。它不仅是一个智能音箱,还可以连接其他家电、家居产品进行智能控制。

阿里巴巴人工智能实验室在开发天猫精灵的过程中,发现家庭智联网遇到的最大的挑战是网络,所以开发了天猫路由器,去解决连接问题。

传统客厅场景,电视是核心。天猫魔屏S1能把一面白墙变成一个电影院,并与天猫精灵连接实现语音交互,是对客厅场景的重新定义。

“我们从来不认为智能音箱就等同于一个遥控器,我们也从来不认为屏幕等同于视觉能力。阿里巴巴人工智能实验室对于AI有我们自己独特的理解。我们希望未来的家庭,不是House,而是Home,带给大家温暖和想象。” 阿里巴巴人工智能实验室负责人浅雪表示。

合作站点
stat