Top
首页 > 正文

数字视网膜成为“城市大脑”破除“自闭症”的下一站

85%到90%的城市数据是监控视频数据,超大数据量却有着超低价值密度。所以当前的城市大脑架构下就容易患“自闭症”和“癫痫”。而借助数字视网膜的三个特征,我们不仅能优化城市大脑,还能为智能交通提供更好的解决方案。
发布时间:2019-11-25 15:14        来源:赛迪网        作者:王昊

【赛迪网讯】11月19-20日,以“动能焕新·智慧融合”为主题的世界人工智能融合发展大会在山东济南隆重召开。中国工程院院士、新一代人工智能产业技术创新战略联盟理事长高文在主题为《智能交通与数字视网膜》的报告中指出,85%到90%的城市数据是监控视频数据,超大数据量却有着超低价值密度。所以当前的城市大脑架构下就容易患“自闭症”和“癫痫”。而借助数字视网膜的三个特征,我们不仅能优化城市大脑,还能为智能交通提供更好的解决方案。

他指出,以智能交通之所以称为“智能”为例,正是可以通过一些技术手段把原来效率较低的查询路面车流量多少的工作提速,但是类似系统大部分是通过地面线圈、摄像头采集到的信息作为输入。而今天,将现代化的传感器和计算系统融合之后可以把智能交通等城市大脑功能做得更好。

高文

中国工程院院士、新一代人工智能产业技术创新战略联盟理事长高文

 传统城市大脑架构带来的问题:超大数据量,超低价值密度

数字视网膜、图像处理、视频处理均是经过了长时间的演化路径,比如最早的模拟的照相机,后来直到19世纪中叶左右,从伦敦开始逐渐利用这些图像与传输的图像内容借助计算机把模拟图像变成数字图像。

直到今天,这几乎涵盖所有可以用图像处理的应用领域。并且在摄像头价格下降、云计算加入以后,摄像机网络诞生,可将几千个、几十万个摄像头连成一个网。后端则是城市大脑,即原来的云存储。因此,城市内有若干个分存储器和一个总中心,最后包括智能交通的所有的决策分析都需要在总中心进行。

高文从数据传输的过程解释道,以前的模式是摄像头捕捉的内容回传,如果直接传输需要的带宽太宽,费用太高,则用编码器压缩之后传输过来,接收方则再把它解码,有价值特征内容提取后进行分析和识别。而特征提取和分析识别过程在人工智能火热以后,现在基本都是以深度神经网络进行。

从数理上看,只要拥有足够的算力就可以完成的。因此,绝大多数城市大脑架构就变成中间的云架构,从最底层的存储到中间层有数据交换的平台、软件平台、算法平台,算法平台、服务平台。

高文结合实例谈道,存储直接连接前端传感器后会造成系统效率低下的问题。比如,公安、交通等部门的摄像机网络很难实时使用。因为提取结果实时传输后,类似大规模的摄像机网络的数据量虽然庞大,但是并不是大数据,很难形成对城市整体的规划改进等有帮助的数据。这就是第一个问题——超大数据量。

另外,数据作为一种生产资料可以产生财富。但是城市监控的视频数据却除外。现在,城市中85%-90%数据都是监控视频数据,但是真正对城市规划、城市管理有所贡献的少之又少。所以第二个问题则是超大数据量却带来了超低价值密度。

没有价值的原因是什么,又该如何解决?原因其实就是架构问题。因为原来架构中的绝大多数摄像头只是获取、编码,对后面数据发挥更多作用的贡献微乎其微。因此,需要利用一些可以在摄像头提取有用数据、传输到云平台并进行处理、存储、长期保存的技术手段,形成一个富有价值的大数据。

高文分析道,当前矛盾是摄像头的工作过多或过少,99%左右不做特征提取的摄像头只进行编码、传输、存储,而如果直接识别人脸、车牌号,其实贡献也很小。从现有监控视频的使用方法来看,一种是人工监控,依靠人工查看,最后定位具体事件。另一种是机器分析,可识别行为的目的和身份。高文继续谈道,现在机器分析通常演示效果尚好,而一旦前端不支持,完全凭云计算把数据解开再分析,则所需算力实在太大,难以实现。 

学习人类视网膜破解城市大脑“自闭症”

人类双眼工作效率非常高效,眼睛视网膜的细胞数和最后传输到大脑后与大脑工作的连接数的相比,会发现一个差值:细胞数是接收区的细胞数量的120多倍。

因此人类的视觉系统在信息传输时并不是一层直接传输的,而是经过若干层,逐层传输后逐层递减,最终一直到脑神经处。以上的信息缩减功能在目前的摄像头中并没有。

高文认为,现有城市大脑的云架构系统则比较像病态的人类视觉系统。比如自闭症、癫痫症等由于神经发育过程出现问题而导致。从神经系统解释,人类出生时末端神经和脑端神经几乎是全连接,从婴儿时期开始学习后,通过周边刺激学会观看世界、通过语言交互学会听说,过程中就会对全连接进行增强和剪裁。正常情况下衰减、增强后发育为正常。但如果发育时没有进行剪裁,长大以后就会患上自闭症。

而癫痫则是剪裁过度,面对一般刺激就会形成放大的反应。现在,我们的城市大脑系统中如果摄像头传输的内容没有进行任何信息提取,就把每个摄像头在系统里完全同等显示,这就是一个“自闭症系统”。如果有的摄像头识别过于得过于重要,这种系统很容易变成“癫痫症系统”。

因此,高文谈道,面对现有城市大脑系统易于患上“自闭症”或者“癫痫症”的现状,就需要有一个系统像人类视觉系统一样,把信息汇总以后逐层缩减以后再传输。

数字视网膜“三流合一”

高文在分析数字视网膜最主要的八个特性时认为,也可汇总成三个本质特征:一个是全局统一的时空ID。每个摄像头要设定一个全局统一时空的ID。每个摄像头只要回传就可知道在全局统一时空下是几点几分发生的以及物理地点。

二是视网膜本身的高效视频编码能力,又分为高效特征编码的能力和联合优化的能力。高效视频编码是指可以应对诸如AVS标准、MPEG4等等不同标准。特征编码是指面对MPEG、CDVS、CDVA等如需在一个码流里同时监控视频编码和特征编码的话,需要让其可以联合优化。

三是模型可更新、注意可调节、软件可定义。模型可更新指的是特征提取的模型,现在的神经网络模型会随着时间推移出现新算法,因此要求数字视网膜的模型是可更新的。当前的数字视网膜芯片可以做到模型可更新、注意可调节,摄像头的注意能力是可以后台控制的。同一个画面里,优先级不同,可以赋予其感兴趣区域标识,具备注意功能,而其他背景区域并不重要可以较大压缩。软件可定义是指有些可以通过软件升级的方式实现软件可定义。

这种新的数字视网膜实际有三个流:视频编码流,特征编码流,模型编码流。

他指出,这三个流各有分工,有的是在前端实时控制调节,有的则是通过云端反馈进行调节和控制。而数字视网膜的应用过程也就通俗易懂了,即通过脑眼合一方式将来自终端的信息经过数字视网膜的处理后传送到云端。也就是完全以这三个流传入,有的流能看,有的流可以让机器自动去处理,而且是可以升级、有不同注意的。

以深圳市的鹏程云脑为例,高文指出,现在其已经具备了100P的算力。之上也有开源内容,比如建立开源生态、使能技术。视频编码标准就是其中的重要使能技术。视频编码在某些最新芯片上已可以应用,比如海思已经出了第一款全新的视频解码芯片。

高文最后介绍到,关于模型和模型的渗透压缩也正处于标准化工作阶段内。数字视网膜芯片的已经在路上,相信会很快发布。这个芯片大小类似一块钱硬币大小,包含以上的三个本质特征、八个功能,将来可能会直接植入包括智能交通系统在内的各种城市大脑系统中,支撑数字视网膜的应用。

数字视网膜凭借全局统一时空ID、高效的视频编码、高效的特征编码、联合优化等多层次的视网膜表达的特征优势,另外结合模型可更新、注意可调节、软件可定义的联合特征,最终和使能技术、硬件和云的工作协作后,相信可以为智能交通、城市大脑提供优化解决方案。

专题访谈

合作站点
stat