Top
首页 > 正文

大数据技术能否借垃圾分类一双"慧眼"?

现阶段,垃圾分类识别技术的计算产品、算法都较为成熟,难点在缺乏足够量的训练图片集。由于神经网络算法是一种数据驱动的方法,对训练样本数据量及质量要求较高,数据量越大,识别判断越精准。
发布时间:2019-07-04 17:27        来源:赛迪网        作者:

7月1日起,上海市将正式实施 《上海市生活垃圾管理条例》。条例规定,个人混合投放垃圾今后最高可罚200元,单位混装混运最高可罚5万元,而且违规行为还将会列入征信系统,"史上最严垃圾分类措施"从天而降。上海市民尚在惊愕中,北京等另外45个城市的垃圾分类政策已然在路上。

日常生活中,每个类别的垃圾往往包含了各式各样的内容,仅凭经验,人们在分类投放的时候难免会出现偏差。幸运的是,得益于云计算、大数据、人工智能和物联网等先进计算技术的发展,垃圾分类识别变得精准高效起来。

通过先进计算技术,垃圾分类识别是否能做到非常精准?速度快不快?技术多久可以成熟并普及开来?带着如上一系列问题,我们采访了曙光公司大数据智能研究院院长宋怀明博士。

据宋怀明介绍,在计算机大数据视觉分析领域,目前主要基于神经网络的算法进行图像分类,分类技术有很多种。具体到垃圾分类,有单一目标分类,即对整张图片进行分类,为图片给出唯一的分类标签,如单个瓶子的照片——可回收,果核照片——湿垃圾;有多目标检测分类,是对图片中的多种垃圾进行定位及单独分类,比如一堆垃圾中,瓶子是可回收,废纸则是干垃圾。前者,技术相对容易实现,市场上近期比较热门的几个手机垃圾分类的APP都是使用这种技术;后者则在生活中更为实用,应用场景更为广泛,但研发难度也更大。

图为使用曙光慧眼系统进行垃圾分类模拟实验

现阶段,垃圾分类识别技术的计算产品、算法都较为成熟,难点在缺乏足够量的训练图片集。由于神经网络算法是一种数据驱动的方法,对训练样本数据量及质量要求较高,数据量越大,识别判断越精准。宋怀明介绍,理想状态是每一类垃圾数据集为几万张图片,精准度可达到95%以上。如果图片集数量不足,精准度则会打折扣,这时候曙光的做法是用图像增强技术增加训练数据的量级,以提高识别精准度。

至于识别图片速度,既取决于终端网络延迟,更取决于后端的处理速度及算法复杂度。以"曙光慧眼"举例,即使在光线阴暗、适量遮挡、物品一定程度变形变色等条件下,仍可实现毫秒级快速物品识别。

其实曙光慧眼的主要用途并非垃圾分类,而是智能视频人脸识别,可用于会议签到、刷脸支付、酒店入住、各类门禁等场景,广泛应用于会场、车站、机场、学校、地铁、小区、超市、宾馆、企业前台等复杂场景。

对于成熟的垃圾分类识别技术多久能普及开来,宋怀明表示很乐观,46个城市,几亿人的刚需,市场空间和商业潜力巨大。即使是复杂的多种垃圾定位分类应用,预计半年内也会成熟并普及使用。

合作站点
stat