Top
首页 > 正文

AI数据的“基建”作用

随着国家“新基建”的提出,包括人工智能、物联网、云计算、大数据在内的新一代基础网络化、智能化技术开始成为社会原有基础设施上的新型技术“底座”。在未来,随着产业人工智能的推进,AIoT智能化设备将进化至“智能化量产产品”阶段。
发布时间:2020-09-18 16:03        来源:互联网经济杂志        作者:贾宇航

作为与“新基建”有着强关联性的AI基础数据服务行业,将迎来潜力较大的市场空间。据统计,2018年中国AI基础数据服务市场规模为25.86亿元,其中数据资源定制服务占比86%,预计2025年市场规模将突破113亿元。随着算法需求越来越旺盛,依赖人工标注不能满足市场需求,因此增强数据处理平台持续学习能力,由机器持续学习人工标注,提升预标注和自动标注能力对人工的替代率将成趋势。

从5G、人工智能、工业互联网、大数据、新能源、城际高铁、特高压等新基建涉及的领域来看,我们能够发现,新型基础建设的这些领域有个共同的特点,它们都具有“管道”的特性。如何去理解“管道”这一特性,例如5G的基建,它是一种信息的传递;工业互联网的基建,它是从物品等原材料变成成品的一个过程;特高压的基建,它是为了能源的传递。而人工智能,实际上也扮演了“管道”作用,现实世界和虚拟世界通过互联网技术、人工智能技术,逐渐把现实世界转化成为虚拟场景,同样通过技术手段也可以将很多虚拟数据转化成为现实对应的具像化的实景。

从人工智能的发展过程来看,人工智能目前正处于落地的阶段,对应的AR、VR、智慧城市、无人零售、自动驾驶、智能制造、智能家电等,这些细分领域的人工智能是在各行各业都有一些对应的落地场景。反之这些领域对应的人工智能,其背后有三个要素基础——算法、数据、算力。其中“算法”是人类对应机器学习的一种工作模式,例如人脸识别算法,就是它对应的人脸识别的相关方法。而“数据”,则是人们为了教会人工智能学习方法所需要的训练数据。“算力”,则是机器在运行、学习、训练过程中消耗的运算资源。

在真正的应用过程中我们会发现,算法、数据、算力这三个要素是既相辅相成又相互制约的存在。算法其轨迹向深度神经网络的突破,这就导致很多应用场景落地,进而有更多数据得以用于训练,算力也会因为它的量产而更加便宜,以上这些过程也会同时再促进算法提升。反观之,一些行业也可能因为迟迟没有可以用于训练的数据产生,导致算法和算力在该领域的落地处于停滞状态,这就是人工智能中对应出现的既相互促进又相互制约的方式。

微信截图_20200918154925

人工智能是一个较为宽泛的概念,机器学习是其中最重要的学科,神经网络是机器学习的一种方式,而深度神经网络是神经网络的加强版。人工智能的发展对应着深度神经网络的发展,实际上这只是算法层面的相互突破。从数据层面来说,数据上的突破在于,手机、电脑、照相机、打印机、扫描仪等大量的AIoT设备,它们可以将很多对应的现实场景转化成为虚拟化的数字资产,并且通过互联网分享、积累的形式让这些内容得以传播,再配合算力资源的迭代、相关算法的提升,最终积累到一些人工智能产品的落地。

微信截图_20200918154953

随着人工智能发展到下一个阶段,我们会发现,已有通用的数码产品所积累的数据已经不足以对相关行业、产业进行促进和提升了,因此定制化的采集设备,像激光雷达、毫米波雷达、阵列麦克风以及热红外传感器,它们的使用能够促进多维度的数据收集,进而转化成为数据,用于人工智能的训练,进一步提升人工智能。从配合来说,由于这些数据还属于被量产化的,或者说普及度还不高,导致这些数据需要有特定场景的训练数据,去弥补从互联网得不到数据的缺失,以完成相对应的人工智能相关算法的开发。

人工智能继续发展,将进入产品及AIoT设备的成熟阶段,在这一阶段中,产能提升导致产品及设备更加量产化、平民化,让更多的用户去使用,在这基础上用户使用过程中所产生的数据会进一步改变下一代人机交互模式,以及改变人与人之间交互的模式。目前,很多人工智能对应的场景处于即将落地的状态,或者说一些对应的行业正处于初级阶段,在这一阶段他们需要的就是定制化设备和场景训练数据。

为满足产品的商业落地,运用的数据也有对应不同的发展趋势,一是场景的多元化,二是样本的多样化,三是内容的专业化。

具体来说,场景的多元化是指由于深度神经网络的特点,它是深度结合所对应的场景。例如人脸识别在获取数据时需要室内的场景或是需要获取某种特定角度的数据,甚至人们在实际生活中应用场景会更为复杂,或是它的长尾场景非常多,那就要求我们在实际设计对应场景过程中,以确保真正有标的数据去用于机器训练。因此如果想要使得产品在某些特定场景中有更好的应用,这就需要产品应用能够覆盖更多元的场景。

样本的多样化是指要求AI需要具备普惠性。对于一款产品来说,不光是年轻人在使用它,同时老年人和儿童也在使用它。对于智能音箱这类智能交互设备来说,不光是中国人在使用它,还会有一部分海外用户在使用它,智能音箱会接收到不同国家的语言以及同种语言的不同方言,在这个过程中AI就需要多样化的样本、多样化的数据,比如从年龄层面、方言层面、人种层面等确保AI产品具有普惠性作用。

内容专业化是指随着新基建的推进,物联网拥抱人工智能的进程也将加速,产业应用领域也将不断深入,有越来越多的具体问题需要引入行业专家。只有具备相应的行业知识积累,才能更好服务于AIoT落地,进行高质量、专业化的数据产出。

云测数据作为AI数据行业的服务商,依托于高质量AI数据交付、高效作业效率、数据隐私安全把控和技术平台实力等优势,除了AIoT领域,也为智能安防、智能驾驶、智慧金融、智慧城市、新零售、文娱等众多领域提供AI数据服务,和众多企业建立了良好持久的合作关系。

受政策利好、物联网发展迅猛、场景需求剧增的影响,AI数据服务行业发展利好。随着AI与传统行业的融合不断加深,数据的量级以及复杂程度也将会大幅提升。聚焦在AIoT领域,作为AIoT场景落地的基础,高质量的AI数据将持续发挥的“基建”作用,最大程度上提升人工智能、物联网产业落地的效率和稳定性。

每日必读

专题访谈

合作站点