Top
首页 > 新闻 > 领袖视野 > 正文

用好大数据,关键是数据融合

对于未来,星光数据CEO白剑波认为,重点要解决的问题首先是分布式存储。通过开源技术做了分布式处理系统,可以有效地进行信息检索,并通过算法引擎的插件预制了一些模型和算法。另外,第三方可以将开发的算法放在平台上。
发布时间:2017-02-16 14:56        来源:赛迪网        作者:lm

利用大数据帮助企业创造价值是一件非常重要的事情。那么如何将企业内部的数据和互联网的数据进行融合?

企业要想应用大数据,特别是用好大数据,很重要的过程就是做数据的融合,再利用数据的应用帮助企业做决策。在获得这些数据后,企业会基于应用帮助企业做决策,而应用的核心就是分析,应用各种模型做精准营销,其关键环节是客户画像,即利用标签化的技术将客户标签化再分类,为企业或行业最终的决策和精准营销提供支撑。

以星光数据为例,他们在互联网数据方面的获取能力值得称道:每天采集海量的互联网原创文档,包括新闻、博客、微博、微信、论坛、平媒等境内外网站,另有电商,手机app等数据。目前,公司监测12亿个账号微博,每天用新账号扫描器扫描新账号,监测其中的数据;对超过2000万的贴吧进行分钟级的监测,分钟级采集所有新发的数据并推荐给客户,这为企业提供服务打下了数据的基础。

此外星光数据还有一个高速的处理平台,可以对所有采集到的数据进行结构化处理和标签化处理,在平台上做语义分析和正负面情感的分析,在此基础上结合多种模型,进行文本数据挖掘。

基于这两个核心基础,可以为用户的各种应用提供数据服务和应用服务,包括源数据服务、舆情监测、企业征信、网络调研(消费者满意度调查、品牌美誉度监测)、精准营销、人物画像、竞争分析、新闻素材等。

对于数据平台,业界专家强调,数据集成非常关键,要将不同形式和格式的数据接入到平台中才能做融合;接入的环节非常重要,对企业来讲,接入物联网后数据量非常庞大,因此需要拥有分布式的存储系统;另外,提供信息检索、基于模型的挖掘能力、可视化的展示方式、算法的引擎对于平台也非常关键。在知识管理和安全审计两个环节:人工智能和深度学习对知识管理非常关键,要通过知识管理构造整个系统;安全对于数据厂商和平台也是非常重要的环节。

对于未来,星光数据CEO白剑波认为,重点要解决的问题首先是分布式存储。通过开源技术做了分布式处理系统,可以有效地进行信息检索,并通过算法引擎的插件预制了一些模型和算法。另外,第三方可以将开发的算法放在平台上。

合作站点
stat