Top
首页 > 文章 > 正文

百度西交大大数据竞赛:把明星串起来

发布时间:2015-10-21 09:29        来源:中国网        作者:中国网

2015年10月16日“百度、西安交通大学大数据竞赛”成功落幕,由百度提供的“十亿条文本数据、50个核心人物的相关信息和网络语料集合”组成本次竞赛的原始数据基础,此次竞赛的数据容量之大,条目之多,在我国目前的数据挖掘、人工智能领域的公开竞赛里,可谓首屈一指。

据悉,大赛基于百度的“知识图谱”技术展开,进而构建知识挖掘系统,选手被要求在任意给定的对象间自动构建该实体的关系网络,然后对实体进行候选关联实体的分层、排序和截断,最终形成针对该对象的三层关系网络,即该对象的知识图谱。

听起来比较抽象?我们来举一个例子。比如给定对象是因为发送了若干小视频而成为热搜人名的王菲家二小姐“李嫣”,则当我们输入“李嫣视频画面”时,应用知识图谱技术,系统可以自动挖掘出李亚鹏是她的爸爸,进而挖掘出周迅是李亚鹏的前男友,再挖掘出汤唯是周迅的同乡……凡此种种,就是“李嫣”这个给定对象的一层、二层、三层关系。

其实,利用知识图谱技术,我们不仅可以挖掘出明星关系,日常生活中的任何一个搜索请求有了知识图谱的参与都可以变得立体化、可视化起来,而不再只是线性的网址列表,比如利用知识图谱搜索地名则可以看到地图、天气、旅游景点等关联信息。搜索某一电影院,则可以显示出附近商圈中与之配套的交通、餐饮、购物信息。知识图谱技术不仅可以使我们的搜索结果更加准确,同时也可以使搜索结果更广更深,通过知识图谱建立的关系让用户可以通过互动、点击拓展搜索的深度和广度。

通过对知识图谱研究的核心技术——知识挖掘的不断研究,真正实现“让知识串起来”也正是百度公司与西安交通大学联手举办这次大数据竞赛的题中之义。相信这两家在业界和学界各为翘楚的联手,定能够打造中国大数据竞赛第一品牌,并通过全国高校的范围内,挖掘、发现大数据尖端人才,并提供更好的发展环境和实践机会。

合作站点
stat