Top
首页 > 互联网 > 资讯 > 正文

宜信CTO张小沛:大数据助力互联网金融可持续发展

由途牛旅游网主办的第二届“互联网高峰论坛-2015紫金之‘颠’”将在南京举行。宜信CTO张小沛发表关于大数据金融云的主题演讲。
发布时间:2015-06-05 14:45        来源:赛迪网        作者:JY

【赛迪网讯】6月5日消息,由途牛旅游网主办的第二届“互联网高峰论坛-2015紫金之‘颠’”将在南京举行。宜信CTO张小沛发表关于大数据金融云的主题演讲。

张小沛表示,互联网金融行业要想实现长期的可持续发展,一定要建立自己的大数据体系,形成整个行业的共享机制,真正让数据成为风险控制最好的手段。

以下为演讲实录:

感谢途牛网给我这个机会,有机会在南京分享我们宜信在金融创新上的实践,其实我压力非常大,两个压力,一个是早上看到很多嘉宾站的非常高,我讲的东西是从业者的角度,讲的非常技术,在座的朋友觉得听不下去,另外一个是说一点半大家非常困,我自己也非常困,让我来讲这场,我看到灯光非常亮,我也看不见下面,下面的朋友如果觉得非常困可以睡觉,走出去也没有关系。我今天在这个地方还是想从一个从业者的角度分享一下,宜信在这段时间做的事。

在过去一年半时间内,我一开始加入宜信是组建一个团队叫大数据团队,当时我是第一个人,我到现在是160个人左右。过去一年半时间内,我们整个团队几乎所有人大数据团队除了一些做风控的同事都跟我一样,是金融的小白,都是做互联网,做数据挖掘,做跟金融不沾边的工作,我们加入宜信,宜信的很多现有同事他们对金融非常了解,这个当中有很多碰撞,这个碰撞当中有很多争吵,但最后还是碰撞出一些非常有意思的东西,一会儿跟大家分享。可能在座很多人不知道宜信是一家什么样的公司,我先简单介绍一下宜信是一家什么样的公司,第二部分我作为做大数据,十几年前在微软的时候做精准广告就开始做大数据,会分享一下我作为一个大数据做了这么多年的人对大数据的看法是什么,由这个引子导出宜信大数据金融云,我们有什么样的创新实践。

宜信是一家做互联网金融的公司,是2006年在北京由唐林创立的,我们对公司的定位是三环,一个是普惠金融,在贷款端,P2P是做撮合的,在投资人这端是财富管理,除了这两个,对立的是互联网金融,我们希望打造普惠金融、互联网金融、财富管理这样的旗舰。在去年阿里上市的时候,我从中国到美国留学的时候,做美都没有想到中国人做的公司会在美国上市,是最大的IPO,非常给中国人涨脸。宜信是2006年开始成立,今天我们其实光P2P,因为宜信已经超过P2P,我们也在做创新理财产品,但是在P2P端,我们是全球最大的P2P金融平台。这是我们在的一个分布,我当时加入宜信的时候,因为我的工作生涯都是在技术公司,我当时加入宜信的时候是2013年底,非常惊讶这个公司有23000人,现在有46000人,分布在180多个城市60多个农村地区,有几百个网点。宜信说自己是互联网金融公司,我们有这么多同事分布在全国各地,线上线下如何结合?我会分享一些有意思的实践。

这是几个数字,到去年年底31号的数据,平均每一分钟会有一名理财这在宜信获取10%的收益,这是在借贷端,每小时我们大概是有2500万元借贷额,这是去年12月31号的数据,今天是5月底,在过去5月中我们见到非常惊人的增长,如果今天这个数字那出来的话不是这个数字。这是一个简单的对宜信公司这样的介绍。

我下面会分享一下什么是大数据,我自己做了这么多年,说老实话,十几年在微软做大数据的时候,是做精准广告,实在量太多了,传统的那些手段是做不了,我们想了很多做分布式的方法,但当时做大数据的时候,绝对没有想到十几年之后大数据会这么火,火到什么程度?我看到很多人在中国和美国都复制话,大数据火到懂得的人和不懂得的人都在谈,去年在微信上被朋友拉进号称大数据的群,将近200个群,特别的费流量。我如何理解大数据的,在座很多朋友不是做技术出身的,我会讲很多例子,大数据在互联网领域的一些应用。我专门放了三家公司在这里,HULU在中国不做生意,NETFLIX是美国最大做专业视频的公司,amazon,中文应该是亚马逊,这三家公司从技术上从大数据应用上有一个非常相同的特点,就是他们推进系统智能做个性化,我想推进系统很多年前在学术界就写文章,我想成功被应用是亚马逊,是独领风骚的,亚马逊的网站非常不漂亮,特别不符合产品经理设计的角度,但是其实对他来说亚马逊最看重的是流量和转化,他们率先有一个团队做推荐引擎,是在2008年左右的时候,亚马逊公布一个数据,当时他的网站上,亚马逊是在美国流量非常大的公司,网站上有30%的交易是从推荐引擎算出来的,今天我想应该是远远超过这个数据。为什么我这么讲,是因为HULU,每个月大概五千万的活跃用户,我加入HULU的时候整个HULU所有的流量大概不到30%是从推荐引擎推出来的,在美国被骂不够精准。我在2003年离开HULU的时候,我有一个团队做推荐引擎,HULU将近70%的流量是在推荐引擎推出来的。我离开HULU的时候,HULU应该只有5个编辑,这5个编辑因为很多推荐版面是推算出来的,不需要人工算出来,很多人失业。我为什么把这三家公司放在这里,在HULU在亚马逊在NETFLIX,很多小惩办的制作剧,包括上小成本的制作剧,是用大数据算出来的,像纸牌屋不是大数据算出来。把这三家公司放在这里,我想更加说明的是推荐系统是大数据的非常典型得应用,今天淘宝、优酷等,后面都有推进引擎在这个地方。我做了很多年的精准广告,黏结广告主和用户的推进引擎。我们在宜信做了一个非常有意思的创新实践,这个实践后面有推荐系统。在HULU的时候,在HULU的一点一滴看到什么,都被抓拍了,只做推荐系统,只靠HULU的这些数据是不够的,我们还做了很多大量的数据,把这些数据关联起来做推荐系统。

八千万微博粉丝,我们团队有一个博士,他从清华毕业以后做了一个创业团队,2009年左右,那时候微博刚刚火起来,他们做了一个创业团队,最高峰的时候不超过十个人,他们都是学机器学习的博士,一个小团队没有多少钱,拿了一个小天使,他做了两件事,左手他写了一堆的“扒虫”,在全世界中文网上扒了很多内容,右手在新郎微博上创建了三千多个帐号,这些帐号分门别类,有的是范冰冰八卦等分出来,把左手扒到中文网上内容自动理解这些内容,十个人很有限,不可能每篇文章自己看,机器就得自动理解,这个文章写什么,那个文章写什么,这些文章理解了之后还不够,光理解是不够的,因为在微博上,某些人还用微博发帖子只能是140个字,这140个字如果在微博上有一个帐号,不停在那发帖子,这些帖子都不说人话,看上去都是机器说的不通顺的话,很难积攒大量的内容。左手抓这些文章,要理解这些文章,同时还得做缩阅,像做雅虎的时候花了几千万美金买了一个公司,这家公司只做一件事就是说给他一段文本,他做摘要的抽取。这个小团队说,把这些文章理解之后做缩阅,之后还得拟人化,还要设计一个调动策略,把这些拟人化的帖子分门别类放到微博上三千多个帐号里,像范冰冰这样的可能每天发五次,要根据那些粉丝怎么回应你的他的频率他的痛。这样一件事在不到一年的时间内,这三千个粉丝去虫以后积累起来,积累了将近八千万粉丝,靠着这八千万的粉丝赚了几个月的钱,后来做不成,新郎给封掉了。我其实还是挺感激的,如果新郎不封掉的话,他们就不会加入我的团队。有很多扒虫要去抓大量的内容,动态去抓内容,抓完之后要做理解,还要机器学做动态算话,而且要根据回帖人的频率打很多标签,还要决定说怎么调整这些策略,自己又去主动@谁,这些策略都是由算法做出来,因为有技术在手里,所以他们做这件事。除了刚才我说的推荐系统,我希望借助这两个分享,如果放一堆数学公式的话,可能在座的人都走光,我希望讲这两个例子,大数据用技术的手段如何用的,达到什么样的效果。

讲完这个以后,下面跟大家分享说在宜信一年半里面,我们有一些非常有意思的思考碰撞,也有一些实际的阶段性成果。这是宜信的整个高管层,我们对互联网金融往下走下去,我们判断的互联网金融发展趋势,我用这样几个关键词总结出来,服务化。今年4月的时候,在美国纽约有一个会,全世界做互联网金融很多公司其实都在这个会上,在上面美国一家公司分享了一个非常有意思的概念,借贷本身不光是一个产品,不光是一个网站,不光是一个能力,是一个服务,这个服务可以到处流走,跟我们互联网金融理解是非常吻合的。第二个我讲的是场景化,比如今天是途牛的主场,很多人上途牛定一个策略,去马尔代夫一万元,有些人可以付的起,有些人付不起,是否可以给我做一个消费金融的分期,这时候你帮助途牛做转化,你又让用户享受到金融服务,自己也把服务完成,这是三者赢的关系在里面。不见得是途牛,我们有很多合作伙伴,有做婚庆有做教育等,这样的场景走出去不是等人家上门找你,是走出去潜入到人家的场景里去。怎么来实现?我们的解读是说通过云+端,很多计算很多之前的解读都是在云端完成的,端是指很多完成这个动作这个场景发生的,可以是手机,现在物联网这么发展,将来的智能项链是非常有可能的,场景本身是在端体现的,服务本身是云和端共同完成的,可能很多计算是发生在云这边,在端上数据叠加进去做计算,云+端合作把金融场景给完成。

这是我对互联网金融的解读,这个解读就会导出我们在宜信做的一个成果,我们做了一个宜信大数据金融云,是一个开放的生态系统,怎么讲?大家都知道阿里有阿里云,百度有百度云,阿里云和百度云都不一样,阿里云像AWS的概念,把很多计算能力、存储能力很多分布式系统的弹性管理能力封装起来,用它的时候像自来水一样可以索取。NETFLIX所有的服务都是在亚马逊云上,我在HULU的时候,我们是自建领域,NETFLIX流量最大的时候服务功能不能进行了,突然大量的服务涌入到HULU里,也考验我们水平扩展的能力,可以看到一小时内流量陡增40%。百度云不是一个真正的云,像是一个云端存储的能力,我们在宜信做的金融云,跟他们两个云都不一样,是什么样的概念?后面的朋友不知道是否看到,这些蓝色的东西包括弹性计算、包括机器学习的引擎等这些能力,的确是自己封装了,但是不会对外开放,开放的是中间的能力,是什么样的能力?我们把宜信9年来尤其是对普惠,中国没有说像三大信用这样的机构,宜信9年来交了大量的学费,积攒了大量在这个人群做信用审核的经验,这些的能力我们把它封装起来,之后把它做成服务,做成SDK的方式,既可以说既有网站也有应动应用,可以到宜信借款理财,因为做成SDK也可以做出去,走到比如说途牛的场景中,比如说做美容做健康做O2O平台这样的场景中,帮他在那个场景中完成关键的一环,完成金融满足的一环。这是我们做金融能力的封装和开放,这个金融能力我来把它简单概括一下,我们刚开始做一年半,还有很多值得继续往下做的。我们的一个能力是说做反欺诈能力,另外做实时授信,今天在中国做实时授信是屈指可数的几家。宜信有大概一千多人内部自由员工的催收团队,我们用技术武装他找人,这样的能力也做成服务封装起来,有很多生态合作伙伴,在当地非常有关系,既能做风控也有资金来源,但是催收的时候不在当地,走到全国各地,可以起用宜信金融云催收能力。我们所有的企业包括宜信包括途牛,我以前在宜信,所有这些公司都面临货客,不管是线上还是线下,流量从哪里来?把这样的一些精准货客能力做成服务,什么服务都不用你的,既有钱做风控也能做货客,但是池子只有这么大,有精准货客是否可以合作?可以合作,这几大不同的能力,我们抽象出来是可以走出去,跟不同合作伙伴,既可以单个合作,也可以打包合作,这是中间我们开放出来的能力。当然我们还做另外一些事情,我希望如果明年机会还有来途牛网分享的话,可能中间不只是6个框架。上面是我说的一些合作伙伴,这些不同的合作伙伴,可能很多人会问我说,阿里也在做生态体系,上午陆金所的朋友也在说,宜信的核心竞争力在哪里?阿里我想有一个非常独特的体系,有电商,经营很多年。宜信是没有电商,重新做宜信也不可能,我们是专注做金融,只做一件事就是金融,可以做O2O可以做婚庆酒店可以做旅游等所有传统和非传统的行业,你去做你擅长的事情,我们做我们市场的事情,我们是否可以谈谈合作的关系,我们应该是去年9月份真正开始金融云谈第一个合作伙伴,是美国合作伙伴易贝,第二个是亚马逊合作伙伴。宜信大数据金融云,这是我简单的概述。

金融云里面,我们有很多能力,我们开放的是金融能力,把这些能力连接起来是知识图谱的能力,我经常开玩笑说,我来宜信做金融,我不懂金融,和金融专家谈的时候,我都要问几遍,但是很多东西都是辨证的,我做大数据很多年是有自己的思维方法在那里,我完全不懂,我就会说好吧,我来做你这样一件东西,我用我之前非常了解的方法来做,是否可以做?我们团队之前是做什么?不懂金融但是做过精准广告和推荐引擎,是否可以用搜索引擎做风控,这个搜索引擎是GOGLE做火的,今天百度已经度过了知识图谱的搜索引擎,我想知识图谱和精准画像的区别是什么?我用一个特别简单的话来说,知识图谱是有精准化,精准化是那些结点,这些结点打很多标签和属性,这是你的精准化画像,但是知识图谱有边,这些边的关系,弱关系、强关系、半强半弱的关系也在知识图谱里显现出来。到上周整个一千多人的风控团队每个人每天都省很多件,每个件都在用风控引擎,这是姨搜金融云里做反欺诈的。我这里有一些简单的数据,我们团队才一年半的时间,整个知识图谱里有2.4亿的内容,到目前为止大概是36亿facts。我加入宜信是2万多人,现在是4万多人,很多人之前在媒体上讲起宜信都说是线下公司,今天到很多城市去看我们的销售,每个人手机里装了一个强小云,我们会在网上做精准广告,拿到线索之后会做很多算法上的筛选补齐,实时推到销售手机里去,不是免费给他,我做了很多年的精准广告和搜索广告,把这样的概念用到了强小云概念,虽然是宜信的员工,但是我会给你打很多标签,根据你的业绩,根据你擅长的关单性质是什么,最后我会让你去竞价买这些线索,如果你的标签不符合某些规则的话,你没有资格来抢。即使有资格来抢,不同的人我们出的底价也是不一样。我们很多几万人的销售在全国各地每天接受到很多线索,今天我们会奖励他说给他很多奖励,如果你把这些线索填到强小云里,我们会给你什么样的奖励,因为数据越多越能做线索。我加入宜信的时候,我们信贷这边基本是线下做的,我们做了大概将近半年,现在已经有将近8%的量是从线上来的线索,这是我们在宜信金融云里做的另外一个尝试。

我刚才为什么会把HULU、亚马逊、NETFLIX专门放在这个地方讲,是为了讲这个,我想今天我们其实有很多移动理财平台,我们指旺是全国第一款基于推荐系统的智能移动理财平台,我们做了5个亿多的销售额,将近有40万用户,从推荐系统数据还是不够,因为我们整个团队是在HULU做推荐系统是在做亚马逊做推荐系统,我们会根据我们的经验,已经开始做推荐系统的一些非常常见的小的规则和小的算法。我给大家举一些例子,这是基于用户状态的推荐,如果打开指旺第一页会看到很多推荐,有资本市场的产品等,就算是今天只有P2P的产品,只要用过一次,看到的首页是不一样的,有的人会说是推荐的18天新手的产品,有的会推荐一年的产品。虽然我们才做了三个月,理财对很多小白来说是黏度非常高,我们看到在这几十万人用户里有很多用户已经重复购买,根据他重复购买的经验和产品做不同的产品件,每个人拿到的指旺看到的东西是不一样的。根据交易时间的规律做的一个推荐,因为时间很短虽然才做三个月,但是有不同的规律,增加转化率。这个产品是限购的,基于风险承受能力和我们对他的SDK的推荐。所有的推荐系统,所有做精准广告,做推荐系统的人,最终这个系统本身都需要大量的数据喂他,做自动学习智能学习的能力,在这个里我们设计了很多产品,这些产品本身是为了帮助推荐系统拿跟多的数据。

在座的人都知道阿里小贷,做的非常棒,有几百万的商家,时时刻刻都能看到数据,在那个地方可以放在一个额度,随使随取。我们宜信跟易贝合作,在华东华南几十万的商家,不在阿里卖东西,同时在亚马逊卖东西,卖到全球去,这些人是需要资金的,但是去找银行是贷不到,因为没有房源也没有车,我跟易贝合作,就不会把大量的中国商家数据给我们,我们跟易贝合作,在我们网站授权你给我们数据,我们后面用技术的能力,可以做到几秒钟根据这个数据估算额度,这是我们这样的逻辑。我们126家合作伙伴,既有做仓储,做物流,做票据,很多不同的系统,核心思想是一致的,基于数据实时去做额度预估的能力,我们现在是从9月份正式上线做到现在大概有5个多亿,宜信已经做了9年,应该说同帐龄里,做到现在我们横向比起来这是宜信所有资产里,风险做的最好的一笔资产,这是商通贷对商家实时授信产品。

整个宜信金融云是三位一体的金融服务生态体系,我就专注做最擅长的事,我和你合作潜入到你的场景里帮你做这件事,你可以做出去当指旺是移动APP,可以理财也可以做姨搜只做风控,也可以潜入到你的场景里做贷款、做反欺诈的能力,这是三方共赢的开放的生态体系。

我最后做一个广告,这是指旺的二维码。谢谢大家。

专题访谈

合作站点
stat