互联网金融时代已经来临,作为爆发式增长的P2P网贷行业,正是互联网数据化和金融化的结合。面对大数据的来临,业内的讨论声音似乎都很“很兴奋”,然而,真正的大数据时代来临了吗?
大数据时代还未来临
上海证大金融信息服务有限公司(简称证大财富)副总经理刘捷认为,目前的P2P网贷行业正处于大数据时代的第一阶段和第二阶段之间。“基于互联网和通讯技术日新月异的发展,大量数据的产生是大数据发展的第一阶段,第二阶段是粗犷地、违法违规的应用,这个阶段中很多人都知道数据有用,至于怎么用却见仁见智。”他介绍,第三阶段是系统、规范地去整理数据并产生相应的管理工具、分析工具以及产生专业的大数据人才,这时进入了真正的大数据时代。“目前只能说是有很多数据而已,真正的大数据时代还未来临。”
“P2P行业要做真正的大数据有两个途径:一是建立自己的生态圈去了解客户的特征,同时需要做数据挖掘寻找关键的数据。”新新贷CEO张扬认为,目前数据获得的渠道和成本都制约了大数据在P2P领域内的实现,与此同时,目前尚不具备大数据来临所需的硬件设备和人才两个因素。“绝大多数P2P并没有云计算的设备,也不具备数据挖掘的人才。”
但不可否认,当前使用移动互联网的人群对于信息的获取较为社会化。犹如你我贷总裁严定贵所说的,“这个时期数据的获得变得越来越容易,交叉比对也变得更加方便,互联网的行为数据可以为其本身的信用定价提供有力的支撑。”也就是说,这个时期为真正大数据的来临做了铺垫。
数据挖掘给风控来带可能 虽然如业内人士所说的,真正大数据时代尚未来临,但利用大数据对P2P网贷行业进行风控的探索已经展开。
据悉,目前P2P对客户的风险计量是通过央行的征信组织来进行。但央行现在的征信数据覆盖的人群数量只有4~5亿,大数据对于更多的人是空白的。不仅如此,在央行现有的征信数据中,借款人的征信数据条目的稀少也为数据挖掘带来困难。更为重要的是,央行的征信数据不仅与P2P网贷平台没有直连,目前还很难获得。"更多的P2P网贷公司通过其他的方式,比如通过由借款人借款时拉取央行征信报告的方式来获取数据,但这却是很不容易的一件事。"严定贵介绍说。
事实上,形成P2P最核心的竞争能力是风险控制,它需要对获取的客户进行高效的、精准的风险定价和风险计量,而这一切随着大数据时代的来临便有了实现的可能。“大数据风控必须符这两个特征:数据及时更新、用户在平台有足够的黏性。”张扬认为,目前国内在金融领域利用大数据做风控的成功案例只有阿里小贷和证监会,“其原因正是满足了大数据风控的这两个特质” 。
“目前P2P网贷行业最大的问题和风险是对客户信息了解得不真实。大数据时代的到来对全民征信提供了可能性,此前的数据是分散给不同的渠道和不同的人而没有形成互通,但是大数据时代的数据互通会变成一种必然。”刘捷介绍,大数据不仅涉及到银行征信的范围,还涉及到个人的消费习惯。当个人的诸多数据被归拢到一个平台上的时候,运用数据的交叉比对就能够真实地了解到个体户、小微企业的运营情况等信息,P2P网贷行业的风控就能到解决。
信息收集和数据挖掘是关键
虽然大数据时代的来临将给P2P网贷的风控带来可能,但风控能否良好地实现取决于信息(数据)的收集和数据的挖掘。犹如严定贵所介绍的,目前大多在20~40岁之间、能够非常熟练地使用互联网的借款人,他们在使用互联网以及移动互联网时留下了大量的信息(数据),使得通过互联网进行征信已变成一种潮流。“这种数据不仅容易获得,还可以进行交叉比对。”每个人在使用电脑时的IP地址、MAC地址都能与上网信息进行匹配,藉此可以找到相应的人以及关联其他信息,为P2P网贷行业信息的搜索和挖掘提供了实现的途径。
严定贵指出,P2P网贷行业要关注大数据方面的数据和采集功能。“业务数据的采集是至关重要的环节。通过采集业务数据并对数据进行加工、分析而得出个人的信用体系。也正因此,大数据能为借款人的信用能力做重要的补充。随着获取数据的方式越来越容易,大数据在个人征信的权重里有可能会高过央行的金融行为准则。”
在这个过程中,大数据只是一个工具,利用关键数据进行评估、授信和贷后管理至关重要。举例说,大数据的LBS信息对于上班族而言,将会搜集到申请借款信息里所填的个人住址和上班的地址。“在这样的情况下,与LES信息相关的公司(类似于电信公司或者互联网公司这样持有数据的公司)进行合作,能够获取到上班族的LBS信息。”
大数据将不止于风控
随着信息量的增多,大数据的“能量”也将越来越强大。如刘捷所说的,大数据时代下的P2P网贷行业会产生业务内的细分。“今后的P2P网贷行业,一部分工作人员可能更专注于销售和线下工作的完成,但同时业内也会分化出专注于数据的分析和研判的工作人员,这种部门类似于大数据的咨询机构,形成这两方面的细分能够让专业的人做专业的事。”他认为,一旦大数据时代真正到来,将会让P2P的从业者把管理的精力更多的从人变为数据,这也是对P2P网贷行业最大的挑战。
值得注意的是,“虽然大数据是一个有效的工具,但也不能迷信大数据。”张扬举例说,在建立用户信用信息纬度模型时,纬度过多的情况造成纬度之间存在性关系,即数据不独立、只是存在相关性、产生大量脏数据而让模型失真。“由于目前并没有到海量数据库作为支撑,P2P网贷行业开始为大数据的分析做一些准备工作。在未来,谁更先建立大数据的生态圈并完善平台的数据挖掘能力,谁就能够在P2P网贷行业中取胜。