大数据风控用了什么模型?有效性如何?

如题所述

大数据风控的价值已经不用再多介绍了。这已经成为互金公司的核心竞争力,也是互金区别于传统金融的重要特征。互金公司能够为传统金融机构所不能服务的人群提供普惠金融服务,基于大数据的风控手段功不可没。通过全方位收集用户的各项数据信息,并进行有效的建模、迭代,对用户信用状况进行评价,可以决定是否放贷以及放贷额度、贷款利率 。

  相比于传统金融的风控模式,大数据风控可以通过机器的大规模数据运算,完成大量用户的贷款申请审核工作,提升工作效率。传统金融的审核由人工完成,效率会相对有限;大数据风控可以针对业务运行中出现的新情况、新数据进行快速迭代,增强模型的有效性;机器和软件可以“24*365”模式工作,摆脱工作时间的限制。

  互金公司发力大数据风控

  目前很多互金公司都在做大数据风控,虎嗅之前的文章对BAT在消费金融业务进行盘点时总结了BAT在大数据风控方面的技术。京东也有相关的布局。

  BATJ的大数据风控技术

  除了BATJ这样的大公司,近年来新兴起的已经具备一定规模的互金公司也大力布局大数据风控,以网贷公司和贷款搜索平台为主,大多推出了相关的大数据风控技术体系。

  国内部分网贷公司与金融搜索公司的大数据风控技术

  除此之外,还涌现了不少做大数据风控技术的金融科技公司,开发大数据反欺诈模型和信用评估模型,向资金端或资产端有资源的金融企业输出技术。这类企业也不断获得资本青睐。统计显示,近四个月内,至少有8家做大数据风控技术输出的公司获得融资,其中九次方大数据、51信用卡、用钱宝都已融到B轮以上。

       从BAT这样的大公司,到互金领域的创业公司,都在着力研发大数据风控技术。大数据风控的价值可见一斑。

  大数据风控具体是怎样的?

  大数据风控模型的构建,包含了明确模型目标、定义目标变量、确定样本、确定分析技术、构建模型、模型初步验证、数据处理、模型迭代等环节。我们专访了用钱宝CEO焦可等业内人士后发现,核心工作包括三方面,即获取数据、建立模型、模型在实践中优化、迭代。

  数据的来源

  对于大数据风控业务而言,数据来源主要包括几部分:

  一是用户申请时提交的数据信息,如年龄、性别、籍贯、收入状况等,这些数据可以了解用户的基本情况,验证用户的身份;

  二是用户在使用过程中产生的行为数据,包括资料的更改、选填资料的顺序、申请中使用的设备等,可以通过用户的行为来进行特征挖掘;

  三是用户在平台上累积的交易数据,如果公司运营比较久的话,可以累积比较多的用户借款相关数据,这类数据对于判断用户信用会有很高的价值;

  四是第三方数据,包括来自政府、公用事业、银行等机构的数据,以及用户在电商、社交网络、网络新闻等互联网应用上留存的数据。这类数据可以从多角度展示用户的特征,利用这些数据进行建模分析,可以找出不同特征与信用水平之间的相关性。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2017-10-27

目前贷款的风控因为每一个样本的收集都需要放款来收集,想想每人放一万,一个亿也就只能放1万人,所以样本量不会太大。所以所谓大数据风控主要是大在特征的数据上。很多时候是用了很多传统上不怎么敢用的特征。比如传统风控比较害怕missing value 比较害怕不稳定的特征 这些都是大数据风控需要解决的。说到模型,既然是特征多,样本少,那就需要一个非常抗过拟合的模型。另外如果是单独针对反欺诈而不是信用,因为问题比较非线性,所以需要一个有非线性能力的模型。满足这两者要求的都可以。当然上面说到的只是针对预测贷款用户好坏的二分类问题,至于很多风控领域的其他问题,就有不同的解决方案了。说到有效性。据我所知目前市场上有一些非常小额短期的产品已经可以完全按照一个模型放款并盈利了。完全不需要人参与。这类产品通过小额解决了样本少的问题。通过短期解决了收集label慢的问题。所以还不太容易推广到大额长期产品上去。

第2个回答  2017-10-27

几乎所有的互金公司都在宣传自己的大数据风控,这样可以让用户更加放心,也给投资机构讲一个技术含量高的故事,但并非每个公司都有相应的能力。就算确实在开发大数据技术,能力也有高下之分。如何判断一家互金公司的大数据风控技术的成色?

  首先看团队实力,团队是否有足够的技术人员,是否有相应的开发经验和履历。技术团队的规模与构成是衡量其大数据能力的重要指标,这一点比较直观。

  其次,看公司的业务特征是否有使用的数据技术的必要。用钱宝CEO焦可认为,企业如果服务于足够海量的用户群体,交易频次也足够高频,则有通过大数据技术提升运营能力的需要,也会有越来越大的数据支撑模型的迭代。

  如果一家企业只是服务于有限的客户,使用传统的线下风控模式就可以,没有使用大数据技术的必要,而且过程中无法产生大量的数据,也就无法为模型提供数据支持,所以也就没有使用大数据风控的可能性。例如,在P2P行业,如果借款人都是机构,且都是大额融资标的,则大数据风控没有用武之地,也没有使用的必要。

  另外,还要看经营的时间长短。陆金所董事长计葵生曾表示,验证一个大数据风控模型的有效性,至少需要5万笔贷款进行验证。如果业务经营没有多长时间,不会累积足够的历史数据,也就无法对模型进行技术进行及时的迭代更新,其有效性也就面临很大考验。

本回答被网友采纳
相似回答