征信宝官网
赢在信用时代

凭安信用总经理杨茂江:反欺诈的实践与展望(可以查人行个人信用记录的公司都来看看,以免引火烧身)

yangmaojiang

本文是凭安信用总经理杨茂江在征信领军者论坛2015上的讲话原文,经组委会授权征信宝刊登出来的。

杨总的讲话干货很多,“对于个人隐私的重视和保护、对于保护个人信息的6项专利”等内容给征信宝的印象非常深刻,这也是征信宝一直在思考的内容——目前无论是app,还是网站、或是微信端,号称可以查“人行个人信用记录”的软件很多(在此我就不举例了),说到底,都是对人行征信系统注册和登录界面的“模拟”,技术不复杂,但迷惑性很大,用户通过这些app、微信等查询个人信用记录后,信息就会在这些端口和数据库“沉淀”下来,也就是说,你的个人征信记录被这些公司获取了,如果遇到不良商家,这些信用记录就可以被出售和泄露,危害可想而知——这也是为什么征信宝开发出了“模拟登录”却始终没有使用的原因——这样的灰色地带,如果人行追究,如果有用户投诉,都是要付法律责任的——创业公司,容不得一点不光彩的历史,何况我们做的就是征信行业呢!

希望这些公司可以好好看看凭安信用杨总的讲话,把用户的“个人隐私”放在第一位,用技术和良心保证用户的信息安全。

 

非常高兴能有这样一个机会跟业内的顶尖的互联网公司,互联网征信公司一起交流。而且作为一个活动的联合主办方也特别感谢上海市经信委、长宁区以及园区IBP给我们的支持。今天讲的是《反欺诈的实践与展望》,可能更多的讲的不是凭安,讲的是通过大数据,通过我们做征信来看看整个互联网这些行业。简单介绍一下,刚才刘军介绍说我们在这个行业里耕耘了几十年,没有。实际上我这个团队在做征信之前,我们一直是做信息安全。信息安全和征信之间有一个特别大的联系,实际上最终落脚还是在安全。

之前的安全可能偏技术,现在的安全可能更多的是偏业务。这两者之间我们认为是非常契合,而且是非常自然的一个延伸。所以凭安信用是自成立以来,我们希望用大数据的技术来帮助整个社会的信用体系建设。

再简单说一下,我们做的事情主要涵盖两块,一块是企业信用,一块是个人信用。如果大家上网,大家如果用的是遨游的浏览器、360的浏览器或者2345的浏览器,大家会看到我们的产品。当你访问一个网站的时候,网站的地址名会有一个标记,告诉你这个企业的信用。这个是凭安信用从创办之初就开始做的一个业务,到现在已经有三年的时间。目前经过我们评估过的企业、网站的信用的数量,已经超过了40万。这是我们在三年前,致力于做的一件事情。然后随着业务的发展,随着需求的拓展,然后我们逐渐涉及到一些个人信用的工作。今天就跟大家分享一下这方面的一些心得。

等一会儿我要分享给大家的主要是通过大数据,通过我们做信用和征信,我们看到的互联网金融的一些现象和数据。然后大家一定会好奇这样的一些数据是从哪里来的,因为我们的数据覆盖了现在还一直在运营、经营的,大概是1314个主流的互联网金融网站,以及200余个金融机构的用户样本。大概覆盖了多少呢?大概是4500万用户,6亿条的金融数据。这是我后面要分享给大家,数据的一些概括。然后刚才刘军在50人论坛启动仪式的时候,让我讲两句,我提到了个人隐私。在讲后面数据之前,这个大半年来一个特别深切的感受,在座的可能很多在深圳参加过刘军他们组织的会。在深圳的时候,有一个演讲者就被观众问到了一个问题,说你们有这么多的数据,这么多个人的信息,你为什么在我没有授权的时候,你就获取了?这个是整个行业里面面临的一个问题。包括我认为在不断的交流过程中,不断地跟各级监管机构,政府沟通的时候,这个问题可能没有回答得很清楚。刚才大家都提到央行让大家做好个人征信准备,其实这8家会有用户问,芝麻信用是一家信用公司,我在阿里上的数据为什么能被芝麻信用使用?这个其实是一个非常屌拐的问题。政府在发牌照的时候,一定要考虑你有没有数据。没有得到用户许可,你还不能采用数据,这是非常困难的问题。我刚才讲我们的样本来自于这样的数据,我也会面临相同的问题。所以在这里,我这大半年的时间,我觉得以后只要我参加的会议,我都会说至少凭安是这样做的。

首先我觉得从业的各位,信息安全,就是征信这个行业的第一生产力。这里我不展开讲了。刚才我提到的几个问题,提到比较尖锐的问题。可能我认为从业的人应该是都知道的,但是我们这个行业,对我们这个行业不太了解的用户,包括前天一位级别比较高的领导到我这里来考察,然后他带了一个随行。我讲完之后,他带的一个随行人员就揪着我问,就问到这样的问题,“你得到的这些数据,没有得到我的同意。”最后我认为我讲明白了。一个信用主体,就是在座的各位,你在互联网上或者任何地方产生的一些行为,这些行为可能是你把那个行为提交给运营商。作为征信机构,作为第三方的信用机构,他要获取这些数据,在这个地方有一个非常重要的节点。无论你从其他机构获取的数据,这里一定有个脱敏,凭安用的方法是一个密码算法。我就举感觉阿里这个例子,因为阿里名声比较大,大家都在生活消费。我们的支付宝帐号注册的时候,会把我们的身份证号、手机号以及家庭住址都会给到阿里。芝麻信用不可能再获取信息,所以他一定会做一些预处理,预处理就为了将来查询更方便。在这个时候,有一个非常重要的动作,一定要把用户的敏感信息,所谓的身份证号、手机号,给它隐去。如果我得到用户的授权,我又能把这个数据给找到。因为我本人是国家密码管理局的专家,在这方面我自认为我是非常专业的,在这里我认为有一个唯一的算法用哈希(音)算法。作为数据员获取数据的时候,一定要把原始的用户数据做一次哈希,这是第一步,凭安信用这么做的。我在这里郑重给大家承诺,凭安信用得到所有用户数据之前,不会存储任何用户的身份标识,就是没有你的身份证号、没有你的姓名和手机号。第二点,在使用的时候,刚才问了,这个哈希算法我可以给大家稍微多说两句。哈希算法就是你输入任何一段字符,比如说手机号,通过哈希算法会生成唯一的一段定长的数字,一段没有意义的二进制的代码。如果相同的字,原文用相同的算法它生成的结果一定是一样的。我用的时候怎么来用呢?用的时候我获取了用户的手机号,这个时候用户一定会给我授权的。我用相同的算法,因为相同的算法,相同的原文得到的结果是唯一的,这个时候我就能从我的库里把用户的信息提取出来。我为什么花这么多时间讲?我真的有切身的体会,你无论在哪里讲。你作为一个真正的机构,都会被质疑,你为什么没有获得我的授权的时候就能获取数据?包括运营商也好,包括水电煤公司也好,所有的数据源公司其实也是非常关心的一件事情。

我认为我们作为征信业的从业者,我们有责任把这个事情说明白。我们的上下游,我们服务的对象,以及我们采集数据的对象,大家一起宣传这个事情,让大家不要觉得这个事情听起来很可怕。至少凭安我可以承诺大家是这样做的。如果大家不这样做,我相信一定会有一天,大家现在已经看到了,网上有一些争议,比如说网上有些争议关于征信行业的,核心就是用户隐私。所以我个人的理解,如果你让用户很不爽,最终不爽的一定是我们自己。我花这么一点时间,特别给大家讲一讲这么一点。

基于这样的一些积累,凭安这方面申请了6项专利。我们申请的专利,其实不是为了我们愿意与所有征信行业的同仁大家一起共享这个专利。如果大家设想一下,这样的方式方法如果被其他行业或者是申请了,我们愿意在相关的,包括金融机构也好,包括刘军讲的50人论坛的平台上也好,我认为个人隐私是征信行业你永远绕不过去的一个坎。这个坎,我们通过技术、专利,通过我们自律,我相信是一定有办法解决好这件事情的。所以我在这里呼吁一下,征信行业的隐私保护标准,我认为是迫在眉睫。无论是行业的实施标准,还是政府牵头做的一些标准,我认为这个事情是非常重要的。而且非常迫切的一件事情。花一些口舌讲这个事情,一旦涉及到个人的时候,大家都会很敏感。

我举一个我自己的例子,我们自己做了一个APP,我们会和金融机构合作。在金融机构申请贷款的时候,金融机构会引导用户装我的APP,我会采集用户的信息。这个APP采集上来的信息,我们会把所有的身份信息,全部按照刚才这个方式隐掉。我们跟员工全部是这样讲的,也是这么做的。但是我们自己的员工不到万不得已,他也不会装这个APP。当你涉及到个人隐私的时候,这个问题就迈不过去。如果这个行业要发展,这件事情我认为我们这个行业的从业者就应该大胆地站出来,非常有底气地告诉对方:“我是这么做的。”我也呼吁监管机构,能够用一套标准去监管你是不是这样做的。这是我的一个想法。

基于这样的一些数据处理之后,我相信后面我讲的这些数据,大家可能会放心一点。后面的这些数据是基于一个样本,基于刚才我们讲的覆盖了这么多数据以后,我不是针对个人分析,是针对群体。有一些跟在座的互联网金融从业者分享数据。这是我们通过跟踪1400多个网贷行业的网站,我们自己创造了一个指标,叫网贷网站的访问景气指数。实际上在半年里面它有一个下降的趋势,这个下降主要体现在7月份。后面我们还有些数据,其实后面的数据表明这个行业还是在发展,而且发展很快。我们这个是跟大家分享,每个人对于相同的数据会有自己的理解。我们认为用户不断地趋于成熟,第二7月份政府出台了相关的意见,可能有些平台认为这个事儿不好玩了。我们这个叫网站景气指数,不是这个行业的景气指数。

我们看看这个行业,我们跟踪了最近半年的数据,我们看看投资人数以及借贷人数的变化。左边不是绝对值,左边是个相对值。从3月份到9月份,实际上这个曲线是非常漂亮的,半年大概有实现了百分之百的增长。在互联网上理财,而且在互联网上借贷两类人数都呈现了非常好的发展。互联网金融征信的蓬勃发展,反过来讲,对互联网金融机构的从业者来说这应该是相当的利好。

还有一个指标非常有意思,是人均的投资额,这个体现了有多少人会在网上?根据我们检测到的数据,在我们检测到的数据里面样本量,投资用户的样本量应该是达到百万级别这样的样本量。通过这6个月的检测,同时我们有个地区的分布,到现在来说人均的投资额已经达到了34000元。这个数据我要解释一下,我们不算累计的,我们只算这个用户的最高投资者。因为我们觉得比较有意义的,我投了一次之后,我可能钱回来了,我接着投。其实没有累计一次,他可能就拿出了5万块钱。这是我们的理解。当然样本的纬度、角度都可以商榷的。这个数据我们认为是用户对互联网金融的信任度,这个数据体现了用户对互联网金融的信任度。如果再分地区来看,我们上海人民投资的热情相对高一点,我相信也和金融机构的努力拓展也很有关系。

另外有一个对从业者来说,像刚才郭总提到的,像点融这样的公司可能比较开心的。就是平台的集中度提高了。但是对于一些创业公司来说,可能不一定是好事。我们监测到的,在我们的样本里面一共监测了193家P2P的平台。然后我们选取的前十家,它所占的整个市场份额,在我们的样本里市场份额,大概是这样的变化趋势,实际上比较明显的在上升。还是个马太效应,恒者恒强。这对一些后期的互联网金融的从业人员可能不是很好的消息,这个也符合大的互联网规律。

还有一个很有意思,从我们的数据看,也反映了社会上的一些现象,土豪的贡献很大。投资者超过20万的人贡献了全额的42%,但是人数只有整个人数的4.2%。在整个全国来说大概大部分人投资额还是小于一千块,这个我想也很容易理解,目前这个市场,就是互联网金融机构还在教育用户。这是我们看到的。我认为从这些数据、信号来看,我认为是偏积极的。就是从参与用户的热情度,参与用户的绝对数都是在持续高速增长。但是确实互联网金融平台固有的一些问题,我们也给大家分享一组数据。这个不是我们的数据,这个是我们引用网贷之家,在这里感谢网贷之家的数据,让我们引用。

这个我就不多讲了,问题比较多。这个是我们的数据,这个数据很有意思。在网络上借钱的,主要有P2P的网贷,还有消费金融。我们叫虚拟金融卡,这里类似于金融白条,然后信用卡的逾期。刚才我们讲我们覆盖的200多家的金融机构,包括银行卡。信用卡数据的逾期率是9.8%,这个数据我可以告诉大家,只出现一天我们也算逾期。就这个数据来讲,大家都是这个样本,就这个逾期率来讲,我们认为虚拟率来讲,京东和花呗确实具备了对银行信用卡颠覆的潜质。它的坏帐率很少,但是用户数很高。我听到阿里说今年打算把信用卡,花呗这个产品做到两千万的用户。这个产品推出来只有一年左右,大家知道平安银行的信用卡做到一千万用户应该是花了十年的时间。在这么快速的情况下,我这里说的坏帐不是收不回来钱,是说它出现一天逾期。在这样的样本下面,我们说互联网虚拟金融产品非常有竞争力的。但是其他的网贷金融产品逾期率非常不敢恭维。

我们尝试着回答这个问题,就是这些坏帐从哪儿来的?我们从50万,就是有银行借贷行为的用户里面,我们选取了这样一批样本,其中只有5.1%他有网贷的记录。什么意思?一个人缺钱,理论上来说他应该到所有金融机构去借。为什么94.9%的用户,他在银行借了之后,不再到P2P去借钱?P2P一定是产品没有竞争力。这个我相信大家也都理解,利率一定会比较高。所以你带来的优质的服务,比如说刚才郭总讲的全程在网上当然很方便,为什么用户不来?一定是其他的因素造成的。也就是说可能P2P接的用户更多的是属于在银行借不到钱的,这是我们的数据反映的。银行借不到钱,一定是被拒绝过,他一定存在一定的风险,这个风险一定是银行不可接受的。把他接收过来,这个命题就值得大家去思考。我们的理解虚拟信用卡行业颠覆银行业的形态是很有希望的,但是网贷可能任重而道远。

还有我们分析了一下,在我们选取的有P2P贷款用户的样本里面,我们发现有31.5%的用户,因为刚才我说了,我们监测到的数量比较多,我们发现31.5%的用户有共债的特征,当月出现逾期的接近三分之一。还有更多的纬度,我们选取了一些有意思的,可能消费能力比较低的,我们现在研究这个人现在消费和消费的能力,我们发现这个确实是呈反比的。消费能力低的用户,逾期的贡献比较高。我们可以大家一起,我们也非常愿意跟在座的金融机构,大家一起来探讨。我们揭示这些数据表面的一些规律,有了这些规律,我们会做得更好。

基于这个我们凭安下午在二楼的会议室,我讲的是宏观一些的,我们会有更加专业的团队,可以把这些数据,以及我们做的工作的经验跟大家方分享。如果大家有兴趣,可以和我留的电话联系。我们这些数据很有意思,包括企业的数据,包括个人展示的数据,这些很有意思。然后我们碰到的案例也非常有意思,非常愿意跟大家分享,谢谢大家。

 

最后,征信宝衷心谢谢凭安信用的“技术和良心”!

未经允许不得转载:征信宝官网 » 凭安信用总经理杨茂江:反欺诈的实践与展望(可以查人行个人信用记录的公司都来看看,以免引火烧身)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址