作者:财新记者 李小晓
观察者言:央行年初给8家民营个人征信公司开业在即,有的高调登场,有点鲜见发声,中诚信征信就属于后者。在此之前,市场上几乎没有中诚信征信业务与产品的消息。据财新记者了解,央行将于六月底启动开业前检查,如顺利就可以正式开业。财新记者专访了中诚信征信执行董事孔令强,他将中诚信征信描画出了全貌
央行年初给8家民营个人征信公司发放了筹备许可,央行要求这8家机构做好个人征信业务的准备工作,准备时间为六个月。如今六个月时限将至,据财新记者了解,央行将于六月底启动开业前检查,如顺利就可以正式开业。
如今这8家机构开业在即,有的高调登场,有点鲜见发声,中诚信征信就属于后者。在此之前,市场上几乎没有中诚信征信业务与产品的消息。
中诚信征信隶属于中诚信集团,是央行年初准许筹备的8家个人征信公司之一。2015年1月5日,央行印发《关于做好个人征信业务准备工作的通知》,公布了首批获得个人征信牌照的8家机构名单,分别为:腾讯征信有限公司、芝麻信用管理有限公司、深圳前海征信中心股份有限公司、鹏元征信有限公司、中诚信征信有限公司、中智诚征信有限公司、拉卡拉信用管理有限公司、北京华道征信有限公司。
在过去半年间,8家机构都各显拳脚,各自业务初见端倪。例如,阿里旗下的芝麻信用推出了“芝麻分”,主要侧重生活类场景,在租车、婚恋等领域推广芝麻分数;平安旗下的前海征信推出了“好信度”信用分,主要用于信贷机构领域;华道征信推出了“猪猪分”,专注于检验租房者的信用情况,此外华道征信还上线了反欺诈平台;拉卡拉旗下的考拉征信推出了“考拉信用圈”,在O2O领域累积信用并获得优惠券。
约定俗成一般,每家机构的分数都起了自己的名字,中诚信也不例外,并其实早在今年3月就确定了自己的“万象分”。据中诚信征信方面介绍,万象分是基于公司10多年为银行提供个人信用评分的实践,结合互联网大数据技术优化升级的个人评分,表现上和其他几家机构的信用分类似,是300-900分区间内的综合信用评分。除此外,中诚信征信还主要针对金融风控向各类机构提供定制化评分建模或评分服务。
那么,竞争力的根源在哪里?业内人士认为,主要是数据来源和科技的比拼。
数据方面,八家机构的来源大部分重叠,例如公共部门数据和移动运营商数据等。此外,各家机构的数据来源各有“彩头”,例如芝麻信用掌握电商数据、前海征信有平安系内部数据、腾讯有社交数据等。据孔令强介绍,中诚信征信的数据优势在于其与全国一百多家中小银行的业务合作。“我们从2003年就开始借助集团优势帮助地方银行建信贷风控模型,积累有较好的客户渠道和资源,目前其中接近三分之一表示了积极的深入合作意愿。根据以往成熟的合作模式,一旦合作,双方之间会有数据共享之利。”
技术方面,八家机构也纷纷开发大数据机器学习分析系统、反欺诈系统、远程识别系统等。中诚信也不例外。据孔令强介绍,中诚信征信正在与机构合作研发基于移动端的快速互联网身份验证应用,同时基于移动设备的虹膜+指纹的远程双重识别系统的研发也进入了实质性谈判中。“在互联网时代这对反欺诈应用至关重要。”孔令强说。
在中诚信位于东四胡同的办公宅院里,财新记者专访了中诚信征信执行董事孔令强,他将中诚信征信描画出了全貌。
财新记者:你们拿到牌照后,主要产品线是什么?
孔令强:5月以来,我们的“万象信用”平台就开始了定向公测,到6月底行将结束,我们计划该平台在7月提供开放使用。我们的产品和服务在平台上呈现,该平台目前主要面向机构提供服务,对个人而言,暂时只提供查询个人“万象分”服务。
产品和服务主要分为五类。
第一类是评分。主要包括“万象分”和定制评分。前者较好理解,和蚂蚁的“芝麻分”、前海征信的“好信度”类似,是一个分值从300-900分之间的评分,综合体现个人信用。后者在应用之特定业务场景时,建立不同的知识图谱,通过多套规则引擎匹配相应算法,得到更专业的专项评分。此外,我们还将推出个人通信信用评分,这一评分有别于当前通信运营商自身的信用评分品种,这可能是八家机构中的首例公开推出。
第二类是融合征信报告。报告会包含我们能获取到的各类线上和线下信息,包括信贷信息、各类违约信息、公共记录、互联网行为等丰富的信息类别。
第三类是个人信息查询服务。可以提供身份验证、关系验证(社交关系图谱)、专项信息查询(工商信息、银行卡交易)等服务,这些信息的查询须严格遵循个人书面授权原则。
第四类是风险信息查询,包括涉诉信息及“黑名单”信息。目前中诚信征信集合有全国3000多家法院的2000多万条涉诉信息,并累计有近5万黑名单信息。
第五类是互联网身份验证服务。8月我们即将推出2C端的移动应用服务,其中将调用移动设备端在线扫描和识别身份证,快速面对面识别身份证真假。
此外,我们还发起成立了自己的征信联盟。目前已经和约70家机构签订了合作协议,目前主要以P2P网贷机构为主,其他包括小贷公司、融资租赁、投资管理、租车、酒店、超市、消费信贷等行业类别,目前积木盒子、融360、华夏典当、开开贷、友友租车、cocar租车等机构都在其中。加入联盟的机构日后将成为联盟的正式会员,会员将有条件地享用“万象信用”平台提供的部分免费服务,此外会员之间还可以共享会员公共信息库的信息数据。当然,共享信息是有严格的条件和保密措施的。
财新记者:你们如何收费?对盈利的预期是多少?
孔令强:我们将实施不同产品或产品组合阶梯定价,但加入我们征信联盟的正式会员能有条件地享用部分免费服务,超出条件或免费范畴的,会给予会员优惠折扣,当然优惠也是有阶梯定价机制的。各类机构还可以向我们申请定制化服务,我们的定制化服务将采取单独签署协议的方式定价。
我们肯定是要盈利的。个人征信并非一个暴利行业,而且我国个人征信业刚刚起步,业务开展的前期投入和收入不会匹配。行业内普遍预期,个人征信机构未来5年内很难有盈利。但我们的情况和其他几家不同。我们其实一直在参与个人征信行业,我们整个征信业务从2007年以来就持续增长和盈利。
我们做个人征信的历史可追溯到2002年。从那时起,我们一直和全国各地的中小银行合作,帮他们搭建综合信用风险管理平台。
目前中诚信征信每年有5000多万元收入,1000多万元净利润,其中约分之一来自个人征信,其余来自企业征信。
财新记者:你们做个人征信的数据来源有哪些?
孔令强:从前年初开始,我们通过移植和升级集团数据中心的互联网大数据能力,逐步构建完善了我们独立自有的互联网大数据业务平台。在互联网金融时代,我们通过既有业务数据沉淀、清洗和积累、合作客户数据互换、外购多方数据源、网络公开爬取、用户授权等模式大规模丰富了个人信息数据,目前已具备可涵盖近2亿人的个人信用评分能力。
我们为个人提供的“万象分”,从身份属性、信用记录、履约能力、行为特征和社交影响5大方面综合考察个人信用,信用分值从300分到900分。
其中,身份属性包括指个人身份识别与认证信息,包括姓名、性别、身份证、年龄、婚姻家庭、住址、职业、文化程度等信息;
履约能力是用于评估个人还款意愿的信息,包括收入、存款、有价证券、商业保险等;
信用记录是用于评估个人还款意愿的信息,包括个人在商业银行贷款、信用卡、消费金融信贷、P2P网贷、贷记卡、担保等金融信用活动中发生的履约信息。此外也有非金融机构的个人赊购、缴费信息等;
行为特征是反映个人行为特点并据此评估个人信用变迁趋势的信息,包括居住地变迁、消费行为习惯、工作学习变迁、通讯行为特点、互联网行为记录与偏好等信息,该部分信息主要为互联网爬取;
社交资料是反应个人交际关系、社交言行特点的信息,包括微博、BBS论坛等公开社交网站;
此外,还有公共记录信息,例如民事、刑事、行政诉讼判决、行政处罚等信息。
从数据的获取渠道来说,主要依靠网络公开爬取、和客户的数据交换、数据采购(公安部、学历学籍、金融交易数据、垂直电商数据等)、个人授权(电商交易、微博等)。我们之前也积累了很多的银行数据,但因为没有个人授权,所以我们只会应用于模型研发,不会纳入评分依据。
财新记者:如何看待网络社交资料等大数据在个人征信中的应用?
孔令强:我们的个人征信模型引入了线性回归、逻辑回归、神经网络、决策树、自动向量机、聚类、协同过滤、随机森林等多种机器学习算法,在具体开发中,使用了SAS、SPSS等统计建镇工具,以及R、Python、Java等机器学习编程语言和相关类库,所有评估算法和计算程序均为我司自主研发。通过这些技术,我们将网上非结构化的文字信息进行结构化处理,也就是“把文字量化处理”,从而应用在模型中。
目前我们使用的社交资料包括个人授权下的微博、BBS论坛、QQ等公开社交平台的资料爬取。
需要指出的是,社交数据做征信,不意味着在微博上骂人就分数下降,而是对你关注什么人、职业信息、消费倾向等多维度的信息捕捉。诚然,现在业内对社交数据的应用褒贬不一,我们也是边摸索边进步。目前社交影响因素在我们的评分模型中,考量的比重在5%以下。