回答者/巴曙松
从一般意义来说,俗话说“物以类聚,人以群分”,社交群体的关系性决定同一个社交圈内的人,具备一定的共性。现代社会,人生活在复杂的社会网络中。个人的家庭状况、教育背景、工作情况、生活爱好在长期的人际互动中形成社交圈,成为个人独特、密不可分的特质。分析社交圈内的数据,就能够总结出该群体的共同特征及规律,这也是社交数据被用来作为互联网金融借贷,用于评价个人信用的理论基础。 在具体业务操作中进行个人信用审核时,主要考察还款能力与还款意愿两大因素。社交数据中客户家庭、学历、工作等信息和客户的个人收入高度相关,一定程度上反映个人的收入情况,帮助评估客户的还款能力。还款意愿则可通过用户的社交行为、兴趣爱好、性格特点等,侧面推断其还款意愿。 在数据真实、充分可获取的情况下,互联网社交数据是信用审核中有价值的辅助信息。虽然互联网社交数据理论上有价值,但是上述数据的可应用性、可获得性决定互联网社交数据是否能在信用审核中成为长期稳妥的解决方案。
一.
社交数据可应用性:相关性挖掘与真实性保障
社交数据作为信用审核的难点在于社交网络数据是弱变量数据,不能直接作为信用评估的参考依据,目前个人金融领域通常使用的评分卡技术和机器学习等对于社交数据的处理和应用还未形成有效应用方案。未来若能提高自然语言处理(NPL)等技术,社交数据对个人征信的补充将有极大的好处;二是社交网络数据与实际还款记录不同,一个人的社交数据可以被人为操控,产生的数据具有重复性以及可篡改性,因而很多人为了获得良好的信用评价,可能会操控自己的社交数据。如“芝麻分”面世后,就有人在网上曝光刷分攻略,因此,无法形成真实的用户画像。
二.
社交数据的可获得性:数据垄断与用户隐私
目前社交数据主要来自以下两类:一是移动、联通以及电信公司通过手机号构建的社交关系链,二是主要以微博、QQ、微信等建立的互联网人脉关系圈。这些企业和科技巨头掌握了绝大部分的社交数据,客观上形成了数据的一定形式的垄断。 同时,社交网络数据信息包括用户个人信息、用户分享信息、人际关系信息、数据挖掘信息等,这些信息中既包含用户个人信息也包括第三方信息。因此,利用社交网络数据对个人信用进行评价,稍有不慎就可能泄露自身以及他人隐私。如果用户的隐私问题不能够妥善的处理,将面临监管的处罚,也会遭到大众的抵制和反抗。因此数据的拥有者对于开放利用社交网络数据存在顾虑,互联网金融企业在现阶段获取有价值的社交数据比较困难。 因此,总体看,现阶段社交数据还远未充分的应用并体现其应有的价值,但长期若能切实有效解决社交数据的可用性、可获得性等问题,社交数据将成为信用审核的非常有帮助的补充。(完)
文章来源:悟空问答 2018年2月27日(本文观点仅代表作者作为一位研究人员个人的看法,不代表任何机构的意见和看法)