来源:《中国征信》2016年第3期。
作者:李铭,北京航空航天大学毕业,获计算机科学及工程硕士学位,美国雪城大学获计算机科学博士学位。
2014年4月2日,美国民间智库“世界隐私论坛”的两位资深研究人员帕米拉·迪克森和罗伯特·盖尔曼发布名为《美国的评分:秘密的消费者评分怎样威胁你的隐私和未来》①(以下简称《报告》)的研究报告。该报告是关于美国近年来四处泛滥的各色消费者个人评分的第一篇系统性研究文章。
迪克森和盖尔曼对评分的研究已有七年历史。2007年,他们初次搜集相关资料的时候,只找到25种不同评分。而到2014年《报告》定稿时,文章涵盖的各类消费者评分已达几百种,而且作者相信,不为他们所知的消费者评分及其变种可能还有数千种之多。
消费者评分及评分开发
《报告》将所讨论的评分称为消费者评分,对其界定比较宽泛,以求涵盖尽可能多的不同类型评分产品。《报告》给出的定义分为几个层面:首先,打分的对象不仅可以是消费者个人,也可以是消费者群体(例如一个家庭或街区);其次,打出的分数可以是单一数值,也可以是数值区间或者范畴标示值;再次,分数由统计模型计算产生,模型在计算分数时使用不同数量和不同组合的消费者特征、行为及其他属性信息;最后,消费者评分用来对消费者进行评级、排序、分类以及进行预测或决策,这些决策对被评分人的影响可以从无伤大雅一直到非常重要。
《报告》特别说明了哪些评分不是消费者评分。《报告》所考虑的消费者评分不度量评分对象的水平或能力。例如,美国大学入学考试(SAT)分数不是消费者评分,体检中心完全根据临床检验结果给出的参检人健康状况分数也不是消费者评分。
《报告》认为评分有三个要素:分数、影响分数的因素(以下暂且称为预测变量)和模型。
分数是对评分对象的状态或行为的度量。分数用来作出直接或间接关系到消费者个人或消费者参与的交易活动的决定。
影响分数的因素或预测变量可被想象为某种信息。这些信息描述或以某种方式关联到消费者的行为,故使用这些信息可使模型具有预测能力。预测变量可以包括评分对象的人口统计特征、行事规则、交易行为、上网历史、现存或可比的外在形象以及来自其他评分模型的分数。年龄、收入水平、种族、地理位置、教育程度和行为模式(例如邮购退货次数或支票跳票次数)都可能是有用的预测变量。
模型考虑各种预测变量的取值,并将其与其他评分对象的类似数据加以比较,为评分对象计算出一个分数。评分模型可以很简单,也可以很复杂;评分模型可以使用大量信息,也可以使用很少的信息。
哪些类型的预测变量可在模型中使用往往存在争议。传统的评分模型基于法律或其他原因常常对可“入模”的变量类型加以限制。例如,某些变量可以使用在汽车保险评分模型中,但不可使用在住房保险评分模型中。近年来出现的许多消费者评分对变量选用则完全不加限制。
另一个争议是有关所谓“过拟合”的问题。一个模型可能在现存数据面前表现非常好,但在其他场景下错得离谱。如果模型在开发时未能进行范围广泛的测试,使用起来可能就会有问题。
哪些信息可以进入评分模型
《报告》指出,计算评分使用的信息直接影响到分数是否公平、准确和非歧视。如果这些信息自身不准确、不公平或带有歧视性,则产生的分数非常可能逃不过相同命运。
消费者最熟悉的消费者评分是传统信用评分。传统信用评分使用的信息依国家不同而不同,甚至同一个国家的不同州(省)也可能有所不同,取决于所在地法律的规定或限制。例如,英国的信用评分除信贷信息外,通常还使用以下信息:居住在当前地址的时间、住房情况(自有、租住及其他)、是否有电话、年龄、郡级法院判决数量、职业类型、婚姻状态和工作年限;美国的信用评分使用的非信贷信息较少,可能用到公共记录和催收信息、在当前住址的居住年数、在当前雇主的工作年数、住房类型和职业。
一般而言,传统信用评分模型使用的变量数量不多。
打个比方,传统信用评分好像是公园中精心呵护的花圃,而近年出现的许多消费者评分则好像野蛮生长的丛林。除对变量类别不加限制外,新的消费者评分常常使用大量变量,虽然没有人真正知道500个变量的评分模型是否优于5个变量的评分模型。
以下是当今消费者评分最常用的一些信息列表。
构建评分模型
《报告》指出,如对建模数据所提出要求一样,评分模型本身必须透明、准确、稳定、及时更新,且必须使用真实数据进行充分和持续的验证。
《报告》认为,今天的评分建模已经是一个成熟且充满竞争的领域,然而近年来见到的许多消费者评分建模时采用了一些与传统建模技术有别的做法,例如在选择变量时不要求变量与模型用途相关。例如,一家金融公司构建评分模型时,将被评分人在写文章时是否使用全部大写字母作为能否履约还款的判断因素之一。此类做法是否可取目前争议颇多。
《报告》发现,在消费者评分模型方面存在的一个关键问题是模型中使用的数据缺乏透明度,外界无法得知模型中是否包含有歧视性或偏见性的信息。此外,在非医学的消费者评分中使用个人健康信息常常受到质疑。将一种消费者分数作为变量引入另一个消费者评分模型也让一些批评人士感觉不安,因为这种做法可能导致错误叠加、使歧视性或偏见性的信息愈加无法辨识,于是即便满足透明性要求,消费者也无法解开这团乱麻。
消费者评分
《报告》以一章的篇幅列举了一些典型的消费者评分,共述及11个范畴45种评分。有关这些评分的信息是通过大量的网上搜索和专家访谈得到的。但《报告》作者坦言,这里介绍的信息远远谈不上完全,因为相当多的消费者评分信息并非公开信息,很难获取。作者同时注意到,消费者评分的数目近年来增长很快,已经从早期为数不多的几种产品成长为一个完整产业。《报告》称,预测分析和消费者评分行业看上去正处于钟形曲线的上升段。
《报告》介绍的典型消费者评分包括:
范畴1:金融和风险评分。包括各类特殊人群的风险评分、不同地理区域人群的风险评分、客户稳定性评分、失业风险评分、利润评分、催收评分、响应促销可能性评分、社会知名度评分、慈善捐款人评分、家庭归类评分等。
范畴2:欺诈评分。包括信贷申请和既有信贷账户的欺诈评分、特定信贷业务类型的欺诈评分、网购欺诈评分和保险欺诈评分等。
范畴3:客户化评分。机构内部开发和使用的评分。这包括数目庞大的各类消费者评分,例如塔吉克(Target)公司开发的著名的客户怀孕预测评分。
范畴4:受监管的信用和金融评分。包括各种传统信用评分,也包括租房人评分等受到《公平信用报告法案》监管的一些新评分。
范畴5:身份识别和验证评分。包括身份标示信息分析评分及许多保险评分。
范畴6:健康评分。包括一批受监管的传统健康评分和其他评分,如处方忠诚度评分、各种类型的个人身体衰弱程度评分、个人健康评分、医疗资源使用程度评分等。
范畴7:智能电网和能源评分。预测消费者能源使用规律和模式的各种评分。
范畴8:社交评分。包括预测消费者社交网络影响能力、职业成功程度、纳税等情况的各种评分。
范畴9:执法评分,涉及警察、交通、国家安全等领域。包括自动识别嫌疑人、潜在犯罪人员、邮政诈骗人员的各种评分。
范畴10:环保评分。包括污染导致的健康风险评分、环境质量评分等。
范畴11:其他消费者评分。包括名牌药物偏好评分、药房选择偏好评分、赌场选择偏好评分、邮寄药品偏好评分、获取金融服务不足人员评分、经济稳定性评分、网购反馈评分、电子邮件发送者评分等。
主要发现和主要推荐意见
《报告》的主要发现有:
1.受监管的消费者评分和不受监管的消费者评分大量存在,其使用范围在不断扩大。
2.消费者评分中使用的信息来自种类繁多的数据源,有些消费者评分使用数千个预测变量。
3.许多消费者评分的分数、分数区间以及所使用的预测变量都秘而不宣。
4.消费者评分可能依赖歧视性或敏感的预测变量,但不为人知。
5.消费者评分影响消费者的市场机会,影响程度可能巨大、可能微小、可能处于二者之间。消费者利益可能因为评分的秘密性质而受到损害,也可能因为没有权力纠正错误信息受到损害。
6.消费者评分使用于许多线下的应用场景,而不仅仅聚焦于消费者的线上活动。
7.消费者通常无法知道评分究竟预测什么以及评分怎样使用。
8.消费者通常不知道评分模型所使用数据的来源,对有关自己的数据没有任何掌控权,也无法控制评分的使用。
9.消费者通常没有权力选择不被评分,也无法制止评分被使用。
10.除《公平信用报告法案》规制范围外,大多数消费者评分不受任何有关隐私保护、公平或程序正义的法律法规监管,缺少透明度导致很难或完全不可能判断创建或使用这些评分是否违反防范歧视的法律。
11.身份被盗窃的受害人会因评分而在市场机会或能力上受到严重伤害,然而却没有任何办法追偿,其他消费者也可能因评分受到不公正对待而求助无门。
12.根据联邦或地方法律规定,消费者有权查看或纠正自己的信用报告信息,但这不意味着消费者能够看到影响自己消费者评分的其他信息。秘密的评分不向消费者提供纠正其所用信息的权力。
研究报告的主要推荐意见包括:
1.拒绝秘密评分。开发或使用评分的人必须将评分的名称、使用目的、分数区间、分数区间的含义公诸于众。消费者评分所使用的信息要素以及信息的性质和来源也应该公开。2.消费者评分的创建者应该公开说明评分的目的、组成和使用,使自身处于《联邦贸易署法案》第五条的管辖之下(该法案第五条禁止不公平或欺骗性的商业实践)。3.任何被评分的消费者都应有权看到分数,并有权要求纠正自己的分数或分数计算所使用的信息。4.就如法律对免费信用报告所作的规定那样,消费者应该能够免费获取自己的各种消费者评分。5.消费者评分的创建者和使用者必须能够展示评分遵从法律规定、不会且不能以歧视的方式使用。6.评分的创建者和使用者只能使用以公平、合法手段采集的信息。消费者评分中使用的信息必须在合理程度上做到准确、完整和及时更新。7.当消费者因评分的使用在雇用、信贷、保险及其他重要的市场机会方面受到不利影响时,评分使用者必须明确告知其分数值、分数的使用方式、哪里可以找到更多有关该评分的信息以及消费者怎样行使自己应有的权力。8.评分创建者在方法论方面拥有某些法律赋予的保密权力,但不可超越对于遵从法律标准、保护消费者隐私以及维护程序正义的要求。要在公平原则上使评分使用者和被评分人的利益保持均衡。9.政府监管部门应该加强对消费者评分,特别是数据采集的监督。监管部门应该建立(或要求行业建立)强制性的消费者评分注册机制。10.监管部门应调查健康信息在消费者评分中的应用并提出监管立法建议。11.监管部门应调查统计评分方法的使用,并扩大有关这些方法的保密性和合法性的公众辩论。12.金融消保局应检验消费者评分以金融为目的(包括身份验证)的应用合法性,特别关注风险评分规避法律监管的应用和欺诈评分的滥用,必要时应修法以填补法律上存在的漏洞。13.金融消保局应调查消费者评分的销售,使消费者不致购买并非实际使用的分数。14.金融消保局等监管机构应调研创建金融决策、反欺诈、身份验证等消费者评分所使用数据的质量,特别要关注社交媒体数据使用于这些评分的情况。15.任何政府机构,特别是执法部门在使用消费者评分之前,必须完整披露信息、召开听证会并充分进行公众辩论。政府没有商业利益需要保护,故使用的评分必须有最高的透明度和信息公平实践,不应使用任何透明度不足或公平信息实践上存在问题的商用消费者评分。16. 由于消费者评分数据不准确,身份诈骗的受害者特别容易受到进一步伤害,监管部门应该加强研究并帮助受害者。17.消费者应该广泛使用法律允许的“不参与”机制减少信息流量,从而减少消费者评分滥用信息的可能性。
后面的话
迪克森和盖尔曼的《报告》可被认为是学术圈中第一篇专门研究消费者评分的文章,有开创性意义。文章的主要贡献在于作者对美国消费者评分现状的调查相当详尽。笔者也注意到两位作者均来自法律界,对评分技术层面的阐述虽堪称合格,但不能算非常专业,相关材料的组织也略显散乱。
①报告英文名为:The Scoring of America:How Secret Consumer Scores Threaten Your Privacy and Your Future,作者:Pam Dixon and Robert Gellman。
微博认证号:征信宝
征信宝网站:zhengxinbao.com
微信公众号:征信宝