在反欺诈场景中,知识图谱聚合各类数据源,逐步绘制出借款人的profile,从而针对性的识 别欺诈风险。以一个借款人举例,借款人可以有身份证号,手机号,学历等个人信息,属于 个人的属性信息;而借款人可以有担保人或是亲属好友,借款人与担保人之间在反欺诈场景中,知识图谱聚合各类数据源,逐步绘制出借款人的profile,从而针对性的识 别欺诈风险。以一个借款人举例,借款人可以有身份证号,手机号,学历等个人信息,属于 个人的属性信息;而借款人可以有担保人或是亲属好友,借款人与担保人之间的关系(也就 是边Edge)是被担保与担保的关系,借款人与其亲属好友之间的关系是父亲、母亲、同事、 同学等关系;借款人也具有住址,银行流水,工作单位等信息。这些信息可以来自于多个渠 道,例如可以由借款人自己填写,或是积累的历史数据,或是数据提供商提供,或是在互联 网上获得,甚至通过推理得到,往往具有冗余性;信息通过图的形式连结,展示出借款人的 profile。
识别数据造假
当融合来自不同数据源的信息构成知识图谱时,有一些实体会同时属于两个互斥的类别(例 如同时在两个不同的城市工作),或某个实体所对应的一个Property (同一个人的住址)对 应多个值,这样就会出现不一致性,这个不一致性即可判定为潜在的可疑点。
通过这种不一致性检测,我们利用绘制出的知识图谱可以识别潜在的欺诈风险。在P2P行业, 欺诈风险主要的骗术包括个人信息造假、工作单位虚假、代办包装、虚假联系人、组团骗贷 等。以识别数据造假为例,利用知识图谱我们可以通过借款人的身份信息PII(Personal Identify Information),例如手机号或是身份证号,直接索引到个人的全部信息,//////////并以此与借 款人的填写信息进行不一致性检测;也可以通过借款人的其他信息进行推理出其相关信息进 行验证,举一个例子,我们可以通过借款人的身份证号和姓名可以获得他的学历信息和年龄, 通过学历信息和年龄可以推算出其工作年限,再根据其所在城市,行业,职位,结合互联网 上的招聘网站数据推理出其薪水范围,进而验证他的收入水平;甚至可以通过不同借款人之 间的同事关系,验证其工作单位的真假。
组团欺诈和代办包装
除了对数据造假进行验证外,由于图结构带来的天然关联检索的特点,知识图谱可以识别潜 在的代办包装或是组团骗贷。我们利用征信公司提供的欺诈数据,拥有的代办包装公司数据, 互联网公开欺诈黑名单,行业黑名单联盟等数据开发大量的标签数据,对实体(包括公司和 人)贴上标签,例如逾期,虚假手机号,代办包装或是组团骗贷等标签,当借款人进行申请 贷款时,如果我们发现他和bad people/company/info具有较多的关联关系,那么这个人有 很大的可能是欺诈,从而识别出风险。
与搜索引擎的场景不同,知识图谱在反欺诈场景中具有较低的应用门槛,数据量较少时也可 以进行低程度的交叉验证,而随着数据量的积累和增多,知识图谱也会越来越完善,其反欺 诈能力也会越来越强。我们建立大数据反欺诈系统,在借款人提交借款申请开始即介入整个 风控流程,对接多个数据源以获取借款人的数据信息,在各个环节建立checkpoint,通过可 配置的规则引擎在各个checkpoint执行预定的逻辑,识别和防御欺诈风险。
反欺诈建模方案 来自淘豆网m.daumloan.com转载请标明出处.