上海银联防欺诈分析平台

案例概述

现在有多的人使用金融服务,也催生了很多欺诈交易,所谓的欺诈交易,是指涉嫌使用虚假身份获取银联卡,或冒用他人银联卡(或账户)获取商品或服务的欺骗性交易行为。SaCa RealRec数据科学平台通过大数据以及机器学习的方法建立一套有效的预测欺诈行为的体系,实现了欺诈源甄别的准确率超过90%,为个人以及团体的财产安全作出保障。

 

客户介绍

中国银联是指中国的银行卡联合组织,通过银联跨行交易清算系统,实现商业银行系统间的互联互通和资源共享,保证银行卡跨行、跨地区和跨境的使用。银联网络遍布中国城乡,并已延伸至亚洲、欧洲、美洲、大洋洲、非洲等境外150个国家和地区。

 

面临挑战

当欺诈性交易行为发生时,传统的欺诈性交易行为处理往往是在欺诈性交易已经发生,并且被误认为合法交易。当受害人发现时,追回的可能性很低,或是追回的成本被无限的提高了,这样对保护客户(个人以及企业集团)的利益是不利的。客户希望把潜在风险的交易查找出来,并且进行监控或是提示受害人,起到提早知晓、实时监控的目的。

 

解决方案

数据分析判定
数据分析判定分为两个步骤,即数据占比分析和关联分析。SaCa RealRec通过对数据占比分析可以得出高风险的交易占总体的百分之多少,并分析出哪些为合法交易,哪些为可疑交易。

然后,我们通过关联分析,进一步判定高风险的交易以及它与其他属性的关系。由于其他属性较多,可选取最可能的一些属性进行关联性分析。此次例子中,我们针对某银行高风险交易、高风险资金转移、大额资金转移、高风险的省份等属性进行分析。

如图所示,我们可以看到高风险的资金转移往往指向大额资金转移。由此,当有大额资金转移时,我们就要对资金转移流向、金额等方面进行预警和防范了。另外,我们还发现高风险交易与高风险省份关联关系也较为明显,可见地理位置对高风险交易的影响较大。

欺诈行为的预测
1. 通过第一步的数据分析判定,我们得到了特征向量。接下来我们通过提取的特征向量进行模型训练,并且进行预测评估。提取的特征向量包括大额转移标签,地理位置信息,资金转移分级,错误等级,非正常时间标签,IP地址信息等。

2. 我们选择高风险的交易作为目标列,使用逻辑回归算法对欺诈行为进行机器学习模型构建。逻辑回归算法是一般线性算法(GLM)的一种特例,在利用SaCa RealRec数据科学平台时,需要在GLM算法配置中选择Binomial的分布来实现逻辑回归对欺诈行为的分辨识别。由于数据集中涉及的维度较多,我们可以采用L2正则参数对算法进行配置调优,避免过拟合问题。

 

实施效果

通过使用SaCa RealRec产品对欺诈行为多维度数据进行分析挖掘,提取相关的特征,并利用上述特征通过机器学习算法进行数据建模,从而达到对欺诈交易进行预测的目的。通过使用银联的数据结合RealRec的工具,平台能够实现欺诈交易预测90%的准确率。

 

相关产品

2019-04-10T15:40:46+00:00