经过大半年的风控实践,我们基本想明白了要怎么搭建风控系统,怎么构建防线,怎么主动出击。这个过程中,我们沉淀了很多经验,也留下了很多困惑,这些经验与困惑指引着严选风控下一步工作的方向,我趁此机会整理下这些零散的思考点,跟大家一起探讨。
这是我们在组建风控团队的时候考虑的问题,我们需要构建一个什么样的团队,团队的工作主要是什么?针对这个问题,不同的公司,不同的产品有不同的回答。有的公司会安排大量的风控业务审核人员冲在最前线(专家系统),他们依赖审核人员的经验和直觉来解决问题;而有的公司只有很少或者几乎没有这样的人工审核职位存在。不同的业务目标和组织文化会有不同的团队组成,这两者之间并没有优劣之分。
在严选,风控团队是一个精练的技术团队,我们把团队主要工作定位在依赖数据分析与算法,构建防线,研发新型武器,躲在实验室里跟敌人作战;我们并不希望组建一个大型军队,有大量士兵去人肉冲锋陷阵。对严选的情况而言,这两者的人力成本和维护复杂度都不在一个层面。
人思考问题,让机器处理问题。
严选风控模型一开始考虑的是构建一个统一的大模型(Universal Model), 包括了风控业务的方方面面,通过这个模型来回答所有有关用户行为风险的问题。有些公司,比如支付宝早期的策略也类似。One model fits all的方式有很多好处,比如维护的简单,回归方便,训练集构建方便,对外有统一的输出。但是渐渐的,我们发现这个模型的维护越来越复杂,当模型加入太多业务相关的特征时,特征间的正交性就越来越弱,不同业务之间的特征互相影响,从而导致模型的可靠性越来越差,牵一发而动全身。我们开始觉得这是一条不长久的路。我们重新设计了模型的结构,采用前文提到的类似护城河-城门方案。统一模型就是护城河,核心关注用户的核心指标,然后将场景相关的模型抽离出来,构建防护城墙。
风控在什么情况下使用规则,什么情况下使用AI模型?传统的风控方式经常使用专家判断+规则系统来实现风控系统。这种方式有许多的优点,比如可解释系强,简单直观,能快速响应业务变化,动态更新等。但缺陷也非常明显,规则很容易有漏洞,很容易被灰产攻破;换个角度说就是规则的效果很容易衰减。时间一长,系统不得不维护大量的规则来应对现实情况,而各个规则依赖的参数因子,规则的效果,规则的优先级都会指数增长。这样的系统不具有可持续性。完全依赖规则的风控容易演变成需要依赖大量业务审核人员来人工处理风险的状态。
我们在这个问题上的策略是充分结合规则与AI模型的优势,这也是大数据风控常见的策略。严选利用AI模型来分析与识别风险,利用规则系统根据模型的计算结果来拦截风险。这样的方式充分利用了规则系统贴近业务,快速灵活的优点;同时又避免规则容易快速衰退,维护复杂度容易指数级增长的缺陷。
关于接下来的工作,目前我们在考虑几个方面:1. 风控的策略管理 2. 算法模型的优化,如何更快的自动化发现新的异常行为特征?3. 风控除了拦截风险行为,还能做什么?
1. 今年严选风控系统主要关注的核心还是模型与规则。接下来我们需要更多的关注策略的层面规划。重新审视我们的风控业务,将其划分业务事前的风控策略,事中的风控策略,以及事后的风控策略。以更清晰直接的思路来切入业务。
2. 模型的下一步优化?局部化的风控模型主要依赖的是决策树算法,比如随机森林等,简单,快速,疗效好,但是局限性也比较明显。下一步模型研发的工作需要把关注点放的更远一些,需要能够回答以下几个问题:
a) 如何在挖掘出即将产生破坏的用户组合,这些即将干坏事的用户与正常用户在产生下单等行为之前,算法是否能够将其划分为两个关联性不大的子网络?2016年有一些会议论文有比较详细的讨论这个问题,京东等公司也在这方面做了比较多的工作,并且有比较好的成果。
b) 尝试使用非监督的方式?
c) 是否能使用全链路监控,从用户行为时序的角度,使用神经网络算法来识别异常行为?这部分我们已经在做研发。
3. 风控除了拦截风险行为,还能做什么?这部分我们思考的不是很多,思路也不是特别清晰,尚未体系化。目前,我们在做的是利用风控模型的信誉评分机制作为CRM分发不同类型优惠券的参考,以求达到更好的运营效果;利用风控信誉评分模型来优化用户在严选上的使用体验——比如做为急速退换货的参考,尽量避免让好的用户使用语音验证码,上行短信等这种体验伤害比较大又效果一般的验证方法。等等。
网易云新用户大礼包:https://www.163yun.com/gift
本文来自网易实践者社区,经作者陈炬授权发布。