当前位置: 首页 > news >正文

【金融风控】相关业务介绍及代码详解

金融风控相关业务介绍

【了解】项目整体介绍

1.风控业务和风控报表</span>
零售金融产品
相关的指标
风控建模流程
​
#2.特征工程
特征构造
特征筛选
​
3.评分卡模型构建
逻辑回归
集成学习 XGBoost LightGBM
模型评估
​
#4.样本不均衡问题/异常点检测

【了解】今日内容介绍

  • 知道常见信贷风险

  • 知道机器学习风控模型的优势

  • 知道信贷领域常用术语含义

  • 了解风控业务报表(SQL)

【理解】信贷&风控介绍

  • 信贷业务,就是贷款业务,是商业银行和互联网金融公司最重要的资产业务和主要赢利手段

    • 通过放款收回本金和利息,扣除成本后获得利润。

    • 贷款平台预测有信贷需求用户的还款情况,然后将本金借贷给还款概率大的用户

  • 信贷业务中的风险控制

    • 信贷业务中,使用信用来预支金钱,在小额贷业务中往往没有抵押物,那么贷款方就会承担一定风险(用户不还钱)

    • 风控就是对用户的信用风险进行管理与规避,对于预测信用较差的人,不向其放款,即便放款,也会是较小的贷款额度和较高的利率

    • 信贷领域有两类风险

      • 信用风险:借款人的的还款能力和还款意愿在贷款后出现问题的风险

      • 欺诈风险:借款人压根没想还钱,以诈骗为目的

    • 风控业务主要针对这两类风险

      • 信用评分系统:针对信用风险

      • 反欺诈系统:针对欺诈风险

    • 基于机器学习的人工智能风控模型对比传统人工审批

      • 人工审批:效率低,对人员业务能力要求高,不适合金融零售业务场景

      • 机器学习模型:批量,迅速,准确,同时处理大量贷款请求(几万,几十万,上百万/天)

申请中信信用卡的经验:

A,信用好,有征信纪录,没有预期,违约等,没有太多的申请纪录和拒绝的纪录,结果秒批。

B,信用很差,征信记录上有逾期,有其他网贷纪录,没有安全还款,结果秒拒。

C,信用好,但是他有很多网贷纪录,同时网贷纪录也保持按期还款,纪录良好,结果是人工打电话过来,审核通过。

综上,目前银行/互金公司,一般如上两种情况都有。

【理解】常见信贷产品及常见风险介绍

  • 信贷产品介绍

    个人信贷产品
    大额借贷房贷车贷
    小微企业贷
    小额借贷消费贷蚂蚁花呗,京东白条
    现金贷蚂蚁借呗,京东金条,微粒贷,各类网贷
    数据服务信用分服务芝麻信用分,京东小白分
    信用数据服务同盾数据,百融,集奥,大峰...
    • 现金贷

    申请借款->放款给客户->客户还款

    额度500~3000
    利率24%~36%
    期限714,30天
    放款形式借给现金,不限场景
    可选功能订单展期
    现金贷产品年化利率现金贷产品年化利率
    苏宁金融24%国美易卡34%
    蚂蚁借呗24%马上消费35%
    微粒贷24%招联金融36%
    有钱花24%桔子分期36%
    京东金条24%拍拍贷36%
    360借条24%趣店36%
    小米金融24%捷信36%
    美团生活费24%宜人贷44%
    分期乐24%玖富50%
    • 消费贷

    信用卡,花呗,白条等产品,备用金(500),有账单日,还款日

信用卡/花呗:假设账单日为每个月1号。出账单的日子。

还款日:15号是还款日。还款的日子。

13日还款,提前还款。

申请消费贷 -> 额度授信->客户使用消费贷消费

额度1000~10000
利率24%
账期30天
放款形式指定消费场景
可选功能最低还款,账单展期,账单分期,停息挂账,临时额度,备用金
  • 产品类型

    • 单期产品

    • 多期产品

    • 循环额度产品

  • 还款方式

    • 砍头息:短期产品(服务费)

    • 等额本金

      • 10w,10个月,每个月1w,1w+10w的利息,1w+9w的利息

      • 每个月还款额度依次递减

    • 等额本息

      • 利息多,本金少

      • 每个月还款是一样的,整个贷款利息要比等额本金多一些

  • 信贷领域风险类别

    • 信用风险:借款人的的还款能力和还款意愿在贷款后出现问题的风险

    • 欺诈风险:借款人压根没想还钱,以诈骗为目的

  • 常见风险形式

    • 冒名顶替,黑产骗贷

    • 多头借贷,借新还旧

      • 客户:工行信用卡,招商信用卡... n张信用卡,网贷平台1,网贷平台2,网贷平台n

      • 用新借来的钱还已有的负债: 负债变多 -> 需新借更多 -> 设法提额 -> 信用资质不够 -> 出现流动性风险 -> 逾期

      • 特点:第三方数据:多头申请记录

        APP安装:大量借款类APP

        短信:大量申请短信,提醒还款,催收短信

    • POS机套现,以少换多

      • 购买有支付牌照机构的POS机进行套现,手续费0.6%

    • 针对风控模型,制作数据

      • 使用花呗在天猫购物,对花呗账单做分期

      • 买入存金宝,一个礼拜后追加存金宝资金

      • 购买***元基金

      • 保持余额宝XXX元不动,余额宝累计收益做到 XX元

      • 购买XXXX保险

【理解】风控相关术语介绍

术语解释
DPDDay past due 逾期天数 DPD0为到期当日,DPD1为逾期一日,DPD7为逾期一周
FPDFirst time past due 首次逾期天数
F/S/T/QPD首次 二次 三次 四次 逾期天数
M1逾期 [1, 30)天 M 是英文“Months”的首写字母
M1+逾期[30, inf]天
default坏账
delinquency拖欠
flow rate流动率 一般指M1向M2,M2向M3转移的比例
bad rate坏账率 当月不良资产数/总资产数
vintage账龄分析

【实现】风控业务案例

案例背景介绍

  • 通过对业务数据分析了解信贷业务状况

  • 数据集说明

    • 从开源数据改造而来,基本反映真实业务数据

    • 销售,客服可以忽略

    • 账单周期,放款日期

    • 账单金额-实收金额 = 未收金额

    • 应付日期为还款时间

    • 账期分成两种:60天和90天

    • 实际到账日为空白,说明没还钱

  • 通过对贷后业务数据的分析要分析出如下内容

    • 每个季度账单金额和坏账率(逾期90天以上)

      • 所有未收金额/所有账单金额

      • 未收金额 = 账单金额-实收金额

    • 每个季度60天账期的入催率,90天账单的入催率

      • 入催率 = 入催金额/账单金额

    • 历史逾期天数的回款情况(回收账单数)

      • 历史逾期天数:历史有逾期,但是相对现在来说,钱已经还完了

      • 当前逾期天数:现在还欠着钱,也就是说钱没还完

代码实现

  • 加载数据

import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
df1 = pd.read_excel('../data/业务数据.xlsx') 
#要使用原始数据构建新指标,所以保留原始数据,copy新的数据,在新的数据中创建新指标
df2 = df1.copy()
df2.head()

显示结果

销售账单状态账单周期账单金额开票金额实收金额未收金额预计付款日应付日期商务催收日期账期实际到账日开票日期客服
0s101未确认2019-0529805.0NaNNaNNaN2019-07-312019-07-312019-08-1560NaNNaNa201
1s102未确认2019-051572.6NaNNaNNaN2019-07-312019-07-312019-08-1560NaNNaNa202
2s103已确认2019-04487551.2487551.2NaN487551.22019-06-302019-06-302019-07-1560NaN05-16a203
3s104已确认2019-04378835.0378835.0NaN378835.02019-07-312019-07-312019-08-1590NaN05-08a204
4s105已确认2019-04326866.0326866.0NaN326866.02019-07-312019-07-312019-08-1590NaN05-10a205
  • 查看数据基本情况

df2.info()

显示结果

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5257 entries, 0 to 5256
Data columns (total 14 columns):#   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  0   销售      5257 non-null   object 1   账单状态    5257 non-null   object 2   账单周期    5257 non-null   object 3   账单金额    5257 non-null   float644   开票金额    5010 non-null   float645   实收金额    4470 non-null   float646   未收金额    5010 non-null   float647   预计付款日   5256 non-null   object 8   应付日期    5257 non-null   object 9   商务催收日期  5257 non-null   object 10  账期      5257 non-null   int64  11  实际到账日   4387 non-null   object 12  开票日期    4996 non-null   object 13  客服      5257 non-null   object 
dtypes: float64(4), int64(1), object(9)
memory usage: 575.1+ KB

df2.describe()

显示结果

账单金额开票金额实收金额未收金额账期
count5.257000e+035.010000e+034.470000e+035.010000e+035257.000000
mean4.073241e+044.096896e+044.082419e+044.684636e+0364.539661
std8.176172e+048.007245e+047.970628e+042.888464e+0415.622765
min0.000000e+002.500000e+010.000000e+000.000000e+000.000000
25%5.103000e+035.300000e+035.112250e+030.000000e+0060.000000
50%1.436500e+041.486560e+041.434000e+040.000000e+0060.000000
75%4.178000e+044.220250e+044.170750e+040.000000e+0075.000000
max1.508796e+061.356215e+061.301665e+061.277098e+0690.000000
  • 数据处理,填充缺失值,将日期时间类型转换成datetime类型

# 获取最大的日期,作为当前时间
today_time = pd.to_datetime(df2.实际到账日.fillna('0').max())#给缺失值填充0
df2['实收金额'] = df2.实收金额.fillna(0)
df2['开票金额'] = df2.开票金额.fillna(0)
df2['未收金额'] = df2.未收金额.fillna(0)#把时间类型转换为datetime类型
df2['账单周期'] = pd.to_datetime(df2.账单周期)
df2['应付日期'] = pd.to_datetime(df2.应付日期)df2['实际到账日'] = pd.to_datetime(df2.实际到账日).fillna(today_time)
  • 为了后续计算,在原始数据基础上构造新的字段:是否到期,是否到期90天,未收金额2(校验原始数据中的未收金额),历史逾期天数,当前逾期天数

df2['是否到期'] = df2.apply(lambda x : 0 if x.应付日期 > today_time else 1,axis=1)#map可以看做是apply,效果类似
df2['是否到期90天'] =  ( today_time - df2.应付日期 ).map(lambda x : 1 if x.days >= 90 else 0)df2['未收金额2'] =  (df2.账单金额 - df2.实收金额)df2['历史逾期天数'] = df2.apply(lambda x : (x.实际到账日 -  x.应付日期).days if x.未收金额2 == 0  else  (today_time - x.应付日期).days,axis=1)df2['当前逾期天数'] = df2.apply(lambda x : (x.历史逾期天数) if x.未收金额2 > 0  else 0 ,axis = 1)
  • 查询实际到账日期字段得知当前最近的到账日为2019年5月17日,如果以2019年5月17日为观察点,有些贷款还没到还款日,没法统计DPD90的数据,所以,这里只统计2019年之前的情况,下面将对应时间段的数据取出

df3 =df2.copy()
#创建’账单季度‘字段,将日期转换成季度,to_period函数可以转换为季度信息
df3['账单季度'] = df3['账单周期'].map(lambda x : x.to_period('Q'))
#提取2017年3季度到2018年4季度数据
df3 = df3[(df3['账单季度']<='2018Q4') & (df3['账单季度']>='2017Q3')]
df3.shape

显示结果

(3856, 20)
  • 按照季度统计账单金额,到期金额,和逾期金额

#账单金额
fn1 = df3.groupby('账单季度')[['账单金额']].sum()
fn1.columns = ['账单金额']
fn1

显示结果

账单金额
账单季度
2017Q38247952.62
2017Q411643604.99
2018Q117149674.79
2018Q231097661.29
2018Q338292071.12
2018Q451963089.64
#90天到期金额
df4 = df3[(df3.是否到期90天 == 1)]
fn2 = df4.groupby('账单季度')[['账单金额']].sum()
fn2.columns = ['到期金额']
fn2

显示结果

到期金额
账单季度
2017Q38247952.62
2017Q411643604.99
2018Q117149674.79
2018Q231097661.29
2018Q338292071.12
2018Q428265677.59
#当前逾期90+金额
df4 = df3[(df3.是否到期90天 == 1)]
fn3 = df4.groupby('账单季度')[['未收金额2']].sum()
fn3.columns = ['当前逾期90+金额']
fn3

显示结果

当前逾期90+金额
账单季度
2017Q363883.0
2017Q457380.0
2018Q164283.0
2018Q2106930.0
2018Q3412920.1
2018Q4304183.0
  • 合并数据计算坏账率

dfs = [fn1,fn2,fn3]
final1 = pd.concat(dfs,axis=1)
final1

显示结果

账单金额到期金额当前逾期90+金额
账单季度
2017Q38247952.628247952.6263883.0
2017Q411643604.9911643604.9957380.0
2018Q117149674.7917149674.7964283.0
2018Q231097661.2931097661.29106930.0
2018Q338292071.1238292071.12412920.1
2018Q451963089.6428265677.59304183.0
final1['90+净坏账率'] = round(final1['当前逾期90+金额'] / final1.到期金额,3)
final1

显示结果

账单金额到期金额当前逾期90+金额90+净坏账率
账单季度
2017Q38247952.628247952.6263883.00.008
2017Q411643604.9911643604.9957380.00.005
2018Q117149674.7917149674.7964283.00.004
2018Q231097661.2931097661.29106930.00.003
2018Q338292071.1238292071.12412920.10.011
2018Q451963089.6428265677.59304183.00.011
  • pyecharts绘图

bar = (Bar().add_xaxis(list(final1.index.values.astype(str))).add_yaxis("账单金额",list(final1.账单金额),yaxis_index=0,color="#5793f3",).set_global_opts(title_opts=opts.TitleOpts(title="90+净坏账率"),).extend_axis(yaxis=opts.AxisOpts(name="90+净坏账率",type_="value",min_=0,max_=0.014,position="right",axisline_opts=opts.AxisLineOpts(linestyle_opts=opts.LineStyleOpts(color="#d14a61")),axislabel_opts=opts.LabelOpts(formatter="{value}"),))
)
line = (Line().add_xaxis(list(final1.index.values.astype(str))).add_yaxis("90+净坏账率",list(final1['90+净坏账率']),yaxis_index=1,color="#675bba",label_opts=opts.LabelOpts(is_show=False),)
)
bar.overlap(line).render()

显示结果

  • 计算每个季度的60天账单金额、60天入催金额,90天账单金额、90天入催金额

#60天账期的账单金额
df4 = df3[(df3.账期 == 60)]
fn1 = df4.groupby('账单季度')[['账单金额']].sum()
fn1.columns = ['60天账期的账单金额']
#60天账期的入催金额
df4 = df3[(df3.账期 == 60)]
fn2 = df4.groupby('账单季度')[['未收金额2']].sum()
fn2.columns = ['60天账期的入催金额']
#90天账期的账单金额
df4 = df3[(df3.账期 == 90)]
fn3 = df4.groupby('账单季度')[['账单金额']].sum()
fn3.columns = ['90天账期的账单金额']
#90天账期的入催金额
df4 = df3[(df3.账期 == 90)]
fn4 = df4.groupby('账单季度')[['未收金额2']].sum()
fn4.columns = ['90天账期的入催金额']
  • 计算入催率

dfs = [fn1,fn2,fn3,fn4]
final2 = pd.concat(dfs,axis=1)
# final2 = fn1.merge(fn2,on='账单季度').merge(fn3,on='账单季度',how='left').merge(fn4,on='账单季度')
final2['60天账期入催率'] = round(final2['60天账期的入催金额'] / final2['60天账期的账单金额'],3)
final2['90天账期入催率'] = round(final2['90天账期的入催金额']/final2['90天账期的账单金额'],3)
final2

显示结果

60天账期的账单金额60天账期的入催金额90天账期的账单金额90天账期的入催金额60天账期入催率90天账期入催率
账单季度
2017Q34854770.9436983.02769264.01900.00.0080.001
2017Q46737327.9952750.03921491.00.00.0080.000
2018Q112106356.7962460.04244304.0800.00.0050.000
2018Q219234086.8713590.08427775.00.00.0010.000
2018Q322830710.42380265.19835629.08235.00.0170.001
2018Q426337959.52584789.517706430.0325141.00.0220.018
  • pyecharts绘图

line = (Line().add_xaxis(list(final1.index.values.astype(str))).add_yaxis("60天账期入催率",list(final2['60天账期入催率']),yaxis_index=0,color="#675bba",label_opts=opts.LabelOpts(is_show=False),).set_global_opts(title_opts=opts.TitleOpts(title="不同账期入催率"),).add_xaxis(list(final1.index.values.astype(str))).add_yaxis("90天账期入催率",list(final2['90天账期入催率']),yaxis_index=0,color="#d14a61",label_opts=opts.LabelOpts(is_show=False),)
)
line.render()

显示结果

  • 历史逾期天数的回收情况(回收账单数)

df5 = df3[(df3.未收金额2 == 0)&(df3.是否到期 == 1)].copy()
#使用cut,讲数据按照逾期天数分箱,然后添加分箱之后结果标签
df5['历史逾期天数'] = pd.cut(df5['历史逾期天数'],bins=[-999,0,5,10,15,20,30,60,90,999],right=True,labels=['0','1-5','6-10','11-15','16-20','21-30','31-60','61-90','91+'])
final3 = df5.groupby('历史逾期天数')[['账期']].count()
final3.columns = ['回收账单数']
final3

显示结果

回收账单数
历史逾期天数
02400
1-5358
6-10235
11-15215
16-2092
21-30189
31-60156
61-9060
91+88
  • pyecharts绘图

ydata = final3['回收账单数'].values.tolist()
bar = (Bar().add_xaxis(list(final3.index.values.tolist())).add_yaxis("收回账单数",ydata,yaxis_index=0,color="#675bba").set_global_opts(title_opts=opts.TitleOpts(title="不同逾期天数的已收回账单数"),)
)
bar.render()

显示结果

业务解读

  • 从数据中看出,在2018年Q2季度之前,运营策略比较保守,坏账金额和入催率都比较低,

  • 2018年Q2之后,有可能是由于运营策略调整,给更多的人放贷,但坏账率和入催率均在3%一下,在合理范围内

  • 不同逾期天数收回账单的数据看,30天内能收回绝大部分账单

【理解】信贷业务涉及部门

市场:获客 (新客, 老客)

风控:把逾期率控制在合理范围,尽可能提高通过率

催收:回款(内催 , 外催)

小结

  • 知道常见信贷风险

    • 信用风险

    • 欺诈风险

  • 知道机器学习风控模型的优势

    • 批量,迅速,准确,同时处理大量贷款请求

    • 在零售信贷业务场景下,与人工审核相比优势显著

  • 知道信贷领域常用术语含义

    • DPD 逾期天数

    • FPD 首次逾期天数

    • bad rate 坏账率

    • M1 逾期一个月以内


http://www.mrgr.cn/news/67216.html

相关文章:

  • JAVA读取doc,docx转PDF通过vue展示
  • 【蚂蚁SQL面试题】蚂蚁数据研发一面面试题
  • 云服务器防火墙设置方法
  • C语言 流程控制语句
  • 设置JAVA以适配华为2288HV2服务器的KVM控制台
  • API网关 - JWT认证 ; 原理概述与具体实践样例
  • C/C++中指针
  • 流程与模式
  • 大模型LLama3!!!Ollama下载、部署和应用(保姆级详细教程)
  • python实战(七)——基于LangChain的RAG实践
  • ABAP开发:数据库表更新时机介绍
  • 数组和指针的复杂关系
  • STL整理
  • 终端文件管理神器 !!!
  • 电商行业企业员工培训的在线知识库构建
  • 宏转录组组装:rnaSPAdes
  • 论文速读:动态再训练-更新用于无源目标检测的Mean Teacher(ECCV2024)
  • 代码随想录第二十二天
  • Golang--面向对象
  • 【c++丨STL】vector的使用
  • 问题排查:C++ exception with description “getrandom“ thrown in the test body
  • 揭秘2024年最火的5个科技趋势,你准备好迎接了吗?
  • 机器学习(四)——神经网络(神经元、感知机、BP神经网络、梯度下降、多层神经网络、Python源码)
  • ELF加载,进程地址空间与可执行程序的关系
  • C++转义序列
  • 【ETL:概念、流程与应用】