30天逾期和90天逾期,对银行来说是完全不同的信号。前者可能只是临时周转问题,后者往往意味着借款人已陷入实质性财务困境。问题在于:等逾期发生再行动,往往已经晚了。

这就是早期预警系统的价值——在贷款变成坏账之前识别风险,给机构留出调整条款、联系客户或启动内部审查的时间窗口。从组合层面看,逾期预测还关系到整体稳定性和监管对信用风险管理的要求。

打开网易新闻 查看精彩图片

一个典型的预警系统可以简化为 pipeline:借款人和还款数据输入预测模型,模型输出风险信号,机构决定是否干预。传统规则系统能标记明显问题,比如连续 missed payment 或信用额度使用率骤升,但这些方法本质是向后看的,容易错过硬逾期事件出现前的早期信号。

时间序列建模正是为了解决这个问题。逾期很少是孤立事件,通常通过恶化的还款模式、攀升的额度使用率或不稳定的还款行为逐步累积。使用随时间变化的协变量的模型,能够捕捉这种演变,而非把每个借款人当作静态快照处理。

UCI 信用卡违约数据集的结构很说明问题:它包含 3 万个样本和 23 个特征,涵盖多月还款状态、账单金额和往期还款金额,时间顺序一目了然。一个简单例子就能说明思路:如果借款人连续数月还款额下降,同时额度使用率上升,这个模式比单次 missed payment 更具信息量。

规则系统 vs 预测模型,本质上是"阈值触发"与"模式识别"的区别。前者快、简单、易落地;后者能捕捉更微妙的累积信号。现实中的风控架构往往是两者叠加——规则守住底线,模型提前嗅探。