文 / 交通银行软件开发中心 李佳蒙
建设背景
1.银行零售业务的重要性
招商银行原行长马蔚华曾提出“银行不做对公,今天没饭吃。不做零售,明天没饭吃”,这句话成为银行业广为流传的名言,彼时话中的“明天”,随着银行零售业务重要性提升,已成为当下。银行零售业务重要性提升,可从以下三个方面分析。第一,从收益角度分析,银行的零售业务主要服务广大储蓄居民,受经济周期影响小,相对稳定;从资金来源分析,零售储蓄业务的客户来源广泛,导致风险分散,在经济下行的市场背景下,贷款利率下降,零售业务是更优质的选择。第二,相比以往银行依靠对公业务规模取胜的模式,在我国日益完善的金融市场发展下,企业有更多的融资渠道和来源,对银行贷款的依存度逐渐下降,发展零售业务,是银行业持续发展的优质可替代选择。第三,在零售市场上,微信、支付宝等支付工具,已经开始培养居民的线上消费信贷习惯,而经济下行的背景下,居民倾向于减少消费,进行投资理财,给银行的零售业务,提供更多客源。
2.数据分析与模型挖掘的应用
新冠肺炎这一世纪疫情,使线下金融服务需求下降,客户越来越倾向于线上交易,对网点的访问频率逐渐下降,银行业务离柜率已接近90%,呈现“金融业务无处不在,但绝不在银行”的局面。而银行面对这一场景变化事实,可以通过交易浏览监控埋点等技术手段,获取比柜台交易更多的客户行为信息和交易信息,沉淀更丰富的零售数据,为决策分析和客户营销提供数据支持。为了更高效地利用数据服务客户,银行需要把数据转化成一类真正对业务有价值输出的产物,然后在这些产物之上实现上层业务的应用。互联网运营方式的发展,使银行可以学习借鉴,通过挖掘银行现有积累的数据资产,用精准的营销策略,更高效地服务和挖掘客户价值,降低营销成本,提高营销命中率。
零售数据的应用场景
鉴于银行零售业务的重要性逐步提升,银行的金融科技应用和发展中,有越来越多的使用场景需要成熟的零售数据体系支撑。
应用场景一是服务于客户营销,银行的零售数据,尤其是消费侧的客户类数据,可协助业务人员筛选和定位目标客户,改善原有的粗放型运营方式,针对目标客户进行精细化运营,将客户群体,尤其是长尾客户切割成更细的颗粒度,比如睡眠客户、30日新开户等标签,通过短信、邮件、APP弹窗、海报机等渠道,采用利率折扣、发放贴金券等活动,用关怀、激励、唤醒等方式进行服务,对不同属性下的客户,进行差异化业务的精准营销,进而降低营销成本,提高营销活动的效率,挖掘客户的潜在价值。同时,可以给客户带来更优质的金融服务,降低客户投诉率,提升客户满意度。
应用场景二是业务决策的分析支撑,成熟的零售数据体系,可以提供海量高质的分析底层数据源。业务人员利用丰富的数据源,通过使用不同的分析工具,如基础的SQL和Python技术,成熟的SAS工具和BI工具,高阶的隐私计算工具、知识图谱、AI智能算法、自然语言处理工具,通过聚类组合、建模挖掘,反复探索从不同维度上进行分析,得到更全面更科学的数据依据,从而辅助决策和业务开展。
应用场景三是产品搭建,零售数据体系是很多数据产品系统的基础。比如客户营销平台、客户管理系统、积分系统、报表系统等,成熟的零售数据体系可以为这些系统的搭建提供底层的数据支持。
零售数据的常见问题
在各大银行的数据搭建体系中,随着数据仓库和数据中台的建设,零售业务数据已经有庞大的存量数据,但由于缺少整体规划和粗放的开发模式,存在以下几点问题(见图1),不能更好地应用于业务服务。
主要问题一是缺少体系化的顶层方案设计和整体建设,只是在业务发展中,随需随建的零散开发部分数据,不能整体统筹各业务部门的实际诉求,全局覆盖客户、产品运营的数据支撑,导致缺少统一的查询数据资产目录,无法支持业务人员开展模糊定位和数据查询,无法辅助业务人员高效利用既有数据。
主要问题二是现有零售数据的冗余重复开发多,在随需随建过程中,零贷、理财、消保等不同部门,根据不同的业务场景,会有相似的业务需求,如果业务部门之间没有共识,开发项目组缺少规划,会导致数据重复开发,数据表达形式不一致,造成数据跑批资源浪费、存储资源浪费,已有数据不能得到有效使用。
主要问题三是缺少生命周期管理,数据上线后,缺少对数据使用效果的监控,缺少数据产生的业务价值的评估,大量低效过期无用的数据,没有得到提纯和迭代,带来计算和存储资源浪费。同时,庞大的零售数据字段,会影响业务人员高效精准的寻找需要配置使用的数据,带来工作效率的降低。
主要问题四是口径定义不清晰、不一致,缺少数据标准和治理,同名的数据字段,存在多套不同的口径,算法和数据源都有差异,技术需要花大量时间查阅代码逐层排查,与业务人员沟通,才能避免数据误用。
零售数据标签体系设计
为解决以上银行零售数据的现存问题,首要方法是设计一套合理的零售数据体系,以标签化、颗粒度化的形式,形成一套高效高质的底层零售标签数据库,支撑应用场景。
1.维度设计
维度一是客户。零售银行金融服务中,核心关键是客户,零售标签体系建设最重要的维度也应该围绕客户。建设标签体系,是为了更好的服务客户,对客户的全生命周期进行管理,提升客户营销的精准度。以银行客户为建设核心,常见的标签分类有风险管理、服务信息、接触行为反馈、模型预测、社交信息、属性信息、营销信息、账务信息、资产负债、贡献度信息等维度,维度的分类太少不能覆盖客户的全部场景,太多则容易导致业务人员筛选定位难,所以合理的标签分类是标签体系设计的关键。不同客户标签分类下,则是具体的颗粒度标签,一个标签代表着客户的一类属性。
维度二则是传统的营销重心——产品。以银行零售产品为维度的标签,则主要集中在产品的分类上,如保险、财管、存款、基金、理财等产品,可以以这些银行产品为维度,对产品明细信息、账务特征、专属销售信息、目标客群定制等设计产品明细标签体系。
客户与产品两个维度的标签,可以进行多次拼接选取,以尽量小的计算存储资源,满足业务多样化的数据需求。对标签池的分类和定义,可以从完整度、重合度、准确性三个维度,进行衡量,确保现有标签可以满足业务使用和支撑业务发展,同时尽可能降低重合度,做好多口径管理,在开发中才能更好地提升标签数据质量的准确性。
2.分类设计
根据传统数据体系中,标签的统计分类方法,可从以下四个方面设计银行零售业务的标签体系。
一是统计类标签,作为标签体系中最基础的标签,主要通过对客户的基础数据进行统计分析得出,比如客户的手机端访问次数、购买基金的行为,客户的基础信息,客户的存贷情况。统计类标签不需要复杂的加工逻辑,只是简单的提炼计算。
二是规则类标签,规则类标签是需要在业务实际场景中的明确口径,比如睡眠客户的定义,根据业务发展的需要,可将六个月或者十二个月没有存贷记录的客户,定义为需要唤醒的睡眠户;比如爱基金客户,可以统计在一周内几次浏览手机端基金类产品,可通过手机埋点实现。这些规则都可以根据业务的实际需求和发展场景,快速进行调整。在标签建设过程中,尽量使用简单的复合逻辑,进行规则计算,实现客户和产品的归类汇总。
三是模型预测类标签,是根据数学模型,对现有高质量的数据进行挖掘分类预测,比如通过K-means函数、关联规则、聚类模型等机器学习和算法,对客户的数据进行建模分析,对客户的资产流失、产品推荐、相应偏好等作出预测,提供更有针对性的营销和高效的服务。
四是摘要类标签,主要是对客户的地址和消费等文本信息进行提取和聚类,在标签开发过程中,可以使用词频统计、词性识别、文本分类等文本挖掘和自然语言处理技术,提炼客户的一些重点信息,比如他行高端客户、常见消费场景等。
以上标签体系的分类,主要是对开发过程的技术手段和实现方法来进行划分,在实际标签体系建设中,更多的需要从业务使用场景,利用现有技术,来推进营销和分析的高效服务。
标签体系的生命周期管理
从零售业务全局设计好整个零售业务标签体系,确定标签的分类开发方法,接下来是在开发管理过程中,实现整个标签数据的生命周期管理(见图2),提升标签的数据质量,带来更高的业务价值。
1.业务设计
零售标签在开发之初,需要建立对应的管理资产库,提前做好数据资产治理,确认标签的标签管理信息,建议分为以下几个信息块。一是标签的业务信息,如标签的名称、业务口径、管理部门、提出人等;二是标签的技术信息,如标签的技术口径、所在库表字段名、加工处理的代码脚本名、血缘关系等;三是标签的管理信息,如标签的状态、投产的版本、使用的权限等;四是标签的历史更新版本记录等。通过建立标签数据库,支持整个标签数据的有序管理和高效查询使用。
2.开发上线
银行零售标签数据在开发过程中,一般是由数据仓库或者数据中台,承接整个开发建设体系。第一步是从业务系统,获取交易源数据和客户埋点日志信息,在数据模型层进行数据治理,根据业务主题整合各源系统业务数据。第二步是在零售数据集市中,进行业务数据的开发。开发测试过程中,需要对标签的质量进行重点关注,一是标签的空值率,尽量提高标签的有值率,空值分布较多的标签在实际使用过程中,不能更精准地定义客户的属性,标签质量不高。二是要关注标签的异常极端值,做好极端值的清洗和监控,尤其是数值类标签的阈值管理。三是做好主键唯一性管理,避免数据重复,方便下游系统进行数据的二次拼接和使用。四是做好标签数据的血缘管理,上游数据质量波动,能有机制通知传递到下游系统;上游源数据下线,能够快速定位到对标签口径的影响;尽可能减少标签加工的长链路,降低数据代码脚本的耦合性。
3.效果评估
高质量的标签库,需要对标签的使用效果做好管理,建议从以下三个方面进行收集。一是通过对营销成果进行统计收集,评估零售标签的价值,如使用标签进行营销推广后,客户的短信退订与回复率;对产品销售预测类标签,可以根据标签营销后客户的购买模型评估标签的实际价值。二是在业务人员自主决策分析时,监控标签的空值率极端值等信息。三是监控标签的复用率和使用频次,对于多场景多系统引用的标签,更应做好标签质量监控和血缘管理。
4.更新使用
标签上线后,要形成良性的生命周期管理,最重要的是现有标签体系的优化和更新。为了避免标签随意增加导致的资源浪费,应优先遵循先利旧再新建的原则,优先考虑在原有标签的基础上做优化迭代,减少标签的重合度,也避免同类型标签的冗余。在标签更新过程中,更要定义好更新规则,比如更新频率、更新维度等,一是方便开发人员的工作排期,二是可以协助业务人员明确标签的使用规则。
5.清理下线
为了避免随着业务的发展,标签数量不断增加,标签体系越来越臃肿,出现大量无效标签或高重合度标签,要定期对标签进行效果评估反馈。通过标签的效果评估,以及对标签的定期分析反馈,对于使用评次低或者无使用的标签,可以设置策略,暂停更新,避免对系统存储和计算资源造成浪费,也提高标签的使用效率,减少业务人员在庞大的标签体系中的搜寻定位。对于长期不使用的标签,或者已经落后于业务场景的标签,经过审慎的分析,应发起下线流程,对标签库定期进行清理瘦身。
总结与展望
零售金融和服务是现阶段银行提升利润的兵家必争之地,也是银行提升服务质量和水准的重要业务领域。一套科学合理的零售标签体系,不仅能够更好地服务决策者,为决策者提供一份更完备的数据图谱,清晰地展示零售客户和产品的脉络和发展趋势,从而作出更科学的决策。还能提升零售营销的质量,更好地服务一线营销人员,展开更精准的营销,降低营业成本。
(此文刊发于《金融电子化》2024年1月上半月刊)
热门跟贴