一直以来,金融行业的核心系统依旧还在沿用甲骨文或者IBM等国外巨头的数据库产品。但据观察,最近的情况似乎有了一些变化,我国金融业的核心系统已渐成全面升级之势。

据了解,在阿里云和OceanBase的助力下,某超大型保险(集团)公司已圆满实现最后一个规模高达20TB+核心数据库的全面迁移改造工作,可以说为金融业国产数据库全面迁移积累了弥足珍贵的经验。

打开网易新闻 查看精彩图片

金融业数据库迁移的前期准备

金融机构一方面要保证客户的信息和数据安全,另一方面要保证整个系统运行稳定,因此在数据库迁移之前应先做好数据库选型、基础设施准备、迁移策略制定三方面的工作。

数据库选型方面,虽然数据库产品众多,但该保险公司经过审慎的评估后,最终选择了 OceanBase、PolarDB 等三款产品作为先期试点验证。基础设施准备方面,本次国产数据库采用机架式服务器和本地存储全面替代进口小型机及传统SAN存储架构,以满足核心系统全量迁移的云原生分布式架构改造。

迁移策略制定方面,先平迁再做业务和架构改造升级,避免多个变量同时发生,影响业务的连续性。同时迁移批次以业务系统为粒度,从低负载到高负载,从外围到核心,用1年时间完成所有业务系统的数据库全量迁移改造。

打开网易新闻 查看精彩图片

金融业数据库迁移的中期实践

该保险公司核心虽然涉及系统众多,但总结下来主要分为:互联网核心和传统核心,中间通过类似ESB的总线机制实现异步解耦。

互联网核心迁移上,选择了和原有Oracle RAC架构更接近的PolarDB作为互联网核心数据库的替换,并于2020年9月,互联网核心首批应用模块迁移到 PolarDB,整个适配过程不到一个月。此后,互联网核心各个模块就开始了大规模地迁移。

2020年11月,PolarDB完成了最大的单库客户主数据迁移;2021年1月底,PolarDB作为互联网核心出单系统的数据库,稳定支撑起该保险公司2021年一季度业务冲刺。

在传统核心迁移上,该大型保险公司的传统核心系统历史悠久,既有1998年之前建成的,也有2004到2008年间建成的,时间跨度长,数据量异常庞大,单个数据库的数据规模甚至超过20TB,基于以上挑战,最终选择了分布式数据库OceanBase作为传统核心的替换。

整体迁移方法过程如下,从基础环境准备-迁移过程演练-正式割接-监控运维等四大环节进行逐项拆解,落实到人,精确到分,最后于2021年9月,完成传统老核心最后一个单体库迁移上线。

打开网易新闻 查看精彩图片

此外,在解决了所有技术难题,完成了所有核心数据库的迁移,经历了开门红大促的考验后,要完成一个保险公司一个完整的业务周期,只剩下最后一关,就是保险精算。

迁移到分布式数据库后,怎么保证在不停应用的情况下完成保险精算,是整个迁移过程的最后一个障碍。经过反复评估,阿里云为此制定了最佳方案,受益于OceanBase底层数据块的快速物理备份和表级的恢复能力。经过近1个月的压测验证,集群恢复速度达到 800MB/S,完全满足精算的备份恢复的时间要求。

打开网易新闻 查看精彩图片

金融业数据库迁移的最终成效

当然迁移过程并不是完全一帆风顺,虽然未产生重大生产事故,但过程中也出了几次故障:数据库连接打满多次触发高可用切换、SAN交换机故障导致数据库进入无主状态、执行计划跳变导致业务卡顿,好在项目组处理及时,没有给迁移带来意外影响。

历时一年,近100个业务系统终于全面实现国产数据库升级,成为首家完成100%核心业务系统国产数据库升级的大型金融企业,数据库OceanBase和PolarDB用量占比超过 97%。

通过数据库的全面替换,实现了对数据资产的全面安全保障能力,做到了100% 数据库技术栈的安全可控,摆脱对Oracle 数据库的依赖;摆脱对小型机和高端存储的依赖;促进云原生和分布式数据库应用成熟,从可用到好用并取得性能提升;数据库服务集中管控,显著降低硬件及整体运维成本;真正的实时扩缩容和高可用能力,轻松应对大促活动。

打开网易新闻 查看精彩图片

从这个数据库迁移案例来看,不仅证明了在金融业核心系统中,长期被国外所垄断商用数据库是可以被替换为国产分布式数据库,并且替换后带来更强劲的性能指标,更低廉的软硬件成本以及更符合中国人操作的用户习惯。

此外,对于OceanBase等国产数据库来说,这也是一个具有代表性的案例,未来可能会将该模式复制到其它金融业客户中。