国内互联网应用非常发达,日常生活的方方面面都可以在手机上完成,便捷程度可以说是世界领先,但是作为程序员,我们非常清楚,这个繁荣的互联网大厦的根基并不稳定,因为它是建立在国外的芯片、操作系统、编译器、数据库、开发工具等基础之上。
这几年,某些国家主动挑起贸易和科技摩擦,试图打压中国的和平发展。互联网大厦的根基,自然成为重点的打击对象。
所以中国必须要实现自主可控,“信创“就是在这种背景下被提了出来。
从产业链角度看,“信创“包括四个部分:基础硬件、基础软件、应用软件、信息安全。其中,CPU、操作系统、数据库、中间件是最重要的产业链环节。
信创的发展政策是2+8+N ,“2”是指党政,是信创产业发展的首要领域,“8”是金融、电力、电信、石油、交通、教育、医疗、航空航天等关于国计民生的八大行业,也是信创产业发展的重点行业。
如果观察下数据库领域的话,党政领域的数据库国产替代率高达80%,基本处于替换的尾声阶段,其他领域还比较低。以金融业为例,银行核心系统的国产数据库替代率15%左右;证券和保险核心系统的国产数据库替代率不超过20%。
01
为什么国产化替代这么难?
应用程序可以随着技术的发展不断变化,但是程序运行依赖的数据非常稳定。
尤其是金融业,国家网络安全和金融监管部门对金融行业有着严格的合规性要求,
它的核心数据经过几十年的沉淀,是非常宝贵的财富,数据库的迁移一旦出错,损失难以估量,所以没有人敢轻易动它。
就拿使用广泛的Oracle来说,要想平滑地替换它,必须要兼容它的SQL语法,存储过程语法,用户自定义函数,数据类型,安全加密….. 这还不算,还得考虑衍生工具和中间件。
也就是说,新数据库必须得实现语法、语义、高级特性和生态的高度兼容,稳定性、性能、可靠性也经受住了真正的考验,用户才敢动手迁移,这是非常难的事情。
之前靠堆人力、堆机器的方法来实现替换,在今天完全不适用,强安全、稳保障、全兼容、零修改、高抗压、高可用是金融行业的生命线,特别是在大压力场景下,性能和可用性必须全面对标国际标杆。
另外一方面,现在大数据、云计算、AI+时代,出现了新需求、新场景、新模式,金融行业也需要做创新,对数据多样性,数据处理的新鲜度和融合性也提出了更高的要求,想要做国产化替代,还得满足金融业的新需求。
02
谁能实现核心场景1:1平替?
虽然国产化替代很难,但国内有一家企业,却成功实现了核心场景的1:1平替,这就是崖山数据库。
崖山数据库提出了一个更经济、更普适的规模化替代方案,替换过程中可以实现“三个不变,两个对等,一个更优”。
“三个不变“指的是架构、应用、运维不变。在架构层面实现和国际标杆Oracle的完全对等,应用层面无需做额外改造,运维层面可直接复用原有数据库产品的生态和技术。“两个对等”即“性能和可用可靠性对等”;“一个更优”即“安全性更优”。
基于这样的替代方案,相对于应用系统重构典型业务场景,崖山1:1平替方案可以实现更低的基础设施成本和人力成本,提供更经济、更普适的规模化替换路径。
在金融行业,核心系统的数据库都是共享集群,即单库多实例的系统,用户连接任意实例都可以访问同一个数据库,具备透明多写、高可用、高性能等特性。共享集群技术因其开发难度高,一直被国外垄断,也被称为数据库领域的“塔尖”技术。
崖山数据库也攻破了这个核心技术,最近发布的共享集群V23.3更是进一步提升了高并发事务处理能力,集群规模和优化能力,集群4节点TPCC已经达520万tpmC(每分钟处理交易量),而且全国产环境下,TPCC测试性能已达到非国产环境下Oracle的同等水平!
03
为什么是崖山数据库?
可能有些人会好奇,崖山为什么能在短短几年里从零做出一款全自研的数据库,还能突破共享集群这样的塔尖技术?
答案很简单:主要在于人,在于团队。
崖山数据库最大的竞争力就是有着一只不可复制的团队,有非常优秀,天才横溢的青年科学家,也聚集了中国非常难得的、坚持坐十年冷板凳的数据库内核工匠。
樊文飞院士是崖山数据库的带头人,也是数据库领域历史上仅有的两个“大满贯”学者之一。他提出的有界计算理论(bounded evaluation)和数据驱动的近似计算(data-driven approximation)理论横扫计算机理论和系统大奖。
崖山团队成员中有超过30位来自北大、清华等全球知名学府的博士研究生,以及超50位拥有十年以上数据库内核开发经验的专业人才。整个团队达300余人规模,其中20%人才毕业于世界排名前100的名校,实力非常强悍。
崖山一直坚持全自研路线,践行长期主义,一开始就选择了最难的路:从第一行代码开始写起,完全自研。
深度掌握了数据库的底层架构,就进入了“自由的王国”,可以“为所欲为”,既可以在数据库中实现自己创新的理论,还可以压榨出极致的性能。
比如事务处理,业界主要的事务处理有 MVCC(多版本并发控制)、OCC(又名乐观锁)和 PCC(又名悲观锁)。崖山数据库则实现了樊文飞院士提出的并发事务调度方式,结合了 MVCC 和 OCC 的优势,使得在高并发场景下,系统不受核数改变的影响,而且整体成本可控。
崖山团队不仅实现了传统数据库的功能,还把先进的数据库理论(例如有界计算、跨模融合、异步自适应并行处理AAP等)带入了崖山数据库当中,应对大数据和AI时代带来的新挑战,成功实现弯道超车。
04
总结
“三个不变、两个对等、一个更优”,崖山数据库面向金融核心实现了1:1平替,在保证平稳替换的前提下,实现更低的基础设施成本和人力成本,进而实现业务价值创新。
崖山数据库依靠原创的基础理论,根技术的突破以及系统工程能力的持续积累,实现了“三位一体”全方位突破,这也是他们对标国际巨头的最大底气。
崖山团队很有信心,他们在官网开放了V23全面版本的下载,主备共享集群、分布式能力完全毫无保留,没有任何限制也没有任何门槛,连注册都不用,可以直接下载。你拿到的版本和在用户场景使用的企业级版本没有任何区别,表现出了十足的诚意。
热门跟贴