打开网易新闻 查看精彩图片

在 Gartner 发布的 2023 云数据库管理系统魔力象限报告中,亚马逊云科技连续第 9 年被评为领导者,并在“执行能力”维度处于最高位置。

我们认为,亚马逊云科技在云数据库领域全面领先的技术能力与市场布局是能够再次脱颖而出的关键。

打开网易新闻 查看精彩图片

图 1:适用于云数据库 管理系统的魔力象限

*该图形由 Gartner, Inc. 发布,作为更大的研究文档的一部分,应在整个文档的背景下进行评估。亚马逊云科技可应要求提供 Gartner 文档。

值得关注的是,报告预测:“到 2025 年,90% 的新数据和分析部署都将通过成熟的数据生态系统进行,从而促进数据和分析市场的整合。”同时,“到 2027 年,由业务部门领域领导者完成的 DBMS 采购占比将由 2022 年的 55% 上升至 75% 。”

云数据库领域的竞争已经不再集中在单点产品上的比拼与技术突破,而进入产品生态、服务能力与业务价值的全面竞争,客户在选择数据库系统时更加注重所能带来的业务价值。

全面、集成、受治理的数据战略

经过长期的持续投入,亚马逊云科技已构建起一套兼具宽度与深度的云端数据产品生态。

首先,提供性能卓越及品类丰富的产品选择,覆盖交易(OLTP)、分析(OLAP)、内存、缓存、键值、大数据、时序、图计算等各类数据场景;既发力自研 Amazon Aurora 及 Amazon Redshift 等明星产品,也提供 MySQL、PostgreSQL、Oracle、Hadoop 等业界主流的云端托管服务。

其次,亚马逊云科技还致力于实现各服务间的 Zero-ETL 数据集成,如 Amazon Redshift 与 Amazon Aurora 系列及 Amazon DynamoDB 的 Zero-ETL 整合,帮助用户降低自建数据管道的复杂度,使用户能自由地调度和使用在云端的数据资产。

同时,也提供 Amazon Lake Formation、Amazon DataZone 等数据治理服务,帮助用户应对错综复杂的安全、合规及数据治理挑战。

打开网易新闻 查看精彩图片

全面拥抱 Serverless

在技术创新方面,亚马逊云科技持续推动数据服务的全面 Serverless,以不断降低用户对数据库底层基础设施的参与,解放用户生产力。

亚马逊云科技于 2012 年推出的非关系型数据库 Amazon DynamoDB,可被看作 Serverless 数据库的开山鼻祖,用户无需对基础设施进行任何操作,便可自动应对不断提升的性能与存储需求。针对关系型数据库的 Serverless,技术复杂度更高,可谓数据库技术的天花板。在实现关系型数据库的 Serverless 过程中,亚马逊云科技通过三项关键的技术创新,经历三个阶段的产品迭代,以 Serverless 的方式全面实现了数据存储与计算的自动水平扩展。

Grover:

存算分离,实现数据存储的 Serverless

Amazon Aurora 提供完全兼容 PostgreSQL 及 MySQL 的关系型数据库,并在此基础上进行了大量创新。其中,内部被称为 Grover 的存储服务,将存储从数据库中分离,实现计算节点和存储节点的分离。Grover 拥有并维护数据库的核心数据资产 log,使其作为中间层,实现对数据库 I/O 响应和数据落盘策略的优化。Amazon Aurora 降低了超 80% 的 I/O 请求,大幅提升了服务性价比。同时,Grover 会将 log 发送到不同可用区并进行自动维护,从而实现了数据的跨可用区高可用,并可通过无服务器化的方式实现读副本的自动伸缩。

打开网易新闻 查看精彩图片

Caspian:

实现计算的无缝自动伸缩

Caspian 是一系列创新技术的组合,包括管理程序、热度管理规划系统以及对数据库引擎本身的一些改动。它可用于动态管理物理机上的内存分配。通过 Caspian,数据库计算实例可以在几毫秒内根据不断变化的负载调整内存大小,而无需重启。当数据库实例启动时,Caspian 会按照当时实际的用量对实例进行内存分配,之后 Caspian 会持续观察并预测内存需求,并进行实时动态调配。而当一台物理服务器的内存将被耗尽时,Caspian 也会通过 EC2 Live Migration 对数据库实例进行热迁移,得益于亚马逊云科技高性能的网络及计算基础设施,这个过程中数据库服务几乎不会受到任何影响。基于 Caspian,Amazon Aurora Serverless 正式推出,可以最小 2GB 的弹性单元 ACU (Aurora capacity unit),进行数据库实例的自动弹性伸缩。

打开网易新闻 查看精彩图片

Amazon Time-Sync Service:

奠定超大规模分布式系统的运行基石

通过前两阶段,在 Aurora Serverless 上已经实现了计算及存储的高可用及自动伸缩。但受制于物理服务器的资源上限,单个数据库实例无法进一步实现扩展。通过数据分片(Sharding)技术实现跨多个数据库集群的分布式数据库是一种主流的技术方向,但其中的一项技术难题是:如何在分布式系统中时钟同步,以确保数据事务的一致性(Data Consistency)。亚马逊云科技通过引入纳秒级别的卫星授时与原子钟系统,并开发了专门的时钟网络硬件与传输协议,实现了分布式集群内的微秒级时钟同步,而这则是在工业界率先实现的一项国家级工程技术突破。

打开网易新闻 查看精彩图片

通过 Time-Sync,Caspian 及 Grover 的不断加持,Amazon Aurora 家族终于迎来 Amazon Aurora Limitless Database 的全新发布。Aurora Limitless 将打破单台物理服务器的资源限制,通过分布式的架构提供高达每秒百万级的事务写入能力,及 PB 级的数据存储能力,同时兼顾强数据一致性。Aurora Limitless 也将提供完整的 Serverless 使用体验,用户通过单一的数据库端点接入服务,系统将自动按需进行扩展或收缩,而无需针对分布式架构更改前端应用逻辑,更无需维护复杂的数据库分片节点。

打开网易新闻 查看精彩图片

Gartner, Magic Quadrant for Cloud Database Management Systems, 2023 年 12 月 18 日

Gartner 对其研究出版物中所描述的任何供应商、产品或服务不做任何推荐,也不建议技术用户仅选择排名最高或其它特指的供应商。Gartner 研究出版物包含 Gartner 研究机构的观点,不应被视为事实陈述。Gartner 关于此研究不作任何明示或暗示担保,包括任何特定用途的适销性或适用性。此图形系 Gartner, Inc. 完整研究文档的一部分,应在整个文档中予以评估。您可向亚马逊云科技申请获取 Gartner 文档。GARTNER 是 Gartner 的注册商标和服务商标,Magic Quadrant(魔力象限)是 Gartner, Inc. 和/或其附属公司在美国和国际的注册商标,此处的使用已获得授权。保留所有权利。在 2014-2019 年间,本报告名为《运营数据库管理系统魔力象限》。

让我们共同见证亚马逊的一小步

云计算的一大步

打开网易新闻 查看精彩图片