【TechWeb】1月21日消息,在2026阿里云PolarDB开发者大会上,阿里云正式发布PolarDB AI数据湖库(Lakebase)等全新能力,标志着其云原生数据库正式步入“AI就绪”新阶段。
阿里云资深副总裁、数据库产品事业部负责人李飞飞在接受采访时,深入解读了从“云原生”到“AI就绪”的进化路径,并分享了在内存等硬件成本预计会有3至5年的上涨周期中,阿里云如何通过技术架构创新持续推动数据库普惠,助力企业抵御成本压力。
从云原生到“AI就绪”:“4+1”核心进化
阿里云在2025年的云栖大会提出了人工智能的发展的道路:从学习人到辅助人、到自我迭代超越人、再到超级人工智能。
李飞飞认为,通往超级人工智能的路上,算力不再是唯一瓶颈,优质的数据和数据处理能力正成为关键。数据和数据处理是通往超级人工智能的燃料与引擎。数据是燃料,数据处理能力是引擎。当前,大模型已经能力处理冷数据(人类历史上产生的数据)、通过微调等处理温数据。但是,企业数据库里交易产生的热数据目前是不能被大模型实时的总结成模型参数的。
“如何把热数据和热数据的处理技术与大模型有机的结合起来,是通往智能的一条关键路径。”李飞飞指出,将AI大模型嵌入数据库是必须要做的一件事情。它解决了两个问题:一个是data gravity,不用把数据搬来搬去;第二是数据主权,数据隐私安全性。这样就形成了热数据和模型算子化能力的有机结合。
李飞飞表示:“阿里云PolarDB就是基于上述理念,在过去两年里面,将PolarDB从一个云原生数据库快速的演进到一个AI就绪的云原生数据库(AI ready cloud native database)。”
具体来看,李飞飞将PolarDB走云原生数据库向“AI就绪的”云原生数据库的演进总结为“4+1”
核心支柱:
第一,存储层走向Lakebase(湖库一体)。“AI时代能处理的数据类型极大丰富,通过embedding、特征提取和多模态检索,Lakebase成为AI就绪的必要第一步。”李飞飞指出,该架构统一管理结构化、半结构化与非结构化数据,打破传统数据孤岛。
第二,元数据的统一与实时管理。 面对AI时代多源、多模态、海量的数据特征,元数据规模已从“几兆”跃升至“上T”级别。PolarDB将Zero ETL与实时同步技术应用于元数据层,实现“metadata for metadata”的闭环管理。
第三,多模态检索与处理能力。PolarDB深度融合向量检索、全文检索与多模态理解,在SQL中实现语义与关键词的联合查询,显著提升复杂场景下的响应精度与速度。
第四,模型算子化与Agent AI支持。“热数据与模型的在线推理结合,是数据库智能化的关键。”李飞飞强调,通过在数据库内实现模型算子化,将实时数据转化为可场景化使用的token,并依托Agent架构实现智能体的快速开发与部署。
“+1”:紧跟硬件演进,实现资源池化与异构调度。李飞飞特别指出,结合CXL内存池化、存算分离、GPU与CPU混合调度等硬件级优化,是支撑AI就绪数据库高效运转的基础。“尤其是在内存持续涨价的周期下,池化与弹性架构显得更为关键。”
成本优化:三层架构释放普惠红利
2025年,阿里云PolarDB以每分钟20.55亿笔交易(tpmC)和单位成本0.8元人民币(price/tpmC)的成绩刷新TPC-C性能和性价比双榜的世界纪录。
面对“单位成本0.8元人民币”的成果,阿里云数据库产品事业部产品管理与技术架构部负责人王远从三个层面解读了PolarDB 的“降本”逻辑:
资源池化与智能分层:依托智能冷热数据分层与流转机制,将数据自动调度至高性价比存储介质,降低用户管理负担。
内存多租与算力异构调度:通过CXL等技术构建可共享的远端内存池,并实现CPU与GPU的混合调度,提升资源利用率。
Serverless极致弹性:面向未来以Agent为主力的负载特征,实现计算节点秒级拉起与释放,支撑高并发与间歇性任务。
李飞飞补充强调,当前存储与内存的价格上涨“可能持续三到五年”, 这一轮涨价逻辑是需求爆发式增长、产能根本不够,不是内存厂商故意踩刹车,所以这波存储周期涨价是相当长期的。而这正是云原生与池化技术释放价值的窗口期。“越是硬件成本高企,规模化、平台化的云计算厂商越能通过边际成本下降,为客户创造更大价值。”
李飞飞指出,云计算与AI平台本质是“规模化的生意”,规模越大,越能通过技术创新与弹性调度释放成本红利。
“过去几年,我们通过池化、多租、弹性等技术,持续推动面向中小企业的普惠降价。未来在AI与硬件变革的双重周期下,PolarDB将继续以‘AI就绪’架构,支持更多企业低成本、高效率地构建智能应用。”
据悉,阿里云PolarDB目前已服务全球超2万用户,覆盖金融、汽车、政务、互联网等关键领域。
热门跟贴