智东西
作者 王涵
编辑 云鹏
一、五大技术特点,一套系统代替交易库+数仓+向量库+数据湖二、TCO降低30%-50%,已在蚂蚁阿福、灵光落地验证结语:OceanBase具备落地验证和技术优势

打开网易新闻 查看精彩图片

智东西6月29日报道,今天,OceanBase发布湖库一体AI数据库产品OceanBase Lakebase,该产品面向Agent应用,原生支持多模态数据管理

“数据湖”是一种集中式存储架构,可以存储结构化、半结构化、非结构化等不同类型的数据。Lakebase融合了“数据湖”架构的开放性和“数据库”架构的功能性,让结构化数据、非结构化数据和向量数据能够在统一架构中被管理、加工、检索和调用。

打开网易新闻 查看精彩图片

基于此,OceanBase还发布了数据生产、治理和服务工作台OceanBase DataStudio,以及面向经营分析和业务决策的数据智能AgentOceanBase DataPilot两个产品。

OceanBase DataStudio覆盖数据接入、数据加工、任务编排、语义建模、数据治理到Agent协作等环节,帮助企业把分散的数据资产转化为可管理、可理解、可调用的数据服务。

打开网易新闻 查看精彩图片

OceanBase DataPilot作为统一的企业业务智能入口,让业务人员可以通过自然语言完成分析报告、数据看板和可信答案生成,把过去依赖专业数据团队完成的分析流程,转化为可交互、可追问、可复用的智能决策能力。

智东西等媒体与OceanBase CEO杨冰、CTO杨传辉,进行了面对面的交流。

杨冰认为,AI正在改变数据的管理方式,数据使用者和数据形态都发生了变化。数据使用者的改变带来了三大挑战:VibeCoding带来了海量Agent应用;Agent开始执行生产任务;Agent长期运行的正确性和自我进化。数据形态改变,则为非结构化数据成为可计算资产、数据要主动流转、数据要理解任务。

两者作用叠加,OceanBase给出判断:在AI时代,数据库应该是湖库一体的

OceanBase内部的AI转型也在进行中。杨冰透露,OceanBase已将内核团队分为“一体化数据库”和“AI”两个大部,配备独立团队研发AI引擎,这是面向未来的第二增长曲线。

对于全球数据库竞争格局,杨传辉认为,在AI数据库领域,中美起步点接近,中国在场景丰富度和工程化落地上甚至可能领先。

OceanBase Lakebase主要有五大技术特点

第一,湖库一体:

OceanBase Lakebase通过湖库一体架构,将数据湖的开放格式与海量存储能力、数据库的结构化管理与在线服务能力统一,把结构化、半结构化和非结构化数据纳入同一套元数据、权限、事务和生命周期管
理体系。

数据可以直接支撑在线服务、实时分析和AI应用运行。

打开网易新闻 查看精彩图片

第二,多模表与AI列:

OceanBase Lakebase的多模表让结构化字段、文本、图片、音视频、JSON、LOB、向量等数据形态进入同一张表的语义之下。

AI列可以基于原始数据生成摘要、标签、向量等语义结果,让模型理解能力以“列”的形式进入数据库。

第三,Agent友好:

CTO杨传辉认为,Agent和人最不同的区别是,Agent强调实时性。实时性会成为AI数据库的第一需求。

OceanBase Lakebase原生支持面向Agent的实时上下文工程,可以统一存储和检索Agent的记忆、上下文、状态与行动记录,并通过向量、全文、结构化数据的混合搜索,为Agent提供更准确的上下文供给。

同时,OceanBase Lakebase通过数据分支、逻辑库、资源隔离和快速回滚,为Agent应用创建独立、安全的数据环境。

打开网易新闻 查看精彩图片

第四,开放生态:

AI时代的数据处理不会只发生在一种引擎里。OceanBase Lakebase基于开放式存储格式与可扩展计算架构,支持S3兼容对象存储与Iceberg开放表格式,并可对接Spark、Ray等计算引擎。

打开网易新闻 查看精彩图片

第五,一体化设计:

OceanBase AI数据库从架构层面减少数据冗余、缩短处理链路、统一治理口径,并降低开发与运维复杂度。

用户可以在一个系统中同时承载事务处理、实时分析和AI工作负载,企业不必为交易库、数仓、搜索引擎、向量库、数据湖分别维护一套链路。

打开网易新闻 查看精彩图片

在部署方式上,Lakebase有2种部署模式:独立部署和智能叠加层模式。

Data Studio是构建在LakeBase之上的统一数据开发治理平台。它的核心目标是将LakeBase的数据能力交付给上层数据应用,降低复杂数据开发和治理的门槛。

该产品的核心能力覆盖了数据从集成到资产化的全生命周期,可以降低复杂数据的开发和治理门槛。依托底层统一存储和多模态处理能力,其还可以向上支撑数据更快地服务化,并加速AI应用落地。

Data Pilot是面向更广泛业务分析场景的数据智能Agent。它的目标是帮助企业在已有的数据集之上,快速构建面向业务团队的数据分析能力。

该产品上文技术优势有自动化语义网络生成和自然语言驱动的下钻与关联分析。其能够帮助业务分析师更快速地理解业务变化,辅助业务人员更及时地做出业务决策。

智驾场景中,OceanBase Lakebase的通义多模态数据底座,可以将海量的盒智驾数据转化为可管理、搜索、分析、复用的数据资产,极大提升数据处理效率和精准率。

打开网易新闻 查看精彩图片

证券行业中,OceanBase AI数据库可以统一移动数据源,并进行多模态智能解析,可以分析行研报告,将监管制度、合规等文件进行分类、提取摘要等。

打开网易新闻 查看精彩图片

OceanBase CTO杨传辉分享到,在相关场景中,OceanBase AI数据库可使项目整体TCO(Total Cost of Ownership,总体拥有成本)降低30%-50%。目前,OceanBase的AI数据库已在蚂蚁阿福、灵光等应用场景完成业务验证。

OceanBase此次发布的三款产品,勾勒出一条AI时代数据基础设施的演进路径:数据不仅被存储,更能被理解、被调用、被Agent自主使用。

OceanBase的AI数据库,有着天生的落地优势。支付宝AI支付、蚂蚁阿福、灵光,以及通义千问、高德、飞猪等阿里生态业务,均为其提供真实、大规模的业务实践场景。AI数据库的推出,也是OceanBase十五年技术演进水到渠成的成果。