AI不接受碎片化的数据世界。

这是近期一项最新研究得出的结论——如果AI模型长期接触高流行但低价值的碎片化数据,会出现类似人类“脑损伤”的现象。

在一体化的数据世界,我们需要AI原生一体化的数据库。当“AI+”走向“AI原生”,AI不再是一个零散的附加功能,而是系统架构的核心方向,对于数据库而言更是如此。

回望过去十五年数据库的范式跃迁,已从事务交易走向实时分析,再到如今智能化时代走向“前台”。站在下一个十五年的起点,OceanBase面向AI时代的战略回应是:基于十五年以来沉淀的“一体化”与“工程化”能力,在AI时代实现“变与不变并行”——不变的是高可靠、强一致性的企业级基因;变的是面向AI负载全面升级的核心能力,构建“AI原生一体化”的现代数据底座。

11月18日,在2025 OceanBase年度发布会上,OceanBase发布并开源了其首款AI原生混合搜索数据库OceanBase seekdb(以下简称“seekdb”)。开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现“开箱即用”。

打开网易新闻 查看精彩图片

“seekdb不是传统数据库的功能叠加,而是专为AI时代重构的AI原生混合搜索数据库。”OceanBase CEO杨冰表示,“它继承OceanBase的代码和设计理念,更轻量、更敏捷,目标是成为大模型与私有数据融合计算的‘实时入口层’。我们希望与开发者一起,在混合搜索、多模融合等方向加速迭代、大胆创新。”

智能范式跃迁

数据库正成为AI的“第二战场”

“AI的真正瓶颈不在模型,而在数据。”这是杨冰与OceanBase对AI原生时代的技术判断。

在过去两年生成式AI带来的技术革命中,大模型训练集中于算法模型与算力建设,然而,随着推理模型的深度应用,开发者与企业都逐渐意识到,私有化数据才是AI真正的“护城河”。这里形成的数据“护城河”有两方面,一是数据本身的质量与模型对数据的理解,二是调用数据的效率。

MIT Project NANDA最新研究显示,95%的企业在生成式AI投入生产后,仍然没能看到可以衡量的回报,其主要原因在于多模态数据割裂、系统链路冗长、权限管理复杂难以落地,导致模型无法持续理解业务上下文、缺乏实时适应能力。

以往割裂的系统架构使得传统碎片化的数据查询分析,难以适应AI时代的需求。一方面,过去向量数据、文本数据、结构化数据与空间数据分布于不同系统中,不利于跨系统查询、整合与排序;另一方面,传统模式下向量检索与混合搜索性能不足,也无法满足实时响应的需求;与此同时,通常依赖于多套外部模型处理流程的AI应用系统复杂且难以维护。

如果说过去数据库是后端静态的仓库,那么在AI时代,开发者需要的是前端能够实时响应的系统,不仅需要存储数据,还要理解数据语义,成为AI原生基础设施。

在这样的背景下,“融合”与“协同”成为全球数据库厂商的共识。Oracle、 MongoDB、Elasticsearch等主流厂商已加速融合向量、JSON、搜索等能力,形成AI时代的“全能型”数据库。

打开网易新闻 查看精彩图片

轻量化探路AI时代

OceanBase的战略回应

作为从2010年就开始投入研发的原生分布式数据库,面对AI时代的智能范式跃迁,OceanBase给出的答案是,从“AI原生”理念出发, 发布并开源其首款AI数据库产品seekdb。

“AI原生不是功能堆砌,而是架构重生。因此,并非简单增加向量索引或接入大模型,而是以‘一体化’为核心,为AI系统性重构数据库。”OceanBase CTO杨传辉表示,“只有在保证‘不塌楼’的前提下,让数据库原生拥抱AI,才能支撑企业级AI应用的长期演进。”

在OceanBase的规划中,这一重构体现为四大能力的深度融合:

第一、一体化的多模数据管理:兼容多样化数据类型与索引,结构化、半结构化和非结构化数据在同一个引擎下统一存储与治理,最终实现“一个引擎,统一语义”;

第二、一体化的多工作负载:事务(TP)、分析(AP)、AI(Search)可以在同一内核中协同,实现“TP+AP+AI,三合一”;

第三、原生的AI Function能力:将大模型与企业私有数据深度耦合,形成“数据可信、推理可控、闭环可衡量”的执行链路,真正释放数据价值。

第四、混合多云:从单机到分布式,从本地到多云,赋予用户完全的部署自由,可自主选择上云、不上云或特定云平台。更关键的是,用户只需使用一套产品,就能实现跨所有公有云、混合云平台的自动升级,无需额外适配。

这四大能力并非孤立功能,而是OceanBase“一体化”理念在AI时代的进一步演进——将数据形态、负载类型与模型能力、多云原生合而为一,构建真正原生支持AI的现代数据架构。

seekdb正是这一战略的关键落子。

它不仅支持向量、标量、文本、JSON、GIS等多模数据的统一存储与混合检索,采用“粗排+精排”机制兼顾精度与低延迟。例如,在反欺诈场景中,可直接查询“近7天交易超5万元、位置异常且行为类似历史欺诈样本”,无需跨系统调用,兼顾性能与安全。

更关键的是其极致轻量化:最低起步资源仅需1核CPU、2GB内存,pip install一键安装、秒级启动,兼容嵌入式与客户端/服务器双模式,可轻松集成至智能Agent或本地工具链,大幅降低AI应用开发门槛。

同时,seekdb以Apache 2.0协议全球开源,全面兼容HuggingFace、LangChain、Dify等30余种AI框架,并同步开源PowerRAG文档解析与PowerMem分层记忆架构——后者在LOCOMO Benchmark以78.70 分达到了业界开源 Memory的 SOTA 水平(State of the Art),Token消耗降低96%。

在OceanBase“Data x AI”战略中,seekdb不是一个独立的产品,而是基于OceanBase工程化能力形成的关键一环。

“做技术有两个难点,一是做的巨大无比,通过分布式架构实现无限扩展,另一个是做得巨小无比,做到极致轻量化。”OceanBase CTO杨传辉坦言,一方面,为应对AI模型数据调用的功能性要求,seekdb要支持在一个查询中融合向量检索、全文搜索、标量过滤以及空间地理数据的混合搜索;另一方面,为应对开发者低成本灵活应用的创新需求,seekdb又需要做得极致轻量化,支持1核CPU、2GB内存的秒级启动,其背后是OceanBase十五年以来沉淀的工程化能力。

“OceanBase工程化的第一性要求是:正确性第一、稳定性第二、性能第三。”杨传辉谈到,所谓正确性,是对代码的完全掌控、对硬件的极致掌控、对强一致性的要求,从2010年创始人阳振坤敲下第一行代码开始,OceanBase就坚持根自研,在300万行代码中,超过50%以上的代码是写在内核里的自检代码。

从这个角度来看,seekdb也是OceanBase在AI现代技术栈及AI数据库的探索者,适应AI技术的快速迭代,同时通过开源,与客户、全球开发者共建。

打造“世界级数据库”

AI浪潮为OceanBase带来历史性机遇。

“在AI时代,我们和全球顶尖数据库站在同一起跑线,甚至因经历过中国最严苛的金融场景而更具实战经验。”杨冰表示。

回望OceanBase过去十五年的来时路,杨冰指出,可以分为三个阶段,一是工程化能力的沉淀阶段,二是加速迈向市场化、规模化的阶段,三是走向全球化的阶段。

在年度发布会上,OceanBase也交出了自2020年宣布商业化以来的“成绩单”:全球客户数已突破4000家,连续五年年均增速超100%。其技术已深入金融、政务、通信、零售、制造、互联网等十余领域,服务网络覆盖16个国家和地区。其云服务OB Cloud稳定运行于阿里云、AWS、Azure等七大主流云平台,支持“一套架构、全球运行”,助力中国企业无忧出海。

打开网易新闻 查看精彩图片

“我们从第一天起就有一个朴素但坚定地目标——打造一款世界级数据库。”杨冰提到,从支撑支付宝核心账务系统、扛住双11每秒17.5万笔交易峰值,到服务全球数个国家客户,工程化是15 年发展的核心基因,也是 OceanBase 面向未来的底气。

在杨冰看来,在OceanBase走向全球的过程中,技术、生态、业务背书三者缺一不可。

在技术层面,OceanBase凭借单机分布式一体化、低成本、高兼容等优势,灵活支持从分布式到单机、TP到AP等多样化场景的客户需求,实现了专有云业务的快速增长。在过去一年公司专有云客户数量增长50%,金融与政企领域的核心系统改造成为增长主力。与此同时,依托于“多云原生”的核心优势,OceanBase的公有云(OB Cloud)业务也已成为“第二增长曲线”,近三年客户数年均增长115%,营收占比已达30%。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

值得一提的是,为保障中国企业出海过程中在不同国家的业务稳定性,OB Cloud已稳定运行于阿里云、华为云、腾讯云、百度智能云、AWS、Azure、GCP七大主流云基础设施,应用无需改造即可“一套架构、全球运行”。

“OceanBase的增长,本质上是生态的增长。”杨冰强调。

在专有云领域,合作伙伴贡献收入超70%,年增速达80%。目前,OceanBase已与350多家ISV协作,共创900多个可复制的行业解决方案。金融领域联合长亮科技、恒生、金证、顶点、中科软等攻坚核心系统;政务领域携手东软、易联众复制人社标杆;医疗、能源、交通等领域亦形成标准化联合方案。

打开网易新闻 查看精彩图片

公有云生态同步扩大。合作伙伴收入占比突破30%,年增速达300%。100余家分销伙伴构建全国DBaaS服务网络,多云业务占比从5%跃升至30%,形成“云厂商+ISV+分销商”协同格局。

“我们是带着整个生态走出去的,这样既能与自有的国内生态形成一个完成解决方案,也可以快速与海外生态进行对接,从而加速业务出海落地。”杨冰表示。

据介绍,OceanBase向量数据库能力已跻身DB-Engines全球前十,2025年16篇论文被ICDE、VLDB、SIGMOD等数据库顶会收录。目前,OceanBase已为GCash、2C2P、PalmPay等50余家海外客户提供服务,并连续两年获评Gartner云数据库“荣誉提及”和亚太区“客户之选”。