原标题:Apache Flink 3.0引领Agent Native革命
6月26日,由 Apache 软件基金会(Apache Software Foundation)官方授权,阿里云主办的社区年度技术盛会 Flink Forward Asia(FFA) 2026在深圳正式拉开帷幕。本届大会以"实时数据,智能未来"为主题,吸引了来自全球的开发者、数据工程师、AI 从业者及行业领袖齐聚鹏城,共同见证实时计算技术迈入 AI Native 新纪元的关键时刻。
在大会主论坛上,阿里云首席技术官、国际业务总裁李飞飞作开场致辞,回顾 Flink 发展历程,从 Cloud Native 的 Flink 2.0快速演进至 Agent Native 的 Flink 3.0,Apache Flink 已发展成为 Apache 基金会中拥有最多华人贡献者的社区之一。AI进入智能体大爆发的阶段,Data Gravity成为主流,AI要做复杂的工作,更要在企业的实际工作中产生最大价值。以Flink为代表的阿里云开源大数据生态协同阿里云自研大数据平台ODPS、人工智能平台PAI和其他AI Infra产品等一起组建了阿里云Agentic Cloud,成为企业Agent时代的新基建,同时期待与全球合作伙伴共同将业界数据处理能力推向新高度。
阿里云首席技术官、国际业务总裁李飞飞
Apache Flink 演进:从实时计算到 Agentic Streaming for AI
阿里云智能集团研究员、开源大数据平台负责人、阿里巴巴开源委员会副主席王峰系统回顾了 Apache Flink 的整体发展脉络。他指出:过去十几年,Apache Flink 从一款专注于流式处理的分布式计算引擎,已逐步成长为实时计算领域的事实标准,而在AI 时代,数据的质量及效率变得愈发重要, Agent 能否高质量落地,既取决于模型能力,更依赖于数据质量和效率的坚实支撑,在此背景下,Agentic Streaming for AI」成为自然演进方向。
如今,AI 时代正在重构数据处理的底层逻辑:计算驱动力从 BI-Driven 转向 AI-Driven,处理对象从结构化数据扩展至文本、图像、音视频、传感器信号等全模态数据。
应对这一变革的关键在于让 CPU 与 GPU 在同一条流水线上高效协同。传统 Stage-by-Stage 批处理架构在调度间歇、Stage 间落盘、失败重跑等环节,往往导致 GPU 长时间闲置;而 Flink 采用的 Pipeline 流水线架构天然适配 AI 工作负载——通过全链路并行流式执行和数据网络直连传输,CPU 与 GPU 算子可在同一条 Pipeline 内统一编排、协同调度。
基于此,阿里云实时计算Flink版在会上正式发布了全模态数据处理能力。在处理性能、结构化算子、实时增量处理、连接器生态及容错能力等维度,均显著优于 Ray、Daft 等开源技术栈。
技术演进不止于此。2026年Harness等技术栈将Agent带入Streaming 时代,7×24不间断自主运行:持续感知外部事件(交易、日志、传感器信号),逐步拆解推理,自主执行决策,而这背后对应的技术架构就是"事件驱动型 Agent"。Flink从2025年就开始孵化Flink Agents,专门为事件驱动场景设计的智能体框架,利用海量事件实时处理、上下文记忆管理、Exactly-Once 一致性和高可用容错等核心特性,为直播分析、视频解说、金融风控、智能运维、舆情监控等场景的Event-Driven Agentic Apps提供一整套完整的Streaming Agent-OS。
阿里云多年来持续不断贡献开源社区,Apache Flink 3.0围绕Agentic Streaming for AI这一理念,将算力层、Runtime层、算子层、API层等各类能力逐步开放到社区,与全球开发者生态共同打造实时数据与智能未来。在云上,Flink也在汽车、大模型、零售、具身等行业中赢得越来越多客户的青睐,在保持技术领先性的同时,成为构建下一代 AI 应用不可或缺的底层支撑,深度拥抱 Agentic Cloud的新范式。
阿里云智能集团研究员、开源大数据平台负责人、阿里巴巴开源委员会副主席王峰
嘉宾探讨:Real-time Data Powers the Future of AI
AI 独立研究者 李博杰 随后以 "AI Agent 的两朵云:流式与环境交互,自主从经验中学习" 为题发表主题演讲,当前 AI Agent 面临的两大难题是如何既保证交互的实时性又能深度思考,交互中积累的经验如何被存储与复用。构建实时交互的 AI Agent,关键在于把一轮接一轮的交互转变成流式事件处理,这与 Flink 的设计思想是同源的。
AI 独立研究者 李博杰
随后,他与阿里云智能集团副总裁、市场营销总裁刘湘雯,阿里云智能集团副总裁、计算平台事业部总裁汪军华,安克创新软件总经理朱熙文等嘉宾共同登台,从平台、应用与企业实践三重视角共同探讨实时数据与AI。嘉宾们认为Agent 的运行范式正由"单轮回话批处理"全面转向"7X24小时流处理",AI 也随之由"辅助工具"演进为持续消费数据、自主决策乃至触发行动的"业务参与者";当各种大模型跨过了"能用"的门槛,让 AI 真正跑进业务,由此沉淀的生产级数据所驱动的"数据 × AI 飞轮",才是各家独有的长期壁垒与核心竞争力;这进一步要求底层平台做好Agentic Streaming。圆桌嘉宾们达成共识,实时数据将成为 AI 产业化进程中不可替代的核心要素,开放、协同的开源生态则是推动这一进程的关键引擎。
从左至右依次为:阿里云智能集团副总裁、市场营销总裁刘湘雯,安克创新软件总经理朱熙文,阿里云智能集团副总裁、计算平台事业部总裁汪军华,AI 独立研究者 李博杰
Agentic Lake for AI:构建 Agent Native 的多模态数据基座
Agent的爆发对多模数据的处理也提出了新的需求,从Flink社区孵化的Apache Paimon 及 Apache Fluss等开源项目共同在阿里云上构建了阿里云多模态Agentic Lake,为大数据、搜索、AI提供数据支持。
Apache Paimon 2.0:The Next-Gen Agentic Lake for AI
阿里云开源数据湖平台负责人、Apache Paimon PMC 主席李劲松
阿里云开源数据湖平台负责人、Apache Paimon PMC 主席李劲松宣布开源社区 Apache Paimon 2.0版本即将发布。传统"仓、湖、流、多模态各自为战"的企业数据架构必然在 AI 时代遭遇存储多处难同步,Agent 真正需要的,是一条"实时离线一体、多模结构一体、安全可控治理、开源开放生态"的统一数据底座。围绕这一目标,Paimon 2.0在1.0实时离线一体的基础上,发布了多模态结构化一体的数据湖数据底座,并提供 Git For Table、全局向量全文标量索引的能力,提供 REST 和 CLI 等接口,不仅是 Agent 友好的统一多模态数据湖,也统一存储,打通结构化与多模态、大数据引擎与 AI 引擎、PyTorch 模型训练的全链路生态。
阿里巴巴高级数据架构专家张子良
阿里巴巴高级数据架构专家张子良及快手数据平台引擎架构师张静分别分享了Paimon在阿里巴巴集团构建内部统一多模态数据湖实践以及快手湖仓架构演进历程,基于Paimon构建了“采、建、管、用”的多模态数据全流程。
阿里云同步发布了Agentic Lake产品DLF,提供Paimon/Iceberg/Lance优化,通用查询性能提升2-6倍,Compaction 效率提升2-3倍,成为Agent友好的大模型训练与多模态推理的统一数据底座,一份数据可以同时提供大数据、搜索、AI使用。
Apache Fluss 1.0:The Real-Time Context for AI Agents
阿里云流存储 Fluss 负责人伍翀分享了 Apache Fluss 1.0的最新进展。即将发布的 Fluss 1.0致力于成为面向 Agent 的实时上下文层:通过 Lakestream 统一实时数据与历史数据,保障上下文的新鲜度和完整度;通过 Context Serving 提供低延迟上下文访问;通过 Semantic View 构建可治理、可审计、可追溯的语义层;通过 MCP Gateway 为 Agent 提供原生接入方式。使 Agent 能够在决策和行动前基于最新、完整、可信的业务上下文进行判断,支撑实时风控、营销决策、运营调度等企业级 Agent 生产场景。
阿里云流存储 Fluss 负责人伍翀
淘宝闪购资深大数据专家王沛斌分享了 Fluss 在千问 x 淘宝闪购免单、618等活动中的应用,Fluss 支撑了实时决策、营销投放、实时标签等场景,并在1.4PB 存储规模下实现网络 IO 减少67%、研发运维成本下降50% 等收益。小红书 Kafka & Fluss 负责人刘焓分享了小红书索引链路从 Kafka 迁移到 Fluss 的实践:通过 Arrow 写入、按列读取和湖流一体能力,写入 CPU 降低30%、写入流量降低50%,在线侧带宽节省30% 至90%,峰值吞吐提升约3倍。
随着 Apache Fluss 在 API、架构、生态与生产能力上走向成熟和大规模可用,社区已启动 Apache 孵化器毕业流程,并即将发布1.0版本。与此同时,阿里云流存储 Fluss 版宣布正式商业化 GA,在实时上下文、引擎生态、运维治理等方面提供企业级增强能力,加速实时数据基础设施迈向 Agentic 时代。
目前,Agentic Lake 已经为阿里巴巴集团在Qwen、Happy Horse、Happy Oyster等模型训练提供坚实可靠的数据支持,也保障了淘宝闪购、快手、小红书等业务的稳定运行。
NVIDIA 与阿里云团队技术合作加速 Apache Flink 多模态数据流处理
NVIDIA 互联网解决方案架构高级总监陈川深入阐述了NVIDIA 与阿里云双方技术团队合作加速Apache Flink 多模态数据流处理的技术成果。
NVIDIA 互联网解决方案架构高级总监陈川
随着 AI 应用从"以文本为中心"迈向"以多模态为中心",视频、图像、音频等非结构化数据的实时处理能力正成为新的技术高地。但是流式处理在同时接入多模态数据时面临低时延、多流对齐和有状态计算压力。
NVIDIA 与 Apache Flink 在算子协同与开源生态上积极共建,依托NVIDIA 在视频、图像编解码加速库 NVIDIA VideoCodec 和nvImageCodec、图像处理加速库 NVIDIA CV-CUDA,以及用于与 GPU 上模型推理上加速的 NVIDIA TensorRT LLM、vLLM 和SGLang,结合 Flink 的流式编排与窗口/状态管理、GPU 调度、Flink Agents、DataFrame API 等能力,帮助用户快速构建端到端、高性能、可扩展的多模态实时流处理架构,支撑 AI 解说、图文快讯、互动问答等丰富应用场景。
目前,Flink在钛动、金山、货拉拉、理想汽车、吉利汽车、零跑汽车等客户使用,并已成为支撑其核心业务实时化、智能化转型的关键数据底座。未来,随着 AI 与实时计算的进一步融合,Flink 有望在更多垂直场景中释放数据要素价值,为企业的数智化创新提供源源不断的动力。
Flink Forward Asia 2026由阿里云主办,Ververica 参与,NVIDIA 则是本届大会唯一钻石合作伙伴。为期两天的大会将持续至6月27日,全程免费向开发者开放,进一步降低优质技术内容的获取门槛,期间还将围绕产业落地、社区共建、开源治理等主题开展多场深度讨论。
Flink Forward Asia 2026不仅是一次技术成果的集中呈现,更是Apache Flink面向 AI 时代的一次方向校准。FFA将持续追踪 Apache Flink、Apache Paimon、Apache Fluss、Flink Agents、Flink CDC 等核心项目的最新进展,与全球开发者共同推动Agentic Streaming, Agentic Lake for AI与 Apache Flink 生态的跨越式发展。
热门跟贴