西雅图一家创业公司拿到了2700万美元,只为解决一个被忽视的问题:当AI代理进驻应用,用户真的只想聊天吗?

CopilotKit的答案是——不。他们押注的是另一种形态:代理直接住在应用里,看懂用户在做什么,主动操作界面,而不是丢回大段文字让人慢慢读。

打开网易新闻 查看精彩图片

事件现场:一笔指向"下一代交互"的融资

这笔由Glilot Capital、NFX和SignalFire联合领投的A轮融资,将用于推广CopilotKit的企业级工具包。核心卖点建立在两个联合创始人Atai Barkai与Uli Barkai的观察之上:当前大多数公司的AI部署,本质上只是把聊天机器人塞进产品,体验往往笨拙。

典型场景是:你想用旅行App订一整套行程,却得在成堆的文字里扫描关键信息。文本界面未必适合所有任务。

CopilotKit的解法分两层。底层是已广泛采用的开源协议AG-UI,标准化AI代理与用户界面(浏览器或App)的连接方式,支持流式对话、前端工具调用、状态共享等人机协作功能。上层是企业工具包,补充支持服务、私有化部署等企业刚需。

正方观点:动态界面是AI代理的进化方向

CEO Atai Barkai向TechCrunch演示了这套框架的能力边界。开发者可以预先定义UI组件库,代理根据上下文动态组装界面,而非返回静态文本。

「代理回复你的不再是文字块,而是你们公司自己定义的交互界面,」Atai解释。「比如用户要按类别看收入 breakdown,得到的不是一大段难啃的段落,而是一个饼图——你们自己设计的饼图,用户可以直接操作。」

这套机制的关键在于控制粒度。开发者可设定界面严格程度:从"像素级精确"的固定样式,到只提供基础模块让AI自由拼装。所有代理都能调用同一套组件库,向用户呈现统一体验。

从商业逻辑看,这击中了B端产品的痛点。企业既想拥抱AI,又不愿放弃品牌一致性;既需要代理的灵活性,又恐惧不可控的界面漂移。CopilotKit试图在两者之间找平衡。

反方观点:文本交互仍有不可替代的优势

但"动态UI"路线并非没有挑战。

首先是认知负荷。用户面对陌生界面时需要学习成本,而纯文本对话的门槛几乎为零。当代理生成的界面每次略有不同,用户反而可能困惑:"这次按钮在哪?"

其次是开发复杂度。维护一套可被AI安全调用的组件库,比训练一个文本模型回答规范得多。Atai提到的"像素级控制"选项,某种程度上承认了这种风险——企业需要锁死可能性,恰恰说明开放组装可能出问题。

更深层的疑问是:代理真的需要"看懂"用户在做什么吗?当前多数成功的大模型应用,核心能力恰恰在于不依赖上下文状态,仅凭用户当前输入就能给出高质量回应。过度绑定应用内部状态,可能让代理变得笨重,丧失跨场景泛化的灵活性。

判断:协议层价值高于单点工具

CopilotKit的真正筹码,可能不在工具包本身,而在AG-UI协议的先发占位。

AI代理与界面的通信标准,目前仍是空白地带。谁定义了"代理如何调用前端组件"的通用语言,谁就能成为基础设施。AG-UI的开源策略和已有采用度,正在构建网络效应护城河。

企业工具包的收费模式也经过验证:开源协议获客,增值服务变现。这是开发者工具领域的经典路径。

但风险同样明显。如果大模型厂商(OpenAI、Anthropic)或平台层(Vercel、Cloudflare)直接内置类似能力,垂直工具的空间会被压缩。Atai强调的"公司自己设计UI",某种程度上是对抗平台化的防御姿态——企业不愿把界面控制权交给第三方模型。

这笔融资的 timing 耐人寻味。2024-2025年,AI代理从概念验证走向生产部署,"最后一公里"的摩擦开始暴露。CopilotKit选择此时加码,赌的是代理基础设施的爆发窗口。

开放提问

当AI代理开始主动操作界面,用户会觉得自己在"用工具"还是"被工具带着走"?这种控制感的微妙转移,会不会成为下一代交互设计的核心张力?