文|梁键强

编辑|王毓婵

一句话介绍

Anijam是一款面向动画创作场景的AI Video Agent,目的是以更低成本提升动画内容生产效率。用户只需输入自然语言提示,即可自动完成角色生成、分镜设计等关键环节的自动生成。

团队介绍

创始人兼CTO王珏,先后获得清华大学学士、硕士学位及美国华盛顿大学博士学位。曾于2020至2023年担任腾讯杰出科学家、AI Lab视觉计算中心总监,拥有IEEE Fellow头衔,2017至2019年任旷视美国研究院院长,2007至2017年任Adobe首席科学家。

CEO 方晨,博士毕业于美国常春藤院校达特茅斯学院,曾先后任职于 Adobe Research 、字节跳动北美 AI Lab 及腾讯,具备从技术研发到产品落地的完整经验,其成果已广泛应用于Photoshop、Lightroom、抖音、微信等产品。

融资进展

已累计完成千万美金级别的融资,投资方包括奇绩创坛、Atypical Ventures和元璟资本。

产品及业务

Anijam的核心定位,是打造一款面向视频创作者的AI Video Agent,类似于视频领域的“Cursor”。就像Cursor这类AI编程工具能够理解需求、协助完成开发任务一样,Anijam也希望推动视频创作走向“AI驱动生成”,帮助创作者完成角色生成、分镜设计等关键环节。

视频创作本质上是一项高门槛、长流程的专业工作。一个完整的视频,从前期的脚本构思、角色设定、分镜拆解,到中期的镜头设计、动作衔接、画面风格统一,再到后期的剪辑、配音和节奏调整,背后需要系统的创作方法和专业能力。

AI虽然让视频生成变得更容易,但对大多数普通人来说,真正的难点并不在于生成,而在于如何搭建叙事、设计镜头语言,并组装成一支表达清晰的好视频。

方晨认为,AI大模型会由头部公司主导,而机会点在于解决生成内容不可控、难修改的问题。

基于这一判断,产品将视频创作流程进行了重新拆解。Anijam通过AI,将原本割裂、复杂的创作流程进行整合,让用户通过更简单的交互完成完整的视频生产。

Anijam在后台整合了多个第三方大模型,并在Agent流程编排、后编辑算法及用户体验优化上进行了优化。

用户只需输入一句自然语言,例如“制作一段孙悟空三打白骨精的视频”,系统就会自动完成从故事大纲生成、视觉概念设计,到分镜脚本拆解、关键帧生成、视频片段制作及最终合成的完整流程。

打开网易新闻 查看精彩图片

整个过程以画布为载体形式,用户可以在任意环节介入修改。例如调整画风、增删角色设定,或对镜头细节进行优化。

在这一过程中,系统会自动识别故事中的关键元素,包括角色、场景、道具及风格,并基于此生成完整的分镜镜头。每一个镜头都会包含场景描述、角色状态、镜头语言等信息。

创作者不仅可以看到每个分镜的大致效果,还可以通过自然语言进行修改,例如调整镜头视角、改变构图,或者替换局部元素等。同时,系统会自动生成每个分镜的关键帧,并支持逐镜头预览与修改。

打开网易新闻 查看精彩图片

这也是Anijam的关键能力之一,即从抽卡式生成视频走向“可控编辑”。

打开网易新闻 查看精彩图片

传统AI视频生成往往依赖反复生成整段内容,一旦某一帧不满意,需要整体重来。而Anijam强调“局部可编辑”,例如只修改角色表情,而不影响动作或背景。

Anijam正在优化AI驱动的视频编辑能力——不仅支持局部修改,还在尝试构建AI的自反馈机制。在方晨的规划中,Anijam未来会争取让AI自动评价视频生成效果,扮演一个“第三方AI导演”,对AI工具生成的镜头质量打分,并反向优化生成过程,通过“AI指导AI”来减少人工调试的次数。

在产品形态上,Anijam同时提供桌面端与移动端。Web端承载更复杂的创作与编辑能力,适合长流程生产。移动端则以对话式交互为主,界面更轻量,适配高频内容创作者。团队还在构建创作者社区,将优质内容沉淀为模板,供用户复用。

当前产品已支持最长5至10分钟的视频生成,具体耗时取决于内容复杂度。一条约2分钟的视频,生成过程可能需要数十分钟至一小时。

在商业模式上,产品采用分层订阅模式,覆盖不同强度的创作需求,从25到60美元不等,价格区间的提升,本质上对应的是算力额度与生成能力的差异。

随着用户与Agent的持续交互,系统会积累大量与创作相关的数据,包括用户偏好、风格选择、修改路径等。这些数据将被进一步结构化,转化为“创作记忆”,并嵌入到Agent中,使其逐步具备个性化能力。

Anijam试图实现的,是用一句话启动创作,用AI完成生产,并对每一帧内容进行可控修改,同时在持续使用中不断变得更高效。

Founder思考

  • AI视频赛道仍处于早期阶段,时间窗口就是壁垒

视频大模型的持续进步是确定的趋势,这对所有入局的玩家来说都是红利。真正的差异不在模型本身,而在模型之外的能力构建,例如后编辑能力、Agent流程编排,以及如何让生成内容变得可用、可修改。相比单纯调用模型,如何让生成内容变得可用、可修改,才是产品竞争的核心。

这一赛道还处在早期阶段,产品还不完美,仍需要用户大量参与修改。在这个阶段,最该担心的不是竞争,而是效率。要尽快进入市场、获取用户,并在真实使用中积累数据与认知。

创业公司与大厂竞争的关键,是要更早跑起来,形成用户留存与数据沉淀。

参考图像生成市场的发展路径,AI视频领域未来也不会出现一家垄断的格局,而是由多家厂商分占不同份额。市场结构可能更加均衡,每家占据一部分用户与场景,而不是单一平台占据绝大多数份额。

  • 视频Agent的核心不只是生成好视频,而是“讲好故事”

当前AI视频的瓶颈,并不只是画面生成能力,而是叙事能力。

让模型在两分钟内清晰讲述一个完整故事,本身就是一件难度极高的事情。这意味着,真正的挑战不在于生成单个片段,而在于如何用导演语言组织内容,讲述用户的故事。

未来的创作者工具不再只是提供功能,而是成为用户的创作伙伴。随着创作者与Agent持续交互,系统会积累用户在创作过程中的行为数据,包括偏好、修改逻辑与经验。Agent可以逐渐理解用户意图,甚至提前完成部分创作决策,最终演化为一个具备记忆与进化能力的“数字分身”。

Anijam的目标并不只是做一个工具,而是成为类似Adobe的创作平台。通过技术重塑创作流程,在提升效率、降低门槛的同时,承载更大规模的内容生产与创作者生态,从而让更多人参与创作,并从中获得价值。

  • AI将推动创作平权,但注意力仍集中头部

随着Agent能力的进一步提升,视频创作将逐渐从“人不断参与反馈”的过程,转变为更自动化的生产模式。未来甚至可能出现“Agent替人反馈”的情况。用户只需提出需求,其余由系统自行完成迭代与优化。

AI正在降低创作门槛,让更多人能够参与内容生产。类似短视频平台的出现,使原本无法进入院线的创作者获得了表达空间,这是一次创作平权的推进。

但与此同时,注意力分配并不会完全平均。院线与短视频并非替代关系,而是新增渠道,头部内容依然会集中流量与商业价值。因此,AI带来的不是“平均化”,而是在扩大供给的同时,继续强化头部效应。

  • 商业模式将从“卖算力”走向“按结果付费”

目前的视频生成成本仍然很高昂,但随着后续的需求增加和技术进步,价格会逐步下滑。

一方面,大规模的需求会持续压低成本;另一方面,模型层面的优化与加速将显著减少算力消耗,例如通过架构优化、硬件协同等方式,将原本需要大量token的生成过程大幅压缩。这意味着,同样一段视频所需的计算资源可以实现数量级下降,从而带动整体价格快速走低,进一步推动AI视频应用的普及。

在商业模式上,当前以算力为核心的计费方式,本质上是阶段性形态。随着技术成熟与成本下降,未来更可能转向“按结果付费”——即用户在对AI视频满意并愿意下载时,才为最终产出买单,而非为生成过程中的token消耗付费。

这一模式的成立,依赖于产品在质量、成本与速度之间达到平衡,一旦生成结果足够稳定且可控,用户的付费逻辑也会随之发生转变。

  • 从动画创作者出发,撬动更广泛的内容人群

Anijam选择从动画类型(animation)切入。原因在于,这一群体本身已经习惯数字化创作流程,对AI工具的接受度更高,相比实拍视频创作者,迁移成本更低。同时,这类用户往往具备较强的创作意愿,是早期最容易被激活的一批人。

在更广泛的用户层面,团队观察到,海外市场存在大量“轻创作用户”——包括副业创作者、内容爱好者等,他们具备较强的内容生产意愿,并且已经在YouTube、Instagram等平台实现初步商业化。

方晨认为,在B端专业内容公司之外,to C创作者同样具备付费能力与增长潜力。

另外,动画与真人视频在技术难度上存在明显差异。尽管两者在生成时长上相近,但真人视频对质量的要求更高,例如需要跨越“恐怖谷效应”,同时在细节、衔接与转场上更接近真实,这使得整体实现难度显著提升。相比之下,动画在风格容错与表达上更容易达到可用水平。

从长期来看,真人视频仍然是更大的市场方向。随着技术成熟与行业方案逐步完善,真人视频的需求一定会释放,我们未来也会进入这一领域。

封面来源|企业官方