ComfyUI估值达5亿美元，创作者争夺AI生成内容控制权|艺术家

ComfyUI是一家帮助创作者通过基于节点的工作流程，精细控制扩散模型图像、视频及音频输出的初创公司，近日完成了一轮3000万美元的融资，估值达到5亿美元。

本轮融资由Craft Ventures领投，Pace Capital、Chemistry和TruArrow等投资机构跟投。

ComfyUI于2023年作为开源项目启动，彼时扩散模型刚刚兴起。那个阶段，Midjourney和OpenAI的DALL-E等模型功能尚不完善，经常出现明显错误，例如在手部图像中生成多余的手指。

为解决上述局限性，项目创始人开发了一套模块化框架，让创作者能够对生成流程中的每个环节实施精细控制。

这款工具在创意专业人士中迅速获得广泛认可，最终发展成为一家正式运营的初创公司。2024年底，ComfyUI完成了由Chemistry Ventures、Cursor Capital以及Vercel创始人Guillermo Rauch参与的1900万美元A轮融资。

尽管最新的扩散模型已经大幅进步，不再频繁出现手指数量错误等问题，但市场对ComfyUI所提供的精细控制能力的需求却与日俱增。

ComfyUI联合创始人兼CEO严友兰在接受TechCrunch采访时表示："如果你使用Midjourney或ChatGPT这类典型的提示词驱动工具，输入需求后，结果往往只能达到预期的60%至80%。而要改变剩余的20%，你只能不停地碰运气。"

严友兰将这一过程比作在赌场里玩老虎机——因为对模型稍加提示以进行微小调整，可能导致输出结果完全不同，甚至覆盖掉原本已经完美的部分。

ComfyUI的节点式界面允许创作者将生成流程中的特定组件相互关联，从而完全掌控最终输出的质量。

"在基础模型的提示词输入框里，你无法轻易传达这种细致的意图。"严友兰说道。

创作者们的选择印证了这一点——ComfyUI目前声称已拥有超过400万用户。

该工具已被创意专业人士广泛应用于视觉特效、动画制作、广告营销乃至工业设计等领域。

这家初创公司表示，其产品已成为技术艺术家和其他创意从业者不可或缺的专业工具，在各大工作室的招聘启事中，"ComfyUI艺术家或工程师"作为职位名称出现已不鲜见。

尽管视频和图像基础模型仍在持续进化，严友兰认为它们距离完美仍有相当差距，像ComfyUI这样的工具将持续保持强劲需求。

"在AI滥制内容泛滥的时代，ComfyUI所倡导的'人在回路'方式，最终将赢得绝大多数用户的青睐。"他说。

ComfyUI的竞争对手包括Weavy——一家去年被Figma收购的初创公司。

Q&A

Q1：ComfyUI是什么？它主要用来做什么？

A：ComfyUI是一款基于节点工作流的创意生成工具，帮助创作者对扩散模型的图像、视频和音频输出进行精细化控制。与Midjourney、ChatGPT等提示词驱动工具不同，ComfyUI允许用户将生成流程中的各个环节模块化连接，从而对最终输出实现全面掌控，广泛应用于视觉特效、动画、广告和工业设计等领域。

Q2：ComfyUI相比Midjourney等工具有什么优势？

A：传统提示词工具（如Midjourney或ChatGPT）生成的结果往往只能达到用户预期的60%至80%，若要调整剩余部分，只能反复尝试，存在极大不确定性。而ComfyUI的节点式界面让创作者可以精准控制生成流程的每个环节，避免因小幅调整导致整体输出面目全非，极大提升了创作的可控性和稳定性。

Q3：ComfyUI目前的用户规模和融资情况如何？

A：ComfyUI目前拥有超过400万用户，并于近期完成3000万美元新一轮融资，估值达5亿美元，由Craft Ventures领投。此前在2024年底，该公司已完成1900万美元的A轮融资。其用户群体以技术艺术家和创意专业人士为主，"ComfyUI艺术家或工程师"已成为部分工作室的正式招聘职位。