自变量机器人近期完成10亿元A++轮融资,据透露领投方为字节跳动。融资消息发布后,其创始人兼CEO王潜接受了《晚点LatePost》的专访,系统阐述了他对技术与行业的思考。

打开网易新闻 查看精彩图片

王潜的创业历程始于对AI的长期追求。他早在2009年便开始研究神经网络,2014年发表了一篇关于注意力机制的论文,与Transformer架构仅一步之遥,他称之为“错过了一个图灵奖级别的工作”。此后他转向机器人学习,但因技术瓶颈在2018年左右离开学术界,转而从事量化基金。2021年GPT-3的出现让他看到了范式转移的希望,决定回国创立自变量机器人,专注于具身智能。

关于创业地点,王潜认为美国硬件生态已不完整,供应链、资金和人才流动均存在问题,而中国在数据成本和供应链方面具有持续优势。他强调,中美在硬件上的竞争不可避免,“中国做硬件,美国做软件”的说法并不成立。

技术路线上,王潜坚定主张端到端的具身基础模型。他认为分层模型错误会被级联放大,而端到端模型能通过反馈直接优化动作,且更易实现少样本学习。他指出,当前瓶颈在于数据质量而非算力,高质量的真实物理数据至关重要,仿真数据则难以奏效。他还提到,多模态模型若加入动作连续性,将更易训练,而未来最好的多模态模型很可能出自具身领域。

在硬件方面,王潜最初以AI为优先,但后来发现自制硬件能更好地服务于AI训练。他主张“用AI定义硬件”,认为硬件设计应基于数据采集与模型需求。对于灵巧手、双足等复杂硬件,他持务实态度,认为许多场景中简单夹爪已足够,高自由度设计往往更多是“情绪价值”。

谈及公司发展,王潜坦言早期融资困难,因为市场普遍不相信初创公司能做从0到1的原始创新。但他强调,自变量的目标是成为“具身智能领域的OpenAI”,而非跟随者。随着Demo验证(如三天内完成卷卫生纸任务)及行业认知变化,融资逐渐顺利,并获得了阿里、字节等头部机构的投资。

团队建设上,王潜倾向于招聘有理想主义、关注技术本质的人才,尤其是应届生或来自大模型背景的成员。他认为硬件与AI团队的协同是关键,目前团队协作程度可打8分(满分10分)。

展望行业,王潜预测2026年将成为具身智能商业化的起点,关键标志是在特定场景实现正ROI,例如家务整理或工业打螺丝。他认为行业正在出清,只有能拿出实际成果的公司才能存活。对于竞争,他区分了以AI为核心的公司和以控制论或资源整合为主的公司,并自信表示自变量在技术层面处于领先。

个人层面,王潜表现出强烈自信,称自己的判断力和vision一直很准。他坦言创业艰苦,虽然对外展现坚定形象,但私下也会焦虑。业余时间他常通过睡觉、阅读《科学美国人》或刷B站来放松。