打开网易新闻 查看精彩图片

据 Z Finance 获悉,由清华博士、华为「天才少年」张家声领衔的 AI 初创公司Philo AI 已完成近千万级美金首轮融资,由祥峰投资(Vertex Ventures)独家投资。张家声此前主导的视频模型曾登上 Artificial Analysis 全球第 2,而这支核心成员全员清北博士的团队一向低调。本轮资金将重点用于世界生命模型的核心研发、自有系统构建与核心团队扩张。

当大厂顶尖技术人才正加速流向 AI 创业,Philo AI 的团队配置,几乎是一份“豪华到不真实”的名单:多位华为「天才少年」、腾讯「技术大咖」、大厂资深技术与产品专家,核心技术团队全员清华、北大博士。比融资本身更值得关注的,是这群人决定一起去做的那件事,一个他们称之为「世界生命模型」的新物种。

一份“豪华到不真实”的名单:天才少年、全员清北博士、5000 卡、把 AI 送上太空冷门方向的起点

这支团队的核心,是创始人张家声。清华大学交叉信息研究院(IIIS)计算机博士,2023 年入选华为「天才少年」。但真正让他进入 AI 视频赛道的,是一款叫 Avenger 的视频模型:在创立 Philo AI 之前,他用8个月把这款模型做进全球前三,2025 年 10 月在 Artificial Analysis 的 Image-to-Video 权威榜单上登上全球第 2。一个从清华实验室走出来的年轻人,用极小的成本挤进了全球视频生成的最前排。

而聚集在他身边的,是一支几乎把你能想到的顶尖标签都集齐了的团队。有人17 岁考入清华、25 岁拿下港大博士,师从两位院士,做着 AI × 高性能计算 × 遥感的交叉研究,把 AI 送上过太空有人是系统方向的华为「天才少年」,能从单卡算子一路打到万卡集群,曾给一个集群业务一行命令解除瓶颈、性能直接翻了三倍有人数学竞赛保送、北大本博连读,把 CUDA 算子和编译器优化抠到芯片级;有人带过5,000 卡的 VLLM 训练集群;有人负责过10 PB级的数据工程;还有人深耕强化学习与实时调度算法。

把这群人放在一起,是一个近乎夸张的事实:由「天才少年」和「技术大咖」领衔、核心团队全员清华北大博士,从算法、训练到推理工程、系统与产品,全栈没有一块短板。这种人才密度,在今天的 AI 创业团队里十分少见。

但真正稀缺的,远不是标签的简单相加,真正重要的是算法与工程在同一群人脑子里被彻底打通。Philo AI 敢把“看似不可能”做成,靠的不是堆算力,而是把极致加速建立在对算法的深刻理解之上:只有把模型吃到最透,才知道哪一步能压缩、能省、能并行,系统优化才有的放矢。算法理解得越深,加速就优化的越极致。一个对算法没有彻底理解的团队,再多的卡也换不来这种工程效率。

而这种能力最直接的证明,是速度。创始团队那种“8 个月做进全球前三”的爆发力和天赋,如今在 Philo AI 延续:团队在验证全双工方向时,仅用一周就跑通了实时互动。这种速度是“深刻理解算法 + 全栈打通工程”叠加后的自然结果。

他们押注的新物种:世界生命模型

那么,这群人到底要做什么?答案是一个极富想象力的概念:世界生命模型(World Life Model)。它既不是简单的视频生成,也不是对话式 AI,而是以实时双向视频为交互本体,创造能感知、能记忆、会主动、可共生的数字生命。团队将其概括为三维同时成立:(视频形态与感知)、(记忆与情感)、(主动行为与关系演化)。

这与常见的“数字人”有本质区别。后者多建立在 3D 建模、动捕与预设脚本之上,本质是“驱动一个外壳”;而世界生命模型由基座模型端到端实时生成形象、表情与行为,感知、记忆与主动性内生于模型本身。两者是代际级技术差异,而非同路线迭代。

围绕世界生命模型,团队的思考其实收敛成两条主线。

主线一:把加速推到极致,质变就会发生

第一条,是一个非常第一性的技术判断:当视频的实时推理被推进到一个全新的区间,量变就会引发质变。

今天的视频模型是单向的:输入 prompt、等待、拿到一段视频,交互在生成之前就结束了。但 Philo AI 相信,借助持续的算法优化与一系列自研技术创新,一旦实时生成的延迟低到某个临界点、推理成本压到某个临界点,视频就会从“一段被生成出来的内容”,跃迁为“一个一直在线、能实时双向交互的存在”。这就是全双工(Full Duplex):人与数字生命同时在线、并行收发,模型持续感知、回应,并在用户参与下不断演化;从回合制到连续交互,从被动执行到主动判断何时回应或沉默,从一次性生成到一直在线、随时进入离开、回来时仍在演化。

这一判断正被全球最前沿的团队印证。前 OpenAI CTO Mira Murati 创立的 Thinking Machines Lab 近期提出「交互模型(Interaction Models)」,同样主张交互须原生于模型、实现全双工。不同的是,Philo AI 从第一天就锚定视频模态,把全双工直接做进视频本体。而能不能跨过那个临界点,恰恰取决于团队最稀缺的那种能力:把对算法的深刻理解,转化成别人给不出的推理效率。

主线二:不只是升级现有场景,更要创造新的可能

第二条,关乎这件事能长成多大。

一方面,这项技术可以无缝接入今天已经存在的场景,互动影游、直播、社交、泛内容平台都能被大幅提升:让 AI 不再是工具栏里的一个按钮,而是能感知你、回应你、与你共处的角色,把“情绪价值”和“实时响应”这两件当前生成式 AI 最薄弱的事补上,更深地嵌进这些体验里,带来新的价值。

但真正让团队兴奋的,是另一面:它会创造出今天还不存在的可能。当数字生命能够实时、双向、持续地与人共处,许多过去无法成立的体验会第一次成立,甚至会长出全新的场景、全新的产品、全新的互动与生活方式。团队真正追求的,从来不是把旧场景做得更好,而是去定义那些还没有名字的新场景

数字生命,一直是人类对 AI 终极形态的畅想。从《银翼杀手 2049》的「Joi」到《流浪地球 2》的「图丫丫」,描摹的都是一个能长期陪伴、可共生的存在。Philo AI 想做的,正是把这样的科幻变成现实。而团队真正要回答的那个问题是:视频模型的智能上限究竟在哪里。正如他们一再表达的,终极愿景是实现视频模态的 AGI

结语

人才、算力、算法、工程、产品的多重优势汇聚一身,让 Philo AI 拥有了挑战行业代际变革的底气。以世界生命模型重构数字生命底层逻辑,他们跳出了现有 AI 应用的边界,坚定奔赴视频模态 AGI 的长远目标。据悉,Philo AI 的新一轮融资目前也已接近尾声。

大厂顶尖人才奔赴 AI 创业的浪潮仍在持续。

加入ZF讨论群,请先添加小助手微信

我们相信认知能够跨越阶层,

致力于为年轻人提供高质量的科技和财经内容。

稿件经采用可获邀进入Z Finance内部社群,优秀者将成为签约作者,00后更有机会成为Z Finance的早期共创成员。

我们正在招募新一期的实习生