打开网易新闻 查看精彩图片

2024 年中国大模型格局,以阶跃星辰最新一轮融资曝光画上句号。

作者丨陈彩娴

今天消息,阶跃星辰完成了 B 轮融资,总融资金额达数亿美元。AI 科技评论获悉,此次融资有国资、战略和财务投资人等多家参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。据了解,这笔融资将用于继续投入基础模型研发,强化多模态和复杂推理能力,并通过产品和生态加大覆盖 C 端应用场景,提供丰富的用户体验。

这起融资事件在业内引起了广泛关注。此时距离智谱官宣其完成最新一轮 30 亿人民币的融资才不到一周。上一周,智谱的融资被视为「可能是 2024 年大模型领域最后一笔融资」,但这个预言随着阶跃星辰的融资消息被打破。

不仅如此,阶跃星辰的追赶,也使得未来至少一年内中国大模型的竞争格局将发生肉眼可见的变化:

首先是 200 亿估值的门槛跨越。

在今年 6 月底 AI 科技评论发表的《 》一文中,我们就已提到 200 亿估值对大模型公司来说将是一道槛,跨得过就至少能撑到下一轮牌桌,跨不过则意味着更漫长的消耗与挑战。

据我们了解,智谱是国内第一家跨越 200 亿估值门槛的大模型,此外还有 MiniMax、月之暗面、百川智能。本轮阶跃星辰没有披露其估值,但据 AI 科技评论获悉,阶跃星辰很可能是 2024 年最后一家跨过 200 亿门槛的大模型公司。

其次是回归基座大模型话题,智谱与阶跃成为「基座双雄」的势力格局愈加明晰。

随着过去两年的技术与产品探索,截至 2024 年 12 月,200 亿以上估值的大模型公司在发展路线上越发泾渭分明。这其中,MiniMax 主打出海,月之暗面主打 C 端产品,百川智能转向医疗等垂直领域——「主打」并非「单一」,但在基座大模型赛道,只有智谱与阶跃坚持追求基座大模型的预训练与效果提升,同时积极探索商业模式。

作为一家成立不到两年的公司,阶跃星辰能快速追赶,是令笔者意想不到的。一年前,阶跃星辰还未浮出水面;一年后,这家大模型独角兽已经崛起,成为一股无法忽视的国产大模型力量。

1

大模型的投资逻辑

在得知阶跃星辰或是 2024 年最后一家拿到融资的大模型公司后,惊讶之余,笔者也与国内多位投资人围绕目前国内几家明星大模型公司的融资与估值进行了讨论。

今年年中,业内 VC 投资创业公司 的普遍观点是「追求赔率」,如押某一家公司的 C 端应用,赌其是否能成为爆款。在这种趋势下,上半年 Kimi 概念股的爆发是意料之中,这一阶段的踊跃分子也以 PE 为主。 但 到了 下半年,随着大厂入局用流量浇灌C端应用, 「追求胜率」就成为更受欢迎的观点, 按这套逻辑,继续研发通用基座大模型的公司会有更广阔的市场空间 ,且资方中拥有国资背景的大模型创业公司也被视为这一逻辑下的最佳选择。

今年下半年,在大模型投资愈加冷静的大环境下,智谱与阶跃还能拿到融资,除了两个团队的技术实力使然,或许也是因为其符合当前追求胜率的投资目标。

一位人民币基金的从业者直截了当地评价:「至少智谱与阶跃目前还有投资逻辑,其他家的不确定性高:Kimi 只有 C 端增长,要看投流有没有收益、以及能不能打得过豆包;MiniMax 的角色扮演产品与出海要赌赔率,看能不能爆发。如果赌上市,阶跃与智谱还有胜率。」

「如果走互联网产品的流量逻辑,那么大模型的 C 端产品只有三条路:要么胜出,要么死掉,要么转型。」一位投资者向 AI 科技评论说道。

都知道,AI 2.0 之所以比 AI 1.0 的想象力更大,是因为 AI 1.0 时代公司的技术 能落地的 C 端场景依然不够广泛 ,竞争到最后往往是跟 垂直领域的 传统行业竞争,如安防领域的海大宇、手机领域的虹软,而 AI 2.0 时代大模型 技术落地能进入广泛的互联网产品赛道 ,因此更「Sexy」。但也正是因为跟互联网的逻辑太近,加上 C 端产品有「新鲜感焦虑」,所以目前国内大模型公司在 C 端的收入仍面临重重挑战。

不过,纯 B 端的模式也不受追捧。据 AI 科技评论了解,今年 B 端大模型收入也受到了来自华为、科大讯飞等大厂的竞争,导致一些企业的 B 端收入没有去年高。加上纯 B 端故事不好撑估值,所以一些类 B 端的营收也被放到了 C 端下。

总的来说,对AI2.0时代的创业公司而言,谁能最先推出通用能力最强的基座大模型,成功进入最多的商业化场景中激发C端消费需求,才会成为资本的宠儿。

基座大模型的能力提升仍是当前的重中 之重。即使已经过去两年,技术增长仍是大模型公司吸引融资的一大要素。

当前第一梯队的大模型公司中,只有阶跃与智谱仍追求基座大模型的效果提升,也只有这两家最像 OpenAI。

坚持基座大模型研发,意味着坚持 AGI,才能支撑起更高上限的资本故事和商业化空间。从成果发布来看,智谱依旧在对标 OpenAI 推出新模型,而从年底国际权威榜单 LiveBench 与 LMSYS 来看,阶跃星辰的模型水平也是国内为数不多能与 OpenAI、Anthropic 等国际顶尖大模型公司一较高下的。

其余三家,百川对外讲医疗大模型的故事。相比智谱有唐杰带队与清华子弟兵,阶跃星辰有前微软全球副总裁姜大昕带队加朱亦博与张祥雨等核心骨干。而 MiniMax 与月之暗面都是主打 C 端产品,一个出海、一个对内,相比预训练,产品创新与体验的效果提升优先级更高。

如果再加上上市的考虑,智谱与阶跃也是投资者最青睐的两个标的。背后的原因很简单:「北京跟上海都押一个宝。」一位投资者告诉 AI 科技评论。

根据公开信息与行业分析,智谱的背后主要是北京国资,阶跃背后则是上海国资。在 12 月宣布的最新一轮融资中,智谱的投资方全是国资,由北京海淀区政府的市场化投资平台中关村科学城⽀持。阶跃星辰B轮核心投资方包括上海国有资本投资有限公司及其旗下基金。

纵观「大模型六小虎」背后的资方情况,不难发现各有特色: MiniMax 和月之暗面以互联网投资居多 ,智谱是纯国资加互联网,百川同时吸纳了北京与上海的国资加互联网、但没有洋气的美元基金,阶跃是上海国资、战略和财务投资人,零一万物则是纯美元与外资为主。

作为一家成立不到两年、但死磕基座大模型的创业公司来说,阶跃星辰的进步速度比我们想象地要快很多。 角逐基座大模型其实是一件投入成本高、同时技术挑战大的事情,尤其在国内面临的竞争对手是成立时间最长的大模型独角兽智谱。

在这样一个看似不可能的目标下,阶跃星辰依然能得到投资方的认可,说明实力不可小觑。2025 年,阶跃很可能是智谱最有力的竞争对手。

2

阶跃星辰的筹码:人才与速度

如果将更多的聚光灯给到阶跃星辰,我们惊诧地发现:这家成立不到两年的大模型公司, 在过去的 10个月里 竟 发布了 11 款基座模型;也就是说,他们平均不到一个月就有一次发布,意味着其基座模型迭代的速度飞快,为中国大模型之最。

根据基座模型的能力划分,阶跃星辰的 Step 系列大模型矩阵覆盖了从千亿参数到万亿参数、从语言到多模态、从理解到生成的全方位能力。

在语言大模型上,阶跃星辰先后分布了千亿参数语言大模型 Step-1、万亿参数语言大模型 Step-2 与 Step-1-flash 极速版大模型。

其中,Step-1 只用两个月就一次性训练成功,在逻辑推理、中文知识、英文知识、数学与代码等方面的能力全面超越了 GPT-3.5。Step-1-flash 极速版大模型能够处理上下文长度为 8K 的长文本。Step-2 采用 MoE 架构,是国内首个由大模型创业公司发布的万亿参数语言大模型。

在刚刚过去的 11 月,Step-2 更是在「最难 LLM 评测榜单」LiveBench 上成为唯一进入榜单前十名的中国语言大模型,位列全球第五,超越了 GPT-4o 和 Gemini-1.5,拿下中国第一。

当时同样上榜的大模型还有通义千问和 DeepSeek,但均没有冲进前十,分别位列第十三和第二十三名。上述提到的估值超过 200 亿人民币的第一梯队大模型公司,则除了阶跃星辰外均没有上榜。

打开网易新闻 查看精彩图片

榜单链接:https://livebench.ai/,2024-11-19

语言基座大模型是竞争 AGI 的准入门槛。根据 LiveBench 的结果,阶跃星辰的 Step-2 能成为上榜模型,实力不言而喻。换言之,即使基座大模型的竞争到最后只会剩下少数几家,阶跃星辰的基座模型凭借技术实力也能赢得最终的入场券。

从技术发展的趋势来看,OpenAI 认为,AGI 的实现会分为五个阶段:第一个阶段是聊天机器人,AI 具备语言对话能力;第二个阶段是推理模型,AI 可以解决人类层面的问题;第三个阶段是智能体(Agents),AI 系统可以自主决策与执行;第四个阶段是创新模型,AI 可以自主思考并诞生想法;第五个阶段是智能组织,AI 可以完成组织性的工作。

第五个阶段被认为与当前具身智能对通用机器人的追求重合,即无论是一个人工智能系统或一个机器人,均可以完成一个工种的全流程、而非其中一个或两个步骤。OpenAI 认为,他们现在才处于阶段二,即模型的推理层,代表成果是 o1。

而在国内的学术探讨中,AGI 的实现从阶段一到阶段二的研究目标除了包括思维链在内的模型推理,还有多模态。目前多模态模型的研发还没有一个主导性的思路,多模态不仅包含语言,还包含视觉、以及语言与视觉乃至语音等多个模态的信息对齐,视觉研究人才将在这当中发挥重要作用。

众所周知,阶跃星辰由前微软全球副总裁姜大昕博士创立。 据悉,阶跃在技术上下一阶段的目标是实现多模态理解和生成一体化。 阶跃星辰的研发团队有诸多牛人,包括计算机视觉领域核心奠基工作 ResNet 的二作张祥雨;

此外,大模型的训练需要消耗大量算力, 技术底层系统能力将决定创业公司能否以最高的性价比和效率训练模型。 阶 跃星辰的系统负责人为朱亦博,其先后任职于微软、字节与谷歌,在大规模系统和万卡集群方面有丰富的实践经验。

不同于 AI 1.0,AI 2.0 时代的基座大模型在预训练中不仅要求算法能力强、也要求底层系统的高效与稳定性。国内同时兼顾算法与系统方面强势人才的大模型公司并不多,阶跃星辰是之一,这也是为什么过去一年阶跃星辰不仅在语言基座大模型、同时在多模态大模型上也频繁发布研究成果的原因。

过去一年,阶跃星辰在多模态领域已经发布了 8 个大模型,包括:

两款多模态大模型 Step-1V 与 Step-1.5V,其中 Step-1.5V 是在 Step-1V 的基础上迭代,从图像理解升级到了视频理解。今年 11 月,LMSYS Org 发布 Chatbot Arena 最新榜单,Step-1V 上榜位列视觉领域中国大模型第一,总分跟 Gemini-1.5-Flash-8B-Exp-0827 持平,超过国内所有大模型公司。

一款图像生成大模型 Step-1X,其具备强大语义理解与图像创意实现能力,可用于各种图像创作与设计任务。

两款视频模型:Step-1.5v-turbo 视频理解模型与 Step-Video 视频生成模型,不仅能准确识别并理解视频中所出现的物体、人物和环境,具备突出的指令跟随能力,还能文生视频,生成 1080P 长达 10s 的高清视频,尤其擅长生成具有中国风美学效果的视频。

除了文图与视频,阶跃星辰还发布了三款语音大模型:Step-tts-mini 语音复刻和生成大模型、Step-asr 语音识别大模型与 Step-1o Audio 语音大模型。其中,Step-tts-mini 只需上传 5s 音频就能进行生动形象的音色复刻,Step-1o Audio 是国内首个千亿参数端到端语音大模型、支持语音与文本的混合输入与输出。

国内大模型创业公司极少同时兼顾语言、图像、视频与语音等多个模态的基座模 型,目前看来,阶跃星辰的 基座模型研发还在持续加速 ,体现了其坚持追求 AGI 的理想与决心。

值得注意的是,不断打磨基座模型的同时,阶跃星辰在将技术应用落地上也有独特思考。

毫无疑问,大模型会衍生出全新的商业模式,目前各家都还在探索中。据观察,当前阶跃星辰的尝试是通过自研与帮助生态伙伴的方式去打造 C 端超级应用。

目前阶跃星辰最广为人知的自研 C 端产品是智能助手「跃问」。

同时,他们也与客户进行了更深入的合作,比如在金融领域与财联社成立合资公司「财跃星辰」一起打造了 C 端应用「AI 小财神」。后者的合作形式不是只提供 API、解决方案或私有化部署,所以跟 AI 1.0 时代的纯 B 端打法也有所不同。

目前跃问已经 接入 Step-2 万亿参数大模型和 Step-1.5V 多模态模型,具有智能搜索、拍照答疑、高效阅读、写作、翻译等能力,而且率先将 多模态功能「拍照问」 接入了 iPhone 16 的「相机控制」, 实现了 真正意义上的「智能视觉搜索」。

OpenAI 预言 AGI 的下一个阶段是智能体,某个意义上,阶跃星辰基于 Step 自研基座模型所打造的「跃问」、或「AI 小财神」应用,也是在探索 AGI 时代的智能体。比如,「AI小财神」能够为用户提供包括 AI 数据挖掘、AI 对话、AI 热点信息和财报解读等功能。

在开发者生态中,阶跃星辰开放平台也推出了「繁星计划」,帮助开发者打造 AI 应用。据了解,网红 AI 应用「胃之书」、国内首款 C 端 AI 电商应用「物圆」、AI 科研大模型专业社区「ReadPaper」、AI 心理陪伴应用「林间聊愈室」、面向胰腺癌肿瘤患者的智能 RAG 平台「小胰宝」等等应用都是基于阶跃星辰的 Step 大模型。

中国第一梯队的大模型公司中,原先智谱、MiniMax、月之暗面与百川智能独占鳌头,花开四朵、各表一枝。一年过去,大浪淘沙,百川退出预训练模型的竞争队伍,月之暗面与 MiniMax 的优先级在产品,只有智谱与阶跃有实力、有决心对标 OpenAI,坚持研究基座大模型。

在不远的未来,模型效果仍是决定上层应用的关键因素。基座大模型双雄,北有智谱、南有阶跃,孰胜孰败一时还难以分晓,不如将答案交给时间。

打开网易新闻 查看精彩图片

更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。