经历了在风口期的密集下注,大模型领域的投融资已然收紧,谁能最终闯进AGI决赛圈成为资本关注的焦点。在这一背景下,两家大模型初创公司在年末斩获了大额融资。
继12月17日智谱官宣完成30亿元人民币新融资后,阶跃星辰近日也完成了B轮融资,总融资金额达数亿美元。此次融资有国资、战略和财务投资人等,核心投资方包括上海国有资本投资有限公司及旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。
据悉,阶跃星辰的这笔融资将用于继续投入基础模型研发,强化多模态和复杂推理能力,并通过产品和生态加大覆盖C端应用场景,提供丰富的用户体验。
据了解,在国内大模型领域的最新两笔融资中,来自南北两大“超级城市”的国资分别出手:阶跃星辰得到了上海国有资本投资有限公司及旗下基金的支持,北京市海淀区政府的市场化投资平台中关村科学城再度加注智谱。“北京、上海各自押宝,这两家公司稳稳进入‘决赛圈’了。”一位AI领域投资机构的从业者表示。
大模型注定是一场高投入的长线战争,它疯狂地消耗着场上每位玩家的物质资源和人才技术储备。此前,百模大战让月之暗面、智谱、阶跃星辰、MiniMax、零一万物和百川智能这“AI六小强”脱颖而出,进入了和互联网巨头比拼的AI竞逐战。
而“六小强”也因过去一年中的不同选择分化出了新格局,其中阶跃星辰和智谱持续投入基座大模型的研发和迭代,已成为基座大模型的“南北双雄”。对于模型能力的重要性,阶跃星辰创始人、CEO姜大昕曾表示,“当具体到某一个应用的时候一定要通用模型跟它深度绑定,才能做到极致。”
“六小强”分化 阶跃星辰何以受国资青睐?
作为今年最为炙手可热的赛道,我国大模型领域涌现出投资热,尤其体现在今年上半年。IT桔子的统计数据显示,今年1月至7月,我国大模型领域月平均融资事件数约5.4起,而在10月、11月回落至2起和3起。
在资本市场的理性回归之中,12月底阶跃星辰和智谱最新完成的两笔大额融资获得了外界极高的关注度。
从股东构成来看,两家背后的国资足以证明业界、市场对它们技术路线和发展前景的看好。据了解,阶跃星辰的投资方较为多元,本次B轮融资中出现了国资、互联网巨头和多家专注前沿科技的专业投资机构。
作为阶跃星辰最新一轮融资中的国资,上海国有资本投资有限公司在今年10月设立了上海人工智能生态基金,该基金总规模达100亿元,首期投资30亿元。
“(阶跃星辰、智谱)稳稳进入‘决赛圈’了,更多元的股东结构也会给阶跃星辰提供更大的灵活性和发展空间。”一位AI领域投资机构从业者表示,受国资青睐的大模型独角兽将在资金和市场机会等方面具有明显优势。
那么,受到国资青睐的为什么是智谱和阶跃星辰?两者不谋而合的发展方向或是关键答案。
“过去说百模大战,现在肯定没有百模在做预训练了。”零一万物创始人李开复在今年10月曾透露过大模型预训练的高昂成本,“一次约三四百万美元。”正因如此,大部分AI创业公司早已停止预训练。
此外,以模型能力暂时取胜的“AI六小强”也进行了不同的优先级排序,例如部分公司的重心是打造“超级应用”、开拓海外市场或主攻垂类场景等。而智谱和阶跃星辰选择持续投入基座大模型。基座大模型的通用性意味着更高的商业化天花板,此外,AI时代超级 App 的出现也高度依赖模型效果。
一位AI投资人在今年7月表示,大模型基础能力的进展比大家想象中更缓慢,但应用最后还是依赖于基础模型的能力,如果基础模型没有更好的能力,应用就很难做出更好的用户体验。
12月15日,阿里旗下大模型通义千问的算法专家在社交媒体上公开表示,对国内大模型公司而言,预训练时代还没有结束。
一位接近阶跃星辰的人士表示,内部判断现阶段依旧是模型能力决定产品上限,坚持预训练和基座大模型的研发是通往AGI路上的必然选择。据了解,在内部构成上,目前阶跃的研发人员占比超80%。
“南阶跃、北智谱” 基座大模型呈现双强新格局
伴随着“AI六小强”的分化,“南阶跃、北智谱”的基座模型双强新格局已经出现。
创始人鲜少露面、不对外透露融资信息、首次出现在公众视野时已达10亿美元估值的阶跃星辰,常被外界看作是最为低调的大模型独角兽,在舆论场中少有声音。
然而,阶跃星辰在模型擂台上动作频频、表现抢眼。在过去10个月中,阶跃星辰一共发布了11个自研基座模型,包含语言(千亿参数和万亿参数)、图像理解、图像生成、视频生成、多模态理解、语音复刻和生成、语音识别、端到端语音等基座模型。
阶跃星辰仅用了16个月,就成为国内少数已经形成从理解到生成、从文本到多模态的全系列模型矩阵的大模型创业公司之一。
而成立于2019年的智谱,是国内最早对标Open AI开启探索基座大模型的公司之一,也在不断探索和丰富着自己的模型能力。智谱分别在今年1月和8月,推出了新一代基座大模型GLM-4和GLM-4-Plus,并先后发布对标Sora的视频生成模型CogVideoX,以及对标GPT-4o的GLM-4-VideoCall和端到端语音模型GLM-4-Voice。今年12月,智谱推出了其首个免费多模态模型GLM-4V-Flash。
不难看出,我国基座大模型的南北双雄在模型矩阵上布局全面,是少数能在模型丰富度上对标OpenAI的大模型独角兽。
从模型能力上来看,阶跃星辰的语言大模型Step-2在今年3月发布,是国内首个由大模型创业公司发布的万亿参数模型。
在2024年11月19日发布的LiveBench测评榜单中,该模型位列国产基座大模型榜首,成绩逼近 OpenAI 的o1 mini,是唯一进入榜单前十名的中国语言大模型,位列全球第五。LiveBench因其更新频率和客观的评分体系,被创始团队定义为“具有挑战性、无污染的LLM基准测试”。
在姜大昕的规划中,阶跃星辰实现AGI的技术路线将是:“单模态—多模态—多模理解和生成的统一—世界模型—AGI”。姜大昕也曾多次公开表示,公司要以模型和应用进行双轮驱动。而在模型研发上的快速迭代和技术积累或将让阶跃星辰在模型的落地应用上抢占先机。
据了解,目前阶跃星辰的发展战略是“超级模型+超级应用”。不同于智谱偏向B端市场的落地尝试,阶跃星辰主要通过自研和生态合作的模式面向C端市场发力。
可以看到的是,阶跃星辰推出了自研智能助手“跃问”等C端产品,尝试用大模型技术创造新的用户体验;同时,阶跃星辰与包括荣耀、OPPO、中文在线、中国知网在内的多家知名企业进行合作,在金融、内容创作、智能终端等领域向用户提供创新智能服务。
据了解,2024年下半年阶跃星辰的多模态API调用量增长了超45倍,一众开发者正基于其多模态大模型开发C端应用,例如AI应用“胃之书”、 AI心理疗愈应用“林间聊愈室”,以及社交媒体上热度较高的AI应用“歌词爆改机”等。
其中,“胃之书”的开发者赵纯想曾公开表示,在构建应用时曾采用A/B测试策略,根据对比结果选择了阶跃星辰模型,“为不同用户分配不同模型,再比较不同模型在实际应用中的表现,特别是用户的付费行为。”
资本、开发者和用户正在用脚投票,基座大模型双强新格局之下,阶跃星辰集结人才、技术能力和物质储备,怀揣着耐心和决心向AGI继续探索。
文/辛夷
热门跟贴