生成式AI迎来窗口期，阶跃星辰加速冲刺｜钛媒体AGI|agi|大模型|模态|知名企业|钛媒体|阶跃

（图片来源：跃问视频demo）

生成式 AI 领域的技术竞赛不断加剧，已进入到“白热化”阶段。

今年以来，OpenAI接连发布Sora、GPT-4o、o1系列等多款模型，引发关注。此外，Runway 发布全新图像模型 Framer、Midjourney 准备发布 V7 版本、Claude 3.5 模型升级，而英伟达公布全新AI音频模型Fugatto。

回到国内，字节跳动、百度、腾讯等大厂接连公布大模型技术和产品进展，开始用大模型实现“卖云”的增值。

国内大模型创业公司也在加速狂奔。

钛媒体App获悉，11月27日，专注于通用人工智能大模型（AGI）研发的公司“阶跃星辰”（StepFun），日前已悄然开启视频生成模型 Step-Video 内测，用户可通过“跃问”官网的“跃问视频”产品进行点击申请，且第二版视频生成模型已经在研发中。

公开资料显示，这家行事低调的大模型独角兽，在8个月内接连发布了至少6款基座模型，且近期多款模型因为强悍的技术实力在国际上大放异彩。

短短一周内，阶跃星辰多模态理解大模型Step-1V、万亿参数语言大模型Step-2分别跻身全球权威大模型评测基准榜单LMSYS大模型竞技场 Chatbot Arena和LiveBench前列，皆位列中国大模型第一。

其中，Step-1V在LMSYS Chatbot Arena上，总分跟 Gemini-1.5-Flash-8B-Exp-0827 持平；Step-2在LiveBench榜单上的成绩逼近 OpenAI 的 o1-mini-2024-09-12，超越 gpt-4o-2024-08-06 等国际主流模型，也是唯一进入榜单前十名的中国语言大模型。

（图片来自 LiveBench 官网，截至今年11月19日数据）

“狂飙”600余天，阶跃星辰建立全面模型矩阵

11月30日，OpenAI将迎来AI聊天机器人ChatGPT发布两周年之日。

回顾过去两年，ChatGPT引爆了全球新一轮 AI 大模型“造模”热潮。《全球数字经济白皮书（2024年）》报告显示，目前，全球AI大模型数量已达1328个，其中美国占比最多达44%，中国占36%，这两个国家已经牢牢占据大模型领域的第一梯队。

全球AI大模型市场的竞争格局日益激烈。

在这一轮生成式AI热潮中，国内最先起跑的是创业公司。成立于2023年4月的阶跃星辰，在600多天的时间里，已形成行业领先的综合技术实力。

包括近期低调内测的Step-Video在内，阶跃星辰已经推出了Step系列通用大模型矩阵，涵盖从千亿到万亿参数、从理解到生成、从语言到多模态的全方位能力：

Step-1千亿参数语言大模型：两个月一次性训练成功，已完成充分打磨，在逻辑推理、中文知识、英文知识、数学、代码方面的性能全面超越 GPT-3.5。
Step-1V多模态大模型：性能比肩 GPT-4V，可以精准描述和理解图像中的文字、数据、图表等信息，并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。
Step-2 万亿参数语言大模型：采用MoE架构，聚焦深度智能的探索，这是国内首个由创业公司发布的万亿参数语言大模型。Step-2 在语言生成上对细节有极强的控制力，模型能够更好地理解和遵循人类指令。
Step-1.5V多模态大模型：在Step-1V的基础上进行了迭代，具备更强大的多模态理解能力，实现了从图像理解到视频理解的跨越升级。
Step-1X图像生成大模型：具有强大语义理解与图像创意实现能力，可用于各种图像创作和设计任务。
Step-Video视频生成大模型：支持文生视频，可生成 1080P 长达 10s 的高清视频，在语义理解、指令遵循、运动、中国风美学生成上效果突出。目前模型已经接入“跃问视频”并开始内测。

从上述两个demo片段中，我们可以看到，无论是语义理解能力，细节运动符合物理规律，还是清晰度，阶跃星辰的Step-Video视频生成模型均达到业界先进水平。

事实上，在大模型“六小虎”中，阶跃星辰以多模态模型技术实力强劲著称。根据阶跃星辰创始人、CEO姜大昕的规划，阶跃星辰实现AGI的技术路线是：“单模态 — 多模态 — 多模理解和生成的统一 — 世界模型 — AGI”。

他曾多次强调，只有解决了多模态理解生成一体化，才能彻底建立一个世界模型，再往后才能跟具身智能结合，最终实现AGI，以此提升社会、经济产业的能力与价值。

2028年超4万亿规模，大模型加速技术落地

据研究机构IDC最新数据显示，预计到2028年，全球 AI 产业支出将达到6320亿美元（约合人民币4.58万亿元），几乎是当前的两倍，5年间复合年增长率 (CAGR) 达29%。

其中，生成式AI成为最大的增长引擎，到2028年该领域投资支出高达2020亿美元，占整个 AI 支出的32%，CAGR达59.2%。

不过，当前生成式AI产业仍处于非常早期的阶段。

中国工程院院士、北京大学博雅讲席教授、鹏城实验室主任高文认为，如果以“人”来相比，AGI现在可能还是刚刚会走路的幼儿状态。但从使用角度看，AI已经能解决生产、社会、服务的问题，可以先用起来，没有必要等到十全十美再去用，要把它逐步的开发、完善、迭代。

越来越多的开发者和企业开始基于阶跃星辰的大模型矩阵打造AI应用。阶跃星辰开放平台逐渐形成了一个大模型“生态伙伴圈”。金融财经、内容创作、消费娱乐等领域的头部机构纷纷跟阶跃星辰达成技术合作。其中，财联社跟阶跃星辰共同打造了国内首个千亿参数多模态金融大模型“财跃F1金融大模型”。

开发者则通过阶跃星辰的 Step 系列大模型尝试新的产品形态。独立开发者赵纯想将包括网红AI应用“胃之书”在内的三款产品都接入了阶跃星辰 Step 系列大模型，原因是胃之书早期对国内所有大模型做了产品 AB test 测试，他发现使用阶跃星辰的模型，用户付费率最高；AI 心理疗愈应用“林间聊愈室”则是基于阶跃星辰多模态大模型的图片理解能力，上线了呼声已久的 AI 识图功能，用户可以跟小动物分享自己的生活场景、状态等，林间聊愈室CEO李神龙表示，接入新功能之后，比较明显的是付费率确实上涨了。

下一步，我们相信，阶跃星辰这类坚持AGI底层技术探索，加速模型应用落地的公司，将成为AGI时代的关键“推手”，同时也是AGI产业的技术领先者。

智能阶跃，十倍每一个人的可能。

（本文首发于钛媒体App，作者｜林志佳，编辑｜胡润峰）