2月2日,阶跃星辰发布并开源最新基座模型 Step 3.5 Flash,该模型旨在为开发者提供更稳定可靠且兼顾性价比的智能体(Agent)底层支撑,让 Agent 能够更加高效地实现规模化,真正融入日常开发工作。Step 3.5 Flash 采用了稀疏混合专家(MoE)架构,总参数量达1960亿,每个 Token 仅激活约110亿参数,实现了推理能力与运行效率的平衡,显著提升了模型在复杂 Agent 工作流中的响应速度。

打开网易新闻 查看精彩图片

随着越来越多开发者正在从单纯提示词工程转向 Agent 和 Workflow 的构建,共性瓶颈也出现了:尽管底层模型强大,但在规模化场景下往往不够稳定、响应过慢、成本过高。Step 3.5 Flash 为此进行了专项优化,在单请求代码类任务上,最高推理速度可达每秒350个 token,可满足多步推理中的低延迟响应需求。

打开网易新闻 查看精彩图片

在针对智能体能力的 τ²-Bench、BrowseComp 等测试,以及 LiveCodeBench V6代码挑战和 AIME 2025数学竞赛中,Step 3.5 Flash 均取得了亮眼成绩,且在 Agent 场景和数学任务上极具竞争力。这意味着当其面对需要结构化输出的多步推理、复杂逻辑求解、后端自动化和长时间运行等任务时,已具备支持企业级应用落地能力,尤其适用于高频工具调用和对行为可预测性有强要求的系统环境。

在实际应用场景中,Step 3.5 Flash 展示了强大的自动编程与“端云协同”能力。比如,它不仅能基于自然语言指令自动构建复杂的可视化地理空间系统,还能作为“云端大脑”将复杂的用户需求拆解为多个子任务,协同本地设备高效完成跨平台数据分析与决策支持。此外,为了满足开发者对数据隐私和本地算力应用的需求,该模型还针对本地部署进行了性能优化,支持在 NVIDIA DGX Spark、Apple M3/M4 Max 以及 AMD AI Max+ 395等主流个人工作站上流畅运行。

Step 3.5 Flash 已在 OpenRouter、GitHub 及阶跃AI APP 和网页端同步上线,面向开发者提供免费试用与快速部署支持。

值得关注的是,阶跃星辰还披露了下一代模型 Step 4的最新进展,表示目前 Step 4的训练工作已经启动,公司将邀请开发者深度参与共建,共同定义下一代 Agent 基础模型。目前,阶跃星辰已围绕 AI+终端体系发布了超30款模型,重点发力语言基础大模型,及多模态和端云结合方向。就在本月,阶跃星辰刚发布了视觉语言模型 Step-3 VL-10B,性能达到同规模 SOTA 水平,以及原生语音推理模型 Step-Audio-R1.1在 Artificial Analysis Speech Reasoning 榜单上登顶全球第一。