告别 Agent“响应慢、不稳定”：阶跃星辰发布 Step 3.5 Flash，直击智能体开发痛点|agent|flash|step|智能体|阶跃

2月2日，阶跃星辰发布并开源最新基座模型 Step 3.5 Flash，该模型旨在为开发者提供更稳定可靠且兼顾性价比的智能体（Agent）底层支撑，让 Agent 能够更加高效地实现规模化，真正融入日常开发工作。Step 3.5 Flash 采用了稀疏混合专家（MoE）架构，总参数量达1960亿，每个 Token 仅激活约110亿参数，实现了推理能力与运行效率的平衡，显著提升了模型在复杂 Agent 工作流中的响应速度。

随着越来越多开发者正在从单纯提示词工程转向 Agent 和 Workflow 的构建，共性瓶颈也出现了：尽管底层模型强大，但在规模化场景下往往不够稳定、响应过慢、成本过高。Step 3.5 Flash 为此进行了专项优化，在单请求代码类任务上，最高推理速度可达每秒350个 token，可满足多步推理中的低延迟响应需求。

在针对智能体能力的 τ²-Bench、BrowseComp 等测试，以及 LiveCodeBench V6代码挑战和 AIME 2025数学竞赛中，Step 3.5 Flash 均取得了亮眼成绩，且在 Agent 场景和数学任务上极具竞争力。这意味着当其面对需要结构化输出的多步推理、复杂逻辑求解、后端自动化和长时间运行等任务时，已具备支持企业级应用落地能力，尤其适用于高频工具调用和对行为可预测性有强要求的系统环境。

在实际应用场景中，Step 3.5 Flash 展示了强大的自动编程与“端云协同”能力。比如，它不仅能基于自然语言指令自动构建复杂的可视化地理空间系统，还能作为“云端大脑”将复杂的用户需求拆解为多个子任务，协同本地设备高效完成跨平台数据分析与决策支持。此外，为了满足开发者对数据隐私和本地算力应用的需求，该模型还针对本地部署进行了性能优化，支持在 NVIDIA DGX Spark、Apple M3/M4 Max 以及 AMD AI Max+ 395等主流个人工作站上流畅运行。

Step 3.5 Flash 已在 OpenRouter、GitHub 及阶跃AI APP 和网页端同步上线，面向开发者提供免费试用与快速部署支持。

值得关注的是，阶跃星辰还披露了下一代模型 Step 4的最新进展，表示目前 Step 4的训练工作已经启动，公司将邀请开发者深度参与共建，共同定义下一代 Agent 基础模型。目前，阶跃星辰已围绕 AI+终端体系发布了超30款模型，重点发力语言基础大模型，及多模态和端云结合方向。就在本月，阶跃星辰刚发布了视觉语言模型 Step-3 VL-10B，性能达到同规模 SOTA 水平，以及原生语音推理模型 Step-Audio-R1.1在 Artificial Analysis Speech Reasoning 榜单上登顶全球第一。