据阶跃星辰消息,阶跃星辰正式发布并开源新一代Step 3.7 Flash模型。该模型并非单纯追求速度或成本的轻量模型,而是围绕Agent生产化需求,系统优化了在复杂多模态任务、工具调用及生态兼容等方面的能力,旨在为开发者提供构建生产级Agent的高效率基座。
面向生产级Agent优化的四大能力
Step 3.7 Flash针对Agent从演示走向真实生产环境的核心挑战,重点强化了四大能力:
1. 原生多模态理解与执行:模型能原生理解UI、图表、文档、图片和应用界面,将复杂视觉信息转化为结构化结果、代码生成和可执行任务。在面临不确定信息时,可自主发起搜索进行交叉验证。
2. 联网与视觉搜索增强:强化了联网检索与图像搜索能力,使模型能在开放信息环境中,主动获取并交叉比对文本与图像等多源证据。
3. 高可靠工具调用与编排:在长程多轮Agent工作流中,能稳定调用API、浏览器、终端、Office工具和外部系统,保持任务轨迹一致,降低执行失败风险。在Toolathlon、ClawEval-1.1、GDPval及τ -bench Telecom等评测中均表现出色。
4. Agent生态兼容优化:针对Claude Code、KiloCode、OpenClaw、Hermes Agent等主流Agent框架,以及MCP/Skills等工具调用协议和开发链路进行了兼容优化,以降低模型接入和工作流编排成本。
性能与效率表现
模型采用稀疏MoE架构,总参数196B+1.8B(ViT),激活参数仅11B,在能力、成本与效率间寻求平衡。其最高生成速度可达400 Tokens/s,适合高频、多轮、低延迟的Agent应用场景。
部署与生态进展
Step 3.7 Flash支持云端与本地部署,并针对本地运行进行了优化。模型已在Kilo Code、Nous Research等生态项目中完成接入验证,并正与Fireworks AI、DeepInfra等更多AI基础设施平台推进适配。开发者可通过Model Page、GitHub、Huggingface、Modelscope等平台获取模型,并通过阶跃星辰的国内外开放平台API进行接入。
阶跃星辰表示,未来将围绕Step 3.7 Flash发布更多技术内容与案例,与开发者共同探索Agent的生产化路径。
原文:阶跃发布 Step 3.7 Flash,面向生产级 Agent 的高效率 Flash 模型(来源:阶跃星辰)
