Skywork Super Agents：Agent范式正在重构Token经济

人工智能（885728）+生态大会（AIEC 2026）于6月16日在北京中关村展示中心举行。本届大会由清华大学全球产业研究院主办，中关村科学城管委会支持，汇聚了来自清华大学、国家信息中心、IDC、阿里云、腾讯、月之暗面、火山引擎、浪潮信息（000977）、美的、上海人工智能（885728）实验室、阶跃星辰、百川智能（002455）等知名机构和领先企业的专家代表，以及Dify、中关村A（399422）I北纬社区、DataWhale等生态社区的开发者。

16日下午，昆仑万维（300418）旗下Skywork首席科学家刘扬在智算中心与Token服务的主题论坛上，发表了以《Skywork Super Agents演进之路和Agent大模型的思考》为题的演讲，系统回顾了产品上线的历程，并分享了关于Agent大模型本质与未来的思考。

1 产品迭代思路：从“深度研究”到“办公场景”的演进

刘扬在开场中指出，Agent的范式正在完全重构Token的经济——Token的使用量、Token的使用方式都发生了根本变化。

在传统ChatBot模型上线的阶段，团队最关心的关键指标是QPS、单位时间收到的Query数量，因为这直接决定了需要部署多少GPU。然而，进入Agent范式后，这些指标已不再那么重要。“因为你的每次Query到底执行消耗多少Token，不确定性是非常高的，Multiplier是非常大的。”

团队之所以选择拥抱Agent，正是因为它虽然消耗大量Token，却能够实现端到端的交付。2024年底，Skywork迭代了一款推理能力较强的模型。当团队发现模型真的可以在长序列中输出50K Token、100K Tokens，甚至更多，进行多步思考和复杂问题推理时，他们意识到模型可以做更多复杂的任务。

从2025年2月开始，团队正式向办公场景的Agent方向迭代。5月份，Skywork Super Agents发布了五个专项Agent，分别解决Word、PowerPoint、Excel、网页和博客的生成需求，真正让大家在工作中用起来。

8月，团队将Agent能力拓（RIO）展到多模态。这次升级后，Skywork在BrowseComp（基于浏览器的研究榜单）上表现突出，基本能力进入第一梯队，与OpenAI O4、GLM4.5、Grok等前沿模型匹配。此外，团队还研发了并行思考技术——从种子节点开始并行思考，经过一段时间Token消耗后动态剪掉不适合的线路，实现智能的Token选择。

11月，团队完成了表格功能的升级。刘扬指出，Excel是微软（MSFT）三件套中最难攻克的，因为表格对数字准确性要求极高，而大模型的Token逻辑与人类数学逻辑不同，经常有一定概率出错。直到11月，团队才解决了表格准确性问题。

2026年，团队受OpenClaw启发，推出Skywork桌面版，将服务从浏览器端搬到了本地端。用户无需频繁上传文件，只要给予权限即可让模型在本地处理任务，大大降低了Token消耗和上传文件量。同时，针对用户反馈的“Token焦虑”，团队将Token使用分为不同阶段，部分阶段允许无限量使用，其他阶段则适当节约。

2 思考：Agent的本质与生态重构

1. Agent的本质：泛化过程，而非仅泛化结果

刘扬提出一个问题：Agent的本质是不是通用智能？他认为可能是，但可能还没有到达那个点。他对比了以往的大模型乃至更早的机器学习模型——本质是结果的验证，通过监督学习从大量数据中获取泛化性。而Agent让人感觉离智能更接近，是因为它不仅在泛化结果，更在泛化过程。

因此，Agent的训练不仅强调最终输出是否漂亮，还要关心中间环节——是否搜到了合适的结果、是否对文件做了正确处理、是否从网页找到了确切信息。这需要大量的过程监督，使得Agent比较擅长结构化推理和多轮工具调用等任务。

2. 过程监督的难点与拐点

过程监督非常困难。刘扬举例说，团队在学习训练模型时想告诉模型“这个搜索信源是好的”，但如何定义“好”并没有正确答案，只能通过代理信号来判断——比如网站访问量、权威性、是否有作者署名等。团队只能用人类已有的知识和经验来定义过程监督，但并不能告诉模型怎样的监督和学习过程是最优的。

他同时指出，拐点正在到来。从机器学习早期“背答案”到“背过程”，再到当前通过训练范式的迭代，模型已经在Harness框架下能够做到“发现新过程”。例如Claude Code或Codex中的“Goal”功能——不需要指明具体做法，只需告诉模型“现在评测只有80分，我需要达到85分，你自己想办法解决”。此外，很多数据供应商已不再只提供题目和答案，而是将解答过程和整个流程交付给模型团队学习。刘扬认为，拐点就在这里——未来人类过程的经验正在被重视和积累，并用于模型训练。

3. AI Office是理想场景，垂类领域需重建过程数据

刘扬认为，AI Office是非常好的逻辑场景——流程稳定、跨行业适用，不同行业的用户写报告和PPT时关心的点都非常一致。对于垂类场景（如医疗、法律），核心是要重建垂类领域的过程数据。例如做律师Agent，就需要知道律师在写合同时会参考哪些文件、走过哪些步骤。

4. 组织和人才的重构

刘扬认为，整个过程中组织和人才都在被重写。流程和过程数据正成为可验证的数据，而岗位本质上就是Agent要执行的上下文。真正的人力将更多投入到“掌控过程发明”和“掌控过程定义”上，而非重复执行流程或重复劳动。

“重复的岗位会消失，设计的岗位会兴起，人类会逐渐过渡为过程的架构师。”他总结道，过去20年互联网积累了创作类和结果导向的数据，而Agent和过程类数据的重要性正在被意识到，未来会系统性地见到工作中过程数据的崛起。

5. SkyClaw模型：轻量、低价、闭环实践

在分享的最后，刘扬介绍了团队在2026年5月推出的SkyClaw模型，这是为SuperAgents以及使用Claude Code或OpenClaw的用户定制的轻量级模型。相比Minimax 2.7或Qwen 3.6系列，定价低于一半以上，性能远超对比模型。

刘扬强调，Agent模型对工具调用质量要求非常高，注重过程而非简单的输入输出回答。在训练链路中，从数据准备、模型训练到线上服务，全程让Agent参与——数据生产、清洗都由Agent自己提升，模型训练中的指标问题和Bug也由Agent帮助解决。

他分享了三步骤迭代法：第一步，让模型确认能力（自然语言确认）；第二步，不要求模型一步给出最优答案，而是同时给出一个最小可执行版本，这对降低模型负担非常有用；第三步，在这个版本之上让模型在环节中反复验证和提升。

3 结语

从2024年底的推理模型，到2025年初的Deep Research，再到2026年的Skywork 2.0本地化版本和SkyClaw轻量模型，Skywork团队在Agent这条路上经历了密集的迭代与深入的思考。Token经济被重构、过程监督被重视、人类角色被重新定义——这些变化正在发生，而天工超级智能体正置身于这一演进的前沿。

Skywork Super Agents：Agent范式正在重构Token经济中性

问财摘要

1

产品迭代思路：从“深度研究”到“办公场景”的演进

2

思考：Agent的本质与生态重构