Skywork Super Agents:Agent范式正在重构Token经济中性

2026-06-18 18:14:20
作者:昆仑万维
分享
AIME

问财摘要

1、人工智能+生态大会(AIEC 2026)在北京中关村展示中心举行,汇聚了众多知名机构和领先企业的专家代表。 2、昆仑万维旗下Skywork首席科学家刘扬在智算中心与Token服务的主题论坛上,发表了关于产品迭代思路和Agent本质的演讲。 3、他指出,Agent的范式正在完全重构Token的经济,并分享了Skywork团队在Agent这条路上的迭代与思考。
免责声明 内容由AI生成
文章提及标的
百川股份--
人工智能--
中关村A--
浪潮信息--
昆仑万维--
力拓--

人工智能(885728)+生态大会(AIEC 2026)于6月16日在北京中关村展示中心举行。本届大会由清华大学全球产业研究院主办,中关村科学城管委会支持,汇聚了来自清华大学、国家信息中心、IDC、阿里云、腾讯、月之暗面、火山引擎、浪潮信息(000977)、美的、上海人工智能(885728)实验室、阶跃星辰、百川智能(002455)等知名机构和领先企业的专家代表,以及Dify、中关村A(399422)I北纬社区、DataWhale等生态社区的开发者。

16日下午,昆仑万维(300418)旗下Skywork首席科学家刘扬在智算中心与Token服务的主题论坛上,发表了以《Skywork Super Agents演进之路和Agent大模型的思考》为题的演讲,系统回顾了产品上线的历程,并分享了关于Agent大模型本质与未来的思考。

1

产品迭代思路:从“深度研究”到“办公场景”的演进

刘扬在开场中指出,Agent的范式正在完全重构Token的经济——Token的使用量、Token的使用方式都发生了根本变化。

在传统ChatBot模型上线的阶段,团队最关心的关键指标是QPS、单位时间收到的Query数量,因为这直接决定了需要部署多少GPU。然而,进入Agent范式后,这些指标已不再那么重要。“因为你的每次Query到底执行消耗多少Token,不确定性是非常高的,Multiplier是非常大的。”

团队之所以选择拥抱Agent,正是因为它虽然消耗大量Token,却能够实现端到端的交付。2024年底,Skywork迭代了一款推理能力较强的模型。当团队发现模型真的可以在长序列中输出50K Token、100K Tokens,甚至更多,进行多步思考和复杂问题推理时,他们意识到模型可以做更多复杂的任务。

从2025年2月开始,团队正式向办公场景的Agent方向迭代。5月份,Skywork Super Agents发布了五个专项Agent,分别解决Word、PowerPoint、Excel、网页和博客的生成需求,真正让大家在工作中用起来。

8月,团队将Agent能力拓(RIO)展到多模态。这次升级后,Skywork在BrowseComp(基于浏览器的研究榜单)上表现突出,基本能力进入第一梯队,与OpenAI O4、GLM4.5、Grok等前沿模型匹配。此外,团队还研发了并行思考技术——从种子节点开始并行思考,经过一段时间Token消耗后动态剪掉不适合的线路,实现智能的Token选择。

11月,团队完成了表格功能的升级。刘扬指出,Excel是微软(MSFT)三件套中最难攻克的,因为表格对数字准确性要求极高,而大模型的Token逻辑与人类数学逻辑不同,经常有一定概率出错。直到11月,团队才解决了表格准确性问题。

2026年,团队受OpenClaw启发,推出Skywork桌面版,将服务从浏览器端搬到了本地端。用户无需频繁上传文件,只要给予权限即可让模型在本地处理任务,大大降低了Token消耗和上传文件量。同时,针对用户反馈的“Token焦虑”,团队将Token使用分为不同阶段,部分阶段允许无限量使用,其他阶段则适当节约。

2

思考:Agent的本质与生态重构

1. Agent的本质:泛化过程,而非仅泛化结果

刘扬提出一个问题:Agent的本质是不是通用智能?他认为可能是,但可能还没有到达那个点。他对比了以往的大模型乃至更早的机器学习模型——本质是结果的验证,通过监督学习从大量数据中获取泛化性。而Agent让人感觉离智能更接近,是因为它不仅在泛化结果,更在泛化过程。

因此,Agent的训练不仅强调最终输出是否漂亮,还要关心中间环节——是否搜到了合适的结果、是否对文件做了正确处理、是否从网页找到了确切信息。这需要大量的过程监督,使得Agent比较擅长结构化推理和多轮工具调用等任务。

2. 过程监督的难点与拐点

过程监督非常困难。刘扬举例说,团队在学习训练模型时想告诉模型“这个搜索信源是好的”,但如何定义“好”并没有正确答案,只能通过代理信号来判断——比如网站访问量、权威性、是否有作者署名等。团队只能用人类已有的知识和经验来定义过程监督,但并不能告诉模型怎样的监督和学习过程是最优的。

他同时指出,拐点正在到来。从机器学习早期“背答案”到“背过程”,再到当前通过训练范式的迭代,模型已经在Harness框架下能够做到“发现新过程”。例如Claude Code或Codex中的“Goal”功能——不需要指明具体做法,只需告诉模型“现在评测只有80分,我需要达到85分,你自己想办法解决”。此外,很多数据供应商已不再只提供题目和答案,而是将解答过程和整个流程交付给模型团队学习。刘扬认为,拐点就在这里——未来人类过程的经验正在被重视和积累,并用于模型训练。

3. AI Office是理想场景,垂类领域需重建过程数据

刘扬认为,AI Office是非常好的逻辑场景——流程稳定、跨行业适用,不同行业的用户写报告和PPT时关心的点都非常一致。对于垂类场景(如医疗、法律),核心是要重建垂类领域的过程数据。例如做律师Agent,就需要知道律师在写合同时会参考哪些文件、走过哪些步骤。

4. 组织和人才的重构

刘扬认为,整个过程中组织和人才都在被重写。流程和过程数据正成为可验证的数据,而岗位本质上就是Agent要执行的上下文。真正的人力将更多投入到“掌控过程发明”和“掌控过程定义”上,而非重复执行流程或重复劳动。

“重复的岗位会消失,设计的岗位会兴起,人类会逐渐过渡为过程的架构师。”他总结道,过去20年互联网积累了创作类和结果导向的数据,而Agent和过程类数据的重要性正在被意识到,未来会系统性地见到工作中过程数据的崛起。

5. SkyClaw模型:轻量、低价、闭环实践

在分享的最后,刘扬介绍了团队在2026年5月推出的SkyClaw模型,这是为SuperAgents以及使用Claude Code或OpenClaw的用户定制的轻量级模型。相比Minimax 2.7或Qwen 3.6系列,定价低于一半以上,性能远超对比模型。

刘扬强调,Agent模型对工具调用质量要求非常高,注重过程而非简单的输入输出回答。在训练链路中,从数据准备、模型训练到线上服务,全程让Agent参与——数据生产、清洗都由Agent自己提升,模型训练中的指标问题和Bug也由Agent帮助解决。

他分享了三步骤迭代法:第一步,让模型确认能力(自然语言确认);第二步,不要求模型一步给出最优答案,而是同时给出一个最小可执行版本,这对降低模型负担非常有用;第三步,在这个版本之上让模型在环节中反复验证和提升。

3

结语

从2024年底的推理模型,到2025年初的Deep Research,再到2026年的Skywork 2.0本地化版本和SkyClaw轻量模型,Skywork团队在Agent这条路上经历了密集的迭代与深入的思考。Token经济被重构、过程监督被重视、人类角色被重新定义——这些变化正在发生,而天工超级智能体正置身于这一演进的前沿。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈