据千问大模型消息,通义千问团队近日发布了下一代旗舰模型的早期预览版Qwen3.6-Max-Preview。相比前代Qwen3.6-Plus,该预览版在智能体编程、世界知识及指令遵循能力方面均实现了显著提升,目前模型仍在积极迭代优化中。
Qwen3.6-Max-Preview主要特性包括:相比Qwen3.6-Plus显著提升的智能体编程能力、更强的世界知识和指令遵循能力,以及更优的真实场景智能体与知识可靠性表现。
在模型性能方面,评测数据显示,相比Qwen3.6-Plus,Qwen3.6-Max-Preview在多项关键指标上取得进步。具体而言,在智能体编程方面,SkillsBench提升9.9分,SciCode提升10.8分,NL2Repo提升5.0分,Terminal-Bench 2.0提升3.8分;在世界知识方面,SuperGPQA提升2.3分,QwenChineseBench提升5.3分;在指令遵循方面,ToolcallFormatIFBench提升2.8分。该模型在六项主要编程基准上均取得了最高分。
用户可通过阿里(BABA)云百炼API(模型名称为qwen3.6-max-preview)调用该模型,或在Qwen Studio网站进行交互对话体验。本次API更新支持行业标准协议,并新增了preserve_thinking功能,可在消息中保留所有前序轮次的思维内容,推荐用于智能体任务。
作为预览版,Qwen3.6-Max-Preview仍在积极开发中,团队表示将持续迭代模型,后续版本将带来进一步提升。
原文:Qwen3.6-Max-Preview来了!(来源:千问大模型)
