今天,第三方大模型盲测平台LMArena旗下编程榜单Code Arena更新排名,阿里最新旗舰模型Qwen3.7-Max得分1541,在大模型厂商中位列全球第二,也是唯一突破1540分的中国模型。
图|Code Arena最新榜单排名
Code Arena是当前最具影响力的AI编程能力评测榜单之一。与传统代码基准测试不同,Code Arena由开发者出题,要求模型从零生成完整的、可交互的Web应用程序,再由用户对匿名模型的生成结果进行两两盲测投票,综合得出排名。阿里凭借千问3.7在该榜单中位列全球第二,意味着在代码理解与生成领域,中国模型已进入全球第一梯队。
面向Agent场景打造的Qwen3.7-Max,在编程、智能体、长程任务等核心能力上实现了显著提升。该模型可独立完成复杂项目的端到端交付,并支持35小时的长时间持续运行、累计超1000次工具调用的复杂长程任务。
