Code Arena放榜，千问3.7编程能力位列全球第二

今天，第三方大模型盲测平台LMArena旗下编程榜单Code Arena更新排名，阿里最新旗舰模型Qwen3.7-Max得分1541，在大模型厂商中位列全球第二，也是唯一突破1540分的中国模型。

图｜Code Arena最新榜单排名

Code Arena是当前最具影响力的AI编程能力评测榜单之一。与传统代码基准测试不同，Code Arena由开发者出题，要求模型从零生成完整的、可交互的Web应用程序，再由用户对匿名模型的生成结果进行两两盲测投票，综合得出排名。阿里凭借千问3.7在该榜单中位列全球第二，意味着在代码理解与生成领域，中国模型已进入全球第一梯队。

面向Agent场景打造的Qwen3.7-Max，在编程、智能体、长程任务等核心能力上实现了显著提升。该模型可独立完成复杂项目的端到端交付，并支持35小时的长时间持续运行、累计超1000次工具调用的复杂长程任务。

问财摘要