10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

来源: 网易科技 作者:有态度的

  出品 |《态度》栏目

  2 月 11 日深夜到 12 日清晨,短短几个小时内,中国三家最重要的大模型公司几乎同时完成了一轮关键更新:

  智谱正式发布 GLM-5,MiniMax M2.5 在产品中悄然上线体验,DeepSeek 也启动新一轮能力升级。

  智谱 GLM-5:

  从“写代码”到“搞工程”

  2 月 12 日,智谱正式官宣上线并开源新模型 GLM-5。同时确认:此前在 OpenRouter 上爆火的匿名模型 Pony Alpha,正是 GLM-5。

  在匿名测试阶段,这个模型已经被全球开发者当作真实生产工具使用。有人用它做横版解谜游戏,有人搭建 Agent 交互世界,也有人直接基于它开发出论文版“抖音”等完整应用形态。模型在没有品牌背书的情况下完成真实市场验证,本身已经说明了能力层级的变化。

  智谱对 GLM-5 的定位非常明确:它不是一个聊天模型,而是一个 Agentic Engineering 基座模型。

  过去两年,大模型的主流叙事是“写代码”“写前端”;而现在,行业共识正在转向:模型需要完成完整工程与复杂任务,即从「Vibe Coding」走向「Agentic Engineering」。GLM-5 正是这一阶段的代表产物。

  与上一代相比,GLM-5 不再满足于生成一个漂亮 demo 或一段 Python 脚本,而是为稳定交付生产级结果而生。在真实编程场景的使用体感上,GLM-5 已经被认为逼近当前行业天花板 Claude Opus 4.5。

  在底层能力上,GLM-5 进行了全面扩展:

  ● 参数规模: 从上一代的 355B(激活 32B)扩展至 744B(激活 40B)。

  ● 数据量级: 预训练数据从 23T 提升至 28.5T。

  ● 架构创新: 首次集成了 DeepSeek Sparse Attention 机制。这一技术在维持长文本效果无损的同时,大幅降低了模型部署成本,提升了 Token 的生成效率。

  ● 异步强化学习: 构建了全新的“Slime”框架,让模型能够在长程交互中持续学习,不再是“聊几句就忘”。

  在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一。

  GLM-5 在编程能力上实现了对 Claude Opus 4.5 的对齐,在工程师最看重的 SWE-bench-Verified(软件工程基准测试)中,GLM-5 拿下了 77.8 的高分;在 Terminal Bench 2.0(终端操作能力)中达到了 56.2。这两个分数不仅是开源模型的 SOTA(State Of The Art),更直接超越了 Google 的 Gemini 3 Pro。

  在智谱内部的 Claude Code 评估集合中,GLM-5 在后端重构和深度调试等“硬骨头”任务上,比 GLM-4.7 平均提升了超过 20%。

  GLM-5 在 Agent 能力上实现开源 SOTA,在多个评测基准中取得开源第一。

  更有意思的是 Vending Bench 2 的测试结果。这个测试要求模型在一年期内经营一个模拟的自动售货机业务。GLM-5 最终的账户余额达到了 4432 美元。这意味着它不仅会写代码,还懂得资源管理和长期规划,这种“经营能力”是迈向 AGI 的关键一步。

  同一夜:

  MiniMax 与 DeepSeek

  就在智谱官宣的同时,另外两家巨头的布局也在进行。

  昨晚,细心的用户发现,在 MiniMax Agent 产品中,底层模型选项里悄然出现了一个新名字——MiniMax M2.5。

  虽然公司尚未正式官宣,但这显然是一次在产品端的“实弹演习”。据早期测试用户反馈,“M2.5 Agent能力炸裂”,“编程和工具调用又强又便宜”。

  此外,就在众人还在猜测DeepSeek V4何时到来时,DeepSeek也在悄然更新。

  我们在昨晚尝试询问 DeepSeek 的最新状态,在关闭“深度思考”和“联网搜索”后查询模型信息时发现,其上下文长度已提升至1M Token(此前为128K),知识库截止日期更新至2025年5月。

  2026 年,注定不会平静。

  智谱用 GLM-5 证明了中国模型在复杂工程能力上已能与世界最强掰手腕;MiniMax 在产品端极速狂奔,抢占用户心智;而所有人依旧在等待 DeepSeek 出招。

  对于此时此刻的身处浪潮中的我们来说,唯一的选择就是——跟上速度。毕竟,在这个 10 倍速的夜晚过后,掉队可能只是一瞬间的事。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 北信源
  • 兆易创新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉视传媒
  • 御银股份
  • 中油资本
  • 代码|股票名称 最新 涨跌幅