DeepSeek-R1启发下,小米大模型团队登顶音频推理MMAU榜

2025-03-17 20:40:09 来源: IT之家 作者:泓澄

  小米技术官微今日(3 月 17 日)发文称,小米大模型团队在音频推理领域取得突破性进展。

  受 DeepSeek-R1 启发,团队率先将强化学习算法应用于多模态音频理解任务,仅用一周时间便以 64.5% 的 SOTA 准确率登顶国际权威的 MMAU 音频理解评测榜首,现同步开源。

  DeepSeek-R1 的 Group Relative Policy Optimization (GRPO) 方法,让模型仅通过"试错-奖励"机制就能使自主进化,涌现出类似人类的反思、多步验证等推理能力。

  该团队尝试将 DeepSeek-R1 的 GRPO 算法迁移到 Qwen2-Audio-7B 模型上。

  在仅使用 AVQA 的 3.8 万条训练样本的情况下,强化学习微调后的模型在 MMAU 评测集上实现了 64.5% 的准确率,这一成绩比目前榜单上第一名的商业闭源模型 GPT-4o 有近 10 个百分点的优势。

  尽管当前准确率已突破 64%,但距离人类专家 82% 的水平仍有差距。

  有趣的是,官方提供的交互 demo 中,默认分析的便是雷总 2015 年“R U OK”的视频。

关注同花顺财经(ths518),获取更多机会 返回首页举报 >

285

+1
advert
advert
advert
advert
  • 三德科技
  • 沃尔核材
  • 电光科技
  • 钧崴电子
  • 金安国纪
  • 长盛轴承
  • 广和通
  • 科泰电源
  • advert
    advert
    advert
    advert