IT之家6月3日消息,在Build2026开发者大会上,微软(MSFT)发布了一系列自研AI模型,其中包括旗下首款高级推理模型MAI-Thinking-1。这也是微软(MSFT)在模型研发领域迈出的重要一步。
微软(MSFT)介绍称,MAI-Thinking-1是一款“中等规模模型”,在关键软件工程基准测试中能够达到业界领先模型的水平。微软(MSFT)表示,该模型“完全基于干净数据从零开始训练,未使用来自第三方模型的蒸馏数据”。
除 MAI-Thinking-1外,微软(MSFT)还公布了多款面向不同应用场景的新模型,覆盖图像生成、语音转写、语音合成以及编程辅助等领域。IT之家汇总如下:
在图像领域,微软(MSFT)发布了MAI-Image2.5及其Flash版本,两者均支持文生图和图像编辑功能。
语音转写方面,微软(MSFT)推出MAI-Transcribe-1.5,并表示该模型“速度可达竞争对手模型的五倍”。
语音能力方面,微软(MSFT)发布了MAI-Voice-2,同时预告其Flash版本即将推出。微软(MSFT)称,新模型新增了对15种语言的支持,并提供更多语音选项。
针对编码场景,微软(MSFT)推出了MAI-Code-1。微软(MSFT)表示,该模型具备“推理效率优化”特性,并已集成到GitHub Copilot和Visual Studio Code中。
通过此次发布,微软(MSFT)进一步扩展了自研MAI模型家族,覆盖推理、图像、语音和编程等多个AI应用方向。
