谷歌发布新一代AI模型Gemini 2.5,“硬刚”OpenAI
3月26日,谷歌宣布推出新一代大语言模型Gemini 2.5,被定义为公司迄今为止“最智能的AI模型”。Gemini 2.5 Pro实验版本在多项基准测试中超越了包括OpenAI o3-mini在内的多个模型,并在LMArena (一个用于评估大型语言模型的开源平台)上排名第一。Gemini 2.5在编码性能上显著提升,擅长创建视觉网页应用程序和代理代码应用程序,其在SWE-BenchVerified上的得分为63.8%。此外,Gemini 2.5 Pro具备多模态处理能力和超长上下文窗口,支持文本、图像、音频、视频及代码的输入,上下文窗口达100万token,未来将升级至200万token。
而在谷歌深夜上线旗下最强推理模型Gemini 2.5的一个小时后,OpenAI紧急发布了GPT-4o图像生成器,该技术能精准文本渲染、严格遵循指令提示,并深度调用4o知识库及对话上下文。不过,OpenAI也承认模型并不完美,依然在裁剪、幻觉、精确绘图等方面存在多个限制,OpenAI表示,将在首次发布后通过模型改进来解决这些问题。
谷歌和OpenAI的新产品发布预示着AI竞争的持续升级,随着各厂商加快研发速度,无论是推理模型、多模态大模型还是AI智能体,接下来或都将不断迎来新的技术进展与突破。
505人