阿里巴巴Qwen2.5-Max正式发布 超越GPT-4o和DeepSeek-V3
据通义官微,1月29日,Qwen2.5-Max正式发布。Qwen2.5-Max在知识(测试大学水平知识的MMLU-Pro)、编程(LiveCodeBench)、全面评估综合能力的(LiveBench)以及人类偏好对齐(Arena-Hard)等主流权威基准测试上,展现出全球领先的模型性能。通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。指令模型是所有人可直接对话体验到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
1091人
- 每日推荐
- 股票频道
- 要闻频道
- 港股频道
![](https://u.thsi.cn/imgsrc/flashcms/726480885_b1db7035e093539cf88a097bcebf2dd9.jpg)
![](https://u.thsi.cn/imgsrc/flashcms/726480885_45323faf5c0c231b8bf06543ef5f725d.jpg)
- 美国总统特朗普发表就职演讲
- “宁王”2024年业绩预喜:归母净利润超490亿元
- 赛力斯重组,大消息来了
- 上调评级+调研 业绩高增长公司获券商青睐
- 大幅换仓!刘格菘、林清源持股曝光
- A股逾1500份2024年业绩预告出炉 三大行业景气度回暖
- 星期三机构一致最看好的10金股
- 多家科创板公司业绩预喜 彰显韧性和活力
- A股公司密集派发“大礼包” 一年多次分红成常态