智源最新模型评测:百度文心4.0登顶国内外“百模”榜
上证报中国证券网讯(记者 罗茂林)6月17日,近日,由北京智源研究院打造的FlagEval天秤大模型评测平台实现了全面升级,并公布202406期FlagEval模型评测排行榜单。
最新一期榜单显示,百度文心大模型4.0以89.72的综合评分在闭源对话模型中排名第一。在中文语境下,以文心大模型为代表的国内头部语言模型的综合表现已超过国际一流水平的表现。
FlagEval天秤大模型评测平台是智源研究院推出的科学、权威、公正、开放的大模型评测体系,自2023年发布以来,已从主要面向语言模型扩展到视频、语音、多模态模型,实现多领域全覆盖,目前已评测国内外 300 余个开源和商业闭源的语言及多模态大模型。
此前,国际数据公司IDC发布的《中国大模型市场主流产品评估,2024》中,百度同样位于第一梯队。评测显示,百度旗下生成式AI产品文心一言和文心一格在问答理解类、推理类、创作表达类、数学类、代码类的基础能力,toC通用场景类、toB特定行业类的应用能力等7大维度均具备领先优势。
截至目前,文心一言累计用户规模已达2亿,日均调用量也达到了2亿。
0人
- 每日推荐
- 股票频道
- 要闻频道
- 港股频道
![](https://u.thsi.cn/imgsrc/flashcms/575802530_85b58d38cf66613ab831895259b0f264.jpg)
![](https://u.thsi.cn/imgsrc/flashcms/575802530_dbce9234b309f7bf3ee19812e88fa8dc.jpg)
- 利好!6个方面促进民营经济发展壮大
- 商务部就欧盟第14轮对俄制裁列单中国企业事答记者问
- 三星将在第三季度将DRAM和NAND价格提高15-20%
- 5G-A商用元年开启 如何与AI技术一起引领行业变革
- 四部门:实施设备更新贷款贴息政策
- 6月26日晚间公告集锦:4连板飞天诚信数字货币相关业务对公司经营影响很小
- 下一个反弹急先锋?估值处于历史低位,中小市值股或被“错杀”! 四大维度筛选,潜力股名单出炉
- 四川加快充电基础设施部署 相关上市川企积极布局
- 年内逾百家上市公司发布中期分红预案,银行、券商较积极