同花顺 Logo
AIME助手
问财助手
火爆!量化巨头出手即“王炸”
2024-12-30 21:59:46
作者:张舒琳
分享
文章提及标的
sonnet--
人工智能--

科技圈和资管行业同时沸腾。

近日,国内全新大模型DeepSeek-V3首个版本上线,并同步开源。DeepSeek-V3背后并非互联网大厂,而是国内头部量化机构幻方量化。量化“大佬”进军AI大模型,引发关注。

前沿大模型“刷屏”

上一代模型DeepSeek-V2.5发布三个多月后,杭州深度求索人工智能(885728)基础技术研究有限公司(DeepSeek)近日发布公告,DeepSeek-V3正式上线。其迭代速度和性能表现令行业震惊,训练成本仅为557.6万美元,整个训练只需要280万个GPU小时。

DeepSeek-V3的更新上线,其模型API服务定价调整为每百万输入tokens0.5元(缓存命中)或百万输入tokens2元(缓存未命中),每百万输出tokens8元。其超低的定价引发科技圈轰动。

从性能来看,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-sonnet(SONN)难分伯仲。

此外,通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS大幅提高至60TPS,相比V2.5模型实现了3倍的提升,为用户带来更加迅速流畅的使用体验。

对于训练成本较低的原因,DeepSeek-V3回复称,主要归功于算法优化、模型架构创新(如稀疏注意力机制、模型剪枝等技术)、智能的数据采样和增强技术、硬件加速、高效的分布式计算策略,以及通过知识蒸馏技术,将大型模型的知识转移到更小的模型中,小模型在保持较高性能的同时计算需求大幅降低。

量化中的“极致技术理想主义者”

值得关注的是,DeepSeek-V3背后并非互联网大厂,而是国内头部量化机构幻方量化。

作为国内顶尖量化私募,幻方量化是目前最坚定向科技公司转型的“异类”。2023年4月,幻方量化高调宣布将踏上新征程,“追寻一直以来的技术理想,超越投资去直面更大的课题”。

幻方量化在公告中表示,多年以来,幻方量化坚持把营收的一大部分投入人工智能(885728)领域,建设领先的AI硬件基础设施,进行大规模研究,探索人类未知的奥秘。

一位量化业内人士表示:“幻方量化已将大模型当作主攻赛道,大模型团队非常庞大,与其它量化机构在战略上明显不同。”

幻方量化在算力方面的投入巨大,是除了头部互联网大厂外,国内少数拥有超过1万枚GPU的公司。DeepSeek曾多次强调其万卡GPU训练集群的优势,并强调拥有在学术、竞赛和工程圈的顶尖人才,将团队视为“一群极致的技术理想主义者”。

近年来,DeepSeek不断招贤纳士,扩充团队。对于顶尖的AI人才,给出的待遇相当可观。此前,DeepSeek曾高薪招聘AGI大模型实习生。对于深度学习研究员,更是开出最高11万元的月薪。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号-4
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈