同花顺 Logo
AIME助手
问财助手
财通证券:架构创新突破大模型推理延迟瓶颈 广阔市场空间有望快速放量
2026-03-16 10:30:12
来源:智通财经
分享
文章提及标的
财通证券--
深南电路--
英伟达--
胜宏科技--
沪电股份--
星宸科技--

财通证券(601108)发布研报称,LPU为新一代面向大模型推理阶段的芯片,核心为TSP架构。该行认为,LPU受益于低推理延时的优异表现,有望实现快速渗透,该行看好LPU的高成长性及LPU以机柜出货时带来的PCB机会,建议关注:智微智能(001339)(001339.SZ)(参股元川微)、星宸科技(301536)(301536.SZ)(多轮增资元川微)、沪电股份(002463)(002463.SZ)(英伟达(NVDA)PCB供应商)、胜宏科技(300476)(300476.SZ)(英伟达(NVDA)PCB供应商)、深南电路(002916)(002916.SZ)。

财通证券(601108)主要观点如下:

LPU为新一代面向大模型推理阶段的芯片,核心为TSP架构

LPU是专为顺序处理的计算密集型任务设计的新型芯片架构,核心在于TSP架构,包含五大功能模块,将经典的处理器五级流水线拆散在整个芯片内,进而消除了硬件的复杂性,使指令执行顺序和时间具有确定性。在TSP架构下,编译器可以直接访问并精确控制芯片的底层硬件状态,实现了软件定义硬件。

LPU可缩短大模型推理过程中的延迟,提高用户体验感

大模型在推理过程中会存在延迟,延迟与用户体验感精密挂钩,大模型推理过程中的延迟主要在Decode阶段,核心瓶颈在于内存带宽。LPU具备更快的内存带宽,可缩短大模型推理过程中的延迟。同时,基于LPU的大模型不仅具有更快的推理速度,还可以提供更具性价比的价格,可进一步提高用户体验感。

LPU具备广阔的潜在发展空间,已步入量产初期

目前Tokens的消耗量大幅增长,2024年初我国日均Token的消耗量为1000亿,2026年2月主流大模型合计日均Token消耗已到180万亿级别,Tokens消耗量快速增长,带动推理芯片市场规模的高增长。LPU可降低大模型推理的延迟,该行认为LPU有望在推理芯片市场中逐步渗透,具有高成长性的市场空间。目前LPU已步入量产初期,放量在即。

风险提示:AI技术迭代不及预期的风险;大模型发展不及预期的风险;LPU行业发展不及预期的风险。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571涉企侵权举报

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈