中信证券：Token量井喷导致算力荒国产算力在推理端加速突围

2026-04-16 08:39:31 智通财经

智通财经APP获悉，中信证券发布研报称，Agent&多模态等应用爆发导致国内算力荒，国产大模型在推理端积极适配为国产算力厂商带来加速放量机遇，预计2026年国产算力芯片出货量至少实现翻倍以上增长，将为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲增长动能。建议关注：1)AI芯片设计公司。2)晶圆代工与先进封装。3)存储。4)其他。

中信证券主要观点如下：

Token井喷：全民养虾&多模态带动驱动需求爆发。

进入2026年以来，全球算力需求快速增长，增长曲线陡峭，2026年4月全球最大的API聚合平台 OpenRouter平台周度累计Token消耗量较一年前提升约7-8倍，其中国产大模型是爆发主驱力，OpenRouter口径下最新市占率~40%。“全民养虾”及多模态AI应用普及是算力需求边际加速的两项核心催化：

1)“全民养虾”热潮下Agent常态化运行，负载常驻对算力需求快速提升。以 OpenClaw 为代表的 AI Agent 单次任务消耗Token是ChatBot的10-100倍，而国内厂商积极布局纷纷推出“国产龙虾”进一步加速国内“养虾”普及并拉升对应算力支持需求。

2)多模态应用普及拉升单次交互消耗。2026年以来文生图、文生视频等AI多模态应用持续爆火，图片输入与生成、视频识别与生成相比于纯文本对话，单次交互对应的Token 消耗通常呈数量级上升;而字节Seedance等国产多模态大模型快速崛起，国内多模态AI应用热潮加速爆火。

算力荒：大模型涨价&限额、算力租赁售罄。

Token调用量井喷带来的是算力需求极大爆发，与此同时供给侧受到各类硬约束短期边际增量有限，目前国内外均出现了严重的算力荒。具体来看，

1)模型涨价及高峰限额措施：如腾讯云3月上调混元系列核心模型价格约 430%+;4月上调AI算力、容器服务及弹性 MapReduce等产品刊例价约5%;2026年2-3月，国产大模型如Kimi在使用过程中时常出现“高峰期算力不足”提示;海外大模型Claude宣布通过调整高峰时段用户会话时长限制以减轻高峰期算力压力。

2)B端算力租赁市场AI芯片租赁价格走高：SemiAnalysis 数据H100 的一年期租赁合约价格已由 2025 年 10 月的低点约 1.70 美元/小时/GPU 提升至 2026 年 3 月的 2.35 美元/小时/GPU，涨幅近 40%。

3)消费级旗舰游戏显卡、主机的溢价与缺货：包括英伟达旗舰级游戏显卡RTX 5090、苹果Mac mini M4主机等。

4)主流AI应用(如字节seedance等)生成反馈的排队等待、面向AI 编程工具开发者群体的Coding plan套餐缺货与售罄。此外2月以来国内头部云厂商及模型厂商均明确公开提及算力资源紧缺，亦是国内算力荒的直接证明。

国产算力：本土推理卡迎来加速放量机遇。

AI应用爆发对应的国内算力荒将会加速国产卡放量，其中对推理芯片的带动更加直接。AI芯片需求可以分为训练和推理，目前Agent和多模态应用的爆发对推理端算力需求拉动极大，而从国产算力导入难度角度来看，推理环节对算力产品综合性能要求相较训练端任务更低，国产算力芯片厂商通过与互联网厂商深度合作(针对特定需求定制化/优化)，能够提供更适配互联网厂商需求的推理芯片，国产替代节奏相较于训练端进展更快。

当前国产大模型正积极适配国产算力卡，尤其是在推理端，如Minimax、智谱、DeepSeek均宣布与华为昇腾、摩尔线程、沐曦、海光、寒武纪等国产芯片进行适配与合作。当前国产单芯片性能加速追赶，但仍落后英伟达1~2代，看好在国内算力荒背景下国产推理芯片等AI芯片迎来爆发增长机遇，预估国内AI芯片市场当前国产化率约30~40%，2030年有望提升至60~70%。

风险因素：

AI需求不及预期;国产大模型发展不及预期;国产推理芯片发展不及预期;国内产业链发展不及预期;技术变革与产品迭代风险;宏观经济波动及地缘政治风险。

（责任编辑：刘畅）

【免责声明】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com

看全文

写评论已有条评论跟帖用户自律公约

提交还可输入500字

中信证券：Token量井喷导致算力荒国产算力在推理端加速突围

最新评论

热门阅读

和讯特稿

中信证券：Token量井喷导致算力荒 国产算力在推理端加速突围

最新评论

热门阅读

和讯特稿

推荐阅读

中信证券：Token量井喷导致算力荒国产算力在推理端加速突围