智通财经APP获悉,中信证券发布研报称,Agent&多模态等应用爆发导致国内算力荒,国产大模型在推理端积极适配为国产算力厂商带来加速放量机遇,预计2026年国产算力芯片出货量至少实现翻倍以上增长,将为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲增长动能。建议关注:1)AI芯片设计公司。2)晶圆代工与先进封装。3)存储。4)其他。
中信证券主要观点如下:
Token井喷:全民养虾&多模态带动驱动需求爆发。
进入2026年以来,全球算力需求快速增长,增长曲线陡峭,2026年4月全球最大的API聚合平台 OpenRouter平台周度累计Token消耗量较一年前提升约7-8倍,其中国产大模型是爆发主驱力,OpenRouter口径下最新市占率~40%。“全民养虾”及多模态AI应用普及是算力需求边际加速的两项核心催化:
1)“全民养虾”热潮下Agent常态化运行,负载常驻对算力需求快速提升。以 OpenClaw 为代表的 AI Agent 单次任务消耗Token是ChatBot的10-100倍,而国内厂商积极布局纷纷推出“国产龙虾”进一步加速国内“养虾”普及并拉升对应算力支持需求。
2)多模态应用普及拉升单次交互消耗。2026年以来文生图、文生视频等AI多模态应用持续爆火,图片输入与生成、视频识别与生成相比于纯文本对话,单次交互对应的Token 消耗通常呈数量级上升;而字节Seedance等国产多模态大模型快速崛起,国内多模态AI应用热潮加速爆火。
算力荒:大模型涨价&限额、算力租赁售罄。
Token调用量井喷带来的是算力需求极大爆发,与此同时供给侧受到各类硬约束短期边际增量有限,目前国内外均出现了严重的算力荒。具体来看,
1)模型涨价及高峰限额措施:如腾讯云3月上调混元系列核心模型价格约 430%+;4月上调AI算力、容器服务及弹性 MapReduce等产品刊例价约5%;2026年2-3月,国产大模型如Kimi在使用过程中时常出现“高峰期算力不足”提示;海外大模型Claude宣布通过调整高峰时段用户会话时长限制以减轻高峰期算力压力。
2)B端算力租赁市场AI芯片租赁价格走高:SemiAnalysis 数据H100 的一年期租赁合约价格已由 2025 年 10 月的低点约 1.70 美元/小时/GPU 提升至 2026 年 3 月的 2.35 美元/小时/GPU,涨幅近 40%。
3)消费级旗舰游戏显卡、主机的溢价与缺货:包括英伟达旗舰级游戏显卡RTX 5090、苹果Mac mini M4主机等。
4)主流AI应用(如字节seedance等)生成反馈的排队等待、面向AI 编程工具开发者群体的Coding plan套餐缺货与售罄。此外2月以来国内头部云厂商及模型厂商均明确公开提及算力资源紧缺,亦是国内算力荒的直接证明。
国产算力:本土推理卡迎来加速放量机遇。
AI应用爆发对应的国内算力荒将会加速国产卡放量,其中对推理芯片的带动更加直接。AI芯片需求可以分为训练和推理,目前Agent和多模态应用的爆发对推理端算力需求拉动极大,而从国产算力导入难度角度来看,推理环节对算力产品综合性能要求相较训练端任务更低,国产算力芯片厂商通过与互联网厂商深度合作(针对特定需求定制化/优化),能够提供更适配互联网厂商需求的推理芯片,国产替代节奏相较于训练端进展更快。
当前国产大模型正积极适配国产算力卡,尤其是在推理端,如Minimax、智谱、DeepSeek均宣布与华为昇腾、摩尔线程、沐曦、海光、寒武纪等国产芯片进行适配与合作。当前国产单芯片性能加速追赶,但仍落后英伟达1~2代,看好在国内算力荒背景下国产推理芯片等AI芯片迎来爆发增长机遇,预估国内AI芯片市场当前国产化率约30~40%,2030年有望提升至60~70%。
风险因素:
AI需求不及预期;国产大模型发展不及预期;国产推理芯片发展不及预期;国内产业链发展不及预期;技术变革与产品迭代风险;宏观经济波动及地缘政治风险。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论