这是一个非常深刻且切中当前AI发展(特别是大模型Agent和具身智能)痛点的观察。
要理解“为什么在Agent强化学习(RL)中,CPU比GPU更早成为瓶颈”,我们需要从计算模式的本质区别、Agent的交互方式以及强化学习的数据生产机制这三个维度来剖析。
1. 根本差异:数据是“算”出来的,而不是“读”出来的
在传统的监督学习(Supervised Learning)中,数据存储在硬盘上。CPU的工作只是把图片或文本读出来,做简单的预处理(Resize, Tokenize),然后丢给GPU。这个过程很快,CPU几乎没压力。
但在Agent强化学习中,数据不存在于硬盘里,而是由Agent与环境(Environment)交互实时生成的。
环境模拟(Environment):无论是玩游戏(如Dota2)、控制机器人(如Mujoco物理引擎)、还是智能体调用工具(如运行Python代码、浏览网页),这些逻辑绝大多数运行在 CPU 上。
工具调用(Tools):研报中特别提到了“构建各种工具”。如果Agent决定“调用计算器”或“搜索网络”,这些操作涉及复杂的逻辑判断、API请求、IO解析,这些都是典型的CPU密集型(或IO密集型但由CPU调度)任务,GPU完全帮不上忙。
结论:GPU处理神经网络一次前向传播可能只需要几毫秒,但CPU运行一次环境模拟、等待一个网页加载或执行一段代码可能需要几十甚至几百毫秒。
2. 规模不对等:为了喂饱一个GPU,需要成百上千个CPU核心
由于GPU的并行计算能力极强(一次能处理几千条数据),而CPU运行的环境通常是串行的(或者每个核心运行一个环境)。
为了不让GPU空转,工业界通常采用大规模并行环境(Vectorized Environments)的策略。
场景:假设GPU一次训练需要个Batch Size为4096的数据。
现状:如果一个CPU核心每秒只能产生10步数据,那么你需要 400+个CPU核心 同时运行环境,才能勉强跟上GPU的吞吐速度。
这就是为什么研报说“需要海量的CPU”。如果是复杂的Agent任务(例如需要调用Docker容器运行代码),单个环境的开销极大,CPU算力会瞬间耗尽。
总结
国联民生这篇研报的核心逻辑是:AI的训练范式正在从“静态学习”转向“动态交互”。
过去(LLM预训练):阅读理解。瓶颈在显存带宽和GPU算力。
现在/未来(Agent RL):实践出真知。Agent需要在一个模拟的、复杂的数字世界中不断尝试、犯错、调用工具。构建这个“数字世界”并维持其运转,是CPU的责任。
因此,随着Agent从简单的聊天机器人进化为能操作电脑、能进行科学计算的实体,CPU的单核性能(处理复杂逻辑)和核心数量(并发环境数) 将成为决定AI进化速度的关键短板。
半导体国产替代的三大核心机会及逻辑:
机会一:半导体设备 —— “从0到1”的硬核突围
核心逻辑:被动式强制替代 + 份额提升的确定性
非市场化因素主导: 由于美国对先进设备的出口管制(特别是光刻机、高端刻蚀机、薄膜沉积设备),国内晶圆厂(中芯国际、长江存储等)为了扩产,必须采购国产设备。这不是选修课,是必修课。
验证加速:以前国产设备求着晶圆厂试用,现在是晶圆厂主动配合设备厂调试。一旦通过验证,订单就是爆发式的。
全线突破:除了光刻机(还在攻坚),在刻蚀、沉积、清洗、CMP(化学机械抛光)等环节,国产化率正在从10%向50%甚至更高迈进。
机会二:高端半导体材料 —— “高壁垒、高粘性”的现金牛
核心逻辑:耗材属性(持续复购) + 极低的国产化率
商业模式优越: 设备是一次性买卖,材料是年年都要买的耗材。晶圆厂产能开动,材料厂商就在印钞。
认证壁垒高: 也就是前面提到的G5级标准。一旦进入供应链(如台积电、中芯),客户极难更换供应商(怕影响良率)。这种“客户粘性”带来了极高的护城河。
高端空白:在光刻胶(ArF/KrF)、抛光垫、电子特气等高端领域,国产化率依然个位数,未来的增长不是10%-20%,而是几倍的空间。
机会三:先进封装与算力芯片 —— “弯道超车”的新战场
核心逻辑:后摩尔时代 + AI算力爆发
规避光刻机限制: 在我们无法获得EUV光刻机制造3nm/5nm芯片的情况下,通过Chiplet(小芯片)和先进封装(2.5D/3D封装)技术,把成熟制程的芯片“拼”在一起,达到接近先进制程的性能。这是中国半导体突围的唯一“捷径”。
AI需求驱动: ChatGPT等AI算力需求爆发,带动了HBM(高带宽内存)和CoWoS封装的需求。谁掌握了先进封装,谁就掌握了AI芯片的命门。
产业链配套: 封装技术的升级,直接带动了上游封装基板(ABF)、封装材料的升级。
半导体:AI 驱动全球半导体市场结构性增长,先进逻辑及存储需求高增
AI 驱动下的半导体投资聚焦于两大主线:一是直接受益于算力需求爆发的高端逻辑芯片、存储器(HBM);二是在全球供应链变局下,模拟芯片、设备、材料等领域持续突破的国产替代机会。
1. 行业产值加速逼近万亿美元大关
2. 区域市场结构性分化:美洲与亚太领跑
3.细分领域结构性分化:逻辑芯片与存储器是市场增长的主要动力
受 AI 与数据中心基础设施建设的推动,逻辑芯片和存储器成为市场增长的主要动力,2025 年逻辑芯片预计同比增长 37.1%,存储器同比增长 27.8%。
免责声明:本刊物由亚商投资顾问沈杨(执业编号:A0240623030002)编辑整理,个股展示仅说明过往案例,不作为投资建议;过往行情及形态,不作为未来行情的唯一评判标准,过往案例未考虑市场因素及交易风险等情况,仅作展示参考使用,不作为未来的服务结果或承诺,据此操作,风险自担。本刊物仅代表个人观点,任何投资建议不作为您投资的依据,您须独立作出投资决策,风险自担。
作者是秉持独立、客观、公正和审慎的原则制作而成,作者对文中所涉及的投资产品描述力求客观、公正,但相关投资产品所涉及到的观点、结论和建议仅供参考,不代表作者对任何投资产品做出具导向性的购买建议。本刊物虽力求做到准确、客观、公正,但不保证在实际使用中不发生任何变更。
本刊物仅供参考,任何人参考本报告进行投资的行为,均应对相应投资结果自行承担风险。并且,当您选择使用本专刊,即表示您已经认真阅读了本声明并同意接受本声明全部内容。本刊物不对投资行为及投资结果做任何形式的担保。
本刊物版权为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用须注明出处为本公司,且不得对本刊物进行有悖原意的引用、删节和修改。刊载或者转发本刊物中的投资观点及策略,应当注明本刊物的发布人和发布日期,并提示使用本刊物的风险。未经授权刊载或者转发本专刊的,本公司所将保留向其追究法律责任的权利。
热门跟贴