证券分析师 芦哲
执业证书:S0600524110003
证券分析师 唐遥衎
执业证书:S0600524120016
投资要点
研究背景与目的:
研究背景:通胀走势是当前宏观交易的核心变量之一,直接影响利率定价、汇率预期及大类资产配置逻辑。为提升对CPI边际变化的把握精度,本研究构建了一套可跟踪、可检验的量化预测框架,以数据驱动与主观经济学判断结合的方式替代单纯依赖主观经验判断的传统分析范式。
研究目标:本研究旨在通过系统整合高频价格信号与宏观领先指标,实现对未来一年CPI趋势的长期演变路径的预测,并同步跟踪未来一个月CPI的短期变化。为中国未来的宏观经济环境判断提供量化层面的参考依据。
长期与短期预测模型选择:
长期预测模型:采用具备外生变量输入的季节性自回归移动平均模型(SARIMAX),对食品与非食品CPI分项进行拆解建模。该模型侧重参数的跨期稳定性与路径一致性,食品侧重点引入春节效应、蔬菜批发价滞后项与猪肉价格滞后项,非食品侧则纳入CRB大宗商品综合指数与制造业PMI,以捕捉中长期成本传导与景气变化对价格中枢的线性影响。
短期预测模型: 采用“月度滚动重估”框架,在长期模型结构的基础上,允许估计系数随最新样本窗口的滚动而进行适应性漂移。相较于长期模型,短期版本在变量选择上更倾向于高时效性指标,旨在增强模型对近期宏观扰动、节日错位及价格拐点的即时响应能力。
模型效果总结:
长期预测模型:2023至2025年半年步长构建的五轮滚动样本外测试中,最优模型RMSE均值由基准模型的0.3396降至0.2422,降幅约28.7%,方向胜率由65.0%提升至80.0%,预测精度与趋势识别能力均有显著改善。
短期预测模型:在2023至2025年逐月滚动测试中,短期最优模型RMSE均值为0.2379,方向胜率达80.56%,表现略好于长期预测模型,对短期拐点与月度节奏的把握能力较优。
2026年模型预测结果:
模型预测显示2026年国内通胀环境将呈现典型的“低位温和修复”特征。全年CPI指数累计涨幅约为2.7%,价格运行节奏表现为:春节因素消退后的3月经历正常季节性短暂回落,随后内需缓慢修复带动价格中枢在下半年趋于平稳上行。综合判断,尽管价格下行风险已较2024-2025年期间明显缓和,但整体物价弹性依然有限,宏观经济运行状态更倾向于“弱复苏、低通胀”组合。在此背景下,成本端的输入性压力传导相对受限,政策层面或仍维持对稳增长与稳预期的必要支持。
风险提示:1)政策或监管环境突变;2)宏观经济不及预期;3)发生重大预期外的宏观事件。
1. 数据与样本说明
本研究的主要目的为在系统整理与更新居民消费价格及相关宏观、价格类历史数据的基础上,建立可重复估计的时序模型,对未来一个月的 CPI 环比水平进行定量预测,并刻画与更新未来一年 CPI 的演变路径与总体走势,从而为短期中国平均价格与通胀水平与中期趋势判断提供数据支持与可检验的预测基准。
1.1. CPI数据说明
本研究使用的居民消费价格指数(CPI)及相关变量均为月度频率,时间索引统一为各自然月月末(与官方常用发布节奏一致)。CPI 部分包含全国 CPI 总指数环比、食品类环比与非食品类环比,数据来源于项目配置的原始指标序列,经与宏观及价格类外生序列按月末对齐、合并后形成分析用面板。环比指标刻画相邻两个月之间的价格变化,解读时需结合春节等季节性因素。
1.2. 外生变量说明
根外生变量的选择遵循“先理论分层、后统计筛选、再经济解释校验”的原则:首先从货币政策、实体经济、食品价格和外部输入四个方向构建候选变量池,分别覆盖流动性与利率环境、景气与生产端变化、主要食品品类价格波动以及国际大宗与输入型成本冲击;随后在统一样本区间内对候选变量与 CPI (及相关分项)进行格兰杰因果检验,保留在统计意义上具有显著领先信息的变量;最后结合变量发布时点、可得性和传导机制的经济学合理性进行二次筛选,剔除虽显著但解释性弱或稳定性不足的指标,形成用于建模的候选外生变量集合。
1.3. 样本空间说明
本研究的数据样本空间按“完整可比、统一频率”原则构建:先将 CPI 及全部候选外生变量按时间对齐,再截取各变量均有有效观测的共同时间区间,最终形成 2010 年 1 月至 2025 年 12 月的月度面板样本。对频率处理方面,若变量原始口径已为月度,则直接使用;若变量为日频,则先按自然月聚合为月度均值后再并入面板,以保证模型输入在同一时间粒度下可比。完成频率统一后,对样本进行缺失值检查与一致性约束,仅保留全字段可用的月份用于估计与评估。季节性事件处理上,研究额外构建春节虚拟变量:根据每年农历春节对应公历日期,将其映射到所在自然月,春节当月记为 1、其余月份记为 0,并随月度面板一并进入模型,用于刻画春节错位对价格环比的结构性影响。
2. 外生变量筛选逻辑
本研究从货币政策、实体经济、食品价格和外部输入四个方向构建候选变量池,分别覆盖流动性与利率环境、景气与生产端变化、主要食品品类价格波动以及国际大宗与输入型成本冲击。候选变量池如表 1 所示:
2.1. 量化角度初步筛选
本研究在构建 CPI 预测模型前,对候选外生变量与 CPI及必要时分项进行格兰杰因果检验,在指定最大滞后阶数下检验在控制各自历史信息后,候选变量是否对 CPI 的预测具有统计上显著的边际解释力。通过该步骤,可在较宽变量池中筛除与 CPI 动态关系不显著或方向不稳定的指标,缩小后续建模与样本外评估的负担,并降低仅凭主观叙事堆砌变量的风险。
选择格兰杰因果检验的原因在于:其一,它面向时间序列预测问题,直接回答“过去信息是否有助于预测未来”,与滚动预测目标一致;其二,检验在向量自回归框架下比较嵌套模型,具有明确的统计假设与可复现的显著性标准,便于在报告中披露与复核;其三,它并不等同于经济学意义上的“真实因果”,但能作为数据层面的先导性筛选,与经济学理论分层(货币、实体、食品、外部输入)相结合,可在统计显著与经济可解释之间取得平衡。
表2与表3展示了食品CPI与非食品CPI的格兰杰因果检验结果。本研究设定最小P值小于0.1的变量通过初步筛选。依照此逻辑,食品项通过初步筛选的变量为:春节变量、蔬菜价格指数、可繁育母猪存栏量、猪肉市场价、美元汇率、制造业PMI、PPI同比。非食品项通过初步筛选的变量为:春节变量、布伦特原油价格、制造业PMI、PPI同比、CBR指数、M1同比、蔬菜价格指数、M2同比。
2.2. 经济学解释角度筛选
从经济学上看,食品 CPI 的短期波动主要由供给冲击、节日消费节奏与“猪周期”主导,因此格兰杰检验虽显示美元汇率与 PMI 等宏观变量也可能含有预测信息,但它们对食品分项的作用往往是间接且多通道叠加的:汇率更多通过进口大宗与能源成本传导,且与本土鲜菜、猪肉等篮子的联动存在时滞与结构性干扰;PMI 则刻画广义景气与工业品需求,对食品价格的映射不如高频农产品价格直接。相较之下,春节虚拟变量刻画的是统计与消费日历上的强季节错位;蔬菜批发价直接对应鲜菜分项的成本与预期;猪肉批发价与能繁母猪存栏分别从价格边际与供给领先两个维度锁定“猪周期”核心机制,变量含义与食品 CPI 的微观传导链条一致、可解释性更强。因此本研究优先保留与食品价格形成机制距离更近、传导路径更清晰的春节、蔬菜批发价、可繁育母猪存栏与猪肉批发价作为食品侧最终候选变量,而将汇率与 PMI 等更偏总量与外部金融条件的指标留给非食品或宏观叙事层使用。
非食品 CPI 更多反映能源与工业消费品、服务与居住相关价格的边际变化,其波动往往与全球大宗、国内景气与成本传导联系更紧。春节虚拟变量同样重要,因为春节会同时扰动出行、服务与部分非食品消费与统计节奏。布伦特原油价格直接锚定国内燃料与能源相关分项及广泛的成本推动链条;制造业 PMI 刻画需求与生产景气,与非食品中工业品、可选消费的价格动量更为贴近。CRB 大宗商品综合指数则把能源、金属与部分农产品价格压力汇总为广义输入型通胀的代理,比单一油价更能捕捉外部价格环境的整体松紧。相较之下,PPI 同比虽与成本端相关,但更偏生产端出厂价,且与油价、CRB商品指数信息高度重叠,容易带来多重共线而边际增益有限;M1、M2 同比属于货币金融条件,对非食品价格的映射路径长、领先关系不稳定;蔬菜批发价则主要驱动食品分项,与非食品篮子的经济距离较远。因此在格兰杰显著的前提下,最终非食品侧优先保留春节变量、布伦特原油价格、制造业PMI 指数与 CRB商品指数作为候选。
3. 模型选择与评估方式
3.1. SARIMAX模型
本研究采用 SARIMAX(季节性自回归滑动平均外生变量)模型,主要出于三方面考虑:其一,该类模型在计量经济学与宏观经济实证研究中长期使用,理论成熟、估计与推断路径清晰,便于与既有文献对照并保持结果可复现;其二,CPI 环比存在较为明显的年度季节结构,SARIMAX 通过季节差分与季节项能够显著刻画其周期性,精准捕捉其季节性趋势;其三,模型在自回归结构基础上可纳入外生变量,将宏观与高频价格信息并入方程,在控制序列相关的同时考察外生冲击的边际影响。与以预测精度为导向、结构往往难以拆解的机器学习方案相比,SARIMAX 的系数、滞后阶数与外生项具有直接的经济与统计含义,系数符号与显著性可作为解释依据,整体可解释性更强,更适合本研究在预测之外兼顾机制叙述与政策讨论的需要。
本研究对食品与非食品 CPI 环比分别设定SARIMAX。食品侧采用 (2,1,0) × (1,0,1,12):非季节部分先作一阶差分,再在差分序列上用二阶自回归刻画短期惯性;季节部分在周期 12 上配置一阶季节自回归与一阶季节滑动平均且不做季节差分,用于吸收年内固定节奏下的季节相关,而不额外强加“季节单位根”结构。非食品侧采用 (1,0,1) × (1,1,1,12):水平序列上使用 ARMA(1,1),使冲击的影响可平滑延续若干期;季节部分对 12 个月周期作一阶季节差分,并配以季节 AR(1) 与季节 MA(1),对应非食品环比存在以年为尺度的随机季节成分,与非季节短期动态分开刻画。
3.2. 合成权重说明
由于在公开材料中无法完整复现统计局对总 CPI 环比的链式分解与分项权数生成规则,本研究在将食品与非食品分项预测合成为总CPI 环比时,对食品权重采用过去 12 个月官方公布食品权重的算术平均值作为下一期合成所用权数,非食品权重由互补关系得到。该做法的合理性在于:一方面,下月权重在预测时点不可观测,只能基于历史信息外推,而篮子结构通常缓慢变化,对近 12 个月取均值可在跟踪结构漂移的同时平滑单月噪声与数据修订;另一方面,相较单月上期权重或需额外校准参数的指数加权方案,12 个月均值规则透明、参数少、便于复核,从而降低因权数设定带来的争议成本。
3.3. 模型评估方式
本研究对模型表现的评估采用固定长度的滚动样本设计:在完整历史数据中,按规则每次截取连续十二年的样本窗口,其中前十一年用于模型估计与参数识别,最后一年作为样本外测试集,并仅以该测试年的 RMSE 衡量当期预测精度。首轮测试区间设定为 2023 年 1 月至 2023 年 12 月;此后将上述十年窗口整体向后平移六个月,重复构造测试集,共进行五轮评估,从而得到五组相互衔接、覆盖不同宏观阶段的样本外表现。最终模型的选择不仅取决于五轮测试 RMSE 的平均水平,还结合各轮误差波动与尾部表现以及方向识别能力,在精度与跨阶段稳定性之间权衡,选取 RMSE 相对较低且五轮表现最为稳健的规格作为本研究的最终模型。
4. 候选模型的构建与评估结果
4.1. 候选模型的构建
本研究的候选模型在结构上采用「食品—非食品」拆分、分别估计带季节项的 SARIMAX,再按固定权重合成总 CPI 环比;春节虚拟变量在两条方程中一律纳入,不作筛选。食品侧从经济学机制出发设定三类信息:蔬菜批发价以滞后 1 期或 3 期刻画鲜菜的季节性与短周期波动;猪周期则在同一规格中仅择一使用:猪肉批发价滞后 1 期或 3 期,或能繁母猪存栏滞后 6 期,且不与猪肉价同时进入,以避免供给链条变量高度重叠。非食品侧必须包含制造业 PMI 滞后 1 期,用于反映景气与成本环境;外部输入成本则在布伦特原油滞后 1 期与 CRB 商品指数滞后 1 期之间选择一项,以区分油价渠道与广义大宗渠道且避免多重共线。由此得到 6×2=12 条经济学含义清晰的结构组合。由于SARIMAX模型假设变量均为时序平稳变量,本研究依据单位根检验结论,对判定为非平稳的变量先作一阶差分再按相同滞后阶数进入,平稳变量仍取水平滞后,从而在统一滚动样本外框架下比较各候选模型的预测表现。
4.2. 候选模型表现对比
本研究在模型筛选中采用“预测精度—稳定性—方向识别能力”三维等权的综合排名标准:首先以五轮滚动样本外 RMSE 均值衡量平均预测误差(越小越优),确保模型在总体数值上具备较高精度;其次以五轮 RMSE 的标准差衡量跨时段表现稳定性(越小越优),避免仅在个别阶段表现良好的“偶然优胜”模型;最后以五轮样本外的方向胜率衡量模型对 CPI 环比涨跌方向的识别能力(越高越优),强化其在宏观研判和政策应用中的可解释性与实用价值。三项指标采用等权排名准则,核心考量为CPI 预测不仅要“点位准”,还要“波动稳、方向对”,从而在统计意义与经济意义之间取得更均衡、可复现的最优解。详细的模型参数对比请参考表4。其中Ln代表滞后n期,RMSE代表残差均方差,no_exog代表无任何外生变量的SARIMA模型,作为基准模型对比其他模型表现。
经综合考量,排名最优的模型食品项外生变量为:春节变量,蔬菜价格指数滞后3期,猪肉价格滞后3期;非食品项外生变量为:春节变量,CRB商品指数滞后1期,PMI指数滞后1期。
5. 最终模型样本外表现
上文中的最终预测模型在2023年至2025年的五轮测试集表现如图2所示,用来对比的无外生变量基准SARIMA模型表现则如图3所示。从样本外结果看,该模型在大多数测试窗口中均表现出较好的预测精度与跨区间稳定性,整体具有较强稳健性。与无外生变量的基线时间序列模型相比,该模型的五轮样本外 RMSE 均值由 0.3396 降至 0.2422(降幅约 28.7%),误差波动(RMSE 标准差)下降约 7.8%,方向胜率由 65.0% 提升至 80.0%。这表明引入外生变量后,模型对 CPI 环比的刻画能力和预测有效性均获得显著提升。
6. 外生变量路径预测
在2026 年外生变量路径设定上,本研究采用“数据优先 + 统计筛选 + 经济合理性校验”的组合策略:对信息更新最及时的变量(猪肉市场价、布伦特原油价格、PMI指数)优先使用已发布/已更新的 2026 月度数据,并对缺口月份衔接外生预测序列;对需内生推演的变量则采用时间序列模型筛选,其中蔬菜价格指数先由周环比递推构建历史指数(2010-01=100),再在候选 SARIMA 规格中以 2024–2025 验证集 RMSE 最小准则选择 (0,1,1)(0,1,0,12) 进行 2026 外推,可繁育母猪存栏量与 CRB 商品指数采用 AIC 最优的 SARIMA 进行缺口补全与预测。该做法的合理性在于:既充分利用可观测“真实信息”降低远期假设误差,又通过统一、可复现的统计准则控制模型复杂度并保证序列连续性与口径一致性。从趋势看,2026 年外生变量整体呈“温和波动”特征:蔬菜指数表现为上半年回落、下半年修复并年末回升,猪价在年初偏弱后逐步抬升,原油在二季度高位后缓慢回落,PMI大体围绕荣枯线附近小幅波动,整体与宏观环境“弱修复、低通胀弹性”的情形相一致。
本研究展示的外生变量路径预测方式为不预设任何观点的情况下结合其自身时序结构进行预测,实际操作中可结合外生变量走势观点进行推演,观测在不同假设的条件下CPI后一年走势的趋势。
7. 2026年CPI预测结果
7.1. 2026年CPI同比与环比预测表现
模型预测2026年CPI环比连乘累计涨幅约2.7%,具体每月环比变化如图8所示。从模型预测结果看,2026年国内通胀呈现“低位温和修复”而非明显上行:年内 CPI 环比多数月份为小幅正增长,春节后(3 月)短暂回落后逐步修复,下半年相对更平稳,说明价格中枢整体有抬升但弹性有限。由此推断,2026 年宏观经济更可能处于“弱复苏、温和通胀”状态:内需较 2024至2025 年有改善,但不足以形成高通胀压力,政策环境预计仍以稳增长、稳预期为主,货币与财政政策可能保持宽松以刺激消费与投资。整体上,价格下行风险较前期明显缓和,但经济修复的斜率仍偏温和。原材料成本方面,中东的地缘冲突带来的能源价格提升造成了一定的工业原材料成本上升压力,但实际传导到CPI仍然有限,主要得益于中国的工业体系和新能源技术。
2026年CPI同比始终为正且持续增长,较去年有大幅度回升,表明中国经济逐渐走出整体价格下行区间,宏观经济环境正在回暖。
7.2. 模型系数解读
本模型中,外生变量参数整体呈现出较为清晰且符合经济逻辑的结构特征。食品方程中,春节虚拟变量系数为正且在统计上高度显著,表明节日效应仍是推动食品价格短期上行的核心力量;猪肉价格三期滞后项系数为负且显著,说明猪价对食品CPI存在明显滞后传导,但该传导在样本期内更多体现为“前期冲击后回落修正”的动态过程。相比之下,节后虚拟变量与蔬菜差分滞后项虽方向上具备一定合理性(节后回落、蔬菜波动的短期扰动),但统计显著性不足,提示其边际解释力相对有限。
非食品方程的外生项表现更稳定。CRB一阶差分滞后项为正且显著,反映出大宗商品成本变化对非食品价格的传导机制依然存在;PMI滞后项同样为正且显著,说明景气修复能够通过需求与预期渠道支撑非食品价格中枢。春节与节后虚拟变量分别呈现“节中上行、节后回吐”的对称特征,且均达到显著水平,这与我国消费季节性和服务价格调整节奏一致。
总体看,模型参数在经济含义与统计显著性上具有较好一致性:食品端主要由节日与猪价周期驱动,非食品端则更多受成本与景气变量共同影响,支持该模型用于2026年通胀路径研判。
8. CPI月度预测模型
本研究的月度短期预测采用“滚动重估”框架:对每一个预测月t,均使用其前 132 个月样本重新估计一次模型参数,再生成 1 步前瞻预测。与长期预测模型相比,短期模型在参数设定上的核心差异在于“时变近似”假设:其默认结构形式不变,但允许参数随样本窗口滚动而缓慢调整,从而及时吸收最新价格与外生变量信息;而长期模型更强调参数稳定性与跨期一致性,默认估计系数在整个预测期内保持不变,因此对中长期趋势刻画更平滑、但对近期拐点响应相对滞后。由此带来的方法学优势是,月度短期模型在高频扰动、节日错位和外生冲击传导节奏变化较快的阶段,通常具有更强的“当期贴合能力”和转折识别能力,能够降低短期预测偏差并提高方向判断的及时性;相对地,长期模型更适用于年度路径研判与情景推演。综合而言,短期滚动模型更适合作为“近月监测与校准工具”,长期模型更适合作为“中长期基准路径工具”,两者应在同一研究框架下互补使用。
8.1. 月度短期预测模型参数说明
在本研究的当前设定中,长期预测模型与短期预测模型使用的 SARIMA 参数并不相同。长期模型(用于 2026 年全年路径预测、一次估计后多步外推)采用的是食品方程 SARIMA(2,1,0)×(1,0,1,12)、非食品方程 SARIMA(1,0,1)×(1,1,1,12);短期模型则为食品方程 SARIMA(2,0,1)×(1,0,1,12)、非食品方程 SARIMA(1,1,1)×(1,0,1,12),并在同样的外生信息框架下进行逐月重估。
两者的差异本质上是“多步稳定性优先”与“单步响应速度优先”的取舍。长期模型在食品端保留一阶差分、在非食品端使用更强的季节差分,参数设定更强调中长期平滑与年度路径一致性,适合做全年情景分析;短期模型则在食品端提高了短期动态项(由 (2,1,0) 调整为 (2,0,1)),并在非食品端弱化季节差分(由 (1,1,1,12) 调整为 (1,0,1,12)),使模型对近月冲击与拐点变化更敏感。换言之,长期模型的参数假设更接近“预测期内结构稳定”,短期模型的参数假设更接近“结构不变但系数可随滚动样本更新而适度漂移”。因此,短期模型通常在当期误差控制和转折识别上更有优势,而长期模型在年度轨迹的平滑性与可解释性上更占优。
8.2. 月度短期预测模型评估结果
本研究的短期模型采用的是逐月滚动单月步长样本外评估。具体做法是:以 2023-01 到 2025-12 的每一个月作为独立测试点,对每个测试月都仅使用
其之前最多 132 个月样本重新拟合一次模型,然后只预测该月 1 个月的 CPI 环比。将全部月份预测值与真实值对比后,计算总体与分年度的 RMSE、MAE 和方向胜率(预测环比符号与实际符号一致的比例)。这种评估方式的优势在于口径严格、贴近实时应用场景,能够真实反映模型在“每月更新、近月预判”任务中的稳定性与短期跟踪能力。
短期预测模型与长期预测最优模型在外生变量选择上呈现出“短期更敏感、长期更稳健”的差异。短期最优模型采用的是蔬菜价格指数滞后1期而非3期,说明在短期预测框架下,食品价格对蔬菜价格的短期变动更为敏感,近期信息的解释力更强;同时,食品端仍保留猪肉价格滞后3期,表明猪价信号虽然重要,但更适合以相对滞后的形式进入模型,以减少高频波动干扰。
非食品端方面,短期最优模型倾向于选择布伦特原油价格滞后1期,而长期最优模型更偏向CRB指数滞后1期;这表明短期预测更看重原油价格对当期非食品通胀的直接传导,而长期预测则更依赖CRB这类更综合的大宗商品指标来刻画成本趋势。总体来看,短期模型偏好高时效性的单项价格信号,长期模型则更偏好稳定性更强的综合性外生变量。
8.3. 月度短期预测模型样本外表现
本研究的短期模型样本外表现如下图所示。从样本外表现来看,相比长期预测模型,短期预测模型在2023年表现略差,但2024与2025年表现均更优。短期最优模型对总体走势和方向的把握较好,尤其在大多数月份能够较准确跟随实际环比的正负变化,说明其对短期拐点和节奏具有一定识别能力。结合前面的结果,模型在 2023-2025 全样本外区间的方向胜率较高,整体预测稳定性在候选模型中处于较优水平。
不足的是,该模型对个别波动较大的月份仍存在一定偏差,表现为峰值和谷值附近的振幅拟合不够充分,即在短期冲击较强时容易出现低估或高估。总体而言,该模型更擅长刻画短期方向和中枢水平,对极端波动的拟合能力相对有限,因此适合作为短期滚动研判工具,但对单月异常波动仍需结合外部信息作辅助判断。
9. 总结
本研究立足于通胀走势对宏观交易与资产配置的前瞻指引价值,以“食品—非食品”双轮驱动框架为核心,构建了一套可跟踪、可检验的CPI量化预测体系。在方法论层面,研究从货币政策、实体经济、食品价格及外部输入四个维度系统梳理外生变量池,通过格兰杰因果检验与经济学含义校验相结合的筛选流程,择优纳入蔬菜、猪肉、CRB大宗指数及制造业PMI等高信息量指标;在模型筛选与评估层面,采用五轮滚动样本外测试设计,以RMSE均值衡量预测精度、以RMSE标准差评估跨期稳定性、以方向胜率检验趋势识别能力,三维等权综合排名后确定最优模型规格。在模型层面,分别构建了侧重年度路径一致性的长期SARIMAX模型与侧重拐点响应的月度滚动短期模型,两者互为补充,形成覆盖中长期趋势研判与短期节奏把握的完整工具箱。
从实际效果来看,最终选定的长期预测模型2023至2025年五轮样本外RMSE均值为0.2422,较无外生变量基准模型下降约28.7%,方向胜率达80.0%;短期滚动模型RMSE均值为0.2379,方向胜率达80.56%,验证了外生变量引入与滚动重估机制对预测效能的边际贡献。 在模型层面,分别构建了侧重年度路径一致性的长期SARIMAX模型与侧重拐点响应的月度滚动短期模型,两者互为补充,形成覆盖中长期趋势研判与短期节奏把握的完整工具箱。
基于上述框架,模型对2026年CPI走势的核心判断为“低位温和修复、弹性仍显不足”:全年CPI环比累计涨幅预计约2.7%,价格中枢较2024—2025年有所抬升,但尚不足以形成高通胀压力。从投资含义看,该通胀环境对应货币政策维持宽松的窗口期较长,短端利率上行风险可控。
本研究亦存在若干值得持续优化的方向。其一,春节效应的刻画仍有精进空间:当前模型采用二元虚拟变量标记春节所在月份,无法区分春节落在月初、月中或月末对当月价格统计的不同影响,未来可尝试构建连续型变量(如距离春节的天数)或引入更精细的日历权重,以更精准捕捉节日错位效应。其二,CPI分项可进一步拆细:当前模型仅区分食品与非食品两大板块,尚未对非食品项下的交通通信、居住服务等子类单独建模,食品项内部亦可考虑将鲜菜、猪肉、粮食等核心分项独立处理,以提升对结构性价格波动的识别精度。其三,外生变量池可拓展至期货市场信息:期货价格蕴含市场对未来供需格局的预期,除已纳入的原油相关变量外,生猪、玉米、豆粕等农产品期货价格对食品CPI可能具有前瞻指示意义,未来可尝试将其作为增量信息纳入预测框架,进一步检验对模型精度的边际贡献。
10. 风险提示
1)政策或监管环境突变
若相关部门对食品、能源等关键品类实施临时价格干预、投放储备或调整CPI篮子构成与权重,可能改变价格形成机制与传导路径,使得基于历史数据训练的模型对短期波动的刻画出现偏差。
2)宏观经济不及预期
若内需回暖幅度低于预期、居民消费意愿持续偏弱,或房地产与就业市场修复进程受阻,可能导致核心通胀中枢进一步走低,使模型预测的“温和修复”路径面临下修风险。
3)发生重大预期外宏观事件
若发生大范围极端天气、疫病扩散或地缘冲突升级等事件,导致鲜菜、猪肉等关键食品分项价格短期剧烈波动,模型基于历史规律的季节性参数可能无法充分捕捉极端尾部风险,进而影响短期预测精度。
热门跟贴