【华安证券·金融工程】专题报告：如何压缩因子动物园？|pca|动物园|华安证券|序列|样本|统计量|金融工程

来源：市场投研资讯

（来源：华安证券研究）

本篇是学海拾珠系列第二百五十篇。本文针对日益膨胀的“因子动物园”问题，提出了一种迭代因子选择策略进行有效压缩。核心发现是，仅需约15个关键因子即可解释美国市场153个因子的绝大部分收益信号，表明多数因子存在冗余。该方法的核心在于通过GRS统计量系统评估新增因子对解释剩余因子Alpha的贡献，从而以最少的因子数量捕捉核心定价信息。实证表明，因子加权方案影响显著，等权因子因其Alpha更强且更多样，需要超过30个因子才能覆盖因子动物园。此外，因子创新具有持续性，新因子会替代旧定义，但核心因子风格（如质量、低波动）长期稳定，跨风格分散化至关重要。该方法的有效性在全球数据中也得到验证，为投资者精简模型提供了实用框架。

迭代因子选择与GRS统计量评估

本文提出的迭代因子选择策略是压缩因子动物园的核心方法。该方法从CAPM模型开始，在每一步迭代中，从剩余因子里选择一个能最大程度提升当前模型解释力的因子加入模型，其提升效果通过GRS统计量的下降幅度来衡量。该统计量用于检验所有测试资产的alpha是否联合为零，其显著下降意味着模型解释力增强。最终，当新增因子无法使剩余因子的alpha在统计上显著异于零时，迭代停止。此过程能以最少的因子数量，系统性地捕捉因子动物园中的绝大部分有效信息。

因子冗余性与关键驱动因素

庞大的因子动物园存在高度冗余。仅需10到20个精心选择的因子，就能有效解释美国市场153个因子的整体表现，这同时表明传统多因子模型（通常含3-6个因子）可能过于简化。研究发现，因子加权方式影响显著，等权加权因子比上限市值加权因子展现出更强、更多样的alpha，但也需要更多因子（超过30个）来覆盖因子动物园。此外，因子创新具有持续性，新发布的因子有时会替代旧因子定义，但核心的因子风格集群（如质量、低波动）长期保持稳定。将方法应用于全球数据也得到了与美国市场相似的核心因子集，表明其结论具有一定的普适性，但全球模型对美国因子解释力更强，暗示国际因子蕴含更丰富的alpha信息。

文献结论基于历史数据与海外文献进行总结；不构成任何投资建议。

引言

为解释股票的横截面收益，资产定价文献提倡使用包含被认为最具代表性和相关性的因子的因子模型。由Sharpe (1964)、Lintner (1965)、Mossin (1966) 和 Treynor (1961) 开发的资本资产定价模型（CAPM）是最早的因子模型之一，这是一个围绕股票市场因子构建的单因子模型。尽管CAPM在理论上具有吸引力，但在解释平均股票收益的横截面差异方面表现不佳。最突出的是，它未能解释规模效应（Banz, 1981）和价值效应（Basu, 1977 或 Rosenberg, Reid, and Lanstein, 1985）的合理定价，这促使Fama and French (1993) 提出了一个由市场、规模和价值因子组成的三因子模型。多年来，该模型一直是行业标准，有时会加入Jegadeesh and Titman (1993) 的动量因子进行扩展，如Carhart (1997) 所示。

然而，在过去的25年里，文献中涌现了数百个因子，所有这些因子据称都提供了独特的新收益来源。Cochrane (2011) 恰当地将这种状况描述为一个需要被驯化和构建的“因子动物园”。由于现有的Fama and French (1993) 和Carhart (1997) 因子模型无法解释许多新因子，Fama and French (2015, 2018) 通过添加投资因子 (Cooper, Gulen, and Schill, 2008) 和盈利因子 (Novy-Marx, 2013) 将这些模型扩展为五因子和六因子模型。这些因子模型与其他的四因子模型竞争，例如Hou, Xue, and Zhang (2015) 的q因子模型、Stambaugh and Yuan (2017) 的错误定价模型或Barillas et al. (2020) 的修正六因子模型。尽管这些模型使用不同的因子，但主流学术界似乎达成共识，认为因子动物园中的大部分因子可以通过仅包含四到六个因子的简约模型来解释，参见Bartram et al. (2021)。

本文对因子动物园的研究旨在探究需要多少个因子才能压缩因子动物园，即在不大幅损失关于整个动物园切点投资组合信息的情况下，显著减少因子数量。为此，本文迭代式地识别那些能捕捉因子动物园中大部分可用alpha因子。具体来说，作者识别策略的第一次迭代是将CAPM与某个因子进行扩展，使得由此产生的双因子模型能最大程度地减少剩余候选因子的alpha。随后的迭代将此模型进一步扩展为一个三因子模型，以捕捉大部分剩余因子alpha。通过依次添加因子，最终得到一个能消除所有剩余因子alpha的因子模型。请注意，本文的程序呼应了早期文献所遵循的方法，即CAPM最初被规模、价值和动量因子扩展，后来又被投资和盈利因子扩展。相比之下，作者系统地考虑迄今为止记录的所有可用候选因子，直到因子动物园被充分压缩，从而得出不同的路径和见解。

分析和构建因子动物园的一个挑战是完全复现文献中现有的因子。为此，Chen and Zimmermann (2022) 以及 Jensen, Kelly, and Pedersen (2023) 复现了绝大多数现有因子，并发布了开源数据库以促进进一步研究。两项研究都证明，许多（即使不是大多数）具有高统计相关性的提议因子确实可以被复现，这对现代金融中常被声称的“复现危机”提出了挑战 (Hou, Xue, and Zhang, 2020)。鉴于 Jensen et al. (2023) 也提供了国际因子，本文的研究从其数据库中获取因子数据。

主要发现可总结如下。首先，使用一组全面的153个美国股票因子，发现一个由15个因子组成的因子模型足以覆盖整个因子动物园。选定的15个因子来源于13个因子风格类别中的8个，说明了因子集的异质性。其次，迭代因子模型在包含相同数量因子时，也优于常见的学术模型，因为它选择了替代性的价值、盈利、投资或动量因子，或包含了替代性的因子风格类别，如季节性或短期反转。在比较现有的学术模型时，发现Barillas et al. (2020) 的修正六因子模型解释了因子动物园中大部分可用的alpha。第三，当在扩展时间窗口内，随着因子逐渐可用而重复进行因子选择时，同样得到了一组多样化的选定因子。具体来说，新发布的因子有时会取代旧有的因子定义，这强调了基于新见解或新可得数据进行持续因子创新的重要性。第四，使用等权重因子而非市值加权因子，需要超过30个因子才能覆盖因子动物园，这表明等权重因子表现出更强且更多样化的alpha。最后，将因子选择策略应用于一组全球因子，会得到一组相似的选定因子。虽然基于全球数据选出的因子模型缩小了美国和除美国外全球子域的alpha，但它们在美国表现更好，这意味着国际因子表现出更大且更多样化的alpha。

本文从几个方面对文献做出了贡献。首先，提出了一种简单而有效的方法来识别因子动物园中重要的alpha贡献者。由此产生的因子集从实践者的角度来看是相关的，因为它们以最少数量的因子代表了可用的因子动物园alpha。作者的方法不同于先前关于因子收益变异的研究，例如Bessembinder, Burt, and Hrdlicka (2021) 和 Kozak, Nagel, and Santosh (2018)，这些研究主要考察因子收益的协方差结构。这些基于主成分分析（PCA）方法的统计因子研究通常识别描述协方差结构的潜在因子，而非关于均值（即因子的收益水平）的信息。例如，考虑一个假设的因子，它每月产生1%的收益且方差为零。虽然从PCA的角度来看，这个因子不相关，但从因子溢价的角度来看，它是真正相关的。本着这种思路，Lettau and Pelger (2020) 开发了一种替代性的风险溢价PCA（RP-PCA）方法，该方法结合了数据的一阶矩和二阶矩信息。然而，作者并非旨在识别因子动物园中的新潜在因子，而是渴望从alpha的角度了解最相关的因子。

其次，通过持续识别出10到20个因子（取决于选定的统计显著性水平），为关于理想因子模型规模的辩论做出了贡献。这与主流的学术因子模型形成对比，后者通常仅包含三到六个因子 (Barillas et al., 2020; Fama and French, 1993, 2015, 2018; Hou, Xue, and Zhang, 2015; Stambaugh and Yuan, 2017)。有趣的是，结果与应用横截面回归的研究结果更为一致。例如，Green, Hand, and Zhang (2017) 发现，在非微盘股中，94个特征里有12个是可靠的独立收益决定因素，并且这12个独立特征中有11个不在主流基准模型之内。类似地，Jacobs and Muller (2018) 在国际股票收益中发现了高度的维度性。此外，来自机器学习模型的最新证据表明，许多特征对于预测个股收益很重要（参见 Gu, Kelly, and Xiu, 2020; Hanauer and Kalsbach, 2023; Tobek and Hronec, 2021）。

第三，作者为关于全球定价与本地定价的文献做出了贡献。Griffin (2002)、Fama and French (2012) 和 Hanauer and Linhart (2015) 证明，在解释本地收益模式时，本地因子优于全球因子。相反，Tobek and Hronec (2021) 和 Hanauer and Kalsbach (2023) 发现，对于非美国市场，机器学习模型的样本外表现在全球模型上优于本地模型。作者强调了区域对因子选择和模型构建的影响。尽管无论显著性水平如何，覆盖美国因子动物园大约需要6到15个因子，但全球因子动物园的特点是拥有一组规模相似的高度显著的因子，但在较低的显著性水平下无法压缩到少于25至30个因子。最后，作者记录了一组能够覆盖美国因子的全球因子，但需要更多因子才能覆盖除美国外的全球因子。

本文的其余部分结构如下。第2节概述了识别因子动物园中最重要的因子的方法。第3节展示了对美国因子动物园的实证结果，考虑了不同的加权方案和动态时间周期。接着，在第4节分析全球因子动物园，并测试因子选择方法对不同区域的敏感性。第5节总结全文。

方法论

2.1 识别能够压缩因子动物园的因子

本文的目标是确定能够解释所有因子alpha所需的最少因子数量。从系统化投资者的角度来看，识别一个能够捕捉尽可能多阿尔法的因子模型是值得的，因为该模型可以指导投资组合配置以获取潜在因子溢价。鉴于文献中提出了大量因子，评估相互竞争的模型具有挑战性。评估单个因子相对于现有替代因子的贡献，并量化（可能）非嵌套（即一个模型中的所有因子都包含在另一个模型中）竞争因子模型的增量价值增加，仍然是一个开放的挑战。先前的工作通常区分左侧（LHS）和右侧（RHS）方法。前者通过在LHS测试资产超额收益的时间序列回归中模型的截距项（阿尔法）来评估模型。测试资产的著名例子包括基于规模和账面市值比、动量或错误定价的双向 5×5股票组合（参见，例如，Fama and French, 2015, 2016; Stambaugh and Yuan, 2017），或使用各种特征的十分位组合（参见，例如，Hou, Xue, and Zhang, 2020）。然而，这种方法的一个局限性是，推论依赖于LHS测试资产，并且可能因不同的测试集而异（参见 Barillas and Shanken, 2017）。相反，Barillas and Shanken (2017) 证明，比较模型的关键在于模型对未包含在模型内的因子的定价能力如何，并且令人惊讶的是，测试资产的选择是无关紧要的。对于嵌套模型，RHS方法基于跨度回归。具体来说，将新的候选因子对现有模型因子进行回归，以检验它们是否增加了机会集。如果相应的截距项非零，则被测试的因子包含未被解释的信息，从而扩展了有效投资组合前沿。RHS方法的一个早期证明例如在Fama(1998) 中给出，并且该方法被应用于 Barillas et al. (2020) 和 Hanauer (2020) 的模型比较中。为了从alpha的角度识别一个能够覆盖整个因子动物园的因子模型，采用了一种非常直观且有效的嵌套模型方法：迭代地将新因子添加到一个不断扩展的因子模型中，直到股票因子横截面中所有剩余的alpha变得不显著为止。本文的起点是CAPM，添加那个能使双因子模型最大程度减少剩余因子alpha的因子（以最低的GRS统计量衡量）。请注意，此选择标准等同于选择对现有模型具有最大阿尔法t统计量的因子。一旦识别出该因子，它就被永久添加到因子模型中，然后基于结果扩展后的因子模型重复此过程，直到没有显著的贡献者剩下。形式上，选择策略可以表述为：

在遵循这种迭代嵌套方法时，需要考虑一些事项。首先，如何衡量被测试因子的增值并比较不同的嵌套模型。鉴于因子模型的线性性质，采用基于回归的方法来区分各个因子的强度是直观的。在下一节中，将讨论文献中使用的不同度量标准并解释本文的选择。但请注意，上述方法也允许使用其他方法来评估嵌套因子模型。

其次，需要选择一个停止准则来有效确定解释因子动物园中所有alpha所需因子的数量。本文使用一个简单的准则，要求剩余显著因子alpha的总数为零。也就是说，一旦确定了一个新的因子模型，就针对该模型测试所有剩余因子，并确定剩余候选因子的alpha。如果新添加的因子是显著的，那么剩余显著因子alpha的数量在此过程中应该减少。替代标准可能是基于统计检验的新增因子显著性水平。也就是说，如果新因子未通过显著性阈值，则不应被视为强因子，因此不应添加到模型中。这种方法的一个注意事项是需要进行大量回归来识别能够解释因子动物园的因子模型。为了解决此类数据挖掘顾虑并考虑潜在的模型设定错误，采用更高的统计阈值。Harvey, Liu, and Zhu (2016) 认为 t 统计量为 3.00 足以解释由此产生的偏差和数据挖掘问题。因此，使用 t>1.96的标准阈值以及更保守的 t>3.00阈值运行本文的分析。

2.2 评估因子模型

当寻求解释整个因子动物园时，本文处理的是嵌套模型。该领域的一个常用度量标准是 Gibbons, Ross, and Shanken (1989) 提出的 GRS 统计量，它检验候选因子是否有助于改进给定模型对预期收益的解释。具体来说，GRS 检验研究测试资产的alpha是否联合显著不为零。GRS 检验在实证金融中广泛使用，并已成为评估资产定价模型性能的标准工具，例如在 Fama and French (1996, 2015) 和 Stambaugh and Yuan (2017) 中。形式上，实证 GRS 统计量给出如下：考虑一个具有 K 个因子、N 个测试资产以及每个时间序列有 τ个收益观测值的资产定价模型(2)。遵循 Fama and French (2018)，将截距项的最大化夏普比率平方定义为：

请注意，GRS 统计量关键取决于 Sh2(α)和 Sh2(f)的比率。在评估因子模型时，目标是识别一个使alpha的最大化夏普比率平方最小的模型，从而通过其系统性成分捕捉大部分收益变异。给定方程(6)中的关系，Barillas and Shanken (2017) 提出使用因子的最大化夏普比率平方来评估一组候选模型的效力。Fama and French (2018) 进一步分析了由此产生的影响，并得出结论：最能减少 Sh2(α)的模型也是具有最高 Sh2(f)的模型，这与 Barillas and Shanken (2017) 一致。因此，实证分析不仅报告 GRS 统计量及其相关的 p 值，还报告 Sh2(f)和平均绝对alpha，标记为 Avg|α|。

实证结果

3.1 数据

本文的实证研究基于 Jensen, Kelly, and Pedersen (2023, 后文简称 JKP) 的全球因子数据，覆盖了使用 93 个国家数据构建的 153 个因子。该因子集扩展了 Hou, Xue, and Zhang (2020) 的因子集，与 Chen and Zimmermann (2022) 的因子集相似，因此是因子动物园的一个有代表性的样本。JKP 数据库提供了基于给定时间点最新会计数据的一个月持有期因子收益。

为了能够覆盖本文研究中的所有 153 个因子，从 1971 年 11 月开始研究美国市值加权因子，样本期结束于 2021 年 12 月。在市值加权因子中，股票每月按特征分为三组，市值加权三组收益计算为市值加权投资组合收益，但单只股票权重上限为 NYSE 市值的 80 分位数。因子收益则定义为高组减低组的收益，参见 JKP。这种因子构建方法旨在创建可交易且平衡的投资组合，既不由超大市值股主导，也不由微小市值股主导。请注意，在第 3.5 节考察了主要分析对于替代因子加权方案的稳健性。

图表2基于月度 CAPM 回归展示了所有因子年化alpha的概览。所有因子被聚为 13 个类别，这是 JKP 基于层次聚合聚类 (Murtagh and Legendre, 2014) 识别出来的，类别名称由最具代表性的特征驱动。观察到除低杠杆 (Low Leverage) 类别外，所有类别的大部分年化alpha为正。所有因子的平均alpha为年化 3.51%，并且alpha在类别之间和类别内部都分布得相当均匀。

大多数因子表现出显著的alpha溢价（即表明其具有超越市场收益的增量解释力）并不令人惊讶，因此它们一开始就被认为是相关因子。Blitz (2023) 进一步分析了这组因子的市场风险、业绩周期性以及因子收益横截面中固有的季节性和动量效应。然而，因子动物园内各个因子的增量alpha贡献问题仍然是一个悬而未决的问题。

3.2 主要结果

图表3展示了遵循第2节描述的迭代因子选择过程后的主要结果。作者报告了选定的因子、它们关联的因子风格类别、GRS 统计量及相应的 p 值 p(GRS)、平均绝对截距 Avg|a|、模型因子的最大化夏普比率平方 Sh2(f)以及它们的夏普比率 SR。第 10-11 列指的是在控制了指定因子模型后仍显著的因子alpha数量，从而表明了所选因子的增量解释力。列标签 t>2 和 t>3 分别指的是使用显著性alpha阈值 t(α)>1.96或 t(α)>3.00进行的迭代因子选择。请注意，在后续的表格中也报告了常见因子模型下的显著因子数量。

迭代因子选择的起点是CAPM模型。基于这个单因子模型，明确拒绝了所有因子alpha在统计上与零无差异的GRS检验原假设（GRS统计量为4.36，p值为0.00）。无论选择哪个阈值，CAPM都留下了大量显著的因子alpha（t>2时为105个因子，t>3时为86个因子）。在下一步中，本文的方法将基于现金的营业利润与账面资产比率(cash-basedoperatingprofits-to-bookassets,cop_at)识别为因子动物园中最强的因子。将这个质量因子添加到市场因子中，仍然产生了高度显著的GRS统计量3.54，但绝对的GRS值明显降低了。然而，在这个双因子模型中，仍有101个(t>2)或78个(t>3)因子具有年化3.94%的平均绝对alpha。

第二次迭代将净经营资产变化识别为剩余因子动物园竞争者中最强的因子。三因子模型留下了65个(t>2)或34个(t>3)显著的因子alpha。平均绝对alpha降至年化2.15%，而GRS统计量仍然高度显著（2.98，p值为0.00）。

进一步迭代，因子模型按构建方式增加。虽然图表3记录了添加前三十个最相关因子的影响，但只需这个数量的一半就能解释整个因子动物园。添加第 15 个因子（过去五个最高日收益经波动率调整, rmax5_rvol_21d）后，剩余显著alpha的数量降至零 (t>3)。即使使用不太严格的 t>2 阈值，也总共只需要 18 次迭代即可使剩余alpha变得不显著。这些截止数字与基于 GRS 统计量显著性水平的替代停止准则一致：过去五个最高日收益经波动率调整 (rmax5_rvol_21d) 也是第一个超过 5% 显著性水平（p 值为 0.09）的因子。总的来说，这些结果表明，从alpha的角度来看，只需要 15 到 18 个额外因子就能解释因子动物园，无论使用哪种停止准则。

在此背景下，想知道迭代因子选择与经典学术因子模型相比如何。下表报告了知名模型下显著的因子alpha数量（使用 t>3的显著性阈值测量）。此处，列 FF5 和 FF6 指的是 Fama and French (2015) 五因子模型，其中 FF6 在此基础上增加了一个动量因子。此外，HXZ、BS 和 SY 分别指的是 Hou, Xue, and Zhang (2015) 的 q 因子模型、Barillas et al. (2020) 的修订六因子模型和 Stambaugh and Yuan (2017) 的错误定价模型。

相对于 CAPM（86个alpha满足t>3.00），Fama and French 五因子和六因子模型、q因子模型和错误定价模型仍然分别留下58到69个显著的alpha。然而，Barillas et al. (2020) 的修订六因子模型显著地将显著alpha的数量减少到33个。这种卓越的解释力源于与其他模型的一个主要区别，即包含了基于现金的营业利润与账面资产比率 (cop_at) 因子，该因子在迭代因子选择方法中也成为了关键因子。当将学术因子模型与包含相同数量因子的迭代因子模型进行比较时，迭代因子模型方法的效力得以显现。虽然包含四个因子的迭代模型仅留下十个显著因子，但 Hou, Xue, and Zhang (2015) 和 Stambaugh and Yuan (2017) 的四因子模型仍然分别留下60和55个显著alpha。类似地，包含五和六个因子的迭代模型分别留下14和15个显著alpha，而对于 Fama and French 五因子和六因子模型以及 Barillas et al. (2020) 的修订六因子模型，则分别留下65、53和29个显著alpha。这些结果强化了所选因子确实携带了超越经典学术因子的信息。更具体地说，基于现金的营业利润与账面资产比率(cop_at)是15个选定因子中唯一一个也包含在常见学术因子模型（即 Barillas et al. (2020) 的修订六因子模型）中的因子。所有其他选定的因子要么代表了替代的价值、盈利能力、投资或动量定义，要么源自于提供超越常见因子模型的alpha的替代因子风格类别，例如季节性或不短期反转（参见 Blitz et al., 2023）。

请注意，这15个选定的因子源自13个已定义的因子风格类别中的8个，其余五个类别中的因子均未被考虑，详见下图中高亮显示的因子条。此外，选定的因子并不一定是特定因子风格集群中CAPM alpha值最高的因子；事实上，这种情况仅适用于价值、质量、短期反转和季节性集群。值得注意的是，在八个有代表的因子集群中，有五个仅包含一个因子，而价值、低风险和投资集群则由3到4个因子代表。

在此背景下，作者思考遵循这些选定因子究竟有多重要，或者是否足以从13个类别中的每一个类别里确定一个最强的因子。图表4的最后一列报告了一个13因子模型的结果，该模型由每个集群中（绝对CAPM alpha值最大的）最强因子组成。该模型几乎涵盖了整个因子动物园，仅剩下四个因子无法解释。在前30个因子中，它仅未能解释掉一个季度的销售增长(saleq_gr1)和内在价值与市值比(ival_me)的alpha，这凸显了跨集群模型的有效性。然而，带有13个额外因子的迭代模型仅留下一个显著的alpha。

3.3 因子相关性的时间持续性

在分析了3.2节中的全样本证据后，思考个体因子相关性的时间持续性。分析因子动物园中个体因子相对强度时的一个注意事项是，许多因子是在研究过程中才陆续发布的，并且其发布后的表现往往较弱(McLean and Pontiff,2016)。为了更好地理解选定因子集合如何随时间演变，重复了迭代因子选择过程，但将每次的选择限制在当时可用的因子范围内。事实上，在整个样本期内发现表现非常好的许多因子，在多年前并不为人所知。例如，Blitz,Huij,and Martens(2011)提出的残差动量因子(resff3_12_1)直到2011年才发布，因此在该样本期的前25年中并不可用。具体来说，作者的分析基于一个扩展窗口分析，使用180个月的初始窗口，因此在1986年12月获得第一个样本外观测值。每年，在进行年度迭代因子选择时仅考虑已发布的因子，并收集如表所示的信息。但是，请注意，在首次出现n(α)t(α)>3=0时停止迭代，即当得到第一个在t>3.00阈值下使所有剩余因子alpha都不显著的因子模型时。

图表6按时间顺序突出了相关因子，并按其对应的因子风格集群着色。也就是说，在相应年份的因子模型中被选中的因子，都会在时间轴上高亮显示。虽然绝大多数因子从未或很少被纳入模型，但表中全样本证据显示的主要因子却显著出现，尤其是在过去10-15年间。

作者观察到，一旦有代表性的因子发布，许多因子风格集群在大部分时间里都会被纳入模型。例如，价值集群在大部分时间都存在，动量集群自Jegadeesh and Titman(1993)发布以来也一直有代表因子。其他持续存在的因子类别包括应计项目、投资、季节性和短期反转。然而，许多因子风格集群的代表因子会发生变化。例如，质量因子在过去三十年一直被认为高度相关，但通常每次只选择一个质量因子。类似的观察也适用于动量因子集群，其在样本期内由四个不同的因子代表。值得注意的是，残差动量(resff3_12_1)的引入使得先前选定的经典动量因子(ret_12_1)变得不显著(参见 Blitz, Hanauer, and Vidojevic, 2020)。另一个例子是应计项目集群。新的因子“当期营运资本变动”(cowc_gr1a)一经发布，便取代了营运应计因子(oaccruals_at)。这些观察结果强调了基于新见解或新数据不断添加和创新因子及其定义的必要性和相关性。

3.4 滚动窗口分析

鉴于不同因子风格集群的长期相关性，接下来研究它们在较短时间间隔内的相关性。因此，本文进行了滚动窗口分析，窗口大小为180个月，每年更新。遵循与之前相同的迭代因子选择方法，并且只报告那些对模型贡献最大、留下未解释alpha最少的选定因子。

图表7描绘了迭代选择过程的发展情况，该图在因子风格集群层面进行了汇总。在滚动窗口分析的每一年，按风格因子集群收集选定的因子。图表7的上图使用t > 2的临界值绘制了每年模型中包含的因子数量，而下图则报告了t > 3临界值的结果。作者报告两个阈值，以应对数据挖掘的担忧，同时评估边界因子的相关性。此外，相对于全样本证据，仅使用180个月的窗口大小自然提高了因子超过给定阈值的门槛。

上图记录了选定因子数量随时间减少的趋势。虽然在样本期早期需要大约15个因子来覆盖因子动物园，但这个数字在最近几年减少到大约8个因子。然而，有一些特定的因子风格长期以来一直具有相关性，包括低波动、季节性、投资和质量。虽然动量、短期反转和价值在2010年代初之前几乎每年都被纳入，但它们的相关性在样本末期有所减弱。

相反，采用 t>3阈值的下图仅报告平均需要4到6个因子来覆盖剩余的因子动物园。近年来最相关的因子风格是质量、低波动以及季节性。总的来说，观察到因子模型规模也有类似的下降趋势，尽管基于 t>2阈值的起始模型规模已经相对较小。总体而言，所代表的因子风格集群随时间缓慢变化，并且通常涉及低波动、季节性和质量集群的某些因子代表。有趣的是，经典的规模因子很少被选中，并且在覆盖其他因子的alpha方面似乎并不相关。

3.5 关于替代加权方案的稳健性

用于构建因子投资组合的加权方案可能产生重大影响，参见Bessembinder, Burt, and Hrdlicka(2022) 以及 Soebhag, Van Vliet, and Verwijmer极地(2023)等的研究。因此，针对三种加权方案检查了结果的稳健性：上限市值加权(CW)、市值加权(VW)和等权(EW)。针对不同的加权方案重复了图表3的分析，并将相应结果总结在下图中。

图中的第一行描绘了随着因子数量增加，GRS统计量及其相关p值的变化情况。虽然上限市值加权和市值加权因子模型的起始GRS统计量是较低的单位数，但等权(EW)因子模型的起始值却是两位数。尽管增加因子数量时EW因子的GRS统计量下降很快，但p值表明即使有30个因子，其显著性依然存在，这与另外两种因子加权方案不同。比较CW和VW因子模型，观察到CW的p值首先开始改善，并在添加第15个因子时跨越5%的显著性阈值，而VW需要18个因子。虽然所有三种加权方案的平均绝对alpha值(Avg ∣α∣)似乎收敛于相同的数值，但调整后的夏普比率平方(adj. Sh2(f))却并非如此。事实上，CW和VW因子模型分别收敛于不同的调整后夏普比率平方，而EW因子模型在考虑30个因子时尚未收敛。这些观察结果，结合Fama and French(2018)的结果——他们总结说具有最高Sh2(f)的模型必然是最能最小化剩余alpha的最佳模型——意味着EW因子模型并非局限于用少量因子来覆盖整个因子动物园。换句话说，EW因子呈现出更高且更多样化的alpha潜力，因此需要更多因子来覆盖EW因子动物园。

在图的最后一行，追踪了给定因子模型下剩余显著因子的数量。垂直虚线表示给定加权方案下首次出现剩余显著因子数量为零的情况。虽然所有三种加权方案都随着模型规模增大而减少剩余显著alpha的数量，但EW因子模型在此过程中有时表现得不稳定（数量有起伏）。也就是说，增加因子数量并不必然导致动物园中剩余显著因子数量的减少。此外，CW和VW因子模型分别需要18和19个因子来解释掉所有因子动物园的alpha，而EW因子模型在 t>2的显著性阈值下需要超过30个因子。值得注意的是，在 t>3 的阈值下，这个顺序几乎颠倒了。此时，VW因子模型需要额外9个因子来消除显著alpha，其次是EW和CW，分别需要11和15个因子。这些结果表明，选定的CW因子在解释CW因子动物园方面相对更强，而EW因子模型基于较少的重要因子，其余因子则更易受数据挖掘问题的影响。

国际证据

4.1 全球因子选择

接下来，本文拓宽视野，使用93个不同国家的国际数据，研究图表3中的美国证据是否适用于全球因子。鉴于某些股票特定指标的可用性有限，缩短了国际样本的时间范围，专注于1993年8月至2021年12月这一时期。该样本覆盖了全球(World)、美国(U.S.)和美国以外全球(World ex U.S.)这三个区域的136个常见因子。

下表记录了基于全球因子数据的迭代因子选择过程。尽管使用了全球因子且样本期较短，但观察到所选因子与图表3中的美国结果有很好的重叠。在前十个选定的因子中，有三个是相同的(cop_at, resff3_12_1, cowc_gr1a)，并且两个选定的投资因子与美国的因子非常相似。此外，这些顶级因子的选定因子风格集群顺序也非常相似（几乎相同）。

选择过程显示，在执行 t>3的阈值时，需要11个全球因子来覆盖全球因子动物园。即使在较低的 t>2阈值下，也只需要大约二十多个因子就能覆盖因子动物园。从GRS检验的角度来看，需要一到两打（12-24个）因子来拒绝“没有剩余显著alpha”的原假设，并且作者可以清楚地观察到全球因子的GRS统计量单调下降。

然而，美国和美国以外全球样本的GRS统计量也几乎单调下降，表明全球因子模型也适用于这些子样本。虽然美国样本中的模型通常具有较低的GRS统计量，导致在大约六个因子时就能拒绝原假设，但世界其他地区的模型则具有更高的GRS值。请注意，这次国际分析的较短样本期由于其构建方式已经导致相关因子数量的减少，参见下一小节中的图表10。尽管从全球数据推导出的因子模型对美国以外全球的因子具有解释力，但它们对美国因子的解释效果更好。这一观察结果的可能解释是，国际因子需要解释的alpha远高于美国因子（国际因子的GRS统计量超过7.03，而美国因子的GRS统计量为2.13）。

4.2 区域比较

迄今为止，全球因子已被证明对解释美国因子回报具有相关性，但它们缺乏对美国以外全球因子的解释力。在4.1节的背景下，思考本地因子模型是否确实强于全球模型。因此，分别确定了每个区域内的迭代因子模型，并将相关统计量按区域并列展示在下图中。

GRS统计量根据设计在三个区域均呈下降趋势。然而，作者可以清楚地看到，美国以外全球（World ex-U.S.）因子的GRS统计量下降发生在比美国和全球因子更高的水平上。因此，对于美国以外全球样本，需要超过30个因子才能在5%的显著性水平上拒绝原假设，而美国模型和全球模型分别仅需要15和22个因子。这种差异主要是由不同区域调整后夏普比率平方（adj. Sh2(f)）收敛速度较慢所驱动的，如图第二行所示。虽然美国因子模型的调整后夏普比率平方似乎收敛于某个极限，但另外两个模型的相应线条在30个因子时仍保持正斜率。相反，一旦考虑30个因子，所有三个区域的平均绝对alpha似乎都收敛到一个统计上不显著的数值。

比较覆盖所有因子动物园alpha所需的模型规模，注意到美国模型的规模相当稳定，介于6个（t > 3）到12个（t > 2）因子之间，这凸显了所选因子真正具有相关性。然而，其他区域的因子相关性参差不齐。在全局（美国以外全球）因子动物园中，以t > 2为阈值识别出的27（28）个因子中，仅有11（13）个在更高的t > 3阈值下被视为相关。因此，这些本地选择的因子模型甚至比通用模型略胜一筹，后者本身已能较好地覆盖不同区域，尤其是美国因子。

结论

正如 Cochrane（2011）以及 Harvey、Liu 和 Zhu（2016）所述，过去几十年来因子动物园的规模显著扩张，这凸显了甄别有效因子与无效因子的必要性。为此，研究旨在探究因子动物园中各个因子的Alpha贡献。具体而言，提出了一种迭代因子选择策略来压缩因子动物园，从而在保留对切线投资组合至关重要信息的前提下，大幅减少因子数量。最终筛选出的因子集能够以最少数量的因子捕捉因子动物园中可用的Alpha，这对业界实践和学术研究均具有重要意义。

通过使用一套包含153个美国股票因子的综合数据集，作者发现，根据所选统计显著性水平的不同，大约需要10到20个因子即可覆盖整个因子动物园。这表明大多数候选因子是冗余的，同时也意味着通常仅包含三到六个因子的学术因子模型定义过于狭窄。当在一个扩展的时间窗口内，对逐步可用的因子重复进行因子选择时，发现新发布的因子有时会取代旧的因子定义，这强调了基于新见解或新数据持续进行因子创新的重要性。然而，已识别的因子风格集群表现出相当的持续性，这凸显了跨因子风格多样化配置的相关性。

此外，作者证实，与上限市值加权因子相比，使用等权加权因子需要超过30个因子才能覆盖因子动物园，这表明等权加权因子能产生更强且更多样化的Alpha。最后，将因子选择策略应用于一组全球因子，会得到一组相似的选定因子。尽管基于全球数据选择的因子模型会降低对美国市场和美国以外全球市场子集的Alpha解释力，但它们在美国市场上的表现更佳，这意味着国际因子呈现出更大且更多样化的Alpha潜力。

总体而言，本文所提出的方法能够有效捕捉不同区域和子时期下因子动物园中的可用Alpha，有助于投资者聚焦于最相关的因子，并为学术界改进资产定价模型提供了启示。

文献来源：

核心内容摘选自Swade A , Hanauer M X , Lohre H ,et al.于2024年在Journal of Portfolio Management上的文章《Factor Zoo (.zip)》。

文献结论基于历史数据与海外文献进行总结；不构成任何投资建议。

本报告摘自华安证券2025年9月29日已发布的《【华安证券·金融工程】专题报告：如何压缩因子动物园？》，具体分析内容请详见报告。若因对报告的摘编等产生歧义，应以报告发布当日的完整内容为准。