AlphaLens
Research
专题5月5日 · Morgan Stanley

推出QAML:融合量化、分析师与机器学习的选股框架

中文EN⚠ quality lint: see notes

推出QAML:一个透明、多层的选股框架,在美股、欧股和日股市场提供稳健的风险调整后回报

核心结论

QAML(量化+分析师+机器学习)是一个完全透明、级联式的选股框架,融合了五大核心因子家族(价值、质量、动量、增长、低风险)、基于行业分析师洞察的动态指标体系,以及包含100多项技术指标的AdaBoost机器学习层。自1996年以来,增强型QAML组合——增加了质量-价值和动量-修正交互过滤——产生了0.70(美股)、1.49(欧股)和1.20(日股)的税后夏普比率。在过去五年中,该框架维持或改善了这些数字:美股1.25,欧股1.31,日股0.89。关键投资启示:QAML提供了一种可扩展、透明的选择,以替代黑箱量化策略,但其有效性取决于维持贝塔中性实施、控制高换手率成本以及调整区域因子权重。

市场错误定价——三个未被充分重视的关键要素

  1. 分析师驱动的动态指标体系增强了近期表现 – 过去五年,动态指标体系的夏普比率在所有三个区域都持续超过静态核心指标。额外分析师建议的指标(例如,美股有26个增长指标)在所有样本中均提供了正的夏普比率,且过去五年的结果显著强于整个时期。这表明市场低估了分析师信息输入的及时性,以捕捉不断变化的因子领导力。

  2. 质量-价值和动量-修正过滤提供了可观的风险调整后收益 – 在过去五年中,应用这两个交互过滤使增强型组合在美股的市场夏普比率提高了+0.17,在日股提高了+0.23。改善主要来自多头:剔除在质量和价值方面均排名后10%的股票(或具有强残余动量但盈利修正较弱的股票)消除了高风险、低回报的头寸。欧股仅改善+0.02,表明存在区域性差异。

  3. 由于完全透明和市场状态适应性,过拟合风险较低 – 与许多机器学习量化模型不同,QAML的级联架构(核心→动态池→机器学习层)完全可追溯。机器学习子组合与六个传统因子回报的相关性较低(月度相关性通常<0.3),提供了真正正交的信号。敏感性测试表明,在合理的参数范围(学习率、训练轮次)内,表现是稳定的,并且基于市场状态的训练(使用OECD CLI、通胀、收益率曲线状态)进一步减少了过拟合。市场可能低估了该框架适应不同市场状态的能力,尤其是VIX状态:趋势跟踪指标在VIX下降时表现最佳,而均值回归信号在VIX上升时表现出色。

证据链

核心指标表现(税后,自1996年):

  • 美股:质量指标最强(低应计夏普比率0.5,ROIC0.4);价值(FCF收益率0.35)和动量(残余动量0.4)也有贡献;增长和低风险的夏普比率接近零或为负。
  • 欧股:价值占主导地位(FCF收益率夏普比率0.6);质量和动量为正但较弱;增长0.3;低风险接近零。
  • 日股:价值是主要驱动因素(所有三个价值因子夏普比率>0.5);质量较弱(ROE分散度历史上为3.3%,而美股为8.4%);动量在大多数行业为负;增长~0.1。

动态指标体系:

  • 在整个样本期(1996-2025),动态指标体系并未持续优于核心指标,但其过去五年的优势在所有区域都是决定性的,验证了定期更新的必要性。

机器学习层:

  • AdaBoost使用七个训练宇宙(12个月、60个月、全部历史、四个基于市场状态)。预测是行业和贝塔中性的。
  • 技术指标在五分组中表现出非线性信号特征,这证明了采用机器学习方法而非简单排序的合理性。
  • 机器学习子组合与核心因子回报的相关性较低(例如,美股:与价值、质量、动量、增长、低风险、规模因子的相关性均低于0.15)。
  • 简化机器学习层(将指标从约200个减少到26个关键指标,降低训练轮次)使美股10年夏普比率降低超过30%,凸显了完整指标集的价值。

增强过滤:

  • 质量-价值交互是凹形的:质量在最便宜的十分位中恶化最快。剔除两者中后十分位(或欧股后5%)的股票,改善了夏普比率,并将每单位波动率的最大回撤降低了约5%(美股全样本)。
  • 动量-修正过滤:残余动量和盈利修正的同时相关性为0.5-0.7;剔除残余动量处于前五分之一但盈利修正处于后十分之一的股票,消除了冲突信号。改善主要来自多头。

区域异质性:

  • 美股:医疗保健ROIC夏普比率(税后,10年)= 1.38;通信服务6个月动量 = 0.44。
  • 欧股:医疗保健上调/下调EPS修正夏普比率 = 1.02;原材料FCF收益率 = 0.86。
  • 日股:银行远期市盈率夏普比率 = 1.54;制药9个月动量 = 1.18;但大多数行业动量夏普比率为负(例如,银行 -0.32)。
  • 规模因子在所有区域和行业中普遍为负。

成本与实施:

  • 假设交易成本为2个基点,实施贝塔中性和行业中性的投资组合。贝塔中性产生的夏普比率显著高于现金中性(美股长期现金中性夏普比率低40%)。
  • 平均月度换手率超过200%(美股223%,欧股210%,日股234%)。

关键风险

  1. 因子领导力转变 – 如果价值或动量长期表现不佳(例如,美股后疫情时代价值股回撤),QAML对这些因子的敞口可能导致相对损失。动态指标体系可能会有所帮助,但无法消除市场状态风险。
  2. 动态指标体系过时 – 指标体系依赖于分析师定期审查。未能随市场状况变化更新输入,很可能会侵蚀近期的表现优势。
  3. 机器学习过拟合 – 尽管敏感性测试表明具有稳健性,但框架的复杂性(200多个指标,50个训练轮次)增加了对特定样本过拟合的概率。简化惩罚(夏普比率下降>30%)表明存在脆弱点。
  4. 区域适用性限制 – 欧洲的质量-价值过滤仅增加了+0.02的夏普比率;日本动量的过滤有效,但过去五年增强型组合的整体夏普比率(0.89)仍低于美股(1.25)。该模型并非统一适用。
  5. 换手率与成本风险 – 每月超过200%的换手率意味着巨大的交易成本。尽管回测包含了2个基点的成本(包括卖空融资成本和股息预扣税),实际滑点可能更高。现金中性实施会降低夏普比率约30%以上(美股>40%),表明对冲方法的敏感性很高。
  6. 特定市场状态 – 技术指标对VIX表现出极端敏感性:例如,美股12日EMA在VIX下降时回报率为17.8%,而在VIX上升时为-6.5%。长期高VIX时期将损害机器学习层的趋势跟踪信号。

估值与交易影响

  • 推荐实施:贝塔中性、行业中性的多空组合,月度再平衡。使用增强型QAML组合作为核心构建工具。
  • 成本管理:鉴于换手率超过200%,要求低佣金执行,并考虑仅投资于流动性最高的股票(每个区域内市值前90%)以减少冲击。回测已经剔除了规模上后10%的股票,纳入小盘股会提升欧股的夏普比率(改善一倍)但可能增加成本。
  • 区域定制:对于日股,超配价值并低配质量;对于美股,强调质量和动量;对于欧股,保持均衡敞口,但注意较弱的质量-价值过滤。
  • 风险叠加:监控VIX状态,并考虑动态调整机器学习层中趋势指标与均值回归指标的权重。该框架已经通过基于市场状态的训练做到了这一点,但明确的风险预算可以避免不成比例的回撤。
  • 监控频率:至少每半年重新评估一次动态指标体系;测试相关性阈值(0.2-0.5范围内夏普比率相似,但美股/日股最优为0.5,欧股为0.4)。
  • 替代用例:QAML框架可通过利用特定行业因子夏普比率表格来应用于单一行业组合,以倾斜敞口。然而,完整组合的分散化效益更优。

附录数据摘要(压缩版)

指标美股欧股日股
增强型QAML税后夏普比率(自1996年)0.701.491.20
增强型QAML税后夏普比率(过去5年)1.251.310.89
平均月度换手率223%210%234%
贝塔中性 vs 现金中性夏普比率惩罚-40%(长期)~-30%~-30%

因子定义摘要: 该框架使用82个基本面股票因子(价值、增长、动量、修正、质量、风险、规模)和50多个技术指标(移动平均线、振荡器、成交量、波动率、空头持仓)。完整定义见展品105-106。关键技术指标:12日EMA(趋势)、布林带宽度(均值回归)、市场贝塔(风险)。它们的表现在不同VIX状态下差异很大(参见展品103)。