量化技巧

高维组合优化别急着估权重,先把资产筛准往往更重要

围绕 Post-Screening Portfolio Selection 这篇论文,讨论高维组合构建里为什么“先筛后配”可能比一步到位更稳,也更接近实务上的约束处理方式。

2026-04-258分钟
很多高维组合优化文章都会直接在庞大的资产空间里求权重,技术上很完整,但对实务团队来说往往不够透明。Post-Screening Portfolio Selection 的思路更朴素:先识别真正相关的资产集合,再在缩小后的空间里做权重估计。Figure 1 的概念图看上去很简单,却准确抓住了问题本质。面对维度远大于样本量的场景,最先需要解决的常常不是精确算出每个权重,而是别把大量无关资产一起拖进来。
这个重写方式有两个好处。第一,它把组合构建与支持集恢复联系起来,使问题更容易讨论可识别性和统计误差。第二,它让许多研究团队在实务里已经默认采用的预筛选步骤,终于有了更明确的理论坐标。很多时候,策略并不是输在优化器不够先进,而是输在一开始就拿错了资产集合。
  • 先筛后配听起来朴素,但它把最关键的误差源提前暴露了。
  • 高维问题里,选错资产集合往往比权重估错更致命。

方法上最扎实的地方,是它没有把筛选当成回测前的随手预处理

论文不是简单建议“先做 feature selection 再优化”,而是把 support recovery 写成了核心理论对象,并进一步区分了 PS² 与面对强因子场景的 FPS²。这样一来,筛选步骤不再只是为了加速运算,而是直接决定最终组合能否逼近目标权重。作者在模拟与经验结果里都在强调这一点:如果筛选阶段就把有效资产漏掉,后面的低维估计再精细也救不回来。
这类处理方式对因子投资和大资产池配置都很有启发。因为真实世界里的组合构建经常先经过行业、流动性、暴露、名单稳定性等多重筛选,只是这些筛选在研究报告里常被弱化成工程细节。论文做的事情,是把这部分重新抬到方法层。
  • 筛选不是前置清洗,而是决定最终组合质量的核心步骤。
  • 把强因子场景单独拿出来处理,是这篇论文比较负责任的地方。

它的风险同样不小:支持集稳定性一旦下降,方法优势会迅速缩水

这篇论文一个天然前提,是市场里确实存在相对清晰的 relevant subset,且这个 subset 在估计窗口里足够稳定。现实里这并不总成立。行业轮动、主题切换、流动性挤兑和制度变化都可能让支持集本身漂移得很快。一旦资产相关结构和期望收益结构变动加速,先筛后配的优势就可能被频繁重筛带来的噪声抵消。
另外,论文的主要展示仍偏统计表现,对交易成本、容量和换手惩罚的展开不算充分。对实盘来说,筛选越激进,组合名单变化越剧烈,后端执行成本往往越敏感。如果团队只记住了“先筛后配更优”,却没有同步控制名单稳定性,就很容易把纸面 Sharpe 换成实盘摩擦。
  • 先筛后配最怕支持集漂移过快。
  • 没有把换手和成本写进去的方法优越性,离实盘仍有距离。

对量化实务最有用的启发,是把组合构建拆成可审计的两份报告

如果要把这篇论文转成团队方法,一个很实用的动作是把组合研究报告拆成两层。第一层单独汇报筛选规则与稳定性,包括保留下来的资产数量、滚动窗口内的一致性、与行业和风格暴露的关系。第二层才汇报在筛选集上的权重估计与业绩表现。这样做的好处是,一旦结果失真,团队能立刻判断问题出在选集还是出在配权。
这其实也是论文带来的最大实务价值。它不是宣称找到了一种万能优化器,而是提醒我们:在高维环境里,先把问题拆对,比直接求一个看上去很高级的解更重要。
  • 组合研究先分清“筛选错了”还是“权重错了”,调试效率会高很多。
  • 高维优化里,把问题拆开往往比把公式堆复杂更有价值。

关键结论

  • 在高维组合问题里,支持集恢复和权重估计不一定要绑成一步完成。
  • PS² / FPS² 的核心贡献,是把“先筛后配”从经验做法写成可分析的方法框架。
  • 真正上手时,筛选稳定性、换手和交易成本仍然是方法能否落地的关键。

关联课程

如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。

继续阅读

微信:446860105