因子工程

非线性选股模型到底值不值得上桌,不能只看平均 IC,还得把回撤和稳定性一起摊开

解读 A Comparative Study and Backtesting of Machine Learning Based Quantitative Stock Selection Model,讨论选股模型比较里最容易被忽略的稳定性与回撤问题。

2026-05-048分钟
选股模型比较最常见的偷懒方式,是报一个平均 IC 或平均收益就结束。问题在于,量化研究真正关心的不是某个均值多高,而是它如何随时间波动,净值怎么走,以及一旦失效会怎么失效。
这篇文章虽然方法不算很前沿,但好在同时给了季度 Rank IC 的时间变化和 long-short 组合表现,让读者至少能看到“会不会只是某几个季度在撑场面”。

优点是把非线性模型的收益与风险一起摆上台面

树模型或其他非线性方法经常在横截面任务里拿到更高的平均指标,但如果没有回撤和稳定性配套信息,团队很难判断这种提升是否值得承担更高复杂度。本文至少在净值和回撤层面做了补充。
这使得结论不再只是“LightGBM 好于 Ridge”,而更像“非线性结构在这段样本期里既提高了排序能力,也没有把风险完全推离控制范围”。
更现实的问题是,许多非线性模型的优势只在个别风格环境里特别显眼,一旦市场进入风格挤压或流动性收缩阶段,原本看起来稳定的排序能力就可能快速变形。若论文只报平均 IC,团队会很难看见这种脆弱性。把收益路径、回撤和季度稳定性同时展开,至少能更早识别“均值好看但过程很难受”的模型。

问题在于样本长度和统计强度都还不够扎实

从论文给出的结果看,模型差异有一定方向性,但样本窗口仍偏短,很多优势未必已经达到足够强的统计说服力。若直接把这种比较转成生产结论,风险仍然偏高。
另外,A 股环境里的制度摩擦、风格轮动和成交约束都可能让样本期表现发生明显扭曲。没有更长窗口和更细的风格分层,结论仍偏初步。

真正值得固化到流程里的,是“模型比较最少要三张表”

以后做选股模型比较,最少应保留三类证据:时间序列上的 IC 稳定性、组合净值路径、以及最大回撤或其他下行风险指标。只给其中一个,研究结论都不完整。
把这三类证据变成固定模板,团队才不容易被某个漂亮的平均分数带偏。

关键结论

  • 比较选股模型时,季度 IC 波动、净值路径和最大回撤必须一起看。
  • 非线性模型常常在平均表现上占优,但也更容易带来样本期依赖和稳定性疑问。
  • 对研究团队来说,模型排序不该只由单一预测指标决定。

关联课程

如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。

继续阅读

微信:446860105