量化技巧

流动性决定因素一旦放开非线性,很多线性点差故事都会变得太简单

解读 Nonparametric Determinants of Market Liquidity,讨论订单特征、成交活跃度和点差之间的非线性关系。

2026-05-038分钟
流动性研究里,大家很熟悉成交量、波动率、市场冲击、券商效率这些变量,但很多工作默认它们和 bid-ask spread 之间关系是大致线性的。这个假设足够方便,也足够容易估计,但在真实执行场景里常常过于粗糙。
本文使用非参数和可解释机器学习去重新看这些关系,得到的结论并不神秘,却很实用:有些变量确实方向稳定,但强度会饱和;有些变量看似重要,却只在某些区间突然起作用。也就是说,流动性问题往往更像曲线问题,而不是斜率问题。

强点在于它把订单层面特征带回了流动性解释框架

论文数据不是抽象市场指数,而是欧洲资管机构的 daily placement orders,因此市场冲击、执行价格偏离、券商效率这些更接近执行现场的变量被放到了模型核心位置。这使得结果比单纯用公共行情变量更贴近实际下单环境。
对执行研究来说,这一点尤其有价值。很多时候不是总成交量决定你能不能成交,而是订单相对 ADV 的比例、冲击成本和执行链路效率共同决定你要付出多大 spread。

边界同样明显:机构订单数据的视角不等于全市场视角

这套结果高度依赖样本来源。机构 placement order 的流动性经历,与零售、做市或高频盘口里的流动性概念并不完全一样。若把它外推到别的市场参与者,容易误以为所有流动性问题都围着同一组变量转。
另外,非参数模型即便更灵活,也会带来稳定性和迁移性问题。变量曲线在一个时间段里很清楚,不代表换了波动 regime 后还保持相同形状。

最值得带走的,是把流动性变量建成分段响应而不是单斜率响应

做流动性预测和执行成本建模时,这篇论文给出的最实际启发是:对关键变量别只估一个全局斜率。成交量、相对 ADV、冲击成本、券商效率等变量更适合做分段响应、饱和区间识别和区间预警。
当研究流程从‘变量重要吗’切换到‘变量在哪个区间突然变得重要’,执行模型才更有机会接近真实交易环境。

关键结论

  • 流动性和成交活跃度、冲击成本、券商效率之间常常是非线性关系。
  • 线性回归能抓住方向,但会丢掉很多关键的拐点和饱和区间。
  • 做流动性预测时,重要的不只是变量名单,还包括变量作用曲线的形状。

关联课程

如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。

继续阅读

微信:446860105