量化技巧

自适应神经 HMM 在高频订单流里真正解决的问题,是先判断该看哪种分辨率,再决定如何做状态识别

解读 Neural Hidden Markov Model with Adaptive Granularity Attention for High-Frequency Order Flow Modeling,讨论高频订单流建模中的分辨率切换与状态识别。

2026-05-048分钟
许多订单流模型默认输入分辨率固定,先提一套多尺度特征,再交给网络自己融合。但真实市场里,某些时段细粒度订单变化重要,某些时段更长的流动性轮廓更关键,固定加权常常会把这两类信息混在一起。
本文的 AGA-Neural HMM 试图直接解决这个问题,让模型根据局部环境动态调整对细粒度和粗粒度特征的关注程度,再把这种切换嵌入状态空间建模。

优点在于把 regime 建模和特征选择绑到了一起

这比普通 attention 网络更进一步,因为它不是只在输出端调整权重,而是把市场状态切换写进了观测和转移层。这样做的好处是,模型可以把“当前该看哪层信息”视作状态的一部分,而不是事后调参。
对高频团队来说,这种结构更有解释力。你不只知道模型给了什么预测,还能看到它是在什么局部波动环境下偏向细粒度特征。
从研究流程看,这种结构还有一个好处:它迫使团队把“切换依据”从隐式经验变成显式对象。以前很多多尺度模型只是把不同窗口的特征一股脑塞进去,再让网络自己决定该怎么混。这样虽然方便,但团队很难解释为什么某次失效来自状态误判,还是来自尺度权重失衡。把切换机制单独暴露出来,至少能让失败分析更像工程诊断,而不是只能看最终精度。

弱点是证据还停留在受控实验,真实撮合摩擦没有真正进场

论文的实验结果说明了结构设计是有效的,但还没有走到真实交易链路里最难的一层,比如延迟预算、撮合差异和执行反馈如何反过来扭曲状态识别。
另外,模型越强调自适应切换,越要警惕 regime 识别过度灵敏导致的状态抖动。如果切换本身不稳定,最终可能把噪声放大成“聪明的动态反应”。

实务上更值得学的是“把尺度切换当成显式建模对象”

许多团队在盘口特征工程上花很多时间列变量,却没有认真问过“在什么情形下该看更细,什么情形下该看更粗”。这篇论文至少把这个问题显式化了。
如果不想直接复用全文架构,也应该把分辨率切换逻辑单独做成可诊断模块。先知道自己为什么要切,再决定切给谁看。

关键结论

  • 盘口状态不是固定频率下能一直看清的,模型需要在局部和全局分辨率之间切换。
  • 把状态转移和特征分辨率联动起来,比简单的多尺度拼接更贴近非平稳市场。
  • 高频模型的价值不只在分类精度,还在切换机制是否能解释交易环境变化。

关联课程

如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。

继续阅读

微信:446860105