量化技巧

在比特币盘口里,先猜时间再猜方向,确实比只猜涨跌更像交易模型

解读 Forecasting Bitcoin price movements using multivariate Hawkes processes and limit order book data,讨论 HawkesTime 为何优于只做方向预测的 HawkesSign,以及这类方法的部署门槛。

2026-04-278分钟
高频交易论文里最常见的一种偷懒,是默认下一个价格变动会在某个固定采样点附近发生,于是模型只负责判断涨还是跌。可在真实盘口里,下一跳什么时候发生,本身就携带大量微观结构信息。等到事件真正落地时再做方向判断,和提前知道“可能在何时出现一跳”相比,对挂撤单和库存暴露的影响完全不同。
这篇论文因此把任务拆成两步。第一步用多变量 Hawkes 过程去建模 LOB 事件流,估计下一次 mid-price change 何时更可能出现;第二步再把 Base Imbalance 等状态变量送进连续时间误差模型,预测变动方向。作者把这条流水线命名为 HawkesTime,并拿它和一个直接同时做时间与符号预测的 HawkesSign 比较。这个拆分本身就比很多“直接端到端上模型”的思路更接近执行系统。

方法上的长处,不在模型名字,而在事件流与状态变量被分工处理

Hawkes 模型适合处理异步、互相激发的事件流,这一点用在订单簿上非常自然。大额买单、卖单撤单、mid-price change 和流动性补充之间存在明显的 self-excitation 与 cross-excitation,把它们当成普通均匀采样序列会损失很多结构。论文沿着这个优势走,用多变量 Hawkes 先刻画“什么时候可能有事发生”。
与此同时,方向判断并没有强行塞进 Hawkes 里做完,而是借助 BI 等盘口状态变量补上一层映射。这个设计比单一模型更容易调试,也让研究者能分清性能到底来自事件时钟、来自盘口状态,还是来自两者的耦合。对于交易团队来说,这种可拆解性远比表面上的架构新颖更值钱。

弱点也很明显:研究对象是单一 BTC/USD 环境,而且市场制度变化对结论冲击很大

作者自己就指出,2024 年 1 月和 2025 年 7 月的 BTC 市场环境差别非常大,价格中枢、波动率以及 tick size 都变了。这意味着模型并不是在一个平稳环境里做简单外推,而是在承受市场微观制度迁移。论文里 HawkesTime 仍然领先,是个优点,但也提示了另一个问题:如果制度变更更频繁、撮合质量更差,参数重估频率和线上延迟补偿会变成主要难点。
此外,样本只覆盖一个交易对和一个中心化交易所。多变量 Hawkes 很容易在单品种环境里吃到明显的事件激发结构,但跨交易所、跨交易对之后,事件定义和数据质量都会迅速复杂化。论文证明了方向是对的,却没有完全回答“这条方法链在更脏的数据和更复杂的路由下能否继续站住”。

如果把它转成可执行经验,重点应放在事件时钟建模而不是盲目迷信某个模型名

这篇论文给实务最直接的提醒是,很多短线模型在方向上已经做得不差,真正被忽略的是事件时钟。只要你还在默认“下一次变化很快就会来”,就会在挂单等待时间、撤单时机和 inventory 曝露上做出系统性错误判断。先把下一跳的时点概率建得更像真实市场,再谈方向 alpha,顺序是不能反的。
因此团队落地时更应该检查三件事:事件分类是否稳定、线上时间戳和撮合回放能否对齐、参数重估是否跟得上制度变化。若这些前提做不到,HawkesTime 的优势会在延迟和噪声里被抹平;若这些前提能做到,这篇论文提供的就不是某个孤立模型,而是一条更合理的高频预测拆分方式。

关键结论

  • 把事件到达时间和收益方向分开建模,通常比让一个模型同时承担两件事更稳。
  • 论文优势主要来自 HawkesTime 这条“先定时、再映射方向”的双阶段流水线。
  • 真实部署时,交易所制度变化、tick size 变化和 LOB 采样延迟都可能迅速稀释这类优势。

关联课程

如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。

继续阅读

微信:446860105