因子工程

先修图,再做图谱:这篇跨股票预测论文把“错误邻居”清得比信号本身更重要

解读 Cross-Stock Predictability via LLM-Augmented Semantic Networks,讨论 LLM 过滤语义边之后,跨股票均值回复信号为什么会更干净,以及这套方法在真实因子研究里还缺什么。

2026-04-279分钟
跨股票预测研究一直有一个老问题:大家都知道供应链、上下游、互补品和竞争对手之间会存在信息扩散,但真正难做的是如何稳定、低成本地把这种联系从全市场里找出来。过去不少做法要么依赖行业分类,要么依赖公开供应链标签,覆盖面和更新速度都不理想。于是文本嵌入网络看上去像是很自然的升级版,年报里写得像的公司被连在一起,再把价差、z-score 或均值回复信号往图上做传播。
这篇论文的第一步不是急着展示预测收益,而是承认这种做法会产生大量“错误邻居”。两家公司可能都在 10-K 里高频提到关税、供应链扰动和监管不确定性,但它们之间并没有真正的业务传导关系。若把这类语义相似直接当成交易边,图会非常密,却未必更有信息。作者因此把问题改写成“先建候选图,再做经济关系筛边”,这比直接宣称 LLM 会预测股价要克制得多。

方法上的亮点,在于把“相似度找候选边”和“语义判断边类型”拆成两步

作者没有让大模型直接在全市场两两配对上做全量推理,而是先用嵌入相似度做候选图,把计算复杂度从近似全连接压到 O(NK)。这一步其实非常关键,因为真正让类似框架可落地的不是提示词本身,而是先把需要贵推理资源的边压缩到一个可控集合里。随后再让 LLM 去判断候选边究竟是竞争关系、供应链关系、互补关系还是纯粹的“看起来像”。
第二个亮点是作者没有满足于单纯删边,而是把关系类型进一步写回组合权重。竞争对手边会被移除,替代品关系会被降权,历史价格共动距离也继续参与 softmax 聚合。换句话说,这不是“语言模型预测收益”,而是“语言模型清洗结构,再由传统价差信号完成交易映射”。这条分工边界非常清楚,也更符合量化研究里组件化验证的思路。

结果看上去是正面的,但还没有强到可以直接宣告可生产化

从回测结果看,作者展示了几个相对可靠的事实。第一,随机图明显更差,说明语义图不是纯碰运气。第二,用 LLM 过滤候选边后,Sharpe 和回撤都改善,表明问题确实出在边的经济含义不够干净。第三,和 SIC 行业图相比,文本图谱能捕捉更细的联系,这一点对跨行业传导型 alpha 很重要。
但这些结果的边界也同样清楚。样本只覆盖 2011 到 2019 年的美股大盘股,图结构按年更新,交易频率却是日度,这意味着年度文本图能否在更剧烈的制度或行业切换中保持稳定,论文还没有证明。另外,LLM 分类只基于 10-K 文本,缺少新闻、供应链数据库和事件流补充;一旦企业描述风格变化、文本提取有截断误差,关系边很可能漂移。

对因子研究团队的启发,不是“上大模型”,而是先审结构噪声来自哪里

很多团队做图谱因子时,默认更多节点和更多连接会让信号更丰富,但这篇论文提醒我们,结构噪声往往先于模型误差成为主导问题。假如候选边里混入大量不具备传导机制的公司对,再精细的 z-score 聚合也只是把错误关系平均化。比起继续堆复杂 GNN,先定义一套更稳的边审查流程,收益可能更直接。
因此真正可执行的落地动作有三个。第一,把候选边生成和边类型判定彻底拆开,单独记录每条边的进入理由。第二,把边分类结果的跨期稳定性做成监控项,避免每年图结构大幅翻转。第三,在回测层面把交易成本、换手和边重构延迟单独列为风险栏。只有这些约束补齐后,这类跨股票图谱才更像研究资产,而不只是一次漂亮的文本金融实验。

关键结论

  • 文本嵌入能找到“看起来像”的公司,但不等于找到真正会传导信息的公司。
  • 这篇论文的增量不在于又上了一层 LLM,而在于把图结构里的错误边当成了主要噪声源。
  • 如果团队要把类似方法做成生产因子,边分类稳定性、交易成本和年度重构频率都要继续补实验。

关联课程

如果你想把这篇文章里的方法系统化学习,可以从这些课程继续深入。

继续阅读

微信:446860105