YC科技资讯网

Claude:假设 1000 个量化团队都用 LLM 挖因子。LLM 给这 10

Claude:假设 1000 个量化团队都用 LLM 挖因子。LLM 给这 1000 个团队输出的因子高度重叠——因为底层语料是同一套。于是这 1000 个团队开始交易同样的信号:同一天买入同样的"低估值高动量"股票,同一天卖出同样的"高估值弱动量"股票。

短期内这些因子看起来有效(因为大家一起买,价格确实涨了),但这不是 alpha,这是自我实现。一旦没有新的资金流入,或者有人开始反向操作套利这个拥挤,这些因子就会突然反转。2024 年初小盘股因子的崩溃就是这个剧本。

真正的 alpha 长什么样:真正有持续 alpha 的因子通常具备一个特征——很少有人写文章讨论它。它可能来自某个行业的独特数据源、某个非直觉的价格行为模式、或者某种结构性的市场摩擦。这些东西恰恰不在 LLM 的训练语料里,因为发现它的人没有动机公开发表。

所以逻辑闭环是: 能被 LLM 生成的因子 → 一定在公开语料里 → 一定已经被广泛知晓 → 一定已经或正在被拥挤交易 → alpha 正在衰减。

反过来推,真正的 alpha 藏在信息不对称还没被消除的地方。