从 Lightning Indexer 到 Lookahead Sparse Attention,DeepSeek 用三代模型重写了 Transformer 注意力机制的底层规则。 | AGIDaily