工具

Vortex: Efficient and Programmable Sparse Attention Serving for AI Agents

2026-06-06arxiv.org

Vortex是一个面向AI代理的高效可编程稀疏注意力服务系统。

值得记下

将稀疏注意力从模型层抽象为可编程服务层,允许代理在推理中动态切换稀疏模式

阅读原文

内容来源:arxiv.org,版权归原作者所有