工具
Vortex: Efficient and Programmable Sparse Attention Serving for AI Agents
2026-06-06arxiv.org
★★★★★
Vortex是一个面向AI代理的高效可编程稀疏注意力服务系统。
值得记下
阅读原文↗将稀疏注意力从模型层抽象为可编程服务层,允许代理在推理中动态切换稀疏模式
内容来源:arxiv.org,版权归原作者所有
Vortex是一个面向AI代理的高效可编程稀疏注意力服务系统。
将稀疏注意力从模型层抽象为可编程服务层,允许代理在推理中动态切换稀疏模式
内容来源:arxiv.org,版权归原作者所有