规划

AdaPlanBench: Evaluating Adaptive Planning in Large Language Model Agents under World and User Constraints

2026-06-05arxiv.org

AdaPlanBench是一个评估大语言模型代理自适应规划能力的基准。

值得记下

首个同时建模世界动态性与用户意图不确定性的规划评估框架,约束维度正交解耦且可组合扩展。

阅读原文

内容来源:arxiv.org,版权归原作者所有