规划
AdaPlanBench: Evaluating Adaptive Planning in Large Language Model Agents under World and User Constraints
2026-06-05arxiv.org
★★★★★
AdaPlanBench是一个评估大语言模型代理自适应规划能力的基准。
值得记下
阅读原文↗首个同时建模世界动态性与用户意图不确定性的规划评估框架,约束维度正交解耦且可组合扩展。
内容来源:arxiv.org,版权归原作者所有