工具

MemoryDocDataSet: A Benchmark for Joint Conversational Memory and Long Document Reasoning

2026-06-04arxiv.org

发布MemoryDocDataSet基准数据集,用于联合评估对话记忆与长文档推理能力。

值得记下

首个同时绑定对话状态演化与超长上下文理解能力的结构化评测基准

阅读原文

内容来源:arxiv.org,版权归原作者所有