开发技术

PaperScope: A Multi-Modal Multi-Document Benchmark for Agentic Deep Research Across Massive Scientific Papers

2026-04-14arxiv.org

发布面向海量文献的智能体深度研究基准,支持多模态多文档交叉分析评估。

值得记下

首创大规模科研文献深度研究评测集,全面检验智能体跨文档推理与知识整合能力。

阅读原文

内容来源:arxiv.org,版权归原作者所有