面对海量学术论文,如何快速精准地完成综述检索?
在进行学术研究时,研究者常面临一个两难困境:传统的关键词搜索往往会返回大量无关文献,而手动筛选又极其耗时。如果能有一个 AI 助手,不仅能理解复杂的查询需求,还能像人类研究员一样自主决定“搜索什么”、“阅读哪些论文”以及“筛选哪些参考文献”,效率将大大提升。
为了解决这一痛点,字节跳动开源了 PaSa —— 一款基于大语言模型的学术论文综合检索 AI Agent。与简单的 AI 搜索不同,PaSa 具备自主决策能力,能够通过调用搜索工具、深度阅读论文内容并筛选相关引文,为复杂的学术问题提供全面且准确的答案。
PaSa 的核心工作机制
PaSa 的高效检索能力源于其内部协作的双代理(Agent)架构:
- Crawler(爬取代理): 负责解析用户的初始查询,通过调用外部工具扩展搜索范围并收集潜在的引文。
- Selector(筛选代理): 对收集到的海量论文进行精准过滤,剔除干扰项,仅保留真正符合条件的文献。
通过引入合成数据集并结合强化学习优化,PaSa 在检索的召回率和筛选的准确率上均显著优于其他基线方法,能够更可靠地处理深层学术查询。
快速上手
你可以通过以下两种方式体验或部署 PaSa:
- 在线体验: pasa-agent.ai
- 开源代码: GitHub – bytedance/pasa
正文完
