Paper2Poster:自动化将科研论文转化为可编辑海报
在学术会议中,海报是快速传播研究成果的关键媒介。然而,将长篇幅、含大量图表的论文手动转化为视觉海报,往往意味着繁琐的排版工作与巨大的时间成本。Paper2Poster 旨在打破这一僵局,通过自动化流程将科研 PDF 论文直接转换为可编辑的 PPTX 海报。
项目核心机制
Paper2Poster 采用多智能体(Multi-Agent)系统架构,集成 GPT-4o 与 Qwen-2.5-7B-Instruct 等先进大模型,实现了从内容解析到视觉呈现的全链路自动化。用户仅需上传 PDF 并运行脚本,即可获得高质量的初步方案。
其自动化流程由三个关键模块驱动:
- Parser(解析模块): 负责精准提取论文中的核心文本与关键信息。
- Planner(规划模块): 将提取的文本与视觉元素进行匹配,并规划整体布局。
- Painter-Commenter(渲染与优化模块): 执行最终的海报绘制,并对视觉效果进行迭代优化。
主要功能与优势
- 高保真输出: 确保生成的海报在视觉美感与原论文语义之间取得平衡,保证学术信息的准确传达。
- 内置质量评估: 系统提供问答评估与视觉相似度分析,帮助用户量化生成效果并指导优化。
- 部署灵活: 支持通过 API(如 GPT-4o)快速调用,也支持通过 vLLM 在本地环境部署,满足不同隐私与算力需求。
快速上手指南
1. 环境配置
首先克隆仓库并安装必要依赖(需安装 LibreOffice 以支持文档处理):
git clone https://github.com/Paper2Poster/Paper2Poster.git
cd Paper2Poster
pip install -r requirements.txt
sudo apt install libreoffice
在项目根目录下创建 .env 文件,配置 API 密钥:
OPENAI_API_KEY=<your_openai_api_key>
2. 生成海报
将待转换的 PDF 论文放入指定文件夹,运行以下命令启动转换:
python generate_poster.py --input_dir <path_to_pdfs> --output_dir <path_to_output>
执行完成后,系统将在输出目录生成可编辑的 PPTX 格式 海报。
资源链接
GitHub 仓库: Paper2Poster GitHub
项目主页 / 论文: Paper2Poster Project Page
正文完
