简介
PDFMathTranslate 是一个面向科研 PDF 的翻译工具,能尽量保留公式、图表、目录和批注的排版信息,同时输出双语或单语的翻译结果。它既可作为命令行工具使用,也提供 GUI 与 Docker 化部署,适用于批量与交互式翻译场景。
主要特性
- 保留布局:在翻译过程中尽量保留原文的公式、表格与图像位置,减小后期排版工作量。
- 多后端支持:可选 Google、DeepL、OpenAI、Ollama 等翻译服务,并支持自定义后端与缓存机制。
- 多种使用方式:提供 CLI、GUI、Docker 镜像与 Zotero 插件以满足不同工作流。
使用场景
- 将科研论文批量翻译为中文或其他语言,同时保留数学公式与图表布局。
- 在学术团队或科研项目中快速生成可读的双语稿件,便于比对与审阅。
- 需要在无网络环境或企业环境中部署翻译能力时,使用 Docker 或本地离线方案。
技术特点
- 基于 PyMuPDF/pdfminer 等工具进行文档解析,并结合布局识别模块处理复杂排版。
- 支持并发翻译与分段处理,带有翻译缓存与容错配置以降低成本与失败率。
- 提供 API 与 Python 接口,便于在下游流程(如文献管理、自动摘要)中集成。