docutranslate
“
基于大语言模型的轻量级本地文件翻译工具,支持多种文件格式(如 PDF、Word、Excel、Markdown、TXT、JSON、EPUB、SRT、ASS 等)的翻译,具备自动生成术语表、PDF 表格公式代码识别、保持格式翻译、多 AI 平台支持、异步支持、局域网多人使用支持、交互式 Web 界面等功能。
Github地址
https://github.com/xunbu/docutranslate
功能特性
-
支持多种格式:支持翻译多种文件格式,包括 PDF、DOCX、XLSX、MD、TXT、JSON、EPUB、SRT、ASS 等。
-
自动生成术语表:支持自动生成术语表,实现术语对齐。
-
PDF 特殊内容识别:凭借
docling和mineruPDF 解析引擎,能够识别学术论文中常见的表格、公式、代码等内容并进行翻译。 -
JSON 翻译:支持通过 JSON 路径(
jsonpath-ng语法规范)指定 JSON 中需要被翻译的值。 -
保持格式翻译:支持对 DOCX、XLSX 文件(暂不支持 DOC、XLS 文件)保持原格式进行翻译。
-
多 AI 平台支持:支持绝大部分 AI 平台,可实现自定义提示词的并发高性能 AI 翻译。
-
异步支持:专为高性能场景设计,提供完整的异步支持,实现多任务并行的服务接口。
-
局域网多人使用:支持在局域网中多人同时使用。
-
交互式 Web 界面:提供开箱即用的 Web UI 和 RESTful API,方便集成与使用。
-
小体积懒人包:不到 40M 的 Windows、Mac 懒人包(不使用
docling本地解析 PDF 的版本)。
注意事项
-
翻译 PDF 时会先转换为 Markdown,可能会丢失原先的排版,对排版有要求的用户需注意。