gosky
V2EX  ›  问与答

如何基于 LLM 翻译文图表混排的 PDF 文件?

  •  
  •   gosky · May 11 · 1158 views
    This topic created in 43 days ago, the information mentioned may be changed or developed.
    有份 PDF ,内容如下图所示。本来也有中文翻译版,但是翻译的太差了。
    我曾经自己写脚本,调用 LLM API 翻译 EPUB 文件。
    但这种 PDF ,还是文图表混排的 PDF ,完全没头绪。

    6 replies    2026-05-12 10:59:15 +08:00
    aikilan
        1
    aikilan  
       May 11
    试试 paddleOCR
    SuperDaniel313
        2
    SuperDaniel313  
       May 11

    是想要这样的效果吗?
    gosky
        3
    gosky  
    OP
       May 11
    @SuperDaniel313 是的。不过你这个没图片和表格
    stargo
        4
    stargo  
       May 11
    mineru
    rpish
        5
    rpish  
       May 11
    先转 LaTex
    iorilu
        6
    iorilu  
       May 12
    mineru 有 api 调用方式, 可以官方看看

    当然了, 有 gpu 也可以本地运行, 不过很慢
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5514 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 39ms · UTC 01:35 · PVG 09:35 · LAX 18:35 · JFK 21:35
    ♥ Do have faith in what you're doing.