V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yezheyu
V2EX  ›  问与答

请教个问题,有什么 Python 库可以把 pdf 文件中表格提取为 excel 吗?要保留合并的单元格

  •  
  •   yezheyu · 13 天前 · 687 次点击

    pdf 中的表格大概长这样 1.png

    期望提取的结果是这样,保留合并的单元格和文字的删除线 2.png

    谢谢!

    3 条回复    2026-03-05 11:04:41 +08:00
    volvo007
        1
    volvo007  
       13 天前 via iPhone
    不是用 py 去导出,而是找一个支持 py 的 ai api 调用之后直接就有了😂
    irockytan
        2
    irockytan  
       13 天前 via iPhone
    纯靠 py 库估计不够,可能要上视觉方案
    johnsmith2077
        3
    johnsmith2077  
       12 天前
    mineru 可以识别表格,但是好像不能直接转成 excel
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5566 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 07:18 · PVG 15:18 · LAX 00:18 · JFK 03:18
    ♥ Do have faith in what you're doing.