yezheyu
V2EX  ›  问与答

请教个问题,有什么 Python 库可以把 pdf 文件中表格提取为 excel 吗?要保留合并的单元格

  •  
  •   yezheyu · Mar 3 · 1143 views
    This topic created in 115 days ago, the information mentioned may be changed or developed.

    pdf 中的表格大概长这样 1.png

    期望提取的结果是这样,保留合并的单元格和文字的删除线 2.png

    谢谢!

    3 replies    2026-03-05 11:04:41 +08:00
    volvo007
        1
    volvo007  
       Mar 4 via iPhone
    不是用 py 去导出,而是找一个支持 py 的 ai api 调用之后直接就有了😂
    irockytan
        2
    irockytan  
       Mar 4 via iPhone
    纯靠 py 库估计不够,可能要上视觉方案
    johnsmith2077
        3
    johnsmith2077  
       Mar 5
    mineru 可以识别表格,但是好像不能直接转成 excel
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1120 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 17:59 · PVG 01:59 · LAX 10:59 · JFK 13:59
    ♥ Do have faith in what you're doing.