halowang1991
V2EX  ›  问与答

macOS 技术栈下有什么可以高效的获取屏幕上内容的方法吗?

  •  
  •   halowang1991 · May 28, 2024 · 1411 views
    This topic created in 757 days ago, the information mentioned may be changed or developed.

    我在做一款 App ,我希望能截取整个屏幕后进行 OCR 功能。也就是说包括其他任意 App (进程)

    我之前的做法是:

    1. 在光标周围置顶范围内截取屏幕
    2. 将截取的图片进行 OCR
    3. 每秒重复若干次上述操作

    但是,总是截取鼠标附近的区域,获取的信息量太少。如果截取整个屏幕,电脑性能又吃不消

    有什么开箱即用的,实时性高的 framework 可以解决这个问题吗?

    在我看来,这个似乎有点像是实时语义分割?

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   923 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 20:33 · PVG 04:33 · LAX 13:33 · JFK 16:33
    ♥ Do have faith in what you're doing.