overthemoon
V2EX  ›  互联网

有什么办法可以比较完整的把一个网页内容保存下来?

  •  
  •   overthemoon · May 6, 2021 · 4249 views
    This topic created in 1857 days ago, the information mentioned may be changed or developed.

    经常看到一些比较好的博文,懒得自己写,又怕博文被删帖,怎样才能保存一个完整的把 html 页面保存下来呢?包括那些样式

    27 replies    2021-05-07 20:14:08 +08:00
    ClericPy
        1
    ClericPy  
       May 6, 2021
    chrome 可以保存 mhtml, 直接另存(ctrl S) 就行了

    现在我批量缓存大量网页就用的 mhtml, 会把 css js 图片什么的都打包成 base64, 格式看起来像 Email 那套, 因为这里的 m 代表的不是可移动的, 而是 媒体类型(通常称为 Multipurpose Internet Mail Extensions 或 MIME 类型 )
    catcn
        2
    catcn  
       May 6, 2021
    全屏截图插件
    geipen
        3
    geipen  
       May 6, 2021
    @ClericPy mac 电脑用的谷歌浏览器下载,没有 mhtml 选项呀,只有 html
    lostberryzz
        4
    lostberryzz  
       May 6, 2021
    竟然没有人提到 https://web.archive.org/ 互联网真正的宝藏所在地
    imdong
        5
    imdong  
       May 6, 2021   ❤️ 1
    打印为 pdf ?
    Jirajine
        6
    Jirajine  
       May 6, 2021 via Android   ❤️ 2
    Helsing
        7
    Helsing  
       May 6, 2021 via iPhone
    Web Clipper 剪藏
    SuperMild
        8
    SuperMild  
       May 6, 2021
    1. 可以截长图
    2. 可以导出 PDF
    3. (推荐!) 使用浏览器插件 SingleFile
    ClericPy
        9
    ClericPy  
       May 6, 2021
    @geipen 早年间我用的 https://chrome.google.com/webstore/detail/save-page-we/dhhpefjklgkmgeafimnjhojgjamoafof 插件去保存, 比自带的 mhtml 保存貌似省心一点. 后来是自己撸轮子走 CDP 了...

    所以还真不记得怎么开启默认的保存选项(老版本我印象中手动从 flags 里打开的 Save Page as MHTML, 但是新版本没这东西了), 现在我浏览器保存时候选格式里就有...
    wa8n
        10
    wa8n  
       May 6, 2021 via iPhone
    有道云笔记收藏网页,反正收藏了也不看🐶
    crab
        11
    crab  
       May 6, 2021
    @geipen 保存类型有 mhtml 的,只是文件名显示的后缀是 html,要手动改下。
    sephinh
        12
    sephinh  
       May 7, 2021 via iPhone   ❤️ 1
    直接打印保存 pdf
    leishi1313
        13
    leishi1313  
       May 7, 2021 via Android
    自建个 wallabag
    Mutoo
        15
    Mutoo  
       May 7, 2021
    早年间收藏整理了很多文章,时间久了全躺尸在老硬盘备份里了。现在也根本没有动力去翻看。
    christin
        16
    christin  
       May 7, 2021 via iPhone
    Safari 可以选择保存为网页归档 保存出来的还挺不错
    hafuhafu
        17
    hafuhafu  
       May 7, 2021
    ispinfx
        18
    ispinfx  
       May 7, 2021 via iPhone
    archivebox
    beijiaoff
        19
    beijiaoff  
       May 7, 2021
    @lostberryzz 这个网站收录是什么标准呀?感觉很随机
    Greenm
        20
    Greenm  
       May 7, 2021
    有好几种方式:

    1. 在线网站:web.archive.org, archive.is

    2. 浏览器手工保存, 可以截图,可以 pdf,可以 singlefile 扩展,各有各的优缺点。

    3. 用工具保存,httrack --list urls.txt 可以把一堆 url 都保存下来,包括多个目录和路径; 包岩村单个 url 的话,wget 其实也能做到。
    leicool520
        21
    leicool520  
       May 7, 2021
    clip to evernote
    laowu2012
        22
    laowu2012  
       May 7, 2021
    有跨平台需求,便捷的话就还是印象笔记了
    ZeroDu
        23
    ZeroDu  
       May 7, 2021
    1,打印 pdf
    2,另存为 mhtml
    3,浏览器插件 https://github.com/gildas-lormeau/SingleFile
    gledos
        24
    gledos  
       May 7, 2021
    20 与 23 楼把我想说的都说完了,我来补充以下吧。

    使用互联网时光机保存网页可以用 yorkxin/copy-as-markdown 这样的浏览器扩展程序,右键复制该网页标题 + 链接的 markdown 格式,如在本网页中右键选择 `Copy [Page Title](URL)`,生成的链接方便丢进自己的电子记事本。

    关于 gildas-lormeau/SingleFile 的特点有:

    + 生成单页化的 html 文件
    + JS 音频 视频可选是否保存
    + 缩小 html 与 css,合并相同的图片,移除未使用的 css
    Moeyua
        25
    Moeyua  
       May 7, 2021 via iPhone
    notion 的插件可以直接保存到 notion 中,而且支持导出为 pdf 和 html 等格式
    webshe11
        26
    webshe11  
       May 7, 2021
    补充一下,https://web.archive.org/ https://archive.today/ 这些都有浏览器扩展程序,遇见想存的网页可以快速一键存档
    dingwen07
        27
    dingwen07  
       May 7, 2021 via Android
    Internet Download Manager
    或者直接用类似 web.archive.org 的服务
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3040 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 90ms · UTC 13:26 · PVG 21:26 · LAX 06:26 · JFK 09:26
    ♥ Do have faith in what you're doing.