背景

先前写程序时遇到了一个问题,最后通过查找网上的一篇文章得以解决。待过了1、2年之后,再次遇到了那个问题,当根据关键字寻找那篇文章时,发现那个网站已经关闭了。虽然最后通过archive.org网站找到了文章的备份,但也因此给自己警示,当看到比较好的资料时,一定要及时的把文章剪藏备份下来,避免以后网站消失。

因此,查找了一些资料,整理了一些可用的方法。

方法

备份的方式基本上可以分为4类,分别是:

  1. 笔记软件的剪藏插件。
  2. 通用的剪藏插件。
  3. 稍后读类插件。
  4. 浏览器自带的功能。

笔记软件的剪藏插件

  1. 印象笔记。
  2. 有道云笔记。
  3. 为知笔记。
  4. OneNote。
  5. Joplin。

通用类的剪藏插件

  1. 简悦,在其将网页转为阅读模式后,可将保存成本地的图片,html,markdown,pdf等。同时可以存储到坚果云、印象笔记、onenote、语雀、google driver等地方。
  2. MaoXian web clipper,该插件可以将网页保存成html或markdown格式,并在本地以文件夹的形式组织存储,图片会一并下载到本地。另在剪藏的时候,可以选择范围。
  3. Save Page WE,该插件可以将网页剪藏成html文件并存到本地,其只会生成一个html文件,图片等内容通过base64的形式存储到html中。
  4. Web Clipper,该插件可以将网页剪藏为markdown格式,支持范围选择。结果可保存到本地,也可直接保存到笔记中,支持的笔记有bear、notion、onenote、有道、语雀、github等。另剪藏后图片需要单独的图床存放。

稍后读类插件

  1. Pocket
  2. Instapaper
  3. wallabag

浏览器自带

  1. 打印成pdf。
  2. 另存为mhtml。

总结

这些方法中自己用过的有印象笔记、有道云笔记、Joplin、MaoXian、简阅、Save Page WE、Web Clipper以及Wallabag。就这些方法中,最满足自己需求的还是印象笔记。主要是有这3个优势:

  1. 剪藏效果好,目前还未遇到过剪藏不成功的页面,剪藏之后的排版也基本与原网页一致。
  2. 可以剪藏那些需要登录才能访问的页面。
  3. 剪藏结果直接存放到印象笔记中,便于归纳整理,后面搜索查找时也很方便。

当然,剪藏之后如果自己能再整理总结记录下来,那便是更好的了🤣。

参考链接

  1. 如何优雅的保存网页正文?