网页备份方法整理
文章目录
背景
先前写程序时遇到了一个问题,最后通过查找网上的一篇文章得以解决。待过了1、2年之后,再次遇到了那个问题,当根据关键字寻找那篇文章时,发现那个网站已经关闭了。虽然最后通过archive.org网站找到了文章的备份,但也因此给自己警示,当看到比较好的资料时,一定要及时的把文章剪藏备份下来,避免以后网站消失。
因此,查找了一些资料,整理了一些可用的方法。
方法
备份的方式基本上可以分为4类,分别是:
- 笔记软件的剪藏插件。
- 通用的剪藏插件。
- 稍后读类插件。
- 浏览器自带的功能。
笔记软件的剪藏插件
- 印象笔记。
- 有道云笔记。
- 为知笔记。
- OneNote。
- Joplin。
通用类的剪藏插件
- 简悦,在其将网页转为阅读模式后,可将保存成本地的图片,html,markdown,pdf等。同时可以存储到坚果云、印象笔记、onenote、语雀、google driver等地方。
- MaoXian web clipper,该插件可以将网页保存成html或markdown格式,并在本地以文件夹的形式组织存储,图片会一并下载到本地。另在剪藏的时候,可以选择范围。
- Save Page WE,该插件可以将网页剪藏成html文件并存到本地,其只会生成一个html文件,图片等内容通过base64的形式存储到html中。
- Web Clipper,该插件可以将网页剪藏为markdown格式,支持范围选择。结果可保存到本地,也可直接保存到笔记中,支持的笔记有bear、notion、onenote、有道、语雀、github等。另剪藏后图片需要单独的图床存放。
稍后读类插件
浏览器自带
- 打印成pdf。
- 另存为mhtml。
总结
这些方法中自己用过的有印象笔记、有道云笔记、Joplin、MaoXian、简阅、Save Page WE、Web Clipper以及Wallabag。就这些方法中,最满足自己需求的还是印象笔记。主要是有这3个优势:
- 剪藏效果好,目前还未遇到过剪藏不成功的页面,剪藏之后的排版也基本与原网页一致。
- 可以剪藏那些需要登录才能访问的页面。
- 剪藏结果直接存放到印象笔记中,便于归纳整理,后面搜索查找时也很方便。
当然,剪藏之后如果自己能再整理总结记录下来,那便是更好的了🤣。