每日牢骚:你的专用补档库
短篇博客新系列:每日牢骚
除了抱怨,就是牢骚,比灵光一现更加一现
第一期,献给笔者的补档库

自从一两年前,看到了自己喜欢看的文章和网站就这么消失在互联网上之后,笔者决定自行建立一个补档库,毕竟,在线的数据再丰富,那都是别人的,不是你的,只有放进本地甚至离线硬盘的数据,那才是真正的数据
目前补档库的技术栈很简单,视频类使用yt-dlp下载,网页类使用Chrome扩展『SingleFile』,他可以较好地处理网页快照功能,还支持抓取后自动上传到WebDAV服务器,真正的一键式服务
需要注意的是,『保存网页』这个需求其实一直是老大难问题:早期纯静态网页当然很轻松地Ctrl+S或者选择『允许脱机使用』,因为这个时候的网页本质上只是一份单纯的静态文档。后来有了网页上播放流媒体的需求(而且视频大多都不是直链了,而是带鉴权的各种分片播放方式),以及网页上插入JAVA小程序的需求,脱机使用的方式有些力不从心;再后来的前端渲染流行起来,以及AJAX等工具实现了实时请求并更新数据,传统的网页保存功能几乎失效(因为传统的设计理念是保留接口,但是如果源站失效,那么保存功能也会失效)。所以目前的网页保存工具基本上都设计为『所见即所得』,即,抓取页面上所有有显示出来的内容,而对于js等就额外处理。个中方式一时半会说不完全,笔者在此略过
简短写了些东西,作为第一篇,感觉差不多了
(完)
也有从网上捡破烂归档的习惯,awa
https://img.picui.cn/free/2025/03/24/67e0ad81923c3.png
主要是很多时候真的不知道什么时候,资源就消失不见嘞
老手法,静态网页用打印为PDF保存