npm installnpm run build- 输出脚本文件位于
dist文件夹下
- 手动构建,或从 Greasy Fork 下载脚本。
- 使用 TamperMonkey 安装脚本。
- 打开想要备份的贴子。
- 点击贴子右上方的 “备份本贴” 按钮。
- 等待备份完成。
- 如果出现 bug,可点击 ”重置状态“ 按钮。
尽量不要频繁使用该脚本,否则可能出验证码,影响浏览体验。
- 主要有以下考虑。
- 传统爬虫并不能获得贴子的全部信息,因为贴子是动态加载的(待确认,有时候好像并非如此),只有你滚动到了对应的楼层才会加载对应的贴子,而使用 Selenium 之类的工具又太过笨重,因此才选择相对简单的方案,即直接在浏览器里跑脚本。
- 通过接口获取贴子可能会被百度软 ban。
- 贴吧在未登录的情况下能够获取的信息比较有限(貌似只能看第一页的贴子),如果做成自动化程度更高的工具,可能会要求用户预先输入账密登录,带来一定的安全隐患。我个人也不太喜欢使用需要输入账密的工具。
- 综上,在浏览器里跑脚本是相对最安全的方法,缺点就是比较慢。