查看原文
其他

2024 年苏生不惑开发的第一个脚本神器:批量下载知乎账号的所有回答和文章导出pdf,还有回答和文章数据,包括标题,链接,赞同数

Editor's Note

搞定知乎

The following article is from 苏生不惑 Author 苏生不惑

苏生不惑第475 篇原创文章,加入我的知识星球

前几天分享过scraper抓取数据学点真正的技术,搞定知乎,b站,豆瓣,抖音,公众号,微博等平台 ,最近又写了个脚本将抓取的知乎链接批量下载导出pdf,算是2024年写的第一个脚本神器,如果你有导出需要可以加微信 sushengbuhuo

下载所有知乎回答以渤海小吏的号为例 https://www.zhihu.com/people/dai-zong-66/posts,效果见视频:


导出的excel包含所有知乎回答问题标题和链接。然后用脚本将excel里的回答批量下载:下载的所有回答html内容,文件名为回答日期加标题。接着批量将html转换pdf,效果如图:

再将所有pdf合成一个pdf文件:每个回答都有原知乎回答链接,效果见网盘  https://pan.baidu.com/s/1KK4vD-EeAo83M-Bb6-eDQA?pwd=8rmy

顺便我还下载了渤海小吏这个公众号的所有文章,包含留言  2023 批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,抓取文章数据包含阅读数/点赞数/在看数/留言数

下载所有知乎文章以半佛仙人的号为例 https://www.zhihu.com/people/banfoxianren/posts,效果见视频:


导出的excel数据包含知乎文章标题,链接,评论数和赞同数。然后用脚本将excel里的文章批量下载:下载的所有文章html内容,文件名为回答日期加标题。接着批量将html转换pdf,效果:

再将所有pdf合成一个pdf文件,每篇文章都有原知乎文章链接,效果见网盘https://pan.baidu.com/s/1egOoSABuVo1nWgL_2r3PXQ?pwd=6ya6 :顺便我还下载了半佛仙人这个公众号的所有文章,包含留言。

另外我还写了个批量下载知乎问题下的回答工具:

导出的excel包含每个回答的回答链接,回答作者,回答内容,回答时间和回答更新时间,本来想把回答里的图片也下载了,但是有些回答的图片太多了。


最新原创文章:

正式介绍下我的知识星球

2023 更新版:苏生不惑开发过的那些原创工具和脚本

再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数

一次性搞定微博,苏生不惑又写了个脚本,一键下载微博内容导出pdf,批量抓取微博评论转发数据导出excel

免费下载全网电子书,再也不怕找不到 zlibrary

下载视频不求人,免费下载全网视频

如果文章对你有帮助还请 点赞/在看/分享 三连支持下, 感谢各位!

公众号苏生不惑

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存