不能完全爬取所有网页

欢乐的舒畅 · 发表于 2018-12-4 14:15:04

<span style="font-family: "Microsoft Yahei"; background-color: rgb(255, 255, 255);">大家好，这是我写的爬取糗事百科的内容，图片以及评论数的爬虫，但是只能爬取到第4页的内容，不能爬取1-3页的内容，求助大家帮我看看问题。</span>

复制代码

硕锅锅爱py · 发表于 2018-12-6 10:34:14

因为不知道你是用什么爬取网页的,我跟你说下可能的原因吧
如果是用requests模块之类的右键网页查看源代码,一定要查看源码在通过ctrl+f搜索网页内容看一下你正则写的规则能不能搜索到

硕锅锅爱py · 发表于 2018-12-6 10:37:25

右键查看网页源码,看一下你规则写的对不对

硕锅锅爱py · 发表于 2018-12-6 10:42:44

右键查看网页源码,看一下你则匹配规则对不对

		自动登录	找回密码
密码			立即注册

[求助] 不能完全爬取所有网页