找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 2240|回复: 2

[求助] 不能完全爬取所有网页

8

主题

22

帖子

22

积分

贫民

积分
22
欢乐的舒畅 发表于 2018-12-4 14:15:04 | 显示全部楼层 |阅读模式
  1. <span style="font-family: &quot;Microsoft Yahei&quot;; background-color: rgb(255, 255, 255);">大家好,这是我写的爬取糗事百科的内容,图片以及评论数的爬虫,但是只能爬取到第4页的内容,不能爬取1-3页的内容,求助大家帮我看看问题。</span>
复制代码


回复

使用道具 举报

0

主题

4

帖子

4

积分

贫民

积分
4
硕锅锅爱py 发表于 2018-12-6 10:34:14 | 显示全部楼层
因为不知道你是用什么爬取网页的,我跟你说下可能的原因吧
如果是用requests模块之类的  右键网页查看源代码,一定要查看源码 在通过ctrl+f搜索网页内容  看一下你正则写的规则能不能搜索到
回复 支持 反对

使用道具 举报

0

主题

4

帖子

4

积分

贫民

积分
4
硕锅锅爱py 发表于 2018-12-6 10:37:25
右键查看网页源码,看一下你规则写的对不对
支持 反对

0

主题

4

帖子

4

积分

贫民

积分
4
硕锅锅爱py 发表于 2018-12-6 10:42:44 | 显示全部楼层
右键查看网页源码,看一下你则匹配规则对不对
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表