首页
Python中文网
在线手册
Python入门
Linux教程
Python高级教程
登录
注册
用户名
Email
自动登录
找回密码
密码
登录
立即注册
扫一扫,访问微社区
只需一步,快速开始
论坛
BBS
Python教程
在线手册
Python入门
Linux教程
Python高级教程
Python函数详解
搜索
本版
帖子
用户
道具
勋章
任务
设置
退出
Python论坛 - 国内最好的Python中文社区
»
论坛
›
技术交流
›
python问答 - 求助悬赏区 Help!
›
不能完全爬取所有网页
返回列表
查看:
2240
|
回复:
2
[求助]
不能完全爬取所有网页
欢乐的舒畅
当前离线
积分
22
8
主题
22
帖子
22
积分
贫民
贫民, 积分 22, 距离下一级还需 38 积分
贫民, 积分 22, 距离下一级还需 38 积分
积分
22
发消息
欢乐的舒畅
发表于 2018-12-4 14:15:04
|
显示全部楼层
|
阅读模式
<span style="font-family: "Microsoft Yahei"; background-color: rgb(255, 255, 255);">大家好,这是我写的爬取糗事百科的内容,图片以及评论数的爬虫,但是只能爬取到第4页的内容,不能爬取1-3页的内容,求助大家帮我看看问题。</span>
复制代码
回复
使用道具
举报
硕锅锅爱py
当前离线
积分
4
0
主题
4
帖子
4
积分
贫民
贫民, 积分 4, 距离下一级还需 56 积分
贫民, 积分 4, 距离下一级还需 56 积分
积分
4
发消息
硕锅锅爱py
发表于 2018-12-6 10:34:14
|
显示全部楼层
因为不知道你是用什么爬取网页的,我跟你说下可能的原因吧
如果是用requests模块之类的 右键网页查看源代码,一定要查看源码 在通过ctrl+f搜索网页内容 看一下你正则写的规则能不能搜索到
回复
支持
反对
使用道具
举报
硕锅锅爱py
当前离线
积分
4
0
主题
4
帖子
4
积分
贫民
贫民, 积分 4, 距离下一级还需 56 积分
贫民, 积分 4, 距离下一级还需 56 积分
积分
4
发消息
硕锅锅爱py
发表于 2018-12-6 10:37:25
右键查看网页源码,看一下你规则写的对不对
支持
反对
硕锅锅爱py
当前离线
积分
4
0
主题
4
帖子
4
积分
贫民
贫民, 积分 4, 距离下一级还需 56 积分
贫民, 积分 4, 距离下一级还需 56 积分
积分
4
发消息
硕锅锅爱py
发表于 2018-12-6 10:42:44
|
显示全部楼层
右键查看网页源码,看一下你则匹配规则对不对
回复
支持
反对
使用道具
举报
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速回复
返回顶部
返回列表