首页
Python中文网
在线手册
Python入门
Linux教程
Python高级教程
登录
注册
用户名
Email
自动登录
找回密码
密码
登录
立即注册
扫一扫,访问微社区
只需一步,快速开始
论坛
BBS
Python教程
在线手册
Python入门
Linux教程
Python高级教程
Python函数详解
搜索
本版
帖子
用户
道具
勋章
任务
设置
退出
Python论坛 - 国内最好的Python中文社区
»
论坛
›
技术交流
›
python问答 - 求助悬赏区 Help!
›
页面url只有一半,前面少了些前缀,要怎么加上? ...
返回列表
查看:
3579
|
回复:
1
[已回复]
页面url只有一半,前面少了些前缀,要怎么加上?
少年瞳
当前离线
积分
2
2
主题
2
帖子
2
积分
贫民
贫民, 积分 2, 距离下一级还需 58 积分
贫民, 积分 2, 距离下一级还需 58 积分
积分
2
发消息
少年瞳
发表于 2018-12-24 19:22:03
|
显示全部楼层
|
阅读模式
我抓两层的页面 抓到第二级页面的url只有一半 需要拼接 gooseeker有拼接的方法吗? 谢谢
/zu/3_155336201.html
类似于这种,前面少了些前缀 我可以认为加上前缀 但是不知道在gooseeker中怎么加上?
另外有好的代理IP推荐嘛?
回复
使用道具
举报
随风优优
当前离线
积分
3
1
主题
3
帖子
3
积分
贫民
贫民, 积分 3, 距离下一级还需 57 积分
贫民, 积分 3, 距离下一级还需 57 积分
积分
3
发消息
随风优优
发表于 2020-3-10 09:04:02
|
显示全部楼层
个人理解:你需要加载urljoin软件包,我就是采用urljoin 进行前缀的“www.http”,仅供参考
回复
支持
反对
使用道具
举报
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速回复
返回顶部
返回列表