找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 4743|回复: 1

[已解决] 如何应对反爬机制的网站

1

主题

1

帖子

1

积分

贫民

积分
1
loveforeverpt 发表于 2017-3-12 14:17:04 | 显示全部楼层 |阅读模式
各位大神好:
        最近在摸索爬虫,想爬取一个漫画网站的图片,但是该网站设置了反爬取机制,我爬下来的汉字有乱码,同时图片的地址非真实地址,跟在网页源代码中看到的不一样,请大神指导如何破解,感谢!!!
       如下是该网站的链接:http://www.52mh.cc/list/7362/362 ... ://comic.sfacg.com/

网页源码中图片链接

网页源码中图片链接

python爬取的链接

python爬取的链接
回复

使用道具 举报

50

主题

1057

帖子

1108

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1108

活跃会员热心会员最佳导师默默耕耘突出贡献优秀版主荣誉管理论坛元老

blueelwang 发表于 2017-3-13 19:04:14 | 显示全部楼层
这个不是反爬虫, 而是使用js渲染的, 你查看它的源代码就明白了。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表