找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 3884|回复: 4

[求助] python爬虫问题,网页源代码大量数字

1

主题

1

帖子

1

积分

贫民

积分
1
blackcat 发表于 2020-12-8 16:45:33 | 显示全部楼层 |阅读模式
昨天晚上爬取我们公司在政采云上的商品信息时,发现通过selenium+chromedriver获取的网页源代码是乱码?
这种格式的数据之前没见过,我该怎么去采集,还请大佬们指点,源码有点长,就只发截图了
目标网址:https://hunan.zcygov.cn/
(364M[4K9G$[2OH6YHU4T~H.png

回复

使用道具 举报

0

主题

5

帖子

5

积分

贫民

积分
5
顺心CIU_pXD8e 发表于 2020-12-15 17:07:09 | 显示全部楼层
<path>标签里的数据可能是一个字体文件,查查字体反爬对应上去就可以了
回复 支持 反对

使用道具 举报

0

主题

5

帖子

5

积分

贫民

积分
5
顺心CIU_pXD8e 发表于 2020-12-15 17:10:50 | 显示全部楼层
获取是svg文件,抱歉刚才回答错了
回复 支持 反对

使用道具 举报

0

主题

5

帖子

5

积分

贫民

积分
5
顺心CIU_pXD8e 发表于 2020-12-15 17:25:57 | 显示全部楼层
SVG映射反爬虫
回复 支持 反对

使用道具 举报

0

主题

2

帖子

2

积分

贫民

积分
2
ken552950 发表于 2020-12-23 08:42:59 | 显示全部楼层

SVG映射,大众点评也是用这个,到目前还没搞懂。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表