python爬虫问题，网页源代码大量数字

blackcat · 发表于 2020-12-8 16:45:33

昨天晚上爬取我们公司在政采云上的商品信息时，发现通过selenium+chromedriver获取的网页源代码是乱码？
这种格式的数据之前没见过，我该怎么去采集，还请大佬们指点，源码有点长，就只发截图了
目标网址：https://hunan.zcygov.cn/
(364M[4K9G$[2OH6YHU4T~H.png

顺心CIU_pXD8e · 发表于 2020-12-15 17:07:09

<path>标签里的数据可能是一个字体文件，查查字体反爬对应上去就可以了

顺心CIU_pXD8e · 发表于 2020-12-15 17:10:50

获取是svg文件，抱歉刚才回答错了

顺心CIU_pXD8e · 发表于 2020-12-15 17:25:57

SVG映射反爬虫

ken552950 · 发表于 2020-12-23 08:42:59

顺心CIU_pXD8e 发表于 2020-12-15 17:25
SVG映射反爬虫

SVG映射，大众点评也是用这个，到目前还没搞懂。

		自动登录	找回密码
密码			立即注册

[求助] python爬虫问题，网页源代码大量数字