找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 5254|回复: 1

[讨论] python如何爬取伪元素(如::after)的内容!!

1

主题

1

帖子

1

积分

贫民

积分
1
美妮 发表于 2017-3-8 21:28:15 | 显示全部楼层 |阅读模式
爬取的网页为:http://k.autohome.com.cn/spec/24 ... _1.html?st=2&piap=1|24234|0|0|1|0|0|0|0|0|1网页内容如图所示,想要爬取网页中的文本,但是源HTML却不能完整爬取,有些字段在伪元素::before的content中,但::before的内容却不在源代码中。想问问,要怎样才能把所有的文本都爬取下来?

1.png
2.png
回复

使用道具 举报

0

主题

1

帖子

1

积分

贫民

积分
1
justinyao 发表于 2017-3-30 13:48:25 | 显示全部楼层
求解决方案
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表