找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 2588|回复: 6

[求助] 抓取内容

2

主题

9

帖子

9

积分

贫民

积分
9
lmh_cn 发表于 2018-3-23 08:39:39 | 显示全部楼层 |阅读模式
我是新手,请高手帮忙。我想提取“[size=1em]'标题'[size=1em],[size=1em]'作者'[size=1em],[size=1em]'影片名'[size=1em],[size=1em]'影片详情链接'[size=1em],[size=1em]'推荐级'[size=1em],[size=1em]'回应数'[size=1em],[size=1em]'影评链接'[size=1em],[size=1em]'影评'[size=1em],[size=1em]'有用数'”部分,该怎么写?
网页源码内容如下:

<div id="content">
                                       '标题','作者','影片名','影片详情链接','推荐级','回应数','影评链接','影评','有用数'
                <script>chaptererror();</script>
</div>


麻烦!

回复

使用道具 举报

2

主题

9

帖子

9

积分

贫民

积分
9
lmh_cn  楼主| 发表于 2018-3-23 08:48:50 | 显示全部楼层
我写如下:
reg1 = re.compile('<div id="content">(.*?)</div>')
text = re.findall(reg1,texthtml)
但text内容为空。
回复 支持 反对

使用道具 举报

2

主题

9

帖子

9

积分

贫民

积分
9
lmh_cn  楼主| 发表于 2018-3-26 09:16:52 | 显示全部楼层
各位高手帮帮忙啊,嘿嘿
回复 支持 反对

使用道具 举报

0

主题

20

帖子

20

积分

贫民

积分
20
sss123 发表于 2018-3-27 15:23:20 | 显示全部楼层
//div[@ id="content"]//text() xpath
回复 支持 反对

使用道具 举报

2

主题

9

帖子

9

积分

贫民

积分
9
lmh_cn  楼主| 发表于 2018-3-28 11:15:35 | 显示全部楼层
不好意思,我是新手,正在学习Python。我按照你的语句:
text = soup.xpath('*[@id="content"]//text()')

出现出错信息:    text = soup.xpath('*[@id="content"]//text()')
TypeError: 'NoneType' object is not callable
回复 支持 反对

使用道具 举报

3

主题

18

帖子

18

积分

贫民

积分
18
jing1208 发表于 2018-3-28 14:15:24 | 显示全部楼层
lmh_cn 发表于 2018-3-28 11:15
不好意思,我是新手,正在学习Python。我按照你的语句:
text = soup.xpath('*[@id="content"]//text()')

可能是没调用模块,而是用了模块的功能。建议用print检查
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表