找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 1894|回复: 1

[求助] 学习时爬虫关于正则提取url字段的问题

1

主题

3

帖子

3

积分

贫民

积分
3
栖南 发表于 2019-1-25 18:18:42 | 显示全部楼层 |阅读模式
<a class="ziyingcity" href="http://aq.tuniu.com"
onclick="_gaq.push(['_trackEvent', '首页_1903','点击','选预定城市_'.A_安庆]);">安庆</a>
<a class="" href="http://ay.tuniu.com"
onclick="_gaq.push(['_trackEvent', '首页_1903','点击','选预定城市_'.A_安阳]);">安阳</a>
<a class="" href="http://anp.tuniu.com"
onclick="_gaq.push(['_trackEvent', '首页_1903','点击','选预定城市_'.A_安平县]);">安平县</a>
<a class="" href="http://axi.tuniu.com"
onclick="_gaq.push(['_trackEvent', '首页_1903','点击','选预定城市_'.A_安溪县]);">安溪县</a>
<a class="" href="http://anji.tuniu.com"
onclick="_gaq.push(['_trackEvent', '首页_1903','点击','选预定城市_'.A_安吉县]);">安吉县</a>
如上例子,我想同时提取城市名和简拼,aq 安庆,ay 安阳,正则该怎么写呀



回复

使用道具 举报

1

主题

3

帖子

3

积分

贫民

积分
3
栖南  楼主| 发表于 2019-1-31 14:27:49 | 显示全部楼层
最后我还是用xpath解决了,此贴终结
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表