找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 4661|回复: 1

[已回复] BeautifulSoup爬蟲Table

4

主题

4

帖子

4

积分

贫民

积分
4
sigmagod 发表于 2016-8-30 17:06:21 | 显示全部楼层 |阅读模式
  1. import urllib
  2. import urllib.request
  3. import requests
  4. from bs4 import BeautifulSoup

  5. source = ['http://lotto.auzonet.com/biglotto/list_' + str(i + 1) + '_all.html' for i in range(2003, 2016)]

  6. for link in source:
  7.     visit_request = urllib.request.urlopen(link)
  8.     visit_response = visit_request.read()
  9.     visit_soup = BeautifulSoup(visit_response, 'html.parser', from_encoding='utf-8')

  10.     for ultag in visit_soup.find_all('td', {'class': 'history_view'}):
  11.         row = ultag.find_all('table')
  12.         for tr in row:
复制代码
 ...

想請問一下,我試著把樂透資料抓下來,但Table他沒有定義ID的話我該怎麼把號碼和中獎金額抓下來
NZrMb.jpg
回复

使用道具 举报

50

主题

1057

帖子

1108

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1108

活跃会员热心会员最佳导师默默耕耘突出贡献优秀版主荣誉管理论坛元老

blueelwang 发表于 2016-8-30 17:32:23 | 显示全部楼层
这个确实不好抓取, 最简单的办法就是按照每个数据的序号进行抓取, 比如第三行表示中奖人数,那就可以根据这个索引进行匹配
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表