Python爬虫如何模拟具有嵌入式框架的浏览器

zen125 · 发表于 2016-11-7 10:26:26

在爬取网站时使用呢Request之后返回这样的信息
<td><iframe border="0" frameborder="0" id="I1" marginheight="1" marginwidth="1" name="I1" scrolling="No" src="/iframe/foot_800.htm" target="_top" width="100%">浏览器不支持嵌入式框架，或被配置为不显示嵌入式框架。</iframe></td>

源码如下：
from bs4 import BeautifulSoup
import requests
import csv
import time
headers = {
'User-Agent:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'
'Cookie:JSESSIONID=00001_i1x8XBaQj3qAMdO82TlG-:-1; _gscs_892086308=784806351ujwjq16|pv:3; _gscbrs_892086308=1; _gscu_892086308=7848063507o2fe16'
}
url = 'http://knews.shaanxi.gov.cn/IssuedContentAction.do?dispatch=vContentListBySubid&scope=tblist'
def get_url(url,data=None):
wb_data = requests.get(url)
soup = BeautifulSoup(wb_data.text,'lxml')
print(soup)

get_url(url)

blueelwang · 发表于 2016-11-8 19:13:35

你这是想干啥？违法的事情不要干哦

		自动登录	找回密码
密码			立即注册

[已回复] Python爬虫如何模拟具有嵌入式框架的浏览器

相关帖子

活跃会员

热心会员

最佳导师

默默耕耘

突出贡献

优秀版主

荣誉管理

论坛元老