|
在爬取猫眼Top100页面(TOP100榜 - 猫眼电影 - 一网打尽好电影 (maoyan.com))时,页面源代码和requests.get中获取到的内容不同,经过核查,发现get到的内容中间有
</div>
<p class="not-found-message">抱歉,页面暂时无法访问...</p>
<p class="error-message">错误信息:服务器找不到请求的网页</p>
<div class="home-button"><a href="/">返回首页<a></div>
</div>
缺失的内容好像就是被这句话代替了。。
请求头中的User-Agent,cookies,referer都填写了
请问该怎么办,多谢。
|
|