书中实例：抓取猫眼电影排行，代码有的地方没看懂

一二三亖 · 发表于 2019-11-4 10:42:19

刚接触Python，想学习爬虫，最近在看《python3 网络爬虫开发实战》
代码能成功运行，就是代码有的地方不太理解，请求大佬们抽空解答一下。
下面是全部的代码
import requests
import re
import json
from requests.excepti** import RequestException
import time
def get_one_page(url):
try:
 headers = {
 'User-Agent': 'Mozilla/5.0 (Macintosh: Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.162 Safari/537.36'
 }
 resp**e = requests.get(url, headers=headers)
 if resp**e.status_code == 200:
 return resp**e.text
 return None
except RequestException:
 return None

def parse_one_page(html):
pattern = re.compile(
 '<dd>.*?board-index.*?>(.*?).*?data-src="(.*?)".*?name.*?a.*?>(.*?)</a>.*?star.*?>(.*?).*?releasetime.*?>(.*?).*?integer.*?>(.*?).*?fraction.*?>(.*?).*?</dd>',
 re.S)
items = re.findall(pattern, html)
for item in items:
 yield {
 'index': item[0],
 'image': item[1],
 'title': item[2].strip(),
 'actor': item[3].strip()[3:] if len(item[3]) > 3 else '',
 'time': item[4].strip()[5:] if len(item[4]) > 5 else '',
 'score': item[5].strip() + item[6].strip()
 }

def write_to_file(content):
with open('result.txt', 'a', encoding='utf-8') as f:
 print(type(json.dumps(content)))
 f.write(json.dumps(content, ensure_ascii=False)+ '\n')
def main(offset):
url = 'http://maoyan.com/board/4?offset=' + str(offset)
html = get_one_page(url)
for item in parse_one_page(html):
 print(item)
 write_to_file(item)

if __name__ == '__main__':
for i in range(10):
 main(offset=i * 10)
 time.sleep(1)

上面，写入文件的步骤中，content这个参数不太理解，感觉上下文代码中也没有出现这个单词，怎么能成功运行这部分代码的。
书中是如此解释的：
通过调用 write_to_json() 方法即可实现将字典写入到文本文件的过程，此处的 content 参数就是一部电影的提取结果，是一个字典。

这个地方不太理解，全部代码中只有 write_to_json() 方法中出现了content，不理解是如何成功运行的，我理解的在别的部分应该会出现这个参数，才能连贯起来的。
请闲暇的大神们，抽空解答一下，不胜感激！

一二三亖 · 发表于 2019-11-4 10:48:49

多看了几遍代码，看明白了！
下面代码中有对应。

		自动登录	找回密码
密码			立即注册

[求助] 书中实例：抓取猫眼电影排行，代码有的地方没看懂