|
你这样试一下
def run(self):#实现主要逻辑
content_list = []
#1、根据url地址的规律,构造url_list
url_list=self.get_url_list()
#2、发送请求获取相应
for url in url_list:
html_str=self.parse_url(url)
#3、提取数据
content_list.append(self.get_content_list(html_str))
#4、保存
self.save_content_list(content_list) |
|