新人求助爬东西乱码

627826483 · 发表于 2022-5-29 15:21:23

# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup

if __name__ == '__main__':

url = 'https://www.shicimingju.com/book/sanguoyanyi.html'
headers = {
      'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}
page_text = requests.get(url=url,headers=headers).text

soup = BeautifulSoup(page_text,'lxml')

li_list = soup.select('.book-mulu  li')
fp = open('./sanguo.txt','w',encoding='UTF-8')
for li in li_list:
      title = li.a.string
      detail_url = 'https://www.shicimingju.com/'+li.a['href']
      detail_page_text = requests.get(url=detail_url,headers=headers).text
      detail_soup = BeautifulSoup(detail_page_text,'lxml')
      div_tag = detail_soup.find('div',class_='chapter_content')
      content = div_tag.text
      fp.write(title+':'+content+'\n')
      print(title,'爬取成功')
就这么一段代码  ， WIN10系统爬完就是乱码  搜索上的回答都没有用呢

627826483 · 发表于 2022-5-29 15:24:24

求帮助太难了看的视频使用的是苹果系统，人家的运行没问题，应该是俩个系统间某个我不知道的一个小参数的问题

556750 · 发表于 2022-6-27 11:09:56

r = requests.get(url=url, headers=headers)
r.encoding = "utf-8"
page_text= r.text

		自动登录	找回密码
密码			立即注册

[求助] 新人求助爬东西乱码