|
如题,代码贴在下面。返回天气,结果为乱码,百度了很久,尝试了N种方法,都不成功,请教,谢谢。
- #coding=utf-8
- import urllib2
- import requests
- import lxml
- from bs4 import BeautifulSoup
- url= "http://www.weather.com.cn/weather/101220304.shtml" #构造网址 网站meta utf-8编码
- req=requests.get(url).text
- soup=BeautifulSoup(req,'html.parser')
- for inpu in soup.findAll('ul',class_='t clearfix'):
- for text in inpu.stripped_strings:
- #print type(text) 这里显示type(text)为unicode
- print text.decode('utf-8')
复制代码 返回结果:
9æ¥ï¼ä»å¤©ï¼
æ´
7
/
-3â
3-4级
10æ¥ï¼æ天ï¼
æ´
6
/
-3â
3-4级转<3级
11æ¥ï¼å天ï¼
å¤äºè½¬æ´
6
/
-5â
<3级
12æ¥ï¼å¨äºï¼
æ´
5
/
-5â
<3级
13æ¥ï¼å¨å
ï¼
å¤äº
7
/
1â
<3级
14æ¥ï¼å¨æ¥ï¼
å¤äº
10
/
3â
<3级
15æ¥ï¼å¨ä¸ï¼
å¤äºè½¬å°é¨
9
/
4â
<3级
|
|