|
在写爬虫框架的时候,有一步操作是把服务器的响应信息转换为utf-8编码格式的数据,
然后就报错了:UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
比如我在终端访问百度服务器并转换响应信息的编码格式:
from urllib import request
req=request.urlopen('http://www.baidu.com')
data=req.read().decode('utf-8')
按下回车就报出上述错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte
这怎么解决啊??看网上有说跟计算机名字有关,可我计算机名称也不是中文啊。也有说解码格式不对,我看了百度的header,里面的编码格式就是utf-8啊。
orz跪求大神给个解决办法~~~ |
|