找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 2440|回复: 2

[求助] python3编码错误UnicodeDecodeError

2

主题

4

帖子

4

积分

贫民

积分
4
智仝障 发表于 2018-7-10 15:53:04 | 显示全部楼层 |阅读模式
在写爬虫框架的时候,有一步操作是把服务器的响应信息转换为utf-8编码格式的数据,
然后就报错了:UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

比如我在终端访问百度服务器并转换响应信息的编码格式:
from urllib import request
req=request.urlopen('http://www.baidu.com')
data=req.read().decode('utf-8')

按下回车就报出上述错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

这怎么解决啊??看网上有说跟计算机名字有关,可我计算机名称也不是中文啊。也有说解码格式不对,我看了百度的header,里面的编码格式就是utf-8啊。
orz跪求大神给个解决办法~~~
回复

使用道具 举报

50

主题

1057

帖子

1108

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1108

活跃会员热心会员最佳导师默默耕耘突出贡献优秀版主荣誉管理论坛元老

blueelwang 发表于 2018-7-12 19:37:25 | 显示全部楼层
windows系统? 在命令行下试试
回复 支持 反对

使用道具 举报

0

主题

12

帖子

12

积分

贫民

积分
12
QQ
pl2379965 发表于 2018-7-13 18:27:55 | 显示全部楼层
data=req.read().decode('gb2312')
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表