找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 5015|回复: 3

[已回复] 爬同一数据源,大部分数据显示中文成功,但偶尔乱码

12

主题

28

帖子

28

积分

贫民

积分
28
.is 发表于 2016-10-28 18:37:41 | 显示全部楼层 |阅读模式
那我到底是要用什么编码显示啊,不然会print错误
])550531[VIDG0`R{R)C4M1.png
回复

使用道具 举报

1419

主题

1891

帖子

291

积分

侠客

积分
291

最佳新人热心会员默默耕耘

whydo1 发表于 2016-10-28 21:36:37 | 显示全部楼层
可以使用chardet模块的detect方法进行编码测试
python3.4.4, win10
回复 支持 1 反对 0

使用道具 举报

0

主题

3

帖子

3

积分

贫民

积分
3
wybhdxfx 发表于 2016-10-28 23:21:55 | 显示全部楼层
我觉得先要搞明白编码问题,前几天看到知乎上一篇文章。挺好的。https://www.zhihu.com/question/31833164
你参考下~
回复 支持 反对

使用道具 举报

50

主题

1057

帖子

1108

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1108

活跃会员热心会员最佳导师默默耕耘突出贡献优秀版主荣誉管理论坛元老

blueelwang 发表于 2016-10-31 15:25:35 | 显示全部楼层
肯能是爬取的网站的问题, 对于出错的url可以在浏览器打开确认编码
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表