找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 2773|回复: 1

[求助] Python requests库爬虫 更改编码方式后出不来文本

1

主题

2

帖子

2

积分

贫民

积分
2
wn箬笠蓑衣 发表于 2017-7-24 09:57:03 | 显示全部楼层 |阅读模式
>>> import requests
>>> r=requests.get("https://item.jd.com/3355143.html")
>>> r.status_code
200
>>> r.encoding
'gbk'
>>> r.apparent_encoding
'GB2312'
>>> r.encoding=r.apparent_encoding
r
>>> r.text[:1000]
u'<!-- shouji -->\n<!DOCTYPE HTML>\n<html lang="zh-CN">\n<head>\n    <meta http-equiv="Content-Type" content="text/html; charset=gbk" />\n    <title>\u3010\u534e\u4e3anova\u3011\u534e\u4e3a HUAWEI nova 4GB+64GB\u7248 \u9999\u69df\u91d1\uff08\u767d\uff09\u79fb\u52a8\u8054\u901a\u7535\u4fe14G\u624b\u673a \u53cc\u5361\u53cc\u5f85\u3010\u884c\u60c5 \u62a5\u4ef7 \u4ef7\u683c \u8bc4\u6d4b\u3011-\u4eac\u4e1c</title>\n    <meta name="keywords" content="HUAWEInova,\u534e\u4e3anova,\u5
QQ浏览器截屏未命名.png
回复

使用道具 举报

1

主题

2

帖子

2

积分

贫民

积分
2
wn箬笠蓑衣  楼主| 发表于 2017-7-24 12:13:05 | 显示全部楼层
问题已解决
由于使用Python 2,所以最后需改成 "print r.text"即可
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表