|
本帖最后由 loco 于 2016-6-23 15:38 编辑
原字符串:
ec:00:00:00:00:c0 2462 88 [WPA-PSK-CCMP][WPA2-PSK-CCMP][ESS] \xe3\x82\xae\xe3\x83\xaa\xe3\x82\xae\xe3\x83\xaaeye
re.findall后:
['ec:00:00:00:00:c0', '2462', '88', '[WPA-PSK-CCMP][WPA2-PSK-CCMP][ESS]', '\\xe3\\x82\\xae\\xe3\\x83\\xaa\\xe3\\x82\\xae\\xe3\\x83\\xaaeye']
\xe3\x82\xae\xe3\x83\xaa\xe3\x82\xae\xe3\x83\xaaeye这个部分 如何转换成正常的文本 原文为日文
如果不能转换的话,输出到文件中时就会输出成:\xe3\x82\xae\xe3\x83\xaa\xe3\x82\xae\xe3\x83\xaaeye
而不是原本的文字了
还有一种情况,使用requests获取了一个网页内容,需要获取的内容为一段正常文字加一个颜文字,那一部分文本正则出来后就变成这样了:
'\\u60a8(\\u30fb\\u03c9< )\\u2605'
求解,如何把这些问题解决,decode无用,因为是字符串,非字节码
|
|