找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 3262|回复: 1

[求助] 在IDLE工具中输出中文出现乱码

2

主题

2

帖子

32

积分

贫民

积分
32
御剑把酒听秋雨 发表于 2015-6-6 17:32:21 | 显示全部楼层 |阅读模式
今天写了一个下载MP3的爬虫,显示歌曲名的时候出现乱码求助各路大神,帮我看看什么原因,谢谢!

其他地方输出都正常,就有一部分是乱码
QQ截图20150606173100.jpg

代码在下面:


#!/usr/bin/env python
#coding:utf-8

__author__ = 'Administrator'

import urllib
import re

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def get_mp3(html):
    reg = r'src="(.*?\.(wav|mp3))" data'
    mp3re = re.compile(reg)
    mp3list = re.findall(mp3re,html)
    for mp3url in mp3list:
        print mp3url[0]


def get_mp3_name(html):
    re_MP3_name = r'songinfo="(.*?)"'
    MP3_name_re = re.compile(re_MP3_name)
    MP3_name_list = re.findall(MP3_name_re,html)
    for i in MP3_name_list:
        print i[0:4]
        print i[4:-20]




html = getHtml('http://tx3.163.com/music/')
get_mp3(html)
get_mp3_name(html)



回复

使用道具 举报

0

主题

3

帖子

12

积分

贫民

积分
12
PosPro 发表于 2015-7-3 22:18:06 | 显示全部楼层
我在Win7/python2.7.3下运行,没有输出啊
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表