找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 4317|回复: 0

[求助] 如何使用python快速的解析xml字符串

2

主题

2

帖子

2

积分

贫民

积分
2
aes3219563 发表于 2017-4-10 14:03:51 | 显示全部楼层 |阅读模式
有一段  xml 格式的字符串 是从http来的(r=requests.post(url)),大小在100~150KB。我使用BeautifulSoup 对他进行解析,发现如果字符串中全部数据符合ascii格式,解析速度非常快。如果其中含有 utf-8的汉字或者特殊字符,解析起来非常慢,要十多秒。我定位的是
print time.time()
res=BeautifulSoup(r.text,'xml') #就这里很慢,尝试过使用 'lxml' 参数,有些数据无法正常解析
print time.time()
尝试过  xml.ElementTree,  xml.dom 和 xml.sax。 其中 elementtree 和 dom 也是非常慢,sax快一些,但是我使用的是python 2.7.13, 该版本sax里面的  parseString() 只支持ascii格式。使用之前还要用  res.encode('ascii','ignore') 转一下,这个转换过程同样十分耗费时间。
另外我的程序跑在树莓派3上面,跪求各位大佬指点。怎么才能解析.............快一点!!


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表