找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 3928|回复: 7

[求助] 关于python英文词云显示

6

主题

13

帖子

13

积分

贫民

积分
13
谁家羊丢这了 发表于 2018-5-16 14:40:32 | 显示全部楼层 |阅读模式
想做的一个英文词组的词云显示图片,每一个要显示的因为词组内容都已经在文档中按行存储好,但是具体到显示的时候,会发现显示出来的词组都是2个词的,但文本中存在三个词的词组,所以显示的结果就有错误,想请教大神,如何解决这个问题

要显示的文本内容

要显示的文本内容

目前显示的结果

目前显示的结果
回复

使用道具 举报

0

主题

956

帖子

956

积分

圣骑士

积分
956
sheeboard 发表于 2018-5-17 09:24:36 | 显示全部楼层
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import collections

words=[]

with open('nr.txt','r') as f:
    for word in f:
        words.append(word.strip())
frequencies=dict(collections.Counter((words)).items())
wc=WordCloud(background_color='black')

wc.fit_words(frequencies)
plt.imshow(wc)
plt.axis('off')
plt.show()

代码很简单,如何使图片更好看点,自己再研究一下吧。



Screenshot from 2018-05-17 09-11-36.png
回复 支持 1 反对 0

使用道具 举报

0

主题

956

帖子

956

积分

圣骑士

积分
956
sheeboard 发表于 2018-5-16 15:27:41 | 显示全部楼层
本帖最后由 sheeboard 于 2018-5-16 15:30 编辑

每一行用split point 把结果放到list,list再去stop word,再count生成关键字字典就可以了。再不然手动写字典。
回复 支持 反对

使用道具 举报

6

主题

13

帖子

13

积分

贫民

积分
13
谁家羊丢这了  楼主| 发表于 2018-5-16 15:57:53 | 显示全部楼层
sheeboard 发表于 2018-5-16 15:27
每一行用split point 把结果放到list,list再去stop word,再count生成关键字字典就可以了。再不然手动写字 ...

可以麻烦您帮忙写的具体一点吗?为什么要用到字典呢,直接文本读不可以吗?
而且照目前的文本来看,我没有要屏蔽的词,但是我不写那个stopword=' '这个他就会把该显示的can't屏蔽掉,我不太理解这一块
回复 支持 反对

使用道具 举报

6

主题

13

帖子

13

积分

贫民

积分
13
谁家羊丢这了  楼主| 发表于 2018-5-16 16:01:58 | 显示全部楼层
sheeboard 发表于 2018-5-16 15:27
每一行用split point 把结果放到list,list再去stop word,再count生成关键字字典就可以了。再不然手动写字 ...

而且其实我想要的生成结果就是每一行的词组,现在是有的词组比如Customer Service Issue,这是三个词的,他就会拆分成Customer Service,或者Service Issue,以至于后面的顺序也会受影响
回复 支持 反对

使用道具 举报

0

主题

956

帖子

956

积分

圣骑士

积分
956
sheeboard 发表于 2018-5-16 23:23:16 | 显示全部楼层
这样把,把两个问题的测试数据文件都传上来。
回复 支持 反对

使用道具 举报

6

主题

13

帖子

13

积分

贫民

积分
13
谁家羊丢这了  楼主| 发表于 2018-5-17 08:18:10 | 显示全部楼层
sheeboard 发表于 2018-5-16 23:23
这样把,把两个问题的测试数据文件都传上来。

这个是我要处理的数据,相当于每一行的内容是在词云中显示的一个单位

nr.docx

11.81 KB, 下载次数: 1

回复 支持 反对

使用道具 举报

6

主题

13

帖子

13

积分

贫民

积分
13
谁家羊丢这了  楼主| 发表于 2018-5-17 09:47:30 | 显示全部楼层
sheeboard 发表于 2018-5-17 09:24
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import collections

谢谢大神!!!终于成功了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表