|
本帖最后由 xting233 于 2018-2-12 14:49 编辑
已经有了词频,用groupby统计的,得到df_word_counts.level_1,意义是“招聘网上5000多个数据分析岗的标签”,这样的:
wordcloud.fit_words()需要传入字典,我就把它变成dict类型了,
word_dic = dict(df_word_counts.level_1[0:100])
word_dic如下:
{'.NET': 6, '15天年假': 1, 'Android': 1, 'BD': 11, 'BI': 201, 'B端': 1, 'C': 3, 'C++': 8, 'C/C++': 3, 'CRM': 6, 'DBA': 33, 'ENVI': 1, 'ERP': 2, 'ETL': 18, 'FA': 2,
....中间省略
'后端开发': 67, '呼叫中心': 1, '咨询': 19, '咨询顾问': 9, '品牌': 2, '售前': 18, '售后': 5, '商业': 139, '商业分析': 1, '商业智能': 6, '商业深度剖析': 1}
生成词云:
from wordcloud import WordCloud
f,axs = plt.subplots(figsize=(15,15))
wordcloud = WordCloud(font_path="/Library/Fonts/Songti.ttc",
width=900,height=400,
background_color="white")
wordcloud.fit_words(word_dic) 这里报错
axs = plt.imshow(wordcloud)
plt.axis('off')
plt.show()
报错信息:
---------------------------------------------------------------------------IndexError
IndexError: string index out of range
传入的参数应该怎么改呢?
是刚开始学习的新手,望指点,感谢
|
|