栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python词云图

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python词云图

python词云图-----wordcloud

常规步骤:

  1. 读取文本,需要先分词( jieba.lcut() )并组成空格分隔字符串)( ’ '.join() )
  2. 自定义停词,注意最终需要为集合形式
  3. 设置词云图形状( numpy和Image库)
  4. 生成wordcloud对象,并设置大小,停词,形状,字体(如果是中文,必须设置字体)
  5. 生成词云图 ( wc.generate(‘分隔好的一个长字符串’) )
  6. 展示词云图 ( plt.imshow(wc) )
import matplotlib.pyplot as plt #数据可视化
import jieba #词语切割
import wordcloud #分词
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS #词云,颜色生成器,停止词
import numpy as np #科学计算
from PIL import Image #读取图片


#对文本进行分词   读取用gbk,是国外设置方便中文的
with open(r'E:书籍北京折叠、死亡考试、天渊14-死亡考试.txt',encoding='gbk') as f:
    text=f.read()
wordlist=jieba.lcut(text)
spacelist=' '.join(wordlist)

#自定义分词词典,最后要为集合形式
with open(r'E:python_pycharmvenvLibsite-packageswordcloudChinese_stopword.txt',encoding='utf-8') as f:
    stopwords=f.readlines()
stopword_lists=set()
content=[stopword.replace('n','') for stopword in stopwords]
stopword_lists.update(content)

#词云图形状
backgroud = np.array(Image.open(r'C:UsersMrDesktops.png'))

#生成词云图对象
#中文需要设置字体路径,英文不需要
wc=WordCloud(font_path=r'E:python_pycharmvenvLibsite-packageswordcloudSTXINGKA.TTF',
             mask=backgroud,
             stopwords=stopword_lists)
#绘制词云图
wc.generate(spacelist)
plt.imshow(wc) #显示词云
plt.axis('off') #关闭x,y轴
plt.show(wc)#显示
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/317307.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号