栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何根据pandas数据框中的频率创建wordcloud

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何根据pandas数据框中的频率创建wordcloud

设置一个示例数据框:

  • 另请参见DataCamp:在Python中生成WordCloud

    import pandas as pd

    df = pd.Dataframe({‘word’: [‘how’, ‘are’, ‘you’, ‘doing’, ‘this’, ‘afternoon’],
    ‘count’: [7, 10, 4, 1, 20, 100]})

word
count
列转换为
dict

  • WordCloud().generate_from_frequencies()
    需要一个
    dict

    data = dict(zip(df[‘word’].tolist(), df[‘count’].tolist()))

    print(data)

    {‘how’: 7, ‘are’: 10, ‘you’: 4, ‘doing’: 1, ‘this’: 20, ‘afternoon’: 100}

Wordcloud:

  • 采用
    .generate_from_frequencies
  • generate_from_frequencies(frequencies, max_font_size=None)

    from wordcloud import WordCloud

    wc = WordCloud(width=800, height=400, max_words=200).generate_from_frequencies(data)

情节

import matplotlib.pyplot as pltplt.figure(figsize=(10, 10))plt.imshow(wc, interpolation='bilinear')plt.axis('off')plt.show()

使用图像遮罩:

twitter_mask = np.array(Image.open('twitter.png'))wc = WordCloud(background_color='white', width=800, height=400, max_words=200, mask=twitter_mask).generate_from_frequencies(data_nyt)plt.figure(figsize=(10, 10))plt.imshow(wc, interpolation='bilinear')plt.axis("off")plt.figure()plt.imshow(twitter_mask, cmap=plt.cm.gray, interpolation='bilinear')plt.axis("off")plt.show()


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/640548.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号