如何从熊猫数据框创建一袋单词

面试问答更新时间：2026-05-21 22:42:59 发布时间：1620天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

IIUIC，使用

选项1] numpy的

flatten

和

split

In [2535]: collections.Counter([y for x in df.values.flatten() for y in x.split()])Out[2535]:Counter({'3': 2,         'Anak': 2,         'Cap': 2,         'Indomie': 4,         'Mas': 2,         'Mi': 2,         'Mie': 2,         'Noodle': 10,         'Pop': 2,         'Telor': 2})

选项2] 使用

value_counts()

In [2536]: pd.Series([y for x in df.values.flatten() for y in x.split()]).value_counts()Out[2536]:Noodle     10Indomie     4Mie         2Pop         2Anak        2Mi          2Cap         2Telor       2Mas         232dtype: int64

选项3] 使用

stack

和

value_counts

In [2582]: df.apply(lambda x: x.str.split(expand=True).stack()).stack().value_counts()Out[2582]:Noodle     10Indomie     4Mie         2Pop         2Anak        2Mi          2Cap         2Telor       2Mas         232dtype: int64

细节

In [2516]: dfOut[2516]:   CATEGORYBRAND0    Noodle        Anak Mas1    Noodle        Anak Mas2    Noodle         Indomie3    Noodle         Indomie4    Noodle         Indomie23   Noodle         Indomie24   Noodle  Mi Telor Cap 325   Noodle  Mi Telor Cap 326   Noodle         Pop Mie27   Noodle         Pop Mie

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/659730.html

上一篇如何为Python click设置默认选项为-h？

下一篇在使用scipy.integrate.odeint和python时遇到麻烦

面试问答相关栏目本月热门文章

关于我们文章归档网站地图联系我们