栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

熊猫-给定特定b的条件概率

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

熊猫-给定特定b的条件概率

要查找

b
每个类实例的类总数,
a
您可以执行

df.groupby('a').b.value_counts()

例如,创建如下的Dataframe:

df = pd.Dataframe({'A':['foo', 'bar', 'foo', 'bar','foo', 'bar', 'foo', 'foo'], 'B':['one', 'one', 'two', 'three','two', 'two', 'one', 'three'], 'C':np.random.randn(8), 'D':np.random.randn(8)})     A      B         C         D0  foo    one -1.565185 -0.4657631  bar    one  2.499516 -0.9412292  foo    two -0.091160  0.6890093  bar  three  1.358780 -0.0620264  foo    two -0.800881 -0.3419305  bar    two -0.236498  0.1986866  foo    one -0.590498  0.2813077  foo  three -1.423079  0.424715

然后:

df.groupby('A')['B'].value_counts()Abar  one      1     two      1     three    1foo  one      2     two      2     three    1

要将其转换为条件概率,需要除以每个组的总大小。

您可以与另一个groupby一起使用:

df.groupby('A')['B'].value_counts() / df.groupby('A')['B'].count()Abar  one      0.333333     two      0.333333     three    0.333333foo  one      0.400000     two      0.400000     three    0.200000dtype: float64

或者,您可以将

lambda
功能应用于组:

df.groupby('a').b.apply(lambda g: g.value_counts()/len(g))


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/662322.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号