栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

检查pandas数据框是否为其他数据框的子集

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

检查pandas数据框是否为其他数据框的子集

方法

Dataframe.merge(another_DF)
在列的默认交集合并(使用来自两个话语结构相同名称的所有列),并使用
how='inner'
-因此,我们期望有行相同#后
innerjoin
(如果没有的话语结构有重复):

len(A.merge(B)) == len(A)

PS,如果其中一个DF有重复的行,它将无法正常工作-有关此类情况,请参见下文

演示:

In [128]: AOut[128]:   A  B  C0  1  2  31  4  5  6In [129]: BOut[129]:   A  B  C0  4  5  61  1  2  32  9  8  7In [130]: len(A.merge(B)) == len(A)Out[130]: True

对于包含重复项的数据集,我们可以删除重复项并使用相同的方法:

In [136]: AOut[136]:   A  B  C0  1  2  31  4  5  62  1  2  3In [137]: BOut[137]:   A  B  C0  4  5  61  1  2  32  9  8  73  4  5  6In [138]: A.merge(B).drop_duplicates()Out[138]:   A  B  C0  1  2  32  4  5  6In [139]: len(A.merge(B).drop_duplicates()) == len(A.drop_duplicates())Out[139]: True


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/646318.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号