实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 面试经验 > 面试问答

基于两列A，B从数据框中删除重复项，并在另一列C中保留具有最大值的行

面试问答更新时间：2026-05-21 16:57:16 发布时间：1623天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

您可以使用分组依据：

c_maxes = df.groupby(['A', 'B']).C.transform(max)df = df.loc[df.C == c_maxes]

c_maxes

是每个组

Series

中的最大值的a
，

但与的长度和索引相同

df

。如果您还没有使用过，

.transform

那么打印

c_maxes

可能是个好主意，以了解其工作原理。

使用的另一种方法

drop_duplicates

是

df.sort('C').drop_duplicates(subset=['A', 'B'], take_last=True)

不确定哪种方法更有效，但是我猜第一种方法不涉及排序。

编辑： 从

pandas 0.18

第二个解决方案将是

df.sort_values('C').drop_duplicates(subset=['A', 'B'], keep='last')

或者，

df.sort_values('C', ascending=False).drop_duplicates(subset=['A', 'B'])

无论如何，该

groupby

解决方案的性能似乎都更高：

%timeit -n 10 df.loc[df.groupby(['A', 'B']).C.max == df.C]10 loops, best of 3: 25.7 ms per loop%timeit -n 10 df.sort_values('C').drop_duplicates(subset=['A', 'B'], keep='last')10 loops, best of 3: 101 ms per loop

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/651226.html

上一篇在Python中，如何检查字符串是否仅包含某些字符？

下一篇使用timeit.Timer（）时如何传递函数的参数

面试问答相关栏目本月热门文章

关于我们文章归档网站地图联系我们