栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

从Pandas DataFrame删除重复项,并保留原始条件

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

从Pandas DataFrame删除重复项,并保留原始条件

>>> df    A   B0   1   Ms1   1   Ms2   1   Ms3   1   Ms4   1   PhD5   2   Ms6   2   Ms7   2   Bs8   2   PhD

使用自定义函数对数据框进行排序:

def sort_df(df, column_idx, key):    '''Takes a dataframe, a column index and a custom function for sorting,     returns a dataframe sorted by that column using that function'''    col = df.ix[:,column_idx]    df = df.ix[[i[1] for i in sorted(zip(col,range(len(col))), key=key)]]    return df

我们的排序功能:

cmp = lambda x:2 if 'PhD' in x else 1 if 'Bs' in x else 0

实际上:

sort_df(df,'B',cmp).drop_duplicates('A', take_last=True)

    A   B4   1   PhD8   2   PhD


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/646530.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号