栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Python-在pandas数据框中自定义排序

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python-在pandas数据框中自定义排序

首先,将月份列设为分类,然后指定要使用的顺序。

In [21]: df['m'] = pd.Categorical(df['m'], ["March", "April", "Dec"])In [22]: df  # looks the same!Out[22]:   a  b      m0  1  2  March1  5  6    Dec2  3  4  April

现在,当你对月份列进行排序时,它将相对于该列表进行排序:

In [23]: df.sort_values("m")Out[23]:   a  b      m0  1  2  March2  3  4  April1  5  6    Dec

注意:如果值不在列表中,它将被转换为NaN。

对于那些有兴趣的人来说,是一个较旧的答案

你可以创建一个中间系列,并set_index在此基础上:

df = pd.Dataframe([[1, 2, 'March'],[5, 6, 'Dec'],[3, 4, 'April']], columns=['a','b','m'])s = df['m'].apply(lambda x: {'March':0, 'April':1, 'Dec':3}[x])s.sort_values()In [4]: df.set_index(s.index).sort()Out[4]:    a  b      m0  1  2  March1  3  4  April2  5  6    Dec

如前所述,在新的熊猫中,Series可以replace更优雅地做到这一点:

s = df['m'].replace({'March':0, 'April':1, 'Dec':3})

稍有不同的是,如果字典之外没有值,则不会增加该值(它将保持不变)。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/411008.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号