栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

按月份名称对熊猫的数据框系列进行排序?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

按月份名称对熊猫的数据框系列进行排序?

感谢@Brad Solomon提供了一种更快的大写字符串方式!

注意1 @Brad Solomon的答案使用

pd.categorical
应该比我的答案节省更多资源。他展示了如何为您的分类数据分配顺序。你不应该错过它:P

或者,您可以使用。

df = pd.Dataframe([["dec", 12], ["jan", 40], ["mar", 11], ["aug", 21],       ["aug", 11], ["jan", 11], ["jan", 1]],         columns=["Month", "Price"])# Preprocessing: capitalize `jan`, `dec` to `Jan` and `Dec`df["Month"] = df["Month"].str.capitalize()# Now the dataset should look like#   Month Price#   -----------#    Dec    XX#    Jan    XX#    Apr    XX# make it a datetime so that we can sort it: # use %b because the data use the abbriviation of monthdf["Month"] = pd.to_datetime(df.Month, format='%b', errors='coerce').dt.monthdf = df.sort_values(by="Month")total = (df.groupby(df['Month"])['Price'].mean())# total Month1     17.3333333     11.0000008     16.00000012    12.000000

注意2

groupby
默认情况下会为您排序组密钥。请注意,在和中使用相同的键进行排序和分组
df =df.sort_values(by=SAME_KEY)
total =(df.groupby(df[SAME_KEY])['Price'].mean()).
否则,可能会发生意外行为。
注意3
一种更有效的计算方法是先计算均值,然后按月进行排序。这样,您只需要排序12个项目,而不是整个项目
df
。如果不需要
df
分类,它将减少计算成本。

注释4 对于已经拥有

month
as
index的人
,想知道如何使其分类,请看一下熊猫。
CategoricalIndex
@jezrael有一个有效的示例,可按月索引对按熊猫系列排列的分类索引进行排序



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/633700.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号