在pandas DataFrame中更改每个组的第一个元素

面试问答更新时间：2026-06-04 09:24:52 发布时间：1636天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

您不能将结果赋值给聚合，也将

first

忽略现存的

NaN

，您可以做的是调用

head(1)

，它将返回每个组的第一行，并将索引传递

loc

给orig
df以覆盖这些列值：

In[91]df.loc[df.groupby('vintage')['val2'].head(1).index, 'val2'] = np.NaNdf:Out[91]:          date  val1  val2     vintage0  2017-01-01  0.59   NaN  2017-01-011  2017-02-01  0.68  0.66  2017-01-012  2017-03-01  0.80  0.81  2017-01-013  2017-02-01  0.54   NaN  2017-02-014  2017-03-01  0.61  0.62  2017-02-015  2017-03-01  0.60   NaN  2017-03-01

在这里，您可以看到

head(1)

返回每个组的第一行：

In[94]:df.groupby('vintage')['val2'].head(1)Out[94]: 0     NaN3    0.535     NaNName: val2, dtype: float64

与此相反的

first

结果将返回第一个非NaN，除非

NaN

该组只有值：

In[95]:df.groupby('vintage')['val2'].first()Out[95]: vintage2017-01-01    0.662017-02-01    0.532017-03-01     NaNName: val2, dtype: float64

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/647982.html

上一篇将值设置为pandas数据框的整个列

下一篇防止在Python的批处理控制台中打印功能

面试问答相关栏目本月热门文章

关于我们文章归档网站地图联系我们