假设您有两列,这应该很容易。使用
groupby+
agg。
v1应该由
first和
v2合并
','.join。
df key v1 v20 1 NaN a1 2 NaN b2 3 NaN c3 2 NaN d4 3 NaN e(df.groupby('key') .agg({'v1' : 'first', 'v2' : ','.join}) .reset_index() .reindex(columns=df.columns)) key v1 v20 1 NaN a1 2 NaN b,d2 3 NaN c,e如果您有多个需要相同聚合的此类列,请构建一个称为的agg dict
f并将其传递给
agg。



