使用
groupby/agg聚集的群体。对于每个组,申请
set以找到唯一的字符串,并
''.join连接字符串:
In [34]: df.groupby('id').agg(lambda x: ''.join(set(x)))Out[34]: category category2id a z 1b yxz 2c y 12要从
id索引移到结果Dataframe的列,请调用
reset_index:
In [59]: df.groupby('id').agg(lambda x: ''.join(set(x))).reset_index()Out[59]: id category category20 a z 11 b yxz 22 c y 12


