您不需要groupby根据几列删除重复项,而可以指定一个子集:
df2 = df.drop_duplicates(["date", "cid"])df2.groupby('date').cid.size()Out[99]: date2005 32006 102007 2272008 522009 1422010 572011 2192012 992013 2382014 146dtype: int64
您不需要groupby根据几列删除重复项,而可以指定一个子集:
df2 = df.drop_duplicates(["date", "cid"])df2.groupby('date').cid.size()Out[99]: date2005 32006 102007 2272008 522009 1422010 572011 2192012 992013 2382014 146dtype: int64