使用
drop_duplicates具有
subset与列的列表上检查重复和
keep='first'保持第一重复的。
如果
dataframe是:
df = pd.Dataframe({'Column1': ["'cat'", "'toy'", "'cat'"], 'Column2': ["'bat'", "'flower'", "'bat'"], 'Column3': ["'xyz'", "'abc'", "'lmn'"]})print(df)结果:
Column1 Column2 Column30 'cat' 'bat' 'xyz'1 'toy' 'flower' 'abc'2 'cat' 'bat' 'lmn'
然后:
result_df = df.drop_duplicates(subset=['Column1', 'Column2'], keep='first')print(result_df)
结果:
Column1 Column2 Column30 'cat' 'bat' 'xyz'1 'toy' 'flower' 'abc'



