为什么不只是groupby
Column1并保存每个组?
df = df.sort_values('Column1').assign(NewColumn='NewColumnValue')print(df) Column1 Column2 NewColumn0 1 93644 NewColumnValue5 1 19593 NewColumnValue6 1 12707 NewColumnValue1 2 63246 NewColumnValue7 2 53480 NewColumnValue2 3 47790 NewColumnValue3 3 39644 NewColumnValue4 3 32585 NewColumnValuefor i, g in df.groupby('Column1'): g.to_csv('{}.csv'.format(i), header=False, index_label=False)感谢Unatiel的改进。
header=False不会写标题,
index_label=False也不会写索引列。
这将创建3个文件:
1.csv2.csv3.csv
每个具有对应于每个
Column1组的数据。



