我能想到的最简单的方法是使用
collect_list
import pyspark.sql.functions as fdf.groupby("col1").agg(f.concat_ws(", ", f.collect_list(df.col2)))
我能想到的最简单的方法是使用
collect_list
import pyspark.sql.functions as fdf.groupby("col1").agg(f.concat_ws(", ", f.collect_list(df.col2)))