这就是您可以执行的操作,使用管道将字符串拆分并使用spark函数爆炸数据
import org.apache.spark.sql.functions._import spark.implicits._val df = Seq(("a1", "b1", "c1|c2|c3|c4")).toDF("A", "B", "C")df.withColumn("C", explode(split($"C", "\|"))).show输出:
+---+---+---+| A| B| C|+---+---+---+| a1| b1| c1|| a1| b1| c2|| a1| b1| c3|| a1| b1| c4|+---+---+---+
希望这可以帮助!



