只需直接执行聚合,而不使用
min辅助程序即可:
import org.apache.spark.sql.functions.minval sqlContext: SQLContext = ???import sqlContext.implicits._val df = Seq((1L, "2016-04-05 15:10:00"), (1L, "2014-01-01 15:10:00")) .toDF("id", "ts") .withColumn("ts", $"ts".cast("timestamp"))df.groupBy($"id").agg(min($"ts")).show// +---+--------------------+// | id| min(ts)|// +---+--------------------+// | 1|2014-01-01 15:10:...|// +---+--------------------+min与之不同的是,它将适用于任何
Orderable类型。



