- 一、SparkSQL概述
-
- (一)SparkSQL简史
- (二)SparkSQL的特点
- (三)SparkSQL执行流程
- 二、使用SparkSQL
-
- (一)创建Dataframe
-
- 1、将rdd转换成df
-
- 案例1、生成单列的数据帧
- 案例2、生成多列的数据帧
- 2、将txt文件转换为df
- 3、将json文件转换为df
- 4、将parquet文件转换df
- 5、利用jdbc将关系型数据中的数据转换为df
- (二)通过方法来使用Dataframe
-
- 1、投影查询 - select()方法
- 2、带条件的查询 - where()方法



