栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

hive sql 高级函数

hive sql 高级函数

窗口函数 over([partition by col_1] [order by col_2] [窗口选取语句] )

窗口选取语句:

rows unbounded preceding 当前行至第一行

rows x following/preceding 当前行到当前行往后/前x行

rows between x preceding and y following 从前x到后y行

rows between unbounded preceding and unbounded following 从第一行到最后一行

窗口函数:

first_value: 取分组内,排序后,截止到当前行第一个值

last_value:取分组内,排序后,截止到当前行最后一个值

lead(col,n,default): 取统计窗口内往下第n行值,第n行值为null时取default

其中n可选,默认为1,default可选,默认为null

lag(col,n,default): 取统计窗口内往上第n行值,第n行值为null时取default

分析函数:

row_number() 有相同值时生成1、2、3、4的排序

rank() 有相同值时生成1、2、2、4的排序

dense_rank() 有相同值时生成1、2、2、3的排序

cume_dist() 小于等于当前值得行数/分组内总行数

percent_rank() 分组内当前值的rank值-1 / 分组内总行数-1

ntile(n) 用于将分组数据按照顺序切分成n片,返回当前切片值。如果切片不均匀,默认增加第一个切片的分布。

强聚合语法:

grouping sets

cube

rollup 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/780470.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号