栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

hive sql子查询缓慢

hive sql子查询缓慢

查询数据最新分区,有时候数据不是t-1的,需要获取到最后一次的分区数据,之前使用的是最大分区:

select user_no,score from table_a where pday=(select max(pday) from table_a)

上述方式为子查询,会扫描所有分区执行非常缓慢,经查询发现,join管理会更快,如下:

select
    user_no
    ,score
from (select max(pday) pday from table_a where pday>='${three_day_ago}') t1
join table_a t2 on t1.pday=t2.pday

可酌情针对近x天的数据匹配

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/632839.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号