栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据

Spark 及 Hive 中的 Union 猜想(有待更详细验证)

大数据 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Spark 及 Hive 中的 Union 猜想(有待更详细验证)

Hive 2.x

-- 这句sql在hive中是无法执行的。
explain select id,id from people
union
select id,id from people

报错:

查看近似sql的查询计划。

Hive在使用union时,自动做了group by
explain select city from test.student
union
select name from test.citys;

结合:
explain select city from test.student group by city;
explain select city,city from test.student group by city;
explain select city,city from test.student group by city,city;

Hive在扫描不同/相同表时,采用的都是相同的临时变量名作为Map的输出。无法区分不同表的id.

Reduce时直接用Map输出的临时变量进行处理。

猜测:

Spark-Emr版本

explain select id,id from people
union
select id,id from people

spark在生成执行计划的时候,尽管是相同表的相同的id,但会添加上不同的数字标注。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/278182.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号