栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

为什么spark中叫算子不叫方法以及算子之间的区别

为什么spark中叫算子不叫方法以及算子之间的区别

今天博主在学习spark中一直在用算子,突然很困惑为什么要叫算子而不是方法呢?
答:
算子:(Operation)
是为了区分和scala集合对象的方法,集合对象的方法都是在同一个节点中完成的,RDD的方法也就是算子都是在Executor中执行,为了区分两者,所以称之为算子。

foreachcollect.foreach
Execute端执行操做在driver端执执行操作
每个Execute进行输出,所以乱序Execute端反馈给driver,driver端进行整合输出,所以是有序
类RDD的方法接口IndexedSeqOptimized的方法
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/751225.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号