栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Spark列出所有缓存的RDD名称,并且不持久

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Spark列出所有缓存的RDD名称,并且不持久

@Dikei的答案实际上是正确的,但我相信您正在寻找的是

sc.getPersistentRDDs

scala> val rdd1 = sc.makeRDD(1 to 100)# rdd1: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at makeRDD at <console>:27scala> val rdd2 = sc.makeRDD(10 to 1000)# rdd2: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[1] at makeRDD at <console>:27scala> rdd2.cache.setName("rdd_2")# res0: rdd2.type = rdd_2 ParallelCollectionRDD[1] at makeRDD at <console>:27scala> sc.getPersistentRDDs# res1: scala.collection.Map[Int,org.apache.spark.rdd.RDD[_]] = Map(1 -> rdd_2 ParallelCollectionRDD[1] at makeRDD at <console>:27)scala> rdd1.cache.setName("foo")# res2: rdd1.type = foo ParallelCollectionRDD[0] at makeRDD at <console>:27scala> sc.getPersistentRDDs# res3: scala.collection.Map[Int,org.apache.spark.rdd.RDD[_]] = Map(1 -> rdd_2 ParallelCollectionRDD[1] at makeRDD at <console>:27, 0 -> foo ParallelCollectionRDD[0] at makeRDD at <console>:27)

现在让我们添加另一个

RDD
并命名它:

scala> rdd3.setName("bar")# res4: rdd3.type = bar ParallelCollectionRDD[2] at makeRDD at <console>:27scala> sc.getPersistentRDDs# res5: scala.collection.Map[Int,org.apache.spark.rdd.RDD[_]] = Map(1 -> rdd_2 ParallelCollectionRDD[1] at makeRDD at <console>:27, 0 -> foo ParallelCollectionRDD[0] at makeRDD at <console>:27)

我们注意到它实际上并没有持久。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/610132.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号