栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何在客户端模式下设置`spark.driver.memory`-pyspark(版本2.3.1)

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何在客户端模式下设置`spark.driver.memory`-pyspark(版本2.3.1)

您提供了以下代码。

spark = SparkSession.builder        .master("local[2]")        .appName("test")        .config("spark.driver.memory", "9g") # This will work (Not recommended)       .getOrCreate()sc = spark.sparkContextfrom pyspark.sql import SQLContextsqlContext = SQLContext(sc)

此配置不得

SparkConf
直接通过

表示您可以设置驱动程序内存,但是不建议在 RUN TIME设置
。因此,如果使用进行设置

spark.driver.memory
,它将接受更改并覆盖它。但是,不建议这样做。因此,该注释不得直接通过SparkConf设置此配置在文档中不适用。您可以使用告诉JVM用
9g
驱动程序内存实例化自身(JVM)
SparkConf

现在,如果您按此行进行操作( Spark可以使用此方法

相反,请通过–driver-memory进行设置,这意味着

当您尝试针对提交

Spark
作业时
client
,可以使用
--driver-memory
标志设置驱动程序内存,例如

spark-submit --deploy-mode client --driver-memory 12G

现在,该行以以下短语结尾

或默认属性文件中。

你可以告诉

SPARK
你的环境中读取默认设置
SPARK_CONF_DIR
$SPARK_HOME/conf
driver-memory
可配置。
Spark也可以。

回答第二部分

如果文档正确,是否有正确的方法可以在配置后检查spark.driver.memory。我尝试了spark.sparkContext._conf.getAll()以及Spark
Web UI,但似乎导致了错误的答案。”

我想说的是正确的文档。您也可以使用或最终检查您指定的

spark.sparkContext._conf.getAll()
工作原理来检查驱动程序内存。

>>> sc._conf.get('spark.driver.memory')u'12g' # which is 12G for the driver I have used

总结一下文档。您可以在界面中设置“ spark.driver.memory”

  • spark-shell
    Jupyter Notebook
    或已经初始化的任何其他环境
    Spark
    不推荐 )。
  • spark-submit
    命令(推荐)
  • SPARK_CONF_DIR
    SPARK_HOME/conf
    (推荐)
  • 您可以先
    spark-shell
    指定

spark-shell --driver-memory 9G

有关更多信息,请参考

默认Spark属性文件



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/393648.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号