栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

Spark-Sumbit命令参数解析

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Spark-Sumbit命令参数解析

用法
spark-submit [选项]  [app arguments]
spark-submit --kill [submission ID] --master [spark://...]
spark-submit --status [submission ID] --master [spark://...]
选项说明
选项说明
--master MASTER_URLspark://host:port,mesos://host:port,yarn, or local
--deploy-mode DEPLOY_MODE在哪里启动驱动程序:本地(client,默认)、集群(cluster)
--class CLASS_NAME应用程序的Main类
--name NAME应用名称
--jars JARS包含在驱动程序和执行程序类路径中的本地 jar,多个jar包用逗号分隔
--packages包含在驱动程序和执行程序类路径中的 jar 的 Maven 坐标。
jar包搜索顺序:本地 Maven -> Maven 中央存储库 -> --repositories 提供的任何其他远程存储库。
参数格式:groupId:artifactId:version
--exclude-packages解析--packages中提供的依赖项时排除产生冲突的依赖,采用逗号分隔。
参数格式:groupId:artifactId:version
--repositories远程仓库地址,多个地址用逗号分隔
--py-files PY_FILES放置在 Python 应用程序的 PYTHonPATH 上的 .zip、.egg 或 .py 文件的逗号分隔列表
--files FILES放置在每个执行程序的工作目录中的文件的逗号分隔列表。
--conf PROP=VALUESpark 配置属性
--properties-file FILE加载额外属性的文件路径。 未指定则默认查找 conf/spark-defaults.conf
--driver-memory MEM驱动程序内存(例如 1000M、2G)(默认值:1024M)
--driver-java-options传递给驱动程序的额外 Java 选项
--driver-library-path传递给驱动程序的额外库路径
--driver-class-path要传递给驱动程序的额外类路径条目。 注意,使用 --jars 添加的 jar 会自动包含在类路径中。
--executor-memory MEM每个执行器的内存(例如 1000M、2G)(默认值:1G)。
--proxy-user NAME提交时的代理用户。 此参数不适用于 --principal / --keytab
--help, -h显示此帮助消息并退出
--verbose, -v打印额外的调试输出
--version打印当前 Spark 的版本

仅适用具有集群部署模式的Spark:

选项说明
--driver-cores NUM驱动程序内核(默认值:1)

仅适用Spark Standalone 或 Mesos 集群部署模式 :

选项说明
--supervise如果设置此项,则在失败时会重新启动驱动程序
--kill SUBMISSION_ID如果设置此项,则杀死指定的驱动程序
--status SUBMISSION_ID如果设置此项,则请求指定驱动程序的状态

仅适用Spark standalone 和 Mesos模式:

选项说明
--total-executor-cores NUM所有执行程序的总内核数

仅适用Spark standalone 和 YARN模式:

选项说明
--executor-cores NUM每个执行程序的核心数。 (默认值:YARN 模式下为 1,或独立模式下工作器上的所有可用内核)

仅适用YARN:

选项说明
--driver-cores NUM驱动程序使用的内核数,仅在集群模式下(默认值:1)
--queue QUEUE_NAME要提交到的 YARN 队列(默认值:default)
--num-executors NUM要启动的执行程序数量(默认值:2)
--archives ARCHIVES要提取到每个执行程序的工作目录中的以逗号分隔的档案列表。
--principal PRINCIPAL在安全 HDFS 上运行时用于登录 KDC 的主体。
--keytab KEYTAB包含上面指定的主体的密钥表的文件的完整路径。
该密钥表将通过安全分布式缓存复制到运行 Application Master 的节点,以定期更新登录票证和委托令牌。
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/572027.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号