栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

spark-submit提交Python程序,使用python zip环境

spark-submit提交Python程序,使用python zip环境

## yarn client hdfs文件
spark-submit  
--master yarn 
--deploy-mode cluster 
--driver-memory 1g 
--num-executors 3 
--executor-memory 1g 
--executor-cores 1 
--archives hdfs://hadoop102:8020/user/xxx/python_zips/pyspark_env.zip#my_env 
--conf spark.pyspark.driver.python=./my_env/pyspark_env/bin/python3.8 
--conf spark.pyspark.python=./my_env/pyspark_env/bin/python3.8 
/tmp/pycharm_project_455/helloworld.py

--archives hdfs://hadoop102:8020/user/xxx/python_zips/pyspark_env.zip#my_env (一定要有#my_env,分发到yarn 容器中解压生成的目录名) 

python环境的zip包 上传到hdfs的用户目录下

zip -r pyspark_env.zip pyspark_env/

hdfs://hadoop102:8020/user/xxx/python_zips/pyspark_env.zip

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/735452.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号