栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

109.升级Python3在CDH集群中遇到的问题与解决

109.升级Python3在CDH集群中遇到的问题与解决

109.1 环境情况

在集群中所有节点/opt/cloudera/anaconda3部署了Python3的安装包:

[root@cdh02 ~]# /opt/cloudera/anaconda3/bin/python -V
Python 3.6.5 :: Anaconda, Inc.
[root@cdh02 ~]# 

全局变量:

# added by Anaconda3 installer
export PATH="/opt/cloudera/anaconda3/bin:$PATH"
[root@cdh01 ~]# python -V
Python 3.6.5 :: Anaconda, Inc.

Spark配置Python3的环境:

export PYSPARK_PYTHON=/opt/cloudera/anaconda3/bin/python
export PYSPARK_DRIVER_PYTHON=/opt/cloudera/anaconda3/bin/python
109.2 出现问题的情况

问题一:报错如下:

Impala-shell时无法正常连接Impala Daemon节点

[root@cdh01 ~]# impala-shell -i cdh01.fayson.com:25003

  File "/opt/cloudera/parcels/CDH-5.14.2-1.cdh5.14.2.p0.3/bin/../lib/impala-shell/impala_shell.py", line 236
    print "Query options (defaults shown in []):"
                                                ^
SyntaxError: invalid syntax
[root@cdh01 ~]# 

Solr命令行创建Collection时

[root@cdh01 solr-collection]# sh create.sh testcollection
create solr collection
Uploading configs from tmp/testcollection_configs/conf to cdh01.fayson.com:2181/solr. This may take up to a minute.
Error: can't discover Solr URI. Please specify it explicitly via --solr.
[root@cdh01 solr-collection]#

创建Collection脚本如下:

[root@cdh01 solr-test]# more solr-collection/create.sh 
#!/bin/sh

ZK="cdh01.fayson.com"
COLLECTION=$1
base=`pwd`
SHARD=3
REPLICA=1

echo "create solr collection"
rm -rf tmp/*
solrctl --zk $ZK:2181/solr instancedir --generate tmp/${COLLECTION}_configs
cp conf/schema.xml tmp/${COLLECTION}_configs/conf/
solrctl --zk $ZK:2181/solr instancedir --create $COLLECTION tmp/${COLLECTION}_configs
solrctl --zk $ZK:2181/solr collection --create $COLLECTION -s $SHARD -r $REPLICA
solrctl --zk $ZK:2181/solr collection --list
109.3 问题分析与解决

1.分析问题
分析一:在python2中print输出可以不加“()”,但是在Python3中print输出需要加”()”,所以是出现python2和python3语法不兼容问题
分析二:使用solrctl命令创建Collection时,该脚本中调用curl命令判断solr server是否可用,通过分析solrctl命令实际调用/opt/cloudera/parcels/CDH/lib/solr/bin/solrctl.sh脚本
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AZV5ISKb-1646294396819)(https://upload-images.jianshu.io/upload_images/19745945-2bb1f70066557694.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]
在脚本中增加echo输出curl请求地址,将输入的地址在名行执行:

[root@cdh01 solr-collection]# curl -i --retry 5 -s -L -k --negotiate -u : http://cdh02.fayson.com:8983/solr
curl: option --negotiate: the installed libcurl version doesn't support this
curl: try 'curl --help' or 'curl --manual' for more information
[root@cdh01 solr-collection]#


得出当前OS安装的libcurl不支持 curl增加–negotiate参数,该问题也是Python版本不兼容问题导致

2.解决问题

通过上面分析结论得出,均是Python3版本与Python2版本不兼容的问题,默认impala和Solr命令使用python2版本,所以需要将Python的全局环境变量删除,不配置python3的全局环境变量即可

大数据视频推荐:
CSDN
大数据语音推荐:
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/753705.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号