问题描述:
修改静态资源池配置的时候,重启整个CM之后,突然发现一个YARN中的NodeManager重启失败,问题NodeManager服务不能重启也不能停止。通过链接发现资源配置有一台还是以前的配置没有变化;
http://hadoopip:8088/cluster/nodes
解决方案:
1、重启有问题的agent,
systemctl restart cloudera-scm-agent
2、在元数据库的CM用户下查询roles,查找role_type不是RUNNING的数据,更新这条数据为RUNNING
原数据库状态无法更新,更新之后正常
select * from roles t where t.role_type = 'NODEMANAGER';
update roles t
set t.configured_status = 'RUNNING'
where t.role_type = 'NODEMANAGER'
and t.configured_status = 'STARTING'
3、回到CM界面重启有问题的NodeManager即可。



