使用ansible远程停止node节点的docker服务时,出现卡死情况;
top,发现有僵尸进程,而且和docker有关;
两个僵尸进程的父进程都是containerd-shim
下面是具体的报错日志
把 containerd-shim进程杀死之后,执行systemctl status docker命令没有反应,并且systemd也变成了僵尸进程,然后 load average变成了5 5 5;ssh也无法登录;
感觉整个虚机都已经卡死了;
只有进exsi将这个虚机关闭电源重启了;
重启之后僵尸进程没有,负载也降了下来
根本原因就是ansible停止docker服务的时候,虚机卡死了;



