在Linux服务器中,有时候我们需要一个进程需要可靠的在后台运行,并且能够监控进程状态,在意外结束时能够自动重启等。此时就可以使用supervisor。
supervisor 是使用Python开发的一套通用的进程管理程序,能够将一个普通的命令行进程变成后台的守护进程,并且监控进程的状态,异常退出时能够自动重启。
安装supervisor在Ubuntu中可以使用apt-get来安装:
sudo apt-get install supervisor
如果安装缓慢,可以更换中科大的源:
配置https://mirrors.ustc.edu.cn/help/ubuntu.html
安装完成以后,我们需要编写一个配置文件,让supervisor来管理它。每个进程的配置文件都可以单独拆分,放在/etc/supervisor/conf.d/目录下,以.conf作为扩展名。
# 首先进入/etc/supervisor/conf.d目录 /etc/supervisor/conf.d # 使用supervisor自带的命令生成模板 echo_supervisord_conf > foo.conf
编辑模板,在开头添加以下内容:
[program:foo] command=/bin/cat
[program:app] : 定义进程app
command : 命令
directory : 进程的当前目录
user : 进程运行的用户身份
详细配置说明:
;*为必须填写项 ;*[program:应用名称] [program:cat] ;*命令路径,如果使用python启动的程序应该为 python /home/test.py, ;不建议放入/home/user/, 对于非user用户一般情况下是不能访问 command=/bin/cat ;当numprocs为1时,process_name=%(program_name)s ;当numprocs>=2时,%(program_name)s_%(process_num)02d process_name=%(program_name)s ;进程数量 numprocs=1 ;执行目录,若有/home/supervisor_test/test1.py ;将directory设置成/home/supervisor_test ;则command只需设置成python test1.py ;否则command必须设置成绝对执行目录 directory=/tmp ;掩码:--- -w- -w-, 转换后rwx r-x w-x umask=022 ;优先级,值越高,最后启动,最先被关闭,默认值999 priority=999 ;如果是true,当supervisor启动时,程序将会自动启动 autostart=true ;*自动重启 autorestart=true ;启动延时执行,默认1秒 startsecs=10 ;启动尝试次数,默认3次 startretries=3 ;当退出码是0,2时,执行重启,默认值0,2 exitcodes=0,2 ;停止信号,默认TERM ;中断:INT(类似于Ctrl+C)(kill -INT pid),退出后会将写文件或日志(推荐) ;终止:TERM(kill -TERM pid) ;挂起:HUP(kill -HUP pid),注意与Ctrl+Z/kill -stop pid不同 ;从容停止:QUIT(kill -QUIT pid) ;KILL, USR1, USR2其他见命令(kill -l),说明1 stopsignal=TERM stopwaitsecs=10 ;*以root用户执行 user=root ;重定向 redirect_stderr=false stdout_logfile=/a/path stdout_logfile_maxbytes=1MB stdout_logfile_backups=10 stdout_capture_maxbytes=1MB stderr_logfile=/a/path stderr_logfile_maxbytes=1MB stderr_logfile_backups=10 stderr_capture_maxbytes=1MB ;环境变量设置 environment=A="1",B="2" serverurl=AUTO启动
如果编辑默认的supervisor.conf,则需要重启supervisor使配置文件生效:
supervisorctl reload
然后运行下面的命令启动进程:
supervisorctl start foo
如果运行出现如下错误:
unix:///var/run/supervisor.sock no such file
可以运行下面的命令,然后再次启动:
sudo touch /var/run/supervisor.sock
sudo chmod 777 /var/run/supervisor.sock
sudo service supervisor restart
看到如下信息,说明运行成功:
foo: started
也可以输入supervisorctl进入supervisor的控制台界面,同样能够看到:
foo RUNNING pid 6665, uptime 0:08:08
在supervisor的控制台输入help可以获取帮助信息,输入status可以获取当前运行的进程信息,输入exit可以退出supervisor的控制台界面。
关闭使用下面的命令就可以关闭supervisor启动的进程:
supervisorctl stop foo
可以看到输出信息:
常用命令foo: stopped
更新新的配置到supervisord
supervisorctl update重新启动配置中的所有程序
supervisorctl reload启动某个进程(program_name=你配置中写的程序名称)
supervisorctl start program_name查看正在守候的进程(同时进入控制台)
supervisorctl停止某一进程 (program_name=你配置中写的程序名称)
pervisorctl stop program_name重启某一进程 (program_name=你配置中写的程序名称)
supervisorctl restart program_name停止全部进程
supervisorctl stop all
更多内容可以参考:supervisor官方文档



