Monit
Z Wiki UnArt Slavičín
Instalace
apt install monit
Konfigurace
Upravit hlavní konfigurační soubor /etc/monit/monitrc:
# kontrolovat každou minutu set daemon 60 # logovat do syslogu set log syslog # posílat e-maily přes náš SMTP server set mailserver smtp.unartel.cz port 25 username "freenetis" password "*********" # posílat e-maily na naši e-mailovou adresu set alert monitor@slavicin.unart.cz # zapnutí webového rozhraní set httpd port 2812 and allow root:tajneheslo
Vlastní hlídač služby
Pro hlídání influxdb vytvořit soubor /etc/monit/conf-available/influxdb s následujícím obsahem:
check process influxdb with matching influxd start program = "/usr/bin/systemctl start influxdb.service" stop program = "/usr/bin/systemctl stop influxdb.service" if failed host 127.0.0.1 port 8086 then restart if cpu > 60% for 2 cycles then alert if cpu > 98% for 5 cycles then restart
Aktivovat jej:
ln -s /etc/monit/conf-available/influxdb /etc/monit/conf-enabled/ service monit restart
CLI rozhraní
monit start all # zapne všechny hlídané služby monit start <name> # zapne pouze danou hlídanou službu monit stop all # vypne všechny hlídané služby monit stop <name> # vypne pouze danou hlídanou službu monit restart all # vypne a zapne všechny hlídané služby monit restart <name> # vypne a zapne pouze danou hlídanou službu monit monitor all # zapne hlídání všech služeb monit monitor <name> # zapne hlídání pouze dané služby monit unmonitor all # vypne hlídání všech služeb monit unmonitor <name> # vypne hlídání pouze dané služby monit reload # reloadne monit monit status # vypíše podrobný stav všech hlídaných služeb monit status <name> # vypíše podrobný stav dané hlídané služby monit summary # vypíše krátký stav všech hlídaných služeb monit summary <name> # vypíše krátký stav dané hlídané služby monit report # vypíše report se statistikou všech hlídaných služeb monit report up # vypíše počet všech funkčních hlídaných služeb monit report down # vypíše počet všech nefunkčních hlídaných služeb monit report initialising # vypíše počet všech startujících hlídaných služeb monit report unmonitored # vypíše počet všech nehlídaných služeb monit report total # vypíše počet všech hlídaných služeb monit quit # ukončí monit monit validate # otestuje všechny služby a zapne se, jestliže není spuštěný monit procmatch <pattern> # otestuje daný regexp výraz pro službu