Serverite jälgimine on erinevus probleemi avastamise vahel enne, kui kliendid seda märkavad, ja intsidendist teadasaamise vahel vihase telefonikõne kaudu. Hasti struktureeritud monitoorimise strateegia pakub naktavust, teavitusi ja ajaloolisi andmeid mahuvõimekuse planeerimiseks.
Mida jälgida
Peamised mõõdikud: CPU kasutus (hoiatus ule 80% pidevalt), RAM-i kasutus (ule 90% on kriitiline), ketta I/O latentsus, vorgusribalaiuse kasutus ja rakenduste reageerimisajad. Jälgige nii keskmisi kui ka tippe: server, mis igal minutil 10 sekundit 100% juures töötab, on problemaatiline, isegi kui keskmine näeb hea välja.
Zabbix: ettevotlik avatud lahendis
Zabbix on terviklik avatud lahtekoodiga lahendis, mis toetab SNMP, JMX, IPMI, SSH ja HTTP kontrolle. Sisaldab automaatset avastamist, hoiatuste eskaleerimist, SLA aruandlust ja malle sadade tavaliste teenuste jaoks. Skaleerub uhest serverist tuhandete hostideni. Ideaalne keskmistele ja suuretele taristutele.
Prometheus + Grafana: DevOps-stack
Prometheus kogub mõõdikuid eksporteritest: node_exporter süsteemi mõõdikute jaoks, mysqld_exporter andmebaaside jaoks, nginx-prometheus-exporter veebiserverite jaoks. Grafana visualiseerib andmeid kohandatavate armatuurlaudade abil ja toetab Alertmanagerit teatisteks. Suurepärane konteineriseeritud keskkondade ja Kubernetese jaoks.
Kaettavuse monitoorimine
Väline monitoorimine (UptimeRobot, Better Uptime) kontrollib teie teenuseid väljastpoolt, vajalik katkestuste tuvastamiseks, mida sisemine monitoorimine ei näe. Seadistage HTTP, TCP ja märksõna kontrolle. Seadistage SMS või kõned kriitiliste teenuste jaoks, millel on garanteeritud SLA-d.
Hoiatuste kujundamine
Hoiatuste väsimine on reaalne probleem. Konfigureerige hoiatusi raskusastme järgi: kriitilised intsidendid (teenus kättesaamatu, ketas ule 95%) SMS-i või kõne teel, hoiatused (suur koormus, tõusnud veamäär) Slacki või e-posti kaudu. Vaadake hoiatusreeglid igakuiselt üle.
Kokkuvõte
E24 BALTIC juurutab ja haldab Zabbix või Prometheus/Grafana stacke klientidele kogu Baltikumis. Konfigureerime armatuurlaudu, hoiatuste marsruutimist ja valveeskaleerimist. Võtke meiega uhendust monitoorimise auditi saamiseks.