Serveriu stebesena yra skirtumas tarp problemos aptikimo pries tai, kai klientai tai pastebi, ir incidento suzinojimo is piktinančio telefoninio skambucio. Gerai sustruktūrizuota stebesenos strategija teikia matomumą, ispejimus ir istorineus duomenis pajėgumu planavimui.
Ką stebėti
Pagrindiniai rodikliai: procesoriaus naudojimas (ispejimas virs 80% nuolat), RAM naudojimas (virs 90% yra kritinis), disko I/O delsa, tinklo pralaidumas ir programu atsakymo laikai. Stebėkite tiek vidurkius, tiek pikus: serveris, kuris kas minutę 10 sekundžiu pasiekia 100%, yra problemiskas, net jei vidurkis atrodo gerai.
Zabbix: imoniu atvirojo kodo sprendimas
Zabbix yra pilnas atvirojo kodo sprendimas, palaikantis SNMP, JMX, IPMI, SSH ir HTTP patikras. Apima automatini aptikimą, ispejimų eskalavimą, SLA ataskaitinimą ir šablonus simtams iprasto nuaudojimo paslaugų. Tinka nuo vieno serverio iki tūkstančių kompiuteriu. Idealus vidutiniam ir dideliam infrastrukturai.
Prometheus + Grafana: DevOps kūpštelys
Prometheus renka rodiklius is eksporteriu: node_exporter sistemos rodikliams, mysqld_exporter duomenu bazems, nginx-prometheus-exporter ziniatinklio serveriams. Grafana vizualizuoja duomenis su tinklamuojamais informaciniuis skydais ir palaiko Alertmanager pranešimams. Puikus konteineriniu ir Kubernetes aplinkų.
Prieinamumo stebesena
Isore stebesena (UptimeRobot, Better Uptime) tikrina jūsu paslaugas is isorės, butina aptikti gedimus, kurių vidinė stebesena nemato. Nustatykite HTTP, TCP ir raktazodžiu patikras. Nustatykite SMS ar skambuciai kritinems paslaugoms su garantuotais SLA.
Ispejimų kūrimas
Ispejimų nuovargis yra tikra problema. Sukonfigūruokite ispejimus pagal sunkumo laipsni: kritiniai incidentai (paslauga nepasiekiama, diskas virs 95%) per SMS ar skambuti, ispėjimai (didelė apkrova, padidėjęs klaidų lygis) per Slack ar el. paštu. Kas menesi peržiūrekite ispejimų taisykles.
Išvada
E24 BALTIC diegia ir prižiūri Zabbix ar Prometheus/Grafana kūpštelius klientams visoje Baltijoje. Konfigūruojame informacinius skydus, ispejimų marširutizavimą ir budejimo eskalavimą. Susisiekite su mumis dėl stebesenos audito.