[리눅스] 리눅스 모니터링 알림

리눅스 서버의 안정적인 운영을 위해 시스템 상태를 모니터링하고 잠재적인 문제를 조기에 발견하는 것은 매우 중요합니다. 따라서 여기에는 모니터링 시스템을 구축하고 시스템 상태 변화에 대한 알림 설정에 대해 다루겠습니다.

모니터링 시스템 구축

리눅스 시스템을 모니터링하기 위해서는 PrometheusGrafana을 함께 사용하여 실시간 시스템 상태를 시각화하고 추적하는 것이 효율적입니다. 이러한 도구를 사용하여 CPU, 메모리, 네트워크 및 디스크 사용량 등을 지속적으로 모니터링할 수 있습니다.

# Prometheus 설치
wget https://github.com/prometheus/prometheus/releases/download/v2.29.1/prometheus-2.29.1.linux-amd64.tar.gz
tar -xzf prometheus-2.29.1.linux-amd64.tar.gz
cd prometheus-2.29.1.linux-amd64/
./prometheus --config.file=prometheus.yml

# Grafana 설치
sudo apt-get install -y software-properties-common
sudo add-apt-repository "deb https://packages.grafana.com/oss/deb stable main"
wget -q -O - https://packages.grafana.com/gpg.key | sudo apt-key add -
sudo apt-get update
sudo apt-get install grafana
sudo systemctl start grafana-server
sudo systemctl enable grafana-server

이제, Prometheus 및 Grafana를 통해 시스템 지표가 수집되고 시각화됩니다.

알림 설정

시스템 상태에 이상이 감지되었을 때 알림 기능을 설정해야 합니다. Prometheus는 Alertmanager를 이용하여 이러한 알림 기능을 제공합니다.

먼저 alertmanager.yml 파일을 생성하고 다음 구성을 추가합니다.

route:
  group_by: ['severity']
  group_wait: 10s
  group_interval: 5m
  repeat_interval: 3h
  receiver: 'email'

receivers:
- name: 'email'
  email_configs:
  - to: 'admin@example.com'
    from: 'alertmanager@example.com'
    smarthost: 'smtp.example.com:587'
    auth_username: 'alertmanager'
    auth_password: 'password'
    auth_identity: 'alertmanager'

이렇게 설정하면 Prometheus는 알림이 발생할 때마다 Alertmanager를 통해 이메일로 알림을 발송합니다.

이제 모니터링 시스템이 구축되었고, 시스템 상태 변화에 대한 알림 설정이 완료되었습니다. 이렇게 하면 시스템 문제가 발생했을 때 빠르게 대응할 수 있게 됩니다.

참고 자료