¿Por Qué Prometheus + Grafana?

En DevOps, no se puede arreglar lo que no se puede ver. Prometheus y Grafana forman el estándar de oro para el monitoreo de infraestructura de código abierto.


Paso 1: Instalar Prometheus

sudo useradd --no-create-home --shell /bin/false prometheus
wget https://github.com/prometheus/prometheus/releases/download/v2.50.0/prometheus-2.50.0.linux-amd64.tar.gz
tar xvfz prometheus-*.tar.gz
sudo mv prometheus-*/prometheus /usr/local/bin/
sudo mkdir /etc/prometheus /var/lib/prometheus

Configurar prometheus.yml

global:
  scrape_interval: 15s
scrape_configs:
  - job_name: 'node'
    static_configs:
      - targets: ['192.168.1.10:9100', '192.168.1.11:9100']

Paso 2: Instalar Node Exporter

# En CADA servidor a monitorear
wget https://github.com/prometheus/node_exporter/releases/download/v1.7.0/node_exporter-1.7.0.linux-amd64.tar.gz
tar xvfz node_exporter-*.tar.gz
sudo mv node_exporter-*/node_exporter /usr/local/bin/
sudo systemctl enable --now node_exporter

Paso 3: Instalar Grafana

sudo apt install grafana -y
sudo systemctl enable --now grafana-server

Acceda en http://su-servidor:3000 (login: admin / admin). Importe el dashboard 1860.

Paso 4: Configurar Alertas

Cree /etc/prometheus/alert_rules.yml con reglas para CPU > 90% o disco < 15%.


Solución de Problemas

ProblemaSolución
Target muestra “DOWN”Verifique que el exportador está corriendo y el firewall permite el puerto
Dashboard vacíoVerifique URL del datasource y la consulta PromQL
Prometheus crash OOMReduzca targets, aumente retención, más RAM

Artículos Relacionados