¿Por Qué Prometheus + Grafana?
En DevOps, no se puede arreglar lo que no se puede ver. Prometheus y Grafana forman el estándar de oro para el monitoreo de infraestructura de código abierto.
Paso 1: Instalar Prometheus
sudo useradd --no-create-home --shell /bin/false prometheus
wget https://github.com/prometheus/prometheus/releases/download/v2.50.0/prometheus-2.50.0.linux-amd64.tar.gz
tar xvfz prometheus-*.tar.gz
sudo mv prometheus-*/prometheus /usr/local/bin/
sudo mkdir /etc/prometheus /var/lib/prometheus
Configurar prometheus.yml
global:
scrape_interval: 15s
scrape_configs:
- job_name: 'node'
static_configs:
- targets: ['192.168.1.10:9100', '192.168.1.11:9100']
Paso 2: Instalar Node Exporter
# En CADA servidor a monitorear
wget https://github.com/prometheus/node_exporter/releases/download/v1.7.0/node_exporter-1.7.0.linux-amd64.tar.gz
tar xvfz node_exporter-*.tar.gz
sudo mv node_exporter-*/node_exporter /usr/local/bin/
sudo systemctl enable --now node_exporter
Paso 3: Instalar Grafana
sudo apt install grafana -y
sudo systemctl enable --now grafana-server
Acceda en http://su-servidor:3000 (login: admin / admin). Importe el dashboard 1860.
Paso 4: Configurar Alertas
Cree /etc/prometheus/alert_rules.yml con reglas para CPU > 90% o disco < 15%.
Solución de Problemas
| Problema | Solución |
|---|---|
| Target muestra “DOWN” | Verifique que el exportador está corriendo y el firewall permite el puerto |
| Dashboard vacío | Verifique URL del datasource y la consulta PromQL |
| Prometheus crash OOM | Reduzca targets, aumente retención, más RAM |