Timeseries, almacenamiento a largo plazo, multiarrendamiento y alta disponibilidad
Este artículo es una retrospectiva de varios meses de mejora continua desde la creación de nuestro actual sistema de seguimiento: a qué retos nos enfrentamos, cómo los superamos y cómo cambiamos finalmente a Victoria Metrics.
Cómo empezó
En Iguana Solutions hemos creado un sistema multi-tenant basado en Prometheus para nuestras necesidades de alertas y metrología: Sismología. Comenzó como un proyecto para sustituir nuestros monolíticos Naemon y Graphite (con collectd) por un sistema único que fusionara metrología y alertas basado en el estándar actual: Prometheus.
Aunque Prometheus nos proporcionó un buen núcleo de metrología y alertas, nos enfrentamos a 3 retos:
![]() | Multiarrendamiento: como pensábamos permitir a nuestros clientes acceder a sus propios datos, había que superar el arrendamiento único de prometheus. |
![]() | Almacenamiento a largo plazo: hasta varios años; de hecho, no es raro que nuestros clientes (o nosotros mismos) comparemos un momento concreto del año con el año N-1 o N-2. |
![]() | Alta disponibilidad: Objetivo de tiempo de inactividad cero, con la posibilidad de desconectar algunos nodos por motivos de mantenimiento. |
En este artículo escrito por Edouard Hur, Vicepresidente de Ingeniería de Iguana Solutions, encontrarás todos los detalles sobre:
- El ajuste fino de las tecnologías utilizadas
- El desarrollo personalizado con respecto a: uso de disco y proxy de lectura remota; uso de RAM, cardinalidad y por qué dio lugar a nuestro propio agente.
- Victoria Metrics y por qué sustituyó a InfluxDB