Tecnología

Claves para lograr una infraestructura redundante y con altos niveles de resiliencia

5 min
de lectura

Al momento de diseñar los servicios y aplicaciones, en Geopagos contamos con múltiples premisas desde la perspectiva del desarrollo y la arquitectura del software.

En primer lugar, nuestra arquitectura orientada a servicios es planificada teniendo en cuenta patrones y buenas prácticas del mercado. Las bases para asegurar estás prácticas se encuentran implementadas bajo el marco de nuestra estrategia tecnológica y está presente en todos los procesos, herramientas y controles.

Estos son algunos ejemplos de estos patrones y prácticas mencionadas:

  • Cada servicio tiene una única responsabilidad y es independiente lo que facilita el mantenimiento, la escalabilidad y acota los dominios de falla. 
  • Todos nuestros servicios funcionan en alta disponibilidad y bajo esquemas de balanceo de carga. Soportan despliegue automatizado y rápida recuperación.
  • Cada servicio implementa sus propios patrones de protección (lógicas de reintentos, circuit-breaking, time outs, etc) para asegurar la resiliencia frente a fallas en dependencias o integraciones, minimizando la afectación. 

Continuando a nivel plataforma, para asegurar una infraestructura redundante y con altos niveles de resiliencia, nuestra arquitectura cuenta con:

Diseño de infraestructura en múltiples zonas de disponibilidad 

Al distribuir los recursos a través de múltiples zonas de disponibilidad, busca proteger los servicios contra fallas en una ubicación física de AWS. Esto proporciona redundancia geográfica, de comunicaciones y de suministro eléctrico, entre otras.

Balanceo de carga

En todos los servicios utiliza sistemas de balanceo de carga lo que le permite  distribuir el tráfico entre múltiples instancias que a su vez se encuentran distribuídas entre diferentes Zonas de Disponibilidad. Esto evita puntos únicos de falla.

Escalabilidad dinámica asegurada por diseño

Implementa políticas de escalamiento automático para que los recursos se puedan adaptar de manera  automática a cambios en la carga de trabajo, protegiendo el rendimiento y sumando alta disponibilidad.

Manejo de estados y sesiones orientados a la disponibilidad continua

Se construye sobre una arquitectura de microservicios, que son independientes en estado de la instancia/contenedor, manejando la persistencia en diferentes capas lo que facilita la recuperación de fallas, escalabilidad y minimiza la afectación en la experiencia del cliente ante contingencias.

Replicación continua de datos e instancias

Utiliza servicios de almacenamiento y bases de datos con replicación entre múltiples zonas de disponibilidad. Se eligen tecnologías de bases de datos ACID compliance para garantizar, entre otras cosas, integridad transaccional.

Implementaciones automatizadas

Implementa herramientas de automatización, procesos de integración y despliegue continuos que garantizan en el proceso los controles de calidad, seguridad y telemetría. En caso de modificaciones o aprovisionamiento de infraestructura, se aplican prácticas como código eliminando operatoria manual y minimizando errores involuntarios.

Observabilidad y alertas

Se asegura una estrategia de monitoreo utilizando herramientas líderes del mercado que permitan en tiempo real: a) almacenar y analizar logs y trazas, con motores de anomalías basados en machine learning, b) evaluar la performance a bajo nivel de nuestros servicios (application performance management),c)  monitorear proactivamente los recursos de infraestructura, y d) consolidar y rutear las alarmas a los equipos que correspondan con flujos de escalamiento a todo nivel en la organización.

Disaster Recovery y Backups

Se prueba regularmente la estrategia de recuperación de desastres que involucra múltiples zonas de disponibilidad (por lo tanto diferentes datacenters y geografías), acompañado de pruebas de restauración de backups. Se realizan pruebas de resiliencia de los diferentes componentes y stress test de los servicios críticos con regularidad.

Para aquellos que quieran crear o escalar su negocio de aceptación de pagos la implementación de una infraestructura redundante y una arquitectura resiliente, es la piedra angular ya que garantiza disponibilidad constante, seguridad y  confiabilidad de los servicios, un factor esencial en entornos críticos.  

Fuente:

Geopagos

Publicado el

Sept. 8, 2023