Descripción del Puesto
Buscamos un / a Site Reliability Engineer para incorporarse a nuestro equipo de SRE, responsable de garantizar la estabilidad, rendimiento y escalabilidad de una plataforma de microservicios desplegada en Cloud Pública (AWS). La persona seleccionada trabajará en la mejora continua de un ecosistema crítico compuesto por Kubernetes, RabbitMQ, IBM MQ, Apache Kafka (Confluent), MongoDB y ElasticSearch.
Responsabilidades
- Garantizar la disponibilidad y fiabilidad de la plataforma mediante la automatización, monitorización y mejora de procesos.
- Colaborar en la definición y puesta en marcha de arquitecturas resilientes y escalables, trabajando con los equipos de Ingeniería y Plataforma.
- Operar, mantener y evolucionar la infraestructura sobre Kubernetes y servicios en AWS.
- Colaborar con los equipos de desarrollo para mejorar la observabilidad, trazabilidad y capacidad de recuperación de los microservicios.
- Gestionar y operar plataformas de mensajería y bases de datos como RabbitMQ, IBM MQ, Kafka (Confluent), MongoDB y ElasticSearch.
- Participar en un sistema de guardias rotativo (2 semanas al mes) con alta capacidad de respuesta y resolución.
- Detectar, diagnosticar y resolver incidencias críticas en producción.
Requisitos Técnicos
Experiencia demostrable como SRE, DevOps Engineer o similar en entornos productivos.Conocimiento avanzado de entornos Kubernetes.Experiencia en operación y tuning de sistemas de mensajería (RabbitMQ, IBM MQ, Kafka / Confluent).Experiencia en MongoDB y ElasticSearch, incluyendo backup, escalado, replicación y troubleshooting.Buen dominio de servicios de AWS como EC2, S3, EKS, CloudWatch, etc.Experiencia con Terraform y Helm.Personales
Alta capacidad resolutiva y orientación a la estabilidad del servicio.Disponibilidad para participar en guardias 24x7 durante 2 semanas al mes.Trabajo en equipo, proactividad y enfoque colaborativo.Se Valorará
Certificaciones en AWS, Kubernetes o Confluent.Conocimiento de metodologías ágiles (Scrum, Kanban).Experiencia previa en entornos similares (banca, seguros, telco).Experiencia con herramientas de monitorización y alertado (Dynatrace, PagerDuty, etc.).Titulación superior, preferiblemente Informática o Ingeniería.#J-18808-Ljbffr