Talent.com
Esta oferta de trabajo no está disponible en tu país.
SRE

SRE

PagoNxt (a Santander company)Boadilla del Monte, Comunidad de Madrid, España
Hace 2 días
Descripción del trabajo

Descripción del Puesto

Buscamos un / a Site Reliability Engineer para incorporarse a nuestro equipo de SRE, responsable de garantizar la estabilidad, rendimiento y escalabilidad de una plataforma de microservicios desplegada en Cloud Pública (AWS). La persona seleccionada trabajará en la mejora continua de un ecosistema crítico compuesto por Kubernetes, RabbitMQ, IBM MQ, Apache Kafka (Confluent), MongoDB y ElasticSearch.

Responsabilidades

  • Garantizar la disponibilidad y fiabilidad de la plataforma mediante la automatización, monitorización y mejora de procesos.
  • Colaborar en la definición y puesta en marcha de arquitecturas resilientes y escalables, trabajando con los equipos de Ingeniería y Plataforma.
  • Operar, mantener y evolucionar la infraestructura sobre Kubernetes y servicios en AWS.
  • Colaborar con los equipos de desarrollo para mejorar la observabilidad, trazabilidad y capacidad de recuperación de los microservicios.
  • Gestionar y operar plataformas de mensajería y bases de datos como RabbitMQ, IBM MQ, Kafka (Confluent), MongoDB y ElasticSearch.
  • Participar en un sistema de guardias rotativo (2 semanas al mes) con alta capacidad de respuesta y resolución.
  • Detectar, diagnosticar y resolver incidencias críticas en producción.

Requisitos Técnicos

  • Experiencia demostrable como SRE, DevOps Engineer o similar en entornos productivos.
  • Conocimiento avanzado de entornos Kubernetes.
  • Experiencia en operación y tuning de sistemas de mensajería (RabbitMQ, IBM MQ, Kafka / Confluent).
  • Experiencia en MongoDB y ElasticSearch, incluyendo backup, escalado, replicación y troubleshooting.
  • Buen dominio de servicios de AWS como EC2, S3, EKS, CloudWatch, etc.
  • Experiencia con Terraform y Helm.
  • Personales

  • Alta capacidad resolutiva y orientación a la estabilidad del servicio.
  • Disponibilidad para participar en guardias 24x7 durante 2 semanas al mes.
  • Trabajo en equipo, proactividad y enfoque colaborativo.
  • Se Valorará

  • Certificaciones en AWS, Kubernetes o Confluent.
  • Conocimiento de metodologías ágiles (Scrum, Kanban).
  • Experiencia previa en entornos similares (banca, seguros, telco).
  • Experiencia con herramientas de monitorización y alertado (Dynatrace, PagerDuty, etc.).
  • Titulación superior, preferiblemente Informática o Ingeniería.
  • #J-18808-Ljbffr

    Crear una alerta de empleo para esta búsqueda

    Sre • Boadilla del Monte, Comunidad de Madrid, España