Ingeniero de Software (Observabilidad y Monitorización) - West Des Moines, IA Washington DC

Ingeniero de Software (Observabilidad y Monitorización) - West Des Moines, IA

Tiempo completo • Washington DC
Descripción del puesto:
 
Resumen:
 
·      Buscando un ingeniero experimentado en Observabilidad y Monitorización para desarrollar y madurar nuestras capacidades de monitorización, registro, alerta y observabilidad a nivel empresarial en toda nuestra pila tecnológica basada en AWS.
 
·      Este puesto definirá la estrategia, arquitectura, estándares de implementación y paneles que permiten una detección proactiva, una resolución de problemas más rápida y una visión basada en datos en aplicaciones, infraestructura, sistemas operativos, bases de datos, transferencias de archivos y procesos por lotes.
 
·      El candidato ideal posee experiencia práctica en ingeniería, sólidas habilidades en arquitectura y la capacidad de unificar múltiples soluciones de monitorización en un marco cohesivo de observabilidad.
 
Responsabilidades:
 
·      Establecerás estándares para registros, métricas, trazos, correlación de eventos y alertas en múltiples entornos
 
·      Construirás paneles centralizados y políticas de alertas que proporcionarán visibilidad unificada en todas partes: aplicaciones y servicios, sistemas operativos, servicios AWS (EC2, RDS, Lambda, S3, CloudWatch, CloudTrail, etc.), bases de datos (MS SQL Server, PostgreSQL, etc.), sistemas de transferencia de archivos (SFTP, herramientas de transferencia gestionada), trabajos por lotes y procesos programados.
 
·      Crearás umbrales de alerta accionables y sin ruido, políticas de escalada y libros de ejecución.
 
·      Integrarás herramientas existentes (Dynatrace, Graylog, Splunk, SolarWinds, Zabbix) en un ecosistema cohesionado.
 
·      Racionalizarás el uso de herramientas y recomendarás consolidación o modernización cuando sea apropiado.
 
·      Gestionarás el ciclo de vida, configuración, ajuste y estado de las plataformas de monitorización y registro, automatizarás los despliegues de monitorización usando IaC (CloudFormation) y pipelines CI/CD, y desarrollarás plantillas/estándares reutilizables para que los equipos puedan incorporar nuevas aplicaciones rápidamente.
 
·      Construirás paneles de autoservicio e informes para los grupos de interés técnicos/empresariales, crearás documentación para estándares de monitorización, convenciones de nombres de paneles, esquemas de registro y directrices de configuración de alertas.
 
·      Definirás SLOs/SLIs y KPIs de fiabilidad para servicios críticos.
 
·      Colaborarás con equipos scrum, infraestructuras y equipos de seguridad para reducir el MTTR y mejorar la fiabilidad del sistema, participar en la resolución de incidentes, el análisis de causas raíz y la gestión de problemas.
 
·      Proporcionarás liderazgo técnico/mentoría a los miembros del equipo y asesorarás en decisiones de arquitectura y mejores prácticas.
 
·      Desarrollarás/mantendrás documentación del sistema y participarás en sesiones de planificación de proyectos y estrategia técnica.
 
Cualificaciones:
 
·      Licenciatura en Informática o campo relacionado
 
·      5+ años de experiencia implementando monitorización y observabilidad usando Dynatrace
 
·      Experiencia práctica con herramientas de monitorización/registro como Zabbix, Graylog, Splunk, SolarWinds o equivalentes
 
·      5+ años de experiencia práctica con servicios y arquitectura de AWS
 
·      Comprensión profunda de métricas, registros, trazas, rastreo distribuido y correlación de eventos
 
·      Experiencia creando paneles de control y KPIs para capas de aplicaciones, infraestructura y bases de datos
 
·      Sólidas habilidades de scripting/automatización (Python, Bash, PowerShell) y familiaridad con Terraform o CloudFormation
 
·      Sólido conocimiento de la monitorización de redes, ajuste de rendimiento y arquitectura de sistemas
 
·      Familiaridad con los procesos de gestión de incidentes/problemas de ITIL
 
·      Se prefiere la competencia con herramientas de IA y su uso responsable para mejorar la observabilidad
 
·      Se prefiere experiencia con orquestación de contenedores y arquitectura de microservicios
 
·      Se prefiere experiencia con AWS OpenTelemetry, Prometheus, Grafana o herramientas similares
 
 
 
Habilidades técnicas requeridas:
 
• Servicios AWS (EC2, RDS, S3, Lambda, ECS/EKS, etc.)
 
• Gestión de configuración (Ansible, Puppet, Chef)
 
• Herramientas de monitorización (Dynatrace, CloudWatch, Zabbix, Solarwinds, Graylog, etc.)
 
• Herramientas CI/CD (Jenkins, Quickbuild, Bitbucket)
 
• Lenguajes de scripting (Python, PowerShell, Bash)
 
• Gestión de bases de datos (MS SQL Server, PostgreSQL)
 
• Infraestructura como código (Terraform, CloudFormation)
 
• Tecnologías de contenedores (Docker, Kubernetes)
 
Compensación: 45,00 $ la hora




(si ya tienes un currículum en Indeed)

O aplicar aquí.

* campos requeridos

Ubicación
Or
Or