Descripción del puesto:
Resumen:
· Buscando un ingeniero experimentado en Observabilidad y Monitorización para desarrollar y madurar nuestras capacidades de monitorización, registro, alerta y observabilidad a nivel empresarial en toda nuestra pila tecnológica basada en AWS.
· Este puesto definirá la estrategia, arquitectura, estándares de implementación y paneles que permiten una detección proactiva, una resolución de problemas más rápida y una visión basada en datos en aplicaciones, infraestructura, sistemas operativos, bases de datos, transferencias de archivos y procesos por lotes.
· El candidato ideal posee experiencia práctica en ingeniería, sólidas habilidades en arquitectura y la capacidad de unificar múltiples soluciones de monitorización en un marco cohesivo de observabilidad.
Responsabilidades:
· Establecerás estándares para registros, métricas, trazos, correlación de eventos y alertas en múltiples entornos
· Construirás paneles centralizados y políticas de alertas que proporcionarán visibilidad unificada en todas partes: aplicaciones y servicios, sistemas operativos, servicios AWS (EC2, RDS, Lambda, S3, CloudWatch, CloudTrail, etc.), bases de datos (MS SQL Server, PostgreSQL, etc.), sistemas de transferencia de archivos (SFTP, herramientas de transferencia gestionada), trabajos por lotes y procesos programados.
· Crearás umbrales de alerta accionables y sin ruido, políticas de escalada y libros de ejecución.
· Integrarás herramientas existentes (Dynatrace, Graylog, Splunk, SolarWinds, Zabbix) en un ecosistema cohesionado.
· Racionalizarás el uso de herramientas y recomendarás consolidación o modernización cuando sea apropiado.
· Gestionarás el ciclo de vida, configuración, ajuste y estado de las plataformas de monitorización y registro, automatizarás los despliegues de monitorización usando IaC (CloudFormation) y pipelines CI/CD, y desarrollarás plantillas/estándares reutilizables para que los equipos puedan incorporar nuevas aplicaciones rápidamente.
· Construirás paneles de autoservicio e informes para los grupos de interés técnicos/empresariales, crearás documentación para estándares de monitorización, convenciones de nombres de paneles, esquemas de registro y directrices de configuración de alertas.
· Definirás SLOs/SLIs y KPIs de fiabilidad para servicios críticos.
· Colaborarás con equipos scrum, infraestructuras y equipos de seguridad para reducir el MTTR y mejorar la fiabilidad del sistema, participar en la resolución de incidentes, el análisis de causas raíz y la gestión de problemas.
· Proporcionarás liderazgo técnico/mentoría a los miembros del equipo y asesorarás en decisiones de arquitectura y mejores prácticas.
· Desarrollarás/mantendrás documentación del sistema y participarás en sesiones de planificación de proyectos y estrategia técnica.
Cualificaciones:
· Licenciatura en Informática o campo relacionado
· 5+ años de experiencia implementando monitorización y observabilidad usando Dynatrace
· Experiencia práctica con herramientas de monitorización/registro como Zabbix, Graylog, Splunk, SolarWinds o equivalentes
· 5+ años de experiencia práctica con servicios y arquitectura de AWS
· Comprensión profunda de métricas, registros, trazas, rastreo distribuido y correlación de eventos
· Experiencia creando paneles de control y KPIs para capas de aplicaciones, infraestructura y bases de datos
· Sólidas habilidades de scripting/automatización (Python, Bash, PowerShell) y familiaridad con Terraform o CloudFormation
· Sólido conocimiento de la monitorización de redes, ajuste de rendimiento y arquitectura de sistemas
· Familiaridad con los procesos de gestión de incidentes/problemas de ITIL
· Se prefiere la competencia con herramientas de IA y su uso responsable para mejorar la observabilidad
· Se prefiere experiencia con orquestación de contenedores y arquitectura de microservicios
· Se prefiere experiencia con AWS OpenTelemetry, Prometheus, Grafana o herramientas similares
Habilidades técnicas requeridas:
• Servicios AWS (EC2, RDS, S3, Lambda, ECS/EKS, etc.)
• Gestión de configuración (Ansible, Puppet, Chef)
• Herramientas de monitorización (Dynatrace, CloudWatch, Zabbix, Solarwinds, Graylog, etc.)
• Herramientas CI/CD (Jenkins, Quickbuild, Bitbucket)
• Lenguajes de scripting (Python, PowerShell, Bash)
• Gestión de bases de datos (MS SQL Server, PostgreSQL)
• Infraestructura como código (Terraform, CloudFormation)
• Tecnologías de contenedores (Docker, Kubernetes)
Compensación: 45,00 $ la hora
Sobre nosotros
AHU Technologies INC. es una empresa de consultoría de TI y dotación de personal permanente que satisface y supera las necesidades cambiantes de servicios de TI de las principales corporaciones dentro de los Estados Unidos. Hemos estado brindando soluciones de TI a clientes de diferentes sectores de la industria, ayudándolos a controlar los costos y liberar recursos internos para enfocarse en temas estratégicos.
AHU Technologies INC. fue cofundada por jóvenes emprendedores tecno-comerciales visionarios que siguen siendo nuestros principales consultores. Al mantener relaciones de trabajo con un grupo de otros consultores independientes altamente calificados, tenemos un número creciente de recursos disponibles para proyectos de desarrollo. Actualmente estamos trabajando en varios proyectos como entretenimiento multimedia, soluciones ERP, almacenamiento de datos, aplicaciones web, telecomunicaciones y medicina para nuestros clientes en todo el mundo.
(si ya tienes un currículum en Indeed)
