Ingeniero de Plataforma de Datos - Jersey City, NJ Fully Remote - US

Ingeniero de Plataforma de Datos - Jersey City, NJ

Tiempo completo • Fully Remote - US
Descripción del puesto:
 
Buscamos un Ingeniero de Datos Senior altamente cualificado con 8+ años de experiencia práctica en ingeniería de datos empresariales, incluyendo una amplia experiencia en desarrollo de DAGs Apache Airflow, modelado e implementación de núcleos dbt y plataformas de contenedores nativas en la nube (Kubernetes / OpenShift).
 
Este puesto es fundamental para construir, operar y optimizar canalizaciones de datos escalables que apoyen plataformas financieras y contables, incluyendo migraciones de sistemas empresariales y cargas de trabajo de procesamiento de datos de alto volumen.
 
El candidato ideal tendrá amplia experiencia práctica en orquestación de flujos de trabajo, modelado de datos, ajuste de rendimiento y gestión distribuida de cargas de trabajo en entornos contenedores.
 
Responsabilidades clave:
 
Pipeline de datos y orquestación
 
  • Diseñar, desarrollar y mantener complejos DAGs de flujo de aire para pipelines de datos basados en lotes y eventos
  • Implementar las mejores prácticas para el rendimiento de DAG, gestión de dependencias, reintentos, monitorización SLA y alertas
  • Optimizar las configuraciones del programador, ejecutor y trabajador Airflow para cargas de trabajo de alta concurrencia
Modelado de Núcleo y Datos DBT
 
  • Lead implementación del núcleo dbt, incluyendo estructura del proyecto, entornos e integración CI/CD
  • Diseñar y mantener modelos robustos de DBT (staging, intermediate, marts) siguiendo las mejores prácticas de ingeniería analítica
  • Implementar pruebas DBT, documentación, macros y modelos incrementales para garantizar la calidad y el rendimiento de los datos
  • Optimizar el rendimiento de consultas DBT para conjuntos de datos a gran escala y necesidades de informes downstream
Cloud, Kubernetes y OpenShift
 
  • Desplegar y gestionar cargas de trabajo de datos en plataformas Kubernetes / OpenShift
  • Estrategias de diseño para la distribución de cargas de trabajo, escalado horizontal y optimización de recursos
  • Configurar solicitudes y límites de CPU/memoria, autoescalado y planificación por pods para cargas de trabajo de datos
  • Solucionar problemas de rendimiento a nivel de contenedor y contención de recursos
Rendimiento y fiabilidad
 
  • Monitorizar y ajustar el rendimiento de las tuberías de extremo a extremo en las plataformas Airflow, DBT y datos
  • Identificar cuellos de botella en la ejecución de consultas, orquestación e infraestructura
  • Implementar soluciones de observabilidad (registros, métricas, alertas) para la detección proactiva de incidencias
  • Garantizar una alta disponibilidad, tolerancia a fallos y resiliencia de las canalizaciones de datos
Colaboración y Gobernanza
 
  • Trabaja estrechamente con arquitectos de datos, ingenieros de plataformas y partes interesadas del negocio
  • Apoyar casos de uso de informes financieros, contabilidad y datos regulatorios
  • Hacer cumplir los estándares de ingeniería de datos, las mejores prácticas de seguridad y las políticas de gobernanza
Habilidades y cualificaciones requeridas:
 
Experiencia
 
  • 10+ años de experiencia profesional en ingeniería de datos, ingeniería analítica o roles de ingeniería de plataformas
  • Experiencia demostrada diseñando y apoyando plataformas de datos a escala empresarial en entornos de producción
Habilidades técnicas imprescindibles
 
  • Apache Airflow a nivel experto (diseño DAG, planificación, ajuste de rendimiento)
  • DBT Core a nivel experto (modelado de datos, pruebas, macros, implementación)
  • Fuerte dominio de Python para ingeniería de datos y automatización
  • Conocimiento profundo de Kubernetes y/o OpenShift en entornos de producción
  • Amplia experiencia en gestión distribuida de cargas de trabajo y optimización del rendimiento
  • Sólidas habilidades SQL para transformaciones complejas y análisis
Experiencia en la nube y la plataforma
 
  • Experiencia ejecutando plataformas de datos en entornos cloud
  • Familiaridad con despliegues contenedores, pipelines CI/CD y flujos de trabajo basados en Git
Cualificaciones Preferidas
 
  • Experiencia apoyando servicios financieros o plataformas contables
  • Exposición a migraciones de sistemas empresariales (por ejemplo, de plataforma heredada a pila de datos moderna)
  • Experiencia con almacenes de datos (Oracle)

Este es un puesto remoto.

Compensación: 63,00 $ la hora




(si ya tienes un currículum en Indeed)

O aplicar aquí.

* campos requeridos

Ubicación
Or
Or