25 may
|
ITPS
|
Argentina
Postúlate en Kit Empleo: kitempleo.com.ar/empleo/q2q4z
Descripción del Puesto:
Estamos en búsqueda de un Ingeniero de Datos experimentado y apasionado para unirse a nuestro dinámico equipo. El candidato ideal poseerá una sólida formación técnica, un profundo conocimiento en el manejo y procesamiento de grandes volúmenes de datos, y la capacidad de diseñar, construir y mantener pipelines de datos eficientes y escalables. Este rol es fundamental para el éxito de nuestros proyectos de datos, asegurando la disponibilidad, calidad e integridad de la información que impulsa nuestras decisiones estratégicas.
Serás responsable de la arquitectura, desarrollo, implementación y optimización de soluciones de datos, trabajando estrechamente con equipos de análisis, ciencia de datos y desarrollo de software para entregar valor a través de información accionable.
Responsabilidades Clave:
- Diseñar, construir, implementar y mantener pipelines de datos robustos, escalables y eficientes.
- Desarrollar y optimizar ETL/ELT para la ingesta, transformación y carga de datos desde diversas fuentes.
- Gestionar y optimizar el rendimiento de bases de datos y sistemas de almacenamiento de datos.
- Colaborar con científicos de datos y analistas para comprender sus necesidades de datos y proporcionar soluciones adecuadas.
- Implementar y mantener prácticas de calidad de datos y gobierno de datos.
- Monitorear y solucionar problemas de los sistemas de datos para garantizar la disponibilidad y fiabilidad.
- Participar en la evaluación e implementación de nuevas tecnologías y herramientas de datos.
- Asegurar la seguridad y el cumplimiento de las políticas de manejo de datos.
- Documentar la arquitectura de datos, procesos y procedimientos.
¿Qué Ofrecemos?
- Oportunidad de trabajar en proyectos desafiantes e innovadores.
- Entorno de trabajo colaborativo y ágil.
- Desarrollo profesional y oportunidades de crecimiento.
- (Incluir otros beneficios relevantes: Salario competitivo, seguro médico, flexibilidad horaria, etc.)
Requisitos:
- Licenciatura en Ciencias de la Computación, Ingeniería, Matemáticas o un campo relacionado, o experiencia laboral equivalente.
- Mínimo de 4 años de experiencia profesional demostrada en ingeniería de datos.
- Sólida comprensión de los principios de bases de datos relacionales y NoSQL.
- Experiencia en el diseño y construcción de data warehouses y data lakes.
- Capacidad probada para escribir código limpio, eficiente y mantenible en lenguajes como Python o Scala.
- Excelentes habilidades de resolución de problemas y pensamiento analítico.
- Capacidad para trabajar de forma independiente y como parte de un equipo.
- Excelentes habilidades de comunicación, tanto verbal como escrita.
Se Valorará (No Excluyente):
- Certificaciones en tecnologías de Big Data o Cloud.
- Experiencia con plataformas cloud como AWS, Azure o GCP.
- Conocimiento de metodologías ágiles de desarrollo.
Herramientas y Tecnologías que Dominarás y Utilizarás:
- Ecosistema Cloudera (Core): Amplia experiencia trabajando con Spark (para procesamiento distribuido), Hive (para consultas SQL sobre Hadoop), Impala (para consultas SQL de baja latencia), HBase (base de datos NoSQL distribuida), HDFS (sistema de archivos distribuido), Kafka (plataforma de streaming de eventos), Oozie (orquestador de flujos de trabajo) y Hue (interfaz de usuario web para Hadoop).
- Seguridad de Datos: Conocimiento profundo en la implementación y gestión de Kerberos para la autenticación y gestión de tickets, Apache Ranger para el control de acceso y auditoría, y Apache Atlas para la catalogación y gobernanza de metadatos.
- Orquestación y Dev Ops: Experiencia práctica con Apache Airflow para la orquestación de flujos de trabajo complejos y el uso de Docker para la contenerización y despliegue de aplicaciones y servicios.
- Búsqueda e Indexación: Familiaridad con Solr para la búsqueda de texto completo, conocimiento en Bases de Datos Vectoriales para aplicaciones de búsqueda semántica y machine learning, y experiencia con Apache Iceberg para la gestión de tablas de datos a escala en data lakes.
- Ingeniería de Datos Avanzada: Dominio de SQL avanzado, incluyendo joins complejos, subconsultas y funciones de ventana. Comprensión y aplicación de técnicas de Change Data Capture (CDC) para la replicación y sincronización de datos en tiempo real.
Postúlate en Kit Empleo: kitempleo.com.ar/empleo/q2q4z
📌 Data Engineer (Rif - Srt) (Argentina)
🏢 ITPS
📍 Argentina