Azure Databricks Data Engineer
Role details
Job location
Tech stack
Job description
Bluetab, an IBM en España busca un profesional experimentado para desarrollar y optimizar pipelines de datos utilizando Scala, Python o PySpark. Este rol incluye el diseño de arquitecturas Data Lake y la transformación de datos a gran escala, asegurando la eficiencia y optimización en entornos Cloud principalmente en Azure y AWS., * Desarrollar y optimizar pipelines de datos en Scala, Python o PySpark.
-
Diseñar y construir arquitecturas Data Lake y Data Warehouse en entornos Cloud.
-
Transformar datos a gran escala mediante Spark., Una compañía muy techie que nos ha llevado a ser el brazo fuerte de IBM en Data, Cloud, ML & IA y donde, para empresas clave de diversos sectores, ayudamos a acelerar y optimizar estrategias en plataformas de datos y en la nube, sacando al máximo las ventajas de su arquitectura y entornos de desarrollo. Lo que harás en el día a día
-
Desarrollar y optimizar pipelines de datos en Scala, Python o PySpark, desarrollando y ejecutando procesos en Spark o sobre Databricks, garantizando rendimiento, calidad y escalabilidad.
-
Diseñar y construir arquitecturas Data Lake y Data Warehouse en entornos Cloud (Azure mayormente o si no en entornos AWS o GCP).
-
Transformar datos a gran escala mediante Spark, aplicando buenas prácticas de procesamiento distribuido.
-
Optimizar queries y almacenamiento en Databricks, asegurando eficiencia en el consumo de datos y reducción de costos.
-
Integrar múltiples fuentes de datos, asegurando su calidad, consistencia y trazabilidad.
-
Colaborar con equipos multidisciplinares, impulsando la mejora continua en procesos de ingesta, transformación y explotación de datos.
Requirements
El candidato ideal debe tener experiencia en Databricks, SQL avanzado y herramientas como Terraform. Se ofrecen beneficios como teletrabajo flexible, 23 días de vacaciones, y formación continua., * Sólida experiencia en desarrollo con Scala, Python o PySpark sobre Spark para procesamiento distribuido.
-
Experiencia con Databricks y conocimiento en arquitecturas Data Lakehouse.
-
Conocimiento en SQL avanzado, optimización de queries y modelos de datos escalables., Desarrollo en Scala Desarrollo en Python Desarrollo en PySpark SQL avanzado Optimización de queries, * Sólida experiencia en desarrollo con Scala, Python o PySpark sobre Spark para procesamiento distribuido.
-
Experiencia con Databricks y conocimiento en arquitecturas Data Lakehouse.
-
Conocimiento en SQL avanzado, optimización de queries y modelos de datos escalables.
-
Experiencia en despliegues y automatización con herramientas como Terraform, Airflow o similares.
-
Familiaridad con entornos Cloud.
-
Mentalidad analítica y enfoque en la eficiencia, optimización y escalabilidad de procesos de datos.
-
Actitud colaborativa y pasión por la innovación, trabajando en equipo para resolver desafíos complejos.
Valorable
- Experiencia en Apache Iceberg o Apache Flink.
- Inglés - nivel B2.
Benefits & conditions
Contrato indefinido Teletrabajo flexible Horarios flexibles 23 días de vacaciones Seguro médico Plan de retribución flexible, * Contrato indefinido con salario competitivo acorde a tu experiencia y conocimientos técnicos.
- Teletrabajo flexible, con la opción de trabajar desde nuestra sede en Madrid o en nuestros Hubs de Alicante, Barcelona, Bilbao y Málaga.
- Horarios flexibles adaptados a tu vida personal, y jornada intensiva los viernes y en los meses de verano.
- 23 días de vacaciones.
- Tarjeta restaurante como beneficio social adicional.
- Seguro médico y póliza dental con amplia cobertura.
- Plan de retribución flexible: transporte y guardería.
- Formación continua gamificada con acceso a más de 1900 cursos y certificaciones oficiales.
- Programa Career Coach para desarrollo profesional.
- Tarjeta Regalo Pass de 50€ en el mes de tu cumpleaños.