Data Engineer (Phd) (Arbo)

Virtual Desk
Arbo, Spain
2 days ago

Role details

Contract type
Apprenticeship
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
Spanish, English

Job location

Arbo, Spain

Tech stack

Java
Artificial Intelligence
Airflow
Amazon Web Services (AWS)
Apache HTTP Server
Azure
Big Data
Cloud Computing
Computer Engineering
Continuous Integration
ETL
Data Warehousing
Relational Databases
Hadoop
Python
NoSQL
DataOps
SQL Databases
Data Streaming
Data Processing
Google Cloud Platform
Spark
Data Lake
Data Lineage
Apache Flink
Kafka
Databricks

Job description

En Virtual Desk impulsamos la transformación digital de grandes organizaciones mediante soluciones innovadoras basadas en inteligencia artificial y automatización de procesos. Combinamos tecnología, estrategia y ejecución para generar impacto real en negocio.Si desea conocer los requisitos para este puesto, siga leyendo para obtener toda la información relevante.Somos un equipo dinámico, colaborativo y orientado a resultados, donde el aprendizaje continuo, la innovación y la excelencia forman parte de nuestro ADN.Buscamos un/a Data Engineer con DoctoradoBuscamos un/a Data Engineer con Doctorado para participar en proyectos avanzados de ingeniería del dato, arquitecturas cloud y plataformas analíticas modernas, trabajando con tecnologías punteras dentro de un entorno altamente técnico y colaborativo. Buscamos una persona con una sólida base analítica y técnica que combine experiencia en ingeniería del dato con capacidad de trabajar con arquitecturas modernas, escalables y orientadas a la calidad del dato.ResponsabilidadesTe incorporarás a proyectos innovadores relacionados con plataformas de datos cloud, gobierno del dato y procesamiento avanzado de información, participando en todo el ciclo de vida del dato.Diseñar e implementar arquitecturas de datos modernas sobre entornos Cloud y Lakehouse.Construir y evolucionar pipelines ETL/ELT robustos, automatizados y escalables.Aplicar metodologías DataOps para el control de versionado, automatización y monitorización de pipelines.Garantizar la calidad, trazabilidad y gobierno del dato durante todo su ciclo de vida.Implementar soluciones de procesamiento de datos batch y near real-time.Diseñar procesos de monitorización y optimización de recursos en entornos cloud.Colaborar con equipos de Data Science, BI y negocio para integrar modelos analíticos y soluciones de reporting.Participar en iniciativas relacionadas con privacidad y seguridad del dato (LOPD/RGPD).Requisitos TécnicosDoctorado (PhD) en áreas relacionadas con: Ciencia de Datos, Estadística, Matemáticas, Física, Ingeniería Informática, Telecomunicaciones, Inteligencia Artificial, Big Data o disciplinas STEM relacionadas con el dato.Experiencia con: Azure, AWS o GCP, Databricks, Spark, Python, SQL avanzado.Diseño e implementación de pipelines ETL/ELT.Experiencia en arquitecturas: Data Lake, Data Warehouse, Lakehouse.Conocimientos de: Apache Iceberg / Delta Lake, Apache Airflow o herramientas similares de orquestación, Gobierno y Calidad del Dato, Data Lineage.Experiencia trabajando con bases de datos relacionales y NoSQL.Conocimientos de metodologías DataOps y automatización de pipelines.Experiencia en entornos Big Data y ecosistema Hadoop/Spark.Conocimientos básicos de privacidad y protección de datos (LOPD/RGPD).ValorableExperiencia en procesamiento en streaming y near real-time (Kafka, Flink, Kinesis) y familiaridad con arquitecturas orientadas a eventos tipo Lambda o Kappa.Experiencia en monitorización y optimización de pipelines cloud.Conocimientos de CI/CD aplicados a plataformas de datos.Programación adicional en Scala o Java.Certificaciones cloud (Azure, AQS, GCP) o en tecnologías del ecosistema data.Nivel de inglés medio-alto para trabajar con documentación técnica y entornos internacionales.Qué Ofrecemos?Participación en proyectos innovadores de alto impacto.Trabajo con tecnologías punteras del ecosistema Data & Cloud.Entorno técnico altamente especializado.Plan de crecimiento y aprendizaje continuo.Cultura orientada a la innovación y mejora continua.Póliza de seguros y plan de retribución adaptable.#J-*****-Ljbffr

Requirements

Doctorado (PhD) en áreas relacionadas con: Ciencia de Datos, Estadística, Matemáticas, Física, Ingeniería Informática, Telecomunicaciones, Inteligencia Artificial, Big Data o disciplinas STEM relacionadas con el dato. Experiencia con: Azure, AWS o GCP, Databricks, Spark, Python, SQL avanzado. Diseño e implementación de pipelines ETL/ELT. Experiencia en arquitecturas: Data Lake, Data Warehouse, Lakehouse. Conocimientos de: Apache Iceberg / Delta Lake, Apache Airflow o herramientas similares de orquestación, Gobierno y Calidad del Dato, Data Lineage. Experiencia trabajando con bases de datos relacionales y NoSQL. Conocimientos de metodologías DataOps y automatización de pipelines. Experiencia en entornos Big Data y ecosistema Hadoop/Spark. Conocimientos básicos de privacidad y protección de datos (LOPD/RGPD). Valorable Experiencia en procesamiento en streaming y near real-time (Kafka, Flink, Kinesis) y familiaridad con arquitecturas orientadas a eventos tipo Lambda o Kappa. Experiencia en monitorización y optimización de pipelines cloud. Conocimientos de CI/CD aplicados a plataformas de datos. Programación adicional en Scala o Java. Certificaciones cloud (Azure, AQS, GCP) o en tecnologías del ecosistema data. Nivel de inglés medio-alto para trabajar con documentación técnica y entornos internacionales. Qué Ofrecemos? Participación en proyectos innovadores de alto impacto. Trabajo con tecnologías punteras del ecosistema Data & Cloud. Entorno técnico altamente especializado.

Benefits & conditions

Plan de crecimiento y aprendizaje continuo. Cultura orientada a la innovación y mejora continua. Póliza de seguros y plan de retribución adaptable. #J-*****-Ljbffr

Apply for this position