Data Engineer (Phd) (Arbo)

Virtual Desk

Arbo, Spain

2 days ago

Role details

Contract type

Apprenticeship

Employment type

Full-time (> 32 hours)

Working hours

Regular working hours

Languages

Spanish, English

Job location

Arbo, Spain

Tech stack

Java

Artificial Intelligence

Airflow

Amazon Web Services (AWS)

Apache HTTP Server

Azure

Big Data

Cloud Computing

Computer Engineering

Continuous Integration

ETL

Data Warehousing

Relational Databases

Hadoop

Python

NoSQL

DataOps

SQL Databases

Data Streaming

Data Processing

Google Cloud Platform

Spark

Data Lake

Data Lineage

Apache Flink

Kafka

Databricks

Job description

En Virtual Desk impulsamos la transformación digital de grandes organizaciones mediante soluciones innovadoras basadas en inteligencia artificial y automatización de procesos. Combinamos tecnología, estrategia y ejecución para generar impacto real en negocio.Si desea conocer los requisitos para este puesto, siga leyendo para obtener toda la información relevante.Somos un equipo dinámico, colaborativo y orientado a resultados, donde el aprendizaje continuo, la innovación y la excelencia forman parte de nuestro ADN.Buscamos un/a Data Engineer con DoctoradoBuscamos un/a Data Engineer con Doctorado para participar en proyectos avanzados de ingeniería del dato, arquitecturas cloud y plataformas analíticas modernas, trabajando con tecnologías punteras dentro de un entorno altamente técnico y colaborativo. Buscamos una persona con una sólida base analítica y técnica que combine experiencia en ingeniería del dato con capacidad de trabajar con arquitecturas modernas, escalables y orientadas a la calidad del dato.ResponsabilidadesTe incorporarás a proyectos innovadores relacionados con plataformas de datos cloud, gobierno del dato y procesamiento avanzado de información, participando en todo el ciclo de vida del dato.Diseñar e implementar arquitecturas de datos modernas sobre entornos Cloud y Lakehouse.Construir y evolucionar pipelines ETL/ELT robustos, automatizados y escalables.Aplicar metodologías DataOps para el control de versionado, automatización y monitorización de pipelines.Garantizar la calidad, trazabilidad y gobierno del dato durante todo su ciclo de vida.Implementar soluciones de procesamiento de datos batch y near real-time.Diseñar procesos de monitorización y optimización de recursos en entornos cloud.Colaborar con equipos de Data Science, BI y negocio para integrar modelos analíticos y soluciones de reporting.Participar en iniciativas relacionadas con privacidad y seguridad del dato (LOPD/RGPD).Requisitos TécnicosDoctorado (PhD) en áreas relacionadas con: Ciencia de Datos, Estadística, Matemáticas, Física, Ingeniería Informática, Telecomunicaciones, Inteligencia Artificial, Big Data o disciplinas STEM relacionadas con el dato.Experiencia con: Azure, AWS o GCP, Databricks, Spark, Python, SQL avanzado.Diseño e implementación de pipelines ETL/ELT.Experiencia en arquitecturas: Data Lake, Data Warehouse, Lakehouse.Conocimientos de: Apache Iceberg / Delta Lake, Apache Airflow o herramientas similares de orquestación, Gobierno y Calidad del Dato, Data Lineage.Experiencia trabajando con bases de datos relacionales y NoSQL.Conocimientos de metodologías DataOps y automatización de pipelines.Experiencia en entornos Big Data y ecosistema Hadoop/Spark.Conocimientos básicos de privacidad y protección de datos (LOPD/RGPD).ValorableExperiencia en procesamiento en streaming y near real-time (Kafka, Flink, Kinesis) y familiaridad con arquitecturas orientadas a eventos tipo Lambda o Kappa.Experiencia en monitorización y optimización de pipelines cloud.Conocimientos de CI/CD aplicados a plataformas de datos.Programación adicional en Scala o Java.Certificaciones cloud (Azure, AQS, GCP) o en tecnologías del ecosistema data.Nivel de inglés medio-alto para trabajar con documentación técnica y entornos internacionales.Qué Ofrecemos?Participación en proyectos innovadores de alto impacto.Trabajo con tecnologías punteras del ecosistema Data & Cloud.Entorno técnico altamente especializado.Plan de crecimiento y aprendizaje continuo.Cultura orientada a la innovación y mejora continua.Póliza de seguros y plan de retribución adaptable.#J-*****-Ljbffr

Requirements

Doctorado (PhD) en áreas relacionadas con: Ciencia de Datos, Estadística, Matemáticas, Física, Ingeniería Informática, Telecomunicaciones, Inteligencia Artificial, Big Data o disciplinas STEM relacionadas con el dato. Experiencia con: Azure, AWS o GCP, Databricks, Spark, Python, SQL avanzado. Diseño e implementación de pipelines ETL/ELT. Experiencia en arquitecturas: Data Lake, Data Warehouse, Lakehouse. Conocimientos de: Apache Iceberg / Delta Lake, Apache Airflow o herramientas similares de orquestación, Gobierno y Calidad del Dato, Data Lineage. Experiencia trabajando con bases de datos relacionales y NoSQL. Conocimientos de metodologías DataOps y automatización de pipelines. Experiencia en entornos Big Data y ecosistema Hadoop/Spark. Conocimientos básicos de privacidad y protección de datos (LOPD/RGPD). Valorable Experiencia en procesamiento en streaming y near real-time (Kafka, Flink, Kinesis) y familiaridad con arquitecturas orientadas a eventos tipo Lambda o Kappa. Experiencia en monitorización y optimización de pipelines cloud. Conocimientos de CI/CD aplicados a plataformas de datos. Programación adicional en Scala o Java. Certificaciones cloud (Azure, AQS, GCP) o en tecnologías del ecosistema data. Nivel de inglés medio-alto para trabajar con documentación técnica y entornos internacionales. Qué Ofrecemos? Participación en proyectos innovadores de alto impacto. Trabajo con tecnologías punteras del ecosistema Data & Cloud. Entorno técnico altamente especializado.

Benefits & conditions

Plan de crecimiento y aprendizaje continuo. Cultura orientada a la innovación y mejora continua. Póliza de seguros y plan de retribución adaptable. #J-*****-Ljbffr

Role details

Job location

Tech stack

Job description

Requirements

Benefits & conditions

Apply for this position

Good distractions

Moments

Videos View all