Arquitecto/a de Datos Senior - Big Data | Barcelona | Híbrido
Beigar
Municipality of Madrid, Spain
4 days ago
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
SpanishJob location
Municipality of Madrid, Spain
Tech stack
Airflow
Big Data
Databases
Cron
Hadoop
Hadoop Distributed File System
HBase
Hive
Kerberos (Protocol)
NoSQL
Apache Oozie
SQL Databases
Data Streaming
Spark
Data Lake
Kubernetes
Collibra
Apache Flink
Sentry
Kafka
Job description
Importante multinacional del sector defensa busca incorporar un/a Big Data con experiencia en entornos Big Data on premise y arquitecturas distribuidas, para participar en proyectos tecnológicos de alta complejidad y entornos críticos., * Diseñar y mantener arquitecturas Big Data escalables y seguras en entornos on premise.
- Definir procesos de ingesta, transformación y almacenamiento masivo de datos.
- Supervisar el rendimiento, estabilidad y capacidad de plataformas distribuidas.
- Gestionar integración con sistemas corporativos tradicionales y entornos legacy.
- Implementar medidas de seguridad, auditoría y control de accesos en plataformas de datos.
- Documentar arquitecturas, flujos de datos e interfaces técnicas.
- Colaborar con equipos de infraestructura, seguridad y datos.
Requirements
- Orientación al rendimiento y estabilidad operativa.
- Pensamiento crítico y capacidad analítica.
- Comunicación clara y buena documentación técnica.
- Capacidad de coordinación con equipos multidisciplinares.
- Adaptabilidad en entornos híbridos y críticos., * Experiencia en ecosistemas Big Data on premise:
- Hadoop
- Spark
- Hive
- HDFS
- Kafka
- HBase
- Experiencia en diseño de arquitecturas distribuidas sobre clusters bare metal y virtualizados.
- Conocimientos en orquestación y automatización de procesos:
- Airflow
- Oozie
- NiFi
- Cron pipelines
- Nivel avanzado de SQL, modelado dimensional y bases de datos NoSQL.
- Experiencia en:
- planificación de capacidad
- escalado horizontal
- particionamiento y replicación
- Integración con ERPs, bases relacionales y sistemas legacy.
- Gestión de seguridad on premise:
- Kerberos
- Ranger / Sentry
- control de accesos
- auditoría
- cifrado
- Capacidad de documentación técnica.
Se valorará
- Experiencia en arquitecturas Lakehouse on premise:
- Delta Lake
- Iceberg
- Hudi
- Procesamiento en tiempo real:
- Kafka Streams
- Flink
- Storm
- Gobernanza del dato:
- Atlas
- Collibra
- Purview
- Optimización avanzada de clusters Spark/Hadoop.
- Conocimientos de Kubernetes y contenedores en entornos locales.
- Experiencia en entornos aislados o de alta seguridad.
- Experiencia en integración híbrida con cloud pública.