Expert Big Data Hadoop (F/H)

Collective
Canton of Pessac-2, France
2 days ago

Role details

Contract type
Temporary contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Senior

Job location

Canton of Pessac-2, France

Tech stack

Bash
Big Data
Cloudera Impala
Databases
ETL
IBM InfoSphere DataStage
Linux
Hadoop
Hadoop Distributed File System
Hive
IBM InfoSphere (ETL Tools)
Python
PostgreSQL
Red Hat Enterprise Linux - RHEL
Power BI
Software Tools
Ansible
Prometheus
Standard Sql
Cloudera
SAS (Software)
SQL Databases
Data Streaming
Teradata
Apache Zookeeper
Scripting (Bash/Python/Go/Ruby)
Data Server Interface
Apache Yarn
Cloudera Manager
Grafana
Spark
Kubernetes
Kafka
Operational Systems
VMware

Job description

L'équipe 'Socles Data' de la Direction Technique Informatique s'occupe de gérer les socles techniques DATA du système d'information de l'Organisation. Ceux-ci répondent aux besoins de pilotage, de mise à disposition de tableaux de bord décisionnels, d'exploration de données, de Data science, etc. Les missions de l'équipe se traduisent par la fourniture d'outils logiciels Data industrialisés et exploitables, la rédaction de dossiers d'architecture, de normes et bonnes pratiques, la réalisation d'études, la recherche et la qualification de nouveaux outils, mais également l'administration et le maintien en conditions opérationnelles des socles DATA., * Assurer le maintien en conditions opérationnelles des socles Hadoop Cloudera Hors-Prod et Prod.

  • Participer aux projets d'évolution technique des socles Hadoop.
  • Administration et exploitation des socles Hadoop : supervision, optimisation, gestion des incidents et des performances.
  • Capacity planning : suivi et mise en place d'outils et procédures.
  • Maintenance proactive : application des correctifs, mises à jour, suivi des évolutions technologiques.
  • Rédaction de procédures d'administration et d'exploitation.
  • Intégration avec l'outillage de l'écosystème DSI de l'organisation pour l'exploitation du SI.
  • Support expertise aux équipes Études et exploitation.
  • Projets d'évolution des architectures techniques (évolutions logicielles et matérielles, sécurité, amélioration de l'existant, évolution des fonctionnalités techniques ou fonctionnelles) : pilotage, définition d'architecture, rédaction des dossiers, mise en œuvre.
  • Participation à des astreintes ou interventions ponctuelles en heures non ouvrées (HNO).

Environnement technique - technologique

Environnement Socle Hadoop :

  • Distribution Hadoop Cloudera CDP (version 7.1.9, 7.3.x) : HDFS, YARN, Cloudera Manager, Hive, Hue, Impala, Spark, Zeppelin, Ranger, Knox, Zookeeper, Iceberg...
  • Langages de scripting et de développement : Shell, Python, Spark
  • Moteurs de requêtage : Hive, Impala, SQL
  • Système d'exploitation : Linux Redhat

Environnement Décisionnel :

  • Teradata, ETL Datastage, PowerBI, SAS

Autres environnements techniques :

  • Base de données : PostgreSQL
  • Data Streaming : Kafka, IBM Infosphere CdC
  • Socle technique infrastructure : Kubernetes, Ansible, Linux RedHat, Vmware
  • Exploitation : ordonnanceur IWS, sauvegarde HDPS, supervision Prometheus / Grafana

Livrables attendus & Délais associés

  • Reporting hebdomadaire
  • Tableau de bord mensuel de suivi d'activités
  • Documentations techniques : normes, principes, dossier d'architecture, dossier d'administration, dossier d'exploitation, modes opératoires (au cours de la prestation)
  • Transferts de connaissances : organisation de sessions et rédaction de supports (au cours de la prestation)
  • Gestion des demandes : tickets incidents / demandes / changements dûment complétés (au cours de la prestation)
  • Contribution à la continuité de services au sein de l'équipe (au cours de la prestation)

Requirements

  • Maîtrise de la distribution Hadoop : HDFS, YARN, Cloudera Manager, Hive, Hue, Impala, Spark, Zeppelin, Ranger, Knox, SQL, Zookeeper, Iceberg

  • Compétences en langages de scripting et de développement : Shell, Python, Spark

  • Expérience avec les moteurs de requêtage : Hive, Impala, SQL

  • Connaissances en infrastructure et système d'exploitation : Linux, Kubernetes, Ansible

  • Connaissance des outils connexes : ETL Datastage, Power-BI, SAS, Teradata, PostgreSQL, Data streaming

  • Capacités rédactionnelles : documentation technique, cahier des charges, communication et compte-rendu

  • Communication et capacités relationnelles : sens de l'écoute et du dialogue, conduite de réunion, négociation

  • Autonomie

  • Capacité à travailler en équipe

  • Esprit d'analyse et de synthèse

Benefits & conditions

Durée et localisation

  • Durée globale du besoin : 24 à 30 mois

Apply for this position