Expert Big Data Hadoop (F/H)

Collective

Canton of Pessac-2, France

2 days ago

Role details

Contract type

Temporary contract

Employment type

Full-time (> 32 hours)

Working hours

Regular working hours

Languages

French

Experience level

Senior

Job location

Canton of Pessac-2, France

Tech stack

Bash

Big Data

Cloudera Impala

Databases

ETL

IBM InfoSphere DataStage

Linux

Hadoop

Hadoop Distributed File System

Hive

IBM InfoSphere (ETL Tools)

Python

PostgreSQL

Red Hat Enterprise Linux - RHEL

Power BI

Software Tools

Ansible

Prometheus

Standard Sql

Cloudera

SAS (Software)

SQL Databases

Data Streaming

Teradata

Apache Zookeeper

Scripting (Bash/Python/Go/Ruby)

Data Server Interface

Apache Yarn

Cloudera Manager

Grafana

Spark

Kubernetes

Kafka

Operational Systems

VMware

Job description

L'équipe 'Socles Data' de la Direction Technique Informatique s'occupe de gérer les socles techniques DATA du système d'information de l'Organisation. Ceux-ci répondent aux besoins de pilotage, de mise à disposition de tableaux de bord décisionnels, d'exploration de données, de Data science, etc. Les missions de l'équipe se traduisent par la fourniture d'outils logiciels Data industrialisés et exploitables, la rédaction de dossiers d'architecture, de normes et bonnes pratiques, la réalisation d'études, la recherche et la qualification de nouveaux outils, mais également l'administration et le maintien en conditions opérationnelles des socles DATA., * Assurer le maintien en conditions opérationnelles des socles Hadoop Cloudera Hors-Prod et Prod.

Participer aux projets d'évolution technique des socles Hadoop.
Administration et exploitation des socles Hadoop : supervision, optimisation, gestion des incidents et des performances.
Capacity planning : suivi et mise en place d'outils et procédures.
Maintenance proactive : application des correctifs, mises à jour, suivi des évolutions technologiques.
Rédaction de procédures d'administration et d'exploitation.
Intégration avec l'outillage de l'écosystème DSI de l'organisation pour l'exploitation du SI.
Support expertise aux équipes Études et exploitation.
Projets d'évolution des architectures techniques (évolutions logicielles et matérielles, sécurité, amélioration de l'existant, évolution des fonctionnalités techniques ou fonctionnelles) : pilotage, définition d'architecture, rédaction des dossiers, mise en œuvre.
Participation à des astreintes ou interventions ponctuelles en heures non ouvrées (HNO).

Environnement technique - technologique

Environnement Socle Hadoop :

Distribution Hadoop Cloudera CDP (version 7.1.9, 7.3.x) : HDFS, YARN, Cloudera Manager, Hive, Hue, Impala, Spark, Zeppelin, Ranger, Knox, Zookeeper, Iceberg...
Langages de scripting et de développement : Shell, Python, Spark
Moteurs de requêtage : Hive, Impala, SQL
Système d'exploitation : Linux Redhat

Environnement Décisionnel :

Teradata, ETL Datastage, PowerBI, SAS

Autres environnements techniques :

Base de données : PostgreSQL
Data Streaming : Kafka, IBM Infosphere CdC
Socle technique infrastructure : Kubernetes, Ansible, Linux RedHat, Vmware
Exploitation : ordonnanceur IWS, sauvegarde HDPS, supervision Prometheus / Grafana

Livrables attendus & Délais associés

Reporting hebdomadaire
Tableau de bord mensuel de suivi d'activités
Documentations techniques : normes, principes, dossier d'architecture, dossier d'administration, dossier d'exploitation, modes opératoires (au cours de la prestation)
Transferts de connaissances : organisation de sessions et rédaction de supports (au cours de la prestation)
Gestion des demandes : tickets incidents / demandes / changements dûment complétés (au cours de la prestation)
Contribution à la continuité de services au sein de l'équipe (au cours de la prestation)

Requirements

Maîtrise de la distribution Hadoop : HDFS, YARN, Cloudera Manager, Hive, Hue, Impala, Spark, Zeppelin, Ranger, Knox, SQL, Zookeeper, Iceberg
Compétences en langages de scripting et de développement : Shell, Python, Spark
Expérience avec les moteurs de requêtage : Hive, Impala, SQL
Connaissances en infrastructure et système d'exploitation : Linux, Kubernetes, Ansible
Connaissance des outils connexes : ETL Datastage, Power-BI, SAS, Teradata, PostgreSQL, Data streaming
Capacités rédactionnelles : documentation technique, cahier des charges, communication et compte-rendu
Communication et capacités relationnelles : sens de l'écoute et du dialogue, conduite de réunion, négociation
Autonomie
Capacité à travailler en équipe
Esprit d'analyse et de synthèse

Benefits & conditions

Durée et localisation

Durée globale du besoin : 24 à 30 mois

Role details

Job location

Tech stack

Job description

Requirements

Benefits & conditions

Apply for this position

Good distractions

Moments

Videos View all