CDD - Ingénieur en Developpement et Intégration de Systèmes d'Information Scientifiques H/F
Role details
Job location
Tech stack
Job description
Le département IRSI (Infrastructures de Recherche et Systèmes d'Information) est en charge des systèmes d'information - de gestion et de recherche - de l'Ifremer. A ce titre, il assure des services et réalise des projets dans le but de développer, programmer et renouveler l'ensemble des ressources informatiques, matérielles et logicielles, nécessaires :
- Au fonctionnement général de l'Institut, à sa communication, interne et externe, et à la sécurité de ses systèmes d'information ;
- A la mise en oeuvre des infrastructures de recherche dont l'Institut a la responsabilité ;
- A la gestion des données et informations scientifiques que l'Institut acquiert, rassemble, analyse ou diffuse en tant qu'institut national de référence en sciences et technologies marines.
Au sein du département IRSI, le service Ingénierie des Systèmes d'Information (ISI) est chargé de la conception, du développement et du déploiement des Systèmes d'Information Scientifiques de l'Ifremer, dont le CERSAT traitant des données de satellites multi-missions. D'une manière générale, les SI comprennent les fonctions suivantes : collecte des données, contrôle qualité, bancarisation, archivage pérenne, traitement, enrichissement et accès à l'information. Ces SI sont opérés par le service Systèmes d'Informations Scientifiques pour le Mer (SISMER).
Quelle sera votre mission ?
Au sein du service IRSI/ISI, vous contribuez au volet numérique du SI Cersat en lien avec les besoins métiers exprimés par la maitrise d'ouvrage, mais aussi en lien avec les équipes en charge des infrastructures dont le centre Datarmor.
Cette mission s'inscrit notamment dans la phase de jouvence du centre Datarmor (ex : passage de PBS à SLURM) impliquant une migration des chaînes de traitements vers la solution Apache Airflow. Dans la démarche et la volonté de modernisation des pratiques (ex : data driven, data lineage) et d'industrialisation de la production régulière et systématique (ex : indexation des données via STAC, suivi de la production).
Quelles seront vos activités ?
- Contribuer à porter les chaînes de traitements vers Apache Airflow
- Factoriser les besoins communs dans des modules réutilisables
- Fournir des recette permettant de conteneuriser (Docker, Appatainer) des scripts/traitements/processeurs utilisés dans les chaînes de traitements
- Évaluer et généraliser l'usage de pixi pour gérer le cycle de vie des logiciels (ex : dépendances python et conda, gestion des versions, ...)
- Développer des pipelines CI/CD via gitlab
- Simplifier l'indexation (STAC), visualisation (Syntool), ... des produits de données
- Déployer et évaluer des solutions techniques (ex : data lineage, observabilité, reporting, ...)
Votre champ relationnel,
En interne :
- Les équipes au sein du service ISI en charge de la maîtrise d'oeuvre informatique (MOE) des SI et du service RIC en charge des infrastructures informatiques mises en oeuvre par les SI
- L'ingénieur référent opérationnalisation des SI au sein du SISMER
- Les responsables SISMER des SI satellites et In Situ
- Les membres du SISMER et en particulier du pôle d'activité données océanographie opérationnelle
- Les équipes scientifiques du LOPS responsables des chaînes de traitement des données satellite
En externe :
- Prestataires des marchés d'exploitation du SI satellite ou de support scientifique sur les chaînes de traitement
- Partenaires des SI satellite, à la fois les donneurs d'ordre institutionnels sur les missions satellite (CNES, ESA, ...) et les équipes scientifiques des laboratoires responsables des chaînes de traitement des données satellite (CESBIO, ...)
Requirements
Vous êtes ingénieur issu d'une grande école ou diplômé d'une formation universitaire de niveau Bac +5. Une première expérience sera appréciée mais les débutants sont également acceptés.
La connaissance des données marines et la recherche océanographique seront un plus.
Vous avez les compétences, connaissances et expériences suivantes :
- Compétence avérée de travail en environnement Linux
- Compétences avérées en programmation Python
- Compétences avérées en conteneurisation (Docker / Apptainer) et appréciées en plateformes d'orchestration (K8s / OpenShift)
- Travail dans un contexte DevOps / GitOps (gitlab / gitlab pipelines, etc.)
- Des connaissances minimales en télédétection seront appréciées
- Les connaissances techniques suivantes sont des plus :
- Formats de données : NetCDF, geoparquet, Zarr
- Bases de données relationnelles (PostgreSQL) et NoSQL (ElasticSearch)
- Outils de supervision : Prometheus, Grafana
- Anglais écrit et oral
Vous avez les qualités suivantes :
- Autonomie technique, sens de l'écoute
- Bonne organisation, capacité rédactionnelle (documenter)
- Dynamisme et force de proposition
- Très bonnes qualités relationnelles
- Capacité et goût du travail en équipe, * Python