Développeur BI

L'ifremer Imagine
yesterday

Role details

Contract type
Apprenticeship
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
English, French
Experience level
Junior

Job location

Tech stack

Artificial Intelligence
Amazon Web Services (AWS)
Amazon Web Services (AWS)
Data analysis
Systems Engineering
Azure
Big Data
Cloud Computing
Information Systems
Relational Databases
Linux
DevOps
File Systems
R
Python
Machine Learning
Metadata
NetCDF
NoSQL
NumPy
TensorFlow
Software Engineering
Solution Deployment Descriptor
Web Services
Parquet
Data Processing
Google Cloud Platform
PyTorch
Large Language Models
Spark
Julia
Jupyter
Gitlab
Scikit Learn
Kubernetes
Information Technology
Dask
Operational Systems
Data Management
Slurm
Machine Learning Operations
Docker

Job description

Le département IRSI est en charge des systèmes d'information - de gestion et de recherche - de l'Ifremer. A ce titre, il assure des services et réalise des projets dans le but de développer, programmer et renouveler l'ensemble des ressources informatiques, matérielles et logicielles, nécessaires :

  • Au fonctionnement général de l'Institut, à sa communication, interne et externe, et à la sécurité de ses systèmes d'information ;
  • A la mise en oeuvre des infrastructures de recherche dont l'Institut a la responsabilité ;
  • A la gestion des données et informations scientifiques que l'Institut acquiert, rassemble, analyse ou diffuse en tant qu'institut national de référence en sciences et technologies marines.

Le département IRSI opère le centre Datarmor, centre de calcul et de traitement de données dédié à l'océan, offrant des équipements à l'état de l'art, notamment en matière d'intelligence artificielle, à la communauté scientifique de l'Ifremer et à ses partenaires.

Le poste est rattaché au service Ingénierie des Systèmes d'Information (ISI), qui est chargé de la conception, du développement et du déploiement des Systèmes d'Information Scientifiques de l'Ifremer, en relation constante avec les équipes internes et partenariales utilisatrices de ces systèmes. Ces Systèmes d'Information gèrent des données variées, observées à bord des navires de la flotte océanographique, mesurées par des satellites et par systèmes d'observation autonomes ou issues de travaux de laboratoires.

Le volume de ces données est en forte croissance et nécessite pour leur gestion, leur traitement et leur analyse, la mise en oeuvre de technologies et d'infrastructures informatiques de pointe : base de données relationnelles et non relationnelles, « big data », calcul intensif, processeurs spécialisés, ... D'autre part, ces analyses s'inscrivent dans un contexte de partenariats en France, en Europe et à l'International qui requiert une complète interopérabilité des systèmes de l'Ifremer avec ceux de nos homologues, obtenue par la mise en oeuvre de technologies d'échange et de traitement de données de type Cloud.

Le poste s'inscrit dans le cadre du thème prioritaire Ifremer "Construire des scénarios numériques d'évolution de l'océan" (CSNEO). Il s'agit de contribuer à la mise en oeuvre de jumeaux numériques de l'océan, en lien avec les partenaires nationaux et européens tels que le DTO Edito (Digital Twin of the Ocean).

Quelle sera votre mission ?

Vous aurez pour mission principale d'accompagner la mise en place de démonstrateurs et de solutions « centrées sur les données » en réponse à des questions posées par les équipes scientifiques. Vous vous appuierez sur votre expertise en technologies d'intelligence artificielle et de big data pour concevoir et préparer les outils les plus adaptés aux cas d'usage à traiter et préparer les données de façon optimale.

Ces missions seront menées dans le cadre d'une collaboration renforcée avec les laboratoires scientifiques de l'institut et en collaboration avec nos homologues français, européens et internationaux.

Quelles seront vos activités ?

Vous aurez pour activités principales :

  • Conception et déploiement de solutions IA/data
  • Concevoir, implémenter et optimiser les solutions techniques (bibliothèques Machine Learning, géostatistiques, visualisation, cartographie) adaptées aux besoins scientifiques et aux données océanographiques,
  • Préparer et structurer les données pour des traitements efficaces sur les infrastructures HPC/Cloud,
  • Contribuer à l'entraînement des modèles, y compris des modèles de fondation et réseaux de neurones profonds appliqués aux données géophysiques spatio-temporelles,
  • Intégration et industrialisation
  • Contribuer à la définition et l'amélioration des plateformes d'analyse de données,
  • Assurer l'industrialisation et l'intégration des solutions dans le cadre des démonstrateurs (approche DevOps),
  • Support, animation et partenariats
  • Assurer information, formation et support aux analystes de données (conseils, notebooks d'exemple, documentation, wiki),
  • Contribuer au montage de projets de recherche communs avec les équipes IRSI et les laboratoires scientifiques.
  • Participer à l'animation et au développement des pratiques et des compétences IA au sein de l'institut.

Vous pourrez être amené à coordonner des acteurs internes ou des sous-traitants pour mener à bien l'ensemble de ces activités.

Cette liste est non exhaustive et est susceptible d'évoluer selon les besoins de l'Institut.

Avec qui travaillerez-vous ?

En interne :

  • Les analystes de données des laboratoires Ifremer,
  • Le service IRSI/RIC, gestionnaire des infrastructures informatiques,
  • Le service IRSI/SISMER, chargé de l'exploitation des systèmes d'informations scientifiques et de la gestion des données marines.

En externe :

  • Les partenaires français (INRIA, CNRS, ...), européens et internationaux de l'Ifremer, et notamment les collègues en charge des plateformes équivalentes (par exemple au sein des Agences spatiales, ...),
  • Les partenaires de l'Infrastructure de Recherche Data Terra dédiée à la gestion et l'analyse des données environnementales terrestres,
  • Les sociétés de service en informatique contractualisées
  • Les partenaires technologiques.

Requirements

Diplôme d'ingénieur ou Master/PhD en informatique, data science, ou domaine connexe.

  • Une première expérience dans les domaines techniques cités ci-dessous sera appréciée.
  • Des formations techniques complémentaires pourront être envisagées.

Vous avez les compétences, connaissances et expériences suivantes :

  • Informatique générale : système Linux, bases de données relationnelles, ...
  • Expertise en développement et intégration de solutions d'intelligence artificielle et d'analyse de données,
  • Très bonne connaissance des technologies logicielles associées : langages de programmation (Python, Julia, R, ...), bibliothèques (numPy, cartoPy, Scikit-learn, Tensorflow, Pytorch...), notebooks et plateformes associées (Jupyter, Onyxia),
  • Expérience avérée de la démarche DevOps : plateforme de développement logiciel (GitLab, ...), conteneurisation des applications (Docker, Singularity, ...), ordonnancement et orchestration (Slurm, Kubernetes),
  • Connaissance des technologies permettant un accès efficace à des données volumineuses : systèmes de fichiers adaptés (S3, OneData), bases NoSQL, formats de fichiers adaptés (Parquet), plateformes de distribution de traitements (Dask, Spark), ...
  • Connaissance des infrastructures matérielles adaptées de type HPC/HPDA, notamment mise en oeuvre de processeurs graphiques (GPU) dans un contexte d'analyse de données et/ou de machine learning,
  • Connaissance de l'architecture et de l'interopérabilité des systèmes d'information : métadonnées, webservices, sémantique, ...
  • Maîtrise des pratiques MLOps : versionnement des modèles et des données (MLflow, DVC), pipelines d'entraînement automatisés, monitoring de modèles en production,

Compétences supplémentaires (atouts) :

  • Connaissance des approches de modélisation par apprentissage profond et des grands modèles de langage (LLM) : fine-tuning, RAG, inférence sur GPU ; familiarité avec les tendances IA fondation appliquées aux données géophysiques,
  • Connaissance des environnements Cloud (AWS, GCP, Azure ou équivalent) et des standards d'accès aux données océanographiques (OGC, ERDDAP, Zarr, NetCDF, STAC),

Vous avez les qualités suivantes :

  • Aptitude à travailler en équipe dans des contextes variés (avec les scientifiques au sein des laboratoires, avec les analystes de données, avec les partenaires et les prestataires de service),
  • Bonnes capacités relationnelles et rédactionnelles en français et en anglais,
  • Sens du service,
  • Rigueur,
  • Fort intérêt pour l'observation et les données environnementales (dont les données marines),
  • Intérêt pour les valeurs portées par l'Ifremer (développement de la connaissance de l'océan, développement durable)., * Python
  • Langages de programmation

About the company

Brest emplois Les missions du poste Rejoignez l'Ifremer pour un océan mieux compris, mieux protégé qui demeure un allié du bien-vivre sur la planète Des abysses à la surface, de la côte au large, l'Ifremer est l'institut de recherche français entièrement dédié à l'Océan. Ses équipes mènent des recherches, innovent et produisent des expertises pour protéger l'océan, exploiter ses ressources de manière responsable et partager les données marines. L'Ifremer apporte son expertise scientifique pour éclairer les politiques publiques et élabore des solutions puisées dans l'océan pour répondre aux enjeux de la transition écologique. Opérateur de la Flotte océanographique française avec sa filiale d'armement Genavir, l'Ifremer imagine, conçoit et déploie des moyens technologiques de pointe pour percer les mystères de l'océan. Rejoignez nos équipes, composées de 1500 scientifiques et métiers supports à la recherche, et présentes sur tout le littoral métropolitain et en Outre-mer., Bioinformatique Développement de Pipelines pour l'Analyse Données H/F

Apply for this position