Ingénieur en intelligence artificielle
Role details
Job location
Tech stack
Job description
Le département IRSI (Infrastructures de Recherche et Systèmes d'Information) de l'Ifremer administre et fait évoluer les systèmes d'information scientifiques de l'institut. Ceux-ci couvrent un large spectre de domaines : programmes et dispositifs d'observation, géosciences marines, observation océanique (satellite et in situ), biodiversité marine, ainsi que les différents produits de la recherche.
Dans un contexte de science ouverte et de forte croissance des volumes de données, les enjeux majeurs sont :
- La production de [méta]données exploitables par les machines (machine-actionnable), permettant leur réutilisation automatisée par des services numériques et des intelligences artificielles ;
- Le renforcement de l'interopérabilité entre systèmes, formats et communautés ;
- Le développement de l'interdisciplinarité, en facilitant le croisement de données issues de domaines scientifiques variés.
- L'objectif est de passer d'une logique de silos de données à une logique de réseau de connaissances interconnectées, exploitable par les humains comme par les machines, afin de faciliter l'exploration, la compréhension et la valorisation des ressources scientifiques.
Quelles seront vos missions ?
Vous serez encadré par les équipes du centre de données et vous participerez aux activités suivantes :
- Modélisation et description sémantique des données à partir de standards existants
- Contribuer à la modélisation et à la structuration des référentiels et des données scientifiques
- S'appuyer en priorité sur des standards, modèles et référentiels existants (ex : SSN/SOSA)
- Les adapter et les enrichir si nécessaire pour répondre aux besoins métiers et scientifiques
- Interconnexion des données et des référentiels
- Contribuer au lien entre les différents silos thématiques de données
- Participer à la mise en relation des référentiels métiers, scientifiques et d'observation
- Explorer les approches basées sur les graphes de connaissances et les variables essentielles (Essential Variables)
- Exploration de l'IA générative en appui à l'exploitation de données structurées
- Explorer l'usage des modèles d'IA générative en amont (structuration, enrichissement) et en aval (recherche, exploration, restitution)
- Prototyper des usages permettant de faciliter la découverte, l'accès et l'exploitation des données scientifiques
- Évaluer l'apport de ces approches dans un cadre fondé sur des [méta]données structurées et interopérables
- Bonnes pratiques et interopérabilité
- Contribuer à la définition et à la diffusion des bonnes pratiques de modélisation et de gestion des données
- Favoriser l'interopérabilité entre systèmes en s'appuyant sur des standards reconnus
- Participer à une démarche de science ouverte et de données FAIR
Requirements
Vous recherchez un contrat d'apprentissage ou de professionnalisation pour l'obtention d'un Bac +5 (école d'ingénieur ou master 2 (alternance sur plusieurs années acceptée)).
Vous avez les compétences, connaissances et expériences suivantes :
- Techniques utilisées :
- Web sémantique (RDF, OWL, SPARQL)
- Modélisation de données et/ou graphes de connaissances
- IA générative et les modèles de langage (LLM)
- Développement en python
- Aptitude à travailler en équipe, Travailler sur des problématiques scientifiques et numériques à fort impact
- Manipuler des données riches, complexes et interdisciplinaires
- Explorer des technologies émergentes et structurantes (web sémantique, graphes, IA générative)
- Évoluer au sein d'un environnement collaboratif entre scientifiques, ingénieurs et experts SI