ALTERNANCE - Data Scientist - Deep Learning et innovation géospatiale - H/F

COLLECTE LOCALISATION SATELLITES
Canton of Toulouse-11, France
2 days ago

Role details

Contract type
Apprenticeship
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Junior

Job location

Canton of Toulouse-11, France

Tech stack

Geographic Information Systems
Artificial Intelligence
Human-Computer Interaction
Python
Machine Learning
Language Modeling
NumPy
PyTorch
Deep Learning
Pandas
Matplotlib
Scikit Learn

Job description

Les modèles de fondation géospatiaux représentent une avancée majeure dans l'exploitation de données spatiales à grande échelle. Pré-entraînés sur des données massives et souvent multi-modales, ils permettent de créer des représentations riches et générales (les embeddings), de généraliser plus facilement sur différents territoires. Ces technologies visent à démocratiser l'utilisation des données d'Observation de la Terre (EO), rendant l'analyse avancée accessible sans expertise spécialisée en apprentissage automatique ou en SIG L'objectif de l'alternance est de concevoir un prototype d'exploration de donnée géospatiales en utilisant les embeddings, afin d'évaluer la maturité, les difficultés et ls opportunités liées à cette nouvelle modalité dans les différentes métiers géospatiaux de CLS. Vous serez amené(e) à : Réaliser une étude bibliographique et pratique des approches des derniers modèles de fondation géospatiaux (Clay, AEF, Tessera...) et des Vision Language Models, tels que SkyCLIP, RemoteCLIP, DescribeEarth,... Cadrer des premiers cas d'usage avec l'équipe Datalab et les équipes métier de CLS, parmi : La détection de changement sémantique : comparer les vecteurs dans le temps pour déterminer la nature du changement en langage naturel (par exemple, une forêt transformée en champ de culture) L'interrogation d'images EO : permet de rechercher des images satellites et leurs géolocalisations en utilisant des requêtes textuelles complexes. La recherche de similarité : permet de rechercher des images satellites ou de la recherche de similarité sémantique. L'intégration de ces modèles fondations et embeddings dans des workflow agentiques, afin de fournir une interface conversationnelle à l'utilisateur. Concevoir, implémenter plusieurs prototypes de bout en bout, depuis l'ingestion des données jusqu'à une interface utilisateur. Evaluer les performances, limitations et axes d'améliorations Présenter et documenter vos travaux au sein de l'équipe Data et aux équipes métier.

Requirements

Etudiant(e) en école d'ingénieurs ou en Master avec une spécialisation en Data Science, Intelligence Artificielle, Machine Learning ou Mathématiques Appliquées, vous souhaitez mettre en application vos connaissances à travers des projets dans un domaine stimulant et porteur de sens. Compétences et connaissances souhaitées : · Solides bases en apprentissage automatique et profond (Machine Learning et Deep Learning) ; · Solides bases des langages et bibliothèques de data science, en particulier Python, scikit-learn, PyTorch, pandas, numpy, geopandas, matplotlib, etc. Qualités attendues : · Curiosité scientifique et goût pour l'expérimentation · Esprit analytique, rigueur, sens de l'organisation et autonomie · Bonnes capacités de communication écrite et orale pour présenter et valoriser vos résultats.

About the company

Au cœur des enjeux de la planète, CLS, Société à missions, filiale du CNES et de la CNP, est une société à mission internationale, pionnière dans la fourniture de solutions d'observation et de surveillance de la Terre. Opérateur historique des balises Argos, CLS, depuis 1986, avec plus de 1200 collaborateurs dans le monde, sur près de 41 sites dans 20 pays et un chiffre d'affaires annuel de près de 220 millions d'euros en 2025, figure parmi les spécialistes des services satellitaires en utilisant les technologies spatiales les plus avancées, couplées au génie logiciel et à la data-sciences. Vous souhaitez rejoindre des équipes agiles et dynamiques sur des projets innovants et ambitieux ? Explorer de nouvelles technologies ? Evoluer sur des projets transverses et variés autour des 5 secteurs d'activité de CLS ?, Le DataLab de CLS est une structure interne d'innovation transverse au sein du groupe CLS, constituée de data scientists, de développeurs et d'ingénieurs Big Data. Son objectif principal est de concevoir des produits pour enrichir et valoriser la donnée dans les solutions CLS et de développer les pratiques data/IA.

Apply for this position