représentation structurée de la connaissance
Role details
Job location
Tech stack
Job description
Traitement de Trajectoires Sémantiques par des Réseaux de Neurones de Graphes (GNN) // Processing Semantic Trajectories using Graph Neural Networks (GNNs), Graphes de Connaissances spatio-temporels, Réseaux de Neurones de Graphes (GNN), Trajectoires Sémantiques, Prédiction de nœuds et de liens dans les graphes, Classification de graphes, Enrichissement sémantique Spatio-temporal knowledge graphs , Graph neural networks (GNNs), Semantic Trajectories, Node and Link Prediction in Graphs, Graph Classification, Semantic Enrichment, Le concept de trajectoire sémantique désigne l'ensemble des informations qui permettent de décrire la trajectoire d'un objet. Si les trajectoires sémantiques font majoritairement référence aux déplacements et activités d'objets mobiles (piétons, animaux, voitures, bateaux, avions…), elles sont plus généralement un moyen de représenter l'évolution dans le temps et l'espace de tout type d'être, objet ou phénomène. L'équipe STORIES du LIG mène des recherches sur 2 types particuliers de trajectoire sémantique : les trajectoires de vie des individus et les trajectoires des territoires. Les premières, alimentées par des données d'enquêtes biographiques, permettent d'analyser l'évolution des pratiques et des aspirations individuelles et collectives au sein d'une population ou société. Les secondes mobilisent différents types d'indicateurs et permettent aux aménageurs du territoire, élus et citoyens de mieux connaitre l'évolution dans le temps de leur commune. À ce jour, STORIES a conçu deux modèles de représentation dédiés respectivement aux trajectoires de vie des individus et aux trajectoires de territoire. Les graphes de connaissances (KG), en tant que représentation structurée de la connaissance, sont le formalisme privilégié pour implémenter ces deux modèles et stocker les données des trajectoires sémantiques. Dans un KG, les nœuds représentent des entités ou littéraux, les arêtes les relations liant les entités. Les KG intègrent également des classes et des propriétés d'ontologies de domaine. Une ontologie est une représentation formelle et structurée des concepts, relations et règles associé à un domaine particulier. Les KG sont le plus souvent décrits par des triplets RDF. On distingue les KG temporels (TKG) qui associent à chaque fait une période de validité, les KG spatiaux (SKG) qui contiennent des coordonnées spatiales et/ou des relations topologiques. En ce sens, les KG représentant des trajectoires sémantiques sont des KG à la fois temporels et spatiaux (STKG). Les Réseaux de Neurones de Graphes (GNN) sont des modèles d'apprentissage profond qui permettent de traiter, notamment, les données des KG. Le principe central est la propagation de messages : chaque nœud met à jour sa représentation vectorielle en agrégeant l'information provenant de ses voisins. Ainsi, les GNN apprennent des représentations vectorielles (embeddings) des nœuds et des relations, en tenant compte de la structure du graphe. Ils sont utilisés pour diverses tâches sur des KG : la complétion de graphes, la classification des nœuds, … Parmi les GNN, les GNN spatio-temporels combinent un module spatial et un module temporel et sont capables de réaliser de la prévision spatio-temporelle, de la détection d'événements ou de la simulation dynamique. Utilisés dans divers domaines (transports, environnement, santé, …), leur conception et l'interprétation de leurs résultats se heurtent encore à des défis majeurs : le couplage de l'espace et du temps, la gestion de KG volumineux, la découverte de corrélations non locales, les échelles multiples dans le temps et l'espace… Cependant, aucun des GNN spatio-temporels existants ne traite de STKG représentant des trajectoires sémantique. À ce titre, la thèse proposée constitue un travail original et exploratoire qui consiste à concevoir, implémenter, tester et rendre performants des GNN spatio-temporels afin d'enrichir et d'analyser des données de trajectoires sémantiques. Deux jeux de données disponibles serviront de cas d'étude : les données d'enquêtes biographiques menées par l'INED, et les données décrivant sur 40 ans les trajectoires environnementales de communes françaises et suisses. On développera une approche neuro-symbolique consistant à coupler le GNN avec un LMM et à intégrer, dans le processus d'apprentissage du modèle, des règles apprises par le LLM afin d'améliorer les résultats et leur explicabilité. Enfin, on cherchera à généraliser l'approche proposée à d'autres types de trajectoires sémantiques.
Requirements
Ce sujet s'adresse à une personne motivée, diplômée d'un master en informatique ou sciences des données. Des compétences solides en apprentissage automatique, de bonnes connaissances en Machine Learning (plus particulièrement en Deep Learning et réseaux de neurones) sont attendues, ainsi qu'une bonne maîtrise des techniques de développement de code et des bibliothèques généralistes et spécialisées (en Python). Une expérience en matière de publication scientifique serait un plus appréciable, ainsi qu'une première expérience en matière de développement de réseaux de neurones, et particulièrement de GNN. Enfin, un réel intérêt pour les données SHS ou/et environnementales est souhaité. This PhD topic is aimed at a motivated individual with a Master's degree in Computer Science or Data Science. Strong skills in machine learning, a good understanding of machine learning (particularly deep learning and neural networks) are required, as well as a solid grasp of coding techniques and general-purpose and specialised libraries (in Python). Experience in scientific publishing would be a significant advantage, as would initial experience in developing neural networks, particularly GNNs. Finally, a genuine interest in social sciences and humanities (SSH) and/or environmental data is desirable.
Benefits & conditions
Début de la thèse : 01/10/2026 WEB : http://lig-stories.imag.fr/
Nature du financement
Précisions sur le financement
Concours allocations
Présentation établissement et labo d'accueil
Université Grenoble Alpes
Etablissement délivrant le doctorat
Université Grenoble Alpes
Ecole doctorale
217 MSTII - Mathématiques, Sciences et technologies de l'information, Informatique