LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications

Loria - Laboratoire Lorrain

Canton de Nancy-2, France

5 days ago

Role details

Contract type

Permanent contract

Employment type

Full-time (> 32 hours)

Working hours

Regular working hours

Languages

French

Job location

Canton de Nancy-2, France

Tech stack

Artificial Intelligence

Computer Vision

Computer Security

Computational Linguistics

Information Extraction

Python

Natural Language Processing

Prolog

TensorFlow

Software Engineering

Apache Yarn

PyTorch

Large Language Models

GIT

Information Technology

Document Classification

Job description

Établissement : Université de Lorraine École doctorale : IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES Laboratoire de recherche : LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications, Ces dernières années ont connu des avancées rapides en traitement automatique du langage naturel, les grands modèles de langage (LLM) atteignant des performances de pointe et étant de plus en plus utilisés dans des applications critiques. Malgré leur fluidité et leur capacité de généralisation, ces modèles présentent des incohérences systématiques, soulevant des inquiétudes quant à leur fiabilité, leur robustesse et leur vulnérabilité à des usages détournés ou à des comportements inattendus dans des contextes sensibles.

Les méthodes d'évaluation actuelles privilégient la précision des tâches, mais offrent peu d'informations sur la cohérence interne des modèles ou leur résistance aux perturbations. Ce projet de doctorat étudie dans quelle mesure des représentations sémantiques formelles peuvent servir à évaluer, surveiller et améliorer la cohérence des LLM, en mettant l'accent sur la cohérence logique comme élément clé d'un comportement robuste et sûr.

En mobilisant des outils de sémantique formelle et de logique, l'objectif est de développer des méthodes rigoureuses pour détecter les vulnérabilités liées aux incohérences et concevoir des systèmes vérifiables et débogables. À long terme, il s'agit de contribuer à des modèles dont le comportement peut être formellement caractérisé et contraint, afin d'en améliorer la fiabilité dans divers contextes et langues.

La cohérence des LLM est définie comme la capacité à produire des décisions non contradictoires. Elle inclut des dimensions sémantiques, factuelles et logiques (négation, symétrie, transitivité, additivité). Si les deux premières ont été largement étudiées, la cohérence logique reste peu explorée formellement.

Les approches actuelles reposent surtout sur des benchmarks ou sur la vérification de raisonnements intermédiaires via des outils externes. Elles présentent des limites : dépendance aux tâches, absence de garanties formelles générales et focalisation sur des textes courts. Le raisonnement sur des textes longs ou au niveau du discours demeure donc peu étudié, alors même que de nombreuses erreurs réelles proviennent d'incohérences à l'échelle du document. Par ailleurs, les travaux se concentrent principalement sur l'anglais.

Ce projet propose de dépasser ces limites grâce à des approches formelles et symboliques. Un objectif central est d'exploiter le formalisme sémantique YARN comme représentation intermédiaire du sens, et d'étudier sa conversion en formes logiques adaptées à la vérification. Les axes incluent : (i) la définition de contraintes logiques pour détecter les incohérences, y compris dans les textes longs ; (ii) des stratégies de vérification et de correction symboliques ; (iii) l'exploration de formalismes logiques plus riches et d'extensions multilingues.

Le projet défend également l'idée que des représentations sémantiques précises peuvent être implémentées dans des modèles plus petits et spécialisés, limitant le recours à des architectures massives. Enfin, l'impact environnemental sera pris en compte, en intégrant coût computationnel et consommation énergétique, dans une perspective d'IA durable.

The Lorraine Research Laboratory in Computer Science and its Applications (LORIA) is a joint research unit affiliated with the University of Lorraine, CNRS, and Inria. It is one of the largest computer science research laboratories in France, with internationally recognized expertise in fields such as artificial intelligence, natural language processing, computer vision, data science, software engineering, and cybersecurity. LORIA conducts both fundamental and applied research, and is actively involved in national and international scientific collaborations. It provides a stimulating interdisciplinary environment for doctoral research, combining strong theoretical foundations with real-world applications. The Sémagramme team at LORIA focuses on research in natural language processing (NLP) and computational linguistics, with a particular emphasis on semantic representation and interpretation of texts. Its main research topics include lexical and distributional semantics, semantic parsing, and the exploitation of large-scale textual data. The team develops models and methods for analyzing meaning in language, addressing tasks such as information extraction, text classification, and semantic similarity. Sémagramme combines linguistic knowledge with formal and statistical approaches, and contributes to both theoretical advances in semantics and practical NLP applications. The PhD candidate will be integrated into a dynamic research team composed of permanent researchers and other doctoral students, providing a stimulating and collaborative scientific environment. The candidate will be enrolled in the IAEM Doctoral School, where they will be required to follow dedicated training courses aimed at developing both scientific and transferable skills. They will actively participate in the scientific life of the team through regular meetings and seminars, and will contribute to the broader research community by submitting scientific papers and presenting their work at national and international conferences. In addition, the candidate will be expected to undertake teaching activities for students in natural language processing and computer science, contributing to academic training and knowledge dissemination.

Requirements

Ce sujet de doctorat requiert un ensemble de compétences combinant expertise en traitement automatique du langage naturel (NLP) et en apprentissage automatique, avec des connaissances en sémantique formelle et en raisonnement logique. Les compétences clés incluent la manipulation de représentations sémantiques, la conception et l'évaluation de contraintes logiques, l'analyse du comportement et des modes de défaillance des LLM, ainsi que la mise en oeuvre de pipelines expérimentaux intégrant analyse symbolique et modèles neuronaux. De solides capacités d'analyse, une autonomie en recherche et une expérience avec des données multilingues ou cross-lingues sont essentielles pour traiter les questions de robustesse et de cohérence dans des contextes réalistes.Compétences techniques : Python, PyTorch / TensorFlow, formalismes logiques et solveurs (par ex. Prolog, Z3, solveurs SAT/SMT), traitement et annotation de texte, manipulation de grands corpus, recherche reproductible (Git, suivi des expériences).Durabilité : principes de Green AI / IA durable, mesure des coûts computationnels et de la consommation énergétique, IA responsable / sécurité de l'IA, interprétabilité et explicabilité.Compétences en recherche : rédaction scientifique, conception expérimentale, lecture critique de la littérature, analyse statistique, présentation en conférence. ","identifier":{"@type":"PropertyValue","name":"Université de Lorraine","value":"456ffc79537ddc9417f38200816b60a9"},"url":"https://www.hellowork.com/fr-fr/emplois/77212789.html","datePosted":"2026-03-24T20:36:36Z","directApply":false,"educationRequirements":{"@type":"EducationalOccupationalCredential","credentialCategory":"postgraduate degree"},"employmentType":["TEMPORARY","FULL_TIME"],"experienceRequirements":"no requirements","hiringOrganization":{"@type":"Organization","name":"Université de Lorraine"},"industry":"Service public d'état","jobLocation":{"@type":"Place","address":{"@type":"PostalAddress","addressCountry":"FR","addressRegion":"Champagne-Ardenne"}},"occupationalCategory":"Mode","qualifications":"Ce sujet de doctorat requiert un ensemble de compétences combinant expertise en traitement automatique du langage naturel (NLP) et en apprentissage automatique, avec des connaissances en sémantique formelle et en raisonnement logique. Les compétences clés incluent la manipulation de représentations sémantiques, la conception et l'évaluation de contraintes logiques, l'analyse du comportement et des modes de défaillance des LLM, ainsi que la mise en oeuvre de pipelines expérimentaux intégrant analyse symbolique et modèles neuronaux. De solides capacités d'analyse, une autonomie en recherche et une expérience avec des données multilingues ou cross-lingues sont essentielles pour traiter les questions de robustesse et de cohérence dans des contextes réalistes.

Compétences techniques : Python, PyTorch / TensorFlow, formalismes logiques et solveurs (par ex. Prolog, Z3, solveurs SAT/SMT), traitement et annotation de texte, manipulation de grands corpus, recherche reproductible (Git, suivi des expériences).

Durabilité : principes de Green AI / IA durable, mesure des coûts computationnels et de la consommation énergétique, IA responsable / sécurité de l'IA, interprétabilité et explicabilité.

Compétences en recherche : rédaction scientifique, conception expérimentale, lecture critique de la littérature, analyse statistique, présentation en