'Scientific machine learning' multi-fidélité avec entrées hétérogènes // Multi-Fidelity Scientific Machine Learning with Heterogeneous Inputs

Institut Polytechnique de Paris

Canton de Palaiseau, France

2 days ago

Role details

Contract type

Permanent contract

Employment type

Full-time (> 32 hours)

Working hours

Regular working hours

Languages

French, English

Job location

Canton de Palaiseau, France

Tech stack

Computer Simulation

Data Structures

Python

Machine Learning

Scikit Learn

Variational Autoencoders

Job description

'Scientific machine learning' multi-fidélité avec entrées hétérogènes // Multi-Fidelity Scientific Machine Learning with Heterogeneous Inputs Mots clés multi-fidélité, Entrées hétérogènes, Scientific Machine Learning Multi-Fidelity , Heterogeneous Inputs, Scientific Machine Learning, De nombreux problèmes d'ingénierie et de sciences reposent sur des phénomènes physiques complexes, difficiles à reproduire expérimentalement, et pour lesquels les campagnes de mesure sont coûteuses. La simulation numérique est donc essentielle pour la prédiction, la conception et l'aide à la décision. Dans des applications multi-physiques, fortement couplées et paramétrées, une simulation haute fidélité du système complet est souvent trop coûteuse pour être répétée (optimisation, quantification d'incertitudes, calibration, contrôle). Un exemple illustratif est l'hémodynamique computationnelle : les simulations 3D instationnaires sur géométries artérielles patient-spécifiques nécessitent la résolution des équations de Navier-Stokes, couplées à l'élasticité des parois et à des conditions aux limites issues de données cliniques ; elles sont précises mais trop coûteuses pour des études paramétriques systématiques, d'où l'usage de modèles simplifiés (1D), réduits ou surrogats.

L'enjeu scientifique central est de combiner, de manière rigoureuse, l'information issue de modèles de fidélité différente pour obtenir la précision du modèle haute fidélité à coût réduit : c'est l'objectif des méthodes multi-fidélité. Toutefois, une limite importante reste insuffisamment traitée : la présence d'entrées et/ou de sorties hétérogènes entre modèles (paramétrisations différentes, discrétisations distinctes, variables d'état non partagées), qui empêche l'application directe des cadres multi-fidélité standards supposant un espace d'entrée commun et une correspondance point à point des sorties.

Cette thèse, financée par le projet MediTwin (jumeaux numériques patient-spécifiques en santé), vise à développer des méthodes multi-fidélité scalables capables de fusionner des modèles aux paramétrisations non concordantes et des structures de données hétérogènes. Le travail abordera : (i) la définition de représentations latentes communes reliant des espaces d'entrée hétérogènes ; (ii) la construction de surrogats multi-fidélité cohérents malgré ces hétérogénéités ; (iii) la quantification et la propagation des incertitudes dues au faible volume de données haute fidélité et aux erreurs d'alignement/embedding ; (iv) la conception de stratégies d'échantillonnage adaptatif (active learning) pour sélectionner efficacement les simulations haute fidélité. La méthodologie s'appuiera sur l'apprentissage de représentations (autoencodeurs/VAEs, Deep CCA), l'apprentissage d'opérateurs (DeepONet, Fourier Neural Operator), des approches probabilistes (co-krigeage en espace latent, modèles hybrides deep-probabilistes) et des techniques d'optimisation bayésienne pour le plan d'expériences.

Requirements

Many engineering and scientific problems involve complex physical phenomena that are difficult-and sometimes impossible-to reproduce experimentally, while experimental campaigns are costly in time and resources. Numerical simulation is therefore essential for prediction, design, and decision support. In modern multi-physics applications with strong couplings across scales and high-dimensional parameterizations, a single high-fidelity simulation is often too expensive to be run repeatedly for optimization, uncertainty quantification (UQ), calibration, or control. A representative example is computational hemodynamics: fully resolved simulations of blood flow in patient-specific arterial geometries require solving the three-dimensional, time-dependent Navier-Stokes equations, often coupled with vessel wall elasticity and boundary conditions inferred from clinical data. Although highly informative, such simulations are computationally intensive, which limits their use in large parametric studies; hence the need for simplified or surrogate models (e.g., 1D network models, reduced-order models, or data-driven surrogates).

The key scientific challenge is to combine information from models of different fidelity levels in a principled way to approach high-fidelity accuracy at reduced computational cost-this is the goal of multi-fidelity modeling. However, a major limitation remains insufficiently addressed: heterogeneous inputs and outputs across fidelities. In many applications, low- and high-fidelity models do not share the same parameterization, discretization, or state variables, which prevents the direct use of standard multi-fidelity frameworks that assume a common input space and pointwise correspondence of outputs.

This PhD, funded through the MediTwin project (patient-specific digital twins for medical applications), aims to develop scalable multi-fidelity methods capable of merging information from models with mismatched parameterizations and heterogeneous data structures. The research will investigate (i) how to define common latent representations linking heterogeneous input spaces across fidelities; (ii) how to build multi-fidelity surrogates that remain consistent under such heterogeneities; (iii) how to quantify and propagate uncertainty induced by limited high-fidelity data and representation mismatch; and (iv) how to design adaptive sampling strategies (active learning) to select expensive high-fidelity evaluations so as to maximize information gain. Methodologically, the work will draw on representation learning (autoencoders/VAEs, CCA/Deep CCA), operator learning (DeepONet, Fourier Neural Operator), probabilistic multi-fidelity modeling (latent-space co-kriging, deep probabilistic surrogates), and Bayesian optimization for adaptive experimental design., Candidat inscrit (ou issu) d'un Master en ingénierie, mathématiques appliquées ou discipline proche. Spécialisation souhaitée en machine learning, quantification d'incertitudes, optimisation ou domaines connexes. Intérêt/compétences en modélisation numérique, surrogats, méthodes probabilistes, et/ou apprentissage d'opérateurs (DeepONet/FNO) constituent un atout. Candidates should be enrolled in (or have completed) a Master's degree in engineering, applied mathematics, computational sciences, or a closely related discipline. A specialization and strong interest in machine learning, uncertainty quantification (UQ), optimization, or related fields is expected. Applicants should be motivated to work at the interface between multi-fidelity modeling and scientific machine learning, including topics such as representation learning (e.g., autoencoders/VAEs), cross-modal alignment, and operator learning (e.g., DeepONet, Fourier Neural Operator). Good programming skills (e.g., Python and standard scientific/ML libraries) and the ability to conduct independent research, analyze results critically, and communicate effectively in English are important assets.

Benefits & conditions

Début de la thèse : 01/10/2026

Nature du financement

Précisions sur le financement, Date limite de candidature 31/08/2026

About the company

'Scientific machine learning' multi-fidélité avec entrées hétérogènes // Multi-Fidelity Scientific Machine Learning with Heterogeneous Inputs, Financement d'autres établissements publics à caractère industriel et commercial (ADEME, ADIT , ANDRA, Bpifrance, BRGM., CIRAD, CNES, Universcience, CSTB., IFPEN, IFREMER, INERIS, IRSN)* Présentation établissement et labo d'accueil Institut Polytechnique de Paris École polytechnique Etablissement délivrant le doctorat Institut Polytechnique de Paris École polytechnique