Déploiement économe en énergie d'applications dans le continuum edge-réseau-cloud H/F
Role details
Job location
Tech stack
Job description
Le déploiement d'applications d'IA connaît un changement de paradigme avec l'avènement des réseaux 5G/6G, de l'Internet des Objets (IoT) et de l'informatique en périphérie (edge computing). Cette évolution permet de déployer des services à travers le continuum edge-réseau-cloud [1], en exploitant des ressources hétérogènes allant des appareils en périphérie (par exemple, smartphones, microcontrôleurs) aux centres de données dans le cloud [2, 3, 4]. Ce nouveau paradigme relève des défis critiques tels que la latence, la bande passante et l'efficacité énergétique, mais introduit également de nouvelles complexités en matière d'allocation des ressources, de déploiement des modèles et d'optimisation énergétique. Parallèlement, les modèles d'IA, en particulier les réseaux de neurones profonds, deviennent de plus en plus complexes, avec la consommation d'énergie et l'empreinte carbone qui émergent comme des préoccupations majeures. Par exemple, l'entraînement d'un seul grand modèle de langage peut émettre autant de CO que cinq voitures sur leur durée de vie, et les tâches d'inférence contribuent de manière significative à l'utilisation d'énergie. Le projet CARECloud (PEPR CLOUD) vise explicitement à réduire l'impact environnemental des infrastructures cloud, ce qui rend ce sujet de thèse hautement pertinent pour les objectifs de durabilité nationale et mondiale.
Objectifs Scientifiques
Cette thèse vise à développer de nouvelles méthodes pour déployer des applications d'IA dans le continuum edge-réseau-cloud, en mettant l'accent sur la réduction de la consommation d'énergie tout en maintenant les performances des modèles. La recherche abordera certains des défis suivants :
-
Stratégies de Déploiement Énergétiquement Aware
-
Compression de Modèles : Étudier des techniques telles que la quantification, l'élagage (pruning) et la distillation de connaissances pour réduire l'empreinte computationnelle et mémoire des modèles d'apprentissage profond sans sacrifier leur précision [7, 9, 13].
-
Systèmes en Cascade : Explorer des architectures à sortie anticipée (early-exit) et des inférences multi-étapes pour sélectionner dynamiquement le modèle le plus adapté (du plus léger au plus lourd) en fonction des contraintes en temps réel (par exemple, niveau de batterie, latence réseau) [10, 11].
-
Apprentissage Fédéré : Étudier l'apprentissage fédéré (FL) comme un moyen de distribuer l'entraînement et l'inférence des modèles d'IA à travers les appareils en périphérie, réduisant ainsi le besoin de centralisation des données et les coûts énergétiques associés au transfert de données et au calcul dans le cloud. Le FL permet d'entraîner les modèles localement sur les appareils, en ne communiquant que les mises à jour des modèles (et non les données brutes), améliorant ainsi l'efficacité énergétique et la confidentialité [14].
-
Planification Aware des Ressources : Concevoir des algorithmes pour optimiser le placement des tâches (edge vs. cloud) et les politiques de planification pour les charges de travail d'IA, en équilibrant latence, énergie et précision [13].
-
Compromis entre Efficacité et Performance
-
Analyse Quantitative : Mesurer la consommation d'énergie des charges de travail d'IA dans différents scénarios de déploiement (edge, réseau, cloud) et pour diverses techniques de compression de modèles.
-
Configurations Adaptatives : Développer des modèles ajustables qui peuvent être reconfigurés à la volée pour s'adapter à des contraintes environnementales et de ressources variables.
-
Impact Environnemental
-
Modélisation de l'Empreinte Carbone : Étendre les cadres existants pour estimer les émissions de CO des déploiements d'IA, en tenant compte à la fois de l'énergie de calcul et de l'énergie réseau.
-
Optimisation pour la Durabilité : Proposer des stratégies de déploiement d'IA "verte" qui minimisent l'utilisation d'énergie et les émissions de carbone, en ligne avec les objectifs du projet CARECloud.
Activités de Recherche
1 Analyser la consommation d'énergie des déploiements d'IA dans le continuum edge-réseau-cloud. 2 Concevoir des méthodes algorithmiques pour la planification énergétiquement efficace des charges de travail d'IA. 3 Étudier les compromis entre efficacité énergétique et précision des modèles dans les techniques de compression. 4 Développer des cadres de déploiement adaptatifs utilisant des systèmes en cascade et des modèles à sortie anticipée. 5 Évaluer l'impact environnemental des méthodes proposées à l'aide d'outils d'évaluation du cycle de vie., [14] Savazzi, S., Rampa, V., Kianoush, S., & Bennis, M. (2022). An energy and carbon footprint analysis of distributed and federated learning. IEEE Transactions on Green Communications and Networking, 7(1), 248-264.
Votre Environnement de Travail
La thèse sera faite au sein du projet CARECloud (Comprendre, Améliorer, Réduire les impacts Environnementaux du Cloud computing) du PEPR CLOUD. Le cloud computing et ses nombreuses déclinaisons offrent aux utilisateurs des capacités de calcul et de stockage considérables. La maturité des techniques de virtualisation a permis l'émergence d'infrastructures virtualisées complexes, capables de déployer et reconfigurer rapidement des ressources virtuelles et élastiques, dans des infrastructures de plus en plus distribuées. Cette gestion des ressources, transparente pour les utilisateurs, donne l'illusion d'un accès à des ressources flexibles, illimitées et quasiment immatérielles. Cependant, la consommation électrique de ces clouds est bien réelle et préoccupante, de même que leurs émissions globales de gaz à effet de serre (GES) et la consommation de matières premières critiques utilisées pour leur fabrication. Dans un contexte où les changements climatiques sont chaque année plus visibles et impressionnants, entraînant des conséquences graves à l'échelle mondiale pour les populations et pour la planète, tous les secteurs (transport, bâtiment, agriculture, industrie, etc.) doivent contribuer à l'effort de réduction des émissions de GES. Les clouds, malgré leur capacité à optimiser les processus des autres secteurs (transport, énergie, agriculture), n'échappent pas à ce constat : la pente croissante de leurs émissions de gaz à effet de serre doit s'inverser, sous peine de gommer leurs éventuels bénéfices dans les autres secteurs. C'est pourquoi le projet CARECloud vise à réduire drastiquement les impacts environnementaux des infrastructures de cloud.
Requirements
- Connaissances en apprentissage automatique, en particulier sur les réseaux de neurones, les graph neural networks (GNN) ou l'apprentissage fédéré.
- Solide background mathématique et algorithmique (optimisation, probabilités, algèbre linéaire).
- Expertise en programmation en Python, avec une expérience en PyTorch ou TensorFlow.
- Maîtrise des concepts de mise en réseau et d'informatique en périphérie (par exemple, MEC, IoT, 5G/6G).
- Compétences analytiques pour concevoir et évaluer des algorithmes d'optimisation.
- Maîtrise de l'anglais (essentielle pour la communication scientifique et la collaboration).
Benefits & conditions
2300,00 € bruts mensuels
Congés et RTT annuels
44 jours
Pratique et Indemnisation du TT
Pratique et indemnisation du TT
Transport
Prise en charge à 75% du coût et forfait mobilité durable jusqu'à 300€