Thèses soutenues 2024
Pierre Jacquet, Améliorer la sur-allocation des ressources pour une meilleure consolidation des IaaS ►
Améliorer la sur-allocation des ressources pour une meilleure consolidation des IaaS
Auteur : Pierre Jacquet
Mots-clés : CloudGridVirtualisationSurallocation
Résumé
En migrant sa charge de travail vers des centres de données plus grands, le numérique a pu améliorer son efficacité énergétique. La consommation liée à l’augmentation des usages a ainsi été atténuée par de nettes améliorations de l’infrastructure mutualisée (appelée communément Cloud Computing), ce qui est visible via des indicateurs tels que le Power Usage Efficiency (PUE). L’infrastructure n’est cependant pas le seul point à optimiser. Le serveur en lui même, et les tâches qu’il exécute, reste un axe important de la recherche. Le taux d’usage est notamment particulièrement étudié car sa valeur relativement faible représente un gain potentiel non-négligeable. Ainsi, d’un point de vue énergétique (consommation) et matériel (coût environnemental et financier), l’utilisation d’un serveur chargé à 100% est préférable à celle de 3 serveurs chargés à 30%. Je propose donc d’étudier ces taux d’usages au travers de quatre contributions complémentaires: 1) La création d’expériences contrôlées réalistes dans un contexte Infrastructure-as-a-Service (IaaS). Alors que les plateformes supportant les infrastructures Cloud sont particulièrement étudiées, la génération de charges de travail réalistes est primordiale. Chaque Cloud provider ayant ses propres caractéristiques (distribution de tailles de Virtual Machines (VMs), taux d’usage individuels), nous proposons un outil permettant de générer ces charges réalistes. 2) L’amélioration du calcul du taux de surréservation individuel des serveurs. En tenant en compte de la stabilité individuelle des serveurs, il est possible d’affiner le calcul de ce taux sans causer de violations supplémentaires. 3) L’introduction d’un nouveau paradigme de surréservation. En démontrant tout d’abord que les vCPUs des VMs ne sont pas uniformément utilisés en conditions réelles, nous exposons aux VMs des coeurs de différentes puissances (car surréservés à différents niveaux) et démontrons que ce paradigme peut améliorer les performances globales. 4) La complémentarité des taux de surréservation pour réduire les ressources non-allouées. La comparaison des VMs dites premium et des VMs surréservées permet d’identifier qu’elles tendent à saturer différemment les ressources de leur hôtes. En les hébergeant sur les mêmes serveurs, il est ainsi possible de bénéficier de synergies, et de réduire jusqu’à 9.6% la taille du parc.
Date de soutenance : 19-07-2024
Président du jury : Thomas Ledoux
Jury :
- Pascal Felber (Rapporteur)
- Gaël Thomas (Rapporteur)
- Laurent Lefevre (Examinateur)
- Anne-Cécile Orgerie [Président]
- Thomas Ledoux
- Romain Rouvoy
Ramiz Gindullin, Apprentissage de modèles à contraintes concis à partir de données sans erreurs : études sur l’acquisition d’équations arithmétiques booléennes et de modèles d’ordonnancement à court terme ►
Apprentissage de modèles à contraintes concis à partir de données sans erreurs : études sur l’acquisition d’équations arithmétiques booléennes et de modèles d’ordonnancement à court terme
Auteur : Ramiz Gindullin
Mots-clés : Programmation par contraintesAcquisition de modelesLimites nettes
Résumé
Utilisant la programmation logique par contrainte, l'objectif de cette thèse est de développer plusieurs techniques d'acquisition de contraintes pour les situations où nous disposons de données sans erreur. De telles situations rendent la majorité des techniques de ML inutilisables et de nouvelles approches sont nécessaires. Les techniques d'acquisition de contraintes proposées sont appliquées à deux cas d'utilisation : la recherche de nouvelles conjectures de limites fortes pour huit objets combinatoires et l'acquisition de contraintes à partir d'un calendrier de production à court terme unique et valide. Les contributions de la thèse comprennent (i) un modèle de contrainte pour acquérir des expressions booléennes-arithmétiques à partir de données, (ii) une base de données générée automatiquement de contraintes anti-réécriture qui empêchent la génération d'équations booléennes-arithmétiques simplifiables, (iii) un certain nombre de techniques de synthèse de formules qui peuvent acquérir une formule unique combinant plusieurs biais d'apprentissage, (iv) l'acquisition d'une variété de contraintes d'ordonnancement telles que les contraintes temporelles, de ressources, de calendrier et d'équipes, et dans ce dernier cas (v) la génération d'un modèle d'ordonnancement MiniZinc.
Date de soutenance : 25-03-2024
Président du jury : Nicolas Beldiceanu
Jury :
- François Clautiaux [Président]
- Nadjib Lazaar [Rapporteur]
- Jean-Charles Régin [Rapporteur]
Adrien Gauché, Stratégies d'optimisation à l'aide d'un contrôle par commande prédictive de microréseaux avec stockage d'énergie hybride batteries/hydrogène ►
Stratégies d'optimisation à l'aide d'un contrôle par commande prédictive de microréseaux avec stockage d'énergie hybride batteries/hydrogène
Auteur : Adrien Gauché
Mots-clés : Planification des stockagesGestion de l’énergieEngagement des unitésMicroréseau électriqueStockage hydrogèneRéseau îlotéÉnergies renouvelablesGénération solaire
Résumé
Cette thèse propose d’améliorer le contrôle prédictif des microréseaux avec générations renouvelables et stockage hybridebatterie-hydrogène. L’objectif est de trouver une planification des stockages applicable à toutes les stations PowiDian, en dépassant les limitations de l’optimiseur actuel. La première contribution est une formulation générique de microréseaux avec stockage. Ensuite, des optimiseurs "boîte noire" sont intégrés et comparés dans l’Energy Management System (EMS) pour planifier la puissance de l’électrolyseur et de la pile à combustible sur l’horizon d’une journée. La formulation et ses différents optimiseurs sont évalués avec des données réelles sur une année entière. La seconde contribution montre que le choix du meilleur optimiseur repose sur la charge de calcul, car la pertinence de la commande et le coût évalué de la fonction objectif sont similaires quel que soit l’optimiseur. Enfin, la thèse propose une formulation linéaire en nombres entiers d’Unit Commitment issu des grands réseaux électriques adaptée au stockage hydrogène. L’objectif est de garantir l’optimalité, de réduire la complexité de calcul et d’intégrer des méthodes classiques (gestion de l’incertain, temps de fonctionnement...).
Date de soutenance : 06-03-2024
Président du jury : Malek Ghanes
Jury :
- Hervé Guéguen [Président]
- Nezha Maamri-Trigeassou [Rapporteur]
- Maurice Fadel [Rapporteur]
- David Morin
Gwenaël Samain, Algorithme de branch-and-bound pour la résolution efficace de problèmes d’optimisation parcimonieuse ►
Algorithme de branch-and-bound pour la résolution efficace de problèmes d’optimisation parcimonieuse
Auteur : Gwenaël Samain
Mots-clés : Branch-and-boundL0Optimisation combinatoireOptimisation continue
Résumé
De nombreux problèmes inverses en traitement du signal, statistique, imagerie biomédicale, astronomie et apprentissage machinepeuvent se formuler comme la recherche de la meilleure combinaison de motifs expliquant les données, ces motifs étant choisis dans un catalogue connu. L’aspect parcimonieux du problème réside dans le faible nombre de motifs que l’on cherche à sélectionner via l’utilisation d’un terme `0. Plusieurs méthodes standards, telles que des algorithmes gloutons (OMP, OLS) et des reformulations convexes du problème (notamment en norme `1), permettent d’obtenir des solutions approchées de ce problème `0. Plus récemment, des méthodes permettant de résoudre exactement le problème `0 ont été développées, reposant sur des algorithmes de branch-and-bound. L’objectif de cette thèse est double. D’une part, explorer les possibilités d’accélérations des algorithmes branch-and-bound `0. D’autre part, étendre ces méthodes à des cas de parcimonie structurée, où l’on ne cherche plus simplement un faible nombre de motifs, mais un faible nombre de groupes demotifs. Ces contributions font l’objet d’un code open-source proposé au plus grand nombre.
Date de soutenance : 08-02-2024
Président du jury : Sébastien Bourguignon
Jury :
- Xavier Gandibleux [Président]
- Nelly Pustelnik [Rapporteur]
- Charles Soussen [Rapporteur]
- Joseph Salmon
- Emmanuel Soubies
Angelica Ginnante, Conception, analyse et contrôle cinématique optimisées de bras robotiques sériel hautement redondants ►
Conception, analyse et contrôle cinématique optimisées de bras robotiques sériel hautement redondants
Auteur : Angelica Ginnante
Mots-clés : Redondance cinématiquePriorité des tâchesPerformance cinétostatiqueOptimisation de la conceptionAnalyse de l’espace de travail
Résumé
L’utilisation de manipulateurs robotiques dans l’industrie s’est développée au cours des dernières décennies afin d’améliorer et d’accélérer les processus industriels. Les manipulateurs industriels ont commencé à être étudiés pour les tâches d’usinage car ils peuvent couvrir de plus grands espaces de travail, ce qui augmente la gamme d’opérations réalisables et améliore la flexibilité. La société Nimbl’Bot a mis au point un nouveau mécanisme, ou module, pour construire des robots modulaires en série plus rigides et plus flexibles pour les applications d’usinage. Ce manipulateur est un robot redondant cinématique à 21 degrés de liberté. Cette thèse analyse en profondeur les caractéristiques du robot Nimbl’Bot et est divisée en trois sujets principaux. Le premier sujet concerne l’utilisation d’un algorithme de résolution de redondance cinématique prioritaire pour la trajectoire de suivi du robot Nimbl’Bot tout en optimisant ses performances cinétostatiques. Le deuxième sujet est l’optimisation de la conception d’un robot à redondance cinématique en fonction d’une applicationsouhaitée et de ses performances cinétostatiques. Pour le troisième sujet, un nouvel algorithme de détermination de l’espace de travail est proposé pour les manipulateurs redondants cinématiques. Plusieurs tests de simulation sont proposés et testés sur quelques conceptions de robots Nimbl’Bot pour chaque sujet.
Date de soutenance : 17-01-2024
Président du jury : Stéphane Caro
Jury :
- Philippe Wenger [Président]
- Lucia Pallottino [Rapporteur]
- David Daney [Rapporteur]
- Giorgio Cannata
Adrien Bazoge, TALMed : Traitement Automatique de la Langue Médicale ►
Mots-clés : TAL cliniqueModèles de langue pré-entrainésEntrepôts de données de santé
Résumé
La collecte massive de données de santé a permis l’émergence d’usages secondaires, notamment la recherche et l’évaluation de la qualité des soins. Pour une utilisation optimale, ces données doivent être harmonisées et stockées dans des entrepôts de données de santé (EDS), souvent sous forme textuelle. Le traitement automatique des langues (TAL) est alors nécessaire pour en extraire des informations à grande échelle. Les méthodes actuelles de TAL s’appuient principalement sur des modèles de langue basés sur l’architecture Transformer, qui nécessitent d’être adaptés au domaine médical pour tirer profit du potentiel de ces modèles. Dans cette thèse, nous explorons deux thématiques : l’adaptation de ces modèles au contexte médical français et leur application en recherche clinique. Premièrement, nous menons plusieurs études d’adaptation au domaine médical de différents modèles pré-entraînés existants. Ces études ont pour but d’évaluer l’impact de différents paramètres pour l’adaptation des modèles, comme la nature des données ou la stratégie de pré-entraînement. Enfin, l’utilisation de ces modèles est étudiée dans deux projets de re- cherche clinique. Le projet GAVROCHE examine la relation entre la variabilité glycémique et la mortalité chez les patients atteints d’in- suffisance cardiaque aiguë. Le second projet vise à extraire des déterminants sociaux de santé à partir des comptes rendus cliniques. Ces cas montrent le potentiel du TAL pour ex- traire des informations cliniques cruciales.
Date de soutenance : 16-01-2024
Président du jury : Emmanuel Morin
Jury :
- Gayo Diallo [Président]
- Laure Soulier [Rapporteur]
- Didier Schwab [Rapporteur]
Elmokhtar Mohamed Moussa, Conversion d’écriture hors-ligne en écriture en-ligne et réseaux de neurones profonds ►
Conversion d’écriture hors-ligne en écriture en-ligne et réseaux de neurones profonds
Auteur : Elmokhtar Mohamed Moussa
Mots-clés : Écriture manuscriteCNNTransformer
Résumé
Cette thèse se focalise sur la conversion d’images statiques d’écriture hors- ligne en signaux temporels d’écriture en-ligne. L’objectif est d’étendre l’approche à réseau de neurone au-delà des images de lettres isolées ainsi que de les généraliser à d’autres types de contenus plus complexes. La thèse explore deux approches neuronales distinctes, la première approche est un réseau de neurones convolutif entièrement convolutif multitâche UNet basé sur la méthode de [ZYT18]. Cette approche a démontré des bons résultats de squelettisation mais en revanche une extraction de trait problé- matique. En raison des limitations de modélisation temporelle intrinsèque à l’architecture CNN. La deuxième approche s’appuie sur le modèle de squelettisation précédent pour ex- traire les sous-traits et propose une modélisation au niveau sous-traits avec deux Tranformers : un encodeur de sous-trait (SET) et un décodeur pour ordonner les sous-traits (SORT) à l’aide de leur vecteur descripteur ainsi que la prédiction de lever de stylo. Cette approche surpasse l’état de l’art sur les bases de données de mots, phrases et d’équations mathématiques et a permis de surmonter plusieurs limitations relevées dans la littérature. Ces avancées ont permis d’étendre la portée de la conversion d’image d’écriture hors- ligne vers l’écriture en-ligne pour inclure des phrases entières de texte et d’aborder un type de contenu complexe tel que les équations mathématiques
Date de soutenance : 16-01-2024
Président du jury : Harold Mouchère
Jury :
- Éric Anquetil [Rapporteur]
- Laurence Likforman-Sulem [Rapporteur]
- Andreas Fischer
- Clément Chatelain