
MacLeOD
Apprentissage machine sur geometries et distributions
Aperçu
Rémi Flamary, professeur, Ecole Polytechnique
Laetitia Chapel, professeure, Institut Agro Rennes-Angers
Le projet MacLeOD vise à unifier l’apprentissage profond géométrique et basé sur la distribution en tirant parti du transport optimal pour comparer et transformer des distributions de données complexes sur des espaces géométriques, en développant des algorithmes efficaces et des architectures novatrices.
Mots clefs : Distributions, Geometric Deep Learning, Optimal Transport, Manifold, Graphs
Les missions
Nos recherches
Modéliser des distributions de données complexes à l’aide de nouveaux problèmes de transport optimal
Les problèmes OT existants ne sont pas adaptés aux besoins des modèles ML modernes et nous avons besoin de nouvelles formulations OT capables de s’adapter aux aspects géométriques et distributionnels des données dans le DL (géométrique) moderne.
Rechercher des algorithmes efficaces pour le traitement de distributions à grande échelle sur des variétés.
L’utilisation de l’OT dans le ML, et en particulier dans les couches d’apprentissage profond, est souvent limitée par le coût computationnel du problème OT. Nous devons développer de nouveaux algorithmes capables de s’adapter à la taille des ensembles de données modernes, tels que les méthodes de projection aléatoire et de découpage.
Concevoir des architectures d’apprentissage profond codant des distributions sur des variétés.
Les modèles d’apprentissage profond, en particulier ceux qui traitent les distributions, sont souvent limités au traitement des données appartenant à un espace euclidien. Il existe donc un besoin pour de nouveaux cadres capables de traiter efficacement les données sur des variétés, des espaces riemanniens aux espaces métriques plus généraux.
Développer le domaine de l’apprentissage profond géométrique distributionnel pour la modélisation de graphes.
Des travaux récents ont démontré la puissance de la combinaison du GDL et de la représentation distributionnelle pour le traitement des graphes, mais il manque un cadre général permettant de modéliser les contraintes ou la dynamique à partir des graphes grâce à des distributions évolutives.
Utiliser les distributions de modèles/données pour analyser et interpréter les réseaux neuronaux profonds.
Les réseaux neuronaux profonds sont réputés difficiles à analyser, et la conception de nouvelles méthodes basées sur la théorie des opérateurs pour analyser la distribution et les opérateurs de distribution le long des couches permettra de mieux comprendre les modèles.
Le consortium
Ecole/Institut Polytechnique de Paris, Université de Bretagne Sud, Ecole Normale Supérieure, Inria
Le projet MacLeOD développera de nouveaux cadres, méthodes et algorithmes pour l’apprentissage profond sur des données complexes, avec un impact potentiel sur un large éventail d’applications. Plus précisément :
– Développer de nouvelles méthodologies pour le transport optimal pour l’apprentissage automatique sur des géométries et des objets complexes
– Jeter les bases de l’apprentissage profond distributionnel pour les graphes
– Concevoir des méthodes d’apprentissage profond dédiées aux distributions situées sur des variétés
– Remédier au goulot d’étranglement de la complexité du transport optimal en le mettant à l’échelle à l’aide de découpages et de projections aléatoires
Des logiciels open source seront développés afin de mettre nos méthodes à la disposition de la communauté et de favoriser la reproductibilité des recherches.
En développant des méthodes fondées sur les mathématiques et des algorithmes efficaces, il permet une analyse plus fidèle et plus robuste des données complexes, améliorant ainsi la qualité des systèmes d’apprentissage. Afin de garantir que des résultats qui aient un impact positif sur la société, le projet MacLeOD encoirage l’approche « Ethics by Design » (éthique dès la conception), minimisant ainsi les risques d’utilisation abusive de nos méthodes.
Une communauté de 2 chercheurs, enseignements chercheurs et 11 ingénieurs permanents, mobilisant en outre 6 doctorants, 2 post-doctorants et 1 ingénieur de recherche contractuel au fur et à mesure du projet.

Publications
Autres projets