MAGICALL

Mathématiques des modèles génératifs: une analyse interdisciplinaire des paysages de fonctions de perte

Aperçu

MAGICALL est un projet de recherche théorique visant à comprendre en profondeur les modèles génératifs modernes et l’inférence variationnelle, en combinant mathématiques, physique statistique et optimisation.

Giulio Biroli, professeur, Ecole normale supérieure (ENS-PSL) – Laboratoire de Physique de l’ENS (LPENS)

Le projet MAGICALL s’intéresse aux fondements théoriques des modèles génératifs modernes, tels que les modèles de diffusion et l’inférence variationnelle. Il vise à analyser les paysages de fonctions de perte, les dynamiques d’apprentissage et les propriétés de généralisation dans des contextes de grande dimension. En utilisant des outils issus de la physique statistique, de la statistique et de l’optimisation, le projet vise à fournir des cadres théoriques sur l’efficacité, la stabilité et la fiabilité de ces méthodes.

Mots clefs : Generative models, Loss landscapes, Diffusion

Les missions

Nos recherches

Comprendre les mécanismes de généralisation des modèles de diffusion

Le projet analysera théoriquement la transition entre mémorisation et généralisation à l’aide de modèles probabilistes contrôlés (mélanges gaussiens, structures hiérarchiques), en étudiant l’impact de la taille des données, de la dimension et des dynamiques d’apprentissage.

Analyser les dynamiques d’apprentissage et la géométrie des paysages de perte

Des outils issus de la physique statistique et de l’optimisation seront utilisés pour caractériser les paysages de fonctions de perte des modèles génératifs et relier leur structure aux propriétés de convergence, de stabilité et de performance des algorithmes d’entraînement.

Caractériser la formation des structures de données au cours de l’apprentissage

Le projet étudiera comment les structures latentes des données (modes, hiérarchies, sous-espaces pertinents) émergent progressivement durant l’entraînement des modèles génératifs, en reliant ces phénomènes aux échelles de temps de l’optimisation et à la complexité des données.

Analyser et développer des méthodes pour limiter le phénomène de “mode collapse”

Des stratégies basées sur des chemins de distributions guidés, l’annealing et la sur-paramétrisation seront étudiées théoriquement et numériquement afin d’identifier des conditions garantissant une exploration robuste de distributions multimodales.

Structurer et animer une communauté interdisciplinaire autour des mathématiques de l’IA générative

Le projet organisera séminaires, groupes de travail PEPR IA, collaborations internationales et une école d’été, afin de favoriser les échanges entre mathématiciens, physiciens et chercheurs en apprentissage automatique.

Le consortium

École normale supérieure (ENS-PSL), CNRS

Les attendus scientifiques

Les impacts sociétaux

Développement de compétences

Publications

Autres projets

Géné-Pi

Mathématiques des modèles génératifs

MacLeOD

Apprentissage machine sur geometries et distributions

MadLearning

Mathématiques de l'apprentissage profond : De la théorie aux applications

PERSNET

Structures PERsistantes dans les Réseaux Neuronaux

PRODIGE-AI

PRObability, ranDom matrIx theory, Geometry and gEneralization for generative-AI

TENSOR4ML

Méthodes TENSORielles pour maîtriser l'apprentissage automatique moderne

THEOREM

Théorie pour des modèles génératifs plus performants

Appel à chaires Attractivités

Le Programme de recherche PEPR IA ouvre son appel à chaires Attractivité, à destination de chercheurs juniors et seniors, avec pour principal critère un excellent parcours en recherche dans les thèmes du PEPR IA.

NNawaQ

NNawaQ (Neural Network Adequate Hardware Architecture for Quantization)

Package Python Keops

Package Python Keops pour les calculs tensoriels en (très) grande dimension (projet PDE-AI)

MPTorch

MPTorch, framework d’encapsulation construit sur PyTorch

FloPoCo

FloPoCo (Floating-Point Cores), générateur de noyaux arithmétiques majoritairement pour les FPGA (projet HOLIGRAIL)

CaBRNeT

CaBRNeT, une bibliothèque pour le développement et l'évaluation de modèles de raisonnement basé sur des cas simplifiés (projet SAIF)

SNN Software

SNN Software, un outil open-source pour le design SNN (projet EMERGENCES)

SDOT

SDOT, logiciel pour le transport optimal semi-discret

Lazylinop

Lazylinop (Lazy Linear Operator), un opérateur linéaire paresseux de haut niveau basé en Python (projet SHARP)

CAISAR

CAISAR, une plateforme de caractérisation de la sécurité et de l’intelligence artificielle robuste (projet SAIF)

P16

P16 ou développer, diffuser et maintenir un ensemble de bibliothèques souveraines pour l'IA

AIDGE

AIDGE ou la plateforme ouverte de développement en embarqué du projet DEEPGREEN

Jean-Zay

Jean Zay ou l'infrastructure nationale pour la communauté de recherche en IA

ADAPTING

Architectures adaptatives pour l'intelligence artificielle embarquée

Appels à chaire Choose France – CNRS AI Rising Talents (appel clos)

Appels à chaire Choose France - CNRS AI Rising Talents

Bourse CEA AI Rising Talents

Le programme CEA AI Rising Talents, vous offre une formidable opportunité de concrétiser vos idées et de diriger votre propre projet de recherche au bénéfice de l’industrie et de la société.