THEOREM

Théorie pour des modèles génératifs plus performants

Aperçu

Vers une meilleure compréhension des modèles génératifs afin de guider leur ajustement, leur spécialisation et leur équité, grâce à un cadre mathématique unifié fondé sur le contrôle optimal stochastique.

Alain Oliviero Durmus, Professeur, Ecole polytechnique

Les modèles génératifs ont transformé la génération d’images, de textes ou de structures scientifiques, mais leur conception reste souvent empirique et difficile à contrôler.
Le projet THEOREM propose de « repartir des fondations » en développant un cadre mathématique unifié pour expliquer ce qui fait la performance de ces modèles, et ce qui cause leurs échecs (instabilité, biais, mémorisation, manque de robustesse).
L’objectif est de traduire des recettes pratiques (schedules, pas de temps, choix d’objectifs) en principes de conception, avec des garanties de stabilité et de précision.
Le projet vise aussi à mieux comprendre comment adapter un modèle à une tâche ou un domaine (spécialisation), tout en surveillant la fiabilité et l’équité.
Enfin, il s’agit de passer d’une IA générative « artisanale » à une IA générative plus auditable et responsable.

Mots clefs : modèles génératifs, diffusion models, normalizing flows, energy-based models, contrôle optimal stochastique, stabilité, convergence, fine-tuning, spécialisation, robustesse, équité/fairness, incertitude, biais, IA pour les sciences.

Les missions

Nos recherches

Unifier les modèles génératifs dans un langage commun

Proposer un cadre théorique qui relie diffusion et flows via une formulation en contrôle optimal stochastique, afin de comparer, expliquer et combiner les approches de façon cohérente

Transformer l’heuristique en méthode

Dériver des règles de conception pour les choix clés (objectifs d’entraînement, schedules, discrétisation, solveurs) et établir des critères pratiques pour guider le réglage fin (fine-tuning).

Garantir et diagnostiquer la fiabilité

Développer des outils d’analyse et des garanties (stabilité, erreurs, sensibilité) pour comprendre quand un modèle déraille, pourquoi, et comment le corriger de manière robuste.

Rendre la spécialisation plus sûre et plus efficace

Etudier des stratégies de spécialisation (adaptation à un domaine, à un type de données, à une contrainte physique) tout en contrôlant la généralisation, l’incertitude et les risques de surapprentissage/mémorisation.

Mettre l’équité au cœur de l’ingénierie générative

Analyser comment les biais apparaissent et se propagent dans l’entraînement et l’échantillonnage, et proposer des mécanismes de régularisation/diagnostic pour améliorer la fairness sans sacrifier la qualité.

Le consortium

Université Clermont Auvergne, Université Paris Dauphine, Ecole Polytechnique de Paris

Les attendus scientifiques

Les impacts sociétaux

Développement de compétences

Publications

Autres projets

Géné-Pi

Mathématiques des modèles génératifs

MacLeOD

Apprentissage machine sur geometries et distributions

MadLearning

Mathématiques de l'apprentissage profond : De la théorie aux applications

MAGICALL

Mathématiques des modèles génératifs: une analyse interdisciplinaire des paysages de fonctions de perte

PERSNET

Structures PERsistantes dans les Réseaux Neuronaux

PRODIGE-AI

PRObability, ranDom matrIx theory, Geometry and gEneralization for generative-AI

TENSOR4ML

Méthodes TENSORielles pour maîtriser l'apprentissage automatique moderne

Appel à chaires Attractivités

Le Programme de recherche PEPR IA ouvre son appel à chaires Attractivité, à destination de chercheurs juniors et seniors, avec pour principal critère un excellent parcours en recherche dans les thèmes du PEPR IA.

NNawaQ

NNawaQ (Neural Network Adequate Hardware Architecture for Quantization)

Package Python Keops

Package Python Keops pour les calculs tensoriels en (très) grande dimension (projet PDE-AI)

MPTorch

MPTorch, framework d’encapsulation construit sur PyTorch

FloPoCo

FloPoCo (Floating-Point Cores), générateur de noyaux arithmétiques majoritairement pour les FPGA (projet HOLIGRAIL)

CaBRNeT

CaBRNeT, une bibliothèque pour le développement et l'évaluation de modèles de raisonnement basé sur des cas simplifiés (projet SAIF)

SNN Software

SNN Software, un outil open-source pour le design SNN (projet EMERGENCES)

SDOT

SDOT, logiciel pour le transport optimal semi-discret

Lazylinop

Lazylinop (Lazy Linear Operator), un opérateur linéaire paresseux de haut niveau basé en Python (projet SHARP)

CAISAR

CAISAR, une plateforme de caractérisation de la sécurité et de l’intelligence artificielle robuste (projet SAIF)

P16

P16 ou développer, diffuser et maintenir un ensemble de bibliothèques souveraines pour l'IA

AIDGE

AIDGE ou la plateforme ouverte de développement en embarqué du projet DEEPGREEN

Jean-Zay

Jean Zay ou l'infrastructure nationale pour la communauté de recherche en IA

ADAPTING

Architectures adaptatives pour l'intelligence artificielle embarquée

Appels à chaire Choose France – CNRS AI Rising Talents (appel clos)

Appels à chaire Choose France - CNRS AI Rising Talents

Bourse CEA AI Rising Talents

Le programme CEA AI Rising Talents, vous offre une formidable opportunité de concrétiser vos idées et de diriger votre propre projet de recherche au bénéfice de l’industrie et de la société.