PDE-AI

Analyse numérique, contrôle optimal et transport optimal pour l’IA : nouvelles architectures pour l’apprentissage automatique

Aperçu

L’objet est le développement de méthodes d’analyse mathématique (analyse numérique, contrôle, transport optimal) pour l’étude et l’amélioration des systèmes d’intelligence artificielle, et le développement d’une IA rigoureuse et fiable pour l’analyse et la simulation numérique.

Antonin Chambolle, Directeur de recherche CNRS

L’objectif principal du projet PDE-AI est de soutenir la création d’un groupe de mathématiciens appliqués spécialisés dans les questions d’apprentissage automatique et de stimuler le croisement entre l’analyse mathématique, le contrôle optimal et le transport optimal, conduisant à de nouvelles architectures des modèles apprentissage automatique. Trois thématiques principales sont étudiées : un premier thème porte sur l’analyse des méthodes d’apprentissage, un second sur les nouvelles architectures profondes (où seront étudiées en particulier des architectures spécifiques pour la simulation numérique), et un dernier angle de recherche se concentrant sur les méthodes génératives et la diffusion d’un point de vue analytique.

Mots clefs : Analyse non-linéaire, équations aux dérivées partielles (EDP), analyse numérique, contrôle, optimisation, apprentissage automatique, réseaux de neurones

Site internet du projet : https://pde-ai.math.cnrs.fr/

Présentation du projet PDE-AI

Les missions

Nos recherches

Etudier et mieux comprendre la dynamique de l’entraînement des réseaux de neurones et les schémas d’optimisation par gradient descendant

Etudier les différents réseaux (par exemple, résiduels, transformers) vus comme des approximations d’Equations aux Dérivées Partielles (EDP) qui émergent en tant qu’équation de champ moyen pour les réseaux de neurones avec un grand nombre de neurones. Mieux comprendre la dynamique de l’apprentissage, basée sur des flots de gradient.

Concevoir de nouvelles architectures profondes, basées sur l’analyse des EDPs, y compris en développant/analysant les techniques d’IA pour la simulation et l’analyse numérique

Analyser les propriétés d’approximation et de stabilité des réseaux avec des techniques tirées de l’analyse des schémas de discrétisation des EDP, tout en développant l’usage de l’IA pour la simulation numérique.

Etudier les méthodes génératives et la diffusion d’un point de vue analytique en exploitant l’analogie avec les systèmes dynamiques et les équations aux dérivées partielles

Comprendre la capacité des réseaux génératifs à modéliser des distributions déconnectées ou multimodales, afin de définir des limites statistiques sur la distance de transport optimal vers la distribution cible. En complément des garanties théoriques, de nouvelles stratégies d’échantillonnage pourront être développées en se basant sur la théorie des flots de gradients pour des ensembles de particules, dans les métriques de transport optimal.

Le consortium

Université Paris Sciences et Lettres, Université Paris-Dauphine, CNRS, INRIA (Nice), Université Paris-Cité, Sorbonne Université, Université Paris-Saclay, Institut National Polytechnique de Toulouse, Université de Bordeaux, CREST-GENEST (ENSAE), Université de Strasbourg, Université Paris 1 Panthéon-Sorbonne, Ecole Nationale de l’aviation civile, Université Toulouse Capitole, Université Toulouse 3 Paul Sabatier, Université de Lyon 1, INSA Lyon, Université de Côte d’Azur

Les attendus scientifiques

Les impacts sociétaux

Développement de compétences

Publications

Autres projets

NNawaQ

NNawaQ (Neural Network Adequate Hardware Architecture for Quantization)

Package Python Keops

Package Python Keops pour les calculs tensoriels en (très) grande dimension (projet PDE-AI)

MPTorch

MPTorch, framework d’encapsulation construit sur PyTorch

CaBRNeT

CaBRNeT, une bibliothèque pour le développement et l'évaluation de modèles de raisonnement basé sur des cas simplifiés (projet SAIF)

SNN Software

SNN Software, un outil open-source pour le design SNN (projet EMERGENCES)

SDOT

SDOT, logiciel pour le transport optimal semi-discret

FloPoCo

FloPoCo (Floating-Point Cores), générateur de noyaux arithmétiques majoritairement pour les FPGA (projet HOLIGRAIL)

Lazylinop

Lazylinop (Lazy Linear Operator), un opérateur linéaire paresseux de haut niveau basé en Python (projet SHARP)

CAISAR

CAISAR, une plateforme de caractérisation de la sécurité et de l’intelligence artificielle robuste (projet SAIF)

P16

P16 ou développer, diffuser et maintenir un ensemble de bibliothèques souveraines pour l'IA

AIDGE

AIDGE ou la plateforme ouverte de développement en embarqué du projet DEEPGREEN

Jean-Zay

Jean Zay ou l'infrastructure nationale pour la communauté de recherche en IA

ADAPTING

Architectures adaptatives pour l'intelligence artificielle embarquée

Appel à chaires Attractivité

Le PEPR IA offre aux chercheurs en IA l’opportunité d’établir et de diriger un programme de recherche et une équipe en France pour une durée de 4 ans.

Appels à chaire Choose France – CNRS AI Rising Talents

Appels à chaire Choose France - CNRS AI Rising Talents