MadLearning

Mathématiques de l’apprentissage profond : De la théorie aux applications

Aperçu

François Malgouyres, professeur des universités, Institut de Mathématiques de Toulouse et Université de Toulouse

Le projet MadLearning explore la géométrie des réseaux de neurones, ainsi que son impact sur le paysage d’optimisation et sur la régularisation des fonctions apprises. Il analyse comment les propriétés de la fonction objectif influencent les trajectoires des algorithmes stochastiques, ainsi que celles de l’estimateur direct (« straight-through estimator »). Les résultats théoriques obtenus sont confrontés à la pratique et enrichissent la conception d’architectures State-Space Models (SSMs) performantes et efficientes, notamment pour des applications en vision par ordinateur et en modélisation de séries temporelles.

Mots clefs : Géométrie des réseaux de neurones, Paysage d’optimisation, Régularisation implicite, Algorithme de gradient stochastique, Estimateur direct, State-Space Models, Réseaux de neurones quantifiés

Les missions

Nos recherches

Etude géométrique des réseaux de neurones

Etudier la dimension locale de l’image par un réseau de neurones d’un échantillon, lorsque les paramètres du réseau varient. Cette dimension locale permet de caractériser à la fois la régularité de la fonction apprise et la géométrie de la fonction objectif.

Analyser cette dimension locale pour différentes architectures, telles que les State-Space Models (SSMs), les Transformers et les ResNet.

Mettre en évidence les propriétés spécifiques des réseaux de neurones présentant une faible dimension locale.

Etude d’algorithmes stochastiques

Etudier le comportement de différents algorithmes stochastiques lorsque la fonction objectif présente des structures variées, notamment des vallées plates dont le fond est composé de minimiseurs locaux.

Etude de l’estimateur direct (le « Straight-Through-Estimator »)

L’estimateur direct (« straight-through estimator ») est l’algorithme privilégié pour l’optimisation des poids des réseaux de neurones lorsque ceux-ci sont contraints à des valeurs quantifiées. Cette approche est essentielle pour concevoir des modèles efficients et/ou embarquables. Pourtant, ses performances et son comportement restent mal compris.

Analyser cet estimateur sous différentes hypothèses concernant les propriétés de la fonction objectif, afin d’en éclairer les mécanismes.

Application aux SSMs

Les « State-Space Models » (SSMs) sont des architectures de réseaux de neurones permettent de résoudre certaines tâches avec une efficacité supérieure aux architectures concurrentes, tout en présentant une complexité algorithmique réduite.

Adapter cette architecture à des applications en vision par ordinateur et en modélisation et traitement de séries temporelles.

Le consortium

Université de Toulouse (UT), Ecole d’Economie et de science sociale de Toulouse (TSE), Université Grenoble Alpes (UGA), CNRS, Université de Lille, IRT Saint-Exupéry, Brown university

Les attendus scientifiques

Les impacts sociétaux

Développement de compétences

Publications

Autres projets

Géné-Pi

Mathématiques des modèles génératifs

MacLeOD

Apprentissage machine sur geometries et distributions

MAGICALL

Mathématiques des modèles génératifs: une analyse interdisciplinaire des paysages de fonctions de perte

PERSNET

Structures PERsistantes dans les Réseaux Neuronaux

PRODIGE-AI

PRObability, ranDom matrIx theory, Geometry and gEneralization for generative-AI

TENSOR4ML

Méthodes TENSORielles pour maîtriser l'apprentissage automatique moderne

THEOREM

Théorie pour des modèles génératifs plus performants

Appel à chaires Attractivités

Le Programme de recherche PEPR IA ouvre son appel à chaires Attractivité, à destination de chercheurs juniors et seniors, avec pour principal critère un excellent parcours en recherche dans les thèmes du PEPR IA.

NNawaQ

NNawaQ (Neural Network Adequate Hardware Architecture for Quantization)

Package Python Keops

Package Python Keops pour les calculs tensoriels en (très) grande dimension (projet PDE-AI)

MPTorch

MPTorch, framework d’encapsulation construit sur PyTorch

FloPoCo

FloPoCo (Floating-Point Cores), générateur de noyaux arithmétiques majoritairement pour les FPGA (projet HOLIGRAIL)

CaBRNeT

CaBRNeT, une bibliothèque pour le développement et l'évaluation de modèles de raisonnement basé sur des cas simplifiés (projet SAIF)

SNN Software

SNN Software, un outil open-source pour le design SNN (projet EMERGENCES)

SDOT

SDOT, logiciel pour le transport optimal semi-discret

Lazylinop

Lazylinop (Lazy Linear Operator), un opérateur linéaire paresseux de haut niveau basé en Python (projet SHARP)

CAISAR

CAISAR, une plateforme de caractérisation de la sécurité et de l’intelligence artificielle robuste (projet SAIF)

P16

P16 ou développer, diffuser et maintenir un ensemble de bibliothèques souveraines pour l'IA

AIDGE

AIDGE ou la plateforme ouverte de développement en embarqué du projet DEEPGREEN

Jean-Zay

Jean Zay ou l'infrastructure nationale pour la communauté de recherche en IA

ADAPTING

Architectures adaptatives pour l'intelligence artificielle embarquée

Appels à chaire Choose France – CNRS AI Rising Talents (appel clos)

Appels à chaire Choose France - CNRS AI Rising Talents

Bourse CEA AI Rising Talents

Le programme CEA AI Rising Talents, vous offre une formidable opportunité de concrétiser vos idées et de diriger votre propre projet de recherche au bénéfice de l’industrie et de la société.