L'analyse complexe des risques rares mais important

Projet McLaren : L'analyse complexe des risques rares mais important

Ce projet de recherche s'inscrit à l’intersection de deux domaines majeurs des statistiques : l’apprentissage statistique et l’évaluation des risques (extrêmes ou non). Dans un contexte où l’apprentissage machine occupe une place de plus en plus centrale dans de nombreux secteurs, les avancées technologiques en matière de collecte et d’enregistrement des données — notamment fonctionnelles ou de haute dimension — posent de nouveaux défis statistiques. En parallèle, les problématiques liées à l’évaluation des risques extrêmes deviennent cruciales, en particulier dans des domaines sensibles tels que la finance, la santé publique ou la gestion environnementale.

Le cœur de ce projet repose sur l’estimation des ensembles de niveaux (ou level sets), un outil mathématique et statistique puissant permettant de modéliser des régions de probabilité faible ou élevée. Cette notion sert de fil conducteur transversal reliant les deux domaines principaux du projet. Trois objectifs scientifiques structurent le projet :

1.    Quantification et clustering fondés sur la profondeur statistique :

L’idée ici est d'exploiter la notion de profondeur statistique. La profondeur statistique est une mesure qui indique à quel point une donnée est « centrale » par rapport à l’ensemble des autres. Dans des cas simples comme les nombres sur une droite, on peut utiliser la médiane pour cela. Mais dans des situations plus complexes — par exemple quand chaque donnée est une courbe ou une image — il faut des outils plus sophistiqués. La profondeur statistique permet ainsi d’identifier les données typiques (centrales) et les données atypiques (excentrées). Ici, ce concept fournit un cadre robuste pour l’analyse de données complexes, et permet d’évaluer à quel point une observation est « centrale » ou « atypique » par rapport à une distribution donnée. Le projet ambitionne de développer des méthodes innovantes de quantification (notamment pour la détection d’anomalies) et de clustering (regroupement non supervisé de données) adaptées à ces contextes complexes, en exploitant la richesse de la profondeur statistique.

2.    Estimation des risques extrêmes :


La modélisation des événements rares — crues exceptionnelles, krachs boursiers, pics de pollution — constitue un défi majeur en statistique. L’objectif est de fournir des outils fiables pour quantifier et anticiper des risques peu fréquents mais potentiellement catastrophiques.

3.    Estimation des ensembles de niveaux comme lien transversal :

L’originalité du projet réside dans l’exploitation des ensembles de niveaux comme point de convergence entre les deux axes précédents. Ces ensembles permettent à la fois de délimiter des régions de profondeur forte (utiles pour le clustering) ou faible (pour la détection de zones à risque) et de modéliser des seuils extrêmes.
Par cette approche intégrée, le projet entend faire progresser de manière significative la méthodologie statistique en réponse aux défis contemporains liés à la complexité des données et à l’aspect rare des événements extrêmes.

Découvrez le portrait de Thomas Laloë à l'origine du projet McLaren !

Intervalle le Magazine : Des Statistiques au Machine Learning