Pouvait‑on prédire les inondations espagnoles de 2024 ? Le problème de la dérive des données illustrée par la climatologie
Le temps est l'ennemi des statisticiens. Même à l’ère des systèmes d’IA, un modèle météorologique qui serait uniquement fondé sur des données passées et des principes statistiques peut avoir des difficultés à prévoir correctement les quantités de pluie futures, dans le contexte du changement climatique – tout simplement parce que la situation évolue.
Nous avons toutes et tous vu passer les images terribles des inondations espagnoles d’octobre 2024. Avec plus de 200 morts, cet évènement est passé directement au statut d’incident le plus meurtrier survenu en Espagne depuis les inondations de 1962.
D’aucuns pourraient s’étonner du manque de préparation alors que les méthodes d’intelligence artificielle (IA) se répandent. À titre d’exemple, le modèle européen ECMFW, utilisé par Météo France, a récemment intégré un modèle d’IA (nommé AIFS) pour améliorer ses performances.
Avec toutes les méthodes récentes en météorologie et en climatologie, liées au déploiement de l’IA, pourquoi les inondations de Valence n’ont-elles pas pu être anticipées ?
Les statistiques au service de la climatologie
Avant d’entrer dans le vif du sujet, je voudrais clarifier un point crucial : je ne suis pas climatologue et ne me revendique pas tel. Je ne vais donc pas m’étendre en détail sur des phénomènes météorologiques que je ne maîtrise pas assez.
Par contre, je connais bien l’étude des données temporelles. Et la question de la prédictibilité de ce phénomène météorologique va me permettre de vous expliquer un problème de statistiques sur lequel la recherche travaille toujours : la dérive des données (en anglais, data drift).
Tout d’abord, il faut formaliser un peu cet évènement climatique.
Premièrement, ce n’est pas un événement qui arrive tous les quatre matins. Ce genre d’occurrence reste statistiquement rare : on utilisera donc l’appellation « événement rare » ou « événement extrême ».
Deuxièmement, les inondations espagnoles de 2024 sont un événement rare parmi des événements rares. Explication : les habitants des Cévennes connaissent bien ces fortes pluies sous le nom d’« épisodes cévenols ». Ces épisodes cévenols font........
