Annonce


[PhD] Physics-Informed Neural Networks for Accelerated Cloud Light-scattering Emulator

11 Avril 2025


Catégorie : Postes Doctorant ;

Plus d'informations, lien externe :

Proposition de thèse financée (financement CNRS)

Titre : Physics-Informed Neural Networks for Accelerated Cloud Light-scattering Emulator

Contexte : L’intelligence artificielle révolutionne les sciences de l’atmosphère. Les méthodes d’apprentissage profond viennent concurrencer les modèles classiques de simulation déterministe basés sur les équations physiques réelles, dont le coût calculatoire est extrêmement élevé. Dans la domaine de la prédiction météorologique, par exemple, des modèles de réseaux de neurones comme GraphCast (Lam et al, 20323) ou Pangu-Weather (Bi et al, 2023) ont montré des performances remarquables. Mais l’explicabilité des modèles développés pour les sciences atmosphériques reste très limitée et les raisons sous-jacentes aux performances des différentes architectures mises en œuvre demeurent masquées par la complexité de celles-ci. Pour dépasser ces limitations et améliorer l’efficience des modèles lors de la phase d’apprentissage, le développement de méthodes neuronales informées par la physique (Raissi et al., 2019) a connu un essor très important ces dernières années, combinant intelligence artificielle et lois physiques pour mieux représenter les phénomènes atmosphériques (Kashinath et al., 2021).
Ce projet de thèse se place dans ce contexte général et plus spécifiquement dans le cadre de l’observation spatiale pour les applications en sciences de l’atmosphère. Dans le domaine de la télédétection, la détermination des propriétés de l’atmosphère à partir de l’imagerie multispectrale ou hyperspectrale peut être vue comme un problème assez classique de traduction image-à-image habituellement abordé dans le domaine de la vision par ordinateur. Le problème consiste à faire correspondre des images multispectrales issues de l’observation spatiale (i.e. multicanaux) à des images décrivant les propriétés physiques de l’atmosphère. La simulation réaliste du signal nécessite la prise en compte explicite ou implicite de la nature tridimensionnelle des scènes observées afin de garantir la cohérence entre les propriétés atmosphériques et les observations multispectrales réalisées à différentes échelles, le transfert radiatif dans des atmosphères tridimensionnelles nuageuses étant un problème où les différentes échelles peuvent interagir (Ferlay et Isaka, 2006). Les graph neural networks (GNN) (Scarselli et al., 2009) utilisés par GraphCast et les vision transformers (ViT) (Dosovitskiy et al, 2021) utilisés par PanguWeather sont deux types d’architectures permettant de modéliser ces relations multi-échelles, d’une manière intégralement guidée par les données. Par ailleurs, les travaux précurseurs de Mishra et Molinaro (2021) ont posé des bases intéressantes pour aborder le problème de la simulation du transfert radiatif et de sa formulation inverse à partir de l’apprentissage profond informé par la physique.
Notre hypothèse est que les architectures de type GNN ou ViT peuvent bénéficier d’approches de type réseaux de neurones informés par la physique pour intégrer explicitement des modèles physiques des propriétés radiatives de l’atmosphère à différentes échelles spatiales, tels que celui de Ferlay et Isaka (2006). L’intégration de ces connaissances au réseau de neurones ou à son mécanisme d’attention permettrait de guider le processus d’apprentissage vers des solutions cohérentes avec les modèles physiques, améliorant ainsi la qualité des prédictions tout en nécessitant moins de données d’apprentissage.

Objectifs : En nous inspirant des travaux réalisés dans le cadre de la prévision météorologique, nous proposons dans cette thèse d’explorer l’usage de réseaux de neurones, en guidant leur attention grâce aux lois et aux propriétés physiques de l’atmosphère, pour développer des modèles rapides de calcul du transfert dans des atmosphères nuageuses 3D. On orientera nos travaux sur des architectures qui semblent a priori adaptées à la géométrie des problèmes de physique atmosphérique, en particulier des architectures capables de considérer l’information contenue à plusieurs échelles dans les données d’apprentissage, telles que les GNN, les ViT, ou les GAT (Graph Attention Networks) (Veličković et al., 2018).
Nous établirons d’abord quels modèles physiques sont les meilleurs candidats pour atteindre cet objectif, puis étudierons comment ces modèles peuvent être intégrés aux architectures visées, pour déterminer quel type d’architecture offre le meilleur compromis entre qualité de prédiction et coût calculatoire.
Le ou les modèles développés seront entrainés et évalués à partir de simulations de référence générées par des programmes de simulation Monte Carlo pour les atmosphères 3D ou des modèles analytiques valides pour des situations simples permettant de représenter physiquement les conditions limites du signal.
Bien que fondamentaux par nature, les résultats de ces travaux pourront trouver un cadre applicatif direct dans l’exploitation de missions spatiales en cours ou en préparation par les agences spatiales française et européenne (C3IEL, 3MI, EarthCare…). Par ailleurs ces travaux pourraient également déboucher sur de nouvelles méthodes de calcul rapide du transfert radiatif utilisable par les modèles de prévision du temps ou de simulation climatique et bénéficieraient ainsi à une très large communauté en sciences de l’atmosphère.

Profil recherché : Titulaire (au démarrage de la thèse) d’un Master 2 ou diplôme d’ingénieur en sciences des données/machine learning, informatique, mathématiques appliquées, sciences physiques, ou dans un domaine connexe. Une expérience en apprentissage artificiel, vision par ordinateur, ou modélisation des phénomènes physiques serait appréciée. Le (ou la) candidat(e) devra disposer d’un bon niveau en mathématiques et en programmation.

Lieu : Université de Lille – Laboratoire d’optique atmosphérique (LOA, UMR CNRS 8518) et Centre de recherche en informatique, signal et automatique de Lille (CRIStAL, UMR CNRS 9189).

Contacts :

  • Directeur : Pr Jérôme Riedi (LOA) – jerome.riedi@univ-lille.fr
  • Co-encadrant : Dr Pierre Tirilly (CRIStAL) – pierre.tirilly@univ-lille.fr

Comment candidater : Les candidats intéressés sont invités à envoyer leur CV, lettre de motivation et relevés de notes de Master (ou équivalent) à jerome.riedi@univ-lille.fr et pierre.tirilly@univ-lille.fr, de préférence avant le 15 mai 2025 (les candidatures reçues après cette date ne seront pas prioritaires).

Bibliographie :
Bi K., Xie L., Zhang H. et al. (2023) Accurate medium-range global weather forecasting with 3D neural networks. Nature 619, 533–538. https://doi.org/10.1038/s41586-023-06185-3
Dosovitskiy A., Beyer L., Kolesnikov A. et al. (2021) An image is worth 16X16 words: transformers for image recognition at scale, International Conference on Learning Representations (ICLR), https://doi.org/10.48550/arXiv.2010.11929
Ferlay N., and Isaka, H. (2006) Multiresolution Analysis of Radiative Transfer through Inhomogeneous Media. Part I: Theoretical Development. J. Atmos. Sci., 63, 1200–1212, https://doi.org/10.1175/JAS3678.1
Kashinath K et al. (2021) Physics-informed machine learning: case studies for weather and climate modelling. Phil. Trans. R. Soc. A.37920200093. http://doi.org/10.1098/rsta.2020.0093
Lam R., et al. (2023) Learning skillful medium-range global weather forecasting. Science 382,1416-1421, https://doi.org/10.1126/science.adi2336
Mishra S., R. Molinaro. (2021) Physics informed neural networks for simulating radiative transfer, Journal of Quantitative Spectroscopy and Radiative Transfer, Volume 270, 107705, https://doi.org/10.1016/j.jqsrt.2021.107705
Raissi,M., P. Perdikaris, G.E. Karniadakis (2019) Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations, Journal of Computational Physics, 378, 686-707, https://doi.org/10.1016/j.jcp.2018.10.045
Scarselli, F., M. Gori, A.C. Tsoi, M. Hagenbuchner and G. Monfardini (2009) The graph neural network model, IEEE Transactions on Neural Networks, 20(1), 61-80, https://doi.org/10.1109/TNN.2008.2005605
Veličković P., Cucurull, G., Casanova A., Romero A., Liò P., Bengio Y. (2018) Graph Attention Networks, International Conference on Learning Representations (ICLR), https://doi.org/10.48550/arXiv.1710.10903

Les commentaires sont clos.