Mots clés : Estimation robuste du signal MT, deep Learning interprétable, traitement adaptatif
en contexte bruité, séries temporelles multivariées, suivi électromagnétique des volcans
Résumé : L’exploitation des données magnétotelluriques (MT) en contexte fortement bruité reste un défi scientifique majeur, en particulier pour la détection de signaux faibles associés aux dynamiques profondes des systèmes volcaniques. La complexité des bruits naturels et anthropiques, leur variabilité temporelle et leur caractère non stationnaire perturbent l’analyse des séries temporelles et compromettent la stabilité des courbes d’impédance, pourtant essentielles à l’interprétation géophysique. Simultanément, les approches classiques de traitement montrent leurs limites dans ces environnements, tandis que les modèles d’apprentissage profond, bien que prometteurs, peinent à s’imposer en raison de leur opacité méthodologique, du manque de jeux de données annotés et de la difficulté à intégrer des contraintes physiques explicites. La conception de méthodes hybrides combinant les capacités d’adaptation et de généralisation des réseaux neuronaux avec la structure propre des signaux MT apparait donc comme un enjeu scientifique majeur de la discipline, puisque ces architectures pourraient permettre de restaurer une information exploitable même en conditions difficiles d’acquisition des signaux MT. Ce travail de thèse s’inscrit donc dans une dynamique d’innovation à l’interface entre modélisation géophysique et apprentissage automatique, avec pour objectif d’ouvrir un nouveau champ d’interprétabilité et de fiabilité dans l’analyse des signaux électromagnétiques en milieux complexes.
Contexte et motivation : Le monitoring magnétotellurique (MT) est une technique de prospection géophysique passive qui permet d’obtenir des informations sur la répartition tridimensionnelle de la conductivité électrique dans la subsurface terrestre. Cette méthode repose sur l’analyse des champs électriques et magnétiques naturels induits par des sources géophysiques, telles que les orages ou les interactions du vent solaire avec la magnétosphère terrestre (Hogg et al., 2024). En volcanologie, la MT présente un intérêt particulier pour l’étude des structures internes des édifices volcaniques, la surveillance de l’activité magmatique et hydrothermale, ainsi que pour l’évaluation des risques associés.
L’obtention de données magnétotelluriques de qualité constitue toutefois un défi technique majeur, en raison de la faible amplitude des signaux naturels, en particulier dans les basses fréquences nécessaires à l’exploration profonde. L’acquisition doit ainsi reposer sur des capteurs très sensibles et des techniques de traitement avancées capables d’extraire l’information utile d’un environnement bruité complexe. Le bruit électromagnétique constitue l’un des obstacles les plus critiques à cette extraction : il peut être d’origine naturelle (variations du champ magnétique terrestre, activité solaire, orages) ou anthropique (réseaux électriques, infrastructures routières, installations industrielles), et présente une structure temporelle non stationnaire, marquée par des variations brutales d’amplitude, de fréquence et de durée (Hogg et al., 2024 ; Ajithabh & Patro, 2023). Ces caractéristiques rendent son élimination particulièrement difficile et compromettent l’interprétation des signaux d’origine géologique. Plusieurs techniques de traitement ont été historiquement développées pour améliorer la qualité des signaux MT. On peut citer le filtrage temporel, l’utilisation de la méthode de référence distante (Remote Reference), qui consiste à enregistrer simultanément les signaux à un site éloigné des sources de bruit (Li et al., 2022), ou encore les estimateurs statistiques robustes comme les estimateurs M (Huber, 1964). Des solutions hybrides telles que l’outil Razorback combinent ces approches pour améliorer la robustesse du traitement (Smaï et Wawrzyniak, 2020). Si ces méthodes ont prouvé leur efficacité dans certaines configurations, elles rencontrent des limites notables en milieu fortement perturbé, notamment urbain ou volcanique, où les bruits sont souvent corrélés, impulsionnels, et présentent une composante spectrale et temporelle complexe.
L’expérience acquise sur le démonstrateur MT de la Montagne Pelée illustre ces limites de manière emblématique. En raison d’une activité cyclonique intense, ce site volcanique tropical, est soumis à des perturbations électromagnétiques importantes, en particulier dans la bande inférieure à 1 Hz, pourtant essentielle pour sonder les structures profondes du système magmatique. Plus précisément, les résultats montrent que les stations situées en zone sommitale cumulent plusieurs facteurs de dégradation du signal : couplage électrode-sol dégradé par des conditions de sol peu favorables, exposition topographique amplifiant les interférences lointaines, et présence de structures géologiques complexes introduisant des distorsions localisées. Les mesures y présentent une variabilité très marquée, avec des fluctuations atteignant jusqu’à 100 % sur certaines composantes magnétiques et des erreurs de phase supérieures à 50°, rendant les données difficilement exploitables. À l’inverse, des sites mieux protégés présentent des mesures beaucoup plus stables, confirmant l’impact déterminant du niveau de bruit sur la qualité des observations (Warwrzyniak & François, 2024).
Les simulations numériques menées dans le cadre de ce démonstrateur ont montré que des variations géophysiques réalistes, telles que l’augmentation de résistivité associée à une remobilisation partielle du mush magmatique, ne sont détectables que lorsque le niveau de bruit ambiant est suffisamment faible. Ces résultats confortent l’idée selon laquelle, en contexte fortement perturbé, la fiabilité du monitoring MT repose autant sur les conditions d’acquisition que sur les capacités de traitement et de restauration du signal.
Dans ce contexte, les approches fondées sur l’apprentissage profond (deep learning) suscitent un intérêt croissant. En effet, des travaux récents montrent que ces méthodes permettent de modéliser les relations non linéaires entre signal et bruit, sans dépendre d’hypothèses a priori en s’appuyant sur des jeux de données annotées ou synthétiques (Li et al., 2024). Les architectures profondes telles que les réseaux convolutifs (CNN) ou les modèles à attention (CA-TCN) peuvent détecter automatiquement des signatures naturelles faibles (comme les impulsions sferics), adapter dynamiquement les stratégies de filtrage au contexte, et s’affranchir de la définition manuelle de seuils ou paramètres (Jiang et al., 2023 ; Li et al., 2022 ; Li et al., 2024). Ces avancées ouvrent la voie à une amélioration notable de la qualité des données, y compris dans des conditions de bruit sévère.
Pourtant, malgré ces démonstrations prometteuses, ces approches restent peu utilisées dans la pratique du traitement MT. Cela tient principalement à des contraintes méthodologiques et opérationnelles : rareté de jeux de données annotées, forte variabilité spatiale et temporelle des perturbations, difficulté de généraliser des modèles entraînés à partir d’un contexte donné.
En outre, les compétences nécessaires à l’articulation entre expertise géophysique et modélisation algorithmique avancée restent peu diffusées.
Ce constat justifie pleinement la mise en place d’un travail de thèse dédié au développement de méthodes d’apprentissage profond pour le traitement robuste des signaux magnétotelluriques en milieu fortement bruité. Une telle recherche vise à améliorer la sensibilité du monitoring géophysique, en particulier pour les applications volcaniques où l’anticipation des signaux précurseurs dépend directement de la capacité à extraire des variations fines dans un environnement instable et chaotique. Elle s’inscrit ainsi dans une dynamique scientifique à la fois exploratoire et appliquée, à fort potentiel d’impact pour la compréhension et la gestion des risques naturels.
L’ambition de ce travail de recherche est d’explorer les apports de l’apprentissage et du deep learning en particulier pour améliorer la qualité des données magnétotelluriques (MT) dans des environnements fortement bruités, en s’inscrivant à l’interface entre traitement du signal non stationnaire, apprentissage automatique et modélisation géophysique. D’un point de vue géophysique, il s’agit de mieux comprendre dans quelles conditions les signaux associés à des processus volcaniques profonds – tels que les variations de résistivité liées à l’évolution d’un système magmatique – peuvent encore être détectés et interprétés malgré un bruit ambiant complexe, fluctuant et souvent dominant. Cela implique de caractériser la signature fréquentielle des phénomènes d’intérêt, d’analyser la réponse des systèmes d’acquisition à différentes configurations topographiques ou climatiques, et d’évaluer la sensibilité des mesures à des anomalies réalistes simulées numériquement.
En parallèle, sur le plan du traitement du signal, la thèse vise à modéliser le bruit électromagnétique comme un processus temporel multivarié et structurellement complexe, à identifier des représentations discriminantes du signal utile et à concevoir des architectures profondes capables de réaliser cette séparation de manière adaptative, robuste et interprétable. Un enjeu transversal est de construire des jeux de données de référence, mêlant observations réelles et simulations physiques, permettant d’entraîner, tester et transférer les modèles dans différents contextes géologiques. Ce double regard – physique et algorithmique – est indispensable pour concevoir un cadre de traitement qui soit à la fois rigoureux sur le plan mathématique et pertinent pour les applications concrètes de surveillance volcanique.
Programme de travail : Ce travail peut être structuré autour de quatre axes de travail, chacun faisant l’objet d’un développement progressif, intégrant des volets théoriques, méthodologiques, expérimentaux et applicatifs. La réalisation effective de ces axes sera discutée tout au long de la thèse et ajustée si nécessaire en fonction du temps restant au doctorant.
• Caractérisation du bruit électromagnétique affectant le signal MT en contexte volcanique
Cette étape doit permettre de mieux comprendre les limites actuelles du monitoring MT en environnement bruité et de définir les conditions minimales requises pour l’interprétation géophysique des anomalies observées dans la résistivité. Il s’agira donc d’analyser la dynamique spectro-temporelle du bruit selon les conditions météorologiques, topographiques et géologiques, d’identifier les fréquences critiques pour la détection des signaux profonds, et de quantifier la variabilité du rapport signal/bruit selon les stations en s’appuyant sur les enregistrements continus issus du démonstrateur de la Montagne Pelée.
• Modélisation statistique et apprentissage supervisé du bruit
Cette phase est essentielle pour préparer l’apprentissage machine et le fonder sur une base solide et physiquement informée. Pour cela, il s’agira d’explorer des outils permettant de représenter les régularités locales, les corrélations inter-composantes et les signatures transitoires du bruit, dans l’objectif de construire un corpus de données annotées, mêlant observations réelles et signaux simulés, suffisamment représentatif pour entraîner des modèles de traitement supervisé.
• Développement et évaluation de modèles de deep learning
Cet axe est dédié au développement et à l’évaluation de modèles de deep learning capables de séparer le signal utile du bruit dans les séries temporelles MT. En combinant des architectures spécialisées, comme les réseaux convolutifs, à mémoire ou attentionnels, avec des régularisations fondées sur la structure physique du problème, l’objectif sera de construire un modèle robuste, interprétable et performant, permettant de restaurer les courbes d’impédance même en présence de perturbations sévères. Des métriques spécifiques, liées à la stabilité des phases et à la fidélité géophysique des résultats, seront développées pour évaluer l’intérêt opérationnel de ces traitements.
• Transfert et validation sur cas réels
Cette dernière partie visera à valider et généraliser les méthodes développées sur d’autres sites d’étude en lien avec les observatoires volcaniques partenaires (REVOSIMA à Mayotte, OVSM en Martinique, OVPF à La Réunion). Elle permettra de tester la transférabilité des modèles à d’autres contextes volcaniques, d’identifier les conditions limites de leur applicabilité et de préparer leur intégration éventuelle dans des chaînes de traitement automatique pour la surveillance en temps réel. Ces développements appuieront directement plusieurs projets en cours tels que REVOSIMA, MARMOR, MT PELEE ou MIR-MT. Par ailleurs, ils ouvriront la voie à des synergies méthodologiques avec d’autres initiatives scientifiques confrontées à des problématiques analogues de traitement de signaux géophysiques bruités, notamment celles utilisant les fibres optiques à travers la technologie DAS (Distributed Acoustic Sensing), comme dans le cadre de l’ANR SitComOptics. Ce prolongement inter-méthodes contribuera à structurer une approche transversale du traitement robuste des signaux géophysiques en milieux complexes.
Encadrement de thèse : Le doctorant sera sous contrat de travail BRGM https://www.brgm.fr/fr, car le financement de la thèse est porté à 100% par le projet BRGM « Développement d’un pilote de monitoring magnétotellurique de la montagne Pelée », financé par la DEAL Martinique. Il sera encadré au BRGM par Drs. C. Gracianne, P. Wawrzyniak, et B. François, géophysiciens experts en analyse de données EM (électromagnétique) pour les risques naturels.
Il sera inscrit à MIPTIS (Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes), école doctorale de l’Université d’Orléans, et sera affecté au laboratoire PRISME https://www.univ-orleans.fr/fr/prisme, sous la codirection de Prof. Karim Abed-Meraim, expert en traitement du signal et analyse de données.
Profil du candidat : Le candidat ou la candidate devra être titulaire d’un Master 2, d’un diplôme d’ingénieur ou d’un diplôme équivalent, avec une spécialisation en traitement du signal, mathématiques appliquées, data science, géophysique numérique ou toute discipline connexe. Une solide maîtrise des méthodes de machine learning, de l’analyse des séries temporelles, ainsi que du traitement des signaux multivariés est attendue. Un intérêt affirmé pour les sciences de la Terre, l’analyse de données complexes en environnement réel, et les approches interdisciplinaires sera particulièrement apprécié. Une première expérience en deep learning appliqué à des données bruitées, ou une sensibilité pour les problématiques géophysiques, constituera un atout. Le profil recherché combine autonomie, capacité d’analyse rigoureuse, curiosité scientifique et aptitude à évoluer dans un environnement collaboratif réunissant informaticiens, physiciens et géoscientifiques. Une capacité démontrée à vulgariser ses résultats, à les présenter de manière claire et accessible à des non-spécialistes, y compris dans un cadre opérationnel, est essentielle pour ce projet à forte dimension interdisciplinaire et appliquée.
Contacts : Gracianne Cecile : c.gracianne@brgm.fr;
Wawrzyniak Pierre : P.Wawrzyniak@brgm.fr;
Francois Benjamin : B.Francois@brgm.fr;
Karim Abed-Meraim : karim.abed-meraim@univ-orleans.fr;
