Contexte
Un sonar actif est un système souvent multi-capteurs permettant la détection et la localisation d’objets sous-marins à partir de signaux acoustiques réfléchis par ces mêmes objets. Les algorithmes de détection et de localisation sont basés principalement sur des méthodes de traitement statistique du signal mais ils peuvent manquer d’efficacité pour classifier les différents objets. Cette classification est importante pour pouvoir distinguer les différents objets présents dans la mer et en particulier pour assurer la sécurité de navigation. Ces objets peuvent être variés allant de l’objet naturel posé sur le fond à une mine en milieu de colonne d’eau en passant par des bancs de poissons ou des traces d’autres bateaux. D’un point de vue pratique, il est difficile de faire cette classification avec une seule image SONAR. Il est donc nécessaire d’effectuer une succession d’émission/acquisition SONAR qui permettent d’obtenir une série temporelle d’imagettes de l’objet. A partir de cette série temporelle, la société Exail a mis en place une première approche de classification, basée sur des méthodes empiriques. Pour renforcer cette étape, il serait pertinent de développer un cadre d’apprentissage permettant d’améliorer la performance, la robustesse et la confiance dans les résultats obtenus. Néanmoins ce développement nécessite de prendre en compte plusieurs caractéristiques de ces données. Tout d’abord, il faut noter que le nombre de données annotées est assez faible pour couvrir toutes les possibilités (différentes cibles, fonds différents, état de la mer, hauteur différente, …). De plus les imagettes sont assez pauvres en terme de caractéristiques avec en plus un rapport signal à bruit très faible. Pour résoudre ce dernier point, une solution utilisée dans différentes applications [1, 2] est de ne pas utiliser les données brutes mais des caractéristiques basées sur des statistiques d’ordre deux. Pour résoudre le second verrou, il devient courant dans la communauté de s’appuyer sur des approches d’adaptation de domaines [3, 4] qui permettent d’apprendre un réseau sur un nombre limité de données annotées, appelées données sources, et d’utiliser des données non-annotées, appelées alors données cibles, pour modifier ce réseau. Le dernier point de ce sujet est que la séquence temporelle n’est pas prise en compte dans les réseaux classiques et qu’il est alors intéressant de s’appuyer sur des architectures plus modernes comme des architectures transformers [5] pour prendre en compte l’évolution temporelle de ces données.
Objectif et méthodologie
Cette thèse propose donc de construire des modèles d’apprentissage pour la classification des différents objets sous marins à partir de séquences temporelles d’imagettes sonar en s’appuyant sur des statistiques d’ordre 2 et en utilisant des stratégies d’adaptation de domaines. Pour réaliser cet objectif, nous proposons tout d’abord de développer une architecture basée sur des statistiques d’ordre 2 obtenues à partir de la série temporelle. Ces statistiques permettront de caractériser la corrélation temporelle dans la série d’imagettes. Ensuite le réseau s’appuiera sur l’architecture SPDnet [6] pour faire l’étape de classification. Même si cette architecture a montré une bonne robustesse pour gérer les décalages de données entre celles d’entraînement et de test, il est nécessaire dans une application industrielle de le coupler à des approches d’adaptation de domaines pour atteindre une plus grande robustesse. Pour cela, la stratégie proposée dans [7], couplée avec les outils de géométrie Riemannienne développés dans [8, 9] sera utilisée. Diverses métriques de probabilités (affine invariant, Bures Wasserstein, …) seront testées et comparées en terme de performances et surtout de robustesse au décalage de données. Dans un second temps, nous développerons une architecture transformer adaptée aux statistiques d’ordre 2 en s’appuyant sur les travaux préliminaires de la communauté [10, 11]. Mais beaucoup d’outils dans ces travaux ne sont pas encore adaptés à l’architecture SPDnet qui nécessiteront donc un développement théorique et d’implémentation. Il sera aussi nécessaire de combiner cette architecture transformer aux stratégies d’adaptation de domaines développées dans la première partie de la thèse. Les méthodes développées seront validées sur des jeux de données produits par la société Exail. Ces jeux de données contiennent différentes séries temporelles d’imagettes SONAR annotées selon l’objet insonifié. Ces données ont été obtenues lors de différentes campagnes effectuées au large de La Ciotat. En fonction des besoins de la thèse, des campagnes d’acquisitions en mer complémentaires pourront être planifiées avec la possibilité de la participation active de la personne recrutée en thèse.
Profil du candidat
Etudiant de M2 ou école d’ingénieur en mathématiques appliquées, traitement du signal, informatique ou domaines connexes. Le candidat doit posséder de bonnes compétences en communication écrite et orale, ainsi qu’une maîtrise de la programmation en Python.
Encadrement et localisation
La thèse est financée par un contrat CIFRE avec la société Exail et plus particulièrement sa division SONAR. L’encadrement scientifique sera effectué par le laboratoire LISTIC, laboratoire de l’Université Savoie Mont-Blanc, spécialisée en développement de modèles IA pour des données issues de la physique. Le candidat pourra être hébergé prioritairement au laboratoire LISTIC, à Annecy mais selon le profil de la candidature, un hébergement sur le site de La Ciotat d’Exail est possible. Dans les 2 cas, des déplacements ponctuels sont à prévoir entre La Ciotat et Annecy pour échanger avec les différents partenaires du projet.
Procédure pour postuler
Pour postuler à ce poste, veuillez envoyer votre candidature, comprenant une lettre de motivation, un CV ainsi que les derniers relevés de notes dont vous disposez, aux personnes suivantes :
- Guillaume Ginolhac : guillaume.ginolhac@univ-smb.fr
- Yassine Mhiri : yassine.mhiri@univ-smb.fr
- Olivier Lerda : olivier.lerda@exail.com
Références
[1] A. Barachant, S. Bonnet, M. Congedo, and C. Jutten, « Classification of covariance matrices using a Riemannian-based kernel for BCI applications, » Neurocomputing, 2013.
[2] D. Jafuno, A. Mian, G. Ginolhac, and N. Stelzenmuller, « Classification of buried objects from ground penetrating radar images by using second-order deep learning models, » IEEE JSTARS, 2025.
[3] M. Long, Y. Cao, J. Wang, and M. Jordan, « Learning transferable features with deep adaptation networks, » in ICML, 2015.
[4] N. Courty, R. Flamary, D. Tuia, and A. Rakotomamonjy, « Optimal transport for domain adaptation, » IEEE PAMI, 2017.
[5] A. Dosovitskiy, L. Beyer, A. Kolesnikov, D. Weissenborn, X. Zhai, T. Unterthiner, M. Dehghani, M. Minderer, G. Heigold, S. Gelly et al., « An image is worth 16×16 words : Transformers for image recognition at scale, » arXiv preprint arXiv:2010.11929, 2020.
[6] Z. Huang and L. Van Gool, « A riemannian network for SPD matrix learning, » in AAAI, 2017.
[7] C. Ju and C. Guan, « Deep optimal transport for domain adaptation on SPD manifolds, » 2024.
[8] F. Bouchard, A. Mian, M. Tiomoko, G. Ginolhac, and F. Pascal, « Random matrix theory improved Fréchet mean of symmetric positive definite matrices, » in ICML, 2024.
[9] F. Bouchard, N. Laurent, S. Said, and N. Le Bihan, « Beyond r-barycenters : An effective averaging method on stiefel and grassmann manifolds, » IEEE Sig. Proc. Letters, 2025.
[10] Y.-T. Pan, J.-L. Chou, and C.-S. Wei, « MAtt : A manifold attention network for EEG decoding, » Neurips, 2022.
[11] M. Seraphim, A. Lechervy, F. Yger, L. Brun, and O. Etard, « Automatic classification of sleep stages from EEG signals using Riemannian metrics and transformer networks, » SN Computer Science, 2024.
