Annonce


[PhD] Détection non supervisée d’images anormales : vers une compréhension améliorée de l’espace latent pour améliorer les performances

21 Mars 2025


Catégorie : Postes Doctorant ;


Directeur de thèse : Etienne Decencière, directeur de recherche à Mines Paris – PSL
Encadrante industrielle : Vaïa Machairas, Capgemini Invent

Contexte

Dans de nombreuses applications on dispose d’un nombre important d’images considérées comme
normales, mais d’un nombre très réduit d’images anormales. On retrouve cette situation dans le milieu
médical, avec les maladies rares, mais aussi dans le contrôle industriel, où il est souvent difficile
d’anticiper tous les cas d’anomalies. Et en effet, apprendre à détecter des anomalies alors qu’on ne
dispose que d’exemples d’images normales a été pendant longtemps un objectif inatteignable.
L’arrivée de deep learning a changé les choses.
La détection non supervisée d’images anormales est ainsi devenue un sujet brûlant, qui commence à
être appliqué industriellement. Des travaux récents [bertoldo2025] mettent en évidences des limites
actuelles dans la construction, la compréhension et l’utilisation des espaces latents employés par la
plupart des méthodes du domaine. La thèse que nous proposons a pour but de s’attaquer à ces limites
pour casser les verrous technologiques qui empêchent aujourd’hui d’utiliser plus largement ces
approches.

Projet de recherche

Les travaux de Liu et al. [Liu2023] et de Bertoldo [Bertoldo2025] montrent que l’exploitation actuelle
de l’espace latent pour la détection d’anomalies reste empirique, sans véritable compréhension des
phénomènes en jeu.
Trois types d’espaces latents sont employés pour la détection d’images anormales. Historiquement,
le premier résulte de l’utilisation d’auto-encodeurs [Sakurada2014], éventuellement variationnels. Le
deuxième utilise des réseaux pré-entraînés, typiquement optimisés sur des tâches de classification
portant sur la base publique ImageNet [Rippel2020]. Enfin, le troisième utilise l’apprentissage
autosupervisé [Langrognet2025].
La première partie de cette thèse portera sur la construction d’expériences pour mieux comprendre le
fonctionnement de ces trois types d’espaces latents. On prendra comme point de départ les travauxde Bertoldo [Bertoldo2025]. Dans un deuxième temps, on exploitera les renseignements ainsi acquis
pour améliorer la procédure de construction et d’utilisation de ces espaces.
Les méthodes développées seront testées sur des bases de données publiques et appliquées à des cas
d’usage proposés par Capgemini Invent.

Procédure de candidature

Envoyer par courriel votre CV, derniers relevés de notes disponibles, une courte lettre de
motivation, au moins deux lettres de recommandation et tout autre document jugé utile à
Etienne.Decenciere@minesparis.psl.eu et à Vaia.Machairas@capgemini.com .

Références bibliographiques

[bertoldo2025] Bertoldo : Contributions à la détection non supervisée d’anomalies visuelles, thèse de PSL
réalisée à Mines Paris, février 2025.
[langrognet2025] Langrognet, Faucon, Decencière : Self-Supervised Metric Learning for Gaussian Anomaly Detection in Fundus Images, ISBI 2025.
[Liu2023] Liu, Z., Zhou, Y., Xu, Y., and Wang, Z. SimpleNet: A Simple Network for Image Anomaly Detection
and Localization, CVPR 2023.
[Rippel2020] Rippel, O., Mertens, P., and Merhof, D. (2020). Modeling the Distribution of Normal Data in Pre-Trained Deep Features for Anomaly Detection. arXiv:2005.14140.
[Sakurada2014] Sakurada, M. and Yairi, T. (2014). Anomaly Detection Using Autoencoders with Nonlinear
Dimensionality Reduction. In Proceedings of the 2nd Workshop on Machine Learning for Sensory Data
Analysis. In Proceedings of the 2nd Workshop on Machine Learning for Sensory Data Analysis.

Les commentaires sont clos.