Workshop « Geometry of Neural Networks and Tensors »
Where: Nancy — Faculté des Sciences et Technologies, Université de Lorraine, Boulevard des Aiguillettes, Vandoeuvre-lès-Nancy....
2 Février 2024
Catégorie : Stagiaire
Profil du candidat(e) : Vous êtes issu(e) d'une formation (Master 2) en sciences de données (traitement du signal des images, informatique avec une dominante en intelligence artificielle/apprentissage/machine learning, mathématiques appliquées) et vous êtes à l’aise en développement informatique (Python/ framework Pytorch, Tensorflow). Vous maitrisez le traitement d’images et les techniques d’intelligence artificielle (Deep learning …). Vous êtes à l'aise en Anglais aussi bien à l'écrit qu'à l'oral. Vous êtes motivé (e) et curieux (se) de nature, dans ce cas venez participer à la création du LabCom IRISER.
Durée du stage : 5 mois
Date de début prévue : 15/03/2024 -- Date limite de dépôt : 29/02/2024
Contact : Fangchen FENG, Bissmella BAHADURI
Dossier de candidature : CV, lettre de motivation, relevés de notes, au moins une lettre de recommandation (merci d’indiquer la référence d’offre de stage S3_2024 dans le sujet de votre courriel).
Ce stage s’inscrit dans le cadre du LabCom IRISER, Laboratoire Commun en « Intelligence, ReconnaIssance, SurveillancE Réactive » (https://www-l2ti.univ-paris13.fr/iriser/) financé par l’ANR. Le LabCom IRISER vise à proposer, à maîtriser de bout en bout le comportement et les performances des systèmes intelligents voire embarqués destinés à la vision artificielle pour l’analyse rapide et automatisée des images/vidéos (de très grandes tailles, multispectrales géoréférencées de hautes résolutions) capturées à bord des aéronefs de COSE en s’appuyant sur des stratégies de traitement de l’information visuelle et d’apprentissage automatique. Nous souhaitons recruter un stagiaire de master en recherche et développement en vision par ordinateur et apprentissage machine sur une durée de 5 mois.
Description succincte du projet scientifique
La détection d'objets notamment de petite taille représente un défi important en vision par ordinateur. Ce défi est d'autant plus complexe dans le cadre de l'apprentissage à partir de quelques exemples (few-shot). En effet, exploiter des informations utiles à partir d'un nombre limité d'exemples est une tâche ardue, en particulier pour les petits objets. Les caractéristiques extraites des petits objets sont souvent bruyantes et dominées par des informations de fond. De plus, les détecteurs récents s'appuient sur des caractéristiques multi-échelles, et des objets visuellement similaires de tailles différentes peuvent présenter des représentations non alignées. L’approche récemment développée [1], basée sur l'Alignement Query-Support à Cross-Scale (XQSA), s’appuie sur un nouveau mécanisme d'attention qui fusionne les caractéristiques des images de requête et de support à différentes échelles. Cette stratégie permet d'apparier des objets de différentes tailles et, par conséquent, améliore les performances de la détection d'objets en apprentissage à partir de quelques exemples (Few-Shot Object Detection - FSOD). Durant ce stage, Il s’agira d’analyser les différents modules et de modifier certains modules dans le but d’améliorer les performances de détection notamment des petits objets. Des expériences approfondies seront menées sur quatre ensembles de données distincts, comprenant des images naturelles (Pascal VOC et MS COCO) et des images aériennes (DOTA et DIOR).
Référence :
[1] P. L. Jeune and A. Mokraoui, "Cross-Scale Query-Support Alignment Approach for Small Object Detection in the Few-Shot Regime," 2023 IEEE International Conference on Image Processing (ICIP), Kuala Lumpur, Malaysia, 2023, pp. 555-559, doi: 10.1109/ICIP49359.2023.10222181.