Le Cerema, en collaboration (via une convention) avec l’IRL2958 Georgia Tech-CNRS, recrute un
stagiaire en Master 2 ou en Ecole d’ingénieur en informatique / biostatistique
Contexte
Depuis 2024, le Département de l’Isère et le Cerema (Est et Centre-Est), dans le cadre d’une convention 2024/2025 de recherche et de développement, avec l’appui de la LPO Isère et l’association Picvert s’intéresse à l’évaluation de l’efficacité fonctionnelle des passages à petite faune (PPF ou batrachoduc), en particulier sur les amphibiens, de Notre-Dame-de-L’Osier et de Saint-Aupre, deux ouvrages nouvellement créés. Ce suivi s’inscrit également dans un projet plus large, celui du développement d’un protocole national standardisé par la technique des pièges-photo en mode time-lapse et s’appuyant sur l’IA via une co-traitance avec Georgia Tech-Lorraine. En effet, cette méthode indirecte et non invasive de suivi de l’efficacité est susceptible de produire un très grand nombre d’images au cours d’une seule saison de reproduction des amphibiens qui se déplacent massivement à la sortie de l’hiver des habitats terrestres d’hivernage en direction des habitats aquatiques de la reproduction (migration prénuptiale) et donc susceptibles d’emprunter les traversées sous la chaussée des routes leur faisant obstacles. Le premier enjeu est donc de pouvoir traiter et exploiter ces centaines de milliers d’images (voir millions) issus de tels suivis par piège-photo au meilleur ratio coût-bénéfice. Le second est de pouvoir transférer la méthodologie sur différentes conceptions de ces PPF (ou batrachoducs) à savoir des traversées à sens unique, à double sens, de dimensions et formes variables.
Missions
Dans cet objectif, le travail consiste à utiliser l’IA par la méthode du deep-learning pour détecter le franchissement des différents amphibiens, en priorité la distinction entre images vides et images présentant un amphibien et l’identité des espèces, à minima la distinction entre anoures (crapaud, grenouille) et urodèles (salamandre, tritons de petite et grande taille). A plus long terme, le nombre d’individus ou la fréquence de passage (approche semi-quantitative) est attendue.
Trois objectifs sont donc attendus dans le stage du point de vue de l’algorithme à créer :
- Mettre en place un réseau de neurone adapté à la détection et à l’identification des amphibiens. Étant donné le peu de données labellisées et la rareté de certaines espèces, une première étape serait de mettre en place un pipeline de génération de données synthétiques aussi proche que possible de la réalité, par exemple en combinant des images de figurines et des photos réalistes de fond de tunnel.
- Entraîner un modèle de détection et d’évaluer ses performances sur un ensemble d’images réelles. A ce stade de l’écriture, un modèle basé sur YOLO est envisagé, mais un tour d’horizon des solutions possibles devra être réalisé au moment opportun.
- Enfin, une partie importante de ce stage est d’intégrer le modèle résultant de cet apprentissage dans un logiciel utilisable de façon pérenne par des utilisateurs non expert. Il faudra envisager soit un système avec une interface web sur un serveur de calcul distant, ou une interface native (qt) utilisable directement sur l’interface utilisateur.
Le stagiaire pourra également participer aux autres missions de ses deux organismes d’accueil de l’IRL2958 GT-CNRS et du Cerema.
Contexte
Depuis 2024, le Département de l’Isère et le Cerema (Est et Centre-Est), dans le cadre d’une convention 2024/2025 de recherche et de développement, avec l’appui de la LPO Isère et l’association Picvert s’intéresse à l’évaluation de l’efficacité fonctionnelle des passages à petite faune (PPF ou batrachoduc), en particulier sur les amphibiens, de Notre-Dame-de-L’Osier et de Saint-Aupre, deux ouvrages nouvellement créés. Ce suivi s’inscrit également dans un projet plus large, celui du développement d’un protocole national standardisé par la technique des pièges-photo en mode time-lapse et s’appuyant sur l’IA via une co-traitance avec Georgia Tech-Lorraine. En effet, cette méthode indirecte et non invasive de suivi de l’efficacité est susceptible de produire un très grand nombre d’images au cours d’une seule saison de reproduction des amphibiens qui se déplacent massivement à la sortie de l’hiver des habitats terrestres d’hivernage en direction des habitats aquatiques de la reproduction (migration prénuptiale) et donc susceptibles d’emprunter les traversées sous la chaussée des routes leur faisant obstacles. Le premier enjeu est donc de pouvoir traiter et exploiter ces centaines de milliers d’images (voir millions) issus de tels suivis par piège-photo au meilleur ratio coût-bénéfice. Le second est de pouvoir transférer la méthodologie sur différentes conceptions de ces PPF (ou batrachoducs) à savoir des traversées à sens unique, à double sens, de dimensions et formes variables.
Missions
Dans cet objectif, le travail consiste à utiliser l’IA par la méthode du deep-learning pour détecter le franchissement des différents amphibiens, en priorité la distinction entre images vides et images présentant un amphibien et l’identité des espèces, à minima la distinction entre anoures (crapaud, grenouille) et urodèles (salamandre, tritons de petite et grande taille). A plus long terme, le nombre d’individus ou la fréquence de passage (approche semi-quantitative) est attendue.
Trois objectifs sont donc attendus dans le stage du point de vue de l’algorithme à créer :
- Mettre en place un réseau de neurone adapté à la détection et à l’identification des amphibiens. Étant donné le peu de données labellisées et la rareté de certaines espèces, une première étape serait de mettre en place un pipeline de génération de données synthétiques aussi proche que possible de la réalité, par exemple en combinant des images de figurines et des photos réalistes de fond de tunnel.
- Entraîner un modèle de détection et d’évaluer ses performances sur un ensemble d’images réelles. A ce stade de l’écriture, un modèle basé sur YOLO est envisagé, mais un tour d’horizon des solutions possibles devra être réalisé au moment opportun.
- Enfin, une partie importante de ce stage est d’intégrer le modèle résultant de cet apprentissage dans un logiciel utilisable de façon pérenne par des utilisateurs non expert. Il faudra envisager soit un système avec une interface web sur un serveur de calcul distant, ou une interface native (qt) utilisable directement sur l’interface utilisateur.
Le stagiaire pourra également participer aux autres missions de ses deux organismes d’accueil de l’IRL2958 GT-CNRS et du Cerema.
Encadrement et modalités de stage
Une collaboration s’effectuera entre le Cerema et l’équipe de spécialistes en informatique du CNRS IRL 2958, maître de stage.
Le/la stagiaire sera intégré·e au sein du laboratoire « CNRS IRL 2958 » et placé·e sous la supervision des co-encadrants Stéphanie ARRAVECHIA, et Cédric PRADALIER. Pour le Cerema, Alain MORAND et Emilie BUSSON (Cerema Est) seront les référents.
Les deux laboratoires étant en ZRR, le dossier du candidat sera soumis au Haut Fonctionnaire Sécurité Défense pour validation.
Lieux de travail : CNRS IRL 2958 GT-CNRS – Cerema-Est (Metz, France).
Durée du stage : 6 mois
Période du stage : période de 6 mois en 2025 selon la date de recrutement.
Indemnité de stage selon la réglementation : 4.35 € / heure soit de l’ordre de 670 €/mois.
Résidence administrative du stagiaire est basée à Metz (57000). Un bureau lui sera mis à disposition respectivement au CNRS IRL 2958 ainsi qu’au Cerema-Est (Ile du Saulcy à Metz).
Profil et compétences recherchées :
Vous êtes en train de préparer un Master ou une école d’ingénieur en informatique. Des compétences en programmation en python sont absolument nécessaires. Une expérience en traitement d’image et/ou en déploiement de réseau de neurone de détection d’objet serait un plus. Aucune compétence en biologie n’est requise, cependant, une sensibilisation aux problèmes de la conservation de la biodiversité est souhaitée ainsi qu’une forte motivation.
Contact : Les candidatures (CV + lettre de motivation) et les demandes éventuelles de renseignements sont à envoyer à