Annonce


Analyses statistiques de grands jeux de données spectrales de phénotypage : application à la discrimination entre stress hydrique et stress azoté

19 December 2024


Catégorie : Postes Stagiaires ;


Lieu : INRAe / Université de Bourgogne, Dijon

Encadrants : Walid Horrigue, Frédéric Cointault et Jean-Baptiste Thomas

Durée du stage : 5 mois

Dates : Mars à juillet 2025

Formation ciblée : Master en mathématiques et applications, master en statistiques et apprentissage, MAS …

Candidature : Envoyer une lettre de motivation, CV, liste de réalisations et recommandations par email à walid.horrigue@agrosupdijon.fr ET frederic.cointault@agrosupdijon.fr avant le 31 janvier 2025

Positionnement et objectifs: Dans le cadre de la plateforme 4PMI, de grands jeux de données sont acquis, principalement au niveau des images. Cependant, la volonté affichée de développer une cabine équipée de caméras hyperspectrales va aussi impliquer des quantités importantes de données spectrales qu’il va falloir acquérir, stocker et surtout traiter, pour faire ressortir les bandes spectrales les plus pertinentes selon les applications visées.

Objectifs du stage: Les objectifs du stage sont ainsi d’établir une méthodologie d’analyses statistiques des spectres, à des fins de caractérisation des différences entre plantes stressées (hydrique, azote) et plantes non stressées, sur la base d’essais menés en 2022 pour lesquels les spectres ont déjà été acquis. Cette méthodologie se traduira par le développement d’algorithmes d’analyses statistiques sous R ou Python, ré-utilisables pour l’ensemble des applications visées par la plateforme 4PMI.

Description du travail qui sera mené.

Les étapes de travail que le stagiaire devra réaliser sont les suivantes :

1. Lissage des spectres sous RStudio (Méthodes de lissage, Visualisation avant et après le lissage).

2. Comparaison des densités spectrales via différents tests (Test de Kolmogorov-Smirnov pour comparer deux distributions spectrales, Test de Cramér-von Mises pour comparer deux densités, Test de Anderson-Darling pour une sensibilité accrue aux différences dans les queues des distributions, Visualisation graphique).

3. Réaliser une Analyse en Composantes Principales (ACP) fonctionnelle avec pca.fd (Transformer les spectres en objets fonctionnels, Réaliser une ACP fonctionnelle, Visualisation des résultats).

4. Autres méthodes de comparaison des spectres (Distance euclidienne, Correlation spectrale).

Les méthodes choisies seront basées sur une étude bibliographique préalable, et des comparaisons seront effectuées pour proposer les meilleures (au sens du résultat et de la rapidité) pour chaque étape, notamment au niveau de la comparaison des spectres.

Les commentaires sont clos.