Annonce

Les commentaires sont clos.

PhD Position in Federated Learning and Medical Imaging

22 Janvier 2024


Catégorie : Doctorant


Version française en bas

==

Synopsis (EN): Confidentiality issues are critical in the field of medical imaging, where data could reveal highly sensitive information about a patient's pathologies and medical history. Federated learning (FL) is a machine learning paradigm (one of the branches of AI) that addresses the problem of confidentiality. It is decentralised: machine learning models are trained locally on distributed data, generally on autonomous devices or servers, without centralising all the data on a master server. However, a major difficulty for federated learning in the processing of decentralised medical imaging stems from the fact that the different sites present variance in the data. This is because although institutions and hospitals may collect the same type of medical data, this data may have varying characteristics due to different collection methods, standards and protocols, institutional policies and priorities, the diversity of patient populations and different confidentiality regulations. This is exacerbated by the limited amount of training data generally available for each site and the small number of sites. This project seeks to combine federated learning and domain adaptation to overcome the disparity of data and enable, during the thesis, the multi-centre application of an innovative AI model in oncology. This is an innovative programme with a strong local position between GREYC and ISTCT and the Normandy oncology centres (co-direction).

==

Synopsis (FR): Les problèmes liés à la confidentialité sont critiques dans le domaine de l'imagerie médicale, où les données pourraient révéler des informations très sensibles sur les pathologies et l'historique médical du patient. L'apprentissage fédéré (ou federated learning FL) est un paradigme d'apprentissage machine (une des branches de l'IA) qui permet de répondre au problème de confidentialité. Il est décentralisé : les modèles d'apprentissage automatique sont entraînés localement sur des données distribuées, généralement sur des appareils ou des serveurs autonomes sans centraliser toutes les données sur un serveur maître. Cependant, une difficulté majeure pour l’apprentissage fédéré dans le traitement de l'imagerie médicale décentralisée provient du fait que les différents sites présentent une variance dans les données. En effet, bien que les institutions et les hôpitaux puissent recueillir le même type de données médicales, ces données peuvent présenter des caractéristiques variables en raison des méthodes de collecte, des normes et des protocoles, des politiques et des priorités institutionnelles, de la diversité des populations de patients et des réglementations de confidentialité différentes. Ce qui est exacerbé par la quantité limitée de données d'entraînement généralement accessibles pour chaque site et le nombre restreint de sites. Ce projet cherche à allier apprentissage fédéré et adaptation de domaine pour pallier à la disparité des données et permettre, durant la thèse, l’application multicentre d’un modèle d’IA innovant en cancérologie. C'est un programme innovant avec un positionnement local fort entre le GREYC et ISTCT et les Centres de Lute Contre le Cancer (CLCC) normands (co-direction).

 

Period: 01/10/24 to 30/09/27

Location and supervision : The student will be based mainly at the GREYC laboratory for the federated learning development part and at the François Baclesse centre and ISTCT for the medical application part. The thesis project will be directed by Romain Hérault and Aurélien Corroyer-Dulmont, experts in AI and oncology/medical imaging respectively.

Localisation et encadrement :

L’étudiant sera localisé principalement au laboratoire du GREYC pour la partie développement en apprentissage fédéré et au niveau du centre François Baclesse et à ISTCT pour la partie application médicale. Le projet de thèse sera dirigé par Romain Hérault et Aurélien Corroyer-Dulmont respectivement experts en Deep Learning et en cancérologie/imagerie médicale.

Contacts :

Romain HERAULT, PhD, HDR
Professeur des universités
Département de Mathématiques/Informatique
Université de Caen Normandie
Laboratoire GREYC (UMR6072-CNRS) - Équipe IMAGE
E-mail: romain.herault@unicaen.fr

Aurélien CORROYER-DULMONT, PhD, HDR
Chercheur-Ingénieur Imagerie Médicale et IA
Responsable scientifique physique médicale,
Centre François Baclesse
ISTCT UMR6030-CNRS, UNICAEN
E-mail: a.corroyer-dulmont@baclesse.unicancer.fr