Annonce

Les commentaires sont clos.

Stage M2/Ingénieur : Multi-view clustering

13 Janvier 2024

Catégorie : Stagiaire

Sujet :

Il s'agit de développer un réseau de neurones profond pour partitionner, de façon non-supervisée, un ensemble de données selon plusieurs points de vue.

Objectif :

Nous disposons de données biomédicales qui concernent des patients atteints de troubles mentaux. Nous souhaitons développer un algorithme de partitionnement (« clustering ») qui nous permet de regrouper ces patients en différents groupes. Ce partitionnement devrait nous permettre d’identifier les caractéristiques communes qui sont partagés par les patients qui souffrent d’un même trouble mental. Un seul partitionnement est souvent peu informatif car il est difficile de forcer ce partitionnement à différencier des troubles qui ne sont préalablement étiquetés. Notre but est d’utiliser le Deep Learning (ou apprentissage profond) afin de calculer, de façon simultanée, plusieurs partitionnements complémentaires entre eux [1]. De cette façon, certains de ces partitionnements devraient permettre d’identifier des groupes de patients qui auraient des caractères biologiques homogènes et révélateurs de leur état de santé.

Le Deep Learning [2] permet d’effectuer des traitements non-linéaires complexes sur les données. Durant ce stage, il s’agira donc d’identifier les architectures de réseaux les plus prometteuses en partitionnement multi-vues (chaque vue correspond à une façon différente de regrouper les données). Les architectures retenues seront alors appliquées aux données disponibles. Le stagiaire pourra s’appuyer sur des travaux méthodologiques récents [3] qui développent des méthodes de partitionnement multi-vues.

Contexte :

L’équipe SIS (Signaux, images et systèmes) du laboratoire I3S collabore sur ce sujet avec le laboratoire IPMC (Institut de Pharmacologie Moléculaire et Cellulaire) situé à Sophia Antipolis. Le stagiaire pourra donc bénéficier de l’expertise d’un professeur en biologie.

Poursuite en thèse :

Ce sujet de stage est réalisé dans le cadre d’un projet ANR. En fonction des résultats obtenus, le stagiaire pourra poursuivre en thèse (financement déjà obtenu).

Profil recherché :

Formation niveau M2/Ingénieur en mathématiques appliquées et/ou en informatique.

Ces travaux requièrent les compétences suivantes :

- Programmation informatique : les développements informatiques seront réalisés en Python et Pytorch (connaître préalablement Python n’est pas nécessaire mais souhaitable)

- Notions de bases en machine learning (en particulier sur les réseaux de neurones).

Lieu du stage : campus SophiaTech (Sophia Antipolis).

Encadrant du stage : M. Lionel Fillatre (professeur des universités)

Courriel : lionel.fillatre@i3s.unice.fr

Durée : de 4 à 6 mois (démarrage en mars/avril 2024 selon les contraintes du stagiaire).

Rémunération : environ 650 euros par mois.

Procédure pour déposer sa candidature : envoyer son CV et ses résultats académiques niveau L1, L2, L3, M1 et M2 à lionel.fillatre@i3s.unice.fr

Bibliographie :

[1] U. Fang, M. Li, J. Li, L. Gao, T. Jia and Y. Zhang, "A Comprehensive Survey on Multi-View Clustering," in IEEE Transactions on Knowledge and Data Engineering, vol. 35, no. 12, pp. 12350-12368, 2023.

[2] http://www.deeplearningbook.org/

[3] F. Falck, H. Zhang, M. Willetts, G. Nicholson, C.Yau and C. Holmes, Multi-facet clustering variational autoencoders, Advances in Neural Information Processing Systems, 2021.