L’apprentissage automatique revêt des enjeux scientifiques pluridisciplinaires, mobilisant des concepts issus des mathématiques appliquées (probabilités, statistique, optimisation) et de l’informatique (algorithmie notamment). Les applications de l’apprentissage automatique sont nombreuses et concernent naturellement le traitement du signal et le traitement d’image. La classification, la régression, le partitionnement, l’identification de sous-espaces sont, par exemple, autant de tâches d’apprentissage qui se retrouvent depuis longtemps au coeur de nombreuses problématiques auxquelles est confrontée la communauté du GdR ISIS. Plus récemment, sous la dénomination anglophone de Machine Learning, l’apprentissage automatique connaît un regain d’intérêt important car il est l’une des disciplines indissociables des recherches en Intelligence Artificielle (IA), au même titre que l’automatique, la robotique ou la logique.
Les avancées récentes en IA, qui se confondent parfois avec celles réalisées en apprentissage automatique, ont reçu un écho médiatique important, notamment dans la presse à grand public à la suite des défis relevés par les systèmes d’apprentissage profond. Les réseaux de neurones profonds ont en effet révolutionné l’apprentissage supervisé, en particulier pour la classification de données structurées, en vision par ordinateur notamment. Ces techniques sont également en train de devenir l’état de l’art pour résoudre certains problèmes inverses en imagerie. Le GdR ISIS doit continuer à se positionner comme le lieu d’animation incontournable en apprentissage, capitalisant sur plusieurs décennies de connaissances, savoir-faire et contributions. En soutien au nouveau thème transverse Apprentissage, le Thème A propose également de dédier un axe consacré aux questions fondamentales, c’est-à-dire méthodologiques et théoriques, de l’apprentissage. Plus spécifiquement, sans pour autant négliger les grands verrous scientifiques traditionnellement étudiés, trois enjeux majeurs seront en priorité considérés.
Robustesse et confiance en la décision
Une problématique récurrente dans la conception de systèmes d’apprentissage automatique réside dans leur robustesse au bruit ou, plus précisément, aux données aberrantes. En particulier, dans un contexte d’apprentissage supervisé, la présence de données mal labellisées dans l’ensemble d’apprentissage peut influencer significativement les performances de décision. Parallèlement, la prise de décision concernant une donnée aberrante, dans le sens où elle ne correspond que très peu aux données rencontrées dans la phase d’entraînement, est généralement peu fiable. Une difficulté réside également dans le constat qu’il est difficile de proposer des méthodes d’apprentissage capables d’accompagner ces prises de décision par un ou des indicateurs de confiance performants concernant ces décisions.
A priori, physique et topologie
Un des atouts majeurs des méthodes d’apprentissage automatique, comme notamment les réseaux de neurones profonds qui atteignent aujourd’hui des performances inégalées, est leur généricité et leur versatilité. Elles peuvent donc être mises en oeuvre pour réaliser un grand nombre de tâches variées, ayant parfois peu en commun. Cette généricité s’accompagne d’une tendance à négliger les processus d’acquisition ou la nature même des données à traiter, qui sont pourtant au sein de la communauté du GdR ISIS généralement intrinsèquement liées à un medium définissant le concept même de signal ou d’image.
L’exploitation de connaissances a priori, qui peuvent notamment résulter de la topologie ou de processus physiques sous-jacents, représente une opportunité certaine pour repousser encore un peu plus loin les performances des systèmes d’apprentissage. Réciproquement, la compréhension fine des mécanismes de décision mis en jeu par les systèmes d’apprentissage les plus performants pourrait permettre d’extraire une connaissance complémentaire des signaux et des images, jusqu’alors inaccessible par les modèles paramétriques ou non-paramétriques traditionnellement utilisés.
Apprentissage de représentations
En lien avec l’extraction de connaissance physique suggérée au point précédent, une question importante en traitement du signal et traitement d’image est le choix d’une représentation optimale en vue de la réalisation d’une tâche dédiée (inférence, classification, compression par exemple). Grâce aux récentes avancées dans le domaine, les méthodes d’apprentissage automatique offrent des possibilités nouvelles d’identifier des représentations structurées ou non-structurées, probabilistes ou paramétriques, dans des contextes supervisé ou non-supervisé.