Axe - Audio, Vision et Perception


Responsables d’axe

  • Aladine Chetouani
  • Cédric Demonceaux
  • Vincent Lostanlen

La vision et l’audio sont deux modalités associées à la perception d’un environnement par des humains ou des machines, spatial dans un cas, sonore dans l’autre. La dimension perceptuelle de ces deux modalités prend une place croissante dans les projets de recherche dans ces domaines, souvent en lien avec la robotique ou la cobotique, ce qui donne la cohérence scientifique de cet axe. Ces problématiques trouvent des applications variées, telles que la conduite autonome, l’agriculture de précision, la sécurité et l’authentification, le diagnostic médical assisté par ordinateur (radiographies, IRM, échographies), la navigation indoor, la réalité virtuelle et augmentée pour des expériences immersives, et les interfaces homme-machine. 

Orientations scientifiques

  • Traitement du signal audionumérique : contrairement aux autres séries temporelles, les signaux audio se distinguent par leurs non-stationnarités dans le domaine temps–fréquence, des modèles physiques de production et de propagation, une structuration langagière, et des liens privilégiés avec la neurophysiologie. Ces particularités motivent des développements spécifiques en traitement du signal audionumérique, avec des applications à l’acoustique urbaine, biologique, industrielle, ou médicale.
  • Traitements des images adaptés aux capteurs atypiques : La grande majorité des traitements en vision par ordinateur  considère des images capturées par des caméras couleur et à champ de vue classiques. Nous voyons cependant apparaître sur le marché de plus en plus de nouveaux capteurs de vision innovants donnant accès à de nouvelles informations sur la scène en temps-réel (3D, mouvement, spectre,…), pour de nouvelles applications en imagerie du vivant, télédétection, art et patrimoine, réalité augmentée, vision pour la robotique ou pour l’industrie du multimédia. Cela implique de créer de nouveaux traitements ou d’adapter l’existant à ces nouvelles modalités. 
  • Apprentissage machine adapté aux capteurs émergents : Si les méthodes d’apprentissage machine ont permis des avancées fulgurantes en vision par ordinateur au cours des dernières années, la rareté des nouvelles informations apportées par les caméras émergentes lui ouvrent le défi de réussir à exploiter ses techniques de calcul intensif et distribué et d’apprentissage, sans la masse de données considérable fournies par les caméras classiques très largement répandues. Ces recherches exploitent toute l’étendue des recherches en image et vision, allant du capteur à l’interprétation des données visuelles, recouvrant par là-même de nombreux axes du GdR IASIS.
  • Perception visuelle : La perception visuelle revêt une importance primordiale en nous permettant de comprendre et d’interagir avec notre environnement de manière significative. Elle est cruciale pour la communication, l’orientation spatiale, la reconnaissance d’objets et l’expérience subjective. Elle facilite la transmission d’informations par signaux visuels, la compréhension des intentions d’autrui par le langage corporel, les expressions faciales, etc. De même, elle guide notre sens de l’espace et nous permet d’identifier et de catégoriser divers objets, personnes, animaux, symboles et motifs. Par ailleurs, elle enrichit notre expérience visuelle en attirant notre attention et en créant des expériences visuelles immersives. Elle joue également un rôle majeur dans notre interprétation sémantique de notre environnement. Ainsi, la perception visuelle sous-tend notre relation avec le monde qui nous entoure. 




Les commentaires sont clos.