Annonce

Les commentaires sont clos.

Extensions de l’algorithme Trial and Error Learning dans le cadre des réseaux de communications

11 Octobre 2023


Catégorie : Stagiaire


Le stage d'une durée de 6 mois a pour objectif de travailler sur des extensions de l'algorithme du trial and error learning, qui appartient à la famille des algorithmes d'apprentissage par renforcement en contexte multi agents.

En particulier, l'objet du stage est de faire une étude comparative de différentes approches permettant d'appliquer cet algorithme dans un contexte de télécommunications, dans lequel les mesures d'utilités à disposition des agents sont bruitées.

 

Le Centre de Compétences Hardware & Logiciel embarqué de Thales SIX GTS France recherche un/une :

Stagiaire – Extensions de l’algorithme Trial and Error Learning dans le cadre des réseaux de communications – 6 mois

Basé(e) à Gennevilliers.

Lien pour faire acte de candidature sur le site Thales : postulez ici

 

Qui êtes-vous ?

Vous êtes en dernière année d’un cursus grande école ou en Master 2 avec une forte composante mathématique avec idéalement un volet d’initiation à la recherche ?

Vous avez envie de développer vos compétences au travers d’un sujet technologique passionnant portant sur des techniques modernes des systèmes distribués, multi-agents ? Vous avez réalisé des projets ou stages dans un de ses domaines ?

Vous avez une forte motivation pour la recherche ? Vous aimez étudier et résoudre des problèmes nouveaux ? Vous êtes reconnu(e) pour votre autonomie, votre proactivité votre créativité ? Vous avez des bases solides en mathématiques et en programmation Matlab ?

Alors ce stage est fait pour vous !

Ce que nous pouvons accomplir ensemble

Une des missions du centre de compétence Hardware Technologies, Tools & Engineering, est la définition de protocoles radio et des traitements numériques du signal qui seront utilisés dans les équipements, leur implémentation et leurs évolutions.

Dans le cadre des réseaux de communications la mise en œuvre de solutions distribuées est recherchée afin de permettre au réseau de s’adapter de manière dynamique et autonome sans échanger des informations de signalisation entre les éléments du réseau. Un des algorithmes maitrisés par le centre de compétence est le Trial and Error Learning (TEL) [1].

L’une des limitations liées à l’application de cet algorithme aux réseaux de télécommunications est sa sensibilité aux fluctuations aléatoires liées au canal de propagation. Le centre de compétence a déjà développé des procédés pour contourner cette limitation, comme par exemple dans [2].

Votre mission sera de vous approprier les solutions proposées afin d’être en mesure d’en réaliser une implémentation en Matlab, pour ensuite effectuer des comparaisons de performances entre les différentes solutions pour différents paramétrages.


[1] Bary S.R. Pradelski, H. Peyton Young, « Learning efficient Nash equilibria in distributed systems », Games and Economic Behavior, 2012

[2] J. Gaveau et al., « Trial and Error Learning for Dynamic Distributed Channel Allocation in Random Medium », IEEE Transactions on Wireless Communications, 2021