Annonce


Estimation de la qualité des mesures GNSS par apprentissage par renforcement / GNSS measurement quality estimation by Reinforcement Learning

30 Novembre -0001


Catégorie :


Stage de recherche de Master au laboratoire GEOLOC
Université Gustave Eiffel, campus de Nantes / Master’s research internship at GEOLOC laboratory
Gustave Eiffel University, Nantes campus


Possibilité de poursuite en thèse à l’issu du stage / Possibility to continue as a PhD student at the GEOLOC lab

Sujet :  (english below)

En milieu urbain, la précision des systèmes de positionnement par satellite (GNSS) est fortement compromise par l’environnement. Les bâtiments, la végétation et la morphologie de la ville peuvent en effet provoquer des réflexions, diffractions ou blocages des signaux des satellites. Cette dégradation des mesures (pseudorange, carrier phase, doppler shift) impacte significativement la qualité du positionnement – un enjeu critique pour des applications exigeant une haute précision, comme les véhicules autonomes et le guidage de personnes déficientes visuelles.

Pour estimer une position à partir des mesures satellitaires, on utilise couramment des algorithmes « snapshot » tels que la régression des moindres carrés pondérés (WLS). L’une des stratégies permettant d’améliorer la précision consiste à attribuer, pour chaque instant de mesure, un indicateur de confiance à chaque satellite. Ces indicateurs servent ensuite de pondération dans l’estimation de position, permettant ainsi de réduire l’influence des mesures de moindre qualité. Bien que des heuristiques existent dans la littérature, elles nécessitent de régler des hyperparamètres et ne sont pas forcément adaptées à des environnements urbains complexes.

Ce stage propose d’explorer une nouvelle approche basée sur l’apprentissage par renforcement. L’objectif est de déterminer une fonction capable de prédire l’indicateur de confiance d’un satellite à partir de ses signaux mesurés. L’apprentissage par renforcement est particulièrement adapté à ce problème car il ne nécessite pas de référence (*ground truth*) pour les pondérations. A la place, nous disposons uniquement de la position de référence du capteur. Dans ce paradigme, un agent prédit des pondérations et reçoit une récompense basée sur la qualité de ses prédictions, ici évaluée avec l’erreur de positionnement commise avec les pondérations prédites. Le schéma ci-dessous illustre l’approche proposée. 

Ce stage pourra donner lieu à une poursuite en thèse au laboratoire GEOLOC.

Tâches :

  • État de l’art sur les méthodes d’apprentissage par renforcement
  • Modélisation du problème d’apprentissage
  • Implémentation et entraînement d’un modèle, en utilisant des données produites au laboratoire GEOLOC
  • Évaluation du modèle et comparaison avec un paradigme d’apprentissage profond end-to-end (https://arxiv.org/abs/2409.12996)

Compétences requises :

  • Connaissances en Machine Learning
  • Développement informatique (Python ou MATLAB)

Contexte :

Le laboratoire GEOLOC est situé sur le campus de Nantes de l’Université Gustave Eiffel. Les thématiques de recherche du laboratoire portent sur la géolocalisation avec la fusion multicapteur pour le transport multimodal.

Modalités :

  • Le stage aura lieu au laboratoire GEOLOC, sur le campus de Nantes de l’Université Gustave Eiffel (Allée des Ponts et Chaussées, 44340 Bouguenais)
  • Gratification : entre 600€ – 700€ / mois selon le nombre de jour de présence
  • Durée : 5 à 6 mois
  • Date de début souhaitée : entre février et avril 2025

Candidature :

Encadrement et contact :

English version

Subject:

In urban environments, the accuracy of Global Navigation Satellite Systems (GNSS) is severely compromised by the environment. Buildings, vegetation and city morphology can cause reflections, diffractions or blockages of satellite signals. This degradation of measurements (pseudorange, carrier phase, doppler shift) has a significant impact on positioning quality – a critical issue for high-precision applications such as autonomous vehicles and guidance for the visually impaired.

To estimate a position from satellite measurements, snapshot algorithms such as Weighted Least Squares (WLS) regression are commonly used. One strategy for improving accuracy is to assign a confidence indicator to each satellite for each instant of measurement. These indicators are then used as weights in the position estimation, reducing the influence of lower-quality measurements. Although heuristics exist in the literature, they require hyperparameters tuning and are not necessarily suited to complex urban environments.

This internship proposes to explore a new approach based on Reinforcement Learning. The aim is to determine a function capable of predicting a satellite’s confidence indicator from its measured signals. Reinforcement Learning is particularly well suited to this problem, as it does not require a ground truth for the weights. Instead, we only have the sensor’s reference position. In this paradigm, an agent predicts weights and receives a reward based on the quality of its predictions, here evaluated with the positioning error made with the predicted weights. The diagram below illustrates the proposed approach.

At the end of the internship, there is a possibility to continue as a PhD student at the GEOLOC lab.

Tasks:

  • Literature review on Reinforcement Learning techniques
  • Modeling of the learning problem
  • Implementation and training of a model, using data collected by the GEOLOC lab
  • Evaluation of the model and comparison with an end-to-end deep learning paradigm (https://arxiv.org/abs/2409.12996)

Skills required:

  • Experience in Machine Learning
  • Coding (Python or MATLAB)

Context:

The GEOLOC laboratory is located on the Nantes campus of the Gustave Eiffel University. The laboratory’s research focuses on geolocation with multi-sensor fusion for multimodal transport. 

Details:

  • The internship will take place at the GEOLOC laboratory, on the Nantes campus of the Gustave Eiffel University (Allée des Ponts et Chaussées, 44340 Bouguenais).
  • 600€ – 700€ / month, depending on the number of days of attendance.
  • Duration: 5 to 6 months
  • Desired start date: between February and April 2025

How to apply:

Internship supervisors:

Les commentaires sont clos.