Les missions du poste

Établissement : Université de Montpellier
École doctorale : I2S - Information, Structures, Systèmes
Laboratoire de recherche : Laboratoire d'Informatique, de Robotique et de Micro-électronique de Montpellier
Direction de la thèse : Karen GODARY-DEJEAN ORCID 000000025835021X
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-05-04T23:59:59

Nous proposons une thèse interdisciplinaire en informatique graphique et robotique sous-marine visant à améliorer les techniques d'exploration sous-marine. L'objectif est de développer une méthode de génération procédurale de jeux de données synthétiques pour le pré-test d'algorithmes de perception, localisation et cartographie (SLAM) sous-marines et l'entraînement de modèles d'apprentissage. Les données incluront images optiques et acoustiques simulées ainsi que vérités terrain géométriques et sémantiques.
Nous étudierons des technologies récentes de génération procédurale temps réel permettant la visualisation rapide de larges scènes avec une faible occupation mémoire. Cette approche permet de générer instantanément de nombreux terrains de test tout en préservant les ressources nécessaires à l'évaluation des algorithmes.
Cette thèse vise à poursuivre le projet initié avec le stage de Vincent Bernardon financé sur fonds du LIRMM, encadré par Nicolas Lutz et Juliette Drupt, qui seront également dans l'équipe d'encadrement de la thèse.

La robotique sous-marine est en plein essor pour la cartographie, l'inspection de structures marines (par exemple plateformes d'énergies renouvelables) ou l'observation de l'environnement (écosystèmes marins). Ces applications peuvent être effectuées par des robots téléopérés ou autonomes. Cela nécessite la détection et la localisation de structures 3D et du robot par rapport à celles-ci, via des algorithmes de localisation et cartographie simultanées (SLAM), et/ou des algorithmes de perception sémantique pour mieux interpréter l'environnement, nécessaire pour la prise de décision [38, 39] (autonomie décisionnelle). Ces algorithmes utilisent des capteurs optiques [7, 32, 5] et/ou acoustiques [1, 2, 20, 27, 30] embarqués. Ces domaines de recherche progressent rapidement en raison des besoins en autonomisation des missions robotiques en milieux sous-marin, ainsi que des défis en perception du milieu : atténuation et turbidité pour la vision, faible résolution et ambiguïtés pour l'acoustique.
Besoin de données synthétiques. Le test des algorithmes de SLAM et de perception sémantique requiert des jeux de données capteurs d'exploration d'environnements sous-marins. L'usage croissant de l'apprentissage profond [6, 13, 24] impose, en outre, des volumes importants de données d'entraînement. Le partage de ces données est par ailleurs important pour l'établissement de standards répétables et faciliter la comparaison entre différents travaux.
L'acquisition en mer étant complexe et coûteuse, des données synthétiques sont couramment utilisées pour l'évaluation [20, 10, 12, 1] ou l'entraînement [33, 8, 21, 13, 24] de ces algorithmes. La génération de ces données nécessite des environnements réalistes et la simulation de capteurs via des modèles dédiés [19, 3, 29, 14, 22]. De plus, l'utilisation d'environnements simulés permet également un accès facilité à la vérité terrain nécessaire pour l'évaluation des algorithmes robotiques.
Génération de données synthétiques d'environnements sous-marins synthétiques. De nombreux simulateurs dédiés à la robotique sous-marine [31, 23, 8, 28, 9] permettent aujourd'hui de charger des scènes 3D et de simuler les mesures de capteurs embarqués. Les scènes d'environnements sous-marins sont principalement créées manuellement, ce qui limite leur nombre et leur taille (4 scènes différentes dans [33]) ou par distribution aléatoire de modèles précalculés [21], entraînant des répétitions et un manque de variété, nuisant au réalisme des scènes. De plus, le coût du chargement et de la visualisation des scènes est proportionnel à leur superficie et leur quantité de détail, rendant impossible la représentation de scènes complexes, telles que les scènes de récifs coraliens.
Génération procédurale temps réel. La génération procédurale permet de créer automatiquement la géométrie [17], l'apparence [34, 16, 35] et la répartition [11] d'objets numériques par des règles algorithmiques. Elle a déjà été utilisée pour produire de vastes environnements pour l'entraînement de méthodes d'IA en vision, en extérieur [25] ou en intérieur [26]. Cependant, dans ces travaux, les scènes sont pré-calculées et chargées depuis la mémoire, et demeurent donc limitées par la quantité de mémoire disponible. La génération procédurale temps réel, d'un autre côté, évite cette limite en ne produisant que la portion visible de la scène à chaque rendu, réduisant l'occupation mémoire de plusieurs Go à quelques ko. Elle s'applique aux scènes [11], aux textures [16, 35,17] (motifs, couleurs, relief), et aux géométries grâce aux technologies récentes des mesh shaders [18] et des work graphs [15] qui permettent de générer des scènes larges et denses ; cependant, comme ces technologies sont nouvelles, la génération temps réel d'objets issus des fonds marins n'a pas encore été explorée. On note que l'IA générative n'est pas envisagée ici, car les modèles d'IA actuels sont loin d'être adaptés aux contraintes temps réel.

Les objectifs scientifiques de ce projet sont les suivants :
-Développer des méthodes de génération procédurale temps réel d'environnements sous-marins en vue de proposer un prototype de moteur 3D instanciant de larges scènes détaillées, sans répétition, principalement sur GPU.
-Simuler des mesures acoustiques et optiques via des modèles existants afin d'acquérir les données synthétiques dans ces scènes. Ces données pourront ensuite être utilisées pour l'évaluation d'algorithmes de SLAM et de perception sémantique, et l'entraînement standardisé de méthodes de machine learning pour ces algorithmes, sur des données synthétiques avec vérités terrain.
-Pour évaluer nos données synthétiques, nous les comparerons à des données réelles en comparant les performances des algorithmes entraînés et évalués sur ces jeux de données.

Le profil recherché

-Fortes compétences en informatique graphique : modélisation géométrique, rendu, génération procédurale. Maîtriser les work graphs/mesh shaders/compute shaders est un plus très valorisant.
-Compétences correctes en traitement d'image pour la robotique : vision par ordinateur et apprentissage profond notamment.
-Compétences en programmation : C++, GLSL/HLSL, Cauldron, ImGUI, Python éventuellement.
-Intérêt dans la recherche interdisciplinaire : informatique graphique, robotique, biologie marine, communication scientifique.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

L’emploi par métier dans le domaine Data et IA à Montpellier