Recherchez une offre d'emploi
Thèse Exploration des Similarités et des Différences Topologiques de Graphes de Pangénomes pour Mieux Analyser la Diversité Génétique et les Processus Évolutifs Entre Espèces H/F - 34
Description du poste
- Doctorat.Gouv.Fr
-
Montpellier - 34
-
CDD
-
Publié le 1 Avril 2026
Établissement : Université de Montpellier
École doctorale : GAIA - Biodiversité, Agriculture, Alimentation, Environnement, Terre, Eau
Laboratoire de recherche : DIADE - Diversité, Adaptation et DEveloppement des plantes
Direction de la thèse : François SABOT ORCID 0000000285227583
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-05-07T23:59:59
La pangénomique est une approche innovante pour explorer la diversité génétique au sein d'une population, d'une espèce ou entre espèces. Le pangénome regroupe toutes les séquences présentes dans un groupe d'individus, en incluant les séquences partagées par tous (core genome) et celles spécifiques à un sous-ensemble (dispensable genome). Grâce aux avancées des technologies de séquençage de troisième génération, le nombre de génomes disponibles au sein d'une même espèce a considérablement augmenté, donnant accès à une diversité génétique plus exhaustive, comprenant les variations structurales avec leur impact sur l'adaptation aux environnements. Cela a entraîné un changement de paradigme, passant d'une référence linéaire à un graphe de pangénome.
Un graphe de pangénome rassemble l'information de plusieurs génomes dans une structure de données unique, où chaque noeud représente une séquence nucléotidique et chaque arête une connexion entre deux séquences adjacentes. Contrairement aux génomes linéaires, ces graphes capturent toute la diversité génétique d'une population. Leur analyse topologique permet d'identifier les régions communes à tous les individus, ainsi que celles spécifiques à certains groupes.
La construction de graphes de pangénome est facilitée avec l'utilsation de logiciels tel que Minigraph-cactus, et un nombre croissant d'outils permet de les exploiter pour des applications comme le génotypage. Des projets récents visent à enrichir ces graphes avec des données partielles pour mieux appréhender la diversité génétique, ou à les utiliser pour des études de GWAS.
Cependant, des défis demeurent, notamment lorsqu'il s'agit de comparer les graphes de pangénomes d'espèces différentes. L'analyse des similarités et des différences topologiques pourrait fournir des indices sur la diversité génétique de chaque espèce et les processus évolutifs, comme la sélection purifiante (réduisant la diversité) ou la sélection diversifiante (l'augmentant). Les effets de la co-évolution, comme ceux observés entre un hôte et son pathogène, pourraient aussi être analysée via une comparaison de la topologie des graphes.
Des approches issues d'autres disciplines offrent des outils prometteurs pour quantifier ces différences topologiques, comme les méthodes basées sur l'alignement de graphes ou l'intelligence artificielle. Adapter ces méthodologies au contexte des pangénomes permettrait d'explorer la diversité génétique sous un autre angle.
Cette thèse vise à développer et implémenter des approches innovantes pour analyser et comparer les graphes de pangénomes. Elle cherchera à répondre à plusieurs questions clés : quelles régions sont spécifiques à une espèce ? Quelles régions sont partagées entre espèces ? Et, au sein des régions communes, dans quelle mesure ces structures sont-elles similaires ?
Les objectifs incluent : 1) réaliser un état de l'art des méthodes de comparaison de graphes, qu'elles reposent sur des mesures topologiques ou sur l'intelligence artificielle ; 2) développer des outils pour détecter les différences et similarités entre graphes, tout en tenant compte des caractéristiques biologiques des pangénomes ; 3) identifier des signatures topologiques associées aux dynamiques écologiques et évolutives, comme l'impact de la domestication ou de la co-évolution. Ces approches seront d'abord testées sur des données simulées, puis appliquées à des données réelles pour mieux comprendre les mécanismes évolutifs qui façonnent les pangénomes.
Récemment, la pangénomique est apparue comme une approche novatrice pour explorer la diversité génétique au sein d'une population, d'une espèce, voire entre espèces. Le pangénome regroupe toutes les séquences présentes au sein d'un groupe d'individus, incluant des séquences partagées par tous les individus (core genome) et celles spécifiques à un sous-ensemble (dispensable genome) (Tranchant-Dubreuil et al. 2019, He et al. 2025).
Avec l'essor des technologies de séquençage de troisième génération, de plus en plus de génomes sont disponibles au sein d'une même espèce, permettant d'accéder à sa diversité de manière plus exhaustive, y compris pour les variations structurales, et leur impact sur l'adaptation aux conditions environnementales (Gordon et al, 2017, Alonge et al. 2020, Jayakodi, et al. 2024). Ces avancées permettent aussi de limiter les biais d'analyse liés à un seul génome de référence, avec un changement de paradigme: du concept d'une référence linéaire vers le concept de graphe de pangénome (Bayer, Petereit, et al. 2022, Liao et al. 2023, Zhou et al. 2022).
Un graphe de pangénome intègre l'information de plusieurs génomes dans une seule structure de données, où chaque noeud (ou segment) représente une séquence nucléotidique, et où les arêtes représentent des adjacences de noeuds dans au moins un génome. Ainsi contrairement à un génome linéaire, le graphe permet de capturer simultanément l'ensemble de la diversité génétique d'un groupe d'individus; l'analyse de la topologie de ce graphe peut mettre en évidence des régions communes à l'ensemble des individus ou spécifiques à certains individus ou groupes.La construction de graphes de pangénome à partir de génomes entiers est aujourd'hui facilement réalisable avec des logiciels largement utilisés dans ce domaine, tels que minigraph-cactus (Hickey et al. 2024) ou PGGB (Garrison et al. 2024). De plus, un nombre croissant d'outils permettent d'exploiter ces graphes pour des applications diverses tels que le génotypage (Sirén et. al. 2021, Rice et al. 2023). Des projets actuels proposent d'augmenter ces graphes à partir de données partielles pour mieux appréhender la diversité (e.g. PHI, Chandra et al. 2024), ou d'évaluer l'utilisation de ces graphes pour réaliser des GWAS plus précis (thèse CIFFRE de C. Carrette dans l'équipe).
Cependant, de nombreux défis demeurent, comme comparer des graphes de pangénomes d'espèces différentes (par exemple, espèces domestiquées et sauvages ou espèces vivant dans des écosystèmes différents).
En effet, l'analyse des similarités et des différences et de topologies de graphes pourraient être utilisées comme indicateur de la diversité génétique, et refléter des processus évolutifs sous-jacents: pression de sélection purifiante (chemins simples), ou diversifiante (augmentation du nombre de liens). Il est aussi possible d'imaginer de voir les effets de co-évolution dans ces topologies, comme dans le cas de la comparaison entre le pangénome d'un hôte et de celui de son pathogène. Ces comparaisons pourraient ainsi permettre de mieux appréhender les mécanismes évolutifs qui façonnent la structure des pangénomes et leur dynamique au sein d'espèces proches.
Des méthodologies développées et appliquées dans d'autres disciplines (hors pangénomiques) offrent des pistes pour quantifier les similarités et les divergences entre graphes biologiques (Mheich et al., 2020, Schieber et al. 2017, Shimada et al. 2016, Tupin et al. 2005). Adapter ces approches au contexte spécifique des pangénomes permettrait d'explorer de nouvelles dimensions de la diversité génétique.
L'objectif principal de la thèse est de proposer et d'implémenter des approches et méthodologies innovantes pour analyser et comparer des graphes de pangénomes, afin d'explorer la diversité intra-espèce, voire inter-espèce, en permettant de répondre à des questions telles que :
-Quelles régions du graphe sont spécifiques à une des deux espèces/groupes ?
-Quelles régions du graphe sont similaires en topologie aux deux espèces ?
-Au niveau des régions communes, quel est ce degré de similarité?
1.Réaliser un état de l'art : recenser et analyser les méthodes de comparaison des graphes appliqués à d'autres thématiques (ex: mesures de similarité topologique comme la distance d'édition ou l'indice de jaccard, l'alignement de graphes, recherche de signatures topologiques), ainsi que des approches basées sur l'imagerie radar (tex: Champs de Markov caché ref) ou sur l'intelligence artificielle (apprentissage automatique pour détecter des motifs complexes dans les les graphes).
2.Développer et implémenter des approches pour détecter les différences et similarités topologiques entre graphes, en prenant en compte les caractéristiques biologiques des pangénomes (taille du génome, taux de séquences répétées, polyploïdie) et les défis computationnels liés à la manipulation de graphes volumineux. Ces approches utiliseront toutes les possibilités mises en exergue dans la partie 1, tout en prenant en compte les spécificités des graphes de pangénomes en comparaison des autres types de graphes, d'abord sur données simulées, puis sur données réelles.
3.Identifier des marqueurs/signatures topologiques dans les graphes liés à des aspects écologiques et environnementaux (impact domestication, co-évolution, écosystèmes similaires, etc...). L'application des méthodes développées en phase 2 sur nos différents modèles biologiques connus (voir ci-après) permettra de mieux comprendre les impacts des différentes pressions évolutives sur la structure et l'évolution des pangénomes.
Traversée et indexation de graphe
Analyse de topologie
Champs de Markov cachés
Analyse d'image
Offres similaires
Mécanicien Automobile en Concession H/F
-
Aquila RH
-
Montpellier - 34
-
Intérim
-
1 Avril 2026
Mécanicien Automobile H/F
-
Aquila RH
-
Montpellier - 34
-
Intérim
-
1 Avril 2026
Infirmier Anesthésiste -Iade H/F
-
Vitalis Médical
-
Montpellier - 34
-
Intérim
-
1 Avril 2026
Déposez votre CV
Soyez visible par les entreprises qui recrutent à Montpellier.
Chiffres clés de l'emploi à Montpellier
- Taux de chomage : 14%
- Population : 295542
- Médiane niveau de vie : 18870€/an
- Demandeurs d'emploi : 39020
- Actifs : 134890
- Nombres d'entreprises : 30684
Sources :
Un site du réseaux :