Méthodes pour la détection de variations de structure à partir de graphes de pangénome
J-23
Doctorat Doctorat complet
Nouvelle-Aquitaine
- Disciplines
- Laboratoire
- LABORATOIRE BORDELAIS DE RECHERCHE EN INFORMATIQUE (LABRI)
- Institution d'accueil
- Université de Bordeaux
- Ecole doctorale
- Ecole Doctorale de mathématiques et informatique - ED 39
Description
Les variations structurales, qui incluent notamment les grandes insertions, délétions, inversions, duplications et translocations, constituent une source majeure de diversité génétique et jouent un rôle important dans les maladies. Leur détection a longtemps été limitée par les technologies de séquençage et par lutilisation dun génome de référence linéaire unique. Avec la disponibilité croissante dassemblages de haute qualité, lanalyse génomique évolue désormais vers des modèles de pangénome, en particulier les graphes de pangénome, qui offrent une représentation plus riche et plus flexible de la diversité génétique.Dans ces graphes, les variants génomiques sont généralement associés à des motifs topologiques de type bulle. Toutefois, la relation entre ces motifs et les variants biologiques est loin dêtre simple. Une bulle peut représenter un ou plusieurs variations, y compris des événements proches ou imbriqués, tandis quune même variation structurale peut être représentée par plusieurs motifs qui se recouvrent ou sentrelacent. Comme les petites variations sont beaucoup plus nombreuses que les grandes variations structurales, ces dernières sont souvent masquées dans un grand nombre de bulles et sont par conséquent difficiles à détecter et à caractériser précisément.
Les outils actuels de détection de bulles dans les graphes de pangénome, tels que vg deconstruct et BubbleGun, fournissent des décompositions utiles du graphe, mais peu dinterprétation biologique. En particulier, ils nidentifient pas explicitement le type de variation structurale ni nannotent précisément les positions de cassure, ce qui rend la détection des variations structurales, comme les inversions et les translocations, particulièrement difficile.
Lobjectif principal de cette thèse est de développer de nouvelles méthodes pour détecter et caractériser les variations structurales à partir de graphes de pangénome, encore difficiles à identifier à partir des sorties brutes des outils actuels.
Compétences requises
Les candidates et candidats doivent avoir une solide formation dans au moins un des domaines suivants : algorithmique, théorie des graphes, bioinformatique, ou biologie computationnelle. Une expérience en génomique ou en analyse de séquences par graphes sera appréciée. De bonnes compétences en programmation sont attendues ; le développement se fera principalement en Python et/ou Rust. Nous recherchons une personne ayant de solides capacités danalyse, un intérêt pour la recherche interdisciplinaire, et une motivation pour travailler au croisement entre théorie, développement logiciel et applications biologiques.Bibliographie
[1] Pangenome graphs and their applications in biodiversity genomics. Secomandi etal, Nat Genet 2025.
[2] A draft human pangenome reference. Liao et al. Nature, 2023.
[3] BubbleGun: enumerating bubbles and superbubbles in genome graphs.
Dabbaghie et al, Bioinformatics, 2022.
[4] Investigating the topological motifs of inversions in pangenome graphs. Romain
S, et al. BioRxiv 2025.
[5] Billi: provably Accurate and Scalable Bubble detection in pangenome graphs. Bhat et al, BioRxiv 2025.
Mots clés
graphes de pangénome, variations de structure , algorithmique des graphesOffre financée
Dates
Date limite de candidature 03/07/26
Durée36 mois
Date de démarrage01/10/26
Date de création06/06/26
Langues
Niveau de français requisAucun
Niveau d'anglais requisAucun
Divers
Frais de scolarité annuels400 € / an
Contacts
Vous devez vous connecter pour voir ces informations.
Cliquez ici pour vous connecter ou vous inscrire (c'est gratuit !)
