CF202649214
Méthodes pour la détection de variations de structure à partir de graphes de pangénome
J-23
Doctorat Doctorat complet
Nouvelle-Aquitaine
Disciplines
Laboratoire
LABORATOIRE BORDELAIS DE RECHERCHE EN INFORMATIQUE (LABRI)
Institution d'accueil
Université de Bordeaux
Ecole doctorale
Ecole Doctorale de mathématiques et informatique - ED 39

Description

Les variations structurales, qui incluent notamment les grandes insertions, délétions, inversions, duplications et translocations, constituent une source majeure de diversité génétique et jouent un rôle important dans les maladies. Leur détection a longtemps été limitée par les technologies de séquençage et par l’utilisation d’un génome de référence linéaire unique. Avec la disponibilité croissante d’assemblages de haute qualité, l’analyse génomique évolue désormais vers des modèles de pangénome, en particulier les graphes de pangénome, qui offrent une représentation plus riche et plus flexible de la diversité génétique.

Dans ces graphes, les variants génomiques sont généralement associés à des motifs topologiques de type bulle. Toutefois, la relation entre ces motifs et les variants biologiques est loin d’être simple. Une bulle peut représenter un ou plusieurs variations, y compris des événements proches ou imbriqués, tandis qu’une même variation structurale peut être représentée par plusieurs motifs qui se recouvrent ou s’entrelacent. Comme les petites variations sont beaucoup plus nombreuses que les grandes variations structurales, ces dernières sont souvent masquées dans un grand nombre de bulles et sont par conséquent difficiles à détecter et à caractériser précisément.

Les outils actuels de détection de bulles dans les graphes de pangénome, tels que vg deconstruct et BubbleGun, fournissent des décompositions utiles du graphe, mais peu d’interprétation biologique. En particulier, ils n’identifient pas explicitement le type de variation structurale ni n’annotent précisément les positions de cassure, ce qui rend la détection des variations structurales, comme les inversions et les translocations, particulièrement difficile.

L’objectif principal de cette thèse est de développer de nouvelles méthodes pour détecter et caractériser les variations structurales à partir de graphes de pangénome, encore difficiles à identifier à partir des sorties brutes des outils actuels.

Compétences requises

Les candidates et candidats doivent avoir une solide formation dans au moins un des domaines suivants : algorithmique, théorie des graphes, bioinformatique, ou biologie computationnelle. Une expérience en génomique ou en analyse de séquences par graphes sera appréciée. De bonnes compétences en programmation sont attendues ; le développement se fera principalement en Python et/ou Rust. Nous recherchons une personne ayant de solides capacités d’analyse, un intérêt pour la recherche interdisciplinaire, et une motivation pour travailler au croisement entre théorie, développement logiciel et applications biologiques.

Bibliographie

[1] Pangenome graphs and their applications in biodiversity genomics. Secomandi et
al, Nat Genet 2025.
[2] A draft human pangenome reference. Liao et al. Nature, 2023.
[3] BubbleGun: enumerating bubbles and superbubbles in genome graphs.
Dabbaghie et al, Bioinformatics, 2022.
[4] Investigating the topological motifs of inversions in pangenome graphs. Romain
S, et al. BioRxiv 2025.
[5] Billi: provably Accurate and Scalable Bubble detection in pangenome graphs. Bhat et al, BioRxiv 2025.

Mots clés

graphes de pangénome, variations de structure , algorithmique des graphes

Offre financée

Dates

Date limite de candidature 03/07/26

Durée36 mois

Date de démarrage01/10/26

Date de création06/06/26

Langues

Niveau de français requisAucun

Niveau d'anglais requisAucun

Divers

Frais de scolarité annuels400 € / an

Contacts

Vous devez vous connecter pour voir ces informations.

Cliquez ici pour vous connecter ou vous inscrire (c'est gratuit !)