CF202545430
Apprentissage profond et simulations de dynamique moléculaire combinés pour modéliser des ensembles conformationnels de protéines intrinsèquement désordonnées et leurs complexes
J-76
Doctorat Doctorat complet
Ile-de-France
Disciplines
Laboratoire
BIOMOLECULES : CONCEPTION, ISOLEMENT, SYNTHESE
Institution d'accueil
Université Paris-Saclay GS Santé et médicaments
Ecole doctorale
INNOVATION THÉRAPEUTIQUE: DU FONDAMENTAL À L'APPLIQUÉ - ED 569

Description

Le projet doctoral consiste à développer de nouvelles stratégies pour échantillonner des ensembles conformationnels de protéines intrinsèquement désordonnées, en utilisant des données de simulations de dynamique moléculaire pour entraîner un modèle d'apprentissage profond. Ce modèle sera conçu pour générer des ensembles à partir de séquences de protéines, mais aussi de modèles de structures ou de courtes trajectoires de dynamique moléculaire. Cette approche sera ensuite étendue à la modélisation de complexes protéiques et d'interfaces de liaison. Des comparaisons entre différents modèles, tels que les modèles de langage protéiques, les modèles de diffusion ou d'adaptation de flux, pourront être effectuées pour évaluer la convergence et déterminer le protocole le plus efficace pour les objectifs de ce projet.

Compétences requises

Les candidats à ce projet de thèse doivent être titulaires d'un Master 2 (ou équivalent) dans un ou plusieurs des domaines scientifiques suivants : intelligence artificielle, biophysique moléculaire, bioinformatique structurale.

Bibliographie

[1] Jumper et al. Highly accurate protein structure prediction with AlphaFold. Nature 2021, 596, 583–589.
[2] Holehouse et al. The molecular basis for cellular function of intrinsically disordered protein regions. Nat Rev Mol Cell Biol 2024, 25, 187–211.
[3] del Alamo et al. Sampling alternative conformational states of transporters and receptors with AlphaFold2. eLife 2022, 11, e75751.
[4] Wayment-Steele et al. Predicting multiple conformations via sequence clustering and AlphaFold2. Nature 2024, 625, 832–839.
[5] Watson et al. De novo design of protein structure and function with RFdiffusion. Nature 2023, 620, 1089–1100.
[6] Lipman et al. Flow Matching for Generative Modeling, 2023, [arXiv:cs.LG/2210.02747].
[7] Hie et al. A high-level programming language for generative protein design. bioRxiv 2022.
[8] Passaro et al. Boltz-2 : Towards Accurate and Efficient Binding Affinity Prediction. bioRxiv 2025.
[9] Albergo et al. Stochastic Interpolants : A Unifying Framework for Flows and Diffusions, 2023, [arXiv:cs.LG/2303.08797].
[10] Jing et al. AlphaFold Meets Flow Matching for Generating Protein Ensembles, 2024, [arXiv:q-bio.BM/2402.04845].

Mots clés

Protéines non structurées, Interactions protéine-ligand, Échantillonnage d'ensembles conformationnels, Biophysique computationnelle, Apprentissage machine

Offre boursier / non financée

Réservée aux pays suivants

Pays

Chine (CSC)

Dates

Date limite de candidature 21/01/26

Durée36 mois

Date de démarrage01/10/26

Date de création30/10/25

Langues

Niveau de français requisAucun

Niveau d'anglais requisB2 (intermédiaire)

Divers

Frais de scolarité annuels400 € / an

Contacts

Vous devez vous connecter pour voir ces informations.

Cliquez ici pour vous connecter ou vous inscrire (c'est gratuit !)