CF202647008
Modèles fondamentaux multimodaux pour les neurosciences
J-158
Doctorat Doctorat complet
Maths
Ile-de-France
Disciplines
Autre (Maths)
Laboratoire
UMR 5141 Laboratoire de Traitement et Communication de l'Information
Institution d'accueil
Institut Polytechnique de Paris Télécom Paris

Description

Les avancées en neurosciences s’appuient sur des données complexes et hétérogènes, allant de l’électroencéphalographie (EEG) à haute résolution temporelle et de l’imagerie par résonance magnétique fonctionnelle/structurale (fMRI/sMRI) aux dossiers cliniques et aux profils génomiques. Les développements récents en apprentissage automatique, et plus particulièrement en apprentissage profond, ont permis la conception de modèles fondamentaux à grande échelle [22], robustes et capables de bien généraliser à travers différentes distributions de données, contextes et applications. Bien que l’attention se soit majoritairement portée sur les grands modèles de langage (LLMs), utilisés pour l’apprentissage à partir de dossiers cliniques textuels, plusieurs initiatives ont visé à développer des modèles fondamentaux pour d’autres modalités de neuroimagerie et de signaux biologiques. Les modèles fondamentaux émergents pour l’EEG [1, 2, 3, 4, 5] ont montré un potentiel prometteur pour la modélisation et l’analyse de signaux EEG complexes, qui présentent typiquement un faible rapport signal/bruit et une forte variabilité intra- et inter-sujets. Ce n’est que très récemment que des tentatives ont été faites pour développer de tels modèles fondamentaux pour les données fMRI, en exploitant des cohortes à grande échelle afin de modéliser l’activité cérébrale [6, 7, 8, 19].
La plupart de ces travaux développent des modèles pour des modalités uniques de manière isolée, négligeant l’information complémentaire que fournissent les différentes données de neuroimagerie et cliniques. Ainsi, l’intégration et l’analyse de données multimodales peuvent permettre une meilleure compréhension des mécanismes neurologiques sous-jacents qui gouvernent le comportement et la maladie. De plus, les tentatives actuelles, qu’elles soient uni- ou multimodales, se concentrent sur l’apprentissage de représentations à partir des données, en négligeant largement les connaissances préalables issues de ressources structurées en biomédecine ou de graphes de connaissances spécifiques aux maladies. Les ressources biomédicales structurées, qu’il s’agisse de graphes de connaissances spécifiques à des maladies comme la maladie d’Alzheimer ou l’épilepsie, ou d’ontologies spécifiques à l’EEG, pourraient ancrer les sorties des modèles dans des résultats cliniquement explicables.
Ce projet de doctorat se concentrera sur l’intersection des modèles fondamentaux multimodaux et des neurosciences computationnelles, en exploitant des connaissances explicites et structurées. L’objectif est de développer un cadre novateur pour construire des modèles fondamentaux multimodaux pour les neurosciences, à la fois interprétables, ancrés dans les connaissances et applicables.

Compétences requises

Diplôme de Master (ou équivalent) en informatique (apprentissage automatique, intelligence artificielle), neurosciences ou dans des domaines connexes Solide formation en informatique, mathématiques appliquées et statistiques, avec un accent sur l’apprentissage automatique (en particulier l’apprentissage profond) Compétences avancées en programmation, de préférence en Python Expérience pratique avec des frameworks d’apprentissage automatique / apprentissage profond (par exemple, PyTorch) Familiarité avec le traitement et l’analyse de données EEG, ainsi que d’autres données cérébrales multimodales (imagerie, évaluations cliniques, données génomiques, etc.) Maîtrise avancée de l’anglais : le/la candidat(e) doit être parfaitement à l’aise à l’oral comme à l’écrit

Bibliographie

[1] Jiang, W. et al. Large Brain Model for learning generic representations with tremendous EEG data in BCI. ICLR , 2024.

[2] Nguyen VC. et al. Balanced Latent Semantics and Signal Fidelity for EEG representation learning. ICLR TSALM 2026.

[3] Wang, Y. et al. EEGPT: Pretrained transformer for universal and reliable representation of EEG signals. In NeurIPS, 2024.

[5] Wang, Y. et al. CBraMod: A criss-cross brain foundation model for EEG decoding. 2024.

[6] Ortega Caro, J. et al. BrainLM: A foundation model for brain activity recordings. ICLR, 2024.

[7] Wang, C. et al. NeuroSTORM: Towards a general-purpose foundation model for fMRI analysis. arXiv:2506.11167, 2025.

[8] Wei, Y. et al. fMRI-LM: Towards a universal foundation model for language-aligned fMRI understanding. arXiv:2511.21760, 2025.

[9] Romano, J. D. et al. The Alzheimer's Knowledge Base: A knowledge graph for Alzheimer disease research. J Med Internet Res, 26:e46777, 2024.

[10] Pu, Y. et al. Alzheimer's disease knowledge graph enhances knowledge discovery and disease prediction. Computers in Biology and Medicine, 2025.

[11] Sahoo, S. S. et al. Epilepsy and seizure ontology: Towards an epilepsy informatics infrastructure for clinical research and patient care. J Am Med Inform Assoc, 21(1):82–89, 2014.

[12] Yang, S. et al. Knowledge graph representation of the mappings between seizure semiology and epileptogenic zones. Scientific Reports, 2026.

[13] Frishkoff, G. et al. Development of neural electromagnetic ontologies (NEMO): Ontology-based tools for representation and integration of event-related brain potentials. Nature 2009.

[14] Poldrack, R. A. et al. The Cognitive Atlas: Toward a knowledge foundation for cognitive neuroscience. Frontiers in Neuroinformatics, 5:17, 2011.

[15] Jiang, W. et al. NeuroLM: A universal multi-task foundation model for bridging the gap between language and EEG signals. In ICLR, 2025.

[16] Goswami, M. et al. MOMENT: A family of open time-series foundation models. In ICML, 2024.

[17] Feofanov, V. et al. Mantis: A generalist time series classification foundation model. 2025.

[18] Gnassounou, T. et al. Leveraging generic time series foundation models for EEG classification. arXiv:2510.27522; 2025.

[19] Tak, D. et al. BrainIAC: A generalizable foundation model for analysis of human brain MRI. Nature Neuroscience, 2026.

[20] Wang, Z. et al. Knowledge graph and its application in the study of neurological and mental disorders. Frontiers in Psychiatry, 16:1452557, 2025.

[21] Soman, K. et al. Early detection of Parkinson's disease through enriching the electronic health record using a biomedical knowledge graph. Frontiers in Medicine, 10:1081087, 2023.

[22] Zhou, X. et al. Brain foundation models: A survey on advancements in neural signal processing and brain discovery. arXiv:2503.00580, 2025.

Mots clés

Modèles fondamentaux pour séries temporelles, Neurosciences computationnelles, apprentissage automatique multimodal, Graphe de connaissance

Offre financée

Pays

Mexique (Conacyt)

Si vous êtes une institution d'accueil française, vous trouverez plus d'information sur ce programme à cette page

Chine (CSC)

Dates

Date limite de candidature 30/09/26

Durée36 mois

Date de démarrage01/10/26

Date de création25/03/26

Langues

Niveau de français requisAucun

Niveau d'anglais requisAucun

Divers

Frais de scolarité annuels400 € / an

Contacts

Vous devez vous connecter pour voir ces informations.

Cliquez ici pour vous connecter ou vous inscrire (c'est gratuit !)