CF202545406
Détection d'anomalies dans les vidéos adaptative et explicable
J-66
Doctorat Doctorat complet
Disciplines
Génie Logiciel
Laboratoire
Laboratoire Vision et Apprentissage pour l’analyse de scènes Département Intelligence Ambiante et Systèmes Interactifs (LIST)
Institution d'accueil
Sorbonne Université
Ecole doctorale
Informatique, télécommunications et électronique de Paris - ED 130

Description

La détection d'anomalies dans les vidéos (VAD) vise à identifier automatiquement les événements inhabituels dans des séquences vidéo qui s’écartent des comportements normaux. Les méthodes existantes reposent souvent sur l'apprentissage One-Class ou faiblement supervisé : le premier n'utilise que des données normales pour l'entraînement, tandis que le second s'appuie sur des labels au niveau de la vidéo. Les récents progrès des modèles Vision-Langage (VLM) et des grands modèles de langage (LLM) ont permis d’améliorer à la fois les performances et l’explicabilité des systèmes VAD. Malgré des résultats prometteurs sur des jeux de données publics, plusieurs défis subsistent. La plupart des méthodes sont limitées à un seul domaine, ce qui entraîne une baisse de performance lorsqu'elles sont appliquées à de nouveaux jeux de données avec des définitions d’anomalies différentes. De plus, elles supposent que toutes les données d'entraînement sont disponibles dès le départ, ce qui est peu réaliste dans des contextes d’utilisation réels où les modèles doivent s’adapter continuellement à de nouvelles données. Peu d’approches explorent l’adaptation multimodale en utilisant des règles en langage naturel pour définir les événements normaux ou anormaux. Or, cela permettrait une mise à jour plus intuitive et flexible des systèmes VAD sans nécessiter de nouvelles vidéos. Ce sujet de thèse a pour objectif de développer des méthodes de détection d’anomalies vidéo adaptables, capables de traiter de nouveaux domaines ou types d’anomalies en s’appuyant sur peu d’exemples vidéo et/ou des règles textuelles. Les axes de recherche principaux seront les suivants : • Adaptation interdomaines en VAD : améliorer la robustesse face aux écarts de domaine via une adaptation Few-Shot ; • Apprentissage continu en VAD : enrichir le modèle en continu pour traiter de nouveaux types d’anomalies ; • Apprentissage multimodal en Few-Shot : faciliter l’adaptation du modèle à l’aide de règles en langage naturel.

Offre financée

Type de financement
CEA

Dates

Date limite de candidature 30/06/26

Durée36 mois

Date de démarrage01/05/26

Date de création22/10/25

Langues

Niveau de français requisAucun

Niveau d'anglais requisAucun

Possibilité de faire sa thèse en anglais

Divers

Frais de scolarité annuels391 € / an

Contacts

Vous devez vous connecter pour voir ces informations.

Cliquez ici pour vous connecter ou vous inscrire (c'est gratuit !)