CF202646351
Sécurité du contenu vidéo dans une architecture de codage par apprentissage profond
J-36
Doctorat Doctorat complet
Ile-de-France
Disciplines
Laboratoire
LABORATOIRE DES SIGNAUX ET SYSTEMES
Institution d'accueil
Université Paris-Saclay GS Informatique et sciences du numérique
Ecole doctorale
Sciences et Technologies de l'Information et de la Communication (STIC) - ED 580

Description

Au cours des dernières décennies, de nombreux algorithmes de compression vidéo ont été développés, la plupart se basant sur une architecture hybride combinant un codage par transformation et un codage prédictif. Les standards tels que H.264/AVC, HEVC et VVC suivent ce principe. Bien qu'ils offrent des performances de compression très efficaces, chaque module suit un design manuel et rigide. Par ailleurs, ces modules ne peuvent pas être optimisés conjointement de bout en bout.

En parallèle, ces dernières années ont été marquées par le succès retentissant de l'apprentissage profond dans de nombreuses disciplines, notamment en vision par ordinateur et en traitement d'images. Ainsi, des architectures de codage basé sur l’apprentissage profond et une optimisation de bout en bout ont été proposées [Ding 2021, Li 2021, Quach 2022, Chen 2025]. Notamment, différentes solutions ont montré des performances compétitives pour le codage vidéo par rapport aux approches classiques.

Dans ce contexte émergeant d’un codage vidéo par apprentissage profond, l’objectif de cette thèse est d’étudier la sécurité du contenu vidéo, notamment la confidentialité et l’intégrité du contenu. Bien que des solutions existent dans le contexte des codeurs classiques [Dufaux 2008, Shahid 2011, Shahid 2014, Boyadjis 2017], à notre connaissance, l’application à ces nouveaux codeurs n’a pas encore été explorée dans la littérature et soulève de nouveaux enjeux.

Dans un premier temps, afin de préserver la confidentialité de la vidéo, nous planifions d’étudier le chiffrement ou l’obscuration des variables dans l’espace latent, après la quantification, mais avant le codeur entropique. Dans ce but, on peut considérer l’information Intra, l’information de résidu, l’information de mouvement, ou une combinaison. Cette approche garantie que le flux binaire compressé peut toujours être décodé, mais avec une vidéo reconstruite bruitée. Afin d’éviter une augmentation importante du débit, il faut veiller à préserver les statistiques des variables latentes. Comme l’espace latent présente une information sémantique du contenu, cette approche a le potentiel de permettre un chiffrement sélectif de certains objets de la scène, par exemple de flouter les visages dans un scénario de vidéo surveillance. Dans un deuxième temps, nous planifions d’explorer la vérification d’intégrité du contenu. Plus précisément, nous envisageons l’utilisation d’une fonction de hachage dans l’espace latent, combiné avec une signature numérique. Une attaque est détectée lorsque la signature numérique est manquante ou lorsque la valeur de hachage est différente de celle déchiffrée à partir du flux compressé.

Compétences requises

Grande école d'ingénieur ou Master 2 (ou équivalent) Bonnes connaissances en traitement des images/vidéos, sécurité, apprentissage profond.

Bibliographie

[Dufaux 2008] F. Dufaux and T. Ebrahimi, Scrambling for Privacy Protection in Video Surveillance Systems, IEEE Trans. on Circ. Syst. for Video Tech., vol. 18, no. 8, pp. 1168-1174, Aug. 2008.

[Shahid 2011] Zafar Shahid, Marc Chaumont, William Puech. Fast Protection of H.264/AVC by Selective Encryption of CAVLC and CABAC for I and P Frames. IEEE Trans. Circuits Syst. Video Technol. 21(5): 565-576 (2011).

[Shahid 2014] Zafar Shahid and William Puech. Visual Protection of HEVC Video by Selective Encryption of CABAC Binstrings. IEEE Trans. Multim. 16(1): 24-36 (2014).

[Boyadjis 2017] B. Boyadjis, C. Bergeron, B. Pesquet-Popescu, F. Dufaux. Extended Selective Encryption of H.264/AVC (CABAC) and HEVC encoded video streams. IEEE Trans. on Circ. and Syst. for Video Tech., 2017, 27 (4), pp.892-906.

[Ding 2021] Dandan Ding et al. 'Advances in video compression system using deep neural network: A review and case studies.' Proc. of the IEEE, 2021

[Li 2021] Jiahao Li, Bin Li, and Yan Lu. Deep contextual video compression. Advances in Neural Information Processing Systems, 34:18114–18125, 2021.

[Quach 2022] M. Quach, J. Pang, D. Tian, G. Valenzise, F. Dufaux. Survey on Deep Learning-based Point Cloud Compression. Frontiers in Signal Processing, 2022, 2

[Chen 2025] B Chen, S Yin, G Konuko, G Valenzise, Z Zhang, S Wang, Y Ye. Generative models at the frontier of compression: A survey on generative face video coding. arXiv:2506.07369, 2025.

Mots clés

codage vidéo, apprentissage profond, sécurité du contenu vidéo, confidentialité, intégrité

Offre boursier / non financée

Ouvert à tous les pays

Dates

Date limite de candidature 31/05/26

Durée36 mois

Date de démarrage01/10/26

Date de création22/02/26

Langues

Niveau de français requisAucun

Niveau d'anglais requisB2 (intermédiaire)

Divers

Frais de scolarité annuels400 € / an

Contacts

Vous devez vous connecter pour voir ces informations.

Cliquez ici pour vous connecter ou vous inscrire (c'est gratuit !)