Sécurité du contenu vidéo dans une architecture de codage par apprentissage profond
J-36
Doctorat Doctorat complet
Ile-de-France
- Disciplines
- Laboratoire
- LABORATOIRE DES SIGNAUX ET SYSTEMES
- Institution d'accueil
- Université Paris-Saclay GS Informatique et sciences du numérique
Description
Au cours des dernières décennies, de nombreux algorithmes de compression vidéo ont été développés, la plupart se basant sur une architecture hybride combinant un codage par transformation et un codage prédictif. Les standards tels que H.264/AVC, HEVC et VVC suivent ce principe. Bien qu'ils offrent des performances de compression très efficaces, chaque module suit un design manuel et rigide. Par ailleurs, ces modules ne peuvent pas être optimisés conjointement de bout en bout.En parallèle, ces dernières années ont été marquées par le succès retentissant de l'apprentissage profond dans de nombreuses disciplines, notamment en vision par ordinateur et en traitement d'images. Ainsi, des architectures de codage basé sur lapprentissage profond et une optimisation de bout en bout ont été proposées [Ding 2021, Li 2021, Quach 2022, Chen 2025]. Notamment, différentes solutions ont montré des performances compétitives pour le codage vidéo par rapport aux approches classiques.
Dans ce contexte émergeant dun codage vidéo par apprentissage profond, lobjectif de cette thèse est détudier la sécurité du contenu vidéo, notamment la confidentialité et lintégrité du contenu. Bien que des solutions existent dans le contexte des codeurs classiques [Dufaux 2008, Shahid 2011, Shahid 2014, Boyadjis 2017], à notre connaissance, lapplication à ces nouveaux codeurs na pas encore été explorée dans la littérature et soulève de nouveaux enjeux.
Dans un premier temps, afin de préserver la confidentialité de la vidéo, nous planifions détudier le chiffrement ou lobscuration des variables dans lespace latent, après la quantification, mais avant le codeur entropique. Dans ce but, on peut considérer linformation Intra, linformation de résidu, linformation de mouvement, ou une combinaison. Cette approche garantie que le flux binaire compressé peut toujours être décodé, mais avec une vidéo reconstruite bruitée. Afin déviter une augmentation importante du débit, il faut veiller à préserver les statistiques des variables latentes. Comme lespace latent présente une information sémantique du contenu, cette approche a le potentiel de permettre un chiffrement sélectif de certains objets de la scène, par exemple de flouter les visages dans un scénario de vidéo surveillance. Dans un deuxième temps, nous planifions dexplorer la vérification dintégrité du contenu. Plus précisément, nous envisageons lutilisation dune fonction de hachage dans lespace latent, combiné avec une signature numérique. Une attaque est détectée lorsque la signature numérique est manquante ou lorsque la valeur de hachage est différente de celle déchiffrée à partir du flux compressé.
Compétences requises
Grande école d'ingénieur ou Master 2 (ou équivalent) Bonnes connaissances en traitement des images/vidéos, sécurité, apprentissage profond.Bibliographie
[Dufaux 2008] F. Dufaux and T. Ebrahimi, Scrambling for Privacy Protection in Video Surveillance Systems, IEEE Trans. on Circ. Syst. for Video Tech., vol. 18, no. 8, pp. 1168-1174, Aug. 2008.[Shahid 2011] Zafar Shahid, Marc Chaumont, William Puech. Fast Protection of H.264/AVC by Selective Encryption of CAVLC and CABAC for I and P Frames. IEEE Trans. Circuits Syst. Video Technol. 21(5): 565-576 (2011).
[Shahid 2014] Zafar Shahid and William Puech. Visual Protection of HEVC Video by Selective Encryption of CABAC Binstrings. IEEE Trans. Multim. 16(1): 24-36 (2014).
[Boyadjis 2017] B. Boyadjis, C. Bergeron, B. Pesquet-Popescu, F. Dufaux. Extended Selective Encryption of H.264/AVC (CABAC) and HEVC encoded video streams. IEEE Trans. on Circ. and Syst. for Video Tech., 2017, 27 (4), pp.892-906.
[Ding 2021] Dandan Ding et al. 'Advances in video compression system using deep neural network: A review and case studies.' Proc. of the IEEE, 2021
[Li 2021] Jiahao Li, Bin Li, and Yan Lu. Deep contextual video compression. Advances in Neural Information Processing Systems, 34:1811418125, 2021.
[Quach 2022] M. Quach, J. Pang, D. Tian, G. Valenzise, F. Dufaux. Survey on Deep Learning-based Point Cloud Compression. Frontiers in Signal Processing, 2022, 2
[Chen 2025] B Chen, S Yin, G Konuko, G Valenzise, Z Zhang, S Wang, Y Ye. Generative models at the frontier of compression: A survey on generative face video coding. arXiv:2506.07369, 2025.
Mots clés
codage vidéo, apprentissage profond, sécurité du contenu vidéo, confidentialité, intégritéOffre boursier / non financée
Ouvert à tous les pays
Dates
Date limite de candidature 31/05/26
Durée36 mois
Date de démarrage01/10/26
Date de création22/02/26
Langues
Niveau de français requisAucun
Niveau d'anglais requisB2 (intermédiaire)
Divers
Frais de scolarité annuels400 € / an
Contacts
Vous devez vous connecter pour voir ces informations.
Cliquez ici pour vous connecter ou vous inscrire (c'est gratuit !)
