La Recherche en France - CF202646351 Sécurité du contenu vidéo dans une architecture de codage par apprentissage profond

J-36

Doctorat Doctorat complet

Ile-de-France

Disciplines

Laboratoire: LABORATOIRE DES SIGNAUX ET SYSTEMES

Institution d'accueil: Université Paris-Saclay GS Informatique et sciences du numérique

Ecole doctorale: Sciences et Technologies de l'Information et de la Communication (STIC) - ED 580

Description

Au cours des dernières décennies, de nombreux algorithmes de compression vidéo ont été développés, la plupart se basant sur une architecture hybride combinant un codage par transformation et un codage prédictif. Les standards tels que H.264/AVC, HEVC et VVC suivent ce principe. Bien qu'ils offrent des performances de compression très efficaces, chaque module suit un design manuel et rigide. Par ailleurs, ces modules ne peuvent pas être optimisés conjointement de bout en bout.

En parallèle, ces dernières années ont été marquées par le succès retentissant de l'apprentissage profond dans de nombreuses disciplines, notamment en vision par ordinateur et en traitement d'images. Ainsi, des architectures de codage basé sur lapprentissage profond et une optimisation de bout en bout ont été proposées [Ding 2021, Li 2021, Quach 2022, Chen 2025]. Notamment, différentes solutions ont montré des performances compétitives pour le codage vidéo par rapport aux approches classiques.

Dans ce contexte émergeant dun codage vidéo par apprentissage profond, lobjectif de cette thèse est détudier la sécurité du contenu vidéo, notamment la confidentialité et lintégrité du contenu. Bien que des solutions existent dans le contexte des codeurs classiques [Dufaux 2008, Shahid 2011, Shahid 2014, Boyadjis 2017], à notre connaissance, lapplication à ces nouveaux codeurs na pas encore été explorée dans la littérature et soulève de nouveaux enjeux.

Dans un premier temps, afin de préserver la confidentialité de la vidéo, nous planifions détudier le chiffrement ou lobscuration des variables dans lespace latent, après la quantification, mais avant le codeur entropique. Dans ce but, on peut considérer linformation Intra, linformation de résidu, linformation de mouvement, ou une combinaison. Cette approche garantie que le flux binaire compressé peut toujours être décodé, mais avec une vidéo reconstruite bruitée. Afin déviter une augmentation importante du débit, il faut veiller à préserver les statistiques des variables latentes. Comme lespace latent présente une information sémantique du contenu, cette approche a le potentiel de permettre un chiffrement sélectif de certains objets de la scène, par exemple de flouter les visages dans un scénario de vidéo surveillance. Dans un deuxième temps, nous planifions dexplorer la vérification dintégrité du contenu. Plus précisément, nous envisageons lutilisation dune fonction de hachage dans lespace latent, combiné avec une signature numérique. Une attaque est détectée lorsque la signature numérique est manquante ou lorsque la valeur de hachage est différente de celle déchiffrée à partir du flux compressé.

Compétences requises

Grande école d'ingénieur ou Master 2 (ou équivalent) Bonnes connaissances en traitement des images/vidéos, sécurité, apprentissage profond.

Bibliographie

[Dufaux 2008] F. Dufaux and T. Ebrahimi, Scrambling for Privacy Protection in Video Surveillance Systems, IEEE Trans. on Circ. Syst. for Video Tech., vol. 18, no. 8, pp. 1168-1174, Aug. 2008.

[Shahid 2011] Zafar Shahid, Marc Chaumont, William Puech. Fast Protection of H.264/AVC by Selective Encryption of CAVLC and CABAC for I and P Frames. IEEE Trans. Circuits Syst. Video Technol. 21(5): 565-576 (2011).

[Shahid 2014] Zafar Shahid and William Puech. Visual Protection of HEVC Video by Selective Encryption of CABAC Binstrings. IEEE Trans. Multim. 16(1): 24-36 (2014).

[Boyadjis 2017] B. Boyadjis, C. Bergeron, B. Pesquet-Popescu, F. Dufaux. Extended Selective Encryption of H.264/AVC (CABAC) and HEVC encoded video streams. IEEE Trans. on Circ. and Syst. for Video Tech., 2017, 27 (4), pp.892-906.

[Ding 2021] Dandan Ding et al. 'Advances in video compression system using deep neural network: A review and case studies.' Proc. of the IEEE, 2021

[Li 2021] Jiahao Li, Bin Li, and Yan Lu. Deep contextual video compression. Advances in Neural Information Processing Systems, 34:1811418125, 2021.

[Quach 2022] M. Quach, J. Pang, D. Tian, G. Valenzise, F. Dufaux. Survey on Deep Learning-based Point Cloud Compression. Frontiers in Signal Processing, 2022, 2

[Chen 2025] B Chen, S Yin, G Konuko, G Valenzise, Z Zhang, S Wang, Y Ye. Generative models at the frontier of compression: A survey on generative face video coding. arXiv:2506.07369, 2025.

Mots clés

codage vidéo, apprentissage profond, sécurité du contenu vidéo, confidentialité, intégrité

Description

Compétences requises

Bibliographie

Mots clés

Offre boursier / non financée

Dates

Langues

Divers

Contacts