intoPIX

Au-delà de la compression : la mise à l'échelle par ondelettes

26/06/2005 à 08h45 Par intoPIX

   ⏱ 7min de lecture

JPEG et la technologie des ondelettes

La plupart des gens considèrent JPEG comme un codec de compression à faible latence — et c'est effectivement le cas. Mais son architecture par ondelettes intègre une fonctionnalité qui va bien au-delà de la simple compression : la possibilité pour n'importe quel récepteur de décoder de manière indépendante une image 4K complète, une couche HD intégrée ou une zone de recadrage spécifique, le tout à partir d'un seul et même flux compressé. C'est ce qu'on appelle l'évolutivité par ondelettes, et cela révolutionne la façon dont on envisage la distribution vidéo sur IP.

Pourquoi les ondelettes sont différentes

Les codecs vidéo traditionnels — H.264, H.265, voire JPEG dans de nombreuses configurations — compressent une image en prédisant les différences entre les images ou les blocs. Pour décoder une partie quelconque de l'image, le destinataire a généralement besoin de l'intégralité du flux binaire compressé correspondant à cette image.


JPEG est un codec basé sur les ondelettes. Une transformation en ondelettes décompose une image en une hiérarchie de sous-bandes de fréquences : les composantes à basse fréquence, qui véhiculent la structure générale de l'image, et les composantes à fréquence progressivement plus élevée, qui apportent les détails fins. Cette hiérarchie est préservée dans le flux binaire compressé.

L'idée clé : comme le flux binaire est structuré par sous-bandes de fréquence, un récepteur peut choisir de n'en décoder qu'une partie — et obtenir une image valide et complète à une résolution inférieure. Les sous-bandes de basse fréquence suffisent à elles seules à reconstruire une version réduite de l'image. L'ajout de sous-bandes supplémentaires augmente progressivement la résolution. C'est ce qu'on appelle l'évolutivité de la résolution, une caractéristique inhérente à l'architecture par ondelettes — et non une fonctionnalité supplémentaire.

Concrètement, cela signifie

Dans un flux JPEG , la décomposition en ondelettes signifie qu'un seul flux binaire compressé contient simultanément :


  • L' image en pleine résolution — 4K, 1080p ou quelle que soit la résolution de la source
  • Une couche intégrée à demi-résolution — en HD à partir d'un flux 4K, par exemple
  • Une couche intégrée à résolution réduite de 25 % — et ainsi de suite tout au long de la hiérarchie
  • La possibilité de recadrer une région— décoder uniquement une sous-région spatiale de l'image sans décoder l'image entière

Il est important de noter que ces sous-images ne constituent pas des flux distincts. Elles sont intégrées dans un seul flux binaire compressé. Un récepteur qui n'a besoin que de la HD à partir d'une source 4K peut l'obtenir en décodant partiellement le flux existant — sans réencodage chez l'émetteur, sans chemin réseau distinct et sans bande passante supplémentaire.

Hiérarchie des sous-bandes d'ondelettes – au sein d'un seul flux JPEG – intoPIX

Le flux PROXY — un exemple concret

L'application la plus concrète de l'évolutivité des ondelettes dans un produit réel est le flux PROXY. Voici comment cela fonctionne dans le cadre du kit de développement intoPIX Titanium FPGA EDK :


Une caméra ou un encodeur transmet un flux PRINCIPAL — JPEG 4K60, généralement entre 500 et 700 Mbps — via une seule GbE 1 GbE . Simultanément, le même émetteur peut générer un flux PROXY — un flux secondaire, adressable indépendamment, en résolution qHD (960×540), d'environ 40 à 50 Mbps — dérivé directement des coefficients d'ondelettes lors de l'encodage, sans nécessiter de passe d'encodage distincte.

Les deux flux transitent par la même GbE 1 GbE . Les destinataires s'abonnent à l'un ou l'autre flux de manière indépendante à l'aide de SDP ouNMOS IS-04/IS-05. Un contrôleur PTZ ou un multiviewer s'abonne uniquement au flux PROXY — il ne reçoit jamais les données 4K dont il n'a pas besoin. Un mélangeur de production s'abonne au flux MAIN. Aucun des deux n'affecte l'autre.

Ce que cela permet d'économiser : dans un workflow traditionnel non compressé ou basé sur la DCT, la fourniture d'un flux de contrôle en basse résolution nécessite un réducteur de résolution distinct, un encodeur distinct, une bande passante réseau distincte et des câbles distincts. Grâce à l'évolutivité par ondelettes JPEG , cela devient un sous-produit du processus d'encodage : aucun matériel supplémentaire n'est nécessaire, et aucune bande passante supplémentaire n'est requise au-delà du flux PROXY lui-même.

Décodage au sein du flux MAIN — 4K, HD, qHD ou recadrage

Le flux PROXY est un flux distinct, mais le flux MAIN lui-même intègre également une capacité d'évolutivité. Un récepteur décodant le flux MAIN peut choisir de décoder à une résolution réduite en traitant simplement moins de sous-bandes d'ondelettes :

  • 4K intégral— décodage de toutes les sous-bandes, détails complets, coût de traitement total
  • HD (ou qHD) à partir de la 4K: décoder uniquement les sous-bandes de basse fréquence pour obtenir une image valide en 1920×1080 avec environ un quart de la complexité de décodage, ou une image en 960×540 avec environ un seizième de la complexité de décodage.
  • Recadrage spatial — décodage des sous-bandes correspondant uniquement à une zone d'intérêt spécifique de l'image, sans décoder l'image dans son intégralité — utile pour le zoom numérique PTZ, l'analyse criminalistique ou workflows axés sur des zones d'intérêt

Cela s'applique tout particulièrement aux récepteurs disposant d'une capacité de traitement limitée— qu'il s'agisse de systèmes embarqués, de circuits intégrés (SoC) ou d'applications devant traiter un flux 4K sans avoir à supporter le coût d'un pipeline de décodage 4K complet.

CapacitéJPEG (ondelettes)H.264 / H.265
Latence de sous-trame✓ (ligne par ligne)Latence élevée
Évolutivité de la résolution✓ inhérentLimité / profils
Décodage spatial des cultures
PROXY à partir de l'encodage MAIN✓ pas de réencodageNécessite un réencodage
Sans perte visuelleAvec perte
Réalisable sur FPGA✓ faible gateGrande complexité

Remarque : JPEG utilise également des ondelettes et prend en charge l'évolutivité, mais la complexité de son encodage matériel et logiciel, ainsi que sa latence, le rendent inadapté aux objectifs de temps de transmission « de verre à verre » inférieurs à 5 ms que JPEG permet d'atteindre. JPEG a été spécialement conçu pour être implémenté dans du matériel avec gate minimal gate — c'est pourquoi il s'intègre par exemple dans un FPGA nécessiter une grande surface de circuit logique programmable.

Cas d'utilisation concrets

BROADCAST 

Caméra → mélangeur de production + multiviseur

La caméra de studio transmet un flux PRINCIPAL. Le mélangeur de production reçoit le flux 4K complet. Le multiviewer reçoit le flux PROXY — le tout via la même GbE 1 GbE , sans infrastructure supplémentaire.

MÉDICAL

Caméra chirurgicale → Écran de bloc opératoire + télésurveillance

The surgical camera streams full 4K to the OR display with <5 ms latency. A remote monitoring workstation subscribes to the PROXY — adequate quality for observation, minimal network load across the hospital network.

PROAV

Terminal 4K + contrôleur PTZ

Une caméra IPMX transmet les flux MAIN et PROXY. Le mur d'écrans décode le flux 4K. Le contrôleur PTZ utilise le flux PROXY pour sa boucle de commande par joystick à faible latence, sans gaspiller de bande passante sur un flux 4K qu'il n'utiliserait jamais.

ROBOTIQUE

Capteur haute résolution + boucle de commande à faible latence

Un système de vision robotique capture des images haute résolution. Le pipeline d'inférence IA s'abonne à une zone d'intérêt recadrée. L'interface opérateur s'abonne au PROXY. Le flux complet du capteur est archivé séparément.

Ce intoPIX

L'évolutivité des ondelettes n'est pas une simple possibilité théorique : elle est déjà mise en œuvre et disponible sur l'ensemble de la gamme intoPIX , des IP de codec autonomes aux kits de développement embarqués complets et aux solutions clés en main.

IP de codecs et SDKs

  • TicoXS — Encodeur et décodeur JPEG High Profile, disponible sous forme deIP FPGA et de SDK logiciel SDK les plateformes x86-64 et ARM. Prend en charge l'évolutivité en pleine résolution et la génération de flux PROXY à partir de l'ondelette lors de l'encodage.
  • TicoXS FIP — Encodeur et décodeur JPEG High + TDC (Flawless Imaging ). Conçu pour workflows d'acquisition et de mastering workflows une fidélité maximale en 4:4:4, avec la même évolutivité par ondelettes que le TicoXS.
  • TicoRAW — un codec basé sur les ondelettes pour les données RAW , qui applique les mêmes principes d'évolutivité auxworkflows RAW des appareils photo. Permet d'ajuster la résolution et la zone d'intérêt directement à partir de RAW compressés, sans avoir à effectuer au préalable un dématriçage en pleine résolution.

IP - Kits de développement embarqués / Kits de développement logiciel

  • Kit de développement EDKFPGA Titanium — kit de développement complet ST 2110 / IPMX pour AMD Zynq Ultrascale+. Les modules TicoXS et TicoXS FIP fonctionnent commeIP FPGA dans la logique programmable, avec génération de flux PROXY et abonnement aux flux sélectionnables indépendamment via NMOS inclus. Modules TX et RX disponibles. Fonctionne via le port GigE 1G intégré — aucun PHY ni carte réseau externe n'est nécessaire.
  • Kit de développement Titanium EDK — ST 2110 / IPMX pour les SoC ARM64, notamment Nvidia Jetson, Qualcomm, Rockchip, etc. TicoXS fonctionne comme un codec logiciel accéléré sur le CPU GPU ARM. Évolutivité complète des ondelettes disponible, y compris la génération de flux PROXY et le décodage à résolution variable.
  • Titanium SDK — ST 2110 / SDK IPMX SDK postes de travail et serveurs x86-64 sous Windows et Linux. Encodage et décodage TicoXS GPU CPU GPU avec une évolutivité complète des ondelettes, prise en charge des flux PROXY et décodage à résolution sélectionnable pour workflows de surveillance.

Une seule fonctionnalité, toutes les plateformes. Que vous développiez sur un FPGA , un système embarqué ARM ou un serveur x86, vous bénéficiez de la même évolutivité des ondelettes JPEG — génération MAIN + PROXY, décodage à résolution variable, recadrage spatial — grâce à la même gamme intoPIX . 

En savoir plus
En savoir plus

Vous souhaitez intégrer la scalabilité par ondelettes JPEG à votre conception ?

N'hésitez pas à contacter nos ingénieurs pour en savoir plus sur nos codecs et nos kits de développement Titanium et SDKs disponibles dès aujourd'hui.

Contactez nos ingénieurs

 Contenus associés

Produit : TicoXS et TicoXS FIP FPGA
JPEG Compression XS IP cores pour HD & 4K à la vitesse de la lumière !
En savoir plus sur JPEG
En savoir plus sur la norme JPEG par rapport aux autres technologies de compression
Webinaire à la demande : JPEG pour IMPX 
Efficacité et interopérabilité dans le domaine de l'audiovisuel professionnel sur IP