Libérer la bande passante vidéo : explorer les pixels, les composantes de couleur, le sous-échantillonnage chromatique et Bit Depth pour un ciblage précis
Dans cet article, vous en saurez plus sur :
Dans cet article, vous en saurez plus sur :
Le concept de bits par pixel (bpp)
Chaque pixel de couleur d'une image numérique est créé par une combinaison des trois couleurs primaires : rouge, vert et bleu. Chaque couleur primaire est souvent appelée "canal de couleur" ou "composante de couleur", et possède une gamme de valeurs d'intensité spécifiée par son bit depth. Le site bit depth pour chaque couleur primaire est appelé le "nombre de bits par canal", généralement compris entre 8 et 16 bits. Le"nombre de bits par pixel" (bpp) fait référence à la somme du "nombre de bits par canal de couleur", c'est-à-dire le nombre total de bits nécessaires pour coder les informations de couleur du pixel.
Une image RGB non compressée avec un bit depth de 8 bits par couleur aura 24 bpp ou 24 bits par pixels (8 bits pour le rouge, 8 bits pour le vert, 8 bits pour le bleu).
RGB, la base du signal de couleur
Il est possible de combiner les couleurs primaires avec des intensités différentes pour créer toutes les autres couleurs. Le format RGB (Red, Green Blue) propose de diviser l'information d'un pixel en 3 valeurs : une pour coder l'intensité du rouge, une autre pour le vert et la dernière pour le bleu. Chaque image d'un flux vidéo RVB est en fait la somme de 3 sous-images, chaque pixel d'un écran étant composé de 3 sous-pixels.
Le panneau affiche donc simultanément les images rouge, verte et bleue, et l'œil humain l'interprète comme une image pleine de couleurs. En jouant sur l'intensité de chacun des sous-pixels, il est donc possible de reproduire une large palette de couleurs RGB.
YCbCr, le signal séparant la luminance et les chrominances
Avec l'avènement de la télévision couleur, il est devenu nécessaire d'ajouter des informations de chrominance (couleurs) au signal de luminance historique (noir et blanc) en un seul signal.
YCbCr divise l'image en 3 composantes :
- Y = image en noir et blanc (luminance)
- U / Cb = image bleue / verte (chrominance obtenue par Y - Bleu)
- V / Cr = image jaune / rouge (chrominance obtenue par Y - Rouge)
Dans le monde numérique, les transformations de couleur réversibles (RCT) ou irréversibles (ICT) peuvent être utilisées pour convertir les images RGB au format de couleur YCbCr et vice versa.
Sous-échantillonnage chromatique pour réduire la largeur de bande
La plupart des signaux vidéo séparent la luminance des chrominances. Il a été établi que les yeux humains sont beaucoup plus sensibles au noir et blanc (luminance) qu'aux couleurs (chrominance). Dans un effort d'économie de bande passante, pourquoi ne pas réduire l'information sur les couleurs puisque la plus grande partie serait de toute façon perdue pour le spectateur ?
Chaque pixel de l'image finale est en fait reconstruit à partir des 3 composantes : Y, Cb et Cr. Le sous-échantillonnage chromatique consiste à réduire la résolution des composantes de couleur Cb et Cr sans introduire de compression réelle. Comme la luminance (Y) reste inchangée et constitue la principale information captée par l'œil humain, le résultat peut être assez impressionnant sur le contenu naturel. Il est souvent impossible de voir les différences entre une image sous-échantillonnée et l'original, à condition d'utiliser un format de sous-échantillonnage adapté.
La structure d'échantillonnage est définie par 3 nombres sur une matrice de 8 pixels (4x2). Le premier chiffre correspond au nombre d'échantillons de luminance (Y) par ligne, le deuxième au nombre d'échantillons de chrominance (Cb / Cr) sur la première ligne de pixels et le troisième au nombre d'échantillons de chrominance (Cb / Cr) sur la deuxième ligne de pixels.
Les 4 :4 :4 correspond à un format raw , sans compression, sous-échantillonnage ou perte de qualité. Chaque pixel de l'image finale est généré à partir d'un pixel de luminance Y, d'un pixel de chrominance Cb et d'un pixel de chrominance Cr - pixel rouge, pixel vert et pixel bleu dans le cas du RGB. Dans cette configuration, il n'y a pas de différence entre un signal RGB ou YCbCr. Cette configuration est utilisée dans le ProAV, les écrans d'ordinateurs, mais aussi dans le monde professionnel du cinéma. La bande passante très élevée représente un coût important.
Avec le 4 :2 :2 la résolution horizontale de la chroma est divisée par deux, c'est-à-dire que la même couleur Cb sera utilisée pour le rendu final de deux pixels (idem pour la couleur Cr). Avec une réduction de 33% du débit et une différence invisible à l'œil nu, ce format est le préféré dans le monde de la télévision.
Le 4 :2 :0 est le format est le sous-échantillonnage utilisé pour le grand public : Programmes TV, films, jeux vidéo, streaming vidéo... Dans ce cas, les images couleur (Cb et Cr) voient leurs résolutions horizontale et verticale divisées par deux.
Ici, la bande passante est réduite de 50 % par rapport au 4:4:4. L'œil humain étant plus sensible à la lumière qu'aux couleurs, la qualité visuelle reste excellente même en 4:2:0.
Le sous-échantillonnage chromatique consiste à passer, par exemple, d'un format 4:4:4 à un format 4:2:2, ce qui aura pour effet de réduire le nombre de bits par pixel (bpp) sans le comprimer réellement. En d'autres termes, lorsqu'un format 4:4:4 signifie 24 bpp (3 couleurs x 8 bits), seulement 16 bpp (2 couleurs x 8 bits) seront nécessaires dans un format 4:2:2 équivalent.
Comment calculer les Mbits par seconde (Mbps) ? Combien de bits par pixel (bpp) ai-je ? Quel est mon débit vidéo ?
Mbps = résolution en pixels x nombre d'images par seconde) x bpp
Prenons quelques exemples pour mieux comprendre comment nous calculons la taille d'un flux vidéo :
Exemple : 4K@24fps 444 8 bit non compressé
Résolution : 4K = 3840 x 2160 = 8 294 400 pixels
Résolution avec suppression : 4K = 4400 x 2250 = 9 900 000 pixels
Image par seconde (fps) : 24
Format: 444 8bit = 24 bpp (3couleurs x 8bits = 8+8+8)
9 900 000 pixels x 24 fps x 24 bpp = 5 702 400 000 bps = 5 702 Mbps = 5,7Gbps
Exemple : 4K@60fps 444 8 bit non compressé
Résolution : 4K = 3840 x 2160 = 8 294 400 pixels
Résolution avec suppression : 4K = 4400 x 2250 = 9 900 000 pixels
Image par seconde (fps) : 60
Format: 444 8bit = 24 bpp (3 couleurs x 8bits = 8+8+8)
9 900 000 pixels x 60 fps x 24 bpp= 14 256 000 000 bps= 14 256 Mbps =14,2Gbps
Exemple : Complet : HD@24 fps 444 8 bit non compressé
Résolution : FHD = 1920 x 1080 = 2 073 600 pixels
Résolution avec suppression : FHD = 2200 x 1125 = 2 475 000 pixels
Image par seconde (fps) : 24
Format: 444 8bit = 24 bpp (3 couleurs x 8bits = 8+8+8)
2 475 000 pixels x 24 fps x 24 bpp = 1 425 600 000 bps = 1 425 Mbps = 1,4Gbps
Exemple : 4K@60fps 422 8bit non compressé
Résolution : 4K = 3840 x 2160 = 8 294 400 pixels
Résolution avec suppression : 4K = 4400 x 2 250 = 9 900, 000 pixels
Image par seconde (fps) : 60
Format: 422 8bit = 16 bpp (3 couleurs avec sous-échantillonnage 4:2:2 = 8bits + 4bits +4bits)
9 900 000 pixels x 60 fps x 16 bpp = 9 504 000 000 = 9 504 Mbps = 9,5Gbps
On peut voir ici qu'en passant d'un format 4K60-4:4:4 à un format 4K60-4:2:2, les Mbps sont réduits (environ 33%) et ce grâce au sous-échantillonnage. Aucun algorithme de compression n'a été appliqué.
Réduire le "bpp" grâce à la compression !
Le nombre de données partagées, notamment les vidéos, a considérablement augmenté. Nous passons de la SD à la HD, puis à la 4K et à la 8K, et la situation ne cesse d'évoluer : une fréquence d'images plus élevée, une meilleure résolution, une plus grande précision et une gamme dynamique supérieure (HDR) impliquent une augmentation considérable de la quantité de données à transporter sur les réseaux.
La technologie de compression permet de gérer plus de pixels, plus de qualité sur une bande passante limitée en utilisant les dispositifs et infrastructures existants.
Un exemple rapide : Les câbles ethernet standard CAT5E peuvent facilement transporter 1Gbps. Mais la vidéo non comprimée atteint souvent 10 à 16 Gbps en 4K.. Les flux HD (720p) peuvent être transportés sur CAT5E, mais dès que l'on doit transporter 4K, compression est nécessaire ! Les codecs intoPIX sont le meilleur moyen de transmettre facilement du 4K en dessous de 1Gbps sans aucune latence et perte de qualité : en réduisant le bpp à 1,5, votre 4K en dessous de 1Gbps passe à 746 Mbps.
Découvrez le calculateur de compression vidéo intoPIX !
Notrecalculateur de compression vidéo est conçu pour vous aider à calculer le taux de compression dont vous avez besoin. Vous pouvez l'utiliser pour n'importe quelle application et n'importe quel codec.
Sélectionnez les paramètres de votre format vidéo et déterminez le taux de taux de compression requis pour transporter votre flux vidéo. Cela peut même vous aider à configurer votre taux de compression avec n'importe quel intoPIX IP -cores ou Fast SDK.