Chroma Subsampling

(di Guglielmo Giani) – luglio 2017

Chroma subsampling è una tecnica video (digitale e non) che consente di comprimere il segnale di chroma mantenendo inalterato il segnale di luma.

[nda]
Data la natura tecnica dell’articolo, alcuni termini sono stati lasciati in inglese. L’autore ritiene che le moderne traduzioni non rendano giustizia. In particolare luma (luminanza) e chroma (crominanza) non sono stati tradotti per evitare confusione con unità di misura colorimetriche. La luminanza (luma) e la luminanza (luminance) sono due cose diverse.

Premessa storica
Alla fine degli anni Quaranta e nei Cinquanta era in corso una guerra fra i colossi americani della radiofonia per stabilire quale sarebbe stato il formato televisivo a colori. Timidi tentativi furono stati fatti prima della guerra, ma fu solo con lo sforzo bellico che la tecnologia progredì abbastanza da permettere una ricerca tecnologica su ampia scala. CBS, RCA, Philco ed altri combattevano per il podio a suon di brevetti. Nel 1949 la Federal Communications Commission (FCC) si espresse favorevolmente ad adottare il sistema CBS, che, nonostante la scarsa qualità, utilizzava la stessa banda passante (6 MHz) del segnale in bianco e nero. CBS fu subito scalzata dal gradino più alto del podio quando RCA presentò un sistema retro-compatibile con il ‘vecchio’ segnale televisivo in bianco e nero. RCA riuscì a trovare un sistema per trasmettere entrambi i segnali (bianco e nero e colori) senza utilizzare troppa banda passante.

Gli ingegneri della RCA adottarono un sistema di codifica brevettato nel 1938 da Georges Valensi, un ingegnere francese. Valensi ideò un metodo per convertire il segnale RGB acquisito dalle telecamere in un segnale Yuv, dove Y è la luma, u il segnale di chroma blu e v il segnale di chroma rosso (il segnale di chroma verde viene estrapolato dagli altri due segnali).

Lo spazio colore Yuv
L’utilizzo dello spazio colore Yuv nelle trasmissioni video a colori ha un duplice vantaggio: la retro-compatibilità con gli apparecchi in bianco e nero e la possibilità di comprimere il segnale visivo risparmiando banda passante.

Il segnale televisivo analogico a colori veniva trasmesso su due frequenze diverse: la luma su di un’onda portante a 1.75MHz e la chroma su di un’onda sotto-portante a circa 5.33MHz. Le televisioni in bianco e nero si potevano così sintonizzare sull’onda portante captando la luma escludendo o filtrando la chroma.

 

Immagine 1 – Separazione di un immagine video nei canali Y (luma) Cb (Chroma blu) e Cr (Chroma rosso)

 

La fisiologia del sistema occhio-cervello
L’altro grosso vantaggio dello spazio color Yuv è di poter comprimere il segnale televisivo con un minimo degrado della qualità delle immagini. Dal momento che il sistema occhio-cervello è più sensibile alle variazioni di luminanza piuttosto che di cromaticità, si può sfruttare questo principio per ottimizzare la compressione, dedicando più banda alla luminanza (Y) e meno alla chroma (u e v). Il vantaggio è tale che è tuttora utilizzato in ambito digitali (YCbCr).

Chroma subsampling
Come abbiamo menzionato in apertura, il subsampling viene applicato solo ai dati riguardanti la chroma e non la luma: i valori di luma non vengono compressi o alterati.

La quantità di compressione effettuata dalla chroma subsampling è normalmente indicata con una notazione a tre cifre J:a:b (es. 4:2:2) che descrive il numero di campioni di luma e di chroma in un’area ipotetica di J pixel di larghezza per due pixel d’altezza.

J è la dimensione orizzontale (lo standard è di quattro pixel – a parte l’isolato caso del codec SONY HDCAM a tre pixel), il secondo numero ‘a’ indica quanti colori vengono campionati dalla prima riga ed il terzo numero ‘b’ indica quanti colori vengono campionati dalla seconda riga.

 

Immagine 2 – Esempi di un segnale video RGB sottoposto a chroma subsampling e ricostruito

 

Nonostante ci siano diversi tipi di chroma subsampling, molti dei formati digitali odierni utilizzano uno dei quattro tipi illustrati nell’immagine 2.

4:4:4

Questa è la qualità più alta ottenibili e non contiene subsampling. Ogni pixel conserva i valori di luma e di chroma inalterati. Le videocamere professionali, i sistemi di telecine e gli scanner hanno la capacità di registrare in 4:4:4.

4:2:2

4:2:2 campiona la chroma da due pixel in entrambe le righe. Ciò riduce l’informazione cromatica al 50%. Questo è uno dei subsampling più popolari e si trova nei codec come AVC-Intra 100, Digital Betacam, Panasonic DVCPRO HD, Apple ProRes 422 e XDCAM HD422.

4:1:1

4:1:1 campiona la chroma solo dal primo pixel di entrambe le righe. Ciò riduce l’informazione cromatica al 25%. Questo subsampling si trova nei codec DVCPRO, DVCAM, e nel NTSC DV.

4:2:0

4:2:0 preleva due campioni di cromatura dalla riga ‘a’ e nessuno dalla riga ‘b’. La riga inferiore ‘b’ ottiene le informazioni di chroma dalla riga superiore ‘a’. Ciò riduce le informazioni cromatica a circa il 25. Questo subsampling è comune nei filmati HDV, AVCHD, Apple Intermediate Codec e in molti dei formati video codificati in MPEG utilizzati dalle fotocamere DSLR. I filmati online e le immagini salvati in JPEG utilizzano questo tipo di subsampling.

Per i pixel in cui non viene campionata la chroma, l’informazione cromatica viene prelevata dal pixel adiacente a sinistra o sovrastante. Per esempio nel caso di 4:2:2 i pixel della seconda e della quarta colonna utilizzeranno gli stessi valori di chroma della prima e della terza colonna rispettivamente. Nel caso di 4:1:1 i pixel della seconda, terza e quarta colonna utilizzeranno gli stessi valori di chroma della prima.

Dall’immagine 2 può sembrare che i subsampling 4:2:2 e 4:2:0 comprimano troppo l’immagine e si perda molta informazione cromatica. Questo avviene perché’ gli otto pixel della nostra immagine originale contengono colori molto diversi fra loro. In realtà oggigiorno è altamente improbabile, se non impossibile, che un segnale (soprattutto se ricco di pixel come un’immagine FullHd o 4K) contenga pixel adiacenti così diversi fra loro. Molto spesso le transizioni da un colore ad un altro avvengono su più pixel (anti-aliasing e motion blur). Una campionatura 4:2:0 è indistinguibile da una 4:4:4 se non confrontando i singoli pixel a valori di zoom superiori al 200%. Maggiore è la risoluzione dell’immagine e migliore è la resa del subsampling.

Campionature di alta qualità come 4:4:4 e 4:2:2 vengono utilizzate in fase di post-produzione, color-grading e soprattutto per la chroma key, dove bisogna ritenere il maggior numero di dati cromatici per non incorrere in artefatti dell’immagine quali: banding, clipping delle ombre e dei colori più saturi.

Con l’avvento di servizi di streaming e video on-demand in 4K (Netflix, Amazon Prime e YouTube) la chroma subsampling (insieme ad altri metodi di compressione) gioca un ruolo chiave nel mantenere la quantità di dati trasmessi a valori compatibili con la banda passante delle moderne linee ADSL e delle reti telefoniche 4G.

 

Annunci

Distribuiamo in esclusiva sul territorio italiano tutti i prodotti e servizi legati al sistema NCS – Natural Colour System®©. NCS – Natural Colour System®© è un sistema logico di ordinamento dei colori che si fonda cu come questi vengono percepito dall'uomo.

Tagged with: , , , , , , , , , , , , , , , , ,
Pubblicato su Scienza

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: