|
LA COMPRESSIONE
La compressione video è una specifica applicazione della tecnica di compressione dei dati, secondo cui un segnale che può essere interpretato come una serie di numeri (sia esso un flusso di parole, di musica o di immagini), viene schiacciato, compresso in un insieme numerico più piccolo.. Questa seconda serie di numeri essendo più piccola, pesa meno, quindi occupa meno spazio su disco e/o impiega meno tempo per essere trasferita via rete. La serie di numeri prima di essere letta di nuovo viene decompressa in un segnale simile a quello originale. È un processo della riduzione di banda o della velocità dei dati di un flusso video La compressione video è considerata un algoritmo dissipativo, in quanto scarta (o perde) alcune parti dell'informazione originale: le serie numeriche che vengono ricostruite non combaciano esattamente con l'originale. Questa perdita di definizione è accettabile finché si tratta di una non-perfetta definizione dei dettagli nell'immagine compressa: la misura dellefficacia di un algoritmo sta quindi nel livello di compressione a cui lalgoritmo può arrivare con la minima perdita o distorsione. Ci sono molti motivi diversi che possono indurre a comprimere un video, ma quella più evidente è il peso/tempo/costo di trasmissione dei dati. Bisogna premettere che la piattaforma di trasporto in assoluto più efficace e veloce al momento è Internet, ed è quindi evidente che per poter lavorare in rete su scala globale i supporti analogici come videocassette VHS, pellicole, e supporti broadcast (tipo beta) saranno soppiantati da supporti digitali basati su tecnologie legate a Internet. La velocità di trasmissione dei dati dipende da un ampio numero di fattori, non ultima la tecnologia stessa di trasmissione: un modem vecchio stile o un telefono cellulare trasmettono a 9600 bit/sec, mentre la fibra ottica ha una portata di alcuni Gb (miliardi di bit/sec). 2.1 Come funziona la compressione 1 byte = 8 bits 1 kilobyte = 1,024 bytes 1 megabyte = 1,024 kilobytes 1Mb (megabyte) = 8 milioni di bit Un segnale video broadcast digitalizzato non compresso utilizza approssimativamente 160 milioni di bit (cioè 20 Mb) al secondo Comprimendolo, lo stesso segnale broadcast può arrivare a pesare fino a 1 megabit (cioè 0,12 Mb) al secondo In qualità più bassa, come per esempio in qualità VHS, si può arrivare a datarate ancora più bassi Per ridurre le informazioni da memorizzare devono innanzitutto essere eliminate alcune di esse.: - I dati ripetuti nello stesso frame: in un fotogramma pixel vicini hanno caratteristiche di luminosità e colore simili. Il compressore sintetizzerà, quindi, queste informazioni eliminando la ridondanza spaziale. (persistenza spaziale) - I dati ripetuti in fotogrammi adiacenti: in frame successivi cè buona possibilità, tranne se non si tratta di scene differenti o particolarmente veloci, di trovare zone dimmagine con colori e luminosità simili (o uguali), per cui il compressore video accorperà questi dati, eliminando la ridondanza temporale. (persistenza temporale) - I dati di componenti del filmato non percepibili dallocchio umano: i valori di colore e luminosità dellimmagine (che viene elaborata scomponendola in piccoli blocchi quadrati di pixel, solitamente 16x16 o 8x8) vengono convertiti nei corrispondenti valori di frequenza video attraverso una funzione matematica, chiamata DTC. Poiché non sono percepibili generalmente le alte frequenze nelle scene animate (ad es. spostamento rapido di fumo, fronde, piccoli oggetti,), queste possono essere eliminate attraverso la quantizzazione; una maggiore quantizzazione causerà più perdita di informazioni e quindi peggiore qualità. Dopo che i dati sono stati compressi in base a calcoli temporali e spaziali, le rimanenti informazioni possono essere ulteriormente compresse utilizzando le tecniche cosiddette lossless (senza perdite). Queste tecniche vengono in genere denominate codifica dell'entropia. Lentropia è una misura matematica della quantità di informazione contenuta in una serie di numeri o altri simboli: la misura del contenuto intrinseco dell'informazione può quindi essere usato per calcolare quanta compressione in teoria è ancora applicabile alla serie numerica, ma la misura dell'entropia non dice nulla su come ottenere questa possibile compressione. Sono state sviluppate molte tecniche aritmetiche a partire da questa misura, che lavorano tutte sulla sostituzione di una serie di simboli con un unico simbolo, o sulla sostituzione di simboli che richiedono un gran numero di bits (numeri binari) con simboli che richiedono meno bit per essere rappresentati. Queste sostituzioni sono guidate dal calcolo dell'entropia per ogni simbolo nel flusso di dati 2.2 Tipologie di Frame I fotogrammi del filmato compresso possono essere di tipo I (Key Frame), P (Predicted Frame) e B (Frame Bidirectional): - Il key frame è un fotogramma memorizzato integralmente e compresso, dal quale sonori creati i successivi p-frame o b-frame. I nuovi codec ne inseriscono uno ad ogni cambio di scena. - Il predicted frame memorizza solamente le differenze rispetto al frame che lo precede, quindi userà poche informazioni. - Il b-frame archivia le differenze rispetto al frame che lo precede e a quello che lo segue (quindi saranno utilizzati ancor meno dati rispetto al p-frame). Più key-frame in un video ne aumenteranno la qualità (e la dimensione), più b-frame ne ridurranno lingombro ma ne riduce la qualità. |
hosting · ISOLE NELLA RETE · AUTISTICI.ORG / INVENTATI.ORG |