NGV

LA COMPRESSIONE

La compressione video è una specifica applicazione della tecnica di
compressione dei dati, secondo cui un segnale che può essere interpretato come
una serie di numeri (sia esso un flusso di parole, di musica o di immagini),
viene schiacciato, compresso in un insieme numerico più piccolo.. Questa
seconda serie di numeri essendo più piccola, pesa meno, quindi occupa meno
spazio su disco e/o impiega meno tempo per essere trasferita via rete. La serie
di numeri prima di essere letta di nuovo viene decompressa in un segnale
simile a quello originale. È un processo della riduzione di banda o della
velocità dei dati di un flusso video La compressione video è considerata un
algoritmo dissipativo, in quanto scarta (o perde) alcune parti
dell'informazione originale: le serie numeriche che vengono ricostruite non
combaciano esattamente con l'originale. Questa perdita di definizione è
accettabile finché si tratta di una non-perfetta definizione dei dettagli
nell'immagine compressa: la misura dellefficacia di un algoritmo sta quindi
nel livello di compressione a cui lalgoritmo può arrivare con la minima
perdita o distorsione. 

Ci sono molti motivi diversi che possono indurre a comprimere un video, ma
quella più evidente è il peso/tempo/costo di trasmissione dei dati. Bisogna
premettere che la piattaforma di trasporto in assoluto più efficace e veloce al
momento è Internet, ed è quindi evidente che per poter lavorare in rete su
scala globale i supporti analogici come videocassette VHS, pellicole, e
supporti broadcast (tipo beta) saranno soppiantati da supporti digitali basati
su tecnologie legate a Internet. La velocità di trasmissione dei dati dipende
da un ampio numero di fattori, non ultima la tecnologia stessa di trasmissione:
un modem vecchio stile o un telefono cellulare trasmettono a 9600 bit/sec,
mentre la fibra ottica ha una portata di alcuni Gb (miliardi di bit/sec).

 2.1	Come funziona la compressione 

  1 byte = 8 bits
  1 kilobyte = 1,024 bytes
  1 megabyte = 1,024 kilobytes
  1Mb (megabyte) = 8 milioni di bit

Un segnale video broadcast digitalizzato non compresso utilizza
approssimativamente 160 milioni di bit (cioè 20 Mb) al secondo Comprimendolo,
lo stesso segnale broadcast può arrivare a pesare fino a 1 megabit (cioè 0,12
Mb) al secondo In qualità più bassa, come per esempio in qualità VHS, si può
arrivare a datarate ancora più bassi

Per ridurre le informazioni da memorizzare devono innanzitutto essere eliminate
alcune di esse.:
-	I dati ripetuti nello stesso frame: in un fotogramma pixel vicini hanno
	caratteristiche di luminosità e colore simili. Il compressore
	sintetizzerà, quindi, queste informazioni eliminando la ridondanza
	spaziale. (persistenza spaziale)
-	I dati ripetuti in fotogrammi adiacenti: in frame successivi cè buona
	possibilità, tranne se non si tratta di scene differenti o
	particolarmente veloci, di trovare zone dimmagine con colori e
	luminosità simili (o uguali), per cui il compressore video accorperà
	questi dati, eliminando la ridondanza temporale. (persistenza
	temporale)
-	I dati di componenti del filmato non percepibili dallocchio umano: i
	valori di colore e luminosità dellimmagine (che viene elaborata
	scomponendola in piccoli blocchi quadrati di pixel, solitamente 16x16 o
	8x8) vengono convertiti nei corrispondenti valori di frequenza video
	attraverso una funzione matematica, chiamata DTC. Poiché non sono
	percepibili generalmente le alte frequenze nelle scene animate (ad es.
	spostamento rapido di fumo, fronde, piccoli oggetti,), queste possono
	essere eliminate attraverso la quantizzazione; una maggiore
	quantizzazione causerà più perdita di informazioni e quindi peggiore
	qualità.

Dopo che i dati sono stati compressi in base a calcoli temporali e spaziali, le
rimanenti informazioni possono essere ulteriormente compresse utilizzando le
tecniche cosiddette lossless (senza perdite).  Queste tecniche vengono in
genere denominate codifica dell'entropia. Lentropia è una misura
matematica della quantità di informazione contenuta in una serie di numeri o
altri simboli: la misura del contenuto intrinseco dell'informazione può
quindi essere usato per calcolare quanta compressione in teoria è ancora
applicabile alla serie numerica, ma la misura dell'entropia non dice nulla su
come ottenere questa possibile compressione.  Sono state sviluppate molte
tecniche aritmetiche a partire da questa misura, che lavorano tutte sulla
sostituzione di una serie di simboli con un unico simbolo, o sulla sostituzione
di simboli che richiedono un gran numero di bits (numeri binari) con simboli
che richiedono meno bit per essere rappresentati. Queste sostituzioni sono
guidate dal calcolo dell'entropia per ogni simbolo nel flusso di dati

 2.2	Tipologie di Frame 

I fotogrammi del filmato compresso possono essere di tipo I (Key Frame),
P (Predicted Frame) e B (Frame Bidirectional):
-	Il key frame è un fotogramma memorizzato integralmente e compresso, dal
	quale sonori creati i successivi p-frame o b-frame. I nuovi codec ne
	inseriscono uno ad ogni cambio di scena.
-	Il predicted frame memorizza solamente le differenze rispetto al frame
	che lo precede, quindi userà poche informazioni.
-	Il b-frame archivia le differenze rispetto al frame che lo precede e a
	quello che lo segue (quindi saranno utilizzati ancor meno dati rispetto
	al p-frame).

Più key-frame in un video ne aumenteranno la qualità (e la dimensione), più
b-frame ne ridurranno lingombro ma ne riduce la qualità.