Pagina:Codifica numerica del segnale audio.djvu/312

Questa pagina è stata trascritta e formattata, ma deve essere riletta.

294

Codifica numerica del segnale audio

A causa della sovrapposizione tra finestre, blocchi lunghi e corti generano rispettivamente blocchi di 512 e 128 coefficienti. Tali coefficienti vengono codificati innanzitutto scalandoli tramite un opportuno fattore di scala. Al fine di ridurre il flusso richiesto alla trasmissione di tali fattori di scala, per ogni 1024 campioni, nel caso di blocchi lunghi i coefficienti vengono raggruppati in 20 bande, mentre nel caso di blocchi corti si utilizza una serie di 4 gruppi di 12 bande. La trasmissione di un fattore di scala per ciascuna banda genera un flusso relativo di 8 kbit/s.

La successiva codifica dei coefficienti utilizza un modello percettivo simile a quello utilizzato nel MUSICAM. Il calcolo della soglia istantanea tiene conto sia degli effetti di mascheramento all’interno della banda che delle interazioni tra bande adiacenti. Nota la maschera si procede alla bit allocation. L’informazione relativa a quale allocazione sia stata prescelta viene trasmessa con una banda di circa 2 kbit/s.

I coefficienti vengono, infine codificati tramite una codifica di Huffman, con lunghezza variabile da zero a 19 bit.

7.3.3 Standard ISO/MPEG-1/Audio: Layer III

Un algoritmo che combina le caratteristiche del MUSICAM e dell’ASPEC è utilizzato nel Layer III della codifica ISO/MPEG- 1/Audio [IS092].

Il segnale è suddiviso in blocchi di 1152 campioni. Il bit rate di uscita è variabile in tempo reale tra 14 differenti possibili valori che vanno da 32 a 320 kbit/s. Nel caso di codifica a bit rate costante, è possibile considerare una bufferizzazione (bit reservoir) che permette di spostare bit di blocchi più esigenti in termini di flusso su quelli che lo sono meno.

La principale differenza nella codifica tra i primi due livelli dell’MPEG ed il terzo è che, in questo caso, alle uscite del banco dei filtri viene applicata una trasformata, rendendo il codificatore ibrido (per sottobande e trasformate) (fig. 7.17). Altre differenze si hanno dall'adozione di una quantizzazione non uniforme, da una segmentazione adattativa e da una codifica entropica delle uscite.

La trasformata, che è una trasformata coseno modificata (MDCT), viene applicata alle uscite del banco di filtri per aumentare la risoluzione dell’analisi in frequenza. Infatti, nel Layer I si era visto come per le frequenze inferiori, la