Pagina:Codifica numerica del segnale audio.djvu/314

Questa pagina è stata trascritta e formattata, ma deve essere riletta.

296

Codifica numerica del segnale audio

predizione può essere limitata ad una banda inferiore ai 7Khz o, al massimo, di 3kHz. Lo spettro attuale e la sua stima sono utilizzati per fissare una soglia di mascheramento che tenga in conto fenomeni di pre-eco.

Passando alla codifica dei coefficienti della MDCT, la quantizzazione adottata è logaritmica. Per controllare che la soglia di mascheramento calcolata dal modello sia rispettata, questa codifica (che è a perdita) è eseguita in maniera iterativa in due loop annidati, uno di calcolo ed uno di verifica.

La codifica dei fattori di scala è simile a quanto fatto per il Layer II. La quantizzazione è relativa a coppie di frequenze (granuli) ed è possibile trasmettere un solo fattore di scala per due granuli adiacenti. La codifica è a lunghezza variabile tramite una codifica statica di Huffman.

Un possibile campo di applicazione del Layer III è nella trasmissione di segnali a banda audio (20 kHz) su canali a 64 kbit/s (es.: ISDN).

7.3.4 Codifica ATRAC

La codifica ATRAC (Adaptive Transform Acoustic Coding) è la codifica utilizzata per il MiniDisc della Sony.

Anche questo è un codificatore ibrido, che utilizza una trasformata in cascata ad un banco di filtri (fig. 7.18). Per garantire una risoluzione paragonabile a quella delle bande critiche (migliore alle basse frequenze), il banco di filtri è costituito da filtri QMF [Appendice D], con bande di 0-5.5 kHz, 5.5-11 kHz e 11-22.05 kHz. All'uscita dei filtri è applicata una MDCT. Infine, coefficienti relativi a bande adiacenti sono raggruppati non uniformemente in blocchi chiamati Block Floating Unit (BFU), dando alle basse frequenze una risoluzione migliore delle alte.

Le finestre temporali utilizzate per la MDCT, che presentano overlap tra blocchi adiacenti (al fine di ottenere una buona risoluzione), hanno ampiezze che variano in maniera adattativa in funzione delle caratteristiche del segnale. Si hanno due modalità di funzionamento. La prima (long mode) ha una risoluzione temporale di 11.6 ms (512 campioni). La seconda modalità (short mode) ha una risoluzione di 1.45 ms (64 campioni) alle frequenze superiori e di 2.9 ms (128 campioni) alle inferiori. Alla buona risoluzione temporale alle bande superiori corrisponde una bassa risoluzione in frequenza e viceversa per le bande inferiori, coerentemente con gli aspetti percettivi. Il passaggio allo