Codifica numerica del segnale audio/Prefazione

Questo testo è stato riletto e controllato.

Daniele Sereno, Pietro Valocchi - Codifica numerica del segnale audio (1996)

Prefazione

Informazioni sulla fonte del testo

◄

Indice

Capitolo 1

►

[p. xi modifica]

PREFAZIONE

Il linguaggio rappresenta ancora il mezzo di comunicazione più desiderabile per trasferire informazione tra esseri umani. Sebbene l’avvento della Information Technology ci abbia abituati e ci abituerà sempre più a considerare congiuntamente espressioni dell’informazione diverse, quali voce, immagini e testi, la comunicazione vocale riveste ancora un’importanza prioritaria. A seguito del salto tecnologico dal mondo analogico al mondo digitale, l’esigenza di comprimere più informazioni vocali su un generico canale di trasmissione numerica ha determinato lo sviluppo di tecniche di codifica vocale sempre più spinte, sfruttando in modo profondo le caratteristiche dell’apparato di produzione e di ricezione del segnale. Sebbene tale esigenza di alti fattori di compressione sia stata smussata dalla disponibilità di canali di trasmissione ad altissima capacità (fibre ottiche), lo sviluppo esponenziale dei sistemi di comunicazione mobile ha continuato a stimolare l’ideazione di tecniche sempre più efficienti.

In questo testo si vuole offrire un quadro per quanto possibile completo ed aggiornato delle tecniche di codifica numerica di segnali audio per la loro trasmissione o memorizzazione. In particolare, non ci si vuole limitare a fornire una descrizione, sia pur approfondita, delle tecniche esistenti, bensì evidenziare quei principi alla base della codifica audio digitale, per permettere al lettore di analizzare autonomamente anche tecniche non descritte nel dettaglio.

Nel seguito si fa riferimento genericamente a segnali audio, volendo comprendere in essi sia il segnale vocale (al quale la presentazione è principalmente rivolta) sia segnali audio a banda larga (es.: audio HiFi). Nel campo delle telecomunicazioni, questo è giustificato principalmente dallo sviluppo delle trasmissioni numeriche che mettono a disposizione dell’utente canali ad elevato bit-rate. In tal modo è possibile offrire servizi (es.: teleconferenza, Audio on Demand, ecc.) che richiedono segnali audio a banda maggiore di quella telefonica.

Inoltre, considerare oltre alle problematiche di trasmissione quelle di memorizzazione risulta una scelta naturale, visto che l’unica (anche se non trascurabile) differenza tra le due applicazioni è nel ritardo con il quale l’informazione scambiata viene utilizzata. Presentare oltre agli standard per [p. xii modifica]telecomunicazioni quelli per audio digitale dell’elettronica consumer (es.: Compact Disk, Digital Compact Cassette, ecc.), offre uno scenario più completo del settore della codifica per coprire probabili futuri sviluppi.

Il tema della codifica audio è affrontato per gradi di complessità crescente. Il primo capitolo è relativo all'analisi del segnale audio analogico. In particolare, per il segnale vocale, vengono presentate le caratteristiche sia della sorgente (l’apparato vocale) sia della destinazione (l’apparato uditivo). Come sarà mostrato nel seguito (cap. 5 e 6), l’analisi del segnale vocale ha un ruolo fondamentale per lo sviluppo delle codifiche predittive e per modelli. D’altra parte, le caratteristiche dell’udito sono alla base dei codificatori percettivi (cap. 7), in grado di raggiungere elevati livelli di compressione con un degrado impercettibile della qualità del suono. Il primo capitolo è completato da una rapida presentazione delle tecniche di trasduzione elettro-acustica e delle caratteristiche del canale telefonico tradizionale.

La conversione analogico-digitale viene trattata nel secondo capitolo, separatamente dalle tecniche di codifica. La trasformazione della sorgente da analogica a discreta è infatti il punto di partenza per eventuali successive tecniche di compressione. La trattazione ha il fine di evidenziare quale siano le alterazioni subite dal segnale per capire come sia possibile minimizzarle in fase di codifica. Il capitolo è completato con un accenno sugli aspetti implementativi dei convertitori A/D e D/A.

Eseguito il mappaggio della sorgente da analogica a discreta, nel terzo capitolo vengono richiamati alcuni risultati fondamentali della teoria dell’informazione. Lo scopo è innanzitutto quello di mostrare i limiti teorici sui rapporti di compressione ottenibili; inoltre, in tale ambito vengono presentate le tecniche per ridurre il flusso numerico di una sorgente discreta senza ridurre l’entropia dell’informazione da essa emessa. In tale capitolo si da un accenno anche alla quantizzazione vettoriale, in quanto, pur essendo associata a perdita di informazione, risulta una tecnica di compressione poco legata alla specifica sorgente, al contrario delle tecniche presentate nel seguito.

Il successivo quarto capitolo completa la presentazione dei codificatori che lavorano su campioni isolati del segnale sfruttando differenti mappaggi da continuo a discreto. La compressione che si ottiene in tal modo avviene esclusivamente a spese di una degradazione del segnale che, però, può essere ritenuta trascurabile secondo specifici criteri di ottimizzazione. [p. xiii modifica] Ulteriori incrementi del grado di compressione si possono ottenere trattando non più campioni isolati, ma blocchi di essi, come mostrato nel quinto capitolo. Anche in questo caso, è necessario distinguere tra tecniche in grado di ridurre il flusso numerico della sorgente a spese di una degradazione del segnale e tecniche che, come la codifica predittiva, permettono di eliminare esclusivamente la ridondanza in esso contenuta. La codifica predittiva è esaminata con un certo dettaglio in quanto, oltre alla sua importanza intrinseca, è di base per le tecniche di codifica per modelli presentate nel capitolo successivo.

Il sesto capitolo è, infatti, relativo alle codifiche per modelli. Tali tecniche sono un punto di arrivo delle tecniche di codifica che lavorano nel dominio del tempo ed infatti in esse si ritrovano tracce di quasi tutte le tecniche precedentemente esposte.

L’ultimo capitolo è relativo alle codifiche nel dominio della frequenza. Seguendo la loro evoluzione, vengono dapprima analizzati i codificatori nel dominio della frequenza di forma d’onda, che tendono ad una fedele ricostruzione del segnale d’ingresso. Nel seguito vengono analizzati i codificatori percettivi che, sfruttando le caratteristiche dell’apparato uditivo, introducono concetti innovativi sui criteri da adottare per valutare la qualità del segnale elaborato.

Il testo è focalizzato sulla parte algoritmica della codifica: gli aspetti implementativi, salvo casi di particolare importanza, sono trattati a livello descrittivo o rimandati in appendice. Gli algoritmi scelti sono stati selezionati tra quelli effettivamente utilizzati negli standard esistenti o tra quelli che maggiormente agevolano la comprensione delle tecniche impiegate. La trattazione matematica svolta nel testo presuppone nozioni di analisi matematica, processi aleatori, teoria ed elaborazione numerica dei segnali fomiti normalmente da corsi a livello universitario.