Pagina:Codifica numerica del segnale audio.djvu/42

Questa pagina è stata trascritta e formattata, ma deve essere riletta.

24

Codifica numerica del segnale audio

orale. Anche per le occlusive è possibile distinguere tra consonanti labiali (es.: “p” per le sorde o “b” per le sonore), alveolari (es.: “t” per le sorde o “d” per le sonore), o palatali (es.: “k” per le sorde o “g” in “gatto” per le sonore) in funzione della posizione di tale occlusione.

Un’altra classe di consonanti si ottiene utilizzando un’eccitazione di tipo vocalizzato, ma con un’irradiazione non esclusivamente ottenuta tramite le labbra. Ostruendo solo parzialmente la cavità orale con la lingua, si hanno le semivocali. A secondo della posizione della lingua stessa, si distingue tra consonanti palatali (es.: “r”) ed alveolari (es.: “l”). Bloccando totalmente l'irradiazione da parte della bocca (tramite le labbra o la lingua), l’irradiazione avviene solamente tramite le cavità nasali. Tali consonanti, dette appunto nasali, si distinguono, in funzione della posizione dell’occlusione, in labiali (es.: “m”) o palatali (es.: “n”).

Dal punto di vista della rappresentazione in frequenza dei fonemi non vocalizzati, data l’ampiezza dello spettro della loro eccitazione, si ha che la banda richiesta (circa 10 kHz) è notevolmente più estesa di quella dei vocalizzati (fig. 1.15). Dal punto di vista dell’ampiezza, invece, dato che l’eccitazione sfrutta flussi d’aria meno consistenti di quanto avviene per suoni vocalizzati e che la funzione di trasferimento presenta degli zeri, la potenza dei relativi fonemi è tipicamente inferiore (fig. 1.16) (es.: circa 0.03 mW nella pronuncia della “v”).

Un modello dell’apparato vocale per la pronuncia di consonanti è sostanzialmente differente da quello utilizzato per la pronuncia delle vocali. Innanzitutto per l’eccitazione è necessario affiancare al generatore periodico utilizzato per i suoni vocalizzati, un generatore di rumore. Inoltre, mentre la funzione di trasferimento del cavo orale per le vocali può essere approssimata da un filtro a soli poli (a causa delle risonanze), la funzione di trasferimento nel caso della pronuncia di consonanti presenta anche degli zeri a causa dei differenti tipi di irradiazione. Infatti, da un punto di vista qualitativo, l’energia necessaria per l’instaurazione di risonanze all'interno del cavo orale è da considerare persa se l’irradiazione avviene tramite le cavità nasali. Di conseguenza, alle frequenze di risonanza, la funzione di trasferimento presenta degli zeri. Dato che modelli digitali a poli e zeri portano a realizzazioni di complessità computazionale maggiore rispetto a quella di modelli a soli poli, si preferisce adottare ancora modelli a soli poli, ma di ordine maggiore di quelli utilizzati per i fonemi vocalizzati.