Pagina:Codifica numerica del segnale audio.djvu/36

18 Codifica numerica del segnale audio

dal fonema emesso) con forma d’onda approssimativamente triangolare asimmetrica (con tempo di salita maggiore del tempo di discesa) e con un tempo di apertura che varia dal 30% al 70% del periodo T. Indicando con τ1 e τ2 rispettivamente la durata del ramo crescente e decrescente della forma d’onda, una sua approssimazione analitica è ottenibile come [Rab78]

  (1.5)

alla quale corrisponde uno spettro che, essendo, l’eccitazione periodica, è a righe equispaziate in frequenza di un valore pari alla fondamentale del segnale {pitch). A causa della differente lunghezza delle corde vocali, la fondamentale dell’eccitazione varia nell'intorno dei 125 Hz per la voce maschile, mentre ha frequenza doppia per quella femminile. Fissato il parlatore, le variazioni nella fondamentale dell’eccitazione sono principalmente legate all'intonazione. Per quanto riguarda l’inviluppo dello spettro, questo decade esponenzialmente con la frequenza di circa 12 dB/ottava. Fig. 1.10 - Caratteristiche dell’eccitazione per suoni vocalizzati.

Data la non stazionarietà del segnale vocale, è necessario precisare che l’analisi in frequenza deve essere eseguita su segmenti di segnale limitati in un intervallo temporale all'interno del quale la sorgente può essere approssimata come quasi stazionaria. La voce, in generale, è considerabile un segnale quasi stazionario se si limita l’analisi ad intervalli di una decina di ms.