Pagina:Codifica numerica del segnale audio.djvu/28

10 Codifica numerica del segnale audio

Per valutare come tale indeterminazione si traduca in termini di frequenze, è necessario innanzitutto osservare che la posizione “x” del massimo di risonanza sulla membrana non varia linearmente con la frequenza “f". Approssimativamente il loro legame è esprimibile come [Kin82]

  (1.1)

Per tale non linearità del mappaggio tra ascissa e frequenza, l’indeterminazione sulla posizione dei massimi di risonanza in un intervallo di ampiezza costante al variare della frequenza, si traduce in un’indeterminazione sulla frequenza dei segnali all'interno di una banda di ampiezze crescenti all'aumentare della frequenza del segnale stesso. Approssimativamente, l’ampiezza di tali bande può essere posta pari al 20% della loro frequenza centrale. Noto che un’ottava corrisponde ad un intervallo di frequenze gli estremi del quale sono in rapporto 2:1, tali bande hanno una spaziatura pari a circa 1/3 d’ottava. Di conseguenza, la risoluzione dell’apparato uditivo non è costante in frequenza, ma si riduce all'aumentare di questa e ciò giustifica l’utilizzo di scale logaritmiche per essa in acustica. Infatti anche il legame tra l’altezza del suono percepito e la frequenza del segnale è non lineare, ma può essere approssimato come [Del93]

  (1.2)

L’unità di misura della grandezza in uscita da tale relazione è il mel. Ulteriore parametro da tenere in conto nell'analisi della selettività in frequenza, è la sua dipendenza dal livello del segnale. Infatti, dato che l’ampiezza dell’intervallo di risonanza aumenta all'aumentare del livello del segnale, la risoluzione peggiora all'aumentare del livello stesso.

L’analisi della sensibilità al livello del segnale e della selettività in frequenza dell’apparato uditivo è particolarmente importante in quanto da essi dipendono l’esistenza di fenomeni di mascheramento. Il mascheramento consiste nell'impossibilità di percepire componenti del segnale in presenza di componenti di maggiore potenza posti (nel tempo ed in frequenza) in loro prossimità. Nel caso di segnali di elevata potenza che precedono temporalmente dei segnali deboli (all'interno di un intervallo di circa 15 ms) si parla