Podstawy Psychoakustyki


Psychoakustyka stara się odpowiedzieć na pytanie, jak postrzegany jest dźwięk przez ucho ludzkie, jakie są relacje pomiędzy obiektywnymi parametrami fali akustycznej (np. częstotliwości) a subiektywnymi, czyli postrzeganymi przez człowieka, cechami dźwięku (np. głośnością czy też wysokością tonu). W kręgu zainteresowania psychoakustyki leżą również badania zjawisk leżących u podstaw percepcji dźwięku.

Na poniższym rysunku przedstawiono budowę anatomiczną ucha, jego przekrój, natomiast opis można znaleźć tutaj.

Ważną cechą słuchu ludzkiego, charakteryzującego się ogromną dynamiką, jest dolna granica słyszenia, tzw. absolutny próg słyszenia. Na rysunku poniżej przedstawiono krzywą absolutnego progu słyszenia. Dźwięki, dla których wykres głośności przebiega poniżej tej krzywej są niesłyszalne dla ucha ludzkiego. Te zaś, których wykres się z nią pokrywa, są ledwo słyszalne.

Wiele badań psychoakustycznych wykazało, że system słuchowy człowieka przetwarza dźwięk w pewnych podpasmach, zwanych pasmami krytycznymi i w każdym z nich sygnał jest analizowany niezależnie od dźwięku w pozostałych. Każdemu pasmu krytycznemu odpowiada pewien odcinek na błonie podstawnej ślimaka równy 1,3 mm. Co więcej, system słuchowy może być modelowany jako zestaw filtrów pasmowo-przepustowych, dla których szerokość pasma jest równa szerokości odpowiedniego pasma krytycznego. Te jednak nie są jednakowe. Poniżej 500 Hz szerokość pasma krytycznego jest stała i wynosi 100 Hz. Powyżej 500 Hz szerokość każdego następnego pasma krytycznego jest o 20% większa niż dla poprzedniego pasma. Ponadto, różni badacze różnie definiują pasmo krytyczne i do najważniejszych definicje należą te podane przez Zwickera oraz Fletchera.

Ze względu na szerokie zastosowanie pasm krytycznych zdefiniowano perceptualną jednostkę dźwięku – bark (dla uczczenia pamięci niemieckiego naukowca Barkhausena, który wprowadził fon). Jeden bark odpowiada szerokości jednego pasma krytycznego. Zależność pomiędzy obiektywną skalą częstotliwości (wyrażoną w hercach) a subiektywną (wyrażoną w barkach) przedstawiono na poniższym wykresie.

Zjawiskami psychoakustycznymi odgrywającymi najważniejszą rolę w perceptualnej metodzie redukcji szumu oraz w wielu algorytmach stratnej kompresji sygnału fonicznego są zjawiska maskowania. W wyniku maskowania, pewne tony, pomimo że są obecne w docierającej do ucha fali akustycznej, stają się niesłyszalne. Rozróżniane są dwa rodzaje maskowania: maskowanie jednoczesne (w dziedzinie czasu) oraz niejednoczesne, zachodzące w dziedzinie częstotliwości, jak pokazano poniżej na rysunku.

Maskowanie jednoczesne, które odgrywa największą rolę, charakteryzuje się tym, że pewne tony stają się niesłyszalne w obecności innych – tzw. maskerów. Zależy ono od natężenia tonów: maskującego i maskowanego oraz ich częstotliwości. Zależność tę opisują tzw. krzywe maskowania dla maskerów o danym natężeniu i częstotliwości. Wszystkie dźwięki, dla których wartości natężenia leżą poniżej takiej krzywej, zostają zamaskowane i stają się niesłyszalne. Przykładowe krzywe maskowania zostały zaprezentowane na poniższych rysunkach. Warto zauważyć, że ich kształty są zróżnicowane i zależą od częstotliwości sygnału maskującego oraz od reprezentacji częstotliwości na osi odciętych, tj. od skali linowej lub logarytmicznej.

W przypadku, gdy częstotliwość wyrażona jest w barkach, krzywe maskowania przyjmują następujące kształty.

Zjawiska związane z właściwościami psychoakustycznymi ludzkiego ucha są szczegółowo opisane w bogatej literaturze przedmiotu.