Realizacja-Podstawy


Dźwięk jest zjawiskiem fizycznym, które towarzyszy nam wszędzie. Dźwiękiem odbieranym przez człowieka jest zjawisko drgania cząstek powietrza w zakresie częstotliwości od 16 herców do 20 kiloherców. Pasmo to nazywa się pasmem akustycznym. Konstrukcja ludzkiego aparatu słuchowego sprawia, że jest ono ograniczone do tych właśnie wartości.

Podstawowym warunkiem zaistnienia zjawiska dźwiękowego jest obecność ośrodka, którego cząsteczki mogą zostać wprawione w ruch. W próżni zjawisko to nie zachodzi. Dźwięk jest zaburzeniem falowym. Gdy na przykład rzucimy do wody kamień, spowodujemy zaburzenie pewnego ustalonego porządku, wywołując powstanie ruchu o charakterze falowym. Oznacza to, iż np. wibracje instrumentów, powodując cykliczne rozrzedzanie i zagęszczanie molekuł powietrza wymuszają ruch fali dźwiękowej, która docierając do ucha powoduje efekt słyszenia dźwięku. Proces ten w prosty sposób zobrazować można na podstawie pracy głośnika. W momencie, gdy jego membrana wychyla się na zewnątrz powietrze zostaje zagęszczone i jego ciśnienie jest wyższe od atmosferycznego. W przypadku wychylenia membrany do wewnątrz powietrze zostaje rozrzedzone, osiągając ciśnienie niższe od atmosferycznego. Tak wytworzona, przez poruszające się poprzez reakcję łańcuchową molekuły powietrza, fala rozchodzi się z prędkością 1200 km/h. Im większa jest intensywność wibracji tym wyższa jest amplituda szczytowa, a co za tym idzie głośniejszy jest dźwięk. Jedna fala oznacza jedno pełne drganie określane mianem cyklu.

Częstotliwość

Częstotliwość jest pierwszą podstawową cechą fizyczną charakteryzującą zjawisko dźwięku. Dla określenia wartości częstotliwości wprowadzono jednostkę zwaną hercem, od nazwiska niemieckiego fizyka Heinricha Rudolfa Hertza (1857-1894). Jeden herc reprezentuje jeden pełen cykl w ruchu falowym, to znaczy od szczytu do następnego szczytu fali. Dzieje się tak, bowiem właściwą istotą dźwięku są drgania. Charakterystyczną cechą drgań jest ich okres. Ilość takich drgań (okresów) zachodzących w ciągu sekundy określana jest w okresach na sekundę. I wówczas jedno drgnięcie (okres) w ciągu jednej sekundy określane jest jako 1 Hz (herc). 1500 drgań w ciągu 1 sekundy to 1500 Hz. A ilość drgań w ciągu jednej sekundy oznacza częstotliwość (wysokość) danego dźwięku. Dla muzyków, wysokość dźwięku „a” odpowiada 440 okresom/sekundę, czyli 440 Hz Dźwięki z zakresu leżącego poniżej pasma akustycznego, zwane są infradźwiękami i odbieramy je jako serię impulsów, natomiast dźwięki mające częstotliwość powyżej 20 kHz to ultradźwięki. Mogą być one przez niektórych ludzi odbierane raczej jako odczucie niż wrażenie słuchowe. W tej części zostaną omówione pozostałe wielkości związane z dźwiękiem. Należy pamiętać, że każdy instrument wytwarza częstotliwości w pewnym określonym przedziale.

Zła charakterystyka częstotliwościowa

Charakterystyka czestoliwościowa jest odpowiedzią – sposobem, w jaki głośnik reaguje na pobudzenie go sygnałem o stałej amplitudzie i częstotliwości równomiernie zmieniającej się od najniższych basów do najwyższych sopranów. Głośniki posiadające nierównomierną charakterystykę, będą „podbijały” dźwięk nienaturalnie. Głośnik o charakterystyce płaskiej brzmieć będzie naturalniej niż ten, którego charakterystyka jest poszarpana. Poza tym, płaskość charakterystyki częstotliwościowej umożliwia w dużym stopniu redukcję sprzężeń między mikrofonem a głośnikami. Jeśli bowiem głośniki wykazują duże uwypuklenie charakterystyki w pewnym przedziale, to może się okazać, że mikrofon zareaguje na ten szczyt i na tej właśnie częstotliwości zacznie się sprzęgać.

Bezpośredni związek z częstotliwością fali dźwiękowej ma jej długość. Ponieważ prędkość dźwięku jest ograniczona i wynosi średnio 331,8 m/s, łatwo można obliczyć, że fala o częstotliwości np. 100 Hz ma długość równą 331,8/100 = 3,32 metra. Wynika to ze wzoru na długość fali dźwiękowej. Długość fali = cT=c/F, (gdzie c to prędkość rozchodzenia się fali w metrach na sekundę (m/s), T to okres – w sekundach (s), natomiast F to częstotliwość drgań, podawana oczywiście w hercach (Hz)). Długość fali nie jest bez znaczenia z naszego punktu widzenia, bowiem gdy dokonujemy odsłuchu w zamkniętym pomieszczeniu, fala bezpośrednia z głośnika i fala odbita od przeciwległej ściany, a następnie odbita ponownie, mogą nałożyć się na siebie, powodując powstanie tzw. fali stojącej. Praktycznym tego efektem jest osłabienie lub wzmocnienie odbioru konkretnej częstotliwości w tym pomieszczeniu w zależności od tego, czy głowa słuchającego znajduje się w węźle takiej fali, gdzie następuje zanik ciśnienia akustycznego, lub też przeciwnie – tam, gdzie amplitudy fal są najwyższe. W praktycznie każdym pomieszczeniu może występować kilka takich częstotliwości. Na przykład, jeśli pokój ma długość 3 metrów, a głośniki ustawione są przy jednej ze ścian, do przeciwległej ściany pozostaje dystans równy 3 metrom. Na tym dystansie mogą powstać fale stojące o długościach 3 metrów, 1.5 meta, 0.75 meta, itd. Można obliczyć, że w tym konkretnym przypadku będziemy mieli do czynienia z upośledzeniem odsłuchu dźwięków o częstotliwościach 110,6 Hz, 221,2 Hz, 442,4 Hz i tak dalej. Zmiany te mogą być odczuwalne w zakresie niskich częstotliwości niosących największą część energii dźwiękowej, należy jednak mieć na uwadze fakt, że częstotliwości średnie i wysokie mogą być lekko zafałszowane. Jest to prosty przykład i ma sygnalizować problem przy właściwym przygotowaniu pomieszczenia do odsłuchu. Między innymi z faktu istnienia fal stojących wynika, bowiem konieczność stosowania adaptacji akustycznych pomieszczeń, w których pracuje się nad dźwiękiem. Szerzej na ten temat w dziale akustyka oraz innych artykułach naszego serwisu.

Amplituda

Dźwięki możemy charakteryzować nie tylko z uwagi na wcześniej wymienione elementy, lecz również pod względem amplitudy fali je wywołującej. Aby przedstawić to zagadnienie obrazowo należy wyobrazić sobie fale o różnych wielkościach, fale małe i duże. Wysokość takich fal nazywa się amplitudą. Wielkość amplitudy fali ma bezpośredni wpływ na głośność, a ściślej na wrażenie głośności, jakie odbiera nasze ucho. Czułość ludzkiego słuchu zmienia się w miarę zwiększania lub zmniejszania częstotliwości dźwięku. Szerzej na ten temat w tym dziale sekcja słuch. W tym miejscu można jednak zasygnalizować, że dźwięki w zakresie 2kHz do 4kHz, są odbierane najsilniej prze ludzkie ucho. Tę cechę zawdzięczamy naturze, która tak pokierowała rozwojem narządu słuchu, aby był jak najbardziej wyczulony na odgłosy mowy. Amplituda drgań cząsteczek powietrza jest, zatem następną ważną cechą zjawiska dźwięku. Z wartością amplitudy jest bezpośrednio związane natężenie dźwięku.

Natężenie dźwięku

Natężenie dźwięku, w międzynarodowym systemie miar SI jest określane za pomocą jednostki W/m2 (wat przez metr kwadratowy). Jednostka ta nie wyraża w sposób bezpośredni głośności dźwięku, gdyż jest to odczucie subiektywne, lecz określa ilość energii akustycznej padającej na jednostkę miary powierzchni. Ponieważ nie jest to zbyt wygodne, a przy tym nie odpowiada logarytmicznej charakterystyce czułości ludzkiego słuchu, natężenie wyrażane jest za pomocą skali logarytmicznej i jednostki zwanej decybelem (dB), będącej pochodną od bela (B), który jest zbyt dużą wartością dla zastosowań w akustyce. Pomijając szczegóły, warto pamiętać, że ze zmianą poziomu natężenia dźwięku o 6 dB subiektywnie odbierana głośność zwiększa się dwukrotnie lub zmniejsza o połowę niezależnie od wartości początkowej. Dla bardziej wnikliwych natężenie dźwięku I, sprowokowanego falą sinusoidalną, opisuje się następującym wzorem I=Pa/S (gdzie Pa oznacza moc akustyczną, natomiast S to powierzchnia prostopadła do kierunku rozchodzenia się fali. Z kolei ciśnienie akustyczne to ciśnienie zmienne, wywierane przez cząsteczki powietrza, dzięki którym wrażenia dźwiękowe są odbierane.

Faza

Faza jest określeniem przebiegu cyklu w czasie. Jest ona mierzona w jednostkach stopni (lub radianach), rozpoczynając od 0, a kończąc na 30. W przypadku, gdy porównujemy dwie identyczne fale dźwiękowe, z których jedna jest względem drugiej opóźniona, możemy mówić o przesunięciu fazowym między nimi. Przesunięcie fazowe mierzone jest również w stopniach i jest tym większe, im większe opóźnienie występuje między falami. Jeśli dwie fale przesuną się względem siebie o 180 stopni, to nastąpi ich wzajemne zniesienie (wyciszenie).

Harmoniczne i Obwiednia

Najczęściej występujące w naturze dźwięki – o przebiegu złożonym – składają się z tonu podstawowego, zwanego pierwszą harmoniczną oraz przytonów zwanych tonami harmonicznymi. Te właśnie harmoniczne określają charakterystykę dźwięku i jego barwę. Sprawiają one, iż dwa dźwięki posiadające te samą częstotliwość, wyzwolone z różnych instrumentów np. gitary i skrzypiec brzmią inaczej. Kolejną cechą charakterystyczną dźwięku jest zmieniający się poziom głośności w trakcie jego powstawania i trwania. Określany jest on mianem obwiedni, którą podzielić można na cztery etapy. Pierwszy to atak, jest to odcinek czasu w trakcie, którego dźwięk przechodzi z ciszy do maksymalnego poziomu. Drugi etap określany mianem schyłku określa drogę, w której dźwięk przechodzi z maksymalnej głośności do poziomu średniego. Średni poziom określany jest mianem podtrzymania, a po nim następuje zwolnienie dźwięku, czyli odcinek czasu, podczas którego głośność dźwięku zanika do poziomu zerowego. Sygnał

Sygnał akustyczny po zmianie na przebieg elektryczny określany jest mianem sygnału fonicznego. Może on występować pod postacią sygnału analogowego lub cyfrowego. Sygnał analogowy ma przebieg analogiczny do sygnału akustycznego, natomiast sygnał cyfrowy powstaje w wyniku przetworzenia analogowego sygnału fonicznego na ciąg impulsów elektrycznych, przedstawiających liczby dwójkowe (jedynki i zera), określające wartość przebiegu analogowego, pobrane z niego w równych odstępach czasowych.

Prędkość Akustyczna

Wiadomo, że cząsteczki powietrza drgają, pobudzone przez źródło dźwięku. Aby osiągnąć konkretną częstotliwość drgań przy danej amplitudzie, cząsteczki muszą osiągnąć pewną prędkość ruchu. Podczas rozchodzenia się fali dźwiękowej nie zmieniają one położenia, jedynie oscylują wokół punktu spoczynkowego. Wykonują wtedy ruch wzdłuż lub w poprzek fali. Prędkość tej oscylacji zależy wprost od częstotliwości drgań oraz ich amplitudy.

Moc Akustyczna

Przez wielu wielkość ta kojarzona jest z głośnością dźwięku. Wartość ta charakteryzuje ilość energii wypromieniowanej przez źródło dźwięku do otoczenia. Moc akustyczna mierzona jest w watach (W). Natomiast pojęciem gęstości energii akustycznej posługujemy się w celu określenia ilości energii akustycznej w jednym metrze sześciennym ośrodka.

Zniekształcenia

Za różnego rodzaju zniekształcenia odpowiedzialne są niedoskonałe komponenty urządzeń. Pojawienie się ich może być obecne na każdym etapie wędrówki dźwięku. Zasadniczo zniekształcenia dzielimy na liniowe i nie liniowe. Ze zniekształceniami liniowymi mamy do czynienia, gdy dane urządzenie nie przenosi całości pasma doprowadzonego sygnału lub tłumi niektóre z jego składowych. Głos w słuchawce telefonicznej jest tego najlepszym przykładem. Innym prostym przykładem jest prosty odbiornik radiowy oraz jego głośnik, niemogący odtworzyć częstotliwości zbyt niskich ani wysokich. Charakterystyka częstotliwościowa danego urządzenia wykazuje nam jak przenoszone jest pełne pasmo akustyczne. Najlepszym rozwiązaniem jest płaska charakterystyka częstotliwościowa, to znaczy taka, która nie tłumi ani nie wzmacnia żadnych częstotliwości składowych. Jednak mało, które urządzenie ma taką charakterystykę. Stąd też często mówi się o tzw. nauce danego urządzenia wśród realizatorów. Ciekawostką może być fakt, że tak zwany kontur często stosowany w wieżach domowych jest w rzeczywistości wprowadzeniem zakłócenia liniowego wyższych częstotliwości. Innym rodzajem zniekształceń są zniekształcenia fazowe. Pojawiają się wówczas, gdy poszczególne częstotliwości składowe sygnału przechodzą przez dane urządzenie z różną prędkością, co powoduje powstawanie różnic czasowych między nimi. Zniekształcenia nieliniowe są inaczej zwane zniekształceniami amplitudowymi. Bierze się to stąd, iż wynikowa amplitud sygnału nie przebiega proporcjonalnie do amplitudy na wejściu układu. Ekstremalnym przykładem takiego zniekształcenia jest obcięcie części przebiegu, który ma tak dużą amplitudę, iż dany układ nie jest w stanie przenieść tego sygnału w sposób niezakłócony. Miarą zniekształceń jest wskaźnik ich zawartości w całym sygnale. W języku angielskim parametr ten zwany jest TOTAL HARMONIC DISTORTION , w skrócie THD i wyrażany jest w %. Odmianą tej miary jest THD + Noise, co oznacza zawartość częstotliwości harmonicznych oraz szumów. Nowoczesne technologie pozwalają na utrzymanie bardzo niskiego wskaźnika zniekształceń, na poziomie do 0,1. Z reguły większemu opóźnieniu podlegają częstotliwości wysokie niż niskie.

Szumy

Szumy dzielimy na szumy ważone oraz nieważone. Szum nieważony jest to szum zmierzony w naturalnej postaci, przy użyciu wartości bezwzględnych. Pomiar odbywa się w pełnym paśmie 22Hz do 22khz. Szum ważony natomiast to szum zmierzony z zastosowaniem filtra tzw. psofomerycznego, który symuluje charakterystykę częstotliwościową słuchu. Dla poziomu szumów miarą jest parametr oznaczony jako S/N , co oznacza Signal to Noise Ratio, czyli odstęp szumów od sygnału i mierzony jest w decybelach. Niektórzy producenci podają na ulotkach wartości obu pomierzonych szumów: ważonych i nieważonych. Mniejszy poziom oznacza wyższą klasę urządzenia.

Słuch.

Ludzkie ucho ma wiele słabych stron. Obok braku charakterystyki liniowej ucho ludzkie ma zdolność maskowania jednych dźwięków przez inne. Zjawisko to polega na tym, że dźwięk o niższym poziomie można zagłuszyć innym, głośniejszym, nawet o innej częstotliwości. Dźwięk cichszy, przy odpowiedniej różnicy poziomów, przestaje być słyszalny. Dowiedziono również, iż aby przywrócić słyszalność zagłuszonemu dźwiękowi, należy zwiększyć jego poziom w większym stopniu, jeśli dźwięk zagłuszający jest dźwiękiem o częstotliwości równej częstotliwości którejś z harmonicznych zagłuszanego. Zasadniczo zjawisko maskowania nie jest zbyt korzystne, jednak znalazło wiele swoich praktycznych zastosowań. Ot choćby układ redukcji szumów Dolby, lub kompresja plików dźwiękowych do formatu mp3. W przypadku formatu mp3 algorytm kompresji danych usuwa informację o częstotliwościach zagłuszonych, traktując ją jako zbędną. W przypadku mp3 wykorzystuje się również zdolności psychoakustyczne ludzkiego mózgu – usunięte częstotliwości mózg projektuje (odtwarza), a raczej daje nam odczuć jak brzmiałyby owe usunięte składowe, gdyby tam były! Jest to tzw. efekt brakującej częstotliwości fundamentalnej. W praktyce wygląda to następująco: gdyby do naszych uszu dotarły jednocześnie tony o częstotliwościach na przykład: 300, 450, 600, 750 i 900 herców, usłyszelibyśmy również ton wynikowy o częstotliwości 150 Hz. Słuch nasz traktując te jednoczesne tony jako harmoniczne „wyprodukowałby” częstotliwość fundamentalną, czyli właśnie 150 Hz. Dźwięk taki nazywamy tonem subiektywnym. Fenomen tego zjawiska jest często wykorzystywany w procesorach psychoakustycznych, np. w procesorze (wtyczce) MaxxBass, firmy ks Waves. A pojęcie „dudniący dźwięk”? Słyszeliście pewnie to nieraz…, Ale on tak naprawdę nie istnieje. Owo dudnienie powstaje w naszym mózgu. I jest to kolejny wynik słabej strony naszego układu słuchowego, polegającej na niezdolności słuchu do rozdzielenia dwóch dźwięków o bardzo zbliżonych częstotliwościach. Zjawisko to ma miejsce, gdy do uszu naszych docierają jednocześnie dźwięki o różnicy częstotliwości rzędu kilku lub kilkunastu herców. Pojawia się wówczas wyraźna pulsacja. W praktyce można spotkać to zjawisko strojąc np. gitarę. Osoby, które mają duży kontakt z dźwiękiem mogą spotkać się z tzw. zmęczeniem słuchu. Pojawia się ono wtedy, gdy pracuje się zbyt długo przy dużym natężeniu dźwięku. Zmęczenie słuchu powoduje obniżenie czułości słuchu i oznacza konieczność przerwania pracy nad dźwiękiem. Otóż słuch bardzo szybko przyzwyczaja się do zastosowanej korekcji. Należy zachować ostrożność przy dokonywaniu obróbki dźwięku, dlatego, że możemy zapędzić się w „ślepą uliczkę”, a efekty długotrwałej pracy z korektorami będą dalekie od oczekiwanych. Na koniec powtórki o słuchu warto przypomnieć, że graniczna wartość natężenia dźwięku, którą może znieść ludzkie ucho, to ok. 120 dB. Nazywamy ją granicą bólu i jest ona wykładnikiem dynamiki ludzkiego ucha. Działanie na błonę bębenkową powyżej tej wartości może mieć tragiczne skutki.

Monofonia i Stereofonia.

Nasz zmysł słuchu w sposób naturalny posiada charakter stereofoniczny. Dzięki niemu możemy określać przestrzenne umiejscowienie dźwięku. Badania nad stereofonią prowadzona już w latach 90-tych XIX wieku jednak praktyczne rozwiązanie znaleziono wiele lat później. Wcześniej przy braku wsparcia technologicznego korzystano jedynie z urządzeń monofonicznych, czyli przesyłających sygnał pojedynczym torem. Historycznie pierwszą próbę dokonania przekazu stereofonicznego przeprowadzono już w 1881 na wystawie światowej w Paryżu. Był to układ dwóch niezależnych torów fonicznych, z oddzielnymi mikrofonami oraz głośnikami. I choć system w niczym nie przypominał współcześnie rozumianej stereofonii, należy traktować go jako namiastkę stereofonicznego przekazu oraz dowód na to, że pojawiła się chęć transmisji przestrzennej. Pierwsze użytkowe systemy stereofoniczne zaczęły powstawać w latach dwudziestych naszego wieku, kiedy to uzyskano patent na pierwsze urządzenie tego typu oraz rozpoczęto próby transmitowania przekazu stereofonicznego. Człowiek słyszy przede wszystkim stereofonicznie. Oznacza to mniej więcej tyle, że słuch nasz jest w stanie lokalizować kierunki. Jednak nie do końca na zasadach klasycznej stereofonii, czyli prawo, lewo, środek, lecz elementy przestrzenne dźwięku nabierają dużo bardziej złożonego charakteru. Potrafimy określić, że dany dźwięk dobiega z góry, z tyłu, czy z dołu. Praktycznym wykorzystaniem tej cechy są systemy odtwarzające dźwięk przestrzenny, trójwymiarowy – Dolby Surround oraz system stereofonii „sztucznej głowy”. Z naszego punktu widzenia szczególnie interesujący jest system „sztucznej głowy”, zwanym w fachowym języku systemem binauralnym, jest w pewnym sensie rewolucyjnym podejściem do kwestii przekazu fonicznego. Wynalazek ten polega na umieszczeniu dwóch mikrofonów wewnątrz dokładnej makiety ludzkiej głowy, w miejscu, w którym znajdują się bębenki uszne. Podczas odsłuchu z wykorzystaniem słuchawek system ten zapewnia realistyczny odbiór przestrzenny zarówno w poziomie jak i w pionie. Ma jednakże jedną istotną wadę nie nadaje się do odsłuchu głośnikowego.