Dom / NA/ Synteza i rozpoznawanie mowy. Nowoczesne rozwiązania

Synteza i rozpoznawanie mowy. Nowoczesne rozwiązania

Kompresja to jeden z najbardziej mitycznych tematów w produkcji dźwięku. Podobno Beethoven przestraszył nawet dzieci sąsiadów :(

W porządku, w rzeczywistości zastosowanie kompresji nie jest trudniejsze niż użycie zniekształceń, najważniejsze jest zrozumienie, jak to działa i dobra kontrola. Co jesteśmy teraz razem i widzimy.

Co to jest kompresja dźwięku

Pierwszą rzeczą, którą należy zrozumieć przed przygotowaniem, jest kompresja. praca z dynamicznym zakresem dźwięku... A to z kolei nic innego jak różnica między najgłośniejszym i najcichszym poziomem sygnału:

Więc, kompresja to kompresja zakresu dynamicznego... Tak, po prostu kompresja zakresu dynamiki, czyli innymi słowy zmniejszyć poziom głośnych części sygnału i zwiększyć głośność ciszy... Już nie.

Można rozsądnie zastanawiać się, dlaczego taki szum jest wtedy połączony? Dlaczego wszyscy mówią o przepisach na prawidłowe ustawienia kompresora, a nikt ich nie udostępnia? Dlaczego pomimo ogromnej liczby fajnych wtyczek, w wielu studiach nadal są używane drogie modele kompresorów vintage? Dlaczego niektórzy producenci stosują kompresory w ekstremalnych ustawieniach, a inni w ogóle ich nie stosują? A który z nich w końcu ma rację?

Zadania kompresji

Odpowiedzi na takie pytania leżą na płaszczyźnie zrozumienia roli kompresji w pracy z dźwiękiem. I pozwala:

Podkreśl atak dźwięk, uwydatnij go;
„Dopasuj” poszczególne partie instrumentów do miksu dodając im moc i „wagę”;
Zwiększenie spójności grup instrumentów lub całego miksu, taki pojedynczy monolit;
Rozwiązuj konflikty między instrumentami za pomocą łańcucha bocznego;
Popraw wady wokalisty lub muzyków dostosowanie ich dynamiki;
Z pewnym ustawieniem działać jako efekt artystyczny.

Jak widać, jest to nie mniej istotny proces twórczy niż np. wymyślanie melodii czy wprowadzanie ciekawych barw. W takim przypadku dowolne z powyższych zadań można rozwiązać za pomocą 4 głównych parametrów.

Główne parametry sprężarki

Mimo duża ilość programowe i sprzętowe modele kompresorów, cała „magia” kompresji pojawia się, gdy prawidłowe ustawienie główne parametry: Threshold, Ratio, Attack i Release. Rozważmy je bardziej szczegółowo:

Próg lub próg, dB

Ten parametr pozwala ustawić wartość, od której kompresor będzie działał (tj. kompresować sygnał audio). Jeśli więc ustawimy próg na -12dB, kompresor będzie uruchamiany tylko w tych miejscach zakresu dynamiki, które przekroczą tę wartość. Jeśli cały nasz dźwięk jest cichszy niż -12 dB, kompresor po prostu pozwoli mu przejść przez siebie, nie wpływając na niego w żaden sposób.

Stosunek lub stopień kompresji

Parametr ratio określa, jak mocno zostanie skompresowany sygnał przekraczający próg. Trochę matematyki, aby uzupełnić obraz: powiedzmy, że ustawiliśmy kompresor z progiem -12dB, stosunek 2:1 i zasilamy go pętlą perkusyjną, w której głośność odbicia wynosi -4dB. Jaki będzie wynik kompresora w tym przypadku?

W naszym przypadku poziom lufy przekracza próg o 8dB. Ta różnica zgodnie ze stosunkiem zostanie skompresowana do 4dB (8dB/2). W połączeniu z nieprzetworzoną częścią sygnału spowoduje to, że po przetworzeniu przez kompresor głośność odbicia będzie wynosić -8 dB (próg -12 dB + skompresowany sygnał 4 dB).

Atak, ms

Jest to czas, po którym sprężarka zareaguje na przekroczenie progu. Oznacza to, że jeśli czas ataku jest wyższy niż 0 ms - sprężarka zaczyna kompresować przekroczenie sygnału progowego nie od razu, ale po określonym czasie.

Wydanie lub odzyskanie, ms

Przeciwieństwo ataku – wartość tego parametru pozwala określić czas po powrocie poziomu sygnału poniżej progu sprężarka przestanie sprężać.

Zanim przejdziemy dalej, zdecydowanie zalecam pobranie znanej próbki, zawieszenie dowolnego kompresora na jej kanale i eksperymentowanie z powyższymi parametrami przez 5-10 minut, aby bezpiecznie zamocować materiał.

Wszystko inne parametry są opcjonalne... Mogą się różnić w różnych modelach sprężarek, częściowo dlatego producenci stosują różne modele w dowolnym konkretnym celu (na przykład jeden kompresor dla wokalu, inny dla grupy perkusyjnej, trzeci dla kanału głównego). Nie będę się rozwodził nad tymi parametrami szczegółowo, a tylko podam informacje ogólne aby zrozumieć, o co w tym wszystkim chodzi:

Kolano lub kolano (twarde / miękkie kolano)... Ten parametr określa, jak szybko zostanie zastosowany współczynnik: twardy wzdłuż krzywej lub gładki. Zwracam uwagę, że w trybie Soft Knee kompresor nie działa w linii prostej, ale uruchamia się płynnie (o ile jest to właściwe, gdy mówimy o milisekundach) kompresując dźwięk już przed wartością progową... Do przetwarzania grup kanałów i ogólnego miksu często używa się miękkiego kolana (ponieważ działa niewidocznie), a także do podkreślenia ataku i innych funkcji poszczególne instrumenty- twarde kolano;
Tryb reakcji: szczyt / RMS... Tryb szczytowy jest uzasadniony, gdy trzeba mocno ograniczyć wybuchy amplitudy, a także w przypadku sygnałów o złożonym kształcie, których dynamika i czytelność muszą być w pełni przekazane. tryb RMS jest bardzo delikatny dla dźwięku, pozwalając na jego pogrubienie przy jednoczesnym utrzymaniu ataku;
Patrz przed siebie... Jest to czas, po którym sprężarka wie, co to zabierze. Rodzaj wstępnej analizy przychodzących sygnałów;
Makijaż lub zysk... Parametr, który pozwala zrekompensować spadek głośności w wyniku operacji kompresji.

Pierwszy i najważniejsze porady, co usuwa wszystkie dalsze pytania dotyczące kompresji: jeśli a) rozumiesz zasadę kompresji, b) dobrze wiesz, jak ten lub inny parametr wpływa na dźwięk i c) udało ci się wypróbować kilka różne modele — nie potrzebujesz porady.

Jestem absolutnie poważna. Jeśli uważnie przeczytałeś ten post, eksperymentowałeś ze standardowym kompresorem twojego DAW i jedną lub dwiema wtyczkami, ale nadal nie rozumiesz, w jakich przypadkach musisz ustawić duże wartości ataku, jakiego współczynnika użyć i w jakim trybie przetwarzać oryginalny sygnał, wtedy będziesz nadal przeszukiwać Internet w poszukiwaniu gotowych przepisów, stosując je bezmyślnie w dowolnym miejscu.

Przepisy dotyczące precyzyjnego dostrajania kompresora to jak przepisy na dopracowanie pogłosu czy refrenu – pozbawione sensu i nie mające nic wspólnego z kreatywnością. Dlatego uporczywie powtarzam jedyny słuszny przepis: uzbrój się w ten artykuł, dobre słuchawki monitorowe, wtyczkę do wizualnej kontroli przebiegu i spędź wieczór z kilkoma kompresorami.

Podejmij działanie!

, Odtwarzacze multimedialne

Płyty, zwłaszcza te starsze, które zostały nagrane i wyprodukowane przed 1982 rokiem, były znacznie rzadziej miksowane i głośniejsze. Odtwarzają naturalną muzykę z naturalnym zakresem dynamiki, który jest zachowywany na płycie i tracony w większości standardów formaty cyfrowe lub formaty wysokiej rozdzielczości.

Są oczywiście wyjątki – posłuchaj niedawno wydanej płyty Stevena Wilsona z MA Recordings czy Reference Recordings, a usłyszysz, jak dobry może być dźwięk cyfrowy. Ale to rzadkość, większość współczesnych nagrań jest głośna i skompresowana.

Kompresja muzyki jest ostatnio przedmiotem poważnej krytyki, ale twierdzę, że prawie wszystkie twoje ulubione nagrania są kompresowane. Niektóre z nich są mniejsze, inne bardziej, ale wciąż skompresowane. Kompresja zakresu dynamiki jest kozłem ofiarnym dla słabego dźwięku muzycznego, ale mocno skompresowana muzyka nie jest nowym trendem: słuchaj albumów Motown z lat 60. To samo można powiedzieć o klasykach Led Zeppelin czy młodszych albumach Wilco i Radiohead. Kompresja zakresu dynamiki zmniejsza naturalny związek między najgłośniejszymi i najcichszymi dźwiękami na płycie, dzięki czemu szepty mogą być równie głośne jak krzyki. Ciężko znaleźć muzykę pop z ostatnich 50 lat, która nie została skompresowana.

Niedawno odbyłem miłą pogawędkę z założycielem i redaktorem Tape Op Larrym Crane'em na temat dobrych, złych i złych aspektów kompresji. Larry Crane współpracował z zespołami i artystami takimi jak Stefan Marcus, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi i Richmond Fontaine. Prowadzi również Studio Nagraniowe Jackpot! w Portland w stanie Oregon, gdzie mieszkają The Breeders, The Decemberists, Eddie Vedder, Pavement, R.E.M., She & Him i wiele, wiele innych.

Jako przykład zaskakująco nienaturalnie brzmiących, ale wciąż świetnych piosenek, przytaczam wydany w 2014 roku album Spoona They Want My Soul. Crane śmieje się i mówi, że słucha go w samochodzie, bo tam świetnie brzmi. Co prowadzi nas do innej odpowiedzi na pytanie, dlaczego muzyka jest kompresowana: ponieważ kompresja i dodatkowa „klarowność” sprawiają, że lepiej słychać ją w hałaśliwych miejscach.

Larry Crane w pracy. Zdjęcie Jasona Quigleya

Kiedy ludzie mówią, że lubią dźwięk nagrania audio, wierzę, że lubią muzykę, tak jakby dźwięk i muzyka były nierozłącznymi pojęciami. Ale dla siebie rozróżniam te pojęcia. Z punktu widzenia melomana dźwięk może być szorstki i surowy, ale dla większości słuchaczy nie będzie to miało znaczenia.

Wielu spieszy się, by zarzucić inżynierom masteringu nadużywanie kompresji, ale kompresja jest stosowana bezpośrednio podczas nagrywania, podczas miksowania, a dopiero potem podczas masteringu. Jeśli nie byłeś osobiście obecny na każdym z tych etapów, nie będziesz w stanie powiedzieć, jak brzmiały instrumenty i wokale na samym początku procesu.

Crane płonął: „Jeśli muzyk chce celowo sprawić, by dźwięk był szalony i zniekształcony jak płyty Guided by Voices, to nie ma w tym nic złego – pragnienie zawsze przeważa nad jakością dźwięku”. Głos wykonawcy jest prawie zawsze skompresowany, to samo dzieje się z basem, perkusją, gitarami i syntezatorami. Kompresja utrzymuje głośność wokalu na pożądanym poziomie przez cały utwór lub nieznacznie wyróżnia się na tle pozostałych dźwięków.

Prawidłowa kompresja może sprawić, że bęben będzie brzmiał żywszy lub celowo dziwny. Aby muzyka brzmiała świetnie, musisz być w stanie użyć do tego niezbędnych instrumentów. Dlatego potrzeba lat, aby dowiedzieć się, jak korzystać z kompresji i nie przesadzać. Jeśli inżynier miksu zbyt mocno skompresował partię gitarową, inżynier masteringu nie będzie już w stanie w pełni przywrócić brakujących częstotliwości.

Gdyby muzycy chcieli, abyś słuchał muzyki, która nie przeszła przez etapy miksowania i masteringu, to wypuszczaliby ją na sklepowe półki prosto ze studia. Crane mówi, że ludzie, którzy tworzą, edytują, miksują i masterują muzykę, nie są po to, by gubić się w stopach muzyków – od ponad wieku pomagają artystom od samego początku.

Ci ludzie są częścią procesu tworzenia, który tworzy niesamowite dzieła sztuki. Crane dodaje: „Nie chcesz wersji 'Dark Side of the Moon', która nie przeszła miksowania i masteringu”. Pink Floyd wydali piosenkę tak, jak chcieli ją usłyszeć.

Zastanówmy się nad pytaniem – dlaczego musimy zwiększać głośność? Aby słyszeć ciche dźwięki, które nie są słyszalne w naszym otoczeniu (na przykład, jeśli nie możesz słuchać głośno, jeśli w pomieszczeniu są obce odgłosy itp.). Czy można wzmocnić ciche dźwięki bez dotykania głośnych? Okazuje się, że możesz. Ta technika nazywa się kompresją zakresu dynamicznego (DRC). Aby to zrobić, musisz stale zmieniać aktualną głośność - wzmacniać ciche dźwięki, głośne - nie. Najprostsze prawo zmienności głośności jest liniowe, tj. głośność zmienia się zgodnie z prawem output_loudness = k * input_loudness, gdzie k jest współczynnikiem kompresji zakresu dynamicznego:

Rysunek 18. Kompresja zakresu dynamiki.

Gdy k = 1, nie dokonuje się żadnych zmian (głośność wyjściowa jest równa głośności wejściowej). Widelec< 1 громкость будет увеличиваться, а динамический диапазон - сужаться. Посмотрим на график (k=1/2) - тихий звук, имевший громкость -50дБ станет громче на 25дБ, что значительно громче, но при этом громкость диалогов (-27дБ) повысится всего лишь на 13.5дБ, а громкость самых громких звуков (0дБ) вообще не изменится. При k >1 - głośność zmniejszy się, a zakres dynamiczny wzrośnie.

Spójrzmy na wykresy głośności (k = 1/2: kompresja DD o połowę):

Rysunek 19. Wykresy głośności.

Jak widać w oryginale, były to zarówno bardzo ciche dźwięki, 30 dB poniżej poziomu dialogów, jak i bardzo głośne - 30 dB powyżej poziomu dialogów. To. zakres dynamiki wynosił 60dB. Po kompresji głośne dźwięki są tylko 15dB wyższe, a ciche dźwięki są o 15dB niższe niż poziomy dialogowe (zakres dynamiki wynosi teraz 30dB). Tak więc głośne dźwięki są znacznie cichsze, a ciche są znacznie głośniejsze. W takim przypadku nie ma przepełnienia!

Przejdźmy teraz do histogramów:

Rysunek 20. Przykład kompresji.

Jak wyraźnie widać, przy wzmocnieniu do +30dB kształt histogramu jest dobrze zachowany, co oznacza, że głośne dźwięki pozostają dobrze wymawiane (nie dochodzą do maksimum i nie ucinają, jak to bywa przy prostym wzmocnieniu ). Powoduje to ciche dźwięki. Histogram pokazuje to słabo, ale różnica jest bardzo zauważalna przez ucho. Wadą tej metody są same skoki głośności. Mechanizm ich powstawania różni się jednak od skoków głośności powstających podczas przesterowania, a ich charakter jest inny – pojawiają się one głównie przy bardzo silnym wzmocnieniu dźwięków cichych (a nie przy przesterowywaniu dźwięków głośnych, jak przy wzmacnianiu konwencjonalnym). Nadmierna kompresja prowadzi do spłaszczenia obrazu dźwiękowego – wszystkie dźwięki mają tę samą głośność i brak wyrazistości.

Silne wzmocnienie cichych dźwięków może spowodować, że będzie słyszalny dźwięk nagrywania. Dlatego w filtrze zastosowano nieco zmodyfikowany algorytm, aby poziom szumu wzrastał mniej:

Rysunek 21. Zwiększanie głośności bez zwiększania hałasu.

Te. przy poziomie głośności -50 dB funkcja przenoszenia jest odmienna, a szum będzie wzmacniany w mniejszym stopniu (linia żółta). W przypadku braku takiego przegięcia hałas będzie znacznie głośniejszy (szara linia). Ta prosta modyfikacja znacząco zmniejsza ilość hałasu nawet przy bardzo wysokich poziomach kompresji (na rysunku - kompresja 1:5). Poziom „DRC” w filtrze określa poziom wzmocnienia dla cichych dźwięków (na poziomie -50 dB). pokazany na rysunku poziom kompresji 1/5 odpowiada poziomowi +40dB w ustawieniach filtra.

Druga część serii poświęcona jest funkcjom optymalizacji zakresu dynamicznego obrazów. W nim powiemy Ci, dlaczego takie rozwiązania są potrzebne, rozważ różne opcje ich wdrożenia, a także ich zalety i wady.

Obejmij ogrom!

Idealnie aparat powinien uchwycić obraz otaczającego świata tak, jak postrzega go osoba. Jednak ze względu na to, że mechanizmy „wizji” kamery i ludzkie oko różnią się znacznie, istnieje szereg ograniczeń, które uniemożliwiają spełnienie tego warunku.

Jednym z problemów, z jakimi borykają się wcześniej użytkownicy kamer filmowych i posiadacze aparatów cyfrowych, jest niemożność odpowiedniego uchwycenia scen z dużą różnicą oświetlenia bez użycia specjalnych urządzeń i/lub specjalnych technik fotografowania. Specyfika ludzkiego aparatu wzrokowego umożliwia równie dobre postrzeganie szczegółów scen o wysokim kontraście zarówno w jasno oświetlonych, jak i ciemnych obszarach. Niestety czujnik aparatu nie zawsze jest w stanie uchwycić obraz tak, jak go widzimy.

Im większa różnica jasności w fotografowanej scenie, tym większe prawdopodobieństwo utraty szczegółów w światłach i/lub cieniach. W rezultacie zamiast błękitnego nieba z bujnymi chmurami na obrazie pojawia się tylko biaława plama, a obiekty znajdujące się w cieniu zamieniają się w niewyraźne ciemne sylwetki lub całkowicie łączą się z otaczającym środowiskiem.

W fotografii klasycznej do oceny zdolności aparatu (lub nośnika w przypadku kamer filmowych) do przepuszczania określonego zakresu jasności stosuje się pojęcie szerokość geograficzna(szczegóły na pasku bocznym). Teoretycznie szerokość fotograficzna aparatów cyfrowych jest określona przez pojemność cyfrową przetwornika analogowo-cyfrowego (ADC). Na przykład przy zastosowaniu 8-bitowego ADC, biorąc pod uwagę błąd kwantyzacji, teoretycznie osiągalna wartość szerokości fotograficznej wyniesie 7 EV, dla 12-bitowego ADC - 11 EV itd. Jednak w rzeczywistych urządzeniach zakres dynamiczny obrazów okazuje się być w to samo maksymalne teoretyczne ze względu na wpływ różnych rodzajów hałasu i innych czynników.

Duże różnice w poziomach jasności stanowią poważny
problem podczas robienia zdjęć. W tym przypadku możliwości aparatu
nie wystarczyło, aby odpowiednio przenieść większość
jasne obszary sceny, w wyniku czego zamiast niebieskiego obszaru
niebo (oznaczone kreską) ma białą „łatkę”

Maksymalna wartość jasności, jaką może zarejestrować czujnik światłoczuły, zależy od poziomu nasycenia jego komórek. Wartość minimalna zależy od kilku czynników, w tym szumu termicznego matrycy, szumu transferu ładunku i błędu ADC.

Warto również zauważyć, że szerokość geograficzna fotograficzna tego samego aparatu cyfrowego może się różnić w zależności od wartości czułości ustawionej w ustawieniach. Maksymalny zakres dynamiczny jest osiągalny, gdy ustawiona jest tzw. czułość podstawowa (odpowiadająca minimalnej możliwej wartości liczbowej). Wraz ze wzrostem wartości tego parametru zakres dynamiczny maleje ze względu na rosnący poziom hałasu.

Szerokość geograficzna nowoczesne modele aparaty cyfrowe z dużymi matrycami i 14- lub 16-bitowymi przetwornikami ADC mają zakres od 9 do 11 EV, znacznie więcej niż 35 mm kolorowe negatywy (średnio 4 do 5 EV). W ten sposób nawet stosunkowo niedrogie aparaty cyfrowe mają szerokość fotograficzną wystarczającą do odpowiedniego oddania większości typowych obiektów fotografii amatorskiej.

Jest jednak problem innego rodzaju. Wiąże się to z ograniczeniami nałożonymi przez obowiązujące standardy nagrywania. obrazy cyfrowe... Używając formatu JPEG z 8 bitami na kanał koloru (który stał się obecnie de facto standardem zapisu obrazów cyfrowych w przemyśle komputerowym i technologii cyfrowej), nie jest nawet teoretycznie możliwe zapisanie obrazu o szerokości fotograficznej większej niż 8 EV.

Załóżmy, że przetwornik ADC kamery wytwarza obraz o długości 12 lub 14 bitów, zawierający rozróżnialne szczegóły zarówno w światłach, jak i cieniach. Jeśli jednak szerokość fotograficzna tego obrazu przekroczy 8 EV, to w procesie konwersji do standardowego formatu 8-bitowego bez żadnych dodatkowych działań (czyli po prostu odrzucając „dodatkowe” bity), część informacji zapisanych przez czujnik światłoczuły zostanie utracony.

Zakres dynamiczny i szerokość geograficzna

W uproszczeniu zakres dynamiczny określany jest jako stosunek maksymalnej wartości jasności obrazu do jego wartości minimalnej. W fotografii klasycznej tradycyjnie używa się terminu szerokość geograficzna, co zasadniczo oznacza to samo.

Szerokość zakresu dynamicznego można wyrazić w postaci stosunku (na przykład 1000:1, 2500:1 itd.), jednak najczęściej używa się do tego skali logarytmicznej. W tym przypadku oblicza się wartość logarytmu dziesiętnego stosunku jasności maksymalnej do jej wartości minimalnej, a po liczbie umieszcza się dużą literę D (z angielskiej gęstości ?-gęstość), rzadziej?- skrót OD (od angielskiego gęstość optyczna? - gęstość optyczna). Na przykład, jeśli stosunek maksymalnej wartości jasności do minimalnej wartości urządzenia wynosi 1000:1, to zakres dynamiczny wyniesie 3,0 D:

Do pomiaru szerokości geograficznej tradycyjnie stosuje się tak zwane jednostki ekspozycji, oznaczane skrótem EV (od angielskich wartości ekspozycji; profesjonaliści często nazywają je „przystankami” lub „krokami”). W tych jednostkach zwykle ustawia się wielkość kompensacji ekspozycji w ustawieniach aparatu. Zwiększenie wartości szerokości geograficznej o 1 EV jest równoznaczne z podwojeniem różnicy między maksymalnym i minimalnym poziomem jasności. Tak więc skala EV jest również logarytmiczna, ale w tym przypadku do obliczenia wartości liczbowych używany jest logarytm o podstawie 2. Na przykład, jeśli urządzenie zapewnia możliwość robienia zdjęć, stosunek maksymalnej jasności do wartości minimalnej osiąga 256:1 szerokość geograficzna wynosi 8 EV:

Kompresja to mądry kompromis

Bardzo efektywny sposób aby zapisać w całości informacje o obrazie rejestrowanym przez czujnik światłoczuły aparatu jest zapis obrazu w Format RAW... Jednak funkcja ta nie jest dostępna we wszystkich aparatach i nie każdy fotograf-amator jest gotowy na żmudną pracę nad doborem indywidualnych ustawień dla każdego ujęcia.

Aby zmniejszyć prawdopodobieństwo utraty szczegółów w obrazach o wysokim kontraście konwertowanych wewnątrz aparatu do 8-bitowego JPEG, w urządzeniach wielu producentów (nie tylko kompaktowych, ale także lustrzankach) wprowadzono specjalne funkcje, które pozwalają na kompresję dynamiki zakres zapisanych obrazów bez interwencji użytkownika. Dzięki zmniejszeniu ogólnego kontrastu i utracie nieistotnej części informacji o oryginalnym obrazie, takie rozwiązania pozwalają na zapisanie w 8-bitowym formacie JPEG szczegółów w światłach i cieniach, zarejestrowanych przez czujnik światłoczuły urządzenia, nawet jeśli zakres dynamiczny oryginalnego obrazu jest szerszy niż 8 EV.

Jednym z pionierów rozwoju tego kierunku była firma HP. Wprowadzony na rynek w 2003 roku aparat cyfrowy HP Photosmart 945 wprowadził pierwszą na świecie technologię HP Adaptive Lightling, która automatycznie kompensuje brak światła w ciemnych obszarach obrazu, zachowując w ten sposób szczegóły cieni bez ryzyka prześwietlenia (co jest bardzo ważne podczas fotografowania w wysokiej rozdzielczości). sceny kontrastowe). Algorytm HP Adaptive Lightling opiera się na zasadach przedstawionych przez angielskiego naukowca Edwina Landa w teorii percepcji wzrokowej człowieka RETINEX.

Menu HP Adaptive Lighting

Jak działa oświetlenie adaptacyjne? Po uzyskaniu 12-bitowego obrazu obrazu, wyodrębnia się z niego pomocniczy obraz monochromatyczny, który w rzeczywistości jest mapą świetlną. Podczas przetwarzania obrazu ta mapa jest używana jako maska, która pozwala kontrolować stopień wpływu dość złożonego filtra cyfrowego na obraz. Zatem w obszarach odpowiadających najciemniejszym punktom mapy wpływ na obraz przyszłego obrazu jest minimalny i odwrotnie. Takie podejście pozwala odsłonić szczegóły w cieniach poprzez selektywne rozjaśnianie tych obszarów i odpowiednio zmniejszając ogólny kontrast wynikowego obrazu.

Zwróć uwagę, że po włączeniu funkcji Adaptive Lighting przechwycony obraz jest przetwarzany zgodnie z powyższym opisem, zanim ostateczny obraz zostanie zapisany do pliku. Wszystkie opisane operacje wykonywane są automatycznie, a użytkownik może w menu aparatu wybrać tylko jeden z dwóch trybów Adaptive Lighting (niska lub wysoka ekspozycja) lub wyłączyć tę funkcję.

Ogólnie rzecz biorąc, wiele specyficznych funkcji współczesnych aparatów cyfrowych (w tym omówione w poprzednim artykule systemy rozpoznawania twarzy) to swego rodzaju produkty uboczne lub produkty konwersji projektów badawczych, które pierwotnie wykonywano dla klientów wojskowych. Jeśli chodzi o funkcje optymalizacji zakresu dynamiki obrazu, jednym z najbardziej znanych dostawców tego typu rozwiązań jest firma Apical. Algorytmy stworzone przez jej pracowników opierają się w szczególności na funkcji SAT (Shadow Adjustment Technology), która jest zaimplementowana w wielu cyfrowych aparatach Olympus. W skrócie działanie funkcji SAT można opisać następująco: na podstawie oryginalnego obrazu obrazu tworzona jest maska odpowiadająca najciemniejszym obszarom, a następnie wartość ekspozycji jest automatycznie korygowana dla tych obszarów.

Sony nabyło również licencję na korzystanie z opracowań Apical. Wiele kompaktowych aparatów Cyber-shot i lustrzanek cyfrowych z serii alpha ma tak zwaną funkcję Dynamic Range Optimizer (DRO).

Zdjęcia wykonane za pomocą urządzenia HP Photosmart R927 z wyłączonym (u góry)
i aktywowane oświetlenie adaptacyjne

Korekta zrzutu obrazu po aktywacji DRO jest wykonywana podczas wstępnego przetwarzania obrazu (czyli przed zapisaniem gotowego pliku JPEG). W wersji podstawowej DRO posiada ustawienie dwustopniowe (w menu można wybrać standardowy lub zaawansowany tryb jego działania). Po wybraniu trybu Standardowy, w oparciu o analizę obrazu obrazu, wartość ekspozycji jest korygowana, a następnie do obrazu jest stosowana krzywa tonalna w celu wyrównania ogólnego balansu. Tryb zaawansowany wykorzystuje bardziej wyrafinowany algorytm do korygowania zarówno cieni, jak i świateł.

Deweloperzy Sony nieustannie pracują nad ulepszeniem algorytmu DRO. Na przykład w lustrzance a700, gdy aktywujesz zaawansowany tryb DRO, możesz wybrać jedną z pięciu opcji korekcji. Dodatkowo zaimplementowano możliwość zapisania trzech wariantów jednego obrazu na raz (rodzaj braketingu) z różnymi ustawieniami DRO.

Wiele aparatów cyfrowych firmy Nikon jest wyposażonych w funkcję D-Lighting, która również opiera się na algorytmach Apical. Jednak w przeciwieństwie do opisanych powyżej rozwiązań, D-Lighting jest zaimplementowany w postaci filtra do przetwarzania wcześniej zapisanych obrazów za pomocą krzywej tonalnej, której kształt sprawia, że cienie są jaśniejsze, a reszta obrazu pozostaje bez zmian. Ale ponieważ w tym przypadku przetwarzane są już gotowe obrazy 8-bitowe (a nie oryginalny obraz ramki, który ma większą głębię bitową i odpowiednio szerszy zakres dynamiczny), możliwości D-Lighting są bardzo ograniczone. Użytkownik może uzyskać ten sam wynik, przetwarzając obraz w edytorze graficznym.

Porównując powiększone fragmenty wyraźnie widać, że ciemne obszary oryginalnego obrazu (po lewej)
stają się jaśniejsze, gdy włączone jest oświetlenie adaptacyjne

Istnieje również szereg rozwiązań opartych na innych zasadach. Tak więc w wielu kamerach z rodziny Lumix firmy Panasonic (w szczególności DMC-FX35, DMC-TZ4, DMC-TZ5, DMC-FS20, DMC-FZ18 itp.) zaimplementowana jest funkcja inteligentnej ekspozycji, która jest integralną częścią częścią systemu Inteligentna automatyczna kontrola fotografowania iA. Inteligentna ekspozycja opiera się na automatycznej analizie obrazu klatki i korekcji ciemnych obszarów obrazu, aby uniknąć utraty szczegółów w cieniach, a także (w razie potrzeby) kompresji zakresu dynamicznego scen o wysokim kontraście.

W niektórych przypadkach działanie funkcji optymalizacji zakresu dynamicznego obejmuje nie tylko pewne operacje przetwarzania oryginalnego obrazu obrazu, ale także korektę ustawień fotografowania. Na przykład w nowych modelach aparatów cyfrowych Fujifilm (w szczególności w FinePix S100FS) zaimplementowana jest funkcja Wide Dynamic Range (WDR), która według twórców pozwala zwiększyć szerokość geograficzną fotograficzną o jeden lub dwa stopnie ( w terminologii ustawień - 200 i 400%).

Gdy funkcja WDR jest włączona, aparat wykonuje zdjęcia z kompensacją ekspozycji -1 lub -2 EV (w zależności od wybranego ustawienia). W ten sposób obraz ramy jest niedoświetlony - jest to konieczne, aby zachować maksymalną informację o szczegółach w prześwietleniach. Powstały obraz jest następnie przetwarzany z krzywą tonalną, aby wyrównać ogólny balans i dostosować poziom czerni. Obraz jest następnie konwertowany do formatu 8-bitowego i zapisywany jako plik JPEG.

Kompresja zakresu dynamicznego zachowuje więcej szczegółów
w światłach i cieniach, ale nieuniknioną konsekwencją takiego uderzenia
to zmniejszenie ogólnego kontrastu. Na dolnym obrazie
tekstura chmur jest jednak znacznie lepiej dopracowana
ze względu na niższy kontrast ta wersja obrazu
wygląda mniej naturalnie

Podobna funkcja o nazwie Dynamic Range Enlargement jest zaimplementowana w wielu aparatach kompaktowych i lustrzankach firmy Pentax (Optio S12, K200D itp.). Jak podaje producent, zastosowanie funkcji Dynamic Range Enlargement pozwala zwiększyć szerokość geograficzną fotograficzną o 1 EV bez utraty szczegółowości w światłach i cieniach.

Podobna funkcja o nazwie Priorytet tonu podświetlenia (HTP) jest zaimplementowana w wielu modelach lustrzanek cyfrowych firmy Canon (EOS 40D, EOS 450D itp.). Zgodnie z informacjami zawartymi w instrukcji, aktywacja HTP może poprawić szczegółowość podświetleń (dokładniej w zakresie poziomów od 0 do 18% szarości).

Wniosek

Podsumujmy. Wbudowana kompresja zakresu dynamiki umożliwia konwersję oryginalnego obrazu o wysokim zakresie dynamiki do 8-bitowego przy minimalnych uszkodzeniach Plik JPEG... W przypadku braku funkcji przechwytywania w formacie RAW, kompresja zakresu dynamicznego pozwala fotografowi w pełni wykorzystać potencjał aparatu podczas rejestrowania scen o wysokim kontraście.

Oczywiście należy pamiętać, że kompresja dynamiki to nie magiczna kula, a raczej kompromis. Za zachowanie szczegółów w światłach i/lub cieniach trzeba zapłacić, zwiększając poziom szumu w ciemnych obszarach obrazu, zmniejszając jego kontrast i nieco zgrubiając płynne przejścia tonalne.

Jak każdy funkcja automatyczna, algorytm kompresji zakresu dynamiki nie jest w pełni uniwersalnym rozwiązaniem, które pozwala poprawić absolutnie każdy obraz. Dlatego warto aktywować go tylko w tych przypadkach, gdy jest to naprawdę konieczne. Przykładowo, aby uchwycić sylwetkę z dobrze rozwiniętym tłem, należy wyłączyć funkcję kompresji zakresu dynamicznego – w przeciwnym razie efektowna scena zostanie beznadziejnie zrujnowana.

Kończąc rozważanie tego tematu, należy zauważyć, że wykorzystanie funkcji kompresji zakresu dynamicznego nie pozwala na „rozciągnięcie” na wynikowym obrazie szczegółów, które nie zostały utrwalone przez czujnik aparatu. Aby uzyskać zadowalający efekt podczas fotografowania scen o wysokim kontraście, należy użyć dodatkowych urządzeń (na przykład filtrów gradientowych do fotografowania krajobrazów) lub specjalnych technik (takich jak robienie wielu klatek z nawiasami ekspozycji, a następnie łączenie ich w jeden obraz za pomocą mapowania tonów technologia).

Następny artykuł skupi się na funkcji burst.

Ciąg dalszy nastąpi

Poziom dźwięku jest taki sam w całej kompozycji, występuje kilka pauz.

Zawężenie zakresu dynamicznego

Zawężenie zakresu dynamicznego, czyli prościej kompresja, jest niezbędny do różnych celów, najczęstsze z nich to:

1) Osiągnięcie jednolitego poziomu głośności w całej kompozycji (lub partii instrumentu).

2) Osiągnięcie jednolitego poziomu głośności utworów w całym albumie/audycji radiowej.

2) Poprawa zrozumiałości, głównie przy kompresji określonej partii (wokal, bęben basowy).

Jak zmniejsza się zakres dynamiczny?

Kompresor analizuje wejściowy poziom dźwięku, porównując go z wartością progową zdefiniowaną przez użytkownika.

Jeśli poziom sygnału jest poniżej wartości Próg- wtedy kompresor kontynuuje analizę dźwięku bez jego zmiany. Jeśli poziom dźwięku przekroczy wartość Threshold, kompresor rozpocznie działanie. Ponieważ rolą kompresora jest zawężenie zakresu dynamiki, logiczne jest założenie, że ogranicza on największe i najmniejsze wartości amplitudy (poziomu sygnału). Na pierwszym etapie ograniczane są największe wartości, które maleją z pewną siłą, którą nazywamy Stosunek(Postawa). Spójrzmy na przykład:

Zielone krzywe pokazują poziom dźwięku, im większa amplituda ich oscylacji od osi X, tym wyższy poziom sygnału.

Żółta linia to próg sprężarki. Zwiększając wartość Threshold użytkownik odsuwa ją od osi X. Zmniejszając wartość Threshold przybliża ją do osi Y. Oczywiste jest, że im niższa wartość progowa, tym częściej sprężarka zostanie uruchomiona i odwrotnie, im wyższa - tym rzadziej. Jeśli wartość Ratio jest bardzo wysoka, to po osiągnięciu poziomu sygnału Threshold wszystkie kolejne sygnały będą tłumione przez kompresor aż do wyciszenia. Jeśli wartość Ratio jest bardzo mała, nic się nie stanie. Dobór wartości Threshold i Ratio zostanie omówiony później. Teraz powinniśmy zadać sobie następujące pytanie: Jaki jest sens tłumienia wszystkich kolejnych dźwięków? Rzeczywiście, nie ma w tym sensu, wystarczy pozbyć się wartości amplitudy (pików), które przekraczają wartość Threshold (zaznaczoną na wykresie na czerwono). Aby rozwiązać ten problem, istnieje parametr Uwolnienie(Decay), który określa czas trwania kompresji.

Przykład pokazuje, że pierwszy i drugi próg przekraczający Próg trwają krócej niż trzeci przekraczający próg. Jeśli więc parametr Release jest ustawiony na pierwsze dwa piki, to podczas przetwarzania trzeciego może pozostać nieprzetworzona część (ponieważ przekroczenie progu Threshold trwa dłużej). Jeśli parametr Release jest ustawiony na trzeci szczyt, to podczas przetwarzania pierwszego i drugiego szczytu za nimi powstaje niechciany spadek poziomu sygnału.

To samo dotyczy parametru Ratio. Jeśli parametr Ratio jest ustawiony na pierwsze dwa piki, to trzeci nie będzie wystarczająco tłumiony. Jeśli parametr Ratio jest ustawiony na przetwarzanie trzeciego piku, przetwarzanie pierwszych dwóch pików będzie zbyt przeszacowane.

Problemy te można rozwiązać na dwa sposoby:

1) Ustawienie parametru Atak jest rozwiązaniem częściowym.

2) Kompresja dynamiczna to kompletne rozwiązanie.

Parametr ataki (atak) służy do ustawienia czasu, po którym sprężarka rozpocznie pracę po przekroczeniu Progu. Jeśli parametr jest bliski zeru (równy zeru w przypadku kompresji równoległej patrz odpowiedni artykuł) – wtedy kompresor zacznie natychmiast tłumić sygnał, a czas ustawiony parametrem Release zadziała. Jeśli prędkość ataku jest wysoka, kompresor zacznie działać po pewnym czasie (jest to konieczne dla jasności). W naszym przypadku możesz dostosować parametry Threshold, Release i Compression Level (Ratio), aby przetworzyć pierwsze dwa szczyty i ustawić wartość Attack bliską zeru. Wtedy kompresor wytłumi pierwsze dwa piki, a podczas przetwarzania trzeciego będzie go wytłumił aż do przekroczenia progu. Nie gwarantuje to jednak wysokiej jakości przetwarzanie dźwięk i bliskie ograniczenia (zgrubne obcięcie wszystkich wartości amplitudy, w tym przypadku kompresor nazywany jest limiterem).

Spójrzmy na wynik przetwarzania dźwięku przez kompresor:

Piki zniknęły, zauważam, że ustawienia przetwarzania były dość łagodne i tłumiliśmy tylko najbardziej widoczne wartości amplitudy. W praktyce zakres dynamiczny zawęża się znacznie bardziej i ten trend dopiero się rozwija. W umysłach wielu kompozytorów podbijają muzykę, ale w praktyce całkowicie pozbawiają ją dynamiki dla tych słuchaczy, którzy mogliby słuchać jej w domu, a nie w radiu.

Pozostaje nam rozważyć ostatni parametr kompresji, to jest Osiągać(Osiągać). Wzmocnienie ma na celu zwiększenie amplitudy całej kompozycji i jest zasadniczo odpowiednikiem innego narzędzia do edycji dźwięku, normalizacji. Zobaczmy efekt końcowy:

W naszym przypadku kompresja była uzasadniona i poprawiła jakość dźwięku, ponieważ wydatny szczyt jest bardziej przypadkiem niż zamierzonym skutkiem. Dodatkowo widać, że muzyka jest rytmiczna, dlatego ma wąski zakres dynamiki. W przypadkach, w których celowo zostały wprowadzone wysokie wartości amplitudy, kompresja może stać się błędem.

Kompresja dynamiczna

Różnica między kompresją dynamiczną i niedynamiczną polega na tym, że po pierwsze, poziom tłumienia sygnału (stosunek) zależy od poziomu sygnału wejściowego. Sprężarki dynamiczne są dostępne we wszystkich nowoczesnych programach, parametry Ratio i Threshold są sterowane za pomocą okna (każdy parametr ma swoją oś):

Nie ma jednego standardu wyświetlania wykresu, gdzieś wzdłuż osi Y wyświetlany jest poziom sygnału wejściowego, a gdzieś poziom sygnału po kompresji. Gdzieś punkt (0,0) znajduje się w prawym górnym rogu, gdzieś w lewym dolnym rogu. W każdym razie przesunięcie kursora myszy nad to pole zmienia wartości liczb, które odpowiadają parametrom Ratio i Threshold. Te. Ustawiasz poziom kompresji dla każdej wartości Threshold, co sprawia, że dostosowywanie kompresji jest bardzo elastyczne.

Łańcuch boczny

Kompresor łańcucha bocznego analizuje sygnał jednego kanału, a gdy poziom dźwięku przekracza próg, stosuje kompresję w drugim kanale. Łańcuch boczny ma swoje zalety w pracy z instrumentami, które znajdują się w tym samym obszarze częstotliwości (aktywnie używany jest bęben basowo-basowy), ale czasami używane są instrumenty zlokalizowane w różnych zakresach częstotliwości, co prowadzi do interesującego efektu łańcucha bocznego.

Część druga – etapy kompresji

Istnieją trzy etapy kompresji:

1) Pierwszym etapem jest kompresja poszczególnych dźwięków (pojedyncze strzały).

Barwa każdego instrumentu ma następujące cechy: Attack, Hold, Decay, Delay, Sustain, Release.

Etap kompresji poszczególnych dźwięków podzielony jest na dwie części:

1.1) Kompresja poszczególnych dźwięków instrumentów rytmicznych

Często bity składowe wymagają osobnej kompresji, aby nadać im wyrazistość. Wiele osób przetwarza bęben basowy oddzielnie od innych instrumentów rytmicznych, zarówno na etapie kompresji poszczególnych dźwięków, jak i na etapie kompresji poszczególnych partii. Wynika to z faktu, że znajduje się on w obszarze niskich częstotliwości, gdzie oprócz niego zwykle obecny jest tylko bas. Klarowność bębna basowego rozumiana jest jako obecność charakterystycznego kliknięcia (bęben basowy ma bardzo krótki czas ataku i utrzymania). Jeśli nie ma kliknięcia, musisz przetworzyć go kompresorem, ustawiając próg na zero i czas ataku od 10 do 50 ms. Realese kompresora musi zakończyć przed kopnięciem ponownie. Ostatni problem można rozwiązać za pomocą wzoru: 60 000 / BPM, gdzie BPM to tempo utworu. Na przykład) 60 000 / 137 = 437,96 (czas w milisekundach do nowego silnego ułamka 4-wymiarowej kompozycji).

Wszystko to dotyczy innych instrumentów rytmicznych z krótkimi czasami ataku – powinny one mieć akcentowany klik, którego kompresor nie powinien tłumić na żadnym z poziomów kompresji.

1.2) Kompresjaposzczególne dźwiękiinstrumenty harmoniczne

W przeciwieństwie do instrumentów rytmicznych, partie instrumentów harmonicznych rzadko składają się z oddzielnych dźwięków. Nie oznacza to jednak, że nie powinny być przetwarzane na poziomie kompresji dźwięku. Jeśli używasz sampla z nagraną partią, to jest to drugi poziom kompresji. Do tego poziomu kompresji należą wyłącznie zsyntetyzowane instrumenty harmoniczne. Mogą to być samplery, syntezatory wykorzystujące różne metody syntezy dźwięku (modelowanie fizyczne, FM, addytywne, subtraktywne itp.). Jak już pewnie się domyślasz – mówimy o programowaniu ustawień syntezatora. Tak! To też jest kompresja! Prawie wszystkie syntezatory posiadają programowalny parametr obwiedni (ADSR), co oznacza obwiednię. Koperta służy do ustawiania czasów Ataku, Zaniku, Utrzymania i Uwolnienia. A jeśli powiesz mi, że to nie jest kompresja każdego dźwięku – jesteś moim wrogiem na całe życie!

2) Drugi etap - Kompresja poszczególnych części.

Kompresując poszczególne partie mam na myśli zawężenie zakresu dynamicznego serii połączonych pojedynczych dźwięków. Ten etap obejmuje również nagrania partii, w tym wokali, które wymagają obróbki kompresyjnej, aby było jasne i zrozumiałe. Podczas przetwarzania kompresji części należy wziąć pod uwagę fakt, że podczas dodawania poszczególnych dźwięków mogą pojawić się niechciane szczyty, których należy się pozbyć na tym etapie, ponieważ jeśli nie zostanie to zrobione teraz, obraz może pogorszyć się na etapie mieszania całej kompozycji. Na etapie kompresji poszczególnych części należy uwzględnić kompresję etapu przetwarzania poszczególnych dźwięków. Jeśli osiągnąłeś klarowność bębna basowego, nieprawidłowe przetwarzanie w drugim etapie może wszystko zepsuć. Przetwarzanie przez kompresor wszystkich części nie jest konieczne, ani nie jest konieczne przetwarzanie wszystkich pojedynczych dźwięków. Na wszelki wypadek radzę założyć analizator amplitudy w celu stwierdzenia występowania niepożądanych skutków ubocznych łączenia poszczególnych dźwięków. Oprócz kompresji na tym etapie należy upewnić się, że części znajdują się, jeśli to możliwe, w różnych zakresach częstotliwości, aby można było przeprowadzić kwantyzację. Warto również pamiętać, że dźwięk ma taką charakterystykę jak maskowanie (psychoakustyka):

1) Cichszy dźwięk jest maskowany przez głośniejszy dźwięk dochodzący przed nim.

2) Cichszy dźwięk o niskiej częstotliwości jest maskowany przez głośniejszy dźwięk o wysokiej częstotliwości.

Na przykład, jeśli masz partię syntezatora, często nuty zaczynają grać zanim poprzednie nuty kończą swoje brzmienie. Czasem jest to konieczne (tworzenie harmonii, styl gry, polifonia), ale czasem wcale – można odciąć ich koniec (Delay – Release), jeśli jest słyszalny w trybie solo, ale nie we wszystkich partiach. To samo dotyczy efektów takich jak pogłos – nie powinien trwać do momentu ponownego uruchomienia źródła dźwięku. Wycinając i usuwając niepotrzebny sygnał – sprawiasz, że dźwięk jest czystszy, a to też można uznać za kompresję – ponieważ usuwasz niepotrzebne fale.

3) Trzeci etap - Kompresja kompozycji.

Podczas kompresji całej kompozycji pamiętaj, że wszystkie części są kombinacją wielu oddzielnych dźwięków. Dlatego łącząc je, a następnie kompresując, należy zadbać o to, aby finalna kompresja nie zepsuła tego, co osiągnęliśmy w pierwszych dwóch etapach. Trzeba też oddzielić kompozycje, w których ważny jest szeroki lub wąski zakres. przy kompresowaniu kompozycji o szerokim zakresie dynamicznym wystarczy włożyć kompresor, który zmiażdży krótkotrwałe piki, które powstały w wyniku zsumowania partii. Kompresowanie kompozycji, w której ważny jest wąski zakres dynamiki, jest znacznie bardziej skomplikowane. Tutaj kompresory są ostatnio nazywane maksymalizatorami. Maximizer to wtyczka łącząca kompresor, limiter, korektor graffiti, wzmacniacz i inne narzędzia do konwersji dźwięku. Jednocześnie musi koniecznie dysponować solidnymi narzędziami do analizy. Maksymalizacja, końcowe przetwarzanie przez kompresor, jest w dużej mierze potrzebne, aby poradzić sobie z błędami popełnionymi na poprzednich etapach. Błędy dotyczą nie tyle kompresji (jednak jeśli robisz na ostatnim etapie to, co mogłeś zrobić na pierwszym etapie, jest już błędem), ile w początkowym wyborze dobrych sampli i instrumentów, które nie przeszkadzałyby sobie nawzajem ( mówimy o zakresach częstotliwości) ... W tym celu korygowana jest charakterystyka częstotliwościowa. Często zdarza się, że przy mocnej kompresji na masterze trzeba zmienić parametry kompresji i miksowania na wcześniejszych etapach, ponieważ przy silnym zawężeniu zakresu dynamiki wychodzą ciche dźwięki, które wcześniej były maskowane, brzmienie poszczególnych komponentów zmiany składu.

W tych częściach celowo nie mówiłem o konkretnych parametrach kompresji. Uznałem za konieczne napisanie o konieczności zwracania uwagi na wszystkie dźwięki i wszystkie partie podczas kompresji na wszystkich etapach tworzenia kompozycji. Tylko w ten sposób uzyskasz harmonijny wynik nie tylko z punktu widzenia teorii muzyki, ale także z punktu widzenia inżynierii dźwięku.

Poniższa tabela zawiera praktyczne porady dotyczące przetwarzania poszczególnych partii. Jednak w przypadku kompresji liczby i ustawienia wstępne mogą tylko powiedzieć pożądany obszar, w dzielnicy, której chcesz szukać. Idealne ustawienia kompresje zależą od indywidualnego przypadku. Parametry Gain i Threshold zakładają normalny poziom dźwięku (logiczne wykorzystanie całego zakresu).

Część trzecia - Opcje kompresji

Szybkie odniesienie:

Próg - określa poziom dźwięku przychodzącego sygnału, po osiągnięciu którego kompresor zaczyna pracować.

Attack - określa czas, po którym kompresor zacznie działać.

Poziom (stosunek) - określa stopień spadku wartości amplitudy (w stosunku do pierwotnej wartości amplitudy).

Release (release) – określa czas, po którym sprężarka przestanie działać.

Wzmocnienie - Określa poziom wzrostu sygnału wejściowego po przetworzeniu przez kompresor.

Tabela kompresji:

Narzędzie	Próg	Atak	Stosunek	Uwolnienie	Osiągać	Opis
Wokal	0 dB	1-2 ms 2-5 mS 10 ms 0,1 ms 0,1 ms	mniej niż 4: 1 2,5: 1 4:1 – 12:1 2:1 -8:1	150 ms 50-100 mS 150 ms 150 ms 0,5s		Kompresja podczas nagrywania powinna być minimalna, wymaga to obowiązkowej obróbki na etapie miksowania, aby było jasne i zrozumiałe.
Instrumenty dęte		1 - 5ms	6:1 – 15:1	0.3s
Beczka		od 10 do 50 ms 10-100 mS	4: 1 lub wyższy 10:1	50-100 ms 1 mS		Im niższy próg i im wyższy współczynnik i im dłuższy atak, tym wyraźniejszy klik na początku kopnięcia.
Syntezatory						Zależy od typu fali (obwiednie ADSR).
Werbel:		10-40 mS 1- 5ms	5:1 5:1 – 10:1	50 mS 0,2s
Hi-Hat		20 mS	10:1	1 mS
Mikrofony napowietrzne		2-5 mS	5:1	1-50 mS
bębny		5ms	5:1 – 8:1	10ms
Gitara basowa		100-200 mS 4ms do 10ms	5:1	1 mS 10ms
Smyczki		0-40 mS	3:1	500 mS
Św. bas		4ms - 10ms	4:1	10ms		Zależy od kopert.

Perkusja		0-20 mS	10:1	50 mS
Gitara akustyczna, fortepian		10-30 mS 5 - 10ms	4:1 5:1 -10:1	50-100 mS 0,5s
Elektronitara		2 - 5ms	8:1	0,5s

Końcowa kompresja		0,1 ms 0,1 ms	2:1 2: 1 do 3: 1	50 ms 0,1 ms	Wyjście 0dB	Czas ataku zależy od celu - czy chcesz usunąć szczyty, czy wygładzić tor.
Limiter po końcowej kompresji		0 mS	10:1	10-50 mS	Wyjście 0dB	Jeśli potrzebujesz wąskiego zakresu dynamiki i grubego „cięcia” fal.

Informacje zostały zaczerpnięte z różnych źródeł, do których odwołują się głupie zasoby w Internecie. Różnicę w parametrach kompresji tłumaczy się różnicą w preferencjach brzmieniowych i pracy z innym materiałem.