Meny
Är gratis
checka in
den huvudsakliga  /  FÖRBI / Syntes och taligenkänning. Moderna lösningar

Syntes och taligenkänning. Moderna lösningar

Komprimering Detta är en av de mest utsöndrade av myterna av teman i fordonet. De säger Beethoven, även rädda sin grannebarn: (

Okej, i själva verket, tillämpa komprimering är inte svårare än att använda förvrängningen, det viktigaste är att förstå principen om sitt arbete och ha god kontroll. Vad är vi nu tillsammans och se till.

Vad är ljudkomprimering

Det första som är värt att förstå före förberedelsen - kompression är arbeta med dynamiskt ljudområde. Och i sin tur - inget mer än skillnaden mellan den högsta och tysta nivån av signalen:

Så här komprimering är en komprimering av ett dynamiskt område. Ja, helt enkelt Dynamisk kompression, väl eller med andra ord sänka nivån av högljudda delar av signalen och en ökning i volymen av tyst. Inte mer.

Kan du vara ganska rimlig att överraska med vad en sådan khaip är kopplad till? Varför alla pratar om recept för korrekt inställning av kompressorer, men ingen delar dem? Varför, trots det stora antalet coola plugins, används i många studior fortfarande dyra sällsynta modeller av kompressorer? Varför vissa producenter tillämpar kompressorer på extrema inställningar, medan andra inte använder alls? Och vem av dem är i slutändan rätt?

Uppgifter som löser komprimering

Svar på sådana frågor ligger i planet för att förstå den roll som kompression i arbetet med ljud. Och det tillåter:

  1. Betona Ljud, gör det mer uttalat;
  2. "Säte" i blanda separata partier av verktyggenom att lägga till ström och "vikt";
  3. Gör verktygsgrupper eller alla mixer mer solid, en sådan enda monolit;
  4. Lös konflikter mellan verktyg använder sidokedjan;
  5. Correfe bristerna av sångare eller musiker, fodra deras dynamik;
  6. Med en bestämd inställning fungera som en konstnärlig effekt.

Som du kan se är det inte mindre signifikant kreativ process än, säg, uppfinna melodier eller störa intressanta timbres. I det här fallet kan någon av ovanstående uppgifter lösas med 4 huvudparametrar.

Kompressorns huvudparametrar

Trots stor mängd Programvara och hårdvara modeller av kompressorer, all den "magiska" kompressionen uppstår när korrekt inställning Grundläggande parametrar: tröskel, förhållande, attack och frisättning. Tänk på dem mer detaljerat:

Tröskel- eller utlösningsgräns, db

Med den här parametern kan du ställa in det värde som kompressorn fungerar (det vill säga komprimera ljudsignalen). Så, om vi installerar i tröskelvärdet -12dB, kommer kompressorn bara att fungera på de dynamiska området som överstiger detta värde. Om allt vårt ljud är quische -12db, kommer kompressorn helt enkelt att sakna det, utan att påverka det.

Förhållande eller kompressionskoefficient

Förhållandet parametern bestämmer hur mycket signalen överstiger tröskeln. En liten matematik för fullheten av bilden: Låt oss säga, vi sätter upp en kompressor med tröskelvärdet -12dB, förhållande 2: 1 och arkiverad en trumma som är tilldelad, i vilken volymen av cylindern är -4dB. Vad är resultatet av kompressorns arbete i det här fallet?

I vårt fall överstiger tunnanivån på tröskeln på 8 dB. Denna skillnad i enlighet med förhållandet kommer att komprimeras till 4 dB (8dB / 2). Sammanfattningsvis med en obehandlad del av signalen kommer detta att leda till det faktum att tröskelns volym (tröskel -12db + komprimerad signal 4dB) efter bearbetning av kompressorn.

Attack, MS.

Den här gången, senare, kommer kompressorn att reagera på att överskrida triggergränsen. Det vill säga om attacktiden är över 0ms - kompressor startar kompression Överskridande tröskelsignalen är inte omedelbart, men den angivna tiden.

Släpp eller återställning, MS

Det motsatta av attacken - värdet av denna parameter gör att du kan ange vilken tid eftersom signalnivån återbetalas under tröskeln kompressorn kommer att sluta komprimera.

Innan vi flyttar vidare rekommenderar jag starkt att ta ett bra bekant prov, hänga på sin kanal någon kompressor och 5-10 minuters experiment med ovanstående parametrar för tillförlitligt fixeringsmaterial

Allt de återstående parametrarna är valfria. De kan skilja sig åt i olika modeller av kompressorer, delvis därför producenter och användning olika modeller För några specifika mål (till exempel en kompressor för vokal, den andra på trumgruppen är den tredje på huvudkanalen). Jag kommer inte att dölja i detalj på dessa parametrar, men bara damerna allmän information För att förstå vad det är alls:

  • Knä eller fravel (hårt / mjukt knä). Denna parameter definierar hur snabbt kompressionsförhållandet (förhållandet) appliceras: styvt av kurva eller smidigt. Jag noterar att i det mjuka knäläget fungerar kompressorn inte rakt, men det börjar smidigt (så långt det kan vara lämpligt när vi pratar om millisekunder) redan före tröskelvärdet. För bearbetningsgrupper av kanaler och en vanlig blandning används det enkelt av det mjuka knäet (som det fungerar obemärkt) och för att betona attacker och andra funktioner separata verktyg - Hård knä;
  • Svarsläge: topp / rms. Toppläge är motiverat när du behöver knappast begränsa amplitudbrott, såväl som på signaler med en komplex form, vars dynamik och läsbarhet du behöver fullt ut förmedla. RMS-läge påverkar mycket försiktigt ljudet, så att du kan komprimera det genom att spara attacken.
  • Befordran (lookaad). Det här är den tid för vilken kompressorn vet vad han kommer att ha. En slags preliminär analys av inkommande signaler;
  • Smink eller vinst.. Parametern som låter dig kompensera för volymens höghet som ett resultat av komprimeringens funktion.

Först I. det viktigaste rådet, medlitar alla ytterligare frågor om kompression: Om du a) förstod principen om kompression, b) fast du vet hur en eller annan och c) har tid att prova några i praktiken olika modelleringa råd du behöver inte längre.

Jag är helt seriös. Om du noggrant läser den här posten, experimenterade med standardkompressorn i din DAW och en eller två plugins, men förstod inte i vilka fall du behöver installera stora angreppsvärden, vilken förhållande koefficienten används och i vilket sätt som ska bearbeta Källsignal - då kommer du att söka på internet färdiga recept, som tillämpar dem tanklöst där den föll.

Recept av exakt kompressortunning Detta är ungefär som recept för noggrann anpassning av reverb eller kör - berövad av någon mening och har inget att göra med arbetet. Därför upprepar jag det enda korrekta receptet: Arming den här artikeln, goda övervakning hörlurar, en plug-in för visuell kontroll av vågformen och spendera kvällen i företaget med ett par kompressorer.

Spela teater!

, Mediaspelare

Plattor, särskilt gamla, som spelades in och tillverkades före 1982, med en mycket lägre sannolikhet att blanda, under vilken posten skulle ha varit högre. De reproducerar naturlig musik med ett naturligt dynamiskt område, som kvarstår på posten och är förlorad i de flesta standard digitala format eller högupplösta format.

Naturligtvis finns det undantag - lyssna inte på det långvariga albumet Stephen Wilson från MA-inspelningar eller referensinspelningar, och du kommer att höra hur bra det digitala ljudet kan vara. Men det här är en sällsynthet, de flesta moderna ljudinspelningar är höga och komprimerade.

Nyligen är musikkomprimering föremål för allvarlig kritik, men jag är redo att argumentera för att nästan alla dina favoritrekord komprimeras. Några av dem är mindre, lite mer, men fortfarande komprimerade. Komprimeringen av det dynamiska området är en slags syndabock, som är klandras i ett dåligt musikaliskt ljud, men starkt komprimerad musik är inte en ny trend: Lyssna på 60-talets album. Detsamma kan sägas om det klassiska arbetet med LED Zeppelin eller yngre album Wilco och Radiohead. Komprimeringen av det dynamiska området minskar det naturliga förhållandet mellan det höga och tysta ljudet på skivan, så viskningen kan vara så högt som ett gråt. Det är ganska problematiskt att hitta popmusik under de senaste 50 åren, som inte har varit föremål för kompression.

Jag pratade nyligen söt med grundaren och redaktören av Tape Op Larry Crane Magazine (Larry Crane) om bra, dåliga och "onda" aspekter av kompression. Larry Crane arbetade med sådana grupper och artister som Stefan Marcus, Cat Power, Greater-Kinney, Jenny Lewis, M. Ward, Go-Betweens, Jason Little, Eliot Smith, Quasi och Richmond Fontaine. Han styr också ljudspelet Studio Jackpot! I Portland, Oregon, som var en tillflykt till uppfödarna, december, Eddie Vederra, Pavelment, R.E.M., hon och honom och mer för många andra andra.

Som ett exempel, överraskande onaturligt låter, men fortfarande utmärkta låtar, citerar jag albumskeden "den önskade min själ", släpptes 2014. Caren skrattar och säger att han lyssnar på honom i bilen, för det låter han perfekt. Vad leder oss till ett annat svar på frågan varför musiken är komprimerad: Eftersom kompression och ytterligare "klarhet" tillåter dig att bättre höra det på bullriga platser.

Larry Craine på jobbet. Foto av Jason Quigley (Jason Quigley)

När folk säger att de gillar ljudet av ljudinspelningar, tror jag att de gillar musik, som om ljudet och musiken var oskiljaktiga termer. Men för mig själv skiljer jag dessa begrepp. Från synvinkeln av musik Audana kan ljudet vara oförskämt och rå, men det spelar ingen roll för de flesta lyssnare.

Många skyndar på att anklaga Master-ingenjörer i kompressionsmissbruk, men kompression appliceras direkt under ljudinspelning, under blandning och först då under mastering. Om du personligen inte deltog i var och en av dessa steg, kan du inte säga hur verktyg och vokalparti lät i början av processen.

Craine var i ett slag: "Om musiker vill medvetet göra ljudet galen och förvrängt som en rekord som styrs av röster, så är det inget fel med det - önskan alltid uppväger ljudkvaliteten." Utställarens röst är nästan alltid komprimerad, samma sak händer med bas, trummor, gitarrer och synthesizers. Med hjälp av kompression sparas volymen på vokalen på önskad nivå i hela låten eller något som skiljer sig mot bakgrunden av andra ljud.

Korrekt komprimering kan göra ljudet av trummor mer levande eller avsiktligt konstigt. Till musik Ljud perfekt måste du kunna använda de nödvändiga verktygen för detta. Det är därför att förstå hur man använder kompression och inte överdriv det, år lämnar. Om mixingenjören pressade för mycket en gitarrfest, så kommer mästaren ingen längre att kunna återställa de saknade frekvenserna helt.

Om musiken ville att du skulle lyssna på musik som inte passerade fasen av blandning och mastering, skulle vi producera det på hyllorna i butikerna direkt från studion. Crane säger att människor som skapar, redigerar, blandar musik och utför sin mastering, det ska inte förväxlas av musiker - de hjälper artister från början, det vill säga mer än hundra år.

Dessa människor är en del av skapandet, som ett resultat av vilka fantastiska konstverk erhålls. Caren tillägger: "Du behöver inte versionen av den mörka sidan av månen, som inte har passerat blandning och mastering." Pink Floyd släppte en sång i det slaget, i vad de ville höra det.

Vi tänker på frågan - varför ska vi höja volymen? För att höra de tysta ljud som inte hörs i våra förhållanden (till exempel om du inte kan lyssna högt om det finns främmande ljud i rummet, etc.). Är det möjligt att stärka de tysta ljuden, och rör inte högt? Det visar sig. Denna teknik kallas komprimering av det dynamiska området (kompression, dynamisk kompression, DRC). För att göra detta måste du ändra den aktuella volymen av ständigt - tysta ljud för att stärka, högt - nej. Den enklaste lagen om volymförändring är linjär, d.v.s. Volymen varierar beroende på lagen Output_Loudness \u003d K * Input_Loudness, där K är kompressionsförhållandet för det dynamiska området:

Figur 18. Komprimering av det dynamiska området.

När k \u003d 1, görs inga ändringar (utgångsvolymen är lika med ingången). Vid K.< 1 громкость будет увеличиваться, а динамический диапазон - сужаться. Посмотрим на график (k=1/2) - тихий звук, имевший громкость -50дБ станет громче на 25дБ, что значительно громче, но при этом громкость диалогов (-27дБ) повысится всего лишь на 13.5дБ, а громкость самых громких звуков (0дБ) вообще не изменится. При k > 1 - Volymen minskar, och det dynamiska området är att öka.

Låt oss titta på volymdiagrammen (K \u003d 1/2: Kompression av DD två gånger):

Figur 19. Volymgrafik.

Som det kan ses i originalet var båda mycket tysta ljuden närvarande, för 30 dB under dialognivån och mycket högt - med 30 dB över dialognivån. Så Det dynamiska området var 60 dB. Efter kompression är högljudda ljud endast 15 dB ovan och tyst - 15 dB under dialognivån (det dynamiska området är nu 30 dB). Således har de höga ljuden blivit mycket tystare, och tyst är betydligt högre. Samtidigt händer överflödet inte!

Låt oss nu vända sig till histogram:

Figur 20. Exempel på kompression.

Eftersom det tydligt kan ses - när man får upp till + 30 dB, är histogrammets form väl rädd, vilket innebär att de höga ljuden är väl uttalade (gå inte till maximalt och är inte trimmade, eftersom det händer med enkel förstärkning ). Samtidigt framhävs tysta ljud. Histogram det visar dåligt, men skillnaden är mycket märkbar för rykten. Bristen på metoden är samma volymvolym. Emellertid skiljer sig mekanismen för deras förekomst från hoppen av omskärmens volym som uppstår vid omskärelse, och deras karaktär är annorlunda - de manifesterar sig huvudsakligen med en mycket stark förstärkning av tysta ljud (och inte när omskuren högt, som med normal vinst ). Den överdrivna kompressionsnivån leder till en utplattning av ljudmönstret - alla ljud tenderar till samma volym och inexpressivitet.

Stark förstärkning av tysta ljud kan leda till att ljudet av inspelningen kommer att höras. Därför appliceras filtret, en liten modifierad algoritm så att ljudnivåerna klättrade mindre:

Figur 21. Öka volymen, utan att öka buller.

De där. På volymen -50dB körs överföringsfunktionen, och ljudet kommer att öka mindre (gul linje). I avsaknad av sådan böjning kommer buller att vara betydligt högre (grå linje). En sådan enkel modifiering minskar signifikant antalet buller, även med mycket starka kompressionsnivåer (i figuren - kompression 1: 5). "DRC" -nivån i filtret sätter nivån av amplifiering för tysta ljud (vid -50 dB), så vidare. Den 1/5 kompressionsnivån som visas i figuren motsvarar + 40 dB-nivån i filterinställningarna.

Den andra delen av cykeln ägnas åt funktionerna för att optimera det dynamiska området för bilder. I det kommer vi att berätta varför sådana lösningar behövs, överväga olika alternativ för deras genomförande, liksom deras fördelar och nackdelar.

Genom en immateriell

Helst måste kameran fixa världens bild runt om i världen när den uppfattar honom. På grund av det faktum att mekanismerna för "Vision" -kameror och mänskliga ögon. Betydligt varierar, det finns ett antal restriktioner som inte tillåter detta villkor att uppfylla.

Ett av de problem som tidigare står inför användarna av filmkameror och nu står inför digitala hållare, ligger i oförmågan att på ett adekvat sätt fånga scenerna med en stor skillnadsdroppe utan att använda speciella armaturer och / eller speciella fotograferingstekniker. De särdrag hos den mänskliga visuella apparaten tillåter dig lika bra för att uppfatta detaljerna i de högkontrastscener i både starkt upplysta och i mörka områden. Tyvärr kan kamerasensorn inte alltid fånga bilden som vi ser den.

Ju större ljusstyrkan faller på den fotograferade scenen, desto högre är sannolikheten för förlust av delar i ljus och / eller nyanser. Som ett resultat, istället för en blå himmel med frodiga moln, erhålls bara en vitisk plats på bilden, och föremålen i skuggan blir vaga mörka silhuetter eller sammanfogar med den omgivande atmosfären.

I det klassiska fotot för att bedöma kammarens funktion (eller bärare i fallet med filmkameror) för att överföra ett visst utbud av ljusstyrka använder konceptet fotografisk latitud(För detaljer, se i infogningen). Teoretiskt bestäms den fotografiska latituden av digitalkameror genom utmatning av en analog digitalomvandlare (ADC). När exempelvis applicering av en 8-bitars ADC, med hänsyn till kvantiseringsfelet, kommer det teoretiskt uppnåbara värdet av den fotografiska latituden att vara 7 EV, för 12-bitars - 11 EV, etc. Men i riktiga enheter visar det dynamiska utbudet av bilder w.teoretiskt maximum på grund av påverkan av olika buller och andra faktorer.

Den stora skillnaden i ljusstyrkan är en allvarlig
Problemet när du tar bilder. I det här fallet, kamerans förmåga
Det visade sig inte vara tillräckligt för adekvat överföring
ljusa områden av scenen, och som ett resultat istället för en blå sektion
himmel (markerad av stroke) visade sig vara en vit "patch"

Det maximala ljusvärdet som är kapabelt att fixera den ljuskänsliga sensorn bestäms av mättnadsnivån av dess celler. Minimivärdet beror på flera faktorer, inklusive storleken på det termiska bruset i matrisen, ljudet av laddningsöverföring och ADC-felet.

Det bör också noteras att den fotografiska latituden av samma digitalkamera kan variera beroende på det känsliga värdet i inställningarna. Det maximala dynamiska intervallet uppnås när den så kallade grundläggande känsligheten är inställd (motsvarande det lägsta numeriska värdet från möjligt). När värdet av denna parameter ökar reduceras det dynamiska området på grund av den ökande nivån av brus.

Fotografisk latitud moderna modeller Digitalkameror utrustade med stora sensorer och 14- eller 16-bitars ADC är från 9 till 11 EV, vilket är signifikant högre jämfört med liknande egenskaper hos färgade negativa filmer i 35 mm-formatet (i genomsnitt från 4 till 5 EV). Således har även relativt billiga digitalkameror fotografisk latitud, tillräcklig för att tillräckligt överföra de flesta typiska fans av amatörskytte.

Det finns dock ett problem med ett annat slag. Den är kopplad till de begränsningar som de befintliga inspelningsstandarderna digitala bilder. Med hjälp av JPEG-formatet med lite 8 bitar på färgkanalen (som nu har blivit den faktiska standarden för inspelning av digitala bilder i datorns industrin och digital teknik), kan även teoretiskt inte sparas en ögonblicksbild med en fotografisk latitud på mer än 8 EV.

Antag att kamerans ADC låter dig få en bild av lite 12 eller 14 bitar, innehållande urskiljbara delar både i lamporna och i skuggorna. Om den fotografiska latituden av den här bilden är 8 EV, då i färd med omvandling till ett standard 8-bitarsformat utan några ytterligare åtgärder (det vill säga helt enkelt genom att kassera "onödiga" utsläpp) en del av den inspelade informationsförlusten i den fria känsliga sensorn.

Dynamiskt område och fotografisk latitud

Om vi \u200b\u200bsäger förenklas, definieras det dynamiska området som förhållandet mellan det maximala bildets ljusstyrka till dess minimala värde. I det klassiska fotografiet används termen fotografisk latitud traditionellt, vilket i själva verket betecknar detsamma.

Bredden på det dynamiska området kan uttryckas i form av ett förhållande (till exempel 1000: 1, 2500: 1, etc.), men den logaritmiska skalan används oftast för detta. I det här fallet beräknas värdet av decimallogaritmen för det maximala ljusstyrka för sitt minimivärde, och efter numret är kapitalbrevet d (från den engelska densiteten? - densitet), mindre ofta? - OD Förkortning (från engelska Optisk densitet? - Optisk densitet). Om förhållandet mellan det maximala ljusvärdet till minimivärdet på vilken som helst anordning är 1000: 1, kommer det dynamiska området att vara lika med 3,0 D:

För att mäta den fotografiska latituden används de så kallade utställningsenheterna som betecknas av EV-förkortningen (från engelska exponeringsvärden traditionellt (från engelska. Exponeringsvärden; Professionella refereras ofta av sina "fotspår" eller "steg"). Det är just i dessa enheter att storleken på exponeringskorrigeringen i kamerans inställningar vanligtvis är inställd. En ökning av den fotografiska latituden av 1 EV motsvarar att du fördubblar skillnaden mellan maximala och minsta ljusstyrka. Således är EV-skalan också logaritmisk, men för att beräkna de numeriska värdena i detta fall appliceras logaritmen med en bas 2. Till exempel, om någon enhet gör att du kan fixa bilder, förhållandet mellan det maximala ljusstyrkan till Minsta värde som når 256: 1, då är dess fotografiska latitud 8 EV:

Kompression - rimlig kompromiss

Mest effektivt sätt Spara hela informationen om den bild som spelats in av kamerans ljuskänsliga sensor, spelar in bilder i råformat. En sådan funktion är dock långt ifrån alla kameror, och inte varje fotograf är redo att engagera sig i noggrann arbete med valet av enskilda inställningar för varje skott som tagits.

För att minska sannolikheten för förlust av delar av högkontrastbilder konverterade inuti kammaren i en 8-bitars JPEG, i anordningarna av många tillverkare (inte bara kompakt, men också speglade), introducerades speciella funktioner, vilket möjliggjorde utan användarintervention till Komprimera det lagrade bildernas dynamiska intervall. Genom att minska den totala kontrasten och förlusten av en mindre del av källbildinformationen, tillåter sådana lösningar att du spara i 8-bitars JPEG-formatdelar i lampor och skuggor, som är fasta med en ljuskänslig sensor av enheten, även om det dynamiska området av källbilden var bredare än 8 EV.

En av pionjärerna i utvecklingen av denna riktning var företaget HP. I HP Photosmart 945-digitalkamera som släpptes 2003 implementerades HP Adaptive Lighting-tekniken för första gången, så att du automatiskt kan kompensera för bristen på belysning i de mörka områdena i bilderna och därigenom upprätthålla delar i skuggorna utan risk för överexponering (vilket är mycket relevant när du fotograferar högkontrastscener). HP Adaptive Belingsalgoritmen är baserad på de principer som anges av den engelska forskaren Edwin Land (Edwin Land) i teorin om den visuella uppfattningen av retinex.

HP Adaptive Lighting Features Menu

Hur fungerar det adaptiva belysningsfunktionen? Efter att ha mottagit en 12-bitars bild extraheras en ögonblicksbild av den med en extra monokrom bild, som faktiskt representerar en ljuskarta. Vid behandling av en ögonblicksbild används detta kort som en mask som gör att du kan justera graden av exponering för ett ganska komplext digitalt filter på bilden. I områden som motsvarar de mest mörka punkterna i kortet är påverkan på bilden av den framtida ögonblicksbilden minimalt och vice versa. Med detta tillvägagångssätt kan du visa delar i skuggorna på grund av selektiv ljusning av dessa områden och därmed minska den totala kontrasten av den resulterande bilden.

Det bör noteras att när den adaptiva belysningsfunktionen är påslagen bearbetas den tagna bilden på det sätt som beskrivs ovan innan den färdiga bilden spelas in i filen. Alla beskrivna operationer utförs automatiskt, och användaren kan bara välja ett av de två användningsmetoderna adaptiv belysning i kameramenyn (låg eller hög exponeringsnivå) eller inaktivera den här funktionen.

Generellt sett är många specifika funktioner hos moderna digitalkameror (inklusive de som anses i föregående artikel erkännande av personer) en slags sida eller omvandlingsprodukter av forsknings- och utvecklingsarbete, som ursprungligen genomfördes för militära kunder. När det gäller funktionerna för att optimera ett dynamiskt utbud av bilder är en av de mest kända leverantörerna av sådana lösningar apikala. De algoritmer som skapas av sin personal, i synnerhet, ligger i synnerhet arbetet i SAT-funktionen (Shadow Adjustment Technology - Shadow Correction Technology) implementerad i ett antal modeller av Olympus digitalkameror. Kort sagt kan SAT-funktionen beskrivas enligt följande: Baserat på källkodsbilden av bilden, skapas en mask som motsvarar de mest mörka områdena, och sedan för dessa områden korrigeras utställningsvärdet automatiskt.

En Sony har också förvärvat en licens att använda apikal utveckling. I många modeller av Compact Cyber-Shot-serien och i ALFA-seriens spegelkameror implementeras den så kallade dynamiska intervalloptimeringsfunktionen (Dynamic Range Optimizer, DRO).

Fotografier gjorda av HP Photosmart R927-kamera med urkopplad (högst upp)
och aktiverad funktion Adaptiv belysning

Bildkorrigering När DRO-aktivering utförs under den primära bildbehandlingsprocessen (det vill säga innan du spelar in en färdig JPEG-formatfil). I den grundläggande versionen har DRO en tvåstegsinställning (du kan välja standard eller avancerat läge för dess funktion i menyn). När du väljer en standardlägesbaserad bildanalys korrigeras exponeringsvärdet, och sedan appliceras en tonkurva för att anpassa en allmän balans på bilden. I det avancerade läget används en mer komplex algoritm, vilket möjliggör korrigering av både i skuggorna och i lamporna.

Sony-utvecklare arbetar ständigt med förbättringen av DRO-operationsalgoritmen. Till exempel, i A700 spegelkameran, när en avancerad DRO är aktiverad, är det möjligt att välja en av fem korrigeringsalternativ. Dessutom implementeras möjligheten att spara de tre alternativen på en ögonblicksbild (en slags bracketing) med olika alternativ för DRO.

I många modeller av Nikon digitalkameror finns en D-Lighting-funktion, som också är baserad på apikala algoritmer. TRUE, i motsats till de ovan beskrivna lösningarna, implementeras D-belysningen som ett filter för bearbetning av tidigare lagrade bilder med hjälp av en tonkurva, vars form gör det möjligt att göra skuggor med lättare, samtidigt som de återstående sektionerna i bild. Men eftersom i detta fall är färdiga 8-bitars bilder utsatta för bearbetning (och inte den ursprungliga rambilden, med en högre bit och, följaktligen ett bredare dynamiskt område), är möjligheterna till D-belysning mycket begränsade. För att få samma resultat kan användaren vara genom att behandla ögonblicksbilden i en grafisk redigerare.

Vid jämförelse av förstorade fragment är det klart märkbart att de mörka områdena i den ursprungliga bilden (vänster)
När du slår på den adaptiva belysningsfunktionen blev lättare lättare

Det finns ett antal lösningar baserade på andra principer. Så, i många kameror av Lumix-familjen av Panasonic (i synnerhet DMC-FX35, DMC-TZ4, DMC-TZ5, DMC-FS20, DMC-FZ18, etc.) implementeras en lättigenkänningsfunktion (intelligent exponering), vilken är en integrerad del av systemets intelligenta automatisk fotograferingskontroll IA. Operationen av den intelligenta exponeringsfunktionen är baserad på den automatiska bildanalysen och korrigeringen av mörka sektioner av bilden för att undvika förlust av delar i skuggorna, liksom (om det behövs) komprimering av det dynamiska området med hög kontrastscener .

I vissa fall tillhandahåller driften av optimeringsfunktionen för det dynamiska området inte bara vissa operationer för att bearbeta bilden av bilden, utan också korrigeringen av fotograferingsinställningar. Till exempel, i de nya modellerna av Fujifilm digitalkameror (i synnerhet i FinePix S100F), implementeras en dynamisk intervallutsläppfunktion (brett dynamiskt område, WDR), som tillåter utvecklarna att öka den fotografiska latituden av ett eller två steg (I terminologin i Inställningar - 200 och 400%).

När du aktiverar WDR-funktionen tar kameran bilder med en exponering -1 eller -2 EV (beroende på den valda inställningen). Således erhålls rambilden felaktig - detta är nödvändigt för att upprätthålla maximal information om detaljerna i lamporna. Därefter bearbetas den resulterande bilden med en tonkurva, vilket gör det möjligt att anpassa den övergripande balansen och justera den svarta nivån. Därefter omvandlas bilden till ett 8-bitars format och spelas in som en JPEG-fil.

Dynamic Range Compression gör att du kan spara mer information
I lamporna och skuggorna är dock den oundvikliga konsekvensen av en sådan inverkan
är en minskning av den totala kontrasten. På den nedre avbildningen
Det är dock mycket bättre utvecklat av molnens konsistens, dock
På grund av den nedre kontrasten, den här versionen av bilden
Ser mindre naturligt ut

En liknande funktion som kallas dynamisk utvidgning implementeras i ett antal kompakta och spegelkameror av Pentax (Optio S12, K200D, etc.). Enligt tillverkaren kan appliceringen av den dynamiska områdesförstoringsfunktionen öka fotografiska latitud av bilder på 1 EV utan förlust av delar i ljus och skuggor.

Funktionen som verkar på detta sätt kallas Highlight Tone Prioritet (HTP) implementeras i ett antal Canon Mirror-modeller (EOS 40D, EOS 450D, etc.). Enligt informationen som anges i användarhandboken tillåter aktiveringen av HTP att du förbättrar delar av delar i lamporna (eller snarare, på nivåområdet från 0 till 18% grå).

Slutsats

Låt oss sammanfatta. Den inbyggda kompressionsfunktionen hos det dynamiska området möjliggör med minimal skada att konvertera källbilden med ett stort dynamiskt område i 8-bitars jpeg-fil. I avsaknad av ramar av sparar ramar i RAW-formatet ger kompressionsläget för det dynamiska området fotografen möjlighet att mer fullt använda kamerans potential när du fotograferar högkontrastscener.

Naturligtvis är det nödvändigt att komma ihåg att kompressionen av det dynamiska området inte är ett mirakulös, utan snarare en kompromiss. För bevarande av delar i ljusa och / eller skuggor är det nödvändigt att betala ljudnivån i de mörka delarna av bilden, en minskning av dess kontrast och viss beläggning av smidiga tonövergångar.

Som någon automatisk funktionAlgoritmen för komprimering av det dynamiska området är inte en helt universell lösning som låter dig förbättra någon bild. Och därför att aktivera det är bara meningsfullt i fall där det verkligen är nödvändigt. Till exempel, för att avlägsna silhuetten med en välbearbetad bakgrund, måste komprimeringsfunktionen hos det dynamiska området vara avstängda - annars kommer den spektakulära tomten att bli hopplöst bortskämd.

Genom att överväga detta ämne bör det noteras att användningen av dynamiska kompressionsfunktioner inte tillåter "dra" på den resulterande bilddelen som inte fixerades av kamerasensorn. För att få ett tillfredsställande resultat, när du fotograferar högkontrastscener, måste du använda ytterligare enheter (till exempel lutningsfilter för fotografering av landskap) eller speciella tekniker (som att skjuta flera ramar med bracketering på exponering och vidare kombinera dem i en bild med hjälp av Tonmaksteknik).

Nästa artikel kommer att ägnas åt seriell fotograferingsfunktion.

Fortsättning följer

Ljudnivån är densamma i hela kompositionen, det finns flera pauser.

Minskning av dynamiskt område

Förminskande det dynamiska området, eller helt enkelt kompressionbehövs för olika ändamål som är vanligast av dem:

1) Uppnå en enda volymnivå genom hela kompositionen (eller verktygsbatch).

2) Uppnå en enda volymnivå av kompositioner över albumet / radiotransmissionen.

2) Öka förståelsen, främst med kompressionen av en viss part (sång, basfat).

Hur är det minskande av det dynamiska området?

Kompressorn analyserar ljudnivån vid ingången som jämför den med den användare som anges av tröskelvärdet (tröskelvärdet).

Om signalnivån är lägre än värdet Tröskel. - Kompressorn fortsätter att analysera ljudet utan att ändra det. Om ljudnivån överstiger värdet av tröskelvärdet - börjar kompressorn sin åtgärd. Eftersom kompressorns roll består i att minska det dynamiska området, är det logiskt att anta att det begränsar de mest stora och de minsta amplitudvärdena (signalnivå). I det första steget finns det en begränsning av de största värdena som minskar med en viss kraft som kallas Förhållande. (Attityd). Låt oss titta på exemplet:

Gröna kurvor visar ljudnivån, desto större är amplituden för deras oscillationer från X-axeln - desto större är signalnivån.

Den gula linjen är kompressorns tröskelvärde (tröskel). Gör tröskelvärdet ovan - användaren tar bort den från X-axeln. Gör tröskelgränsen nedan - användaren tar den till Y-axeln. Det är uppenbart att det nedre värdet av tröskeln - oftare kompressorn kommer att utlösas och det andra sättet. Om förhållningsvärdet är mycket stort, kommer den efterföljande signalen att undertryckas av kompressorn för tystnad efter nått tröskelsignalnivån. Om värdet av förhållandet är mycket litet - händer ingenting. På valet av tröskelvärde och förhållanden kommer det senare. Nu borde vi fråga dig själv nästa fråga: Vad är meningen med att undertrycka hela det efterföljande ljudet? I själva verket är det i så fall nej, vi måste bli av med amplitudvärdena (toppar), som överstiger värdet av tröskeln (i grafiken är markerade i rött). Det är att lösa detta problem och det finns en parameter Släpp (Dämpning), som kommer att ställa in kompressionstiden.

Exemplet visar att det första och det andra överskottet av tröskelgränsen varar mindre än det tredje överskottet av tröskelgränsen. Så, om frisättningsparametern justeras till de två första topparna, då vid bearbetning av den tredje kan förbli obehandlad del (eftersom tröskeln överstiger tröskeln varar längre). Om frisättningsparametern justeras till den tredje toppen - sedan vid behandling av den första och den andra toppen bildas en oönskad minskning av signalnivån.

Detsamma kommer förhållandet parametern. Om förhållandet parametern är konfigurerad till de två första topparna, kommer den tredje inte att undertryckas tillräckligt. Om förhållningsparametern är konfigurerad att bearbeta den tredje toppen - kommer bearbetningen av de två första topparna att vara för höga.

Dessa problem kan lösas på två sätt:

1) Ställ in Attack-parametern (attack) är en partiell lösning.

2) Dynamisk komprimering är en komplett lösning.

Parameter mentaki (attack)det är avsett för en tidsuppgift, varefter kompressorn startar sitt arbete efter tröskelvärdet överskrids. Om parametern är nära noll (lika med noll i fallet med parallellkomprimering, se ACC. Artikeln) - då börjar kompressorn att undertrycka signalen omedelbart och hur många gånger som anges av frisättningsparametern kommer att fungera. Om attacken är bra, kommer kompressorn att starta sin åtgärd efter en viss tidsutgång (det är nödvändigt att göra en definition). I vårt fall kan du konfigurera parametrarna för tröskelvärdet (tröskelvärdet), dämpning (release) och komprimeringsnivån (förhållandet) för att bearbeta de två första topparna, och attackvärdet (attack) är inställd nära noll. Därefter kommer kompressorn att undertrycka de två första topparna, och vid bearbetning av den tredje kommer att undertrycka den tills tröskelvärdet (tröskelvärdet) är klar. Detta garanterar dock inte högkvalitativ bearbetning Ljud och nära till begränsning (grovklippning av alla amplitudvärden, i detta fall kallas kompressorn en begränsare).

Låt oss titta på resultatet av ljudbehandling med kompressor:

Toppar försvann, märka det faktum att bearbetningsinställningarna var tillräckligt milda och vi levererade endast de flesta högtalare av amplitud. I praktiken är det dynamiska området minskat mycket starkare och denna trend utvecklas bara. I många kompositörers sinnen - de gör musik högre, men i praktiken berövar de helt sina högtalare för de lyssnare som kanske måste lyssna på henne hemma och inte på radion.

Vi har lämnat för att överväga den sista parametern för kompressionen är Få.(Få). Förstärkning är avsedd att öka amplituden för hela kompositionen och, i själva verket ekvivalent med ett annat verktyg för ljudredaktörer - normaliz. Låt oss titta på slutresultatet:

I vårt fall var komprimeringen motiverad och förbättrade ljudets dop, eftersom den släppta toppen är ganska en olycka än ett avsiktligt resultat. Dessutom kan det ses att musiken är rytmisk, därför kännetecknas det av ett smalt dynamiskt område. I fall där höga amplituder gjordes specifikt kan kompressionen bli ett fel.

Dynamisk kompression

Skillnaden mellan dynamisk komprimering från inte dynamiska ligger i det faktum att med den första signalundertryckningsnivån (förhållandet) beror på nivån på den inkommande signalen. Dynamiska kompressorer är i alla moderna program, som styr förhållandet och tröskelparametrarna med fönstret (varje parameter motsvarar sin egen axel):

Det finns ingen enkel schema visningsstandard, någonstans längs Y-axeln, visas nivån på den inkommande signalen, någonstans tvärtom, signalnivån efter kompression. Någonstans är punkten (0,0) i övre högra hörnet, någonstans längst ner till vänster. Under alla omständigheter ändras värdena för siffror som motsvarar förhållandet och tröskelparametrarna när man flyttar muspekaren genom det här fältet. De där. Du anger kompressionsnivån för varje tröskelvärde, tack vare vilken du enkelt kan konfigurera komprimering.

Sidokedja

Sidokedjekompressor analyserar en enda kanalsignal, och när ljudnivån överstiger tröskeln (tröskelvärdet) - applicerar komprimering till en annan kanal. Sidokedjan har sina fördelar med att arbeta med verktyg som finns i en frekvensdomän (basbasbasbasen används aktivt), men ibland används verktygen i olika frekvensområden, vilket leder till en intressant sido-kheeng.

Del två - kompressionssteg

Det finns tre kompressionssteg:

1) Det första steget är komprimeringen av individuella ljud (singlarhoots).

Timbre av något verktyg har följande funktioner: Attack (Attack), Holding (Hold), Nedgång (Förfall), Nivåperiod (Sustain), Attityd (Release).

Kompressionsfasen hos enskilda ljud är uppdelad i två delar:

1.1) Komprimering av individuella ljud av rytmiska verktyg

Ofta kräver delarna av biten en separat kompression för att ge dem en klarhet. Många behandlade basfat separat från andra rytmiska verktyg, både vid kompressionsstadiet av individuella ljud och på kompressionsstadiet. Detta beror på det faktum att det är i ett lågfrekvensområde, där endast basen vanligtvis är närvarande förutom det. Under kanten av basfat betyder närvaron av ett karakteristiskt klick (en mycket kort tid av attack och hållarstänger). Om klicket inte är - är det nödvändigt att bearbeta det med en kompressor, ställa in tröskeln lika med noll och attacktiden från 10 till 50 ms. Realeese kompressorn måste sluta till den nya basfatstrejken. Det sista problemet kan lösas med formeln: 60 000 / bpm, där BPM är tempo av kompositionen. Så till exempel) 60 000/137 \u003d 437,96 (tid i millisekunder till en ny stark skugga av den 4-dimensionella kompositionen).

Allt ovan gäller andra rytmiska verktyg med kort tid attack - de måste ha ett accenterat klick, vilket inte bör undertryckas av kompressorn på några av stadierna av kompressionsnivåer.

1.2) Komprimering Separata ljud Harmoniska instrument

Till skillnad från rytmiska instrument är satsen av harmoniska verktyg ganska sällan bestående av individuella ljud. Det följer emellertid inte av detta att de inte bör behandlas på nivån av ljudkomprimering. Om du använder prov med den inspelade parten är det den andra nivån av kompression. Denna nivå av kompression innefattar endast syntetiserade harmoniska instrument. Dessa kan vara prover, syntetiserare med användning av olika ljudsyntesmetoder (fysisk modellering, FM, additiv, subtraktiv etc.). Som du förmodligen har gissat - pratar vi om programmering av synthesizer-inställningarna. ja! Detta är också en komprimering! Nästan alla syntetiserare har en programmerbar kuvertparameter (ADSR), vilket innebär kuvert. Med hjälp av kuvert är attacktiden (attack) satt, lågkonjunktur (sönderfall), hålla nivåer (bibehålla), Atoys (release). Och om du berättar vad det inte är komprimeringen av varje enskilt ljud - är du min fiende för livet!

2) Det andra steget är komprimeringen av enskilda parter.

Under kompressionen av enskilda parter förstår jag minskning av det dynamiska området för ett antal United-ljud. I detta skede ingår register över fester, inklusive sång, vilket kräver behandling av komprimering för att ge det en klarhet och förståelse. Vid bearbetning av komprimeringen av parter är det nödvändigt att ta hänsyn till att när de enskilda ljuden läggs till kan oönskade toppar uppträda, på vilka det är nödvändigt att bli av med detta skede, eftersom om det inte är gjort nu, då bilden kan förvärras på informationsstadiet om hela kompositionen. Vid kompressionsstadiet av enskilda parter är det nödvändigt att ta hänsyn till komprimeringen av bearbetningssteget för individuella ljud. Om du har uppnått känsligheten i bassfatet - kan felaktig återbehandling i det andra steget förstöras allt. Bearbetningen av alla satser av kompressorn är inte nödvändig, liksom bearbetningen av alla enskilda ljud inte krävs. Jag råder dig att leverera en amplitudanalysator bara i fall för att bestämma närvaron av oönskade biverkningar av att kombinera individuella ljud. Förutom kompression, i detta skede är det nödvändigt att se till att parterna är som möjligt i olika frekvensband så att kvantisering utfördes. Det är också användbart att komma ihåg att ljudet har en sådan egenskap som maskering (psykoakusti):

1) Ett tyst ljud är maskerat högt och går till honom.

2) Tyst ljud vid låg frekvens maskeras av högt ljud vid hög frekvens.

Så, till exempel, om du har en sats synthesizer, så börjar ofta spela innan de tidigare anteckningarna avslutar sitt ljud. Ibland är det nödvändigt (skapa harmoni, spelstil, polyfoni), men ibland inte alls - du kan beskära sin slut (fördröjning) om det hörs i solo-läge, men inte hörs i uppspelningsläget för alla parter. Detsamma gäller för effekter, som reverb - det borde inte vara sist till det nya ljudet av ljudkällan. Skärning och borttagning av en onödig signal - Du gör ljudrengöraren, och det kan också betraktas som en kompression - eftersom du tar bort onödiga vågor.

3) Det tredje steget är kompositionens kompression.

Med kompressionen av hela kompositionen är det nödvändigt att ta hänsyn till att alla parter är associerade med många separata ljud. När de är associerade och efterföljande kompression är det följaktligen nödvändigt att säkerställa att den slutliga komprimeringen inte förstör det vi har uppnått vid de två första etapperna. Du måste också separera kompositionerna i vilka är viktigt och smalt intervall. Med kompression av kompositioner med ett brett dynamiskt område - det är tillräckligt att sätta en kompressor som kommer att förskriva kortsiktiga toppar som bildades som ett resultat av tillsatsen av parter bland dem själva. Med komprimering av den sammansättning där det smala dynamiska området är viktigt - allt är mycket mer komplicerat. Här kallas kompressorerna nyligen maximizers. Maximizer är ett plugin som kombinerar kompressor, limitter, graffiti equalizer, enhaiser och andra ljudomvandlingsverktyg. Samtidigt måste det nödvändigtvis ha ljudanalysverktyg. Flytta, slutlig bearbetning med en kompressor, behövs i stor utsträckning för att bekämpa antagna fel i tidigare steg. Fel - inte så mycket kompression (men om du gör det i sista etappen, vad du kan göra i första etappen - det här är ett fel), hur mycket i det ursprungliga valet av bra prover och verktyg som inte skulle störa varandra (Vi pratar om frekvensband). Det är för detta att ACHK-korrigering görs. Det händer ofta att med stark komprimering på befälhavaren måste du ändra parametrarna för kompression och information om tidigare steg, eftersom med en stark inskränkning av det dynamiska området, tysta ljud, som tidigare maskerade, ändrar ljudet av individuella komponenter i kompositionen .

I dessa delar påverkar jag inte specifika kompressionsparametrar. Jag ansåg att det var nödvändigt att skriva om det när kompression är nödvändigt att uppmärksamma alla ljud och alla parter i alla stadier av att skapa kompositionen. Endast så i slutändan får du ett harmoniskt resultat inte bara ur musikens teorin, men också ur ljudteknikens synvinkel.

Därefter finns det praktiska tips om behandling av enskilda parter. Men i kompression kan siffrorna och förinställningarna bara föreslå det önskade området, där du behöver leta efter. Perfekt inställningar Komprimering beror på varje enskilt fall. Förstärkningen (vinst) och tröskelvärdet (tröskelvärde) innebär den normala ljudnivån (logisk användning av hela intervallet).

En del av TIE-kompressionsparametrarna

Kort referens:

Tröskeln (tröskel) - bestämmer ljudnivån för den inkommande signalen för att uppnå vilken kompressorn börjar fungera.

Attack (attack) - bestämmer tiden efter vilken kompressorn börjar arbeta.

Nivå (förhållande) - bestämmer den steniga att reducera värdena för amplituden (med avseende på det ursprungliga amplitudvärdet).

Släpp (release) - bestämmer tiden efter vilken kompressorn slutar fungera.

Gaining (Gain) - bestämmer nivån på ökande signal, efter att ha bearbetat kompressorn.

Kompressionstabell:

Verktyg Tröskel. Ge sig på Förhållande. Släpp Få. Beskrivning
Vokaler 0 db. 1-2 ms.

2-5 ms.

10 ms

0,1 ms.

0,1 ms.

mindre än 4: 1

2,5: 1

4:1 – 12:1

2:1 -8:1

150 ms.

50-100 ms.

150 MSEK

150 ms.

0,5s.

Komprimering Vid inspelning måste vara minimal, kräver obligatorisk behandling på informationsstadiet för att göra en definition och förståelse.
Vindinstrument 1 - 5ms 6:1 – 15:1 0,3s.
Tunna från 10 till 50 ms

10-100 ms.

4: 1 och över

10:1

50-100 ms.

1 ms.

Det lägre throden och det större förhållandet och längre attackerar, desto starkare klick i början av fat.
Syntetiserare Beror på vilken typ av våg (ADSR-kuvert).
Trumma trumma: 10-40 ms.

1-5ms

5:1

5:1 – 10:1

50 ms.

0,2s.

Höghatt 20 ms. 10:1 1 ms.
Teparmikrofoner 2-5 ms. 5:1 1-50 ms.
Trummor 5ms. 5:1 – 8:1 10ms.
Basgitarr 100-200 ms.

4ms till 10ms.

5:1 1 ms.

10ms.

Sträng 0-40 ms. 3:1 500 ms.
Sint bas 4ms - 10ms 4:1 10ms. Beror på kuvert.
Percussion 0-20 ms. 10:1 50 ms.
Akustisk gitarr, piano 10-30 ms.

5 - 10ms

4:1

5:1 -10:1

50-100 ms.

0,5s.

Elektro-nitara 2 - 5ms 8:1 0,5s.
Slutkompression 0,1 ms.

0,1 ms.

2:1

från 2: 1 till 3: 1

50 ms.

0,1 ms.

0 dB vid utgången Anfallstiden beror på målet - oavsett om det är nödvändigt att ta bort toppar eller göra spåret jämnare.
Limiter efter slutlig kompression 0 ms. 10:1 10-50 ms. 0 dB vid utgången Om du behöver ett smalt dynamiskt område och en oförskämd "snitt" vågor.

Informationen togs från olika källor som kallas långa resurser på Internet. Skillnaden i kompressionsparametrar komprimeras av skillnaden i ljudinställningar och arbeta med olika material.