Digitalizace, kodeky aneb jak to vše funguje

Většina hudby, kterou dnes posloucháme, prošla ve větší či menší míře procesem digitalizace a následným zpracováním různými typy počítačového softwaru. Jak tento proces probíhá a jaké jsou výhody konkrétních nástrojů pro zpracování zvuku?

 

Co je to kodek a jak probíhá proces digitalizace?

Pro pochopení toho, co to vlastně kodek je a jak funguje, je nutné znát alespoň základ postupu zvukové digitalizace. Samotné slovo kodek (v angličtině codec) je složenina dvou slov – dovat a Dekódovat. Jedná se tedy vlastně o soubor instrukcí, podle nějž se něco převádí do něčeho jiného a naopak. Můžeme si jej představit jako složitou šifru. Nejčastěji se kodeky užívají k převodu audio a video signálu. V tomto článku se budeme věnovat kodekům zvukovým.

Kodeky se ve světě počítačů používají ke zpracování zvuku obecně a také pro převod signálu analogového na signál digitální. Největší problém těchto převodů je rozdílná podstata obou signálů.

 

 

 

Analogový signál

je spojitý a lze si ho představit jako průběh nějaké funkce (na obrázku vidíte průběh funkce sinus). Jeho spojitost zajišťuje, že se i ve velmi malém časovém intervalu můžeme podívat na jeho přesný průběh.

Pokud si odmyslíme náš graf a přejdeme do oblasti audia, analogový signál je proud zvuku, který vnímají naše uši. Řeč, koncert, hluk motoru, ptačí zpěv, to všechno jsou analogové signály.

 

 

 

Digitální signál

je signál, který není spojitý a ukazuje hodnotu v určitém krátkém časovém okamžiku. Jedná se o zjednodušení analogového signálu, tak aby s ním byly schopny pracovat počítače. Toto zjednodušení se nazývá aproximace.

 

 

 

 

Velmi zjednodušeně proces aproximace popisuje tento graf. Za přesný časový interval si změří aktuální hodnotu signálu a zaznamená ji, čím je časový údaj kratší, tím je převedený výsledek kvalitnější.

Proces aproximace s sebou nutně přináší ztrátu dat (v případě převodu audia ztrátu kvality zvuku). Na tomto grafu vidíme velmi jednoduchý příklad aproximace, ta, kterou provádějí kodeky, je mnohem sofistikovanější a čím lépe je její proces navržen, tím kvalitnější zvuk si může posluchač vychutnat.

Digitalizace zvuku tak, jak jsme si ji popsali výše, se v masovém měřítku používá od osmdesátých let a souvisí s nástupem CD nosičů. Zvuk na CD je složen z 44100 vzorků za vteřinu a každý vzorek má hodnotu 0 – 65 535 (tedy rozsah šestnácti bitů). Ve zkratce lze tento proces popsat jako 16bitová/44kHz rychlost. Její nekomprimovaná velikost byla přibližně 10 MB za minutu záznamu, na CD se tak vešla přibližně hodina hudby. Pro potřeby efektivní práce se zvukem a jeho přenos se tato velikost příliš nehodila a brzy tak začaly pokusy o její zmenšení – tzv. komprimaci.

 

Jak funguje lidské ucho a jak pomůže zmenšit velikost hudebního souboru?

 

Metod, jak zvuk komprimovat, je několik. Jedna z nejpoužívanějších je založena na principu psychoakustického modelování. To využívá toho, že lidský sluch nevnímá všechny zvuky stejně intenzivně. Ucho přenese do nervového centra mozku sérii signálů a mozek je pak dále zpracovává a na různé vzruchy reaguje s jinou intenzitou. Proto například neslyšíme zvuky o vysokých nebo nízkých frekvencích nebo je pro nás nepostřehnutelná příliš malá změna v průběhu tonů.

Jde tedy říci, že komprese pomocí psychoakustického modelování má za cíl zachovat jen tu část zvuku, kterou lidské ucho slyší, a zbytek odříznout a vymazat. Problémem je, že pro tento proces neexistuje jednotný postup a může se také lišit v závislosti na povaze zvuku, který komprimujeme. Proto se může stát, že při použití toho samého typu kodeku se nám může zdát nějaký typ zvuku (třeba rockový koncert) bezchybný, zatímco u jiného (například koncertu vážné hudby) uslyšíme zřejmý pokles kvality i pokud jej posloucháme v méně kvalitních sluchátkách (obecně platí, že kvalitnější sluchátka jsou schopna lepší zvukové reprodukce a pokles kvality zvuku se u nich projeví významněji). Tato komprese funguje na principu ztráty nedůležitých dat, a proto se nazývá „ztrátovou kompresí“.

 

Kodek AAC

 

Pod zkratkou AAC se skrývá anglické sousloví Advance Audio Coding. Jedná se o standard ztrátové komprese, který byl vyvinutý jako následník velmi populárního kodeku MP3. Tento formát není jednotný a zahrnuje více tzv. profilů.

Všechny profily mají stejný základ, ale vykazují drobné změny v procesu komprese, některé z nichv sobě také zahrnují pokročilé technologie jako postprocessing nebo LTP(Long Term Prediction). Svůj vlastní profil si v rámci tohoto kodeku vytvořila firma Apple. Ten je podporován všemi jejími zařízeními, pracují s ním iTunes. Firma Apple neustále pracuje na jeho zdokonalování a obecně je tento profil považován za jeden z nejlepších, jaké AAC má.

 

 

 Kodek AptX

Tento kodek je založen na principech časové domény ADPCM. Jedná se nejen o softwarový kodek jako takový, ale také o polovodičovou součástku, která umožní modulaci pulzních kódů. Tato funkce je nutná při kódování i dekódování signálu a je tedy potřeba, aby AptX podporoval jak vysílač (např. mobilní telefon), tak přijímač (např. sluchátka).

Tato metoda komprimace je překvapivě velmi stará a objevila se už počátkem osmdesátých let. V současnosti je známá především v souvislosti s bezdrátovým spojením Bluetooth. Zvuk jím přenášený je díky AptX velmi věrný a ztráty během přenosu jsou minimalizovány. Je však třeba uvědomit si, že kódování prostřednictvím AptX nemůže opravit vysokou komprimaci u zdroje. Pokud bude výchozí skladba ve formátu MP3 nekvalitní a zašuměná, AptX ji vylepšit nedokáže. Máme-li k dispozici kvalitní zdroj hudby a kvalitní sluchátka, není důvod AptX nepoužívat. Pokud se rozhodnete pro pořízení sluchátek nebo reproduktorů s podporou tohoto kodeku, nezapomeňte se přesvědčit, že zařízení, ze kterého signál vysílá, jej také podporuje.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.