Karlheinz Brandenburg – ten, který přinesl světu MP3

V dnešním díle seriálu o nejvýznamnějších osobnostech technologického světa si představíme zvukového inženýra Karlheinze Brandenburga, který se proslavil vyvinutím metody komprese audio dat známé jako MP3 a otevřel tak cestu k rozvoji digitální hudby, jak ji známe dnes. Nově vzniklý formát se stal v době rozmachu internetu nesmírně populárním a audio soubory tohoto formátu byly svého času snad na každém počítači. Kromě toho je Brandenburg znám svým výzkumem v oblasti psychoakustiky nebo rozvojem technologie zvané syntéza vlnových polí. Byl také jednou z klíčových osob, které se angažovaly při založení ústavu Technologie digitálních médií na Fraunhoferově institutu, jednom z nejvýznamnějších evropských výzkumných pracovišť.

 

Srdcový projekt přinesl revoluci

   Jaká byla profesní cesta držitele mnoha prestižních technologických ocenění, např. German Future Award 2000 nebo IEEE Masaru Ibuka Consumer Electronics Award za rok 2004, a spoluvynálezce 27 v USA zaregistrovaných patentů?

   https://c1.staticflickr.com/5/4143/4764099009_03544256d7_b.jpgNarodil se v roce v roce 1954 v bavorském městě Erlanky. V roce 1980 vystudoval na Erlangensko-norimberské univerzitě obor elektrické inženýrství a o dva roky později tamtéž matematiku. V roce 1989 na své alma mater získal doktorský titul Ph.D. Vedoucím jeho práce byl profesor Dieter Seitzer, odborník na zmíněnou psychoakustiku, obor zabývající se  vnímáním zvuku, přesněji výzkumem psychologických i fyziologických reakcí na audiální podněty jako řeč a hudba. Začátkem 80. let přišel se svým vysněným projektem, který nesl pracovní označení „digitální jukebox“ a na kterém pracoval s výzkumníky Fraunhoferova institutu. Cílem bylo vytvořit systém, prostřednictvím něhož se by se lidé mohli spojit s centrálním serverem a poslouchat hudbu v kvalitě blízké CD on-demand přes ISDN telefonní linky. Problém byl v tom, že šířka pásma sítě ISDN byla pro přenos digitální zvuku ve kvalitě „cédéčka“ příliš úzká – standardní kompaktní disk totiž používá pulzně kódovou modulaci (metodu převodu analogového zvukového signálu na digitální) s 16 bity na vzorek na jeden kanál při frekvenci 44 100 vzorků za sekundu. To znamená, že jedna sekunda stereo zvuku vyžaduje k zakódování 1,4 mil. bitů. K tomu, aby bylo možné hudbu posílat přes síť ISDN v rychlosti standardního playbacku, bylo nutné zkomprimovat soubor v poměru téměř 12:1.

 

Kompresní poměr 12:1? Neproveditelné

https://images.computerwoche.de/bdb/1845370/890x.jpgSeitzer si chtěl nechat projekt patentovat, nicméně jeho přihláška byla zamítnuta, protože byl podle úřadů „neproveditelný“. Seitzer si to ale zjevně nemyslel a zaúkoloval Brandenburga, aby z „neproveditelného“ zkusil udělat „proveditelné“. Brandenburg se nejprve domníval, že komprese v takovém poměru je v praxi nerealizovatelná, nicméně po hlubším studiu si začal uvědomovat, že by uskutečnitelná být mohla. Z kompresního poměru 12:1 byl nakonec poměr zhruba 11:1, což byl i tak velký úspěch. Tak velký, že výsledky jeho výzkumu, které tvořily jádro jeho disertace, se staly základem kompresních audio standardů MPEG-1 Layer 3 (neboli MP3), MPEG-2 Advanced Audio Coding (AAC) a dalších moderních standardů. Nový formát MP3 byl v roce 1989 zaregistrován u patentového úřadu a o několik let později byly jeho specifikace implementovány mezinárodní organizací MPEG, zabývající se stanovováním standardů v oblasti přenosu a komprese audia a videa, do jejího standardu MPEG-1.

   MP3 je, zjednodušeně řečeno, audio formát obsahující základní stream standardu MPEG-1 a zakódovaná video data, přičemž k vysoké efektivitě komprese využívá psychoakustický model. To znamená, že se snaží ze vstupního signálu odstranit všechny zvukové informace, které člověk neslyší, protože jsou mimo jeho frekvenční rozsah, nebo si je neuvědomuje. K tomu využívá techniky zvané časové a frekvenční maskování. MP3 soubory je možné komprimovat i v poměru 9:1 a 7:1. Vzhledem k tomu, datový tok nekomprimovaného audia na kompaktním disku činí 1411,2 KB/s, MP3 soubory se podle zmíněných poměrů přehrávají rychlostí 128, 160 a 192 KB/s. Pochopitelně platí, že vyšší poměr komprese má za následek relativně větší ztrátu kvality zvuku.       

 

Rozmach „empétrojek“

   https://media.gettyimages.com/photos/karlheinz-brandenburg-codeveloper-of-the-mp3-music-format-and-of-the-picture-id631304910?k=6&m=631304910&s=612x612&w=0&h=HDMdKF9odELhSFRPJ0adFI59Fa4tOdoS-vASWEd4XQU=První platformou formátu nebyl internet, jak by se někteří mohli domnívat, nýbrž rozhlasové stanice a měl sloužit k oficiální distribuci hudby. V  roce 1995 se však kódovacího softwaru zmocnil neznámý australský hacker a jeho nelegální kopii vypustil na internet. Přidal k němu uživatelsky přívětivější rozhraní a revoluce v poslechu digitální hudby byl na světě. Díky svému kompresnímu poměru (celé album na CD mělo najednou místo 650 MB přibližně jen 60 MB) a bez výrazné ztráty kvality audia se formát mezi nadšenci hudby rychle šířil a dal vzniknout různým nelegálním P2P službám na sdílení či ripování hudby, z nichž nejznámější byla patrně služba Napster, nebo digitálním přehrávačům „empétrojek“. Přestože šíření a sdílení hudby na bázi tohoto formátu nebylo legální (oficiální kódovací software licencoval Fraunhoferův institut za 350 dolarů), jeho popularita byla tak obrovská, že  institut časem uvolnil jeho specifikaci zdarma a umožnil tak komukoli bez placení licenčních poplatků legálně vytvářet softwarové dekodéry a přehrávače a MP3 soubory „beztrestně“ šířit. Patrně nejznámějším takovým přehrávačem byl Winamp z roku 1998. Soubory formátu proslavily i fyzické přehrávače, z nichž nejpopulárnější byl bezpochyby iPod od Applu.

   https://pxhere.com/en/photo/1335916Dnes je formát MP3 překonaný a byl nahrazen další generací formátů založených na ztrátové kompresi. Jeho nástupcem je formát AAC, na jehož vývoji se v druhé polovině 90. let podílel Fraunhoferův institut společně s americkou společností AT&T Bell Laboratories, Dolby Laboratories a dalšími a který se stal standardem pro streamování hudby na platformách jako Spotify nebo YouTube. Největší podíl na jeho rozšíření měl však Apple se svým obchodem iTunes a později smartphony. Prosadil se také formát FLAC, za nímž stojí programátor Josh Coalson a který vznikl v roce 2000.    

   Brandenburg je v současnosti ředitelem na začátku zmíněného ústavu Technologie digitálních médií na Fraunhoferově institutu, od roku 2000 působí jako profesor na Technické univerzitě v Ilmenau a vyučoval i na své rodné Erlangensko-norimberské univerzitě. Spoluzaložil také firmu Bach Technology, zabývající se vývojem a licencováním technologií digitální hudby, a kromě toho se angažuje v jedné z největších světových organizací svého druhu Audio Engineering Society, kde zasedá ve výboru pro určování technických audio standardů, přijímaných na bázi dobrovolnosti.