OpenAI chystá novou funkci. Složí za vás hudbu

Úterý 04. 11. 2025

Monika

Používáte k psaní textů ChatGPT? A vygeneruje vám k nim navíc obrázky DALL-E? Tak se připravte, protože OpenAI teď míří na další metu. Společnost intenzivně pracuje na nástroji, který dokáže na základě textového popisku vygenerovat originální hudební skladbu.

Společnost OpenAI nedávno představila vylepšené modely pro zpracování zvuku. Ty nyní pomáhají s již vytvořenými zvukovými stopami, které potřebuje uživatel pouze upravit nebo umí například vytvořit mluvené komentáře, zvukové efekty a podobné formáty. Nyní je ale na řadě model, který by měl dle aktuálně dostupných informací umět složit hudbu tak, aby se uživatelé například nemuseli zabývat autorskými právy při jejím použití. Bude to ale opravdu tak jednoduché?

Nová dimenze kreativity

Open AI podle všeho momentálně pracuje na novém generativním “hudebním” nástroji. Ten by mohl fungovat na podobném principu, jaký už známe z ChatGPT nebo obrázkových generátorů. Uživatel tedy zadá požadavek – v tomto případě například „taneční elektronická hudba ve stylu milénia“ – a umělá inteligence na základě těchto požadavků vytvoří naprosto originální hudební stopu.

Tento nástroj by měl obrovský dopad především na tvůrce různého obsahu, youtubery, bloggery, podcastery, ale i pro amatérské hudebníky. Tito lidé často potřebují originální „podkresovou hudbu“, nicméně v některých případech je pro ně zbytečné se potýkat s autorskými právy či složitými programy k tvorbě vlastní hudby.

OpenAI ale v tomto ohledu nebude žádným průkopníkem. Tímto krokem se pouze snaží dohnat konkurenci. Podobné nástroje už totiž existují, patří sem například Google Lyria nebo Meta MusicGen. OpenAI by se tak logicky mohla chtít zaměřit spíše na vyšší kvalitu a detailnější možnosti ovládání výstupu.

Pokrok v audio modelech

OpenAI si už v posledních měsících dláždila cestu k audio inovacím. Nedávno na svém blogu představila své modely nové generace pro zpracování zvuku, které navazují na předchozí úspěšný systém Jukebox. Tyto vylepšené modely, trénované na obrovském množství zvukových dat, slibují vyšší realističnost, lepší srozumitelnost mluveného slova a hlavně celkově vyšší kvalitu generovaného zvuku.

Podle interních zdrojů by se nová funkce mohla objevit v rámci balíčku s názvem AudioGPT. Oficiální název ale není známý a jde pouze o dohady, stejně jako u přesného data spuštění. Spekuluje se však, že by funkce mohla být nejprve součástí placené verze ChatGPT. Podobně to měl i nástroj pro generování obrázků DALL-E.

Příchod takto sofistikovaného nástroje vyvolává, podobně jako u generování textu a obrazů, řadu etických a právních otázek. Největším problémem je rozhodně otázka autorských práv. Bude se AI trénovat pouze na hudbě s volnou licencí, nebo dojde k dalším právním sporům s hudebními vydavatelstvími a umělci?

Zdroje: Techcrunch.com, Euronews.com